MIT重新构想图像生成标记器和解码器无需生成器即可进行编辑和修复

栏目:资讯   来源:盖世汽车    发布时间:2025-07-24 19:12阅读量:18510    首页 > 热点 > >文章

盖世汽车讯 人工智能图像生成——依靠神经网络根据各种输入创建新图像——预计到本世纪末将成为一个价值数十亿美元的产业。即使以今天的技术,如果想要创作一幅奇特的画面,比如一位朋友在火星上插上国旗,或者漫不经心地飞进黑洞,也只需不到一秒钟。

然而,在图像生成器能够执行此类任务之前,它们通常需要接受海量数据集的训练,这些数据集包含数百万张图像,通常还配有相关文本。训练这些生成模型可能是一项艰巨的任务,需要数周甚至数月的时间,并且会消耗大量的计算资源。

但是,如果真的可以通过人工智能方法生成图像,而无需使用生成器,那会怎样呢?

据外媒报道,2025年夏初,在加拿大不列颠哥伦比亚省温哥华举行的国际机器学习大会上,一篇研究论文阐述了这种现实可能性以及其他一些引人入胜的想法。研究人员重新构想图像生成,使标记器和解码器无需生成器即可进行编辑和修复图像。相关论文已发表在arXiv预印本服务器上。

论文由麻省理工学院信息与决策系统实验室(LIDS)研究生研究员Lukas Lao Beyer、麻省理工学院计算机科学与人工智能实验室(CSAIL)博士后研究员Tianhong Li、Facebook人工智能研究中心的Xinlei Chen、麻省理工学院航空航天学教授兼LIDS主任Sertac Karaman以及麻省理工学院电气工程与计算机科学副教授Kaiming He共同撰写。

这项团队研究的起源是Lao Beyer去年秋季参加的深度生成模型研究生研讨课的课堂项目。在学期中的交流中,Lao Beyer和研讨课的授课老师He都意识到这项研究具有真正的潜力,远远超出了普通家庭作业的范畴。很快,其他合作者也加入了进来。

Lao Beyer的研究起点是一篇发表于2024年6月的论文,该论文由慕尼黑工业大学和中国公司字节跳动的研究人员共同撰写,该论文介绍了一种新的视觉信息表示方法,称为一维标记器。利用这种设备(它也是一种神经网络),可以将256x256像素的图像转换为仅由32个数字组成的序列,这些数字被称为标记。

   免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。

热点MOST POPULAR
  • 金伯利钻石再掀秋冬浪漫潮流,钻石艺术家带来“小杏福”系列
    金伯利钻石再掀秋冬浪漫潮流,钻石艺术家带
    时间来到深秋,萧瑟的秋风总是用凉意,勾起人们细腻的情感,而银杏却用璀璨的金色告诉...
  • 百年品牌英诺亮相MEC,为爱美者提供肌肤全程问题解决方案
    百年品牌英诺亮相MEC,为爱美者提供肌肤
    6月28日,由中国整合医学美容学会(香港)、MEC中国精英医美院长俱乐部共同举办...
  • BAPE GALLERY™全球巡回展览首站登陆北京
    BAPE GALLERY™全球巡回展览首
    ABATHINGAPE®旗下艺术分支BAPEGALLERY™创立于2002年,作...
  • 在游戏里,年轻人都能拥有「第一件奢侈品」
    在游戏里,年轻人都能拥有「第一件奢侈品」
    香奈儿推出首款手机游戏Chanel正在向年轻消费者靠拢,日前推出首款手机游戏「香...
  • 品牌之友演绎路易威登春夏太阳眼镜
    品牌之友演绎路易威登春夏太阳眼镜
    靓姿绰影,光芒随行。品牌代言人刘亦菲佩戴LVMoonSquare太阳眼镜置身街头...
  • 第一时尚网
    网站地图 第一时尚网 RSS订阅 联系方式
    Copyright © 2012- 第一时尚网版权所有    All Rights Reserved.
    联系:linghunposhui@163.com
    备案号:皖ICP备2023007381号