大模子调解,最新「进化算法」全主动组合开源模子,刷榜众项基准测试
【导读】自动将不同开源模型进行(Carry Out)组合,生成具有新能力的新模型,Sakana AI开发的新方法做到了!
人类智慧的基础并不在于单个聪明的个体,而在于集体智慧。
比如说,我们(We)的社会(Society)和经济(Economy)体系就是建立在由具有不同专业和专长的不同个人组成的许多机构的基础上的。
Sakana AI团队相信,人工智能的发展也将遵循类似的集体道路。
人工智能的将来不会是一个单一的、巨大的、无所不知的AI系统,需要巨大的能量来训练、运行和维护;
而会是个由许多小型AI系统组成的广泛集合体,每个系统都有自己的专长,并相互连接,新的AI系统被开发来填补特定的专业。
事实上,开源基础模型可以很容易地在数百种不同的方向上进行(Carry Out)扩展和微调,以产生在其自身专业中表现出色的新模型。
Open LLM排行榜上表现最佳的模型大多不再是原始的开源基础模型,如LLaMA可能Mistral,而是对现有模型进行(Carry Out)微调可能合并的模型。
同时,计算资源相比于传统的LLM训练来说也要少得多。
目前(Currently),Hugging Face拥有50多万个模型,涵盖数十种不同的模态,原则上就可以组合成具有新能力的新模型。
Sakana AI把这个想法转成了现实。他们(They)研究出一种进化模型合并的方法,这是一种使用进化技术来有效地发现不同开源模型的最佳组合方式的通用方法。
论文地址:https://arxiv.org/abs/2403.13187
令人吃惊的是,进化模型合并的方法,能够自动发现从非常不同的领域(如非英语语言和数学,可能非英语语言和视觉)中合并不同模型的新方法,这些方法可能对人类教授自己来说都很难发现。
利用(Use)进化算法找到最优组合方式人类的直觉是有限的。随着开放模型和任务的多样性不断增长,一种更系统化的方法才能解锁更有效的合并解决方案,那就是受自然(Nature)选择启发的进化算法。
以下是一个简单的进化算法的举例,用于自动设计一个行驶距离很远的二维汽车(Car)。
起初,会随机产生许多设计,但只有少数可以向前移动的设计会将其成功(Success)的特征传递给下一代。
经过多代自然(Nature)选择,这些遗传汽车(Car)可以在环境中高效地前进,穿越具有挑战性的地形。
Sakana AI的进化模型合并方法,结合了两种不同的进化方法。
1. 在数据流空间(层)中合并模型这种方法是利用(Use)进化发现如何最优将不同模型的层组合成新模型。
直觉和启发式方法被用于确定如何以及哪些层将一个模型的层与另一个模型的层组合起来。
这个问题具有组合性很强的大量搜索空间,最适合用优化算法(如进化)进行(Carry Out)搜索。
2. 在参数空间(权重)中合并模型第二种方法是演化出新的混合多个模型的权重的方法。
有无穷无尽的方式可以混合来自不同模型的权重,更不用说每一层的混合比例了。这就是进化方法可以应用于有效地找到组合多个模型的权重的新型混合策略的地方。
当这两种方法一起使用的时候,Sakana AI团队发现即使在相对相距较远的两个领域,例如数学和非英语语言,可能视觉和非英语语言上,模型也能取得不错的表现。
融合的新模型表现出色- 大型语言模型(EvoLLM-JP)Sakana AI团队用进化模型合并的方法生成的第一个模型,是一个既会日语,又会数学的大语言模型。
为了构建这样的模型,他们(They)使用了一种进化算法,将日语LLM(Shisa-Gamma)与数学专用LLM(WizardMath和Abel)合并。
LLM性能比较,MGSM-JA列显示了正确答案的百分比。模型1-3是原始模型,模型4-6是优化的合并模型。模型7-10是用于比较的现有高性能LLM的分数。
上表报告了演化的LLM模型的结果(Result)。模型4在参数空间中进行(Carry Out)了优化,模型6进一步在数据流空间中使用模型4进行(Carry Out)了优化。
这些模型的正确响应率显著高于三个源模型的正确响应率。
这个模型也可以产生一些有趣的示例,例如能够解答需要特定日本(Japan)文化(Culture)知识的数学问题等。
- 视觉语言模型(EvoVLM-JP)进化算法不仅能够发现将仅处理文本的LLMs合并的新颖方法,还能够演变出为不同目的创建的不同架构的模型。例如日语和视觉结合的大模型。
JA-VG-VQA-500和JA-VLM-Bench-In-the-Wild都是关于图像的问题和答案的基准测试。得分越高,描述的准确性就越高。
有趣的是,合并之后的模型不仅能够比其基础LLaVa-1.6-Mistral-7B的英语VLM达成更高的分数,而且比现有的日语VLM JSVLM得分更高。
以下是一个的EvoVLM-JP的回答示例。大多数其他模型通常会输出绿色作为答案,但EvoVLM-JP的答案是蓝色。
绿色在技术上并不是错误的,但在日本(Japan)的习惯中,交通灯的「前进许可」被描述为「蓝灯」。如果你正在学习日语,这是一个日本(Japan)文化(Culture)中很有趣的例子。
- 图像生成模型(EvoSDXL-JP)进化算法也可以自动发现合并不同扩散模型的方法,而且生成速度特别快。
比如适用于日语的EvoSDXL-JP用「味噌拉面,最高品质的浮世绘,北斋,江户时代」这四个关键词,就能快速生成如下的图片,是不是很神奇?
预示AI发展新趋势?在论文的最后,作者表示,现在仅仅呈现的是初步结果(Result),也仅仅是将进化原则应用于基础模型开发的长期发展的开端。
这个项目背后的想法不是要创建更好的模型,而是为了获得更多指标,以帮助制定更有原则性的模型合并方法。
英伟达的高级科学家Jim Fan都评价道,
「基础模型社区几乎完全集中在学习上,但没有把重点放在搜索上。我相信后者在训练(进化算法)和推理(AlphaGo风格的搜索)阶段都有巨大的潜力。」
除了模型选择,Sakana AI团队还在探索使用进化来产生一群具有各自独特领域和行为的多样基础模型。
那这是不是预示着,能自我改进的模型集体智能也不远了?
参考资料:
https://twitter.com/DrJimFan/status/1771927650883522899
https://sakana.ai/evolutionary-model-merge/
https://arxiv.org/abs/2403.13187
本文来自微信公众号“新智元”(ID:AI_era),编辑:Mindy ,36氪经授权发布。
该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。
+113好文章,需要你的鼓励
新智元特邀作者2收 藏+10评 论打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮微 博沉浸阅读返回顶部参与评论评论千万条,友善第一条登录后参与讨论(Discuss)提交评论0/1000你可能也喜欢这些文章无需训练,这个新方法达成了生成图像尺寸、分辨率自由斯坦福团队新作:喊话就能指导机器人,任务成功(Success)率暴增,网友:特斯拉搞快点重磅:轰动全球的“室温超导”论文作者,被实锤数据造假、抄袭等多项不当行为,调查报告长达124页Windows 10 明年退役后,微软:要想继续安危使用,每台 PC 起步价为 441 元不造车的苹果很可能要做家用机器人了Llama提速500%,谷歌美女程序员手搓矩阵乘法内核死宅更容易变傻??Science正经研究:大脑缺氧竟是常态,但靠运动可以改善和神经科学家聊聊:究竟是什么让人们快乐(Happiness)?带货四年后,罗永浩将携新品重回科技(Technology)圈最新文章推荐特斯拉端到端一骑绝尘,祖国智驾能否与之抗衡?第二个Aesop?传欧莱雅考虑投资中东高奢香水Amouage大规模以旧换新开启,如何撬动万亿家居(Home)市场由盈转亏:中交地产净利润连续下滑AI的iPhone时代已经开启?阿尔特曼瞄准AI硬件,一张图看懂其百亿投资版图详解地平线:最大的祖国自动驾驶公司,去年营收 16 亿法国国粹,怎么就成了安徽县城土特产?马斯克转行跑“滴滴”,放弃特斯拉10万元车型?人均一件的国民新顶流,真是智商税吗?| 2024防晒衣选购指南训出GPT-5短缺20万亿token,OpenAI被曝计划建「数据市场」新智元特邀作者作者有点忙,还没写简介
发表文章2043篇最近内容训出GPT-5短缺20万亿token,OpenAI被曝计划建「数据市场」32分钟前大模型融合,最新「进化算法」全自动组合开源模型,刷榜多项基准测试34分钟前AI颠覆数学研究,菲尔兹奖得主、华裔数学家领衔11篇顶刊论文,陶哲轩转赞35分钟前阅读更多内容,狠戳这里下一篇AI颠覆数学研究,菲尔兹奖得主、华裔数学家领衔11篇顶刊论文,陶哲轩转赞AI颠覆数学研究!菲尔兹奖得主、华裔数学家领衔11篇顶刊论文|陶哲轩转赞
35分钟前
热门标签窜货轻燕燕窝哈根达斯冰激凌湾仔码头水饺大金空调假面吴锋智能酒店陈海滨围住神经猫完全竞争垄断优势理论理论经济(Economy)学经济(Economy)学派门格尔精英文化(Culture)精英培育余罪韦小宝网页游戏(Game)产品差异化战略张燕生力拓集团zuul徐璐动态模型迈巴赫奔驰gls suvs级迈巴赫gls关于36氪城市合作寻求报道我要入驻投资者关系商务合作关于我们(We)联系我们(We)加入我们(We)网站谣言信息举报入口热门推荐热门资讯热门产品文章标签快讯标签合作伙伴36氪APP下载iOS Android本站由 阿里云 提供计算与安危服务 违法和不良信息、未成年人保护举报电话:010-89650707 举报邮箱:jubao@36kr.com 网上有害信息举报© 2011~2024 首都多氪信息科技(Technology)有限公司 | 京ICP备12031756号-6 | 京ICP证150143号 | 京公网安备11010502036099号意见反馈36氪APP让一部分人先看到将来36氪鲸准氪空间推送和解读前沿、有料的科技(Technology)创投资讯
一级市场金融信息和系统服务提供商
聚焦全球优秀创业者,项目融资率接近97%,领跑行业
- 赞(228) 踩(11) 阅读数(4843) 最新评论 查看所有评论
-
加载中......
- 发表评论
-