面对娇弱的催化剂,吴骊珠团队没有轻言放弃,而是选择直面这个问题。
按每个实验验证至少5小时计算,找到最佳配方可能需要2000年。它与人类智慧的结合将创建物质科学全新的可能,引领人类在星辰大海中不断拓宽知识的边界。
眼下,这群学生已成为实验室的骨干,各有各的绝活儿。他们以自己熟悉的谱学、催化为抓手,应用人工智能方法开展研究,取得了良好的效果。张大岗/摄 《中国科学报》 (2024-04-11 第4版 专题) 特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性。就在前不久,机器化学家利用火星陨石成功创制出实用的产氧电催化剂。作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
江俊等人亲切地把机器化学家命名为小来,意味着开启未来物质科学探索的新纪元。2020年,英国利物浦大学安德鲁库珀团队建造了世界首个移动机器人实验员。如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的来源,并自负版权等法律责任。
后者来自包括知乎、百科、豆瓣、小红书等社交平台。不过,也正是研究团队对弱智吧数据的特殊操作,在论文内容发酵后引发了相关人士对实验结果的质疑。(中国科学院自动化研究所在读博士生梁燚铭(论文共同第一作者)对本文亦有贡献) 相关论文信息: https://arxiv.org/abs/2403.18058特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性。张舸介绍说,两年多前,他和几位小伙伴因一个音乐类大模型训练项目走到了一起,共同创办了M-A-P。
一切为了更适合中国宝宝的AI 张舸是这项研究的核心人物,他也是COIG(Chinese Open Instruction Generalist,中文开源指令数据集)系列工作的发起人之一。当他们决定手搓一个高质量的中文指令微调数据集时,弱智吧相关语料自然地成为他们的一个选择。
白岳霖告诉《中国科学报》。他的团队在题为COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning的研究中,使用弱智吧标题+GPT-4回答微调后的大模型评估结果,超过了他们收集的其他有监督微调(SFT)指令集数据。通过筛选收集,构建出具有挑战性的、真实的中文语料互动数据,对于训练和评估大语言模型理解和执行中文指令的能力而言,无疑是极具价值的。具体来说,弱智吧只贡献了个标题。
至于为何只有弱智吧子集不包括网友评论,正如前述所提到的,也是出于弱智吧部分网友评论经判断达不到训练语言模型的回答质量标准,因此决定重新构造回答。如此高效率的表现,他们是怎样组织协作的? 我们创建了一个致力于多模态AI的开源社区—— M-A-P(Multimodal Art Projection),没有线下实体、没有任何盈利目的,只要能来一起做事情,我们就欢迎。对平台‘跑分的实验本意,是想观察各平台数据对于测试集中各任务都有哪些影响。张舸 由于对弱智吧数据的区别对待在传播中很难被关注到,吃瓜群众很容易就对这项工作产生了误读,认为仅使用弱智吧的内容就能将大模型训练出远超其他平台的效果。
作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。这样的语料数据,自然也逃不过研究团队的法眼。
而使用GPT-4辅助构造回答,则主要是为了尽可能减少人力投入。张舸告诉《中国科学报》,手搓一个通用的、高质量的中文指令微调数据集,需要做大量筛选、检查和调优的工作,是个体力活儿,能寻求机器帮忙的当然不会放过。
《中国科学报》进一步了解到,这群年轻人从2023年11月起着手该研究,仅用了不到4个月就完成了几乎全部工作。不过,并不像传说的那样——弱智吧8项测试第一,远超知乎豆瓣小红书竟成最佳中文AI训练数据。在这项工作中,作者团队构建了一个包含4万多条高质量数据的中文指令微调数据集,并将其开源给研究机构、企业等各方,为中文NLP社区提供了宝贵的资源。我们所有项目的目标,都是能够做出来一些好东西开源给大家用。作者:赵广立 来源:科学网微信公众号 发布时间:2024/4/17 20:22:17 选择字号:小 中 大 弱智吧帖子训练AI效果遥遥领先?研究团队回应 白岳霖和他的小伙伴们实在想不到,他们最近做的中文指令微调数据集,会因为使用了百度贴吧弱智吧的帖子相关数据而火爆出圈。他们经常光顾知乎、豆瓣、小红书等平台,当然也少不了弱智吧。
对此,业内人士表示看论文看到哈哈大笑。图片截自论文 要指出的是,除弱智吧之外,知乎、小红书、豆瓣、百科等来源的数据,研究团队并没有借助GPT-4去生成回答,而是采用严格的数据过滤,最大程度保留网络中人类撰写的高质量内容。
使用这240对样本训练过的Yi-34B大模型,在Belle-Eval测试集上录得高分。因此,面对网上‘弱智吧上大分之类的言论,白岳霖回应说:网络上的宣传过分夸大事实。
既当运动员又当裁判员,Evaluation bias(评估偏见)不会爆炸吗?用这种操作误导公众、获取流量,是不是有点过于不严谨了? 对于这一诘问,白岳霖也给出了正面回应。许多读者误以为我们使用‘弱智吧网友的评论训练大模型就可以达到很好的效果,事实上,我们仅保留了弱智吧帖子的标题。
张舸说,开源社区具有高校院所和企业所不具备的灵活性和纯粹性,此次中文指令微调数据集(CQIA)的工作,就是在M-A-P社区发起、逐步汇聚了国内外科研力量完成的。获取流量并不是我们的初衷,我们也无意哗众取宠,更没有计划或安排任何宣传内容,我们的初衷只是想默默为中文NLP(自然语言处理)社区贡献些高质量数据集。因此,该工作的作者团队就达20人。白岳霖同时表示,已经注意到有关评估偏见的问题,他们计划在下一版论文更新中补充人工评估实验。
以拥有大量高质量用户生产内容的知乎为例,研究团队设置了高赞回答等筛选条件,经内容过滤、评分后,即采用得分较高的原内容。论文通讯作者、加拿大滑铁卢大学博士生张舸进一步向《中国科学报》解释:‘弱智吧中网友们绞尽脑汁想出来的‘弱智问题,的确为大模型提供了角度清奇的高质量指令。
但前提是,项目完成之后,公司除保留一些私有资源外,必须将项目成果共享给开源社区。谈及发起这项研究的初衷,他告诉《中国科学报》,国内在有关中文指令微调数据集方面,目前还没有质量特别好的开源项目,个别项目也只是勉强能用,因此萌生了给业界提供一个完全开源的、包含中文社交媒体数据等在内各种来源的、可以直接微调大模型的数据集的想法。
如果涉及到一些资源需求,大家会和科技公司等洽谈,公司若愿意投入资源,可以一起合作、共同开发。有质疑者提出:来自知乎、豆瓣等平台的其它子数据集采样了原内容和网友评论,只有弱智吧的子数据集完全不包括网友的评论、而是采用了GPT-4合成的回答——这样的回答明显更完善、准确、多样,且最终来评分的居然还是GPT-4。
此外,《中国科学报》了解到,这支研究团队的平均年龄只有20多岁,大多为在读硕士生和博士生。白岳霖进一步谈到:我们的实验结果也不能完全代表互联网中的各个平台,任何关于平台对立的情绪都不是我们想要探讨或者希望看到的武建飞向《中国科学报》表示:我们力争2026年率先实现硫化物全固态电池批量化生产。这项研究为硫化物固态电解质和全固态锂硫电池的设计提供了新思路。
武建飞介绍,研究组制备的多层叠片软包电池循环300次容量几乎不衰减,性能还在继续测试中。与此同时,研究组在硫化物电解质设计及与锂负极界面稳定性方面取得关键性进展,相关研究成果近日发表于国际知名期刊《美国化学会应用材料与界面》。
这使得硫化物全固态锂电池兼具高能量密度和高倍率性能,是电动汽车电源的最佳选择,世界众多车企纷纷投入硫化物全固态锂电池的研发,并发布了量产计划。武建飞带领研究组针对Li3PS4硫化物电解质离子电导率低、与锂负极界面不稳定的问题,提出了双元素共掺杂改性硫化物固态电解质的策略。
硫化物固体电解质具有可媲美液态电解质的电导率、适宜的电化学窗口、60℃高温下不氧化、低温下不凝固等优势。电池的能量密度和安全性成为实现新能源汽车可持续发展的重中之重。
网友点评
已有0条点评 我要点评