本文作者:nihdff

27 亿参数,微软发布 Phi-2 模型:某些性能指标优于 Llama-2-7B

nihdff 2023-11-17 98
27 亿参数,微软发布 Phi-2 模型:某些性能指标优于 Llama-2-7B摘要: IT之家 11 月 17 日消息,微软 Ignite 2023 大会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型 Phi-2,共有 27 亿参数,相比较此前版本有明显提升。...

IT之家 11 月 17 日消息,微软 Ignite 2023 大会已拉开帷幕,微软在本次活动发布了旗下最小的语言模型 Phi-2,共有 27 亿参数,相比较此前版本有明显提升。

27 亿参数,微软发布 Phi-2 模型:某些性能指标优于 Llama-2-7B

IT之家注:微软于今年 6 月发布 Phi-1,只有 13 亿代码,适用于 QA 问答、聊天格式和代码等等场景。该模型完全基于高质量数据进行训练,在基准测试中的表现比同类模型高出 10 倍。

微软今年 9 月更新发布了 Phi-1.5 版本,同样为 13 亿参数,可以写诗、写电子邮件和故事,以及总结文本。在常识、语言理解和推理的基准测试中,该模型在某些领域能够跟上多达 100 亿个参数的模型。

微软现在更新发布的 Phi-2 拥有 27 亿参数,规模虽然比此前版本翻番,但相比较其它主流语言模型,依然小很多。

微软表示 Phi-2 在逻辑推理和安全性方面显示出显著的改进。通过正确的微调和定制,小型语言模型是云和边缘应用程序的强大工具。

Microsoft Research 机器学习基础小组负责人 Sebastien Bubeck 在 Twitter 上发布了“MT-Bench”基准测试的屏幕截图,该基准测试了具有强大语言模型(例如 GPT-4)的大型和小型语言模型的实际功能。

27 亿参数,微软发布 Phi-2 模型:某些性能指标优于 Llama-2-7B

根据结果,Phi-2 在某些方面优于 Meta 的 Llama-2-7B 模型。Phi-2 的聊天版本也在酝酿中,可能会解决该模型在这些领域的一些现有痛点。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章版权及转载声明

[免责声明]本文来源于网络,不代表本站立场,如转载内容涉及版权等问题,请联系邮箱:83115484@qq.com,我们会予以删除相关文章,保证您的权利。 转载请注明出处:http://www.dlwpw.com/post/11542.html发布于 2023-11-17

阅读
分享