三大综合能力重磅升级！讯飞星火大模型打响赶超 ChatGPT 第一枪

显示全部楼层 · 2023-6-16 18:40:22

智东西（公众号：zhidxcom）
作者 | 程茜
编辑 | 漠影
智东西 6 月 10 日报道，昨天，讯飞星火大模型 V1.5 亮相，升级了开放式知识问答、逻辑推理和数学能力、多轮对话三大综合能力，并发布了支持纯语音输入、多模态输入的星火 APP。同时，科大讯飞还公布了星火大模型在办公、教育、医疗、工业领域的应用新进展。
星火大模型的文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力均在持续提升，其中知识问答能力提升高达 24%，逻辑推理能力提升 10%。

事实上，星火大模型与教育、办公场景的结合成果已经显现出来。5 月 6 日，讯飞星火大模型发布并集成到教育、办公场景中，科大讯飞总裁吴晓如透露，今年 6 月 1 日到 8 日，拥有口语陪练、写作助手、作文批改等功能的讯飞 AI 学习机激活数量同比增长 214%，搭载语篇规整、一键成稿等功能的讯飞办公本、讯飞听见，用户激活提升了 176% 和 205%。
可以看出，新的用户体验正在极大激活用户的需求。
值得一提的是，6 月 9 日正是全国高考最后一天，讯飞研究院院长刘聪也现场演示了星火大模型答高考卷的能力，做数学函数题、语文阅读理解题，都能给出逻辑清晰的分析过程。

在星火大模型发布之际，科大讯飞董事长刘庆峰就曾公布了星火年内的三次升级时间点，同时将在 10 月底整体赶超 ChatGPT。这也是国内大模型厂商唯一明确给出升级时间的。现在正是其迭代升级的关键节点，刘庆峰谈道，因为长期主义的梦想需要一个又一个阶段里程碑来实现。
一、三大综合能力升级，用户能定制 200+" 私人 " 助手
讯飞星火大模型 V1.5 对于用户最需要的开放式知识问答、逻辑推理和数学能力、多轮对话三项综合能力实现了升级。
同时，讯飞发布了星火 APP 和小程序，支持全语音对话、多模态输入等，同步上线了 " 星火助手创作中心 "，用户可以基于自己的需求打造大大小小的智能助手。
用户想要从 0 到 1 构建助手需要在后台输入相应的助手指令。如果想丰富文本的内容，用户还可以在助手指令里添加关键词，如 " 欢快幽默 "、" 引经据典 " 等。并且新生成的助手也会同步到 PC、移动设备上。

目前，星火助手创作中心已经发布 200 多个助手。
1、开放式知识问答，文本内容能引经据典、补充分析见解
当下大模型在解决新知识更新上较为困难，回答一些事实类问题时容易发生张冠李戴的现象。而大模型可以基于其强大的语言理解能力，深度理解用户需求后，从实时的数据库、信息库中进行知识提取，再通过概括表达能力将答案提供给用户，从而保证结果的及时性和准确性。
吴晓如谈道，其实开放式知识问答最终拼的还是大模型的自然语言理解能力。
6 月 9 日是全国高考最后一天，借这一契机，讯飞研究院院长现场向星火大模型提问，"2023 年全国高考甲卷的作文题是什么？并分析一下它传递的意义 "。星火大模型不仅给出了作文题目，还描述出题面背后想传递的内容。

在长文本生成能力上，星火大模型也实现进一步提升。当问到 " 高考刚刚结束，孩子即将开始新的起点，请给你的孩子写一封暖心的信 "，星火生成的文本框架很清晰，并且还引经据典使得文章更加丰富。

还有关于通用人工智能产业的情况，" 中国关于通用人工智能有什么新动向，并分析一下中国的基础和优势 "。星火罗列了国内新动向后，还进一步分析了人才、数据、政策等方面的优势，最后还补充了当下面临的挑战。刘聪说，星火可以自己检索到今年 6 月发生的新信息，并从这些内容中抽取出共性知识，补充见解。

在司法领域，星火大模型还能帮助用户生成起诉状。当问到 " 我有个朋友叫张三，他在 2023 年 1 月 5 日晚上被李明家的狗咬伤了，前期治疗花了 2000 元，耽误上班损失了大概 1500 元。张三想让李明赔偿他的全部损失，但是好几次沟通无果，想要起诉他，请列出需要准备的材料 "，星火生成了包括沟通记录、证人证言等材料，再次提问它还能直接生成起诉状。

大模型开放式问答展现了更强大的想象力，再加上其自然语言处理能力和专业知识库相融合，能为各个行业提供助力。
2、逻辑推理和数学能力升级，综合应用数学方法解答
大模型基于思维链的场景式逻辑推理和数学十分紧密，因此，逻辑推理能力提升也是数学能力提升的基础。
当问到 " 农夫需要带着狼、羊、菜一起过河，只有农夫能够划船，而且船比较小，农夫每次只能带一样东西过河，如果农夫不在，羊会偷吃菜，狼会吃羊，请设计一种方法，让农夫能够安全地将所有东西带过河 "，星火不仅能给出方案，还会解释每一步骤的用意。

经典谜题星火也能轻松应对，如 " 一条船上有三个人，但是有两个父亲、两个儿子，请问是怎么回事？"

还有考察排列组合和空间想象力的初中数学题，当问到 " 六条直线相交，最多能有多少个交点？" 星火会列出思考的过程，找到最终答案。

数学问题中，如三角函数等很多会包含大量的图片等，无法通过语音或者文字输入。讯飞星火 APP 基于 OCR 能力实现了图片输入。
例如一道考察多项式的数学问题，基于讯飞 APP 中的数学解题助手，就能给出完整的解题步骤。

星火大模型不仅能理清一些很绕的逻辑现象，还能综合应用方程、配列组合等数学方法来解决问题。
值得一提的是，此前搜狐科技选取了百度文心一言、阿里通义千问、讯飞星火大模型、360 智脑、ChatGPT 对 2023 高考上海数学卷前 10 道填空题进行了测试。结果显示，星火大模型的正确率最高为 50%。

▲五大 AI 大模型高考数学题回答情况（图源：搜狐科技）
3、多轮对话能力升级，化身面试官、儿童作家
一般情况下，人和人协同完成任务需要多次交互，很少能通过一次性交互就完成复杂的任务，在人机交互中同样如此。
星火 APP 中的 " 讯飞智聘面试官 " 可以模拟面试现场，支持全语音交互。刚毕业的大学生如果没有面试经验，可进行模拟演练。例如说 " 我想面试产品经理的岗位 "，助手就会询问用户此前的工作经历等，最后还会基于回答内容给出整体评价和建议。

还有一个更有趣的助手是故事创作助手，当用户输入一个标题就能生成一篇故事，如 " 小兔子去黄山旅游探险的故事 "。如果小朋友对故事不满意，还可以补充需求，比如增加 " 小兔子遇到了一个伙伴皮卡丘 "。

这样的话，星火大模型生成的故事就可以基于用户的需求不断丰富更新。
还有一个帮助用户生成故事的助手叫故事对话共创，用户输入标题后，星火小助手不会生成整篇文章，而是先给出一段话引入，用户再输入下一步的故事走向，以此类推去续写故事。

二、教育、办公场景设备再升级，工业、医疗服务次数大幅提升
在教育行业，讯飞此前发布的星火 AI 口语助手升级为了星火语伴 APP，使得用户使用更为便捷。该 APP 面向的是中小学、大学生、商务人士等所有英语学习爱好者，除一般性交流外，还能发现用户发音、语法的问题，帮助纠错，支持语音、图片的翻译软件。
如果遇到不会用英语回复的问题，用户可以切换到中文，并且中英文混合输入星火语伴 APP 也能准确识别，同时，用户还可以在设置界面调整语伴的难度。
为了打造真人面对面的对话场景，星火语伴还支持虚拟人对话。

办公领域下，星火认知大模型搭载于讯飞听见智慧屏，该设备的拾音范围能达到 10 米，还能线接入声音、视频等。录音完成后讯飞听见智慧屏支持快速转写录音，还能基于大模型的能力整理成稿，并生成会议纪要。
同时，用户想要离开办公环境，还能一键扫码将记录的内容转到手机上，同时自动生成工作待办、自定义关键词、提炼核心内容等，满足不同领域、不同风格的文本创作需求。

面向 B 端场景，星火大模型已经在工业、医疗行业实现应用。
此前，科大讯飞发布了羚羊工业互联网平台，贯穿工业领域企业的研产供销服管场景。工业场景的企业服务中，需要人工来对接企业需求的服务供应，但依靠人工所完成的需求和供应对接量十分有限。当下，AI+ 大数据的精准理解、分析、推荐在工业场景的融合应用，使得需求和供应的对接效率大幅提升。目前，羚羊平台用户总量达到 32.2 万人次，平台服务企业次数超 72.1 万次。
基于星火大模型，讯飞推出羚机一动，能将产业的商机、政策等推荐给用户。
例如问道 " 我们是一个家电生产企业，车间有大小设备 20 多台，正在寻求能进一步节能降耗的解决方案 "，羚机一动会根据产业特点，为用户提出建议，同时给出一些解决方案案例、资源以及相应的技术专家。

刘聪称，基于星火大模型能力，讯飞开发了面向企业的产品介绍、新闻撰写等工具，下一步，讯飞也将会将这一工具的能力开放出来。
星火大模型可以和工业领域的知识结合企业，形成工业大脑，再和企业的知识库结合形成企业的知识大脑，企业的生产、研发、服务、营销各个环节，可以和企业大脑进行交互，更加精准的定位问题，找到针对性的解决方案。
此外，在车间场景中，一些新员工如果遇到设备故障，也可以询问羚机一动，" 在总装车间进行整机调试的过程中，出现了触摸屏不灵的问题，有哪些原因导致 "。当用户将周边工作环境的信息输入，羚机一动也会再次分析并给出建议。之后，羚机一动还会为用户提供触摸屏替代品建议，先从公司内部库存检索，然后再去外部寻找合适的触摸屏，实现了完成了故障查询、购买建议、测试验证的全流程

在医疗行业里，科大讯飞的智医助理可以应用到诊前导医、导诊，诊中帮助医生防止误诊、漏诊，诊后康复环节。吴晓如透露，智医助理系统已经应用到全国 31 个省，完成 6.29 亿次辅助诊断，修正了 127 份医生的首次诊断。并且智医助理和语音外呼相结合，已经完成了 11 亿次电话随访。
一般情况下，患者出院后服务的延续性会缺失，绝大部分患者面临出院即托管，医患人数不匹配使得医生不能对患者用药、饮食安全及时指导。吴晓如举了一个例子，脑卒中患者中有 12% 的人出院后 30 天内会再次出院，而这部分人中 50% 的患者其实可以通过诊后康复管理避免再次入院。
基于上述现象，星火大模型可以对病案进行全过程分析快速生成康复计划，同时这份计划会实时同步到医生、患者面前。
这一诊后管理平台的医生端界面有患者入院、出院、会诊单、检验记录、住院病历等，会基于这些数据为用户生成包含医生提醒、用药指导、康复运动、饮食建议等六个维度 90 天的康复计划。

经医生审核通过后，这份计划会同步到患者手机中，同时患者复查后上传检查单，医生端的数据也会同步变化，基于患者身体数据的变化调整健康管理计划，形成了复诊、随访，跟踪闭环患者康复情况的过程。
除了康复计划制定外，智医助理还能回答患者更加开放性的问题，同样基于患者的病历给出答案，如患者发烧吃退烧药能否与长期服用药物一起服用。
吴晓如称，康复管理医生诊后效果康复效率提升 10 倍以上，即时的管理使得患者对医生的依存性提升 2.4 倍，由于患者得到即时医院随访，问题及时回应、指导，其对医院的满意度从近 90% 提升到 98% 以上。
三、开放大模型七大能力、200+ 助手开发接口
星火大模型发布初期，科大讯飞就要联合行业合作伙伴共建大模型 " 星火 " 生态。刘庆峰透露，目前讯飞人工智能开放平台上的开发团队已经超过 400 万家。
他宣布要开放星火大模型的开发接口，包括七大维度能力和 200 个星火小助手，并且支持多端接入快速集成，对于数据安全有更高要求的企业还支持私有化部署。

5 月 6 日发布星火大模型时，科大讯飞就划定了 6 月 9 日升级到 V1.5，今年 1024 对标 ChatGPT，实现中文超越、英文相当的时间表。刘庆峰谈道，这是因为科大讯飞在通用人工智能研究中，每一个关键模块都坚持自主研发，其 "1+3+1" 的创新体系，包含自主研发的安全可控大模型训练基座、软硬一体化的高性能大模型推理平台，以及数据、建模和强化学习等关键模块。

这也是科大讯飞能给出明确时间迭代节奏的关键。
未来，科大讯飞将在类脑智能、神经网络大模型的新算法和博弈智能等领域布局，探索更多的潜在路径，以前这些领域的交叉研究。
在人才培养方面，科大讯飞已经与首批全国 22 所重点高校联手，开展星火大模型场景创新赛、讯飞高校 AI 星火营，让更多学生参与到通用人工智能产业中来。
结语：围绕技术、应用、生态，" 星火 " 再升级
点点 " 星火 "，已成燎原之势。讯飞星火大模型与行业应用的结合愈加紧密，其能力展现的也更加充分，不仅包括用户感知度更高的教育、办公等场景的设备，还有工业、医疗行业的应用升级。
有 AI 国家队之称的科大讯飞，凭借其技术积累为大模型研发划定了时间表，其以大模型为核心的技术研发、应用落地、生态建设蓝图正徐徐展开。技术的发展并不难一蹴而就，需要综合考虑多方因素，包括技术研发进展、应用落地情况等，但科大讯飞基于其自主研发的大模型底座，以及在数据安全、建模、强化学习实现安全可控，都使得其在大模型浪潮中更加从容。
随着星火大模型的不断升级，星火大模型正在赶超 ChatGPT 的道路上勇往直前。

来源网址：http://www.myzaker.com/article/648426a88e9f097b6d41d520

三大综合能力重磅升级！讯飞星火大模型打响赶超 ChatGPT 第一枪

本帖子中包含更多资源