三大综合能力重磅升级!讯飞星火大模型打响赶超 ChatGPT 第一枪

[复制链接]
查看634 | 回复0 | 2023-6-16 18:40:22 | 显示全部楼层 |阅读模式
智东西(公众号:zhidxcom)
作者 | 程茜
编辑 | 漠影
智东西 6 月 10 日报道,昨天,讯飞星火大模型 V1.5 亮相,升级了开放式知识问答、逻辑推理和数学能力、多轮对话三大综合能力,并发布了支持纯语音输入、多模态输入的星火 APP。同时,科大讯飞还公布了星火大模型在办公、教育、医疗、工业领域的应用新进展。
星火大模型的文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力均在持续提升,其中知识问答能力提升高达 24%,逻辑推理能力提升 10%。




事实上,星火大模型与教育、办公场景的结合成果已经显现出来。5 月 6 日,讯飞星火大模型发布并集成到教育、办公场景中,科大讯飞总裁吴晓如透露,今年 6 月 1 日到 8 日,拥有口语陪练、写作助手、作文批改等功能的讯飞 AI 学习机激活数量同比增长 214%,搭载语篇规整、一键成稿等功能的讯飞办公本、讯飞听见,用户激活提升了 176% 和 205%。
可以看出,新的用户体验正在极大激活用户的需求。
值得一提的是,6 月 9 日正是全国高考最后一天,讯飞研究院院长刘聪也现场演示了星火大模型答高考卷的能力,做数学函数题、语文阅读理解题,都能给出逻辑清晰的分析过程。




在星火大模型发布之际,科大讯飞董事长刘庆峰就曾公布了星火年内的三次升级时间点,同时将在 10 月底整体赶超 ChatGPT。这也是国内大模型厂商唯一明确给出升级时间的。现在正是其迭代升级的关键节点,刘庆峰谈道,因为长期主义的梦想需要一个又一个阶段里程碑来实现。
一、三大综合能力升级,用户能定制 200+" 私人 " 助手
讯飞星火大模型 V1.5 对于用户最需要的开放式知识问答、逻辑推理和数学能力、多轮对话三项综合能力实现了升级。
同时,讯飞发布了星火 APP 和小程序,支持全语音对话、多模态输入等,同步上线了 " 星火助手创作中心 ",用户可以基于自己的需求打造大大小小的智能助手。
用户想要从 0 到 1 构建助手需要在后台输入相应的助手指令。如果想丰富文本的内容,用户还可以在助手指令里添加关键词,如 " 欢快幽默 "、" 引经据典 " 等。并且新生成的助手也会同步到 PC、移动设备上。




目前,星火助手创作中心已经发布 200 多个助手。
1、开放式知识问答,文本内容能引经据典、补充分析见解
当下大模型在解决新知识更新上较为困难,回答一些事实类问题时容易发生张冠李戴的现象。而大模型可以基于其强大的语言理解能力,深度理解用户需求后,从实时的数据库、信息库中进行知识提取,再通过概括表达能力将答案提供给用户,从而保证结果的及时性和准确性。
吴晓如谈道,其实开放式知识问答最终拼的还是大模型的自然语言理解能力。
6 月 9 日是全国高考最后一天,借这一契机,讯飞研究院院长现场向星火大模型提问,"2023 年全国高考甲卷的作文题是什么?并分析一下它传递的意义 "。星火大模型不仅给出了作文题目,还描述出题面背后想传递的内容。




在长文本生成能力上,星火大模型也实现进一步提升。当问到 " 高考刚刚结束,孩子即将开始新的起点,请给你的孩子写一封暖心的信 ",星火生成的文本框架很清晰,并且还引经据典使得文章更加丰富。




还有关于通用人工智能产业的情况," 中国关于通用人工智能有什么新动向,并分析一下中国的基础和优势 "。星火罗列了国内新动向后,还进一步分析了人才、数据、政策等方面的优势,最后还补充了当下面临的挑战。刘聪说,星火可以自己检索到今年 6 月发生的新信息,并从这些内容中抽取出共性知识,补充见解。




在司法领域,星火大模型还能帮助用户生成起诉状。当问到 " 我有个朋友叫张三,他在 2023 年 1 月 5 日晚上被李明家的狗咬伤了,前期治疗花了 2000 元,耽误上班损失了大概 1500 元。张三想让李明赔偿他的全部损失,但是好几次沟通无果,想要起诉他,请列出需要准备的材料 ",星火生成了包括沟通记录、证人证言等材料,再次提问它还能直接生成起诉状。




大模型开放式问答展现了更强大的想象力,再加上其自然语言处理能力和专业知识库相融合,能为各个行业提供助力。
2、逻辑推理和数学能力升级,综合应用数学方法解答
大模型基于思维链的场景式逻辑推理和数学十分紧密,因此,逻辑推理能力提升也是数学能力提升的基础。
当问到 " 农夫需要带着狼、羊、菜一起过河,只有农夫能够划船,而且船比较小,农夫每次只能带一样东西过河,如果农夫不在,羊会偷吃菜,狼会吃羊,请设计一种方法,让农夫能够安全地将所有东西带过河 ",星火不仅能给出方案,还会解释每一步骤的用意。




经典谜题星火也能轻松应对,如 " 一条船上有三个人,但是有两个父亲、两个儿子,请问是怎么回事?"




还有考察排列组合和空间想象力的初中数学题,当问到 " 六条直线相交,最多能有多少个交点?" 星火会列出思考的过程,找到最终答案。




数学问题中,如三角函数等很多会包含大量的图片等,无法通过语音或者文字输入。讯飞星火 APP 基于 OCR 能力实现了图片输入。
例如一道考察多项式的数学问题,基于讯飞 APP 中的数学解题助手,就能给出完整的解题步骤。




星火大模型不仅能理清一些很绕的逻辑现象,还能综合应用方程、配列组合等数学方法来解决问题。
值得一提的是,此前搜狐科技选取了百度文心一言、阿里通义千问、讯飞星火大模型、360 智脑、ChatGPT 对 2023 高考上海数学卷前 10 道填空题进行了测试。结果显示,星火大模型的正确率最高为 50%。




▲五大 AI 大模型高考数学题回答情况(图源:搜狐科技)
3、多轮对话能力升级,化身面试官、儿童作家
一般情况下,人和人协同完成任务需要多次交互,很少能通过一次性交互就完成复杂的任务,在人机交互中同样如此。
星火 APP 中的 " 讯飞智聘面试官 " 可以模拟面试现场,支持全语音交互。刚毕业的大学生如果没有面试经验,可进行模拟演练。例如说 " 我想面试产品经理的岗位 ",助手就会询问用户此前的工作经历等,最后还会基于回答内容给出整体评价和建议。




还有一个更有趣的助手是故事创作助手,当用户输入一个标题就能生成一篇故事,如 " 小兔子去黄山旅游探险的故事 "。如果小朋友对故事不满意,还可以补充需求,比如增加 " 小兔子遇到了一个伙伴皮卡丘 "。




这样的话,星火大模型生成的故事就可以基于用户的需求不断丰富更新。
还有一个帮助用户生成故事的助手叫故事对话共创,用户输入标题后,星火小助手不会生成整篇文章,而是先给出一段话引入,用户再输入下一步的故事走向,以此类推去续写故事。




二、教育、办公场景设备再升级,工业、医疗服务次数大幅提升
在教育行业,讯飞此前发布的星火 AI 口语助手升级为了星火语伴 APP,使得用户使用更为便捷。该 APP 面向的是中小学、大学生、商务人士等所有英语学习爱好者,除一般性交流外,还能发现用户发音、语法的问题,帮助纠错,支持语音、图片的翻译软件。
如果遇到不会用英语回复的问题,用户可以切换到中文,并且中英文混合输入星火语伴 APP 也能准确识别,同时,用户还可以在设置界面调整语伴的难度。
为了打造真人面对面的对话场景,星火语伴还支持虚拟人对话。




办公领域下,星火认知大模型搭载于讯飞听见智慧屏,该设备的拾音范围能达到 10 米,还能线接入声音、视频等。录音完成后讯飞听见智慧屏支持快速转写录音,还能基于大模型的能力整理成稿,并生成会议纪要。
同时,用户想要离开办公环境,还能一键扫码将记录的内容转到手机上,同时自动生成工作待办、自定义关键词、提炼核心内容等,满足不同领域、不同风格的文本创作需求。




面向 B 端场景,星火大模型已经在工业、医疗行业实现应用。
此前,科大讯飞发布了羚羊工业互联网平台,贯穿工业领域企业的研产供销服管场景。工业场景的企业服务中,需要人工来对接企业需求的服务供应,但依靠人工所完成的需求和供应对接量十分有限。当下,AI+ 大数据的精准理解、分析、推荐在工业场景的融合应用,使得需求和供应的对接效率大幅提升。目前,羚羊平台用户总量达到 32.2 万人次,平台服务企业次数超 72.1 万次。
基于星火大模型,讯飞推出羚机一动,能将产业的商机、政策等推荐给用户。
例如问道 " 我们是一个家电生产企业,车间有大小设备 20 多台,正在寻求能进一步节能降耗的解决方案 ",羚机一动会根据产业特点,为用户提出建议,同时给出一些解决方案案例、资源以及相应的技术专家。




刘聪称,基于星火大模型能力,讯飞开发了面向企业的产品介绍、新闻撰写等工具,下一步,讯飞也将会将这一工具的能力开放出来。
星火大模型可以和工业领域的知识结合企业,形成工业大脑,再和企业的知识库结合形成企业的知识大脑,企业的生产、研发、服务、营销各个环节,可以和企业大脑进行交互,更加精准的定位问题,找到针对性的解决方案。
此外,在车间场景中,一些新员工如果遇到设备故障,也可以询问羚机一动," 在总装车间进行整机调试的过程中,出现了触摸屏不灵的问题,有哪些原因导致 "。当用户将周边工作环境的信息输入,羚机一动也会再次分析并给出建议。之后,羚机一动还会为用户提供触摸屏替代品建议,先从公司内部库存检索,然后再去外部寻找合适的触摸屏,实现了完成了故障查询、购买建议、测试验证的全流程




在医疗行业里,科大讯飞的智医助理可以应用到诊前导医、导诊,诊中帮助医生防止误诊、漏诊,诊后康复环节。吴晓如透露,智医助理系统已经应用到全国 31 个省,完成 6.29 亿次辅助诊断,修正了 127 份医生的首次诊断。并且智医助理和语音外呼相结合,已经完成了 11 亿次电话随访。
一般情况下,患者出院后服务的延续性会缺失,绝大部分患者面临出院即托管,医患人数不匹配使得医生不能对患者用药、饮食安全及时指导。吴晓如举了一个例子,脑卒中患者中有 12% 的人出院后 30 天内会再次出院,而这部分人中 50% 的患者其实可以通过诊后康复管理避免再次入院。
基于上述现象,星火大模型可以对病案进行全过程分析快速生成康复计划,同时这份计划会实时同步到医生、患者面前。
这一诊后管理平台的医生端界面有患者入院、出院、会诊单、检验记录、住院病历等,会基于这些数据为用户生成包含医生提醒、用药指导、康复运动、饮食建议等六个维度 90 天的康复计划。




经医生审核通过后,这份计划会同步到患者手机中,同时患者复查后上传检查单,医生端的数据也会同步变化,基于患者身体数据的变化调整健康管理计划,形成了复诊、随访,跟踪闭环患者康复情况的过程。
除了康复计划制定外,智医助理还能回答患者更加开放性的问题,同样基于患者的病历给出答案,如患者发烧吃退烧药能否与长期服用药物一起服用。
吴晓如称,康复管理医生诊后效果康复效率提升 10 倍以上,即时的管理使得患者对医生的依存性提升 2.4 倍,由于患者得到即时医院随访,问题及时回应、指导,其对医院的满意度从近 90% 提升到 98% 以上。
三、开放大模型七大能力、200+ 助手开发接口
星火大模型发布初期,科大讯飞就要联合行业合作伙伴共建大模型 " 星火 " 生态。刘庆峰透露,目前讯飞人工智能开放平台上的开发团队已经超过 400 万家。
他宣布要开放星火大模型的开发接口,包括七大维度能力和 200 个星火小助手,并且支持多端接入快速集成,对于数据安全有更高要求的企业还支持私有化部署。




5 月 6 日发布星火大模型时,科大讯飞就划定了 6 月 9 日升级到 V1.5,今年 1024 对标 ChatGPT,实现中文超越、英文相当的时间表。刘庆峰谈道,这是因为科大讯飞在通用人工智能研究中,每一个关键模块都坚持自主研发,其 "1+3+1" 的创新体系,包含自主研发的安全可控大模型训练基座、软硬一体化的高性能大模型推理平台,以及数据、建模和强化学习等关键模块。




这也是科大讯飞能给出明确时间迭代节奏的关键。
未来,科大讯飞将在类脑智能、神经网络大模型的新算法和博弈智能等领域布局,探索更多的潜在路径,以前这些领域的交叉研究。
在人才培养方面,科大讯飞已经与首批全国 22 所重点高校联手,开展星火大模型场景创新赛、讯飞高校 AI 星火营,让更多学生参与到通用人工智能产业中来。
结语:围绕技术、应用、生态," 星火 " 再升级
点点 " 星火 ",已成燎原之势。讯飞星火大模型与行业应用的结合愈加紧密,其能力展现的也更加充分,不仅包括用户感知度更高的教育、办公等场景的设备,还有工业、医疗行业的应用升级。
有 AI 国家队之称的科大讯飞,凭借其技术积累为大模型研发划定了时间表,其以大模型为核心的技术研发、应用落地、生态建设蓝图正徐徐展开。技术的发展并不难一蹴而就,需要综合考虑多方因素,包括技术研发进展、应用落地情况等,但科大讯飞基于其自主研发的大模型底座,以及在数据安全、建模、强化学习实现安全可控,都使得其在大模型浪潮中更加从容。
随着星火大模型的不断升级,星火大模型正在赶超 ChatGPT 的道路上勇往直前。






来源网址:http://www.myzaker.com/article/648426a88e9f097b6d41d520

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则