谷歌 深态 已经发布了一个名为Gemini的竞争对手,它可以理解并生成多种类型的媒体 ,包括图像,视频,音频和文字。
大多数人工智能(AI)工具只能理解并生成一种类型的内容。例如 ,Openai的Chatgpt,“读”,仅创建文本 。但是Google在 博客文章。
Gemini 1.0的三个版本是Gemini Ultra ,最大的版本Gemini Pro,该版本正在Google的数字服务中推出,而Gemini Nano则旨在用于智能手机等设备。
根据DeepMind的说法 技术报告 在聊天机器人中 ,双子座Ultra在AI研发中使用的32个关键学术基准中的30个中击败了GPT-4和其他领先的AI模型 。这些包括高中考试以及关于道德和法律的考试。
具体来说,双子座在九个图像理解基准,六个视频理解测试 ,五个语音识别和翻译中赢得了胜利,以及12个文本和推理基准中的10个。该报告称,双子座Ulta未能击败GPT-4的两者是常识性推理 。
有关的: AI正在改变科学的各个方面。这就是方法。
构建处理多种形式媒体的模型很难,因为训练数据中的偏见可能会被放大 ,性能往往会大大下降,并且模型倾向于过度fort 。这意味着它们在针对培训数据进行测试时表现良好,但在接触新输入时无法执行。
多模式训练通常还涉及单独训练模型的不同组件 ,每种组件在单一类型的介质上,然后将这些组件拼接在一起。但是,双子座同时在文本 ,图像,音频和视频数据中共同培训 。科学家从Web文档,书籍和代码中获取了这些数据。
科学家通过策划训练数据并将人类监督纳入反馈过程来培训双子座。
该团队以比以前的AI培训工作更宏伟的规模部署了多个数据中心的服务器 ,并依靠数千个Google的AI ACELERATOR CHIPS&MDASH—称为张量处理单元(TPU)。
DeepMind建立了这些芯片,专门为加快模型培训加快了速度,并将其包装成4,096芯片的簇 ,称为“超级点”,然后才训练其系统 。重新配置的基础架构和方法的总体结果意味着Goodput&Mdash;通过系统移动的真正有用的数据的量(与吞吐量相反,所有数据)—根据技术报告,从以前的培训工作中的85%增加到97%。
DeepMind科学家设想了在场景中使用的技术 ,例如在实时上传餐点的照片,以及Gemini在此过程中的下一步中响应说明。
也就是说,科学家们确实承认了幻觉和Mdash;AI模型以最大的信心&mdash返回虚假信息的现象;对于双子座来说仍然是一个问题 。幻觉通常是由培训数据中的局限性或偏见引起的 ,并且很难消除。
本文来自作者[admin]投稿,不代表东辰文化立场,如若转载,请注明出处:http://www.mzwhys.cn/zlan/202506-1040.html
评论列表(4条)
我是东辰文化的签约作者“admin”!
希望本篇文章《双子座AI:我们对Google对Chatgpt的回答有什么了解?》能对你有所帮助!
本站[东辰文化]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享
本文概览:谷歌 深态 已经发布了一个名为Gemini的竞争对手,它可以理解并生成多种类型的媒体,包括图像,视频,音频和文字。大多数人工智能(AI)工具只能理解并生成一种类型的内容。例...