ChatGPT大更新,能看能听也能说,多模态功能即将上线
OpenAI在其官网宣布,看能听目前正在推出ChatGPT的说多上线新版本,除了通过常见的模态文本框交互外,现在它正在学会以新的更新功方式理解人类的问题,比如通过大声说话或者上传一张图片。看能听
·随着越来越多的说多上线人使用语音控制和图像搜索,并且ChatGPT越来越接近成为一个真正多模式、模态有用的更新功虚拟助手,维持住安全护栏会变得越来越困难。看能听
OpenAI在其官网宣布,说多上线ChatGPT现在可以“看”、模态“听”和“说”了。更新功
自诞生以来,看能听ChatGPT的说多上线大部分更新主要在于,这个基于AI的机器人可以做什么、可以回答哪些问题、可以访问哪些信息,以及如何改进其基础模型等方面。这一次,OpenAI正在调整使用ChatGPT的方式。
北京时间9月25日晚,OpenAI在其官网宣布,目前正在推出ChatGPT的新版本,除了通过常见的文本框交互外,现在它正在学会以新的方式理解人类的问题,比如通过大声说话或者上传图片。
具体而言,在语音方面:第一,允许用户进行语音对话,提供更直观的交互方式;第二,支持在iOS和Android移动应用上使用;第三,提供5种不同的语音选择;第四,通过新型文本转语音模型和语音识别系统实现。
这应该感觉就像与苹果的Siri交谈一样,只是OpenAI希望,通过改进基础技术使其说出更好的答案。目前,大多数虚拟助手,如亚马逊的Alexa,都在以大语言模型(LLM)为基础进行改进。
据OpenAI介绍,新的语音功能由一个新的文本到语音模型提供支持,该模型能够从文本和几秒钟的语音样本生成“类似人类的音频”。OpenAI似乎还认为该模型的潜力不止于此,其正在与流媒体音乐服务平台Spotify合作,将播客翻译成其他语言,同时保持播音者的声音。合成语音有许多有趣的用途,而OpenAI可能会成为该行业的重要组成部分。
然而,只需几秒钟的音频就能构建出功能强大的合成音色,这也为各种问题性用例敞开了大门。“这些功能还带来了新的风险,比如恶意行为者冒充公众人物或实施欺诈的可能性”,OpenAI在其宣布新功能的博文中写道。OpenAI表示,出于这个原因,该模型不会广泛被使用,而更多受到特定用例和合作伙伴的限制。
在图像方面,第一,允许用户上传图像与ChatGPT进行交互;第二,支持多张图像;第三,提供移动应用上的绘图工具;第四,使用多模态GPT模型(Generative Pre-Trained Transformer,生成式预训练Transformer模型)理解图像;第五,在接下来的两周内首先面向Plus(付费订阅用户)和企业用户推出;第六,语音和图像功能的推出采取渐进策略,以确保安全性;第七,要注意模型局限性,避免高风险场景下对其依赖。
图像搜索有点类似于Google Lens的功能,用户拍摄自己感兴趣的任何东西的照片,ChatGPT去尝试了解用户在询问什么,并做出相应的回应。用户还可以使用应用程序的绘图工具帮助明晰自己的诉求,或配合图像进行说话或写入问题。
这是ChatGPT希望实现的一个互动特性:与其进行一次搜索得到错误答案,然后再重新进行一次搜索,不如在进行的过程中提示AI机器人完善答案。
不过,显然图像搜索也有其潜在问题。比如,如果用户询问的是关于一个人的情况,ChatGPT该如何反应?OpenAI表示,他们故意限制了ChatGPT“分析和直接陈述关于人的能力”,这既是为了准确性,也是为了隐私原因。这意味着对于AI的一个极具科幻色彩的想象——看着某人然后问AI“那是谁”,并不会很快实现。
在ChatGPT首次推出将近一年后,OpenAI似乎仍在寻找,如何为其AI机器人增加更多功能和能力而不会产生新的问题和缺点。OpenAI也试图通过有意限制其新模型的功能,来维持“更进一步”和“降低风险”这两者之间的平衡。但这种方法可能不会永远奏效。随着越来越多的人使用语音控制和图像搜索,并且ChatGPT越来越接近成为一个真正多模式、有用的虚拟助手,维持住这个护栏会变得越来越困难。
分享免责声明:家电资讯网站对《ChatGPT大更新,能看能听也能说,多模态功能即将上线》一文中所陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。
本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,本网站无法鉴别所上传图片或文字的知识版权,本站所转载图片、文字不涉及任何商业性质,如果侵犯,请及时通知我们,本网站将在第一时间及时删除,不承担任何侵权责任。联系QQ:411954607
本网认为,一切网民在进入家电资讯网站主页及各层页面时已经仔细看过本条款并完全同意。敬请谅解。
(责任编辑:探索)
-
“智周万物”——2024ChinaJoy AIGC大会圆满召开
“智周万物”——2024ChinaJoy AIGC大会圆满召开2024-07-27 13:25:39编辑:Reset 20 ...[详细]
-
【家电资讯-家电新闻 - 国际传真,作者:编辑】 日经中文网4月16日消息,日本象印魔法瓶公司正在加紧开拓新业务。除了与实际大股东中国格兰仕合作 ...[详细]
-
【家电资讯-家电新闻 - 行业新闻,作者:编辑】 当地时间4月21日,加拿大不列颠哥伦比亚省高等法院法官希瑟·霍尔姆斯(Heath ...[详细]
-
足机收挖机摹拟游戏是很多的玩家很喜好的游戏的范例之一,正在足机收挖机摹拟游戏中玩家能够体会到分歧的兴趣,上里小编便去先容几款好玩的足机收挖机摹拟游戏,感兴趣的小水陪一起去看看吧。1.摹拟农场20收挖机 ...[详细]
-
已往,有个叫余叶文的人,他非常善良,深受人们喜爱。 他家非常贫穷,他的母亲因为家世贫穷得了一种怪病,余叶文到处求医,可是没有人会医治这样的怪病。 为了给他母亲看病,花光了他们家一切 ...[详细]
-
易车讯近日,有海外媒体曝光了现代IONIQ 5 N的最新谍照,该车最快有望于2023年亮相,如果晚一些的话,可能会在2024年与大家见面,新车基于E-GMP纯电平台打造,主打高性能纯电SUV市场。外观 ...[详细]
-
足机真正在的山海经吞噬退化游戏,经由过程没有竭天吞噬晋降同兽的品级,窜改同兽的品量,有机遇退化入迷级辱物,真正在非常的游戏殊效,带玩家体验真正在的山海经足游,玩家能够或许自正在脱拆服饰,超大年夜的洪荒 ...[详细]
-
内置服从菜单游戏大年夜谦是很多的玩家很喜好的游戏的范例之一,正在内置服从菜单游戏大年夜齐中玩家能够体会到分歧的兴趣,上里小编便去先容几款好玩的内置服从菜单游戏大年夜齐,感兴趣的小水陪一起去看看吧。1. ...[详细]
-
预兆景象是一款漫画风格的动作游戏,这款游戏人物造型和场景设计都比较独特,玩家们可以从游戏中体验到很多独特的玩法乐趣,下面是游戏介绍及画面截图,有兴趣的小伙伴可以了解一下。动作冒险游戏《预兆景象Omen ...[详细]
-
路透社远日报导称,一名好国联邦法民远日表示,数以亿计的苹果用户完整能够便其正在 iOS 体系上制止利用第三圆付出并导致利用市场把持、用度代价上涨对公司提起个人诉讼。好国天区法民 Yvonne Gonz ...[详细]