英伟达今天宣布推出微服务,允许人工智能工程师构建可以存储和检索多种语言数据的生成式人工智能应用程序,使其更容易跨越国界障碍。
为了使生成式人工智能的跨语言数据检索更加准确,英伟达通过面向开发人员的应用编程接口目录,推出了使用Nvidia NeMo Retriever的多语言功能。该软件可以理解多种语言和格式的数据,并将其转化为文本,帮助实现上下文感知结果。
NeMo Retriever允许开发人员为人工智能模型建立信息摄取和检索管道,通过转换文本、文档、表格和类似信息来提取结构化和非结构化数据,并避免重复的数据块。它将信息转换成人工智能可以理解的语言,并将其插入到使用嵌入技术的矢量数据库中。
嵌入是一种复杂的信息数学表示方法,代表了词、短语和其他类型数据之间的属性和关系。在搜索或思考两个词或句子时,它可以帮助捕捉两者意义的“接近程度”,就像“猫”和“狗”很接近,因为它们都是动物,并且都是家养宠物。然而,“烤面包机”和“狗”的区别比较大,不过两者都经常出现在房子里。
英伟达生成式人工智能软件副总裁Kari Briski在接受SiliconANGLE采访时表示,使用 Retriever以母语嵌入和检索数据还能提高准确性。这种情况的部分原因是英语在大多数人工智能数据训练集中占主导地位。任何人如果将某些德语的内容翻译成英语,然后再翻译回德语,都会发现“翻译遗失”效应,即每次都会遗失上下文或准确性。
Briski表示:“准确性是必要的,而世界上大多数数据、开放数据恰好都是英语,这就是为什么要推动主权人工智能的原因。”“加强其他语言,让数据和检索器使用他们的自然语言,将有助于提高准确性。”
Briski表示,Retriever刚发布时,由于使用翻译软件会失去准确性,因此客户要求提供多语言支持。企业业务并非只使用一种语言。他们可能会嵌入英文文档、德文测试、日文内容,或者调入用俄文撰写的研究报告。结果是,这些信息需要通过相同的模型进行搜索,但通过的工具越多,准确性就越低。
除了摄取之外,NeMo Retriever还能对结果进行“评估和重排”,以确保答案的准确性。当通过Retriever发送查询时,它会检查矢量数据库的响应,并对检索到的信息进行排序,以便根据与查询的相关性对答案进行排序,从而提高准确性。
英伟达与DataStax合作,采用NeMo Retriever对免费在线志愿者众包的维基百科的内容进行矢量嵌入。利用英伟达提供的技术和专用软件,该公司能够在三天内将1千万个数据条目的内容矢量化为人工智能可以使用的格式,这项工作原本通常需要30 天。
其他一些英伟达的合作伙伴——包括Cohesity、Cloudera、SAP SE和VAST Data等已经在整合对这些新的微服务的支持,以支持大型多语言数据源。其中包括检索增强生成技术等服务,这些技术允许预训练的生成式人工智能使用实时数据源获取更丰富、更相关的信息。适应多语言源的企业可以获取更多数据。
Briski表示,目前,NeMo Retriever for Multilingual只能用于文本检索和回答。她表示:“面向未来,我们正在研究多模态数据、图像、PDF和视频。”“我们现在只讨论文本。因为如果你能处理好文本,那么你就能在其他模式方面做得很好。”
好文章,需要你的鼓励
随着AI系统复杂性不断增加,AI对齐技术成为确保系统安全可靠的关键。研究人员正通过人类反馈强化学习、合成数据训练、红队测试等技术手段,以及AI治理、伦理委员会等管理方法来引导AI行为。然而,价值观的多样性和AI系统的"迎合性"行为带来了新挑战。最新研究表明,我们可以理解并调整AI内部表征参数来控制系统输出。控制AI不仅是技术挑战,更是道德和政治选择问题。
NVIDIA研究团队开发的STORM系统实现了AI长视频理解的重大突破。该系统采用Mamba时间编码技术,能够像人类一样理解视频的时间脉络和内容关联,而非孤立分析每帧画面。通过创新的三种压缩策略,STORM在大幅提升处理效率的同时保持了理解准确性,在多项基准测试中超越现有系统5%以上,为教育、医疗、安防等领域的智能化应用奠定了技术基础。
谷歌DeepMind发布Gemini 2.5 Deep Think,这是一款新的创意问题解决AI模型。该模型能够同时考虑多个想法并选择最佳答案来解决复杂问题。Deep Think通过延长"思考时间",探索不同假设以找到创意解决方案。新模型在编程、科学知识和推理能力基准测试中表现优异,特别擅长迭代开发、数学研究和复杂编程问题。该工具将在Gemini应用中向Ultra订阅用户提供,月费250美元。
这项由希伯来大学、IBM研究院和耶鲁大学联合完成的综合性研究,首次系统梳理了大语言模型智能代理评估领域的完整现状,涵盖基础能力评估、应用场景测试、通用能力考量和开发框架四大维度,为这个快速发展的领域绘制了详细地图,并指出了向现实化、动态化、细粒度评估发展的重要趋势。
牙龈起包是什么原因fenrenren.com | 没谁了是什么意思hcv8jop9ns6r.cn | 吃益生菌有什么好处hcv9jop0ns0r.cn | 糖类抗原125是什么指标hcv8jop0ns3r.cn | h是什么hkuteam.com |
谷草谷丙比值偏高代表什么hcv7jop6ns6r.cn | 省略号的作用是什么ff14chat.com | 计算机科学与技术是学什么的hcv8jop4ns0r.cn | 一点点奶茶什么最好喝hcv8jop2ns9r.cn | 王安石号什么hcv8jop3ns5r.cn |
什么食物含蛋白质高hcv7jop9ns8r.cn | 农历5月17日是什么星座hcv8jop9ns5r.cn | 肾衰竭吃什么水果好hcv9jop6ns1r.cn | 白细胞酯酶弱阳性什么意思hcv8jop6ns6r.cn | 为什么会肛裂tiangongnft.com |
快乐是什么意思hcv8jop5ns3r.cn | 犹太人说什么语言hcv9jop6ns6r.cn | 什么春白雪hcv7jop6ns4r.cn | 湿疹涂什么药膏hcv8jop9ns8r.cn | 阳气不足吃什么药hcv9jop6ns5r.cn |