新闻
您现在的位置:首页 > 新闻 > 亚马逊解释Alexa如何学习新语言
  • 腾讯创作者生态的前车之鉴,能否支撑《元梦之星》逐梦UGC?

    腾讯创作者生态的前车之鉴,能否支撑《元梦之星》逐梦UGC?

    发布时间:2023/09/24

    近期,腾讯以“天美乐园”的特别形式公布了新作《元梦之星》,宣告正式入主派对游戏赛道。过去,派对游戏在国内市场份额较小,直到《糖豆人》《香肠派对》《蛋仔派对》等作品引发用户和市场的高度关注,整个赛道才...

  • 普悦智能,专注净水,为渠道经销搭载新引擎!

    普悦智能,专注净水,为渠道经销搭载新引擎!

    发布时间:2023/08/28

    稳步推进:祝贺普悦智能(北京联营公司)第一轮股东入股签约圆满成功! 2023年8月18日,浙江普悦智能科技有限公司北京联营公司——北京普悦京允智能科技有限公司在总经理宋玉财的热忱推进下,成功签约了五名销售/服...

  • 新鸿基地产园区中心封面地标, 苏州环贸汇众盼而至

    新鸿基地产园区中心封面地标, 苏州环贸汇众盼而至

    发布时间:2021/12/28

    当苏州迈向全球都会序列之际,当苏州园区盛启一城想象之时。实力港企新鸿基地产携苏州首个超高层多业态综合体住宅——新鸿基地产苏州环贸汇澎湃而来,势将为苏州高净值投资人群挚献园区中心CBD地标之作,擎领苏州未...

  • 看图操作,三步即可开通微粒贷

    看图操作,三步即可开通微粒贷

    发布时间:2021/12/01

    ​微粒贷是由国内首家互联网银行微众银行推出的一款小额信贷产品,具有无抵押无担保、随借随还等特点,深受大家的喜欢。在此,小编结合官方资料,为想用微粒贷却不知怎么开通的朋友提供一些帮助。微粒贷开通 第一...

  • 英国与快速反应小组一起抗击冠状病毒

    英国与快速反应小组一起抗击冠状病毒

    发布时间:2020/04/01

      英国政府宣布了新的措施,以打击虚假的COVID-19在线信息的传播,包括建立专门的专家小组来处理错误信息。 新成立的快速反应小组将在英国内阁办公室内部运作,并将研究应对互联网上“有害叙述”的方法-解决“...

  • 微软即将吸引消费者-但Skype仍将保留

    微软即将吸引消费者-但Skype仍将保留

    发布时间:2020/03/31

      微软今天宣布,今年晚些时候,它将推出Teams的基本消费版,即类似于Slack的文本,音频和视频聊天应用程序。就像Microsoft所喜欢的,您的个人生活团队将使用许多工具,这些工具将使家庭和小组更轻松地组织...

  • 安全漏洞暴露了共和党选民公司的内部应用代码

    安全漏洞暴露了共和党选民公司的内部应用代码

    发布时间:2020/03/31

      一家专供共和党政治运动使用的选民联系和拉票公司,错误地在其网站上留下了未经保护的应用程序代码副本,供任何人找到。 Campaign Sidekick公司通过iOS和Android应用程序帮助共和党竞选活动布署其选区,这...

  • 在宾夕法尼亚州,州酒商店仍然关闭,人们越来越口渴

    在宾夕法尼亚州,州酒商店仍然关闭,人们越来越口渴

    发布时间:2020/03/31

      随着美国人渴望长时间的自我隔离,白酒业务的销量激增。根据尼尔森(Nielsen)的数据,到3月中旬,这一增长已经比去年同期高出26%以上。但是,联盟中至少有一个州与这种趋势背道而驰,而且与消费者的意愿无...

亚马逊解释Alexa如何学习新语言

发布时间:2019/10/14 新闻 浏览次数:720

 
亚马逊的Alexa助理最近学会了在全球讲新语言:北印度语,美国西班牙语和巴西葡萄牙语。亚马逊研究科学高级经理珍妮特·斯利夫卡(Janet Slifka)今天上午在Alexa博客上的帖子中解释说,合成数据在很大程度上起到了辅助作用,但这并不是万事俱备的解决方案。这些语言需要新的引导工具。
有问题的工具是由亚马逊的Alexa AI应用建模和数据科学小组开发的,并使用一种称为“语法归纳”的技术来分析“黄金话语”(即Alexa功能团队提出的客户要求的典型示例)并产生可以生成相似句子的一系列表达式。另一个是“引导式重采样”,它通过将可用数据中的示例中的单词和短语重新组合来创建新颖的句子,重点是优化句子类型的数量和分布。
斯利夫卡指出,当正在积极开发新语言版本的Alexa时,团队会为该系统收集培训数据,以避开客户的意图。一部分来自AI模型翻译的现有语言,其余通常来自人群工作者和Cleo(Alexa语音应用程序),其任务是让客户提供提示的答案。
语法系统利用一种称为贝叶斯模型合并的技术来生成代表性语法,或者使用一组重写规则来通过单词插入,删除和替换来改变基本模板语句。通常,在给定50条黄金语音的情况下,该过程可能需要一天的计算语言才能完成,但是该工具通过识别语音列表中的模式并使用它们为数千个模板生成100条以上的候选规则,从而将流程缩短至几秒钟。例如,如果两个词(例如“ pop”和“ rock”)始终出现在相似的句法位置,但是它们周围的措词有所不同,则可能暗示一个候选规则,即“ pop”和“ rock”在某些情况下可以互换。
有用的是,语法系统可以自动确定哪个规则说明了样本数据中的最大差异(不过度概括),这些规则在流程的进一步迭代中成为合格的变量。另外,它还可以利用现有的Alexa目录中经常出现的术语或短语。例如,如果金色话语与运动有关,并且确定“凯尔特人”和“湖人”这两个词是可以互换的,则可以得出结论,它们也可以与“战士”,“马刺”,“尼克斯”以及所有Alexa知道的NBA球队的其他名称。
至于引导重采样工具,它类似地使用目录和现有示例来增强自然语言理解培训数据。具体来说,它通过交换元素以生成额外的训练样本,例如“播放贾斯汀·比伯”和“你能演奏Camila Cabello的歌曲吗?”,使用所谓的Jaccard索引来评估内容之间的成对相似性。 (Jaccard索引测量了两个集合之间的重叠-在这种情况下,是不同类型请求中的内容。)结果是系统产生了比例更大的训练集,用于更复杂的话语数据模式,Slifka指出,该系统有助于AI模型实现更高的性能。
她写道:“ Alexa一直在变得越来越智能,而AMDS研究人员的这些创新和其他创新有助于确保Alexa在新的语言环境中启动时可能的最佳体验。”

姓 名:
邮箱
留 言: