向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
东西问·中外对话丨全球化背景下,俄罗斯与西方经济攻防战有何启示?******
中新社北京7月10日电 题:全球化背景下,俄罗斯与西方经济攻防战有何启示?
中新社记者 孟湘君
数月来,西方对俄罗斯制裁不断加码的情况下,俄经济虽遭遇困难,却也表现出一定韧性。然而,西方将货币和金融体系武器化的举动,正反噬其自身,并波及全球贸易与金融领域。
复杂因素交织下,俄罗斯和全球经济能否继续承受住难以承受之重?全球能源格局与全球化进程受到哪些冲击?这场危机,又带给世界各国哪些启示?
就此,中新社“东西问·中外对话”邀请中国人民大学国际货币研究所所长助理、研究员曲强,莫斯科国立大学大数据存储与分析中心执行主任阿列克谢·别洛希茨基,东方证券首席经济学家邵宇,深入解读局势走向。
别洛希茨基指出,西方误判了俄方韧性,随着国际贸易多元化,主导国际贸易体系的美元以及“美式和平”(“美式和平”是指二战后,西方视野中由美国主导全球经济、地区军事地位的概念)的影响力正在减弱。他认为,俄罗斯与西方的对抗,是在为其他国家争取更多主权铺路。
对话实录摘编如下:
俄罗斯承受制裁之重,卢布强势回归
曲强:西方国家一直在实施严厉制裁,俄罗斯经济真的崩溃了吗?
别洛希茨基:在金融服务方面,目前在与盎格鲁-撒克逊世界的合作上存在一些技术上的困难。但正如我们所看到的,俄与西方国家的贸易仍在继续。由于他们先发起了制裁,现在他们必须找到避开制裁的方法,以继续合作。制裁的最初目标是在一个月内摧毁俄经济支柱,但我们还是承受住了挑战。
曲强:如何看待俄罗斯遭到金融制裁和外汇储备被冻结的情况?
别洛希茨基:西方国家实施制裁是想逼我们放弃主权,但他们误判了我们的韧性,没有预想到我们在乌克兰发起特别军事行动,(对后果)是早有准备的。我们总会找到新方法来进口必要的东西,出口所拥有的资源。西方在资源、农业、科技等方面,仍依赖于我们。
邵宇:冻结一个国家的外汇储备,实际上是有法律风险跟法律后果的。美国财政部长耶伦也提到,冻结一个主权国家如俄罗斯的美元外汇储备,看起来是不公平或者不合法的。
这意味着任何一个国家,特别是主权国家的货币可能因为意识形态或者其他原因被没收,这在整个货币体系包括不同国家的储备安全(方面),就会造成比较大的担忧。你不是我的朋友,我就把你的钱扣住,听起来有点像“黑社会”的做法。
曲强:我认为可能有99%的经济学家和金融从业者都作出了误判,西方在制裁一开始时让卢布贬到一文不值,现在又不得不买进。为什么卢布如此坚挺,这一情况会持续多久?
别洛希茨基:这实际上对经济来说是一个好兆头,因为最初,卢布与美元或欧元相比确实贬值了,但我们的政府尽一切可能稳定住了卢布和经济,停止了恐慌。所以中期和长期来看,我们未来不得不将卢布贬值回最初水平,可能要回到1月份的水平,当时大概是1美元兑70至80卢布。
最初我们让卢布升值,购买了所有必要设备来生产大部分商品。现在我们可以再让卢布贬值。这不是一个完美战略,但任何一种战略总是取决于它对经济中长期表现的影响。我认为它最后会奏效。
重塑全球地缘竞争及能源格局
曲强:高昂的能源价格给俄罗斯带来收益,但这会对俄罗斯和世界经济造成负面影响吗?
邵宇:这个阶段,卢布的走强显现出俄罗斯抗拒欧美,特别是美国金融制裁的一定效应。它用必不可少的石油需求维护了自己货币的主权。俄罗斯在供应链中占有的重要地位,目前可能无法取代。
如果能对金融市场释放正面信息,市场能慢慢稳定下来的话,再考虑卢布适当贬值,可能会对能源出口有帮助。
但对全球而言,现在能源的价格非常高。能源转型的一个逻辑是,让传统能源保持在一个(价格)较高位置,大家就会往新能源方向转移。这种转型可能会对全球格局包括化石能源、传统能源的需求发生一些中长期甚至是革命性的变化。
曲强:如何看待美国对他国的制裁以及美元武器化?这会给全球化带来什么负面影响?
邵宇:全球化实际上就是人员、物资、技术、信息跟理念的全方位交流。我们习惯于把过去的全球化叫做全球化的3.0版,各国在其中扮演不同角色。
三类国家构成了全球化循环的完整结构。第一类是俄罗斯、乌克兰这样的能源或者资源型国家;第二类叫做生产型经济体,这些国家的经常账户盈余超过GDP4%以上;最后一类消费型国家像南欧国家、美国,经常账户赤字占GDP4%以上。
但现在不管是地缘冲突还是一些国家间的竞争,已经导致全球化结构断裂了。全球可能进入一种地缘竞争更激烈、不同国家的联盟形成竞争集团的过程,有点像一战跟二战之间的一种低迷状态。
我们预测,这样一个状态可能会持续10年甚至更长时间,所以不管是资源型国家转型,生产型国家能力提升,还是约束消费型国家滥发货币,都要找到一个新的平衡,但这个平衡比较难达到。
资料图:卢布钞票。俄挑战美元霸权,俄乌冲突带来哪些启示?
曲强:俄政府正努力推动卢布与贸易伙伴国货币的结算,以越过美元主导的金融体系。这会对世界金融和贸易体系产生什么影响?
别洛希茨基:我认为“美式和平”的影响力正在减弱。我们真的不在乎我们使用什么样的货币。西方针对俄罗斯的政策让人大开眼界。
这种情况下,我们会看到国际贸易的多元化。随着越来越多的国家更分散、更独立地进行交易,从长远来看,我想美国有一天将不得不加入这种公平、平等的贸易体系中。俄罗斯只是为其他国家争取更多主权铺路,同时,我们随时都有坐在圆桌旁谈判的准备。
邵宇:从短期来看,美元占市场份额80%,还是非常强劲的。货币不仅是用于交易,还用于投资,它有一个足够大的金融市场来吸收。上百年的努力,让美国得到了这种特权。
俄罗斯搭建跟其他国家的直接货币交易系统是一种尝试,短期来看,比较难以撼动美元现有的全球构架。但从长期来看,像冻结央行储备等不友好、不明智的举动,最终会撼动现在的货币体系。
我们可能期望有更多选择,包括多个清算系统、多种货币选择、电子货币,数字货币等全新的考量。
曲强:从乌克兰危机当中,可以总结出哪些应对思路?
别洛希茨基:长期发展才是最重要的,(俄罗斯)要不断调整以在未来能存活和发展下去。我们只能依靠平等稳定的伙伴关系。因此,我认为俄罗斯应该和欧洲、美、英等国在平等地位上进一步交流。不同国家有不同国情,而政府从来都是致力于国家主权和人民福祉的。这种世界才是我理想中的世界。
邵宇:俄乌冲突中的一系列制裁、技术细节等,其实对我们思想上的影响非常大。未来的冲突是全方位的,可能涉及舆论、传播技术、金融、贸易、能源、供应链等各方面。
我们要学到的就是怎么样去保证充分的自给自足,同时又能在经济循环方面,跟世界保持良好接触。
尽管我们可能跟世界进行各种竞争,但只要是良性竞争,大家保持相对开放的心态,遵循公平原则,未来不管什么样的冲突,都能安然度过,俄罗斯应该也一样。(完)
中国网客户端 国家重点新闻网站,9语种权威发布 |