向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
维谢格拉德四国经济面临新挑战******
光明日报记者 杨艺明
国际货币基金组织总裁格奥尔基耶娃日前表示,2023年半数欧盟国家将陷入经济衰退。近期此间多家媒体、经济机构、专家学者对包括波兰、捷克、匈牙利、斯洛伐克在内的维谢格拉德集团国家(以下简称“V4国家”)2023年经济形势进行展望和预测认为,受当前能源价格上涨、通货膨胀、供应链受阻等因素影响,V4国家作为欧盟中等规模经济体均面临不同程度的困局。
工业生产进一步下滑
俄乌冲突爆发已近一年,这场发生在“家门口”的战争给V4国家的经济社会带来巨大的冲击,不仅体现在政府政策调整上,也体现在百姓的日常生活中。甚至在今年相当长的一段时间内,冲突还将对V4国家的经济、能源、财税、产业等带来一系列广泛且深刻的影响。
V4国家工业、制造业基础较好,工业产品出口长期以来是其国民经济的重要支柱。以汽车行业为例,新冠疫情和随后的俄乌冲突推高了能源、零部件和原材料价格,企业融资成本明显增加,物流受阻。捷克最大的汽车制造商斯柯达公司就面临这样的问题,其销售和营销董事会成员雅恩日前表示,如果可以获得所有零部件,斯柯达2022年的汽车销量可能增加20%到30%。但因为全球整体需求下降,订单大幅减少,捷克2022年出售新车19.2万辆,同比下降了7.15%。
标准普尔机构日前表示,波兰制造业采购经理人指数(PMI)从2022年11月的43.4升至12月的45.6,捷克从11月的41.6升至12月的42.6。该指数的50点水平是增长和收缩的分界线,显示出波兰和捷克制造业状况在2022年12月仍然处于恶化状态。匈牙利采购经理人指数也处在异常区间。与世界其他地区相比,包括V4国家在内的整个欧洲都面临着工业竞争力下降的危险。
欧委会2022年11月曾表示,预计2023年捷克工业将继续受到供应链受阻和能源价格高涨的影响,整体经济将处于衰退边缘,经济增长率将放缓至0.1%。捷克财政部长斯坦杜拉也坦言,捷克已经处于“温和衰退”中。根据捷克统计局2022年12月数据,与2021年12月相比,企业和消费者对整体经济的信心均有所下降。捷克赛勒斯银行首席经济学家维特哈迪尔表示,2023年的经济衰退对捷克的打击将比其他大多数欧盟国家更严重。
斯洛伐克布拉迪斯拉发联合信贷银行首席经济学家科尔什扎克称,由于俄乌冲突、创纪录的通货膨胀以及斯洛伐克工业几个重要出口市场收紧货币政策,斯多个工业部门将被削弱,国内产业仍然低迷。有分析人士称,能源价格上涨和能源供应短缺对斯洛伐克工业造成的打击比其他几个V4国家更严重。波、捷、匈2022年工业生产至少同比实现了增长,而斯却下降了2.6%。专家预计,在2023年前几个月内,V4国家工业生产将进一步下滑。
能源多元化阵痛难免
V4国家与俄罗斯地缘相近,长期以来享受着低成本能源的实惠。俄乌冲突爆发以来,在欧盟整体减少对俄罗斯能源需求的政策背景下,高度依赖俄能源的V4国家在2023年不得不继续想办法寻找新的能源供应。
波兰长期以来对俄强硬,一直在努力减少对俄罗斯的依赖。此前,波兰每年超过50%的天然气从俄罗斯进口,但合同已于2022年年底到期。作为替代,波兰正通过波罗的海管道从挪威进口天然气,并扩建其液化天然气接收站。这也使华沙成为呼吁欧洲拒绝俄罗斯化石燃料最响亮声音之一。
虽然捷克和斯洛伐克都赞成对俄实施全面制裁,但俄气在两国天然气消耗量中的占比分别高达98%和85%,短期内切断俄能源供给并不现实。斯洛伐克金融政策研究所表示,V4国家中,斯洛伐克经济遭受能源危机的打击最为严重。捷克贸易和工业部长西克拉日前表示,捷克目前不受欧盟对俄石油进口禁运的限制,但在2024年要解决依赖俄化石燃料的问题。两国正寻求通过购买德国或波兰的液化天然气、开发核能等措施提升能源供给多元化。斯洛伐克虽然在风能、太阳能、地热能等可再生能源方面有巨大潜力,但开发进展非常缓慢。当地社区民众抵制风力发电项目,行政机构效率低下,导致风电行业的环境影响评估需要数年才能完成。目前,斯洛伐克生产的可再生能源占其能源总产量的23%,波兰为16%,捷克为15%,均低于欧盟37%的平均值。因此,这些国家在短期内完全摆脱对俄化石能源的依赖并不现实。
匈牙利的能源政策更显务实。匈牙利约85%的天然气来自俄罗斯,匈总理欧尔班表示,90%的匈牙利家庭都使用天然气取暖,不愿完全停止购买俄罗斯天然气。同时,考虑到如果俄罗斯进一步削减对欧洲的能源供应,可能会给匈牙利带来风险,匈政府正以开放的态度寻求多元化能源供给方案。近日,匈牙利与斯洛文尼亚讨论建设一条连接两国的天然气管道。总体上,V4国家能源转型的阵痛在一定程度上给其经济发展带来不确定性,影响市场预期。
乌难民涌入带来利与弊
从地理位置上看,V4国家靠近俄乌冲突前线,斯、波、匈更是直接与乌接壤,四国因此成为接受乌克兰难民最多的地区。其中,波兰接收难民总数最多,捷克人均接受难民数量最多。根据波兰边防卫队的每日报告,截至今年1月4日,已有近810万乌克兰人越境进入波兰。虽然目前近620万人已经回乌,剩下的190万人中也有部分转入欧盟其他国家,但预计未来仍会有超过100万难民把波兰作为永久家园。
难民的大量涌入对V4国家的经济社会产生了深远影响。波兰政府估算,截至2022年年底已花费180亿波兰兹罗提(约合38.3亿欧元)帮助乌克兰难民,包括福利、儿童教育、医疗保健等支出,而普通民众花费了更多的金钱和精力帮助难民,向其提供长租公寓或房间等。
同时,难民涌入也给四国经济增长带来新动力。一方面,增加了劳动力。乌克兰人受教育水平较高,对V4国家有文化认同。波兰罗兹大学研究表明,多达一半的乌克兰难民接受过高等教育。乌克兰难民也从仅仅寻求避难逐渐转向在当地谋生,缓解了当地的低出生率和人口老龄化问题。有报告称,截至2022年年底,难民流入可能使欧盟的劳动力增加0.5%,是2015—2016年难民潮的两倍。截至2022年9月底,乌克兰人已在波兰开办了近1万家大小企业,涉及软件服务、建筑和装修、理发和美容等,为当地贡献税收,难民的投资置业等也带动了当地的银行信贷。
另一方面,提振了食品、服装和其他生活必需品的生产和销售。波兰统计局数据显示,波兰纺织品、服装和鞋类的销售额在2022年3月同比增长41.9%,4月同比增长121.4%。显然,难民将继续带动当地这类消费品以及药品、化妆品的销售。
不过,大量难民的涌入挤压了当地的社会空间,占据了社会资源,带来了新的问题。据报道,不少波兰民众表示,难民甚至比当地人享有更好的医疗、社保等福利待遇。如何帮助难民更好融入当地经济社会生活,成为2023年摆在V4国家面前的重要问题。
(光明日报布拉格1月11日电)
《光明日报》( 2023年01月12日 12版)