在雄安新区容东片区的地下停车场,看不到纷繁复杂的线路,大量装备都被“隐藏”在专门的机房里。机房的墙壁上放置着3个小盒子,既有合路器,又有北斗卫星导航室内分布单元,还有运营商的5G基站。在这里,一条线路连接楼顶上方,以获取北斗等卫星的定位信号;一条室分线路连接多个“小蘑菇头”,以实现地下停车场信号无缝覆盖。
在复杂如“迷宫”的地下停车场,找不到自己的车或者开着车找不到出口,是人们经常遇到的尴尬又让人头疼的事情。
如今,在“地上一座城、地下一座城、‘云’上一座城”的河北雄安新区(以下简称雄安新区),精准室内导航技术正在改变这一现状。雄安新区利用“5G+北斗”技术,低成本快速实现了区域地下空间准确定位与导航。即便是身处地下停车场,“智慧”定位导航系统也能够随时告知用户的具体位置,以及下一步该往哪走,让地下通行更加便捷、高效。
瞄准地下精准定位导航难题
人们的切身体会是,在室内尤其是地下开阔空间,定位导航服务远不如地上来得精准且持续。在接受科技日报记者采访时,北京邮电大学信息与通信工程学院副教授路兆铭直言:“当前的室内定位技术解决了定位服务‘有与无’的问题,但尚未解决‘服务质量有保障’的问题。”
当前,雄安新区“地下一座城”已经初具规模。除去高标准建设的、埋藏在地下的城市“大动脉”——城市综合管廊外,城市中地下停车场的面积也非常大。
例如,在雄安新区首个集中建成区——容东片区,众多小区、楼宇的地下停车场全部联通。在大规模的地下空间中,会有大量的人、车、物流动,初入其中很容易迷路,如何实现精准定位导航成为雄安新区“地下一座城”建设过程中面临的问题。
2022年,国家重点研发计划设立“交通基础设施”专项,在5G通信与信号定位领域有长期积累的北京邮电大学信息与通信工程学院,成为“雄安新区交通设施数字化建设示范应用”项目的牵头单位,展开“5G+北斗地下空间组合式定位导航”的课题研究。
作为上述课题负责人,路兆铭告诉记者,为了解决无法实现地下精准定位的难题,“5G+北斗地下空间组合式定位导航”课题组在立项时便设定了三个层级的目标:高精度车辆定位与导航、亚米级人员定位与导航、地上地下一体化无缝定位。
“项目结项时,我们要在雄安新区超大规模地下停车场内实现这三个目标的示范应用,这对我们来说是一个不小的挑战。”路兆铭表示。
北斗卫星信号赋能地下精准导航
“手机在室内有信号,不是靠室外的铁塔基站来实现,而是靠室内分布系统。”路兆铭告诉记者,这个系统并不神秘,就是人们经常在楼道或者家门口看见的那种“小蘑菇头”(信号增强器)。
在雄安新区容东片区的地下停车场,记者举目四望,看不到纷繁复杂的线路,大量装备都被“隐藏”在专门的机房里。机房的墙壁上放置着3个小盒子,既有合路器,又有北斗卫星导航室内分布单元,还有运营商的5G基站。在这里,一条线路连接楼顶上方,以获取北斗等卫星的定位信号;一条室分线路连接多个“小蘑菇头”,以实现地下停车场信号无缝覆盖。
现代楼宇建筑多由钢筋混凝土建成,室外信号被墙体“屏蔽”,需要室内分布系统进行信号的全覆盖。特别是2018年,工业和信息化部要求5G室内信号实现共建共享,运营商将各路信号“混”入统一由中国铁塔股份有限公司提供的关键设备——合路器中。这样,运营商的标准5G室内信号便被合路器分散给各个“小蘑菇头”,以实现信号扩增。
路兆铭科研团队成员“就地取材”,利用现有的4G/5G的室内分布系统,在5G基础设施上混搭北斗卫星导航信号,无需重建基础设施,只用一个简单的“加法”,就让北斗信号“混”入5G信号,构建出了一个精准的地下定位导航系统。
看似简单的操作,背后依靠的是融合定位算法的创新。“我们团队创新性地提出由信号SLAM(即时定位与建图)架构的‘5G+北斗组合式定位算法’,实现时空信息融合,使室内分布系统支持地下1米精度的定位与导航。”路兆铭表示。
从理论上来说,要给物体做空间定位,至少需要3个角度的观测值,而且观测值越多、定位越精准。“好比说,如果一辆车旁边站着10个人,每个人眼中车的位置都是1个观测值,那么当把10个观测值全部融合起来,车辆定位就会更精确。”路兆铭表示,“5G+北斗组合式定位算法”正是将北斗卫星导航信号、5G信号、加速度计等多源位置观测信息融合在一起,精确解算出车辆的当前位置。
除了创新定位算法,路兆铭科研团队还在算法的实际场景应用与优化方面做了大量工作。当技术成型后,2021年初,路兆铭科研团队先在北京邮电大学校园搭建环境进行了算法和技术验证,当年6月到雄安新区容东片区杏秋苑地下停车场搭建了试点,开展了为期一年的驻场技术研发和创新。在这期间,路兆铭科研团队解决了三四十种问题,例如异形路段、从地上到地下的定位与导航衔接等,使地下定位导航系统越来越适用于具体场景。
把导航服务送到更多地下停车场
随着大规模推广示范,目前地下定位导航系统已覆盖容东片区超过20万平方米的地下停车场。
利用“5G+北斗”定位导航技术,在雄安新区可实现停车场人员和车辆准确位置导航。路兆铭告诉记者,这套技术还可以被集成到百度地图、高德地图、雄安行等应用程序中,用户通过手机就能够实现精准定位导航。
路兆铭科研团队在容东片区地下停车场的测试结果显示,他们研发的地下定位导航系统,其室内导航定位精度在2米左右,可以实现找车位等功能。经测算,与此前技术方案相比,这套拥有完全自主知识产权的技术方案可以将整个建设成本节省50%以上。
“现如今,不光是容东片区,容西片区、启东区的地下空间也将推广使用这套地下定位导航系统。”路兆铭表示,作为在雄安新区示范应用的创新技术,这套地下定位导航方案未来还有望被推广至医院、商业综合体、地下矿区、航站楼等地上地下一体化的复杂场景中。
“雄安新区为技术创新提供了现实需求,更为创新技术应用提供了极好的验证平台。”路兆铭表示,借助雄安新区先进的设计理念和丰富齐全的场景需求,潜藏在论文里的新技术与方法得到了转化应用。
“未来,地下精准定位导航技术还将在河南、福建、广东等地不断推进建设。”路兆铭希望,能把精准定位与导航服务送到更多地下停车场中。(科技日报记者 何 亮)
人工智能,如何妙笔“生”画******
核心阅读
输入一段话,“绘”出一幅画——人工智能的绘画本领,吸引众多职业画师和零基础用户尝鲜。人工智能绘画的本质是计算,接受“语言描述”指令后根据自身的理解还原出图像。未来,人工智能技术应用于艺术创作等领域,还要注意防范潜在风险,让技术进步更好地造福社会。
不用画笔、颜料,输入一段描述性文字,计算机就能自动解析,生成相应的画作。2022世界人工智能大会上,人工智能绘画的展示令观众惊叹。
一些过去专属于人类创作的领域,比如绘画、书法、写作、作曲,如今人工智能也已开始涉足。人工智能是如何绘画的?当前沿技术与艺术相遇,将碰撞出怎样的火花?在内容、版权等方面又是否存在问题?
从文本到图像,人工智能绘画本质是计算
人工智能绘画是一个从文本到图像的生成过程,输入一段话,生成一幅画,本质是计算。简要地说,计算机通过大量学习,能识别特定图片元素和文本之间的关联。同理,人工智能程序在收到“语言描述”指令后,可以根据自身的算法还原出图像。
设定计算机程序作画的想法由来已久。早在20世纪70年代,就有艺术家开发了操作机械臂的电脑程序,让机械臂按照指令在画纸上作画。近些年,人工智能技术日新月异,科研人员尝试设计自动作图的计算机程序。但过去很长一段时间,人工智能“画”出的作品普遍不够好,往往只是一些模糊的图像元素的组合,还称不上是完整的画。
今年以来,人工智能画技迅速“进化”。谈及技术突破原因,百度文心一格总架构师肖欣延认为,这是预训练大模型的兴起、大数据的训练和扩散模型的出现3方面共同作用的结果。
具体来说,预训练大模型增强了人工智能的通用性,成为人工智能技术及应用的新基座;大数据的训练中,通过在众多高性能GPU(图形处理器)算力资源中进行并行学习,计算机能够在短时间内完成大量的数据学习。近年来,几乎所有人工智能的技术发展都受益于这两方面的进展。而对人工智能绘画来说,扩散模型的出现至关重要。
扩散模型的原理是,通过人为逐步添加噪声,让图像逐渐变“模糊”,再不断学习去噪过程,如此人工智能就能从完全是噪声的图片中逐渐还原出清晰的图片,即“画”出图像。
“这一过程与人类学习相似。通常,人们学画从临摹开始,机器也是如此。它最初生成的图像可能很模糊,但计算机会不断修正,从而输出越来越清楚、层次越来越丰富的图像。”肖欣延说。
扩散模型让人工智能绘画技术实现跨越,不仅作画质量快速提升,生成时间也缩短到几秒钟。
众多用户尝鲜,大量应用加速“画技”进化
汤林杰是某互联网公司的运营人员。工作中,他需要借助一些图片来丰富文案,而网络上找到合适的配图并不容易。今年10月,了解人工智能绘画程序后,他尝试自己“画”图。现在,人工智能绘画工具已经是他工作的重要辅助。
随着算法模型对公众开放以及训练数据成本的下降,人工智能绘画门槛越来越低,一些简易化操作平台在国内外兴起。如今,不仅一些职业插画师尝试用人工智能绘画程序辅助作画、激发灵感,许多没有绘画基础的用户也开始尝鲜,并“晒”在社交平台上。
大量需求的涌现也加速了技术的更新迭代。“用人工智能绘画的人越多,算法就越能理解输入的描述文本,画作质量就越高。”肖欣延表示,当前人工智能绘画水平与今年初相比,已经有很大进步。
不过,目前的人工智能绘画技术并不完美。首先,可控性仍然不高,即计算机不能很好理解人类指令的含义,即便是输入“画两个苹果,左边红色,右边绿色”这样的简单描述,生成的图像也可能有很大偏差;其次,细节呈现能力还不够。比如,对空间、透视和光影的刻画就很不如意。不少人工智能渲染出的画作,初看上去惊艳,认真观察问题却不少。
但肖欣延认为,人工智能绘画在技法上的缺陷未来有望得到弥补。比如,基于跨模态大模型和强大的深度学习框架,百度开发的技术一定程度上已经缓解这些问题。此外,未来人工智能不仅能作画,还能根据文本描述生成视频,并直接配上解说文字,“可以把视频生成看作是维度更高的绘画,从技术层面看,这是可以实现的。”
防范潜在风险,守住法律和伦理底线
人工智能进入绘画领域,计算机会取代人类画师吗?
在肖欣延看来,好的绘画与构图、设计语言、视觉情绪息息相关,即使人人都可以用人工智能技术作画,但通常只有高水平的画师才能制作出优秀的人工智能绘画作品,“人工智能只是作画的辅助工具”。此外,虽然有的人工智能绘画语言娴熟,也包含细腻的情感,但并不意味着机器有意识、情感,它不过是学过类似的作品,又恰好呈现出来了。“优秀的艺术作品往往是人的思想的投射,目前机器并没有真正具备思考能力。”肖欣延说。
不少业内人士认为,不妨以开放的心态拥抱人工智能绘画,接受新事物。可以预想,将来绘画中一些繁琐、重复性的工作可能由计算机完成,创作者能腾出更多时间去构思想法与创意,调整构图、色彩、光影氛围等。
“人工智能可能会激发绘画创造的活力。”肖欣延表示,20世纪前后,照相技术让传统肖像画失去市场,促使一些画家向非写实方向创新。与人工智能技术融合,或许能激发画家创作出别开生面的作品。
不过,由于人工智能绘画发展刚刚起步,技术发展也引发关于版权、内容把控等问题的争议。比如,有人认为,未经授权人工智能画作模仿原画的内容、构图和风格等,侵犯了原作者的版权,有违法嫌疑。也有人认为,“机器学习”过程是一种类人化的创作行为,同样体现了创造者的思想和劳动,应当获得版权保护。此外,还有人担忧,人工智能绘画技术若被滥用,可能滋生暴力等令人不适的图像。面对新技术发展,有必要前瞻潜在的风险,只有守住法律和伦理底线,技术进步才能更好地造福社会。
不只是绘画,写作、作曲、生成短片,人工智能日益强大的深度学习能力,让它与不同艺术门类发生着奇妙的碰撞。展望未来,业界专家认为,人工智能与艺术融合,一方面会降低一些艺术门类的创造门槛,让更多人参与到当代的审美创造中来;另一方面新技术会带来新的审美风格,人们或许能从中扩展对自身和世界的认识。
记者 喻思南
(文图:赵筱尘 巫邓炎)