2021 年 – - //m.krtcgo.com 新一代人工智能开源开放平台 Thu, 30 Dec 2021 10:43:46 +0000 zh-Hans hourly 1 https://wordpress.org/?v=6.9 //m.krtcgo.com/wp-content/uploads/2025/04/favicon.png 2021 年 – - //m.krtcgo.com 32 32 高效工作?畅快游戏?来开发者 Meetup 探索 AI 技术新玩法 //m.krtcgo.com/%e9%ab%98%e6%95%88%e5%b7%a5%e4%bd%9c%ef%bc%9f%e7%95%85%e5%bf%ab%e6%b8%b8%e6%88%8f%ef%bc%9f%e6%9d%a5%e5%bc%80%e5%8f%91%e8%80%85-meetup-%e6%8e%a2%e7%b4%a2-ai-%e6%8a%80%e6%9c%af%e6%96%b0%e7%8e%a9/ //m.krtcgo.com/%e9%ab%98%e6%95%88%e5%b7%a5%e4%bd%9c%ef%bc%9f%e7%95%85%e5%bf%ab%e6%b8%b8%e6%88%8f%ef%bc%9f%e6%9d%a5%e5%bc%80%e5%8f%91%e8%80%85-meetup-%e6%8e%a2%e7%b4%a2-ai-%e6%8a%80%e6%9c%af%e6%96%b0%e7%8e%a9/#respond Thu, 30 Dec 2021 10:43:46 +0000 https://new.openi.org.cn/%e9%ab%98%e6%95%88%e5%b7%a5%e4%bd%9c%ef%bc%9f%e7%95%85%e5%bf%ab%e6%b8%b8%e6%88%8f%ef%bc%9f%e6%9d%a5%e5%bc%80%e5%8f%91%e8%80%85-meetup-%e6%8e%a2%e7%b4%a2-ai-%e6%8a%80%e6%9c%af%e6%96%b0%e7%8e%a9/ 新年首场深圳飞桨领航团 Meetup 来了!

本次活动由深圳飞桨领航团和 OpenI 共同举办,为你开启高能 2022!

飞桨领航团是飞桨开发者兴趣社区,为所有对人工智能及深度学习领域感兴趣的开发者提供丰富的本地技术沙龙、Meetup、及线上交流平台。

OpenI 是由新一代人工智能产业技术创新战略联盟(AITISA)组织产学研用通力协作共建共享的开源软硬件开放数据超级社区,旨在促进人工智能产业健康快速发展及人工智能技术的广泛应用。

手动数据标注费时费力?

智能背后必须有人工?

并不!

CVer 的福音来了!

本期 Meetup 活动将邀请百度研发工程师玉莹为大家全面解析智能标注工具 EISeg,带来标注效率提升 10 倍方案大揭密,以及医疗和遥感定制化智能标注的实现方法。

卷累了?

再聊点轻松有趣的话题吧。

飞桨开发者技术专家欧阳世雄还将为大家分享如何利用飞桨深度强化学习框架 PARL 玩转《明日方舟》,AI 模型也能在手机游戏领域落地实践。

欢迎深圳的开发者朋友报名坐上 2022 年人工智能的的第一班车~

同时,飞桨领航团志愿者招募也正式启动,欢迎感兴趣的小伙伴在文末报名加入!

 

活动时间:2022 年 1 月 9 日 14:00-16:20

活动地点:深圳市南山区深圳湾科技生态园 8 栋一楼 DT 未来科技体验中心(广发银行斜对面)

因受疫情影响,活动已改为线上会议形式进行

现场惊喜福利

参与活动的每位开发者都可获得一份飞桨提供的精美伴手礼,主讲嘉宾也将现场抽奖,随机抽取幸运开发者送出惊喜礼品哦!

加入领航团|飞桨领航团志愿者招募启动

飞桨领航团是飞桨开发者兴趣社区,面向所有对人工智能及深度学习领域感兴趣的开发者开放,提供丰富的本地技术沙龙、Meetup、及线上交流平台。在各个城市/高校飞桨领航团团长及成员的热情支持下,飞桨领航团已在全球建立 200+社群,覆盖全国 29 个省级行政区、160+高校,聚集超过 16000 名 AI 开发者。

无论你在哪个城市、哪所高校,只要你对技术有热情、对开源有兴趣、认同飞桨社区文化、愿意为社区贡献出时间/力量/知识/想法,欢迎报名成为飞桨领航团志愿者!

期待你具有以下特长之一:

1.     技术大咖,熟悉深度学习技术与应用,热衷于技术/经验/知识交流与分享

2.     体验专家,会拍照/会摄影,熟悉平面设计或视频处理软件,具有一定的审美能力

3.     公众号小编,熟悉技术社区的内容运营,具有一定的文案采编能力

4.     专业气氛组,协助飞桨领航团活动会务及现场组织工作

你将收获:

1.     专业技术能力、团队合作能力、协调组织能力、个人影响力的综合提升

2.     参与组织 Meetup 等各类活动,与技术大佬面对面交流,拓展人脉网络

3.     免费参与飞桨领航团开发者聚会团建

4.     获得百度飞桨精美周边纪念品

5.     获得百度飞桨官方授予的志愿者证书

如何加入?

关注飞桨领航团微信公众号,回复“志愿者”报名。

加入飞桨领航团,结识更多本地技术同好,共建开源社区, 共享开源成果与快乐。

]]>
//m.krtcgo.com/%e9%ab%98%e6%95%88%e5%b7%a5%e4%bd%9c%ef%bc%9f%e7%95%85%e5%bf%ab%e6%b8%b8%e6%88%8f%ef%bc%9f%e6%9d%a5%e5%bc%80%e5%8f%91%e8%80%85-meetup-%e6%8e%a2%e7%b4%a2-ai-%e6%8a%80%e6%9c%af%e6%96%b0%e7%8e%a9/feed/ 0
解读人工智能的 2021:超大规模预训练模型爆发,自动驾驶迎来商业化前夜 //m.krtcgo.com/%e8%a7%a3%e8%af%bb%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e7%9a%84-2021%ef%bc%9a%e8%b6%85%e5%a4%a7%e8%a7%84%e6%a8%a1%e9%a2%84%e8%ae%ad%e7%bb%83%e6%a8%a1%e5%9e%8b%e7%88%86%e5%8f%91%ef%bc%8c%e8%87%aa/ //m.krtcgo.com/%e8%a7%a3%e8%af%bb%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e7%9a%84-2021%ef%bc%9a%e8%b6%85%e5%a4%a7%e8%a7%84%e6%a8%a1%e9%a2%84%e8%ae%ad%e7%bb%83%e6%a8%a1%e5%9e%8b%e7%88%86%e5%8f%91%ef%bc%8c%e8%87%aa/#respond Wed, 29 Dec 2021 07:24:24 +0000 https://new.openi.org.cn/%e8%a7%a3%e8%af%bb%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e7%9a%84-2021%ef%bc%9a%e8%b6%85%e5%a4%a7%e8%a7%84%e6%a8%a1%e9%a2%84%e8%ae%ad%e7%bb%83%e6%a8%a1%e5%9e%8b%e7%88%86%e5%8f%91%ef%bc%8c%e8%87%aa/ 微信图片_20211229153113.jpg

即将过去的 2021 年,又是跌宕起伏的一年。疫情仍没有结束的苗头,缺芯造成的供应链中断此起彼伏,与此同时,数字化、智能化转型已是大势所趋。全球企业和机构在不断学会适应“新常态”,并从中捕捉新的商业机会。

2021 年, 人工智能领域依然热潮汹涌。AphaFold2 成功预测 98%蛋白质结构,预训练大模型迎来大爆发,自动驾驶迈入商业化试点探索新阶段,元宇宙概念东风劲吹,首个关于 AI 伦理的全球协议通过,商汤科技即将摘得“AI 第一股”… 前沿技术突破令人欣喜,落地应用“润物细无声”般深入各行业,业界也开始正视人工智能的问题和挑战。

在岁末年初之际,InfoQ 采访了众多行业专家,回顾了 2021 年人工智能大模型、深度学习框架、 NLP、智能语音、自动驾驶、知识图谱等各项 AI 技术的发展情况,并展望了未来一年可能的技术趋势。

2021 年度 AI 技术突破

人工智能预测蛋白质结构

12 月 15 日,Nature 发布了《2021 年十大科学新闻》;12 月 17 日,Science 紧随其后,公布了《2021 年度十大科学突破》。Nature 和 Science 都将「人工智能预测蛋白质结构」评为本年度最重要的发现,Science 更是将其列为“2021 年十大科学突破进展”之首。

长期以来,蛋白质结构的预测一直是生物学领域的研究热点和难点。传统的蛋白质结构探测方法主要有三种:X 射线晶体学、核磁共振和冷冻电镜。但这些方法成本较高,研究周期漫长,且进展有限。

人工智能为这一困扰生物学界数十年的难题按下了快进键。

今年 7 月,蛋白结构两大 AI 预测算法 —— DeepMind 的 AphaFold2 和华盛顿大学等机构研发的 RoseTTAFold 相继开源。

AphaFold2“解锁”98%人类蛋白质组

7 月 16 日,DeepMind 在 Nature 发表论文,宣布已利用 Alpha Fold2 预测了 35 万种蛋白质结构,涵盖了 98.5%的人类蛋白质组,及其他 20 种生物几乎完整的蛋白质组。研究团队还公布了 AlphaFold2 的开源代码和技术细节。

RoseTTAFold 可十分钟内计算出蛋白质结构

同日,华盛顿大学蛋白设计研究所 David Baker 教授课题组及其他合作机构在 Science 上发表论文 ,公布了其开源蛋白质预测工具 RoseTTAFold 的研究结果。研究团队探索了结合相关思想的网络架构,并通过三轨网络获得了最佳性能。三轨网络产生的结构预测精度接近 CASP14 中的 DeepMind 团队的 AlphaFold2,且速度更快、所需计算机处理能力更低。仅用一台游戏计算机,在短短十分钟内就能可靠地计算出蛋白质结构。

其他研究进展

8 月,中国研究人员使用 Alpha Fold2 绘制了近 200 种与 DNA 结合的蛋白质结构图。11 月,德国和美国的研究人员利用 Alpha Fold2 和冷冻电镜绘制了核孔复合物的结构图。12 月 22 日,深势科技推出了蛋白结构预测工具 Uni-Fold,在国内首次复现谷歌 Alphafold2 全规模训练并开源训练、推理代码。

AI 技术 2021 年发展总结与展望

人工智能迈向“炼大模型”阶段

今年是超大规模预训练模型的爆发之年。

去年,GPT-3 横空出世,这个具有 1750 亿参数规模的预训练模型所表现出来的零样本与小样本学习能力刷新了人们的认知,也引爆了 2021 年 AI 大模型研究的热潮。

谷歌、微软、英伟达、智源人工智能研究院、阿里、百度、浪潮等国内外科技巨头和机构纷纷展开大模型研究和探索。

超大规模预训练模型的“军备竞赛”

2021 年 1 月,Google 推出的 Switch Transformer 模型以高达 1.6 万亿的参数量打破了 GPT-3 作为最大 AI 模型的统治地位,成为史上首个万亿级语言模型。

国内研究机构也不甘示弱。今年 6 月,北京智源人工智能研究院发布了超大规模智能模型“悟道 2.0”,达到 1.75 万亿参数,超过 Switch Transformer 成为全球最大的预训练模型。

值得一提的是,今年国产化大模型研发工作进展飞速,华为、浪潮、阿里、百度等都发布了自研的大模型。

浪潮人工智能研究院首席研究员吴韶华向 InfoQ 表示,现在业界提高模型参数量有两种技术路线,产生两种不同的模型结构,一种是单体模型,一种是混合模型。如浪潮的源大模型,华为的盘古大模型、百度的文心大模型、英伟达联合微软发布的自然语言生成模型 MT-NLG 等走的都是单体模型路线;而智源的悟道模型、阿里 M6 等走的是混合模型路线。

预训练模型技术新进展

OPPO 小布智能中心、 NLP 算法工程师曾冠荣认为,预训练模型在今年取得的重要技术进展有:

  • 知识表示和学习机理进一步创新突破 随着对预训练模型的深入理解,预训练模型的知识学习和表征的机理逐步明确,人们得以更加顺利地往模型里注入需要其学习的知识,在这些知识的加持下,对复杂任务的应对能力得到了大幅提升。

  • 对比学习、自监督和知识增强

以对比学习为中心,多种增强方法为工具的方式能进一步提升预训练模型的语义理解和表征能力,增强方法的深入让模型自监督成为可能,让对比学习对样本,尤其是正样本的依赖降低,数据依赖的降低势必让模型对少样本甚至无样本任务的适应性提升,模型能更好地完成这类型的任务,这将让预训练模型落地的成本再降低一个层次。

降低 AI 规模化落地的门槛

预训练大模型降低了 AI 应用的门槛,解决了 AI 应用的两个难题:数据和行业知识。它既不需要大量的标注数据,又保障了基础底座。

在预训练模型的业务定制优化和应用方面,曾冠荣认为,从第一个预训练语言模型 BERT 发布至今,已在多个热门任务下得到应用,逐步从一种“潮流”变成前沿技术的“基本操作”,如预训练模型已成为机器翻译领域的基础关键性技术。此外,预训练模型也成为大系统中的一部分,发挥着其语义理解的优势。

无论是业界还是科研,对预训练模型的使用方式逐渐灵活,能从预训练模型中拆解出适合任务的部分并组装到自己的实际任务模型中。

时至今日,对预训练大模型的性能优化仍未终止,在学界,仍有大量的研究在预训练模型的落地能力上努力,压缩、剪枝、蒸馏的工作仍起到重要作用。不止于算法本身,编译、引擎、硬件等方面的优化也在大步迈进。

小结和展望

吴韶华认为,整体而言,现在大规模预训练模型的研究,包括模型结构的演进和落地仍处在探索阶段,各家的持续探索正在不断扩大对大规模预训练模型的认知边界。

“大规模预训练模型是人工智能的最新技术高地,是对海量数据、高性能计算和学习理论原始创新的全方位考验”,清华大学教授、智源大模型技术委员会成员刘知远在接受 InfoQ 采访时展望了明年大模型的发展趋势。

刘知远表示,他明年将重点关注两个层面的问题:

一是人工智能技术正呈现“大一统”趋势,如预训练模型在 Prompt Tuning 等技术的支持下可用于很多不同的任务,再如 Transformer 模型框架正在从自然语言处理扩展到计算机视觉模态,接下来我们也许会看到更多的从框架、模型和任务等方面推进人工智能技术趋向统一的工作;另一个问题是,随着预训练模型规模增大,如何更好更高效地实现任务适配和推理计算,将是让大模型飞入千家万户的重要技术。

国产深度学习框架不再是“技术的跟随者”

过去十年涌现了大量的 AI 算法和应用,这背后都离不开开源深度学习框架提供的支持。

开源深度学习框架是 AI 算法研发和 AI 应用落地的“脚手架”,帮助 AI 研究员和开发者大幅降低算法研发门槛,提升研发效率。

IDC 的调研显示,中国人工智能领域 90%以上的产品都使用了开源的框架、库或者其他工具包。

新进展,新趋势

深度学习框架的发展核心是跟随着深度学习领域的发展而前进的。

开源深度学习框架旷视天元 MegEngine 研发负责人许欣然在接受 InfoQ 采访时,分享了过去这一年他所观察到的深度学习的新进展:

(1)以 ViT、Swin 为代表的 Transformer 类模型开始向 NLP 以外的领域进军,在更多场景中展现威力,让“大”模型的趋势愈演愈烈。

相应的,深度学习框架也在训练大模型方面进展颇多(如 DeepSpeed+ZeRO),多种混合并行方案层出不穷。无论是深度学习框架还是硬件厂商,都在思考 Transformer 是否是会长期固定的计算 pattern。

(2)A100 这类显卡的诞生,催生了一股从动态图回到静态图的趋势。本身对动态图更友好的框架也纷纷尝试通过编译的方式提升效率,比如 PyTorch 的 LazyTensor、Jax 的 XLA。 很多国产框架也在尝试通过动静结合的方式提升效率,比如旷视天元 MegEngine 推出的 Tensor Interpreter、MindSpore 的 Python 代码转静态图的方案等。

此外,MLIR 和 TVM 这两个深度学习编译器领域的灯塔都在快速增长,如何靠机器做好编译也正成为各个深度学习框架研发的主要方向。同时随着深度学习方法的持续发展,也诞生了更多的新兴框架,如图神经网络领域的 DGL。

技术自立之路

近两年,国产深度学习框架陆续开源且发展迅速,逐渐在开源框架市场占有一席之地。

在技术研发方面,国产框架不再是技术的“跟随者”的角色,研发出了很多领先的创新点,比如 MegEngine 的 DTR 技术、OneFlow 的 SBP 并行方案和 MindSpore 的 AKG 等等。此外,在功能、代码质量和文档等方面都达到了很高的水准。

在开源生态建设方面,各家也都持续投入,通过开源社区扶植、产学研合作等方式,助力国产开源生态的发展和人才培养。

业界现有的主流深度学习框架多来自国外大厂,目前,国内企业自研的深度学习框架还没有哪一款进阶成为国际主流的学习框架。

许欣然坦言,国产深度学习框架在生态建设上还有很长的路要走,既需要持续投入、不断完善生态建设,也需要找到差异化的技术竞争点,充分结合我国国情和国产硬件,发挥好自身的技术优势和更好的生态洞察力。

研发难点

现阶段,在深度学习框架方面,业界普遍面临的研发难点主要体现在以下三个方面:

(1)在训练侧,NPU 开始入场,不少厂商已经做出自己的训练芯片,如何高效对接训练 NPU 仍待解决;

(2)学术研究发展迅速,框架技术需要持续跟进,这为框架研发带来了一定挑战。接下来一段时间会持续一段大 Transformer 的趋势,那么,下一个趋势是什么?

(3)算力提升速度更多地开始依赖 DSA 硬件,只是单纯的手写 kernel 已难以支撑,框架需要更多的编译技术、domain knowledge 才能不断提升训练效率。 随着 NPU、GPU 等芯片的快速迭代,包括 MLIR、XLA、TVM 在内的编译技术将受到更多关注。

将更好地支持大模型训练

随着大模型的持续火热,预期深度学习框架将在并行策略、重计算等能力上不断提升,以更好地支持大模型的训练。

同时,目前训练大模型仍需消耗大量资源,如何依靠深度学习框架的力量节省计算资源,甚至在更小规模上完成任务,将是一个值得探索的技术方向。

智能语音这一年:技术突破不断,工业落地加速

语⾳领域的⼤规模预训练模型层出不穷

字节跳动 AILAB 语⾳技术总监⻢泽君向 InfoQ 表示,2021 年度,智能语音技术的演进呈现出三个层面的趋势:

(1)基础建模技术在打破领域边界加速融合,如 Transformer 系列模型在⾃然语⾔、视觉和语⾳领域都展现出⼀致性的优势,颇有“⼀统江湖”的意思。

(2) 超⼤规模⾃监督学习技术(self-supervised learning)在上述多个领域展现出很强的通⽤学习能⼒,即在海量⽆标签数据上训练⼤规模通⽤预训练模型,然后⽤少量有标签数据做精细调整就能取得⾮常好的效果。

过去⼀年里,基于这种两段训练模式的超⼤模型不断刷新各项学术算法竞赛纪录,在⼯业界也成为⼀种模型训练和调优范式。

最近⼀年,Facebook、亚⻢逊、⾕歌和微软等公司的研究学者陆续提出语⾳领域的⼤规模预训练模型, 如 Wav2vec、 HuBERT、 DecoAR、 BigSSL、WavLM 等。

(3)除基础技术外,在不同应⽤场合场景下,多个领域模态的技术也在快速相互融合,形成视觉、语⾳和语义结合的多模态综合系统,如虚拟数字⼈。

工业界落地加速

整体来说,智能语⾳技术在⼯业界的落地不断加速,来⾃业务和技术两个⽅向的合⼒共同作⽤牵引和驱动应⽤落地。

从应⽤场景的牵引看,⼀⽅⾯如短中⻓视频业务,在全球仍保持着较⾼的增⻓速度,视频内容创作者和内容消费者活跃度很⾼;另⼀⽅⾯,疫情令居家办公和远程协作的需求增⻓,智能语⾳技术能在视频会议中提供通信增强和语⾳识别等关键能⼒,为参会者提供更佳的会议体验;以智能汽⻋和虚拟现实 VR/AR 为代表的新场景不断出现,需要更⽅便、更低延迟、更沉浸式的语⾳交互体验。

从核⼼技术的驱动看,基础模型改进和⾃监督技术不断提升着模型性能上限,同时多模态技术融合使得技术⽅案的能⼒越来越强,可⽀持更复杂的场景并带来更好的体验。

商业化难点主要在于商业模式选择

马泽君认为,现阶段,智能语音商业化的难点主要是商业模式探索和路线选择的问题,具体包括如何更好地满⾜需求,控制成本以及保证交付质量。

⼀⽅⾯,AI 商业模式探索需要始终围绕需求展开,提升模型效果和在真实场景中解决用户或客户的问题不能等同。解决实际问题需要 AI 研发⼈员深⼊业务场景,理解需求和条件限制,找到合理的产品技术⽅案,并不断思考和抽象功能和技术,沉淀通⽤的技术解决⽅案,探索验证可规模化的标准产品,降低定制周期和代价。

另⼀⽅⾯,AI 技术研发成本⾮常⾼,如何通过优化算法低对领域数据依赖,建设⾃动化平台降低⼈⼒消耗和提升研发流程效率对成本控制⾮常关键。

最后还要重视交付质量和售后服务。只有同时做好上述三个环节,才能完成从需求到交付到服务的整个链路,从而奠定规模商业化的基础。

端到端和预训练等技术仍然值得关注

  • 端到端序列建模技术

(1)准确率和推理速度更上⼀层楼的端到端技术值得期待,其中对⻬机制(alignment

mechanism)是端到端序列建模的关键。字节跳动 AILAB 正在探索的连续整合发放 CIF 模型(Continuous Integrate-and-Fire)是一种创新的序列端到端建模对齐机制,具有软对齐、计算代价低和容易扩展的特性。

(2)在端侧设备上的端到端语⾳识别和合成技术落地值得关注,特别是轻量级、低功耗、⾼准确度和定制灵活的端到端语⾳识别和合成技术。

(3)端到端语⾳识别技术⽅向的热词定制和领域⾃适应技术⾮常可能有重⼤进展。

  • ⽆监督预训练技术 (1)超⼤数据规模和模型 size 的语⾳⽆监督预训练技术值得关注,语⾳⽆监督预训练的 BERT 已经出现(Wav2vec2.0/Hubert), 语⾳⽆监督预训练的 GPT-3 很可能在 2022 年到来。

(2)多模态语⾳⽆监督预训练技术也⾮常吸引⼈,该技术可能会极⼤地提升预训练模型的表征能⼒,从⽽带来⽆监督预训练技术更⼤范围的落地应⽤。

(3)无监督预训练技术在语⾳合成、⾳乐分类、⾳乐识别领域的应⽤同样值得关注,借助⽆监督预训练的声学⾳频表征,可以有效提升下游任务的性能。

  • 语⾳对抗攻击与防御技术。 (1)语⾳领域的对抗攻击,从攻击⼿段上来看,将从当前的⽩盒攻击,进⼀步进化成⿊盒攻击;从攻击内容来看,将从当前流⾏的 untarget 攻击进化成 target 攻击。

群雄逐鹿,谁能赢得自动驾驶之战?

2021 年,自动驾驶领域格外热闹。

造车热

今年,互联网大厂、新造车势力和传统企业纷纷进场布局自动驾驶,可以说能下场的巨头们基本上都下场造车了,自动驾驶“战场”群雄逐鹿,不知未来谁执牛耳?

在资本市场上,自动驾驶也备受追捧。据零壹智库分析,继 2016-2018 年热潮之后,2021 年自动驾驶领域迎来第二次投资热潮。今年 11 月,Momenta 完成超 10 亿美元 C 轮系列融资,创下本年度自动驾驶领域最大规模融资记录。

商业化前夜

Robotaxi 是自动驾驶最有价值的商业模式,现阶段,很多自动驾驶技术公司都在做 Robotaxi 的尝试。今年,很多自动驾驶车辆从封闭路测场地走向真实道路。百度、小马智行、文远知行、等企业已实现面向公众的示范运营,开始探索商业化。11 月,国内首个自动驾驶出行服务商业化试点在北京正式启动,百度和小马智行成为首批获许开展商业化试点的企业。业内人士认为,这标志着国内自动驾驶领域从测试示范迈入商业化试点探索新阶段。

今年,自动驾驶卡车赛道也格外火热,量产和商业化均提速,头部玩家走向上市。近日,毫末智行董事长张凯在接受 InfoQ 等媒体采访时谈到了自动驾驶卡车的发展,他表示,相对乘用车辅助自动驾驶运行场景的复杂性,RoboTruck 具有一些优势,例如长时间运行在较畅通的高速公路上,运行场景相对简单。现阶段,RoboTruck 走得是类似于乘用车般从辅助驾驶到无人驾驶渐进式的发展路线。从发展前景看,Robotruck 具备商业化闭环的可行性,但自动驾驶系统的量产将会是一个坎。

毫末智行 COO 侯军认为,2021 年是自动驾驶的爆发之年。一方面,得益于技术的持续进步、市场需求、政策加持、资本看好等各方面因素,高级别自动驾驶在落地探索方面,已有了初步的成果;另一方面,智能驾驶商业化落地也在快速渗透,开始走向量产时代。

2022,这些技术将是下半场竞争胜负的关键

根据张凯的预判,“2022 年将是自动驾驶行业发展最为关键的一年。乘用车辅助驾驶领域的竞争将会正式进入下半场,而下半场竞争的场景将会是城市开放场景。其他场景的自动驾驶也将正式进入商业化元年”。

张凯认为,2022 年,多项自动驾驶技术值得关注。

(1)数据智能将成为自动驾驶量产决胜的关键。 数据智能体系是自动驾驶商业化闭环的关键所在,搭建高效、低成本的数据智能体系有助于推动自动驾驶系统不断迭代前行。

(2)Transformer 与 CNN 技术深度融合,将会成为自动驾驶算法整合的粘合剂。Transformer 技术帮助自动驾驶感知系统理解环境语义更深刻,与 CNN 技术深度融合能解决 AI 大模型量产部署的难题,这是自动驾驶行业下半场竞争的关键技术。

(3)大算力计算平台将在 2022 年正式量产落地,Transformer 技术与 ONESTAGE CNN 技术都需要大算力计算平台做支撑。

(4)随着自动驾驶系统的量产和规模化,激光雷达与机器视觉组成的 AI 感知技术,将与大算力计算平台深度融合,这将大幅提升自动驾驶感知、认知模块的运行效率。

NLP,黄金时代持续?

这几年,NLP 处于快速发展阶段。去年,多位 NLP 专家评判,NLP 迎来了大爆发的黄金时代。那么今年,NLP 的发展情况如何?

基于提示的微调技术迅速流行

作业帮产研中心蒋宏飞博士告诉 InfoQ,今年基于提示的微调 (prompt-based tuning)的技术迅速流行起来,这是一种人类知识和大模型较高效的结合模式。该技术是今年较值得关注的新进展。

“今年 NLP 在基础模型方面没有大的突破。预训练模型方面,今年涌现了很多很大的模型,但整体上同质化也较严重,对于工业界实践效果来讲,往往按照‘奥卡姆剃刀’原则,倾向于使用最适当的如 Bert 往往就够了”蒋宏飞表示。

现阶段,NLP 技术在发展过程中还存在不少技术挑战,其中之一便是很难获取到大量高质量的标注数据。深度学习依赖大规模标注数据,对于语音识别、图像处理等感知类任务,标注数据相对容易,但 NLP 往往是认识类任务,人的理解都有主观性,且任务和领域众多,导致大规模语料标注的时间成本和人力成本都很大。

与 CV、语音识别相比,NLP 项目在业务中落地往往较慢

NLP 落地项目往往和业务强相关。不像图像识别、语音识别,通用能力在具体业务也有大量落地场景,业务和算法协作边界和指标相对好确定。而 NLP 项目在业务中落地往往会比较慢,需要上下游不断深度磨合对齐。

NLP 解决的是最难的认知智能,而人类语言的歧义性、复杂性、动态性令其挑战重重。但 NLP 商业化落地必须面对这些本质的难题,所以不太可能有通用性的“一招吃遍天”的技术方案。

“尽管现在的预训练模型一直在往这个方向努力,但我认为起码目前这种 Transformer 式的,或者更通用地说,DNN 这种蜂巢智能式的技术范式不太行。所以,大家能看到也有不少研究学者在知识图谱类的各种其他范式上在做努力”蒋宏飞说。

通用性的模型既然走不通,那垂类单一具体场景任务为什么也不能快速搭建?这个问题又涉及到数据的问题。数据标准的对齐、数据标注一致且高效、数据覆盖度和均衡度、长尾数据的处理、数据动态漂移等都是 NLP 从业者每天面对的麻烦事。而相关的方法论和基础工具还很不系统、不齐备,这是未来想达到快速商业化目的前必须打好的基础。

明年,NLP 将在哪些场景实现规模化落地?

2022 年,NLP 的大规模化应用可能会出现在以下行业出现突破:

  • 教育智能化

  • 场景化高标准机器辅助翻译,如专业领域文档翻译、会议实时翻译等。

  • 服务运营智能化:培训、销售、营销、服务等场景的智能化。

  • 外文学习/写作智能辅助,参考 Grammarly 和 Duolingo 的快速发展。

  • 医疗智能化。文本广泛存在于电子病历、临床试验报告、医学产品说明书、医学文献中。分析、挖掘和利用这些文本,有大量且能直接使用的场景,可能会有突破式发展。

  • 代码智能分析。代码 bug 识别、代码智能优化等。

2022 年,NLP 值得关注的技术点

  • 基于提示的微调 (prompt-based tuning)的技术。

  • 具有逻辑推理的文本生成技术、具有良好控制性以及一致性的文本生成技术。文本生成要在严肃场景用起来就必须满足这些,否则只能应用在娱乐场景。

  • 多模态技术。如 NLP+CV、 NLP + Image、 NLP+ Speech 等。

  • 主动学习、数据增强等。NLP 大规模快速落地时的很多痛点需要这些技术来缓解。

  • 代码智能。代码问题识别、代码翻译、自动代码优化、代码工作量评估(如 Merico 的方案)。

元宇宙概念大火,计算机视觉是基石技术之一

回首过去的一年,OPPO AI 技术产品化专家(语音语义和计算机视觉以及多模态融合方向)何苗总结了计算机视觉在工业界和学术界的进展。

具身智能,从被动式 AI 转向主动式人工智能

具身智能(embodied AI),强调智能体(agent)要与真实世界进行交互,并通过多模态的交互 — 不仅仅是让 AI 学习提取视觉上的高维特征,被“输入”的认知世界,而是通过“眼耳鼻舌身意”六根来主动获取物理世界的真实反馈,通过反馈进一步让智能体学习并使其更“智能”、乃至“进化”。

今年 2 月,李飞飞提出了一套新的计算框架—— DERL(deep evolution reinforcement learning)深度进化强化学习。她提到了生物进化论与智能体进化的关系,并借鉴了进化论的理论应用于假设的智能体的进化学习中。

进入元宇宙,需要智能感知和交互这张门票

今年,元宇宙概念大火,各家纷纷入局。

Facebook 极为推崇元宇宙,为了表示投入元宇宙的决心,今年,Facebook 改名为 meta,并宣布 “all in 元宇宙”。

扎克伯格提出云宇宙需要具备八要素,其中之一是 Presence 开发平台/套件。Presence 是 meta 为 Oculus VR 头显开发者提供的元宇宙基础开发套件,提供的即为基于计算机视觉和智能语音技术的工具集,分别是 insight sdk、interaction sdk 和 voice sdk。

进入元宇宙需要智能感知与交互技术这张门票,而这张门票里的视觉和语音技术是最重要的基石。

趋势一:面向内容生成的 AIGC

元宇宙世界需要孪生大量现实世界的物体或是对于现实世界的人物进行重建,而这些海量的重建必然不能按照传统游戏世界中的方法,由 CG 工程师一个个手工制作,这样效率远远无法满足实际场景的需求。因此面向内容生成的 AIGC(算法层面)是必要的。相关技术方向包括:图像超分、domain 迁移、外推、类似 CLIP(对比式语言图像预训练模型,可以从自然语言监督中有效学习视觉模型)的隐式神经表示 — 通过文字描述来生成图像等多模态的(CV+NLP)等相关技术。

趋势二:SCV 合成

虚拟现实引擎有专门的生成合成数据的组件,这些合成数据不仅美观,而且有助于训练更好的算法。

生成/合成的数据不仅是元宇宙的必备要素,也是训练模型的重要原料。如果有合适的工具来构建数据集,就可省去繁琐的给数据手工打标的过程,更好地对计算机视觉算法进行开发和训练。

知名数据分析公司 Gartner 认为在未来 3 年中,合成数据将比真实数据更占优势。在合成计算机视觉(SCV)中,我们使用虚拟现实引擎训练计算机视觉模型,并将训练好的模型部署到现实世界。

制约知识图谱商业化落地的主要问题在于标准化

重要技术进展

知识图谱技术在过去这一年取得的重要技术进展有:

知识抽取方面,多模态信息抽取在同时处理文本和视频方面取得了进展;知识表示方面,自注意力机制的知识表示方法越来越走向实用;知识应用方面,很多行业开始构建行业知识库,用于各类下游任务。

明略科技资深科学家张杰在接受 InfoQ 采访时指出,现阶段,在知识图谱方面,业界普遍面临的研发难点主要体现在两个方面:算法方面,针对非结构化数据的信息抽取和实体对齐的准确度难以保障直接商用,需人工校验;工程方面,行业图谱构建成本高,需要大量的人工标注,另外构建进度也不是一蹴而就,需要业务专家不断运维。

张杰预测,2022 年,领域预训练语言模型和 Prompt 在知识图谱中的应用,有望使得信息抽取环节得到进一步提升。针对技能性知识的抽取技术和多模态抽取技术,商用前景广阔。

应用落地进展

2021 年,知识图谱技术的应用落地,在 ToC 场景中仍主要用于搜索、推荐的提升,在 ToB 场景中集中在可视化上。

张杰认为,现阶段,制约知识图谱商业化落地的主要因素在于标准化,行业图谱的 schema 很难在企业内部大范围内达成认知的一致性,影响了后续的标注、抽取、应用。

2022 年,知识图谱技术的大规模化应用可能会在制造业出现突破,制造业的知识密度高、重视标准化,头部企业重视数字化建设,积累了大量原始数据。

2022 年,值得关注的重要技术趋势

人工智能工程化

近两年,人工智能工程化(AI Engineering)格外受关注。在 Gartner 发布的 2021 年和 2022 年重要战略技术趋势中,人工智能工程化都被列入其中。人工智能工程化是一种实现人工智能模型操作化的综合方法。

不久前,Gartner 高级研究总监高挺曾在接受 InfoQ 采访时表示,AI 工程化本质上是 AI 在企业中大规模、全流程的落地过程,尽管目前大家现在对 AI 期待很高,但实际上 AI 目前的应用仍然是被低估的。因为,很多 AI 项目的价值只能体现在一些“点对点”的一次性的方案中。将 AI 大规模落地的工程化方法(包含 DataOps、ModelOps 和 DevOps)总和起来,便是“AI 的工程化”的一整套体系。

人工智能工程化对企业有很多好处,企业在进行人工智能落地的时候,落地效率、落地广泛度会更高。

可以预见,人工智能工程化将会是未来 2-3 年需要持续关注的方向,人工智能工程化应该关注三大核心要点:数据运维、模型运维、开发运维。

Gartner 预测,到 2025 年,10%建立人工智能工程化最佳实践的企业从其人工智能工作中产生的价值将至少比 90%未建立该实践的企业高出三倍。

生成式 AI 渐成趋势

生成式人工智能(Generative Artificial Intelligence)也被 Gartner 评为 2022 年重要战略技术趋势之一。

该机器学习方法从其数据中学习内容或对象,并运用数据生成全新、完全原创的实际工件。人们可以用 AI 来创造出一些新事物,如内容创作、创建软件代码、辅助药物研发等。

近日,机器学习大牛吴恩达发文回顾了 AI 在 2021 年的四个重要进展,其中之一便是,AI 生成音频内容呈现出主流化倾向。现在音乐家和电影制作人们,已经习惯于使用 AI 支持型音频制作工具。

在国内的优酷、爱奇艺等视频平台,AI 也已经广泛用于音、视频的内容生产和创作中,如 AI 辅助视频制作、智能字幕生成、智能翻译、特效生成等。

Gartner 认为,未来一段时间内,AI 会逐渐从一个做判断的机器变成一个做创造的机器。预计到 2025 年,生成式人工智能将占所有生成数据的 10%,而目前这一比例还不到 1%。

不过该技术还存在一定的争议,如会被滥用于诈骗、欺诈、政治造谣、伪造身份等,存在道德和法律风险。

元宇宙,狂热的新风口

2021 年,可能没什么技术名词比“元宇宙”热度更高了。全球很多公司都在讲元宇宙的概念,认为元宇宙是指向互联网的“终极形态”。如今,移动互联网的红利已经见顶,不知道互联网的尽头是否会是元宇宙?

所谓元宇宙,是一个虚拟时空间的集合, 由一系列的增强现实(AR), 虚拟现实(VR) 和互联网(Internet)所组成。元宇宙的实现,仰赖一系列前沿技术作支撑,包括人工智能、VR/VR、5G、云计算、大数据、区块链等基础设施。

元宇宙中可以重点关注的细分赛道有 VR/AR 、游戏、社交、Metahuman 等。文娱基金易凯资本在其元宇宙报告中也表示,长期看好基于上述形态的底层技术公司。易凯资本预测,在未来十年,元宇宙概念将依旧集中于社交、游戏、内容等娱乐领域,到 2030 年会渗透到提升生产生活效率的领域。

写在最后

总结人工智能在 2021 年的发展,涌现了不少激动人心的重大突破,人工智能也正在赋能、改变甚至颠覆许多行业。当然也仍有很多难点需要投入更多时间攻克。

近日,李彦宏对 AI 的未来发表评论:“人机共生”时代,中国将迎来 AI 黄金十年。而未来十年,AI 技术应用门槛将显著降低,为各行各业的智能化转型提供技术“大底座”。

人工智能发展已渐入深水区,期待明年以及之后的 10 年,人工智能能够在技术和落地上取得更多进展,为下一个“黄金十年”而努力。

采访嘉宾介绍(按姓名首字母排序):

何苗,OPPO AI 技术产品化专家

侯军,毫末智行 COO

蒋宏飞,作业帮产研中心

刘知远,清华大学教授、智源大模型技术委员会成员

⻢泽君,字节跳动 AILAB 语⾳技术总监

吴韶华,浪潮人工智能研究院首席研究员

许欣然,旷视天元 MegEngine 研发负责人

曾冠荣,OPPO 小布智能中心、 NLP 算法工程师

张杰,明略科技资深科学家

张凯,毫末智行董事长

来源 | InfoQ

]]>
//m.krtcgo.com/%e8%a7%a3%e8%af%bb%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e7%9a%84-2021%ef%bc%9a%e8%b6%85%e5%a4%a7%e8%a7%84%e6%a8%a1%e9%a2%84%e8%ae%ad%e7%bb%83%e6%a8%a1%e5%9e%8b%e7%88%86%e5%8f%91%ef%bc%8c%e8%87%aa/feed/ 0
应用落地 智创未来 | 2021 新一代人工智能院士高峰论坛昇腾人工智能应用专场成功举办 //m.krtcgo.com/%e5%ba%94%e7%94%a8%e8%90%bd%e5%9c%b0-%e6%99%ba%e5%88%9b%e6%9c%aa%e6%9d%a5-2021-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b/ //m.krtcgo.com/%e5%ba%94%e7%94%a8%e8%90%bd%e5%9c%b0-%e6%99%ba%e5%88%9b%e6%9c%aa%e6%9d%a5-2021-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b/#respond Sat, 25 Dec 2021 03:25:00 +0000 https://new.openi.org.cn/%e5%ba%94%e7%94%a8%e8%90%bd%e5%9c%b0-%e6%99%ba%e5%88%9b%e6%9c%aa%e6%9d%a5-2021-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b/ 12 月 19—20 日,由鹏城实验室和新一代人工智能产业技术创新战略联盟主办的“2021 新一代人工智能院士高峰论坛暨启智开发者大会”在深圳举办,期间,华为技术有限公司承办的新一代人工智能院士高峰论坛昇腾人工智能应用专场于 20 日成功举行。

深耕基础,厚植技术。近年来,华为昇腾以“硬件开放、软件开源、使能伙伴、发展人才”16 字方针不断发展产业,携手各行各业的开发者们进行赋能升级,助推人工智能的应用落地。本次昇腾人工智能应用专场,华为更是邀请了多位昇腾技术专家,从一线的 AI 应用挑战出发,与开发者们研讨交流,共创机遇。

与开发者共成长,共筑 AI 技术生态

会上,华为昇腾生态首席专家张存燕以行业的人才培养为切入点,向大家分享了昇腾面向开发者们的 offering 发展战略,以及面向行业、高校、初创、个人不同类型开发者的权益和计划。张存燕介绍到,华为深耕根技术,一直致力于打破算力消耗的鸿沟。在昇腾基础软硬件平台上,昇腾一共打造了技术和商业两个生态。技术生态为科研机构、高校、企业、合作伙伴的研发人员提供技术支撑,加速科研创新;商业生态则注重与合作伙伴一起打造面向各行各业的解决方案,真正让 AI 走入到千行百业,赋能各个产业的智能化改造和智能化升级。

在这两个生态的带动下,昇腾希望打造一个人工智能的“黑土地”,合力为每位 AI 开发者及每个行业的应用开发者提供强大引擎,共同繁荣国内人工智能产业新生态。

构筑澎湃 AI 算力,CANN5.0 性能再提升

在汹涌的 AI 时代浪潮中,人工智能技术领域无疑面临着重重困难和挑战。AI 算力设施昂贵、专业人才稀缺,整个行业对计算效率和编程易用性的诉求愈发强烈。昇腾 CANN 运营总监田晓亮便从新计算范式出现、异构计算兴起和大集群等行业新挑战引导发问,介绍了 CANN 的基础架构及其适配场景。自 2018 年 CANN1.0 发布面世,经过三年发展,CANN 在技术和生态上都已经有了长足的进步。在性能方面,CANN5.0 通过软硬件结合优化,充分发挥了昇腾芯片的算力性能。这主要源自于多项关键技术的突破,如自动流水、算子深度融合、自适应梯度切分、智能计算调优带来的更高效的任务角度和切分策略。

在发展过程中,CANN 还非常注重生态发展,通过社区运作,CANN 不断创新优化,迭代出了新的产业、新的软件。回应开发者诉求、助力解决行业困境,CANN 未来将持续在基础和关键技术上进行突破,“只有基础打得牢、根扎得深,才会有人工智能的繁荣发展”,田晓亮这样强调。

全场景 AI 计算框架,MindSpore 超大模型训练落地实践

近段时间,中文大规模预训练语言模型层出不穷,已经成长到仅加载就需要 TB 级内存或显存的生态。昇思 MindSpore 架构师 ZOMI 酱就针对 MindSpore 超大模型训练的一些关键技术,进行了一些稍为“硬核”的内容分享。MindSpore 在 2020 年 3 月份开始开源,到现在的 1.5 版本,总下载量已经接近 100 万。快速部署、灵活调试,现在的 MindSpore 已经能够支撑像鹏城盘古 NLP、鹏城神农氨基酸序列生成、华为云 NLP 模型、紫东太初多模态模型这样的千亿大模型。对于大模型面临的“内存、性能、效率、调优”挑战,MindSpore 则分别对应给出了图算融合、Scale out、集群调优等解决方案。

讲起核心技术,ZOMI 酱表示,除了通过图的编译把多维度并行融合到框架,“多维度混合自动并行”是 MindSpore 做得比较好的地方。现今,MindSpore 自动并行已经实现 5 维的并行方式,实现对超大规模的分布式训练及超大规模中文预训练模型的探索。

MxIndex: 更快、更便捷、更友好的数据检索 SDK

将物理世界中的非结构化数据,如图片、视频、音频通过 AI 模型转换为特征,是众多 AI 业务的核心逻辑。昇腾 MindX 技术专家李明举在给大家介绍数据检索的 SDK 时,就用简单的语言阐释了普通开发者如何用 AI 来解决生活中的问题。让 AI 从学术成果到产业落地,昇腾 MindX 总结了三座问题大山——算法开发难、应用开发难和业务部署难,而 MindX 的四个组件“ MindX DL”“ MindX Edge”“MindX Zoo”和“MindX SDK”则对应这三座大山给出了解决方案。

“大数据”“区块链”“元宇宙”,各行各业的概念正潜移默化地改变着我们的生活,昇腾 MindX SDK mxIndex 更是将目光聚焦在了非结构化数据上。李明举提到,非结构化数据有着非常多潜在的发展空间,在推荐系统、数据挖掘等领域都有良好的发展前景。但同时,机遇与挑战并存,算法问题常常会演化成更大的工程问题,如何在如此多的技术之下去搭建业务,mxIndex 在这里给出了答卷。“更快”——带来更高的 QPS,更大的吞吐量和更大的底库数据规模;“更便捷”——昇腾拥有开源中最受欢迎的框架之一,而 mxIndex 在用户迁移上更是兼具了轻体量与便捷性两项优点;“更友好”——清晰操作、在线交流,在用户体验上,mxIndex 拥有简明的接口定义,丰富详实的手册和活跃的社区支持。对于大规模特征检索或聚类的应用场景需求,mxIndex 能够提供极简易用、高性能的 API,助力昇腾 AI 处理器赋能各类应用。

Sedna,分布式协同 AI 框架

边缘 AI 在如今的工业互联网、智慧园区等场景已有着越来越多的应用,但同时还存在着诸多挑战,包括软硬件异构、边缘资源受损、边缘数据异构、边缘小样本和隐私安全等常见问题。会上,华为云边缘云创新 Lab 高级工程师普杰从应用的角度,向开发者们介绍了华为云在边缘计算尤其是边云协同 AI 领域的相关探索。

2018 年,华为云开源了边缘计算平台项目 KubeEdge。作为业界首个云原生的边缘计算平台,KubeEdge 通过开放的社区治理连接云原生和边缘计算生态,旨在提供应用协同、资源协同以及数据协同和设备协同的统一标准。

在边缘计算场景中,AI 应用需要面对个性化的边缘场景,资源碎片化、数据异构、小样本、数据隐私等问题急需解决。2020 年底,KubeEdge 社区成立了特别兴趣小组 SIG AI,聚焦边缘 AI 相关的技术讨论、API 定义、参考架构、开源实现等,使能 AI 应用在边缘更好的运行。

2021 年初,华为云进一步开源了边云协同 AI 框架 Sedna,基于 KubeEdge,实现边与云的协同推理、增量学习、终身学习、联邦学习等核心边缘 AI 能力,能有效提升模型准确度,降低边缘资源的消耗,保护数据隐私和安全。

普杰提到,Sedna 不是想做一个 TensorFlow 这样的框架,而是基于 KubeEdge 提供的边云协同的能力,支持现有的 AI 应用无缝地下沉到边缘,降低边云协同 AI 应用的构建和部署成本、提升模型的性能并保护数据隐私。

现场实操,在线体验昇腾全栈 AI 魔力

当天下午,昇腾人工智能应用专场进行了丰富有趣的案例分享和在线实验。现场由昇腾 CANN 资深技术专家毛红朝、昇腾 MindX 研发专家陈航、昇思 MindSpore 资深技术专家 xavier 和昇腾 CANN 资深技术专家郑佳带领,为开发者们带来了“基于昇腾 CANN 的 AI 应用开发”、“使用 MindX SDK 开发智能质检应用”、“昇思 MindSpore YOLO 案例开发到部署介绍”和“基于昇腾 CANN 的模型迁移”四场实操课程。

共筑 AI 新高地,共赢智能新未来。伴随着惊喜有趣的现场抽奖环节,开发者们于实践中全方位感受华为面向“端、边、云”的全场景 AI 基础设施方案,在线体验来自昇腾的全栈 AI 魔力。

]]>
//m.krtcgo.com/%e5%ba%94%e7%94%a8%e8%90%bd%e5%9c%b0-%e6%99%ba%e5%88%9b%e6%9c%aa%e6%9d%a5-2021-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b/feed/ 0
2021 年全国人工智能大赛正式启动,396 万奖金等你报名! //m.krtcgo.com/2021-%e5%b9%b4%e5%85%a8%e5%9b%bd%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e5%a4%a7%e8%b5%9b%e6%ad%a3%e5%bc%8f%e5%90%af%e5%8a%a8%ef%bc%8c396-%e4%b8%87%e5%a5%96%e9%87%91%e7%ad%89%e4%bd%a0%e6%8a%a5%e5%90%8d/ //m.krtcgo.com/2021-%e5%b9%b4%e5%85%a8%e5%9b%bd%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e5%a4%a7%e8%b5%9b%e6%ad%a3%e5%bc%8f%e5%90%af%e5%8a%a8%ef%bc%8c396-%e4%b8%87%e5%a5%96%e9%87%91%e7%ad%89%e4%bd%a0%e6%8a%a5%e5%90%8d/#respond Sat, 25 Dec 2021 03:23:00 +0000 https://new.openi.org.cn/2021-%e5%b9%b4%e5%85%a8%e5%9b%bd%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e5%a4%a7%e8%b5%9b%e6%ad%a3%e5%bc%8f%e5%90%af%e5%8a%a8%ef%bc%8c396-%e4%b8%87%e5%a5%96%e9%87%91%e7%ad%89%e4%bd%a0%e6%8a%a5%e5%90%8d/ 12 月 19 日,由深圳市人民政府、鹏城实验室主办,深圳市科技创新委员会、新一代人工智能产业技术创新战略联盟(AITISA)联合承办的 2021 年全国人工智能大赛在深圳举行启动仪式。科技部高新技术司副司长梅建平,中国工程院院士、鹏城实验室主任高文,中国工程院院士于全,深圳市科创委副主任钟海,星河集团常务副总裁阎镜予,华为昇腾计算业务 CTO 周斌,平安科技庄伯金 7 位嘉宾共同按下大赛启动键,宣布 2021 年全国人工智能大赛正式启动。

随着在各个领域的广泛渗透,人工智能不断释放潜力,已成为当今世界最受瞩目的科技之一。我国紧抓机遇,相继推出了一系列相关政策来推动人工智能产业的发展。在时代和政策的双重驱动下,我国人工智能产业呈现出勃勃生机,而通过大赛来聚焦人工智能领域关键问题、探索实际问题解决方案,也成为提高科研水平、推动人工智能产业发展的重要方式——全国人工智能大赛也正是希望通过竞赛的方式来选拔和培育优秀科技创新人才,推动人工智能产业的发展。

此前,大赛已举办了两届,共吸引全球 13 个区域的 8324 支队伍、10738 名选手报名参赛,累计提交作品数万件——大赛影响力及规模均位列各类人工智能大赛前茅,并获得了良好的社会反馈。

本届大赛竞赛委员会由中国工程院院士高文、中国工程院院士于全担任主席;由华为昇腾 AI 计算领域总裁许映童,东南大学副校长金石,清华大学教授、中国计算机学会副秘书长陈文光,中山大学教授梁凡担任副主席。委员会 27 名委员均由国内外人工智能、互联网、通信行业的顶尖专家组成。

本届大赛以“AI 赋能视界”为主题,设立“AI+无线通信”和“AI+视觉特征编码”两大赛道,由鹏城实验室“鹏城云脑”AI 超算大科学装置支撑。同时,华为昇腾生态也为大赛添加助力:初赛和复赛期间,优秀团队可获得华为云资源券。

启动仪式上,于全院士对大赛赛题进行了解读。他表示,和前两届大赛相比,本届大赛有继承性,也有新发展——“数据集更大,模型和场景更复杂,难度上有很大增加,技术上有了新的发展,也将会产生更大的科学价值和产业影响。”

本届赛事将历时四个月,分为初赛、复赛和决赛三个环节,总奖金池高达 396 万。每个赛道分别设置一、二、三等奖和优胜奖,同时配有绿色招聘通道、科研及创业支持、政策资助等相关配套激励。

赛/事/亮/点

AI 开发者不可错过的理由

官方主办,赛事含金量高

深圳市人民政府与鹏城实验室主办,深圳市科技创新委员会和新一代人工智能产业技术创新战略联盟(AITISA)联合承办。

大咖汇聚,委员会专业保障

具有大赛赛题相关领域较高的理论水平和较丰富的实践经验的院士、专家组成竞赛委员会:中国工程院的高文院士、于全院士担任大赛竞赛委员会主席,华为昇腾 AI 计算领域总裁许映童、东南大学副校长金石等担任大赛竞赛委员会副主席。

前沿赛题,对标业界需求

大赛发布“AI+无线通信”和“AI+视觉特征编码”2 个赛道,对标社会和产业的最新需求,充分考虑了赛题的学术价值、落地价值、产业影响和数据规模等问题。

高额激励,只为良才

大赛总奖金 396 万元,每个赛道的一等奖团队独揽 100 万元奖金,更有绿色通道、云资源、政策资助、科研及创业支持等系列福利。

大/赛/赛/题

2 个赛道可同时参与

赛道一:“AI+无线通信”

要求选手通过人工智能技术学习信道特性,进行高维信道数据压缩降维与重建,利用 AI 设计接收机及其智能收发机联合优化。

赛道二:“AI+视觉特征编码”

要求选手综合考虑视觉信息编码效率和机器视觉任务性能,结合传统信号处理技术与人工智能技术,提升精度,优化效率,改善泛化性。

赛/程/安/排

注意,不要错过哟~

#1 初赛阶段

2021-12-19(12:00:00 中午)至 2022-02-21(12:00:00 中午)

初赛将进行算法设计、模型训练及评估,提交预测结果进行比赛。

  • 2021-12-19 大赛启动,发布初赛赛题

  • 2021-12-20(12:00:00 中午) 发布初赛数据

  • 2021-12-19(12:00:00 中午)至 2021-02-13(12:00:00 中午)开放报名

  • 2021-12-20(12:00:00 中午)至 2022-02-15(12:00:00 中午) 初赛评测

  • 2022-02-15 至 2022-02-21 晋级资格审核

各赛道前 100 支队伍可晋级至复赛

#2 复赛阶段

2022-02-21(12:00:00 中午)至 2022-03-28(12:00:00 中午)

复赛将开放复赛测试集,各参赛队伍提交结果进入评分、排名、代码验证,个别比赛还将考察参赛队伍算法运行效率。

  • 2022-02-21  发布复赛赛题

  • 2022-02-21(12:00:00 中午)  发布复赛数据

  • 2022-02-21(12:00:00 中午)至 2022-03-21(12:00:00 中午) 复赛评测

  • 2022-03-21 至 2022-03-28 晋级资格审核

各赛道前 10 支队伍可晋级至决赛

#3 决赛阶段

2022-03-29 至 2022-04-15

决赛采用远程接入调测、现场技术比拼、现场答辩等方式进行。

复赛结束后公布具体日程安排。

一等奖 1 名二等奖 2 名三等奖 3 名优胜奖 4 名

大/赛/激/励

奖励多多,等你来~

奖金奖项

本届大赛总奖金池高达 396 万元人民币,每个赛道设 4 类奖项、198 万元奖金激励。(所有奖金均为税前金额)

招聘绿色通道

复赛审核通过的单赛道排名前 20 支队伍中的选手,可进入鹏城实验室和相关协办单位的招聘绿色通道。

云资源

初赛过程中成绩优秀的团队、进入复赛的团队,可获取华为云资源券支持。

政策资助

大赛对接政府创新创业资助和贷款贴息项目资助。选手政策支持自参赛次年起两年内有效,鼓励进入决赛选手团队在深圳发展。

科研支持

参赛项目及团队经过评估将有机会在鹏城实验室立项,获得鹏城实验室科研经费支持及人才政策支持。

创业支持

入围决赛、获决赛前三等奖及获优胜奖的团队组选手,待在深圳成立企业后,按规定给予创新创业资助支持,选手政策支持自参赛次年起 2 年内有效。

配套支持

决赛获奖团队落户深圳的优秀项目,可获得深圳相关区级资金、场地等配套支持。

报/名/方/式

等你~

本届大赛面向全球开放,个人、高等院校、科研单位、企业或创客团队等均可报名参赛,团队上限 5 人。即日起,AI 极客们可访问大赛官网(https://naic.pcl.ac.cn),完成个人信息注册及初赛报名。

]]>
//m.krtcgo.com/2021-%e5%b9%b4%e5%85%a8%e5%9b%bd%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e5%a4%a7%e8%b5%9b%e6%ad%a3%e5%bc%8f%e5%90%af%e5%8a%a8%ef%bc%8c396-%e4%b8%87%e5%a5%96%e9%87%91%e7%ad%89%e4%bd%a0%e6%8a%a5%e5%90%8d/feed/ 0
近400万奖金!2021全国人工智能大赛来了 //m.krtcgo.com/%e8%bf%91400%e4%b8%87%e5%a5%96%e9%87%91%ef%bc%812021%e5%85%a8%e5%9b%bd%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e5%a4%a7%e8%b5%9b%e6%9d%a5%e4%ba%86/ //m.krtcgo.com/%e8%bf%91400%e4%b8%87%e5%a5%96%e9%87%91%ef%bc%812021%e5%85%a8%e5%9b%bd%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e5%a4%a7%e8%b5%9b%e6%9d%a5%e4%ba%86/#respond Fri, 24 Dec 2021 07:48:00 +0000 https://new.openi.org.cn/%e8%bf%91400%e4%b8%87%e5%a5%96%e9%87%91%ef%bc%812021%e5%85%a8%e5%9b%bd%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e5%a4%a7%e8%b5%9b%e6%9d%a5%e4%ba%86/ 12 月 19 日,由深圳市人民政府、鹏城实验室主办,深圳市科技创新委员会、新一代人工智能产业技术创新战略联盟(AITISA)联合承办的 2021 年全国人工智能大赛在深圳举行启动仪式。科技部高新技术司副司长梅建平,中国工程院院士、鹏城实验室主任高文,中国工程院院士于全,深圳市科创委副主任钟海,星河集团常务副总裁阎镜予,华为昇腾计算业务 CTO 周斌,平安科技庄伯金 7 位嘉宾共同按下大赛启动键,宣布 2021 年全国人工智能大赛正式启动。

随着在各个领域的广泛渗透,人工智能不断释放潜力,已成为当今世界最受瞩目的科技之一。我国紧抓机遇,相继推出了一系列相关政策来推动人工智能产业的发展。在时代和政策的双重驱动下,我国人工智能产业呈现出勃勃生机,而通过大赛来聚焦人工智能领域关键问题、探索实际问题解决方案,也成为提高科研水平、推动人工智能产业发展的重要方式——全国人工智能大赛也正是希望通过竞赛的方式来选拔和培育优秀科技创新人才,推动人工智能产业的发展。

此前,大赛已举办了两届,共吸引全球 13 个区域的 8324 支队伍、10738 名选手报名参赛,累计提交作品数万件——大赛影响力及规模均位列各类人工智能大赛前茅,并获得了良好的社会反馈。

本届大赛竞赛委员会由中国工程院院士高文、中国工程院院士于全担任主席;由华为昇腾 AI 计算领域总裁许映童,东南大学副校长金石,清华大学教授、中国计算机学会副秘书长陈文光,中山大学教授梁凡担任副主席。委员会 27 名委员均由国内外人工智能、互联网、通信行业的顶尖专家组成。

本届大赛以“AI 赋能视界”为主题,设立“AI+无线通信”和“AI+视觉特征编码”两大赛道,由鹏城实验室“鹏城云脑”AI 超算大科学装置支撑。同时,华为昇腾生态也为大赛添加助力:初赛和复赛期间,优秀团队可获得华为云资源券。

启动仪式上,于全院士对大赛赛题进行了解读。他表示,和前两届大赛相比,本届大赛有继承性,也有新发展——“数据集更大,模型和场景更复杂,难度上有很大增加,技术上有了新的发展,也将会产生更大的科学价值和产业影响。”

本届赛事将历时四个月,分为初赛、复赛和决赛三个环节,总奖金池高达 396 万。每个赛道分别设置一、二、三等奖和优胜奖,同时配有绿色招聘通道、科研及创业支持、政策资助等相关配套激励。

赛/事/亮/点

AI 开发者不可错过的理由

官方主办,赛事含金量高

深圳市人民政府与鹏城实验室主办,深圳市科技创新委员会和新一代人工智能产业技术创新战略联盟(AITISA)联合承办。

大咖汇聚,委员会专业保障

具有大赛赛题相关领域较高的理论水平和较丰富的实践经验的院士、专家组成竞赛委员会:中国工程院的高文院士、于全院士担任大赛竞赛委员会主席,华为昇腾 AI 计算领域总裁许映童、东南大学副校长金石等担任大赛竞赛委员会副主席。

前沿赛题,对标业界需求

大赛发布“AI+无线通信”和“AI+视觉特征编码”2 个赛道,对标社会和产业的最新需求,充分考虑了赛题的学术价值、落地价值、产业影响和数据规模等问题。

高额激励,只为良才

大赛总奖金 396 万元,每个赛道的一等奖团队独揽 100 万元奖金,更有绿色通道、云资源、政策资助、科研及创业支持等系列福利。

大/赛/赛/题

2 个赛道可同时参与

赛道一:“AI+无线通信”

要求选手通过人工智能技术学习信道特性,进行高维信道数据压缩降维与重建,利用 AI 设计接收机及其智能收发机联合优化。

赛道二:“AI+视觉特征编码”

要求选手综合考虑视觉信息编码效率和机器视觉任务性能,结合传统信号处理技术与人工智能技术,提升精度,优化效率,改善泛化性。

赛/程/安/排

注意,不要错过哟~

#1 初赛阶段

2021-12-19(12:00:00 中午)至 2022-02-21(12:00:00 中午)

初赛将进行算法设计、模型训练及评估,提交预测结果进行比赛。

  • 2021-12-19 大赛启动,发布初赛赛题

  • 2021-12-20(12:00:00 中午) 发布初赛数据

  • 2021-12-19(12:00:00 中午)至 2021-02-13(12:00:00 中午)开放报名

  • 2021-12-20(12:00:00 中午)至 2022-02-15(12:00:00 中午) 初赛评测

  • 2022-02-15 至 2022-02-21 晋级资格审核

各赛道前 100 支队伍可晋级至复赛

#2 复赛阶段

2022-02-21(12:00:00 中午)至 2022-03-28(12:00:00 中午)

复赛将开放复赛测试集,各参赛队伍提交结果进入评分、排名、代码验证,个别比赛还将考察参赛队伍算法运行效率。

  • 2022-02-21  发布复赛赛题

  • 2022-02-21(12:00:00 中午)  发布复赛数据

  • 2022-02-21(12:00:00 中午)至 2022-03-21(12:00:00 中午) 复赛评测

  • 2022-03-21 至 2022-03-28 晋级资格审核

各赛道前 10 支队伍可晋级至决赛

#3 决赛阶段

2022-03-29 至 2022-04-15

决赛采用远程接入调测、现场技术比拼、现场答辩等方式进行。

复赛结束后公布具体日程安排。

一等奖 1 名二等奖 2 名三等奖 3 名优胜奖 4 名

大/赛/激/励

奖励多多,等你来~

奖金奖项

本届大赛总奖金池高达 396 万元人民币,每个赛道设 4 类奖项、198 万元奖金激励。(所有奖金均为税前金额)

招聘绿色通道

复赛审核通过的单赛道排名前 20 支队伍中的选手,可进入鹏城实验室和相关协办单位的招聘绿色通道。

云资源

初赛过程中成绩优秀的团队、进入复赛的团队,可获取华为云资源券支持。

政策资助

大赛对接政府创新创业资助和贷款贴息项目资助。选手政策支持自参赛次年起两年内有效,鼓励进入决赛选手团队在深圳发展。

科研支持

参赛项目及团队经过评估将有机会在鹏城实验室立项,获得鹏城实验室科研经费支持及人才政策支持。

创业支持

入围决赛、获决赛前三等奖及获优胜奖的团队组选手,待在深圳成立企业后,按规定给予创新创业资助支持,选手政策支持自参赛次年起 2 年内有效。

配套支持

决赛获奖团队落户深圳的优秀项目,可获得深圳相关区级资金、场地等配套支持。

报/名/方/式

等你~

本届大赛面向全球开放,个人、高等院校、科研单位、企业或创客团队等均可报名参赛,团队上限 5 人。即日起,AI 极客们可访问大赛官网(https://naic.pcl.ac.cn),完成个人信息注册及初赛报名。

]]>
//m.krtcgo.com/%e8%bf%91400%e4%b8%87%e5%a5%96%e9%87%91%ef%bc%812021%e5%85%a8%e5%9b%bd%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e5%a4%a7%e8%b5%9b%e6%9d%a5%e4%ba%86/feed/ 0
智算未来 | 2021 新一代人工智能院士高峰论坛智算网络分论坛成功举办 //m.krtcgo.com/%e6%99%ba%e7%ae%97%e6%9c%aa%e6%9d%a5-2021-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b%e6%99%ba%e7%ae%97%e7%bd%91%e7%bb%9c/ //m.krtcgo.com/%e6%99%ba%e7%ae%97%e6%9c%aa%e6%9d%a5-2021-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b%e6%99%ba%e7%ae%97%e7%bd%91%e7%bb%9c/#respond Fri, 24 Dec 2021 03:20:00 +0000 https://new.openi.org.cn/%e6%99%ba%e7%ae%97%e6%9c%aa%e6%9d%a5-2021-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b%e6%99%ba%e7%ae%97%e7%bd%91%e7%bb%9c/ 伴随我国超大规模预训练模型的发展,国内人工智能算力需求持续攀升,人工智能算力中心的建设如火如荼。新形势迫切需要在此建设过程中不仅考虑将算力中心作为独立的系统发挥作用,更应形成相互联接的算力网络,以满足网络化算力联通调度的需求。

12 月 19 日,“人工智能算力网络推进联盟”在 2021 新一代人工智能院士高峰论坛暨启智开发者大会上成立。12 月 20 日,为了更好地探索智算网络的建设、实践、保障和运营,峰会智算网络分论坛顺利召开。

智算网络分论坛现场,鹏城实验室与华为、百度、国家超级计算济南中心、武汉人工智能创新生态中心、中原人工智能计算中心、琴智科技研究院、中科类脑等智算联盟首批联盟单位完成了联盟签约仪式。

汇聚科创力量 共建算网融合

人工智能算力中心作为智能时代的新型公共基础设施,是发展人工智能产业的基础资源保障。为发挥其公共基础设施的作用,就要不仅建得好还要用得好。因此构建能够支撑人工智能产业持续发展的智算网络和管理运营机制就变得至关重要。

华为集群计算解决方案架构师崔金带来题为《人工智能算力网络调度平台系统架构》的报告。他认为, 作为一项具有重要意义的新技术,算力网络的落地节奏会分三个阶段:第一阶段,实现运营层面的互联,如提供统一的门户入口等。第二阶段,算力网络利用作业调度层面的互联,实现不同计算中心负载和网络的实时感知与简单调度。第三阶段,跨数据中心并行。系统可以进行细粒度任务调度,大模型并行训练,安全数据管理,还可以从应用场景支持各类复杂的多样性运用。

武汉人工智能生态创新中心副总经理蔡维康在现场作《武汉人工智能生态创新中心运营分享》主题报告,主要围绕武汉人工智能中心的运营模式以及武汉人工智能中心的发展状况等内容进行分享。他表示,未来武汉人工智能生态创新中心将在产业集聚方面,吸引头部科研院校及 AI 企业来汉合作,做实产业发展。

国家超级计算济南中心主任助理、研究员郭猛在题为《超算互联网的探索与实践》的报告中指出,超算互联网不仅仅是网络的概念,智算网络更应提供应用服务,以促使开发者、超算和用户的紧密耦合。打造从超级计算最底层的基础软件到中间件、编程工具、应用软件的全链条应用生态。

百度深度学习技术平台部主任研发架构师、飞桨分布式技术负责人吴志华在《飞桨大规模分布式训练技术》报告中介绍,分布式训练技术能够解决各种场景、各种硬件下多设备的协同训练问题。百度从产业实践的角度不断地进行应用落地的尝试,做出分布式训练算力和算法上的极致优化,在实际场景中打磨部署能力以提升用户的最终体验,让深度学习的创新应用更加简单。

鹏城实验室开源软件与平台研究所副所长、OpenI 技术委员会委员曾炜发表《基于算力网络的全国开源开放平台》的报告。他指出,人工智能开源社区的最佳支撑是智能算力网络,算力网络本身的发展是全球计算和通信产业结合的基础。因此他希望各方资源能在软件、硬件统一的模式为开源、开放提供服务。

业界大咖研讨 构建智算网络建设蓝图

在当日圆桌讨论中,陈文光、管海兵、王子彦、崔金、蔡维康、郭猛等多位业界大咖齐聚现场,共同探讨未来智算网络建设之路。

管海兵教授从政府角度出发,“工业社会看电力,信息社会看算力。算力对当今社会而言,就像以前的电力和水一样,是社会最必不可少的、非常重要的公共资源。”他认为建立算力网络是符合人类社会数千年来运行规律非常重要的举措。

王子彦回应“智能算力网络现状是什么?”一问。他认为,目前对于国家超算来说,国家做了投入,承担了相关的电费、运营补贴等费用。计算中心能够产生相关的科研效益,仍然是它的公共属性。但如果面向产业的话,地方政府要发展智算网络的现状压力仍然大。

崔金表示,虽然算力的汇聚跟水电网络有比较大的差别,算力网络是要把用户的数据、用户的算法拿到算力中心来计算,但希望未来智算网络能够从体验和网络特性上都能做成像水电网络一样。

曾炜表示,软件问题是制约整个网络体系打通和服务最关键的问题。他从开源和标准化的角度,鼓励不同的企业,甚至是圈子外的人在构建软件的过程中倡导共享,共同打造开放的软件栈。

郭猛回顾了网格计算和算力网络的发展历史。他认为网格计算是算力网络必不可少的研究基础。网格计算的分布式计算概念、作业调度的中间件、安全的解决方案和网格的文件传输工具对于构建算力网络都有非常重要的借鉴意义。

管海兵教授在回答现场提问者时总结,发展算力网络和发展智算网络并不矛盾。算力发展的前期阶段已经有了成功的实践,云计算就是一种算力网络。云计算发展到今天,目前存在最大的问题是云和云之间不能互联互通,对用户的水平有一定的要求。因此,只有不断的实践,才能走到更大的普及、普惠、甚至普世的层面。

人工智能算力网络推进联盟将以“平等自愿、优势互补、资源共享、合作共赢”为原则,结合国内外人工智能技术和产业发展需求,整合业内资源,加强相互合作,提升人工智能技术、产品研发水平和应用能力,促进人工智能产业健康快速发展,保障国家人工智能技术和产业的安全,推动人工智能技术在社会各领域、传统产业各领域的广泛应用。

]]>
//m.krtcgo.com/%e6%99%ba%e7%ae%97%e6%9c%aa%e6%9d%a5-2021-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b%e6%99%ba%e7%ae%97%e7%bd%91%e7%bb%9c/feed/ 0
共筑 AI 开源繁荣生态 | 新一代人工智能院士高峰论坛深度学习框架分论坛成功举办 //m.krtcgo.com/%e5%85%b1%e7%ad%91-ai-%e5%bc%80%e6%ba%90%e7%b9%81%e8%8d%a3%e7%94%9f%e6%80%81-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b/ //m.krtcgo.com/%e5%85%b1%e7%ad%91-ai-%e5%bc%80%e6%ba%90%e7%b9%81%e8%8d%a3%e7%94%9f%e6%80%81-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b/#respond Fri, 24 Dec 2021 02:41:00 +0000 https://new.openi.org.cn/%e5%85%b1%e7%ad%91-ai-%e5%bc%80%e6%ba%90%e7%b9%81%e8%8d%a3%e7%94%9f%e6%80%81-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b/ 12 月 20 日,新一代人工智能院士高峰论坛深度学习框架分论坛于深圳成功举办。百度飞桨作为我国首个自主研发、功能丰富、开源开放的产业级深度学习平台,目前已经凝聚了 406 万开发者,创建 47.6 万个模型,服务 15.7 万家企事业单位。飞桨助力开发者快速实现 AI 想法,创新 AI 应用,作为基础平台支撑越来越多行业实现产业智能化升级。

“崇尚技术,鼓励创新”,本次深度学习框架论坛共邀请到 7 位嘉宾,向与会者们分享来自百度飞桨的技术干货。

飞桨:源于产业实践的深度学习开源开放平台

飞桨作为源于产业实践的深度学习开源开放平台,一直不断从产业实践中吸取经验,进行各项性能的极致优化以满足更多的业务落地。百度飞桨主任研发架构师吴志华基于产业级深度学习框架面临的诸多挑战,向大家介绍了飞桨的四大领先技术。

首先在编程模式上,飞桨采用动静统一的方式,构建了开发便捷的深度学习框架。飞桨基于编程逻辑的计算描述,提供给开发者一个比较直观的编程范式,并同时支持静态图和动态图两种模式。在超大规模分布式训练技术上,飞桨目前重点解决了“同生活息息相关的推荐场景下的稀疏大模型”、“图像和自然语言处理下的稠密大模型”两大类。对于比较稀疏的推荐场景,飞桨也在不断解决万亿参数存储、万亿边图存储和高性能通信及训练等诸多挑战。第三个领先技术来自多端多平台部署的高性能推理引擎。飞桨针对推理提供多端多平台的推理部署工具链,从模型准备到模型优化到推理部署,各个环节都有不同的工具组件。飞桨的第四个特点当属其产业级的开源模型库。另外,目前飞桨已经适配了 22 家企业,31 种芯片,飞桨套件更是多次登上 GitHub 创建的榜首。

产业级部署方案,飞桨致力推动产业落地应用

会上,飞桨资深研发工程师 Jason 介绍了飞桨在深度模型应用中的产业级部署方案。在模型准备阶段,开发者可以选择基于飞桨的动态图 API,也可以通过飞桨开源的产业级模型库,或者 X2Paddle 快速迁移其它框架的模型。在部署阶段,目前飞桨提供了包括服务端上的 Paddle Inference 推理引擎,快速服务化部署引擎 Paddle Serving,移动端和边缘端上的部署引擎 Paddle Lite,以及支持在网页前端上部署的 Paddle.js。而除了飞桨自研的全场景部署方案之外,飞桨也开源了 Paddle2ONNX,支持飞桨模型保存为开源的神经网络交换格式 ONNX,可以满足用户更灵活的部署需求。

在讲解完飞桨在各场景下产业级的部署方案后,Jason 还分享了飞桨在无人巡检场景落地的产业案例。他表示,飞桨目前已在多个产业领域得到应用,欢迎大家携手飞桨,共创中国 AI 未来。

知识增强大模型,文心升级再赋能

“大规模预训练技术旨在通过海量数据进行自监督训练,使用统一的模型和方法解决所有任务。该技术打破了传统方法对于大规模标注数据的依赖,显著降低了人工智能的应用门槛。”百度资深研发工程师 Shawn 这样说道。

今年 12 月,全球首个知识增强千亿大模型——鹏城-百度·文心(模型版本号:ERNIE 3.0 Titan)正式发布。从 2019 年 3 月发布 ERNIE 1.0,到最新的产业级知识增强大模型文心全景图,既包含基础通用的大模型,也包含面向重点领域、重点任务的大模型,以及丰富的工具与平台。ERNIE3.0 的创新点是知识增强,将 NLU 和 NLG 进行有机整合等。另外,ERNIE3.0 还针对模型的框架进行了优化,利用 4D 混合并行技术,缩短了模型的收敛时间。Shawn 强调道,现在的文心除了在百度搜索、好看视频、百度地图、小度音响等内部产品应用外,还在持续赋能包括保险、金融、医疗、人力资源在内的各行各业。

实践应用,不断升级的飞桨高性能强化学习框架

百度资深研发工程师周波介绍了飞桨强化学习框架的三个特性。一是提供了非常友好的初学者教程;二个是在框架层面做的设计以及算法开源工作。第三个是聚焦到强化学习的并行方向,提供了非常便捷且高效的并行接口。在实际性能上,百度的强化学习框架与其他开源框架对比,性能和收敛效果都更好。

“我们已经在飞桨算法库里做了很多算法,相关的算法也经过了内部测试团队在多个测试基准做了评估。我们开源的算法在最终效果上领先于主流的算法库,有 70%多的指标比它们更好。”周波说道。

多方位聚焦发力,OpenCV 未来可期

会上,OpenCV 中国团队负责人于仕琪向大家介绍了 OpenCV 的发展历程。他提到,OpenCV 对深度学习模型的支持是非常好的,非常擅长在嵌入式系统里部署。最近几年 OpenCV 的变化,体现在它的运营变得更加国际化、社区化。

OpenCV 的未来是什么?于仕琪答道,作为一个有 21 年历史的老库,OpenCV 不仅在边缘计算方面要发力,深度学习上要提升,更要对 Licence 有所关注。OpenCV4、4.5 和 5.0,在边缘端和 ARM 的提速上不断加入了很多新功能,后面 OpenCV 在部署上也会更加有优势。中国在 OpenCV 用户数量里排第一,但中国的贡献量排名却不是第一。针对这点,于仕琪表示:“希望在我们的共同努力下,使得中国对 OpenCV 的贡献也达到世界第一。”

持续发展,飞桨图神经网络的框架与实践

图是描述复杂世界的通用语言,而图神经网络的发展从 2014 年开始。百度资深研发工程师 Yelrose 谈到,目前基于空间的图卷积算法主要是把图的建模分成两部分:一是怎么建模一个节点,二是怎么建模整张图。PGL 2.2 按照消息传递的思路设计 API 接口。在编程算法上,它支持消息传递接口,包括不同的池化接口、采样接口,方便用户做图神经网络的研发。另外,PGL 上还有一些模型仓库,让用户快速实现已有算法,真正做到推荐系统、搜索引擎、金融风控等场景的应用落地。

传统机器学习有一个数据是相互独立的假设,数据没有相互关联,但在图网络场景,样本之间有相互关联的关系。这些关系怎么充分利用上,是图网络的关键。飞桨图神经网络 PGL 的应用落地很多,例如百度 APP 和贴吧等推荐系统场景,搜索引擎内的语义索引算法,甚至是百度地图的流量预测和兴趣点检索。

开源赋能,来自飞桨的产业级模型库

飞桨高级技术经理赖宝华分享了飞桨产业级模型库产生的背景,作为一个 AI 应用开发者经常遇到这些问题——应该去哪里找模型,另外模型很多,模型应该怎么选,选哪种?很多模型只追求算法精度,不一定适用产业场景,此外模型优化和部署时可能遇到一系列问题。飞桨产业模型库的目标就是希望解决用户这三大难题。

飞桨产业级模型库中包含了业界经典、前沿以及百度自研的一系列在产业实际场景中充分验证的模型,覆盖语音、图像、自然语言处理、强化学习、图神经网络等多个方向,超过 400 种模型算法。针对产业场景,从数据准备到模型训练到最终上线部署做了全流程的打通。针对用户模型优化以及产业化落地需求,飞桨推出训推一体认证以及端到端开发套件。在设计理念和架构上,每个开发套件都提供全流程支持、模块配置化以及提供丰富的案例、示例代码和文档。此外还可以通过飞桨产业实践范例库中场景快速尝试及实现业务快速验证。随后详细介绍了飞桨产业级模型库在巡检、安防、互娱、电商等业务场景中的应用。业务场景是复杂多变的,飞桨不定时会开展产业落地赛,并提供技术培训、赋能工具以及奖金,鼓励各行各业开发者加入飞桨开源项目建设和丰富飞桨模型生态,共同推进人工智能繁荣生态。

]]>
//m.krtcgo.com/%e5%85%b1%e7%ad%91-ai-%e5%bc%80%e6%ba%90%e7%b9%81%e8%8d%a3%e7%94%9f%e6%80%81-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b/feed/ 0
启梦行动再扬帆 | 2021 优秀项目 & 优秀开发者评选结果重磅揭晓 //m.krtcgo.com/%e5%90%af%e6%a2%a6%e8%a1%8c%e5%8a%a8%e5%86%8d%e6%89%ac%e5%b8%86-2021-%e5%90%af%e6%99%ba%e7%a4%be%e5%8c%ba%e4%bc%98%e7%a7%80%e9%a1%b9%e7%9b%ae-%e4%bc%98%e7%a7%80%e5%bc%80%e5%8f%91%e8%80%85/ //m.krtcgo.com/%e5%90%af%e6%a2%a6%e8%a1%8c%e5%8a%a8%e5%86%8d%e6%89%ac%e5%b8%86-2021-%e5%90%af%e6%99%ba%e7%a4%be%e5%8c%ba%e4%bc%98%e7%a7%80%e9%a1%b9%e7%9b%ae-%e4%bc%98%e7%a7%80%e5%bc%80%e5%8f%91%e8%80%85/#respond Thu, 23 Dec 2021 02:37:00 +0000 https://new.openi.org.cn/%e5%90%af%e6%a2%a6%e8%a1%8c%e5%8a%a8%e5%86%8d%e6%89%ac%e5%b8%86-2021-%e5%90%af%e6%99%ba%e7%a4%be%e5%8c%ba%e4%bc%98%e7%a7%80%e9%a1%b9%e7%9b%ae-%e4%bc%98%e7%a7%80%e5%bc%80%e5%8f%91%e8%80%85/ 新一代人工智能的开源开放平台“ ”,现已形成开源开放技术体系与平台框架,包括基础设施的硬件、软件环境、算法框架、模型库共四个层次。OpenI 是由新一代人工智能产业技术创新战略联盟(AITISA)组织产学研用通力协作共建共享的开源软硬件开放数据超级社区,旨在促进人工智能产业健康快速发展及人工智能技术的广泛应用。

为构建健康可持续发展的开源生态体系,鼓励更多开发者积极参与 的建设,2020 年 8 月,AITISA 秘书长黄铁军教授在全球智博会上发布了《 优秀开发者激励计划-启梦行动》,宣布三年内对社区项目开发中做出实质性贡献的开发者给予总奖金不低于 1 千万的激励。

2021 年,经过专家评审委员会公平、公正、客观的评审,共评选出 10 个 2021 年 优秀项目和 170 名积极贡献者, 奖励范围包括社区支持的主要比赛/开发活动的优胜选手,自愿将活动开发成果在社区中开源贡献并自行建立组织运营的全部开发者。

12 月 19 日,在 2021 新一代人工智能院士高峰论坛暨启智开发者大会上,揭晓了 2021 年度十个优秀开源项目的获奖名单,徐宗本院士和郑纬民院士上台为“ 优秀项目”获奖代表颁奖。

2021 年 优秀开源项目有:启智飞桨、启智磐石、智立方 CubeAI、READ、惊蛰 SpikingJelly、TensorLayer、ORIMMP、依瞳人工智能平台、天元、灵机 BrainPy。每个 优秀项目获得 5 万元人民币奖金,奖金分配由各 PMC 自行制定。

根据评选规则,从 近 3 万余名贡献者中,结合启智集结号、中国软件开源创新大赛、开源黑客松等品牌活动,最终评选出了 170 名积极贡献者。按照各贡献者参与社区活动的情况,每人次的 积极贡献者将获得 3 千元人民币的奖励。

AITISA 秘书长、 技术委员会主席黄铁军教授在评选情况介绍时表示,“ 专门有优秀开发者激励管理办法,奖励资金既有新一代人工智能重大科技项目的支持,还有鹏城实验室配套资金的激励”。他介绍到,评选以项目的情况介绍、活跃情况以及开发者材料等为基础依据,通过与各个项目团队进行多次沟通,核实数据等工作后严格评审确定下来。针对评估所用的维度和参数,综合考虑了社区影响力、项目成熟度、开发活跃度、项目健康度、项目发展趋势等多种因素,希望更全面地反映开发者们在社区的贡献。

黄铁军还介绍了 2022 年激励计划方案,在原有《激励计划管理办法》基础上,增加《 优秀开发者激励评估细则》。将激励细分为日常激励(月度、季度)和年度激励,对应以相应奖励额度,明确了对开发者宣评估的维度和参数,雷达图的工程化工作正在进行中。按照这样的评估方式,保证优秀开发者每月都可以因为在社区的贡献而拿到一定奖励。

12 月 20 日,主办方特别设置了“ 优秀开发者优秀项目分享”线上直播。

黄铁军表示,未来在多方合力的共同努力下, 将建成更加健康可持续发展的生态体系,我国开源领域将持续涌现出更多优秀人才和优质项目。

]]>
//m.krtcgo.com/%e5%90%af%e6%a2%a6%e8%a1%8c%e5%8a%a8%e5%86%8d%e6%89%ac%e5%b8%86-2021-%e5%90%af%e6%99%ba%e7%a4%be%e5%8c%ba%e4%bc%98%e7%a7%80%e9%a1%b9%e7%9b%ae-%e4%bc%98%e7%a7%80%e5%bc%80%e5%8f%91%e8%80%85/feed/ 0
新一代人工智能院士高峰论坛 – 视觉预训练大模型及其在智慧城市中的应用分论坛顺利举办 //m.krtcgo.com/%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b-%e8%a7%86%e8%a7%89%e9%a2%84%e8%ae%ad%e7%bb%83%e5%a4%a7%e6%a8%a1%e5%9e%8b/ //m.krtcgo.com/%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b-%e8%a7%86%e8%a7%89%e9%a2%84%e8%ae%ad%e7%bb%83%e5%a4%a7%e6%a8%a1%e5%9e%8b/#respond Thu, 23 Dec 2021 02:33:00 +0000 https://new.openi.org.cn/%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b-%e8%a7%86%e8%a7%89%e9%a2%84%e8%ae%ad%e7%bb%83%e5%a4%a7%e6%a8%a1%e5%9e%8b/ 2021 年 12 月 20 日,新一代人工智能院士高峰论坛-视觉预训练大模型及其在智慧城市中的应用分论坛在深圳市人才研修院成功举办。

该论坛由鹏城实验室视觉智能研究所主办,邀请了企业界和学术界的技术大咖和资深专家齐聚一堂,围绕大模型与智慧城市的主题,为线上线下的参会人员带来了 10 场精彩的报告和一场精彩的圆桌讨论。论坛主席由视觉智能研究所所长王耀威担任。中科院智能信息处理重点实验室副主任蒋树强主持了论坛。

中科院智能信息处理重点实验室副主任 蒋树强主持论坛

论坛的主题为视觉预训练大模型及其在智慧城市中的应用,与会的专家学者分别就视觉预训练大模型的研究成果、未来发展方向、对 AI 技术的贡献特别是在产业中的应用进行分享和介绍。

论坛共分三个环节:主题报告、中小企业 AI 赋能平台发布仪式和圆桌讨论。

鹏城实验室网络智能部视觉智能研究所所长王耀威首先致辞。“突破网络智能系统共性关键技术,研发集感知、评价、决策于一体的全域多维度协同网络智能系统,支撑智能制造、物联网、工业云、人工智能等规模化产业应用。”王耀威研究员开宗明义地介绍了鹏城实验室视觉智能研究所的定位。他指出,“以技术成标准,以标准谋生态,以生态促发展”是视觉智能研究所的发展路径和策略。

鹏城实验室网络智能部视觉智能研究所所长 王耀威发表言论

王耀威研究员还进一步介绍了研究所正在攻关的鹏程-大圣视觉预训练大模型的研究情况。鹏程-大圣视觉大模型基于原创 Conformer 基网架构,具有基网架构模块化、模型训练增量化、特征历史可兼容、模态数量可增减、场景多样可落地的特点。目前已完成 2.65 亿参数的模型构建与训练,测试性能已达到业界领先水平,视觉研究所攻关团队正在进行基于鹏城云脑Ⅱ的 30 亿参数的视觉大模型研究开发工作,未来该模型与数据集都将完全开源开放。

业界大咖齐聚,共绘视觉大模型及应用场景建设蓝图

来自企业界的大咖们就智慧城市发展战略以及大模型在智慧城市中的应用作了精彩报告。海信集团高级副总裁陈维强博士以《智慧城市:视频 AI 创新应用》为题描绘了海信智慧城市的发展战略以及“城市云脑+海信云脑” 双云脑为核心的总体架构,并介绍了海信在数字视网膜落地应用方面的进展。

海信集团高级副总裁 陈维强博士发表言论

云天励飞未来工厂总监胡文泽博士作了题为《AI 大规模产业化探索》的报告,介绍了以数据开发为中心的 AI 应用研发新模式及云天励飞以此为基础打造的低成本 AI 应用研发系统,并对未来该研发模式大规模应用的前景进行了展望。

云天励飞未来工厂总监 胡文泽博士发表言论

华为诺亚方舟实验室计算视觉实验室主任许春景博士以《多模态大模型的应用前景》为题,重点介绍了华为诺亚方舟实验室在多模态大模型方面的研究和思考,并结合华为当前产业应用,分析和探讨了多模态大模型的未来技术方向和应用前景。

华为诺亚方舟实验室计算视觉实验室主任 许春景博士发表言论

此外,中科院自动化所模式识别国家重点实验室徐常胜研究员,中山大学计算机学院副院长郑伟诗教授、中科院自动化所模式识别国家重点实验室王金桥研究员,华南理工大学软件学院谭明奎教授,中山大学智能工程学院何兆成教授等来自科研院所与高校的资深专家们分别作了精彩报告,在视觉大模型和多模态大模型的研究经验、发展方向、迁移部署、生态构建方面的探索与尝试等方面分享了各自的观点和看法。

最后鹏城实验室视觉智能研究所总工程师张伟就视觉智能研究所在构建视觉大模型驱动下的城市智能体系统方面的探索进行了介绍。

鹏城实验室视觉智能研究所总工程师 张伟发表言论

强强联手,鹏城实验室与云天励飞共同推出中小企业 AI 赋能平台

论坛期间,鹏城实验室网络智能部副部长田永鸿、鹏城实验室视觉智能研究所所长王耀威、鹏城实验室视觉智能研究总工程师张伟、云天励飞首席科学家王孝宇和鹏城实验室智能计算部综合处处长范少军一起发布了鹏城实验室与云天励飞共同推出的中小企业 AI 赋能平台。为促进科研和产业的良性结合,解决中小企业在智能化转型升级的道路上面临诸多难题,鹏城实验室视觉智能研究所、鹏城实验室智能计算部以及云天励飞技术有限公司联合打造的中小企业 AI 赋能平台在此次论坛上正式发布。该平台集成鹏城实验室研发的智能算法仓和云天励飞的开源 AI 训练平台,并由鹏城实验室提供部分算力支持,免费对中小企业开放。

专家学者激烈讨论,共筑未来智慧城市基石

在圆桌讨论环节,王耀威、谭明奎、徐常胜、何兆成、陈维强、胡文泽、许春景、张伟等 8 位企业界和学术界的专家学者,就 AI 技术作为产业变革的主要推动力,对人、空间与城市的影响、大模型对产业发展的作用、大模型评价标准以及大模型能力与模态数量之间的联系等技术应用问题和产业发展问题进行了深入探讨。参与讨论的各位专家开动脑力,分别就上述问题发表了自己的观点和见解,激烈的讨论让线上线下的嘉宾更清晰的了解了 AI 技术、视觉大模型在智慧城市中的应用和发展。相信此次论坛活动将促进 AI 技术和视觉大模型技术与产业的有机结合,推动 AI 技术向更高、更深的方向发展。

深圳市特区发展信息技术服务有限公司总经理殷实、平安科技人工智能研究中心战略总监谭韬、云从科技战略技术总监温浩、深圳市交通警察局监控科科长李志毅、深圳市巴士集团资深专家廖汉秋、中电科智慧城市研究院视觉算法专家阮威健等企事业代表受邀出席本次论坛活动。

本次论坛专家学者们的精彩报告,从不同角度介绍了大模型和智慧城市的最新发展和未来方向,展示了当前业界的最高应用水平及最新研究成果,思想碰撞和观点分享让线上线下的参会人员享受了一场真正的 AI 饕餮盛宴。

本次论坛在鹏城实验室各级领导、各位讲者嘉宾、各合作单位,所有参会人员、志愿者的大力支持下,取得了圆满成功。

]]>
//m.krtcgo.com/%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b-%e8%a7%86%e8%a7%89%e9%a2%84%e8%ae%ad%e7%bb%83%e5%a4%a7%e6%a8%a1%e5%9e%8b/feed/ 0
开源驱动未来 | 2021 新一代人工智能院士高峰论坛暨 Open/O 启智开发者大会开源专场顺利召开 //m.krtcgo.com/%e5%bc%80%e6%ba%90%e9%a9%b1%e5%8a%a8%e6%9c%aa%e6%9d%a5-2021-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b%e6%9a%a8-open-o/ //m.krtcgo.com/%e5%bc%80%e6%ba%90%e9%a9%b1%e5%8a%a8%e6%9c%aa%e6%9d%a5-2021-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b%e6%9a%a8-open-o/#respond Wed, 22 Dec 2021 02:26:00 +0000 https://new.openi.org.cn/%e5%bc%80%e6%ba%90%e9%a9%b1%e5%8a%a8%e6%9c%aa%e6%9d%a5-2021-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b%e6%9a%a8-open-o/ 12 月 20 日,“2021 新一代人工智能院士高峰论坛暨启智开发者大会”开源专场:“开源驱动未来”在深圳市隆重召开,作为面向开源开发者的一场盛大开源技术盛宴,本次专场由 OpenI 与 Linux 基金会联合承办,携头部开源公司和华为、中兴、第四范式等顶级开源项目一起亮相,由科技部领导和顶级科技公司高层致辞、知名专家主题演讲、前沿视野报告、多个技术研讨、开源成果展示、开源圆桌讨论等环节组成。

场上,国内外顶尖院士专家及行业领军人物从各个角度来阐释、诠释开源,碰撞思想,覆盖云原生边缘计算、元宇宙、人工智能、物联网、企业数字化转型、开源治理等多个技术领域,共同见证 OpenI 与国际开源组织 Linux 基金会签署战略合作,进一步推动中国开源文化和国际开源文化的融合发展。

 

战略引领 构建开源发展蓝图

        科技部高新技术司副司长梅建平致辞时表示,开源是中国软硬件发展中的弯道超车,为了实现软硬件发展促进中国经济发展的目标,一是要提倡开源共享的理念,以开放、科学和开源的技术路径,营造开放环境,促进全球的创新要素资源流动,汇聚各方面的资源;二是要做基础设施的建设,加强开源创新联合体的资源整合,汇聚各方面的资源,加强开源数据库的建设;三是构建开源生态,通过搭建高校、院所、科技企业、社会组织沟通交流平台,推动开源社区的创新、开源基金的筹建、开源文化的形成,探索开源的实体化应用。四是要合作共赢,以多样化的方式共享开源资源。

未来,科技部将继续推动自主开源开放和 AI 生态的建设,进一步支持 AI 联盟和领军企业开放创新平台的建设,推动社区平台向生态进行转化,提升人工智能产业的竞争力。

“不开源,无 AI”,AITISA 联盟秘书长黄铁军认为人工智能技术的性质决定了要用开源的方式去发展。开源开放作为联盟的核心任务, 作为落实工作的载体,目前 有 30 多个项目,3 万多位参与者在做贡献。未来,应继续努力达到国家包括社会公众对开源的要求 。

作为 Linux 基金会旗下面向 AI 领域全球范围内影响最大、最活跃的一个开发者社区, LF AI & DATA 基金会是靠开源精神、开放的治理、充分的项目自治来维持社区的活力和发展,LF AI & DATA 主席堵俊平期望 LF AI & DATA 基金会也能够向 OpenI 学习经验,除了顶层社区的交往之外,两个大的开源社区深度合作,项目之间能够形成更多融合的趋势。

 

强强联手 启动国际战略合作

在新一代人工智能产业技术创新战略联盟(AITISA)联盟秘书长黄铁军教授和 Linux 基金会旗下 LF AI & DATA 主席堵俊平先生的共同见证下, 运营中心主任余跃博士与 Linux 基金会亚太区业务发展总监杨轩先生代表双方签署合作协议。这代表着 正式接入国际顶级开源组织,将进一步扩大其在开源产业的影响力。

 

思维碰撞 专家齐聚畅谈 AI 开源

与 LF AI & DATA 基金会战略合作签约仪式后,在主题为“开源问道”的 Panel 环节中,由 Linux 基金会亚太区业务发展总监杨轩主持,AITISA 联盟秘书长黄铁军、LF  AI & DATA 主席堵俊平、华为昇腾开源总监黄之鹏、CNCF 亚太区首席战略官陈泽辉这几位 AI 开源行业翘楚,从社区的发展、技术的趋势、产业的发展这三个领域出发畅谈 AI 开源,共同展望 Linux 基金会 的合作。

黄铁军首先提出,强化学习的历史比人工智能还长,但强化学习在过去十几年能发展起来离不开数据、算力,但更重要的是更多人以开源的方式参与其中。AI 开源在技术发展上也将是这种趋势,想支持做好 AI 方面的开源,要推动包括学生在内的更多群体参与成为开源力量。他认为基金会和社区能够搭建一种治理框架,让开发者在社区里共同为开源发展做出贡献。

堵俊平则提出了 3 个关于开源的前沿方向,一是认为开源不仅在底层的框架和基础设施发挥作用,也会通过模型、应用可以极大的降低 AI 应用领域的门槛,推动 AI 更好更快地在中国乃至全球范围内推广。二是目前在 AI 领域大量进行 AI 的伦理、法律方面的前沿探索。三是在 AI 领域包括 LF AI & DATA 在探讨新的数据集开源、开放,以合规合法的方式来推动这个数据集的开源有更好更有价值的数据和框架诞生。

人工智能的垂直度非常高,带给开源巨大的挑战是一个垂直度很高的开源社区,黄之鹏提出,冲突对于开源社区未必不利,需要设计一个制度解决这个冲突。此外,在技术层面,他认为整个人工智能可能跟量子力学等结合有巨大的发展。在 Linux 基金会和很多其他基金会里的开源项目。

陈泽辉指出国内的贡献度越来越高,国家已经把开源作为战略,用开源来展开整个产业的影响力,符合开源作为国家战略的点,期望未来有一个能够影响全世界整个产业的开源项目。

Linux 基金会旗下 LF AI & Data 首席执行官 Ibrahim Haddad 通过线上视频的方式,介绍了 LF AI & Data 的创建是为了支持开源的人工智能、机器学习、深度学习和数据,并创建一个可持续的开源人工智能生态系统,使其能够轻松地使用开源技术创建人工智能和数据产品和服务。同时,他针对 LF AI & Data 如何加速开源人工智能与数据的发展与创新,以及在 AI 创新领域遇到的挑战和机遇进行了分享。

鹏城的开源思路是和 AITISA 联盟一起推动 的建设。鹏城实验室网络智能研究部副主任李革提出这一“鹏城云脑赋能开源社区”总体框架,并指出要基于新一代人工智能基础性软硬件基础设施,对外开放,算力、工具,打造一个人工智能基础性的开源社区,以提炼共性关键技术与重大科研成果对社会开放,支持 AITISA 变成国家新一代人工智能开放开源的创新平台。

场上, 运营中心主任余跃提出了新一代人工智能中重点项目要解决的几大问题。一是先进的基础设施;二是服务平台的开发环节;三是更多资源、爱好机制以及长效的开发者生态。基于鹏城实验室具体的支持以及未来开源生态希望建立在算力网络体系下,怎么把更多基础算力设施通过普惠形式,未来能支持开源的发展。磨平异构性,不断地搭建开发从代码、数据、模型、推理、服务这一套支撑环境。

为了让更多人了解到 MindSpore 以及开源社区的运转,展现女性在科技中的力量,上午场还专门设置了以“开源创新需要女性力量,解锁‘她’的力量”主题的专场,由华为 MindSpore 运营总监胡晓曼主持,鹏城实验室开源所的助理研究员张彤、鹏城实验室副研究员李睿、Adlik TSC 主席袁丽雅共同探讨女性在开源领域里的创新展现。

其中,李睿表示,在做麒麟操作系统开源版本时需要群策群力,科技领域女性参与度还是挺高的,开源发展需要大家一起贡献力量。张彤指出,在多维度多模态医学影像分析的研究中,通过模型开源正在全力实现一个全链条的诊断模型,提升基层医院的诊疗水平。袁丽雅则在 Linux 基金会开的 Adlik 项目中融合目前主流的推理框架进行模型推理加速工具链,把不同训练框架和深度训练模型快速部署到不同的硬件环境中,以实现最高的推理性能。

 

大咖论道 研讨开源发展新未来

在以“企业智能转型对 AI 技术的挑战以及应对”为主题的演讲中,第四范式资深架构师谭中意讲到,企业智能转型是 AI 在企业中的大规模应用,它不是单纯的人脸识别,OCR,语音识别等几个场景落地,而是要利用 AI 来彻底改变企业的核心业务流。企业智能转型要达到的效果是或彻底改变商业模式,或在核心效率上有巨大提升。并提出了“从量变到质变”的第四范式的方法论,以及企业智能转型对技术“多快好省”的需求。并直接指出企业智能化转型需要多个智能场景的落地,AI 落地难、落地慢的问题,并对此提出借鉴 DevOps 经验实施 MLOps,探讨机器学习在企业进行工业化落地面对的各种挑战。

Intel 亚太区 AI 开发者布道策略经理张晶在主题为“OpenVINO:开源驱动 AI 推理加速”的演讲中开门见山地指出开源作为当今软件开发的潮流,可以通过公开透明的源代码开放方式,吸引开发者参与,推动软件演进。开源软件社区聚集着开源软件项目和开发者,在中国,英特尔 AI 开发者社区期待与广大的 AI 开发者合作、协作、共建和共享 OpenVINO 工具包基于开源软件开发模型进行开发,深入探讨赋能开发者如何将 AI 模型轻松部署到从边缘到云的英特尔®架构上。

Adlik TSC 主席袁丽雅则从 Adlik 切入,进行“Adlik,让 AI 触手可及”为主题的演讲,介绍了模型优化器、模型编译器工作流程等 Adlik 中比较重要的模块,其中提到 Adlik 实现了 conv,它分成两个,一个为低层次代码、一个为高层次代码,高层次代码是 C++语言描述的,主要是现成算子的调动以及分发、管理等一系列功能。低层次的代码主要是汇编语言所形成的算子具体实现,通过把高层次的代码和低层次的带一起打包就能够形成最终的模型文件,最后可以运行在设备上。

KubeEdge 社区核心贡献者卞盛伟在“云原生边缘计算系统架构”主题演讲中,从云视角下的边缘计算、云原生边缘计算平台 KubeEdge 架构实践、云原生边缘计算商业实践及落地、边缘云到分布式云的演进方向 4 个方面进行了深入讲解,总结出云原生边缘计算平台开放的应用、硬件生态促进行业解决方案发展,轻量、灵活的边缘管控软件,满足多样的边缘节点要求可靠的边云链接,应对弱网场景挑战,节点离线自治,故障自动恢复边云、边边数据通信,实现应用、数据全域协同边缘智能中间件,降低边缘智能化门槛的 6 大核心能力。

通过制定开放数据治理的最佳实践和标准来推动对 AI 项目和系统的高质量数据的访问,在开放数据集面向未来的行动项上,LF CHAOSS Member 李自在主题演讲“AI 开放数据集的现在与未来”中提到,通过开源社区制定开放数据格式、元数据、license、安全等标准,制定治理工作流,覆盖开放数据全生命周期,开发开放数据治理工具集,提升效率,总结优秀实践和经验,并向各行业推广。

元宇宙经历了哪些阶段?Linux 基金会亚太开源布道师苏振兵在线上“元宇宙之道,开源之道”视频演讲中提出了这个问题并做出回答,他表示,元宇宙经历了市面出现 AR、VR 的产能以及政府的数字支持的初始阶段、把现实部分应用到实际部分,例如利用人脸识别体系建立人脸识别技术的虚实结合阶段,还有以脑机接口为代表的最高阶段,通过智能化的行业平台和智能工业完全解决了人类的基本生活问题。

]]>
//m.krtcgo.com/%e5%bc%80%e6%ba%90%e9%a9%b1%e5%8a%a8%e6%9c%aa%e6%9d%a5-2021-%e6%96%b0%e4%b8%80%e4%bb%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e9%99%a2%e5%a3%ab%e9%ab%98%e5%b3%b0%e8%ae%ba%e5%9d%9b%e6%9a%a8-open-o/feed/ 0