原创新智元02-10 00:06

摘要: 戈登贝尔奖今年的终选名单已公布,共有3篇论文入围。其中有两篇来自中国,基于“神威·太湖之光”

【AI WORLD 2017世界人工智能大会倒计时 15 

“AI达摩”齐聚世界人工智能大会,AI WORLD 2017议程嘉宾重磅发布 


大会早鸟票已经售罄,现正式进入全额票阶段。还记得去年一票难求的AI WORLD 2016盛况吗?今年,即将于2017年11月8日在北京国家会议中心举办的AI World 2017世界人工智能大会 AI Cloud 论坛,寒武纪创始人兼CEO陈天石,浪潮集团副总裁胡雷均,比特大陆CEO詹克团,阿里云量子技术首席科学家施尧耘,以及体系结构华人学者代表、UCSB谢源教授,共论人工智能时代的计算。


点击文末阅读原文,马上参会!


抢票链接:http://www.huodongxing.com/event/2405852054900?td=4231978320026


大会官网:http://www.aiworld2017.com

  新智元编译  

来源:hpcwire

作者:John Russell    编译:常佩琦

 

【新智元导读】国际高性能计算应用领域最高奖——戈登贝尔奖今年的终选名单公布,一共三篇论文中有两篇来自中国、基于“神威·太湖之光”。


国际高性能计算应用领域最高奖戈登贝尔奖今年的终选名单已公布,有三篇论文入围。其中有两篇来自中国、基于“神威·太湖之光”应用的论文。第三篇是来自普渡大学的三维图像重建论文。奖项将于11月16日在丹佛宣布,得奖者将获得10000美元的奖励。


“戈登贝尔奖认可了每年在科学、工程、大数据分析方面并行计算创新应用所取得的进步。本奖项或对在重大科学和工程问题的可拓展性和时间解决方案上取得的特殊成就进行表彰奖励。


Gordon Bell提供10000美元的财务支持。Gordon Bell是高性能并行计算领域的先驱,他曾创造一些改变世界高性能计算的计算机系统,并因此获得IEEE Seymour Cray Award。”


3篇终选论文中,2篇来自中国,基于神威·太湖之光


以下是入围论文的概述:


1、重新设计神威·太湖之光千万亿次级气候建模性能的CAM-SE


描述:我们将整个社区大气模型Community Atmosphere Model (CAM)重构优化到神威·太湖之光系统中,并提供了一个千万亿次级别气候模型演示。我们在第一阶段使用OpenACC指令,以每天2.81模拟年的模拟速度,将CAM拓展到150万个核心。然后,我们以更具侵略性和挑战性的方式,对HOMME动态核心进行更精细的重新设计,以实现更好的内存控制、更有效的向量化,以及计算和通信间的重叠。


此外,我们提出了一种基于通信寄存器的并行方案,使模块中的数据依赖性最小化。通过以上方式,经过优化的运行在260核心神威处理器上内核要比在具有184个Intel Xeon E5-2680V3 CPU核心的平台上运行的HOMME内核表现的更好。在使用8519680个核心的情况下,我们实现了0.75公里全球模拟中实现了可持续的双精度性能,约2.5Pflops。


作者:Haohuan Fu, Junfeng Liao, Nan Ding, Xiaohui Duan, Lin Gan, Yishuang Liang, Xinliang Wang, Jinzhe Yang, Yan Zheng, Weiguo Liu, Lanning Wang, Guangwen Yang


https://sc17.supercomputing.org/presentation/?id=gb101&sess=sess147


2. 神威·太湖之光15-Pflops非线性地震模拟:实现10Hz场景描述


描述:本文介绍了以125Pflops计算能力和1000多核心,我们在神威太湖之光上建立高效地震仿真平台的工作。由于平台源于AWP-ODC和CG-FDM,我们工作的重点是重新设计完全不同微架构的速度、压力和可塑性处理内核,并显著增加了神威太湖之光的并行性。通过组合方案,包括(1)优化并行方案(2)最适合blocking configuration(3)同位阵列融合(4)寄存器通信与CPE ID重映射用于光圈交换(5)定制基本功能的无ROM评估,我们设法实现了12.2%的系统理论峰值。我们的项目提供了超15Pflops的持续性能,可以模拟唐山地震,空间分辨率为25m,频率为10Hz。


作者:Haohuan Fu, Conghui He, Bingwei Chen, Zekun Yin, Zhenguo Zhang, Wenqiang Zhang, Tingjian Zhang, Wei Xue, Weiguo Liu, Wanwang Yin, Guangwen Yang, Xiaofei Chen


3、大规模并行3D图像重建


描述:计算机断层扫描(CT)图像重建是广泛应用中使用的重要技术。在重建方法中,基于模型的迭代重建(MBIR)通常产生更高质量的图像。然而,不规则数据访问模式,有效并行化的难度和慢速算法收敛使得MBIR对于许多应用来说是不切实际的。本文提出了一种用于MBIR的新算法,即Non-Uniform Parallel Super-Voxel(NU-PSV),使数据访问模式正规化,实现大量并行并确保快速收敛。我们将NU-PSV算法与69632核心分布式系统上的两个前沿实施进行比较。结果表明,与最快的、最先进的实施相比,NU-PSV算法的平均加速度为1665。


作者: Xiao Wang, Amit Sabne, Putt Sakdhnagool, Sherman J. Kisner, Charles A. Bouman, Samuel P. Midkiff


中国2016年首次实现戈登贝尔奖“零的突破”


“戈登贝尔奖”设立于1987年,由美国计算机协会(ACM)于每年11月颁发,旨在奖励时代前沿的并行计算研究成果,特别是高性能计算创新应用的杰出成就,被誉为“超级计算应用领域的诺贝尔奖”。与全球高性能计算TOP 500着眼于高速计算硬件性能不同,戈登贝尔奖更注重于高性能计算应用水平。


2016年11月17日,在美国盐湖城召开的全球超级计算大会(SC2016)上,由中科院软件所杨超和清华大学计算机系薛巍、地球系统科学研究中心付昊桓等共同领导的团队所完成,运行于神威太湖之光的应用 “千万核可扩展大气动力学全隐式模拟”获得戈登贝尔奖,实现了该奖创办30年来我国在此大奖上零的突破,打破了西方国家对该奖项的垄断。



报道原文:https://www.hpcwire.com/2017/10/23/2017-gordon-bell-prize-finalists-named/


深入了解AI 技术进展和产业情况, 点击“阅读原文”,参加新智元世界人工智能大会,马上抢票!

【AI WORLD 2017世界人工智能大会倒计时 15 点击图片查看嘉宾与日程。


大会门票销售火热,抢票链接:http://www.huodongxing.com/event/2405852054900?td=4231978320026


【扫一扫或点击阅读原文抢购大会门票

AI WORLD 2017 世界人工智能大会购票二维码: