新闻中心

了解最新公司动态及行业资讯

新闻中心

了解最新公司动态及行业资讯

新闻详情

浪潮KOS,浪潮信息服务器操作系统,软硬件协同应对数据中心三大挑战
时间:2023-05-16   

文/美雅欣

近期,随着停更趋势的确定,操作系统的迁移浪潮也将带来新一轮的市场格局变化。

众所周知,操作系统作为设备中最底层的软件,连接着硬件和上层应用软件,负责管理硬件资源的分配和应用软件的交互。 可谓是信息技术领域的灵魂。 在算力即生产力的当下,数据中心正在向智能计算中心演进,这也对数据中心操作系统提出了更高的要求。

作为全球领先的IT基础设施技术、产品、解决方案和服务提供商,浪潮信息一直坚持开源、开放技术的理念进行技术创新。 在操作系统方面,浪潮信息正式发布了服务器操作系统KOS,这是面向智慧时代数据中心的软硬件。 协同设计与优化,为稳定可靠、高效协同、广泛兼容、全天候运维提供基础软件平台支持。

1个

智能时代,服务器操作系统面临三大挑战

面对智能时代数字化创新日益多样化的需求,已形成以通用算力、智能算力、高性能算力、边缘算力为代表的多元算力体系,并呈现多元化趋势和无处不在。

在浪潮信息副总裁张东看来,在智能时代,对计算的需求持续快速增长,这对整个IT行业来说是一个巨大的发展机遇。 但同时,由于计算场景多样化、算力单元多样化、资源管理和运维复杂化、新技术带来的产业链重构等,诸多挑战已经出现被带到数据中心。 这些挑战大致可以分为三个方面:协同、运维、生态。

一是协作的挑战。 对于用户来说,各种计算场景和计算架构是多种多样的,这给软硬件协同和资源调度带来了巨大的挑战。 这将显着增加硬件管理的复杂度,要求操作系统为多种异构计算能力建立资源调度机制。

二是运维的挑战。 数据中心设备的成倍增加,使得运维难度越来越大。 数据中心规模集中,设备复杂度日益增加。 运维普遍面临监控数据不足、故障定位困难、自动化程度低等问题。 ,主要是被动响应等问题。

三是生态挑战。 在算力多元化背景下,算力供给侧发生较大变化,芯片、整机系统等软件级供应商逐渐增多。 然而,技术多元化在提供更丰富选择的同时,也容易导致生态离散化。

化繁为简,为客户提供便捷、稳定的操作系统,是浪潮信息一直努力的目标。 张东强调:“我们把整机+操作系统加上一些其他的基础软件看成一个整体,把上层的应用和下层的芯片无缝对接起来,让终端用户不用关心什么。底层处理器貌似,只要选择统一的操作系统,就可以实现上层的业务系统,支撑应用的长期稳定运行。”

为此,浪潮信息提出了“面向应用、以系统设计为中心、多异构算力融合、软硬件协同优化”的技术发展路线,操作系统是浪潮信息以系统设计为中心的技术路线。 . 关键环节。

2个

聚焦四大优势,KOS为智能计算中心注入灵魂

熟悉浪潮资讯的人都知道,KOS并不是突然诞生的,而是经过了十几年的积累。 据张东介绍,浪潮信息在操作系统领域的历史可以追溯到2008年,为关键应用主机打造的操作系统KUX。 此次发布的服务器操作系统KOS可以说是浪潮信息面向智慧时代数据中心的服务器操作系统的又一次升级。

KOS同源异构支持x86和ARM架构,支持云计算、大数据、人工智能、工业互联网时代的高可用、高可靠、高安全、易管理需求。 它用于金融、电信、能源、政府和交通。 等行业已实现规模化应用。

在稳定性和可靠性方面,KOS可提供RAS增强、应用高可用等能力,支持业务集群改造,保障业务连续性和可靠性。 其中,KOS具有关键数据冗余机制,可以对核心数据内存进行镜像,保证业务关键数据的可靠性,增强的容错能力可以降低导致系统宕机的UCE,大大降低系统宕机率。 在安全方面,KOS提供全栈可信计算链,涵盖从硬件到软件的各个层面,并通过了国内安全认证。

在高效协同方面,KOS设计了应用、算力、芯片的跨级资源调度机制。 通过对算力需求特征、应用负载特征、算力设备能耗特征的深入感知,实现业务和算力的最优性能。 最优匹配和弹性缩放。 同时,KOS实现了虚拟化、云原生、人工智能等场景的优化和增强。 例如,KOS大大提升了AI应用的开发和运行效率,支持基于DPU的高性能虚拟化网络和存储,可以提升至少10倍的性能,容器密度提升10%,网络性能提升高达到 300%。

在全天候运维方面,KOS支持700余种深度监控数据、10余种运维工具、10余年积累的专家知识库和精细化能耗管理经验,以及可全面展示从底层芯片、元器件到整个系统、软件运行状态,支持基于专家规则的自动化运维和诊断,可方便地进行故障定位、性能分析和性能优化。 同时,KOS可无缝接入浪潮云运维服务,实现运维远程托管,提供故障预测、实时报警、一键报修、资源扩容、技术支持等所有服务-场景全天候运维能力,节省运维成本。

在广泛的兼容性方面,浪潮信息通过与上下游合作伙伴的广泛合作,完成了大量的兼容性认证,涵盖各类主流芯片、板卡、数据库、中间件等。 值得一提的是,在大规模部署验证方面,KOS已经支持完成了全球最大的单集群1000节点的云-数-智融合实践,KOS的稳定性、可靠性和扩展性得到了验证。实践。

“浪潮信息发布自主研发的服务器操作系统KOS,一方面是进一步践行以系统设计为核心的技术路线,持续推进软硬件协同创新;另一方面,通过KOS,充分利用芯片、板卡和服务器的创新成果,为用户提供卓越的整体系统体验。” 张冬茹说道。

3个

装机量超20万台,携手龙力社区服务生态伙伴

经过多年的发展,我国的操作系统已经实现了高度的稳定性和安全性,但生态系统的薄弱一直是其发展的关键痛点。 从底层芯片、服务器、网络、存储,到数据库、中间件、上层应用,链上各方都需要能够协同合作、优势互补、资源共享。

作为全球三大开放计算组织(OCP、ODCC、)的唯一核心成员,浪潮信息从贡献产品SPEC、参与标准到主导项目能耗管理系统解决的痛点,始终保持着积极的态度。 今年,浪潮信息正式加入国内领先的操作系统开源社区——龙蜥社区,成为理事单位。

浪潮信息一直高度重视操作系统生态建设,将深度参与社区建设,通过协同创新、生态共建,共同推动开源操作系统产业化。 张东表示,依托浪潮信息龙蜥联合实验室,浪潮信息还将联合社区及上下游合作伙伴,共建操作系统生态标准和行业解决方案,壮大开源社区的力量,共同推动繁荣操作系统产业生态。

同时,为满足迁移换代需求,浪潮信息推出了基于KOS的可视化迁移解决方案C2K。 该方案可为用户量身定制整体迁移方案,安全可靠地切换到KOS,实现迁移评估、迁移实施、迁移验证的自动化。 .

据了解,目前,KOS已广泛应用于政务、金融、通信、能源、交通、医疗等众多行业,累计装机量超过20万台。 预计在不久的将来,KOS的用户规模将快速增长,使其广泛应用于更多的应用场景,实现商业化的良性循环。 张东强调,KOS将成为最适合浪潮服务器的操作系统,引领“软硬件协同设计”的技术创新,推动全系统软硬件生态繁荣。

一个大的AI模型背后需要数万个GPU的计算能力。

作者| 镁星球韩璐

文章指南

公司简介:

公司名称:深圳市亿万科数据设备技术有限公司

公司地址:深圳

行业:计算机

主营业务:集产品研发、生产、销售、部署、运维于一体的服务器及IT系统解决方案

从去年11月30日至今,由物联网引发的“AI大模热潮”在业界持续不断。 从目前企业和行业大咖的不断参与来看,AI大模型的热度一时半会不会低。 向上。

在此背景下,高性能服务器作为算力基础设施,自然受到了极大的关注。

冰箱1级能耗和2级能耗_腾讯能耗管理系统_大唐集团以热效率为核心能耗管理指导意见

在早前结束的第11届中国电子信息博览会(CITE 2023)上,美客网还结识了众多服务器和数据厂商。 期间,伴随着AI大模型盛行下高性能服务器和数据中心的讨论,我们也有幸采访到亿万科全国销售总监刘星先生,聆听他的口才。

易万科的“前身”是研祥集团的服务器事业部,后成为集团的独立全资子公司。 、运维一体机及IT系统解决方案,应用领域涵盖云计算、数据中心、边缘计算、人工智能、金融、电信、教育、能源等。

目前,亿万科的主打产品包括亚当的通用机架式服务器系列、亚当的液冷服务器系列、交云存储设备系列等。

AI大模型流行,AI异构服务器需求翻倍

毫不夸张的说,只要你能第一时间想到各大科技公司,基本上都走在了AI模式的道路上。

回过头来看,这把火先是在国外科技行业被点燃,吸引谷歌、微软、Meta相继入局,而后火势蔓延到中国。 包括BAT、360在内的大科技和互联网公司似乎都在讨论,并相继推出。 自主研发AI大模型产品。

在此期间,马斯克在呼吁暂停研发更强AI模型的同时,购买10000块GPU,成立AI大型模型公司,像“打耳光”一样在赛场上比拼,也为大规模人工智能模型的普及。

在应用层面,从最初的对话式交互,到后来的图片交换,再到自动驾驶领域,AI大模型的场景应用也在逐渐增多……刘星也表示,实在是太大众化了。 随着国内应用需求的大幅提升,致力于提供高性能服务器的亿万科在过去六个月也接到了很多AI异构服务器的需求。

面对客户对高算力不断增长的需求,EWG早有回应,比如本次展示的“亚当”。

据刘星介绍,这是一款搭载英特尔平台可扩展系列处理器的4卡供电AI服务器,最多可同时支持10张双宽GPU卡。 具有实时高速并行计算和浮点计算能力,适用于HPC、大数据分析、3D图形应用、深度学习、科学计算等场景。

从高性能服务器的角度来看,基于GPU提供高计算能力是一回事,但如何降低能耗也是绕不开的一道坎。

液冷技术,高性能服务器减碳“新宠”

对于算法训练和应用,高性能服务器可以提供更高的计算能力、更快的数据处理速度和更低的时延,但往往需要付出高能耗的代价,既伤“芯”,又容易导致高成本。 在严重的情况下,服务器很可能会因过热而宕机。

尤其是近年来,随着“3060双碳目标”的提出,作为能源消耗大户的数据中心成为减碳的重点,比如PUE值的不断收紧。

PUE值是评价数据中心能效的指标,是数据中心消耗的全部能源与IT负载消耗的能源的比值。 PUE值越小,数据中心的节能减排效果越好,反之,能耗比越高。

根据最新政策,国家要求到2025年,全国新建大型和超大型数据中心的PUE值要降至1.3以下,这对服务器厂商来说是一个不小的挑战。 在此背景下,厂商们也将目光投向了比传统风冷技术效率更高的液冷技术。

“整个数据中心有几千台或几万台服务器,整体能耗比较高。传统风冷服务器会导致数据中心PUE值偏高,不符合要求。现在包括老数据中心和新数据中心的整改,中心可以使用我们的液冷服务器,将PUE值降到1.25以下。” 刘星说道。

目前亿克液冷服务器业务分为两条线,一是LCP系列冷板液冷服务器,也在本次电博会上首次公开亮相; 另一款是IC系列浸没式液冷服务器。

其中,与上亿克的冷板液冷服务器和风冷服务器相比,前者可将PUE值降至1.25以下,后者则可维持在1.6左右。 虽然数值上只有0.35的差别,但是服务器功耗却有很大的差别。

终于

如前所述,研祥依托于整个研祥集团,是中国最大的集专用计算机研发、制造、销售和系统集成为一体的高新技术企业。 控制形成了一套严格的标准。

如今腾讯能耗管理系统,这一严格的标准也融入了亿万克的基因之中。 同时,“从产品研发生产到销售,再到交付给客户,售后是一整套服务,上亿克的服务器,包括外观,都是国外first独家设计的- 一流的知名设计团队,在品质上,从整体交付到整体供应链体系,易旺格拉姆都能给到客户很好的支持。” 刘星说道。

在线咨询

微信扫一扫

微信联系
返回顶部