几个好玩的高性能集群站点

来源:百度文库 编辑:神马文学网 时间:2024/04/28 10:21:53
本文来自:Linux教程 -- http://doc.linuxpk.com/55311.html
如有不明白之处,欢迎参加社区讨论
昨天在整理bookmark, 除了自己日常工作需要的一些资源之外,还看到一些很好玩的东西,拿出来贻笑大方.
下面的link 都是给对hpc感兴趣或者已经在这行工作的朋友休闲看看的,另外备注属于个人观点,喜欢抬杠的朋友不要来找碴.
1. http://www.top500.org
虽然排名不说明太多的问题,但是从历年排名的变化中却可以看到很多问题,国人一直觉得老美自大,到底谁在真正加速度的发展,看看这种变化就知道
No. 1 还是 美国能源部的 IBM BlueGene/L system.  4月15日在德国要发布新的2006 list.
2. http://www.llnl.gov/
这个站点没有去看过就太可惜了, 大名鼎鼎的美国劳伦斯立莫国家实验室.
http://www.llnl.gov/linux/
嘿嘿,Lawrence Livermore 国家实验室有专门的linux 门户 :")
http://www.llnl.gov/linux/downloads.html
可以下软件哟....
http://www.llnl.gov/linux/clusters.html
看看这个巨大的实验室正在运行中的超级集群们。(好多套哟,很多都是用来研究核武器的)
http://www.llnl.gov/linux/mcr/build/lnxi_build.html
我最喜欢的集群之一,  MCR(11.2TF哟!!!!!!) . 有很多照片.
http://www.llnl.gov/linux/mcr/build/llnl_integration.html
MCR的安装照片
http://www.llnl.gov/computing/hpc/resources/OCF_resources.html#mcr
MCR的配置
http://www.llnl.gov/linux/linux_basics.html
MCR 的详细linux使用教材, 对国内有大型hpc集群的用户有参考价值
3. http://www.llnl.gov/linux/projects.html
几个牛B的linux project, 大家熟悉的大名鼎鼎的SLURM也在当中. SLURM 是GPLd
4. http://www.lanl.gov/
另外一个大名鼎鼎的实验室,美国洛斯阿拉莫斯国家实验室(也是用来研究核物理,武器系统等东东的)
一个叫Li Ning的华裔科学家在头条上,好像是研究液态重金属和材料科学的工程师.(project leader).
lanl 的站点做得就比较奥妙了吧,嘿嘿.
我在外面找到了一个关于 lanl 的 超级集群 Lightning 的专访,有兴趣的可以看看
http://www.fcw.com/fcw/articles/2003/0825/tec-lightning-08-25-03.asp.
5. http://www.clustermatic.org/
lanl 做了一个很棒的hpc集群软件 clustermatic 思路是基于linuxBIOS和beowulf 的Bproc
个人不太喜欢.
6.http://www.nas.nasa.gov/
NASA拉 :")  不知道这里有多少人喜欢经常逛NASA站点(做的超棒,去不了上面,看看也好)
有一天我在上海浦东机场,看到一个穿着一件Johnson Space T-shirt的哥们匆匆走过 ,真的羡慕非常.
上面的这个link 是NASA 高级超级计算部的站点,NASA的好东西就更加好了.(不过也许是llnl和lanl的研究太多的都涉及很机密的东西,所以透露出来的信息也不多的缘故).
http://www.nas.nasa.gov/Resources/Systems/systems.html
NASA 的宝贝有哥伦比亚集群, 图灵集群,克雷Opteron集群, 克雷X1 MPP
哥伦比亚集群媒体露面很多的. 用了20 套SGI® Altix™ 3700 超级计算机,每一个有 512 个处理器, 因为是SGI 专有的NuMAFlex技术,所以内存是在512个处理器上共享的.一共是10,240 个 Intel Itanium® 2 处理器(安腾2处理器)
图灵集群也是SGI的,不过是MIPS结构的.
克雷Opteron集群 按照名字就知道是用AMD64 Opteron做起来的拉. 个人很喜欢AMD64系统,有非常惊讶的性能表现,特别是hpc集群方面.
特别注意一下这套AMD64集群的配置
------------------------------------------------------
System:
Hostname - sn7417
Cray Opteron
64 Newisys™ 2100 nodes, each with 2 processors; 1 head node and 63 compute nodes
Processors:
128 AMD® Opteron® processors
Processor speed: 2 gigahertz
Cache per processor: 1 megabyte
Memory
Head node: 4 gigabytes (GB) high-speed RAM Compute nodes: 2 GB per node 130 GB total memory
[color=red]
Operating Environment
SuSE Linux® operating system, kernel version 2.4.21
PBS Pro 5.3 job scheduler
Compilers: PGI 64-bit and 32-bit for Fortran, C, and C++
GNU 64-bit and 32-bit for C and C++
[/color]
Interconnect
Myrinet
Storage
2300 GB
-------------------------------------------
克雷X1就是大名鼎鼎的Cray公司的产品了,也是最老的设备,不过不是cluster,是MPP系统
http://www.nas.nasa.gov/Resources/Software/swdescriptions.html
NASA 的NAS也提供软件下载拉,隔行如隔山,我了解的也只有hpc集群和空气动力学上面有关联的一点浅薄知识,所以NAS的download page上面的软件大多我都看不太懂.
只有一个了解过.就是http://www.nas.nasa.gov/Resources/Software/swdescriptions.html#NPB , 做并行的benchmark的.
hpc集群方面,好玩的东西很多. 以后慢慢分享给大家.