首页|五四陈后院|百丁屋论坛 CNFLEX组织|md5破解|关于|Profile
  • 802.1x代码 | bbsdown代码 | php手册 | 技术资料翻译

    人人网-英特尔技术专题讨论会实录

    字号:T|T

    Intel/Qianxiang server workshop
    (这横幅很搞 叫Qianxiang不如叫RenRen,千橡的英文:Oak Pacific)
    intel技术专家
    互联网大客户技术技术服务内容
    1.idc机房相关
    2.性能优化:调试、锁等基础知识

    下面由请intel技术专家:一个阿姨先讲话,可能是领导,无自我介绍
    数据中心专家:张静、oracle专家津鹏、泰勒、优化组的徐进
    (以上纯音译)

    泰勒说话
    性能技术分享
    cpu 至强服务器优化产品

    数据中心 Optimized Datacenters

    技术专家津鹏开始说话
    国内普通机房2.2kw-3kw每机柜
    放视频:英特尔原料的一个生产厂 现在是一个数据中心 一个三层的楼 (真TM大) 视频里一个老外一层一层地介绍 每机柜30kw(国内的十倍)(听不懂老外在介绍啥,没有字幕,一帮人在看纯视频)

    视频放完

    在研究散热与机柜

    张静开始
    PPT
    数据中心未来的发展和案例分析
    从九六年到零九年的服务器成本的柱状图。power & cooling的费用在增长。
    数据中心:可靠性、可扩容性、管理
    神奇了(第一个大哥讲了半天,第二个大哥上来说PPT是他准备的。。。)

    津鹏大哥来说话了
    数据分散
    数据中心要求越高、成本越高、建的时间就越长。
    运营数据中心与灾备数据中心。

    张静大哥又回来了
    数据中心的需求与建设的花费的策略:考虑未来几年的增长
    空调的增加更加容易:逐渐投入
    超级用户:类似腾讯,模块化的数据中心建设.集装箱数据中心。快速实施。
    如何在数据中心里节能:PUE Data Center Power Usage Effectiveness
    SPUE
    TPUE = PUE+SPUE
    目前通常在3.2
    一个数据中心基本上只有三分之一是用来计算的。
    1.使用更高效率的电源。80PLUS 铜 银 金
    2.(UPS有三次电源转换:整流器 逆变器 变压器)英特尔在美国实验中取消了UPS (高压直流供电)
    3.气流与温度
    冷气流不够 上半部分服务器过热
    风量过大 风速过大 冷空气短路(只有一半的温度降了),下面的解决办法:
    1.封闭冷通道改变冷气流风向 可节能36% 温差变大后更能节能50%
    2.烟窗式机柜

    水冷

    打了下瞌睡
    现在是津鹏大哥在讲集装箱机房
    案例:一家美国上市的国内顶级的互联网公司 我猜是百度
    评估一个数据中心的好与坏

    最后又是一个视频:google的集装箱数据中心 有个google的兄弟穿个GMAIL的Tshirt很cool

    津鹏这哥们播视频用的QQ影音

    ===
    徐进大哥上台,这兄弟来过一回,讲CPU
    ASE全球对云计算/互联网数据中心的支持
    这兄弟讲课老是晃
    解决性能缺陷:概念和方法及策略
    一个表,按获益排序:1.系统级(网络磁盘内存)  2.应用级(进程堆数据结构)  3.微架构级(微架构级优化指令集) 越前面的策略获益越高 难度越低

    intel tools&libraries;
    线程级并行:Thread Building Block Open Standards OpenMP
    数据并行:Ct,C/C++ Stds

    2008年的硬件概述
    理论计算能力:102.4G指令/秒
    实际只是三分之一到二分之一,经常是四分之一或者五分之一
    2009年的硬件概述
    理论计算能力:不变
    内存带宽提高了3倍:6通道DDR3:64G/s
    硬盘系统 SSD RAID5*6: IOPS:100,000(上百倍提升) SSD写性能远差于自己的读性能1:100 但也比传统的高
    SSD随机读性能非常好 随机写一般

    BIOS设置:-SMT/EIST/NUMA/Prefetcher
    NUMA:不跨CPU访问内存 尽量不调度原来的CPU上的指令

    SSD VS HD
    一般情况下,索引文件都比较大。
    在更新索引文件的过程中,磁盘压力较大,SSD能获得较好性能。

    应用级的性能缺陷
    多核环境下,多线程程序的设计需要非常细致的设计
    -锁的粒度
    -并发
    -软件流水线的设计
    -选择合适的线程库(TBB)

    锁的粒度
    一个例子,对应用程序内部的缓存加锁造成的线程冲突,将缓存拆分成多个部分,分别加以保护,大大缓解了冲突,应用程序性能提高了21%

    典型的应用性能缺陷
    滥用STL:滥用可能会造成非常密集的内存管理操作;多线程环境下会更坏
    Glibc的malloc/free在多核环境下扩展性很差、如果在多线程环境下需要频繁分配和释放内存,可以考虑SmartHeap(收费的)\hoard\intel TBB
    内存操作:memcpy memset是耗时的,特别是在Xeon E5400平台上,每秒memcpy/memset 2GB将会对整个系统的性能造成极大的影响。
    Bitmap:随机写位图的某些图,如果造成了缓存缺失每次访问都能造成上百个CPU cycle(一个小循环里写10W到20W次,读没有关系)

    算法的选择
    JPEG缩略图生成
    通过在频率域减采样可以将原图非常快的缩小到1/(2的N次方)大小,然后再缩小到合适的大小,与直接缩小相比,性能提高了2.5倍(校内相册吕威大侠曾经说过,我记得是2.8倍)
    加密算法AES VS TEA
    AES比TEA要快3倍以上
    搜索引擎中,为了减少磁盘访问,通常倒排表被压缩后存放,SSE4.2优化后的PForDelta算法可以达到3GB/s的解压速度,是VBYTE速度的10倍,而压缩率更好。

    采取正确的IO API
    SSD的IO延迟很小,并且能同时处理几十个IO请求,单线程上的同步IO不能最大化发SSD的性能。
    要SSD发挥到最大,要使用许多个线程去同步操作SSD。
    BufferIO会造成内核的内存拷贝,如果需要每秒处理上GB的磁盘读操作,则需要考虑是否需要采用Direct-IO mmap等无需拷贝的方式。
    当文件大于系统内存的情况下,通过mmap的方式随机的访问会造成频繁缺页。

    采用高性能库函数
    intel ipp库:JPEG resize IPP是libjpeg的2部
    Westmere上新的AES指令可以提供10倍于普通AES的性能,IPP将会在第一时间提供支持。

    例子:用SSE4.2优化P_FOR_dELTA解压缩 很复杂 看不懂

    ===
    四个内部案例
    分享时间:小白 铁安 军辉

    passport优化 小白

    以前的情况
    read->mysql->loginCache->write
    Ice.Server.ThreadPool
    第三个阶段非常慢,用户登录不上。

    现在
    read
    Ice.Server.ThreadPool
    mysql->loginCache->write
    另一个pool

    延长二十分钟在线,从产品上解决问题。

    新鲜事重构 铁安
    文件存储
    索引存储4-5W写入每秒
    每秒中用户产生的feed有500条左右,这500条需要发给特定的一群人,平均分给一百人,每秒大概5W

    SearchCache  全站用户数据全缓存服务 长青
    以struct形式存储用户,一个亿的用户会占65.2G内存,不包括内存碎片等实际开销。
    去掉struct的内存结构化开销,通过序列化反序列化来压缩内存占用。
    内存优化比例大概在40-70%之间。

    锁的效率 军辉
    原子操作效率最好
    自旋锁的效率还不错
    hash函数:boobs(memcache里的) 性能和均匀程度最好的是murmur stdhash是最不好的
    其他经验:
    一个锁有严重的效率问题
    锁的数目在并发线程数的10部时最好
    pthread spinlock有效率问题 争用发生时延迟达5-10ms
    spinlock的cpu消耗比mutex低
    实现lockfree需要抛弃一些特性

    专家说明:spinlock使用时可能会cpu特高,用的时候小心。


    原创文章如转载,请注明:转载自五四陈科学院[http://www.54chen.com]
    本文链接: http://www.54chen.com/_linux_/everyone-network-intel-technology-symposium-record.html

    相关阅读:

    分类: linux   Tags: , , ,

    [五四陈科学院出品]

    网友评论:

    推广信息