看雪论坛
主题:186764  回帖:1214907  会员:741306  在线:774
6

【分享】Intel® Parallel Studio XE 2016 Update 4 专业版&集群版 for Windows

bxc 2016-10-21 783
最新回复 (14)
AASSMM 2016-10-21
2
谢谢分享! 用过前面几个版本, 比较了下代码优化效率还不如vs2008 ...... 更别提vs2013了
核心未拥有 2016-10-21
3
开玩笑吧,兄弟,把你例子发上来

没见过有比这东西优化牛B的

对比过代码生成过

最极致就这东西

文件变大那就不说了,这东西生成很多分支代码,在内存比较CPU,然后去走哪部分

不过这东西在汇编写法上编译有些和VS不一样

__asm push 全局变量

VS编译是

push ds:[全局变量]

这货色直接编译这样

push offset 全局变量

严格了,当初找问题,害死很多脑细胞
6
bxc 2016-10-21
4
从网上找的一个快速CRC32的源码来测试,来源是:http://create.stephan-brumme.com/crc32/。稍微对源码做了点修改。
测试的数据大小是512 MB。
这是VS2015 release默认配置:
Please wait ... bitwise : CRC=8AC52C35, 5.064s, 101.097 MB/s half-byte : CRC=8AC52C35, 2.432s, 210.563 MB/s 1 byte at once: CRC=8AC52C35, 1.030s, 497.165 MB/s 4 bytes at once: CRC=8AC52C35, 0.423s, 1209.604 MB/s 8 bytes at once: CRC=8AC52C35, 0.371s, 1378.404 MB/s 4x8 bytes at once: CRC=8AC52C35, 0.318s, 1609.898 MB/s 16 bytes at once: CRC=8AC52C35, 0.228s, 2243.487 MB/s 16 bytes at once: CRC=8AC52C35, 0.230s, 2225.956 MB/s (including prefetching) chunked : CRC=8AC52C35, 0.230s, 2228.896 MB/s


这是PS XE 2016 release的:
Please wait ... bitwise : CRC=8AC52C35, 5.045s, 101.484 MB/s half-byte : CRC=8AC52C35, 2.421s, 211.484 MB/s 1 byte at once: CRC=8AC52C35, 1.223s, 418.477 MB/s 4 bytes at once: CRC=8AC52C35, 0.464s, 1103.497 MB/s 8 bytes at once: CRC=8AC52C35, 0.245s, 2086.200 MB/s 4x8 bytes at once: CRC=8AC52C35, 0.240s, 2133.008 MB/s 16 bytes at once: CRC=8AC52C35, 0.188s, 2718.889 MB/s 16 bytes at once: CRC=8AC52C35, 0.186s, 2751.569 MB/s (including prefetching) chunked : CRC=8AC52C35, 0.185s, 2762.833 MB/s


这是clang llvm 3.9.0的:
Please wait ... bitwise : CRC=8AC52C35, 3.899s, 131.328 MB/s half-byte : CRC=8AC52C35, 2.470s, 207.290 MB/s 1 byte at once: CRC=8AC52C35, 1.080s, 474.236 MB/s 4 bytes at once: CRC=8AC52C35, 0.482s, 1063.224 MB/s 8 bytes at once: CRC=8AC52C35, 0.306s, 1672.723 MB/s 4x8 bytes at once: CRC=8AC52C35, 0.241s, 2124.406 MB/s 16 bytes at once: CRC=8AC52C35, 0.161s, 3184.907 MB/s 16 bytes at once: CRC=8AC52C35, 0.158s, 3236.586 MB/s (including prefetching) chunked : CRC=8AC52C35, 0.157s, 3270.657 MB/s


某些情况下,ICC确实不如VS 2015,但是总体上来说提升还是很大的。
核心未拥有 2016-10-21
5
都没见开 intel sse 3

intel 最牛b就是在自己CPU优化了

要说平衡的话,还是 vs好,生成的代码比较均匀

intel 就极端了
VCKFC 2016-10-21
6
非常感谢.不错
1
meilin 2016-11-3
7
http://dl.downloadly.ir/Files/Software/Intel_Parallel_Studio_XE_2016_Update4_Downloadly.ir.part1.rar
http://dl.downloadly.ir/Files/Software/Intel_Parallel_Studio_XE_2016_Update4_Downloadly.ir.part2.rar
http://dl.downloadly.ir/Files/Software/Intel_Parallel_Studio_XE_2016_Update4_Downloadly.ir.part3.rar
ntkey 2016-11-6
8
http://registrationcenter-download.intel.com/akdlm/irc_nas/tec/9955/parallel_studio_xe_2017_update1_setup.exe

直接上新的吧,看你们找得那么累
xdnice 2016-11-6
9
With Update4: http://registrationcenter-download.intel.com/akdlm/irc_nas/9770/parallel_studio_xe_2016_update4_setup.exe
6
bxc 2016-11-6
10
thanks
6
bxc 2016-11-6
11
thanks
核心未拥有 2016-11-6
12
这个 2017 sp1 解决了 不引用函数,编译进去问题了

看更新列表就说了 BUG FIX

应该是其中一个了

论坛KEY可以用
IntThree 2017-3-14
13
核心未拥有 这个 2017 sp1 解决了 不引用函数,编译进去问题了 看更新列表就说了 BUG FIX 应该是其中一个了 论坛KEY可以用
3q,看了几篇ntel® Parallel Studio XE的文章,了解了2017 update1 问题算比较好的版本了,所以决定用他了
相约去青楼 1天前
14
http://registrationcenter-download.intel.com/akdlm/irc_nas/9770/parallel_studio_xe_2016_update4_setup.exe 我下载的这个版本 安装的时候 没有让我输入lic 倒是让我输入了 序列号 请问是怎么回事 第一次用呢 请大神指教。。。
2
hewittlee 17小时前
15
thanks
返回



©2000-2017 看雪学院 | Based on Xiuno BBS | 知道创宇带宽支持 | 微信公众号:ikanxue
Time: 0.010, SQL: 6 / 京ICP备10040895号-17