关于IL语法问题

1 view
Skip to first unread message

Aurex

unread,
May 28, 2009, 11:36:45 PM5/28/09
to AMD-SPL
想问一下
sin_vec r20.x___,r6.x000
sin_vec r20._y__,r6.0y00
这种可以直接写成
sin_vec r20.xy__,r6.xy00
么?两者一样么?
速度有差别么?

Jiawei Ou

unread,
May 29, 2009, 2:10:28 AM5/29/09
to amd...@googlegroups.com
两者一样,速度的差别也许会有,也许会没有,主要要看编译器的优化。但是最好还是写下面哪种。

Aurex

unread,
May 29, 2009, 3:15:58 AM5/29/09
to AMD-SPL
哦,还有一个问题,那这样也写行么
mov r50._yzw,l0.0www
SKA中分成了三份

> 速度有差别么?- 隐藏被引用文字 -
>
> - 显示引用的文字 -

Jiawei Ou

unread,
May 29, 2009, 6:00:00 AM5/29/09
to amd...@googlegroups.com
也可以的

Aurex

unread,
May 29, 2009, 10:36:44 AM5/29/09
to AMD-SPL
继续问
如果在一个kernel中写
sin_vec r20.x___,r6.x000 类似的代码
另一个

sin_vec r20.xyzw,r6.xyzw
这种,那后者和前者所花的4倍时间比,是否有优化呢?

> > - 显示引用的文字 -- 隐藏被引用文字 -
>
> - 显示引用的文字 -

the729

unread,
May 30, 2009, 8:27:05 AM5/30/09
to amd...@googlegroups.com
如果我没搞错,三角函数是要用T-core算的,所以一次只能处理一个,所以写成sin_vec
r20.xyzw,r6.xyzw也是要4个指令的,和分开写应该是一样的。

2009/5/29 Aurex <aur...@gmail.com>:

--
Tianji Wu (the729)
dept. of EE, Tsinghua Uni.

Try the latest Firefox3 !
http://www.spreadfirefox.com/node&id=215918&t=209

Reply all
Reply to author
Forward
0 new messages