Status: Accepted
Owner: ----
Labels: Type-Defect Priority-Medium
New issue 226 by
suxp...@gmail.com: 第五朵彩云全新问世
http://code.google.com/p/vimim/issues/detail?id=226
就在前两天,微软亚洲研究院放出了全新的拼音输入法“英库
”(
http://pinyin.engkoo.com/),也挤进了云输入的大家庭。
既是微软的产品,自然水平应该是不错的,尽管不知道会不会跟腾讯一样不靠谱
(
http://www.cnblogs.com/birdshome/archive/2010/11/11/qq_ime.html)。
英库桌面版试用结果,长句识别率还是比较高的,跟搜狗输入法一样,第二候选会请求
云端的结果,如果跟第一候选一致则第二候选变成灰色,显示一个指向第一候选的云
朵。云输入的链接速度还行,不知是不是本地网络的原因,偶尔会出现较长的停顿。
然而英库没有提供网页版本的云输入接口,于是只好祭出大杀器——wireshark。无奈
WinPcap 不兼容 win8,但在 Microsoft Network Monitor 的帮助下,至少得到了下面
这个例子:
xi'anmeimeidepi'aosuifengpiao:
GET:
/http/v2/3e37e87a262e4b34a25bf7f74e0df0d0/?q=xi'anmeimeidepi'ao&s=*_*_*&rmf=2128897&oc=1&tc=%E8%A5%BF%E5%AE%89%E5%A6%B9%E5%A6%B9%E7%9A%84%E7%9A%AE%E8%A2%84&l=zh-CN&cnt=&cc=&ver=1.0.333.04
/http/v2/3e37e87a262e4b34a25bf7f74e0df0d0/?q=xi%27anmeimeidepi%27ao&s=*_*_*&rmf=2128897&oc=1&tc=%E8%A5%BF%E5%AE%89%E5%A6%B9%E5%A6%B9%E7%9A%84%E7%9A%AE%E8%A2%84&l=zh-CN&cnt=&cc=&ver=1.0.333.04
HTTP/1.1
Cache-Control: no-cache
Connection: Keep-Alive
Pragma: no-cache
User-Agent: Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64;
Trident/6.0)
Host:
s.p.msra.cn
在浏览器中直接使用
http://s.p.msra.cn/http/v2/....(上面 GET 的东东,不再重复)
能够返回如下内容(xml):
<R xmlns="
http://microsoft.com/ime/response/v1"><V>2</V><E
id="_TEXT_"><C><S>西安美美的皮奥</S><P>xi an mei mei de pi
ao</P><Y>87189</Y><T>西安美美的皮奧
</T></C></E><R><Q>xi&amp;apos;anmeimeidepi&amp;apos;ao</Q></R></R>
其中有些选项不太清楚是什么意思,但至少看上去这朵彩云也能返回一个整句匹配的结
果来。
相关说明:
tc=... 参数的值是输入法的第一候选词,【可能】是用于收集信息用的?不太清楚。
去掉 tc 参数返回结果似乎没有变化;
oc=[NUMBER] 参数的值,看上去是这样的:0,中文简体;1. 中文简体+中文繁
体;2. 中文简体+某个不知道什么意思的返回值;3. 中文简体+中文繁体+那个值,其
他值貌似没有效果。直接去掉参数也能返回,相当于 0;
l=zh_CN 似乎是个没有意义的参数,可以去掉;
ver=.. 是英库输入法的版本号,去掉不影响返回值;
cnt, cc 两个没有赋值的参数似乎也不影响,可以去掉;
q 当然就是拼音串了,支持音节分隔符;
rmf= 的数字不知道是什么作用,去掉貌似不影响返回结果;
s 参数【不可以】去掉,但具体的取值不知道是什么规则;
最后,v2/.../? 之间的十六进制字符串应该是 session ID 之类的东东。
于是,一个合法的英库云(微软云)请求最短应该是这个样子:
http://s.p.msra.cn/http/v2/xxXXxxXXxxXXxxXXxxXXxxXXxxXXxxXX/?q=pinyin&s=*_*_*
Thats all.
尽管从这些结果看来,只能返回一个结果,但毕竟是大名鼎鼎的微软亚洲研究院出品的
云输入法,况且很多时候云输入法主要也只在乎最前面的那个结果。
有必要添加到 VimIM 的云大家庭中不?
PS:微软的云竟然会有这么个神奇的结果:刚刚的输入在英库输入法中返回“西安妹妹
的皮袄”,而云的结果前面您已经看到了……难道这是朵乌云?
PPS 英库本地的长句识别结果还是相当帅气的。