重要同步:【IP跑词系统BUG同步及规避指南】IP-RMS跑词注意事项

0 views
Skip to first unread message

陈兆春

unread,
Dec 12, 2024, 5:23:04 AM12/12/24
to policy-warning, policy-warning, 王慈婵, 叶旭东, 陶金容, 刘美琳, 蒋婧, 黄子森, 梁诚辉, 周伟国, elvis.chan, 吴洪洲, ringo.ng, 李铁源, 田霞, 车晓君, 雷柳丝, 黄丽妍, 胡双, 陈开俊, 杨平桥, 刘德强, 尚心奕, 朱曼冰, 宋文辉
Hi 各位垂直IP和风控相关人员,

一、Bug同步:
    背景是上传跑词的文件,避为免“小语种/带符号的跑词”出现乱码,需要把跑词文件格式设为“utf-8”形式
    但因此发现,RMS系统跑词文件“utf-8”形式下,跑词实际从第二行开始list第一行的词会无法正常匹配产品资料)

*声明:这个bug仅rms系统跑词存在,IT人工跑词(线下脚本批量跑)不会有这个bug。

二、Bug风险告知:
    这个bug是自从有跑词系统起有的。
    但考虑投诉的warning一般会rms+IT人工一起跑;且list会把单词多个形式(单复数等)同时跑词,暂时看是还行。

*建议:因此最近仅通过rms排查过的,建议把跑词list第一个词再补跑下(因为大数据没法拿到大家各自跑词的记录,所以没法批量安排。如果没有记录的就没办法补查了)

三、短期规避Bug方法:
    1、跑词list第一行和第二行用同样的词填入
    2、上传跑词的文件格式还是建议维持“utf-8”形式

四、长期方案:
    1、和大数据团队沟通排期,尽快修复(目前预计排期在25年春节前
     

 
发件人: zhaoch...@ux168.com
发送时间: 2024-07-19 14:30
主题: 【IP跑词系统操作】IP-RMS跑词注意事项
Hi 各位垂直IP和风控相关人员,

一、RMS跑词目前已能覆盖listing和a+。遇到侵权词的时候(warning\诉讼监控)等操作跑词操作需要2个一起跑。
-RMS-listing 资料禁词检查函数名称getDisabledWordSku
-RMS-A+      资料禁词检查函数名称:getDisabledWordAplusContent

二、上传跑词的文件需要注意文件格式为“utf-8”形式
文件编码需要是 utf-8 的,否则像  “ü” 等小语种字符上传会出现乱码
比较简单的方式就是下载模板文件填充,模板文件设置的是 utf-8 编码格式


三、目前跑词文件内容需注意,所有字符需为小写,但目前仅知例外——  小语种含“ü”“ペジグ 和字符和日语的输入法中的全角和半角的英语,这些需要特别单独找IT确认跑词方式是否支持。
*由于这种例外只能遇到一个整理一个,请遇到跑词失败的时候随时联系平台组-Lia陈兆春或者大数据-黄子森。予以反馈,对这些情况再予以收集。
*考虑目前跑词bug主要出现的是小语种,小语种商标warning极少,因此判断不紧急,预计24年Q4再请大数据安排优化这个bug。
比如:
eg:侵权词:würth


Regards,
Lia Chen

Catch9215(07-18-(12-12-17-38-10).jpg
CatchEFD7(07-18-(12-12-17-38-10).jpg
Catch(07-19-14-2(12-12-17-38-10).jpg
Reply all
Reply to author
Forward
0 new messages