同步:【IP跑词系统BUG同步及规避指南】IP-RMS跑词注意事项

1 view
Skip to first unread message

蒋燕

unread,
Feb 12, 2025, 1:27:56 AM2/12/25
to policy-warning, policy-warning, 王慈婵, 叶旭东, 陶金容, 刘美琳, 蒋婧, 黄子森, 梁诚辉, 周伟国, elvis.chan, 吴洪洲, ringo.ng, 李铁源, 田霞, 车晓君, 雷柳丝, 黄丽妍, 胡双, 陈开俊, 杨平桥, 刘德强, 尚心奕, 朱曼冰, 宋文辉, 马军, 丁芳, 杜琳晗, 李桃

Hi 各位垂直IP和风控相关人员,

关于此前同步给大家的RMS系统跑词bug,目前已有长期解决方案,请各位知悉。
1、bug内容:RMS系统跑词模版文件“utf-8”形式下,第一行关键词不跑,实际从第二行开始(list第一行的词会无法正常匹配产品资料)
2、长期解决方案:从系统下载模版文件后,请注意粘贴keywords时选择"粘贴为数值",见下图:
Windows的操作:

Mac的操作:

3、另外RMS跑词界面也增设红字提醒,烦请留意。
4、附件为更新后的跑词操作指南。

——————————
蒋燕
IP专员
平台中心-平台风控组
18815551864
------------------ Original ------------------
From:  "陈兆春"<zhaoch...@ux168.com>;
Date:  Thu, Dec 12, 2024 06:22 PM
To:  "policy-warning"<policy-...@ux168.com>; "policy-warning"<policy-...@googlegroups.com>; "王慈婵"<cicha...@ux168.com>; "叶旭东"<xudo...@ux168.com>; "陶金容"<jinro...@ux168.com>; "刘美琳"<meili...@ux168.com>; "蒋婧"<jing....@ux168.com>; "黄子森"<zisen...@ux168.com>; "梁诚辉"<chenghu...@ux168.com>;
Cc:  "周伟国"<wgz...@ux168.com>; "elvis.chan"<elvis...@dragonmarts.com>; "吴洪洲"<hongz...@ux168.com>; "ringo.ng"<ring...@dragonmarts.com>; "李铁源"<tieyu...@ux168.com>; "田霞"<jas...@ux168.com>; "车晓君"<xiaoj...@ux168.com>; "雷柳丝"<lius...@ux168.cn>; "黄丽妍"<liyan...@ux168.com>; "胡双"<shua...@ux168.com>; "陈开俊"<kaiju...@ux168.com>; "杨平桥"<pingqi...@ux168.com>; "刘德强"<deqia...@ux168.com>; "尚心奕"<xinyi...@ux168.com>; "朱曼冰"<manbi...@ux168.com>; "宋文辉"<wenhu...@ux168.com>;
Subject:  重要同步:【IP跑词系统BUG同步及规避指南】IP-RMS跑词注意事项
 
Hi 各位垂直IP和风控相关人员,

一、Bug同步:
    背景是上传跑词的文件,避为免“小语种/带符号的跑词”出现乱码,需要把跑词文件格式设为“utf-8”形式
    但因此发现,RMS系统跑词文件“utf-8”形式下,跑词实际从第二行开始list第一行的词会无法正常匹配产品资料)

*声明:这个bug仅rms系统跑词存在,IT人工跑词(线下脚本批量跑)不会有这个bug。

二、Bug风险告知:
    这个bug是自从有跑词系统起有的。
    但考虑投诉的warning一般会rms+IT人工一起跑;且list会把单词多个形式(单复数等)同时跑词,暂时看是还行。

*建议:因此最近仅通过rms排查过的,建议把跑词list第一个词再补跑下(因为大数据没法拿到大家各自跑词的记录,所以没法批量安排。如果没有记录的就没办法补查了)

三、短期规避Bug方法:
    1、跑词list第一行和第二行用同样的词填入
    2、上传跑词的文件格式还是建议维持“utf-8”形式

四、长期方案:
    1、和大数据团队沟通排期,尽快修复(目前预计排期在25年春节前
     

 
发件人: zhaoch...@ux168.com
发送时间: 2024-07-19 14:30
主题: 【IP跑词系统操作】IP-RMS跑词注意事项
Hi 各位垂直IP和风控相关人员,

一、RMS跑词目前已能覆盖listing和a+。遇到侵权词的时候(warning\诉讼监控)等操作跑词操作需要2个一起跑。
-RMS-listing 资料禁词检查函数名称getDisabledWordSku
-RMS-A+      资料禁词检查函数名称:getDisabledWordAplusContent

二、上传跑词的文件需要注意文件格式为“utf-8”形式
文件编码需要是 utf-8 的,否则像  “ü” 等小语种字符上传会出现乱码
比较简单的方式就是下载模板文件填充,模板文件设置的是 utf-8 编码格式


三、目前跑词文件内容需注意,所有字符需为小写,但目前仅知例外——  小语种含“ü”“ペジグ 和字符和日语的输入法中的全角和半角的英语,这些需要特别单独找IT确认跑词方式是否支持。
*由于这种例外只能遇到一个整理一个,请遇到跑词失败的时候随时联系平台组-Lia陈兆春或者大数据-黄子森。予以反馈,对这些情况再予以收集。
*考虑目前跑词bug主要出现的是小语种,小语种商标warning极少,因此判断不紧急,预计24年Q4再请大数据安排优化这个bug。
比如:
eg:侵权词:würth


Regards,
Lia Chen

3C6DAEC3@F5D0AE26.C6E5A96700000000.jpg
0798AA59@A4A50037.C6E5A96700000000.jpg
A55CADAC@DFEFE83D.C6E5A96700000000.jpg
2FFFF30C@324C8604.833DAC6700000000.png
2FFEF50C@E095193D.833DAC6700000000.png
2CFEF30B@7650014B.423FAC6700000000.png
RMS禁词查询步骤.docx
Reply all
Reply to author
Forward
0 new messages