跳转至

黑词、黑话整理

关键词

种子关键词

种子关键词用于模型分类时的初始应用,后续需要结合人工判断的方式优化种子关键词,对种子关键词进行迭代。

对于种子关键词,设定的原则需要为[5]:

  • 种子关键词的数量应该足够少
  • 不同类别之间的种子关键词相似性很低
  • 对于该类别,种子关键词非常具有代表性
  • 考虑到分词的不确定,种子关键词不一定是一个词语,也可以是短语形式
{
   "gamble": ["财神", "娱乐", "发牌", "bet", "bet365", "中奖", "开奖", "发财", "投注", "澳门", "赢球", "博彩", "体育", "葡京", "彩票", "电玩", "棋牌", "太阳城", "赌", "冰球", "金花", "赌场", "赌注", "赌城", "太阳城", "赌博", "彩金"],
   "yellow": ["约会", "亚洲", "牲交", "av", "欧美", "长腿", "肛交", "三级", "成人", "看片", "丝袜", "足浴", "偷拍", "调教", "骚", "阴毛",  "无码", "臀", "屁股", "性爱", "情欲", "巨乳", "吹箫", "美乳", "开档", "高潮", "熟女", "操", "啪啪", "偷情", "做爱", "出轨", "性", "少妇", "肥臀"],
   "drug": ["毒品", "兴奋剂", "摇头丸", "贩毒", "可卡因", "吗啡", "鸦片", "白粉", "镇静剂", "罂粟", "drug", "吸毒者", "海洛因", "大麻", "冰毒"],
   "gun": ["枪", "步枪", "狙击", "步枪", "汽怆", "气枪", "狙击枪"],
   "personal_info": ["查通话记录", "查微信记录", "聊天记录", "短信内容"],
   "fraud": ["股票", "理财", "算命", "贵金属", "贷款", "集资"],
   "get_code": ["验证码", "短信"],
   "account": ["回收", "买卖", "共享", "账号", "王者", "荣耀", "地下城", "勇士", "白号", "外国号", "站街号", "瓶子号", "成品号"],
   "hack": ["黑客"],
   "cdn": ["分发", "cdn"],
   "idc": ["idc"],
   "score": ["跑分"],
   "card": ["发卡", "发卡网", "发卡平台", "卡密"],
   "empty_package": ["空包", "物流", "代发", "快递", "单号", "刷单", "发货", "底单", "空包网"],
   "online_money": ["兼职", "在家", "打字", "赚钱", "网赚"],
   "game_private_server": ["私服", "稀有", "游戏"],
   "government": ["人民", "国情", "政府", "政务", "制度", "国家", "政策", "机关", "减税"],
   "payment_platform": ["第三方", "第四方", "四方", "聚合", "支付宝扫码H5", "微信扫码H5", "银联扫码", "快捷支付", "接口"],
   "fake_id": ["文凭", "学位证", "学历", "毕业证", "证书"],
   "card_pool": ["猫池", "池"],
   "personal_info": ["查通话记录", "查微信记录", "聊天记录", "短信内容"],
   "hijack_traffice": ["网吧", "增值", "TR"],
   "pyramid_sale": ["返佣"],
   "e_commerce":["羊毛", "吃货"],
}

黑话关键词

这是涵盖更广的归类,包括黑灰产行业里的一些敏感词、关键词、缩写等。用于粗粒度地检测文本数据中的关键词命中情况:

{
    "account": ["信封", "信封号", "取信", "洗信", "二手信"],
    "fraud": ["金主", "菜商", "卡农", "话务员", "话术本"],
    "click_fraud": ["外宣", "肥羊", "主持", "老师", "干饭", "稀饭"],
    "sex_fraud": ["色粉", "站街", "号商", "键盘手", "养火花", "机房", "散键盘", "出台", "楼凤", "做局"],
    "draug_fraud": ["马", "抓马", "垫蓝"],
    "laundering": ["水房", "声佬", "刷机佬", "接数佬", "卡佬", "车手"],
    "bank_card": ["料", "内料", "外料", "轨道料", "下料", "洗料", "洗拦截料", "挂马", "刷货", "鹅场", "猫场"],
    "gambling": ["菠菜", "出千", "埋雷", "猪蹄"]
}

英文缩写

WZ=网赚 WD=网赌 JZ=兼职 bc=博彩
WD=网贷 QP=棋牌 GM=股民 6H=六合彩
QP=棋牌 CP=彩票 GP=股票 NK=男科
JF=解封 HX=后续 XK=洗款 TK=提款
SR=骚扰 H=黄 PL=跑路 YL=引流
SD=刷单 AL=暗雷(雷子) SB=色播 SL=色流
SF=色粉 SSC=时时彩 PF=跑分 PB=跑币
SGK=社工库 SF=私服 CS=车手 DM=打码
RT=人头 TT=同台 FQ=翻墙 HS=号商
JR=金融盘 JY=交友粉 XQ=相亲粉 FL=福利
YZ=验证 YX=邮箱/博彩游戏 WH=外汇 SM=上门
PZ=配资
  • BC:博彩,有时候也称“吃菠菜”,“开奔驰”
  • SSC:时时彩,主要活跃在重庆地区
  • QP:棋牌。各种麻将、斗地主包装的博彩游戏
  • JR:金融盘,也叫杀猪盘。以贵金属、期货、指数、股票等交易为幌子诈骗用户资金
  • WH:外汇。通过网上炒外汇的形式诈骗资金

按类型区分

黑话特指黑灰产团伙进行交流时特定的一些暗号、代指等,是为了内部沟通时不易被外人发现。掌握黑灰产黑话,就像杨子荣掌握土匪帮黑话一样重要。

网络诈骗

  • 金主:实施诈骗的团伙老板。可能是一个人,也可能有几个股东,主要负责选址,招募并培训团伙成员,并提供诈骗所需的“话术本”等[4]

  • 菜商:通过非法手段获取信息,批量卖给“金主”大量公民信息

  • 卡农:非法收购银行卡,批量卖给“金主”
  • 话务员:具体实施电信诈骗的团伙成员,“金主”负责对其进行培训,团伙内的话务员通常分成不同层级,扮演不同角色
  • 话术本:诈骗套路的剧本。包括话务员要说的话、辅助的道具(虚假网站、伪造的图片等)、表述方式等

兼职刷单诈骗

兼职刷单是当前发案量最大的诈骗类型,骗子通过在网上发布兼职广告招募刷单人员,承诺每刷单成功一次就给付佣金和本金,但往往从第二单开始就以各种理由让你继续交钱购物,而不返还任何资金。[2]

  • 外宣:指专门通过加群、加好友发送兼职广告的人
  • 小白/肥羊:指看到刷单广告后过来咨询如何刷单的受害者
  • 主持:指在语音聊天群中专门维持秩序、分配任务的人
  • 老师:指专门负责外宣人员培训,并为小白解答刷单流程的人
  • 干饭:指高返利
  • 稀饭:指低返利

神药诈骗

  • 马:病人,也是骗子的作案目标。和兼职诈骗里的“肥羊/小白”意思差不多
  • 抓马:确定目标后,派出人去搭讪、推销神药
  • 垫蓝:当“马”上钩后,团伙成员会根据被害人穿着打扮、言行举止等情况现场确定诈骗金额。考虑到被害人身上通常不会携带大量现金,此时会出现一个“好心人”为被害人垫付药费,也就是“垫篮”

色情服务/诈骗

随着公安机关严厉打击涉黄犯罪,色情服务也玩起了“互联网+”,很多人通过网络招揽嫖客,甚至是以提供色情服务为名搞连环诈骗。[2]

  • 色粉 : 通过发布带有色情或色情擦边的内容吸引来的粉丝
  • 站街 :和站街女一样,不同的是,这个站街是线上通过技术手段实现的,算是线上的站街女
  • 号商:专门从事各大社交软件帐号注册,并养号出售的商家
  • 键盘手:专业“代聊”人员(大部分是男性),假扮美女与人聊天,并负责约见面
  • 养火花:键盘手站街成功后,与受害人培养感情
  • 机房:指拥有一定数量键盘手,并为其提供吃住培训一条龙服务的集团,对外一般称公司
  • 散键盘:指没有在机房工作,独立“代聊”的自由人
  • 出台:指小姐提供的色情上门、外出服务
  • 楼凤:指隐匿在自己家里(自有或租住)提供色情服务的女人
  • 做局:指通过线上、线下手段实施诈骗的团伙

洗钱

  • 水房:专门的洗钱集团
  • 声佬:水房中专门负责打电话、发信息、邮寄等工作的人,算是业务员
  • 刷机佬:负责刷POS机,把钱刷到网上结算中心
  • 接数佬:负责联系“声佬”和“刷机佬”。骗子为了躲避打击,内部分工很精细,而且一般单线联系,不能越级
  • 卡佬:负责买卖各种银行卡
  • 车手:通过到ATM机取诈骗所得赃款进而获得提成的人,因通常骑摩托车、电动车等交通工具作案,故称车手

盗号养号

  • 信封:被盗的账号信息(通常指QQ号)的集合
  • 信封号:被盗的QQ号

  • 取信:获取成对的QQ号账号密码信息

  • 洗信:将被盗账号中有价值的信息筛选、套现出来
    • 一般由专门的“洗信人”或者是“洗信工作室”来完成[3]
  • 二手信:一手信经过洗信后,称为二手信[3]
    • 二手信一般以更小的单位出售,在二手信的黑市上,一个信封一般只是一千个号
    • 二手信经过洗信人的封装,分成不同的种类,不同的种类有不同的用处:
      • 群发信:用来给被盗号的每一个好友发消息
      • 广告信:在QQ空间内植入广告
      • 忽悠信:黑市上的买家登陆被盗的QQ号给好友发一些诈骗消息,一般都是急需钱或者出事了之类的骗术
      • 老信:最后被榨净的QQ号还会卖给黑客用来编写密码词典,或者邮件群发者群发广告

盗刷银行卡

盗刷银行卡,主要是指犯罪分子通过非法手段获取银行卡信息,再通过复制银行卡或者通过网上盗刷。[2]

  • 料:主要指银行卡账号、密码,持卡人身份证号及绑定手机号四大类信息(又称CVV四大件)
  • 内料:指境内卡的四大件
  • 外料:指境外卡的四大件
  • 轨道料:指通过改装POS机得到的银行卡信息,这种信息一般非常精准
  • 下料:即非法搜集CVV四大件信息
  • 洗料:即将诈骗资金转账、套现、洗白,洗料这个行业又有很多细分工种
  • 洗拦截料:通过植入木马病毒拦截用户手机验证码完成套现,是洗料的一种方法
  • 挂马:制作、出租木马病毒
  • 刷货:指通过复制银行卡的方式来实施盗刷的过程
  • 鹅场:微信支付
  • 猫场:支付宝

网络赌博

网络赌博是指通过互联网手段(赌博网站、博彩APP、微信群等)进行的赌博活动。由于网络赌博不合法,资金不受法律保护,有很多“出老千”的行为,很多人被骗后往往不敢报警。[2]

  • 菠菜网站:菠菜是博彩的谐音,菠菜网站就是博彩网站的意思,在每年的世界杯期间,菠菜网站往往会比较猖獗
  • 出千:指在赌博中作弊
  • 埋雷:在微信红包赌博群中,庄家一般会先宣布规则,比如抢到的红包金额最小的发100元红包,或者红包金额尾数是6的发100元红包。庄家一般会通过外挂软件来控制谁抢到这个红包,这个过程叫埋雷
  • 猪蹄:猪蹄是主推的谐音,指赌博中介

References

[1] 揭秘博彩黑产的支付江湖产业链,鄂西一农夫,https://mp.weixin.qq.com/s/Tq6kHYBQr3HPdxjQddgtSw

[2] 38个诈骗界最流行的“黑话”,这些黑话你都掌握了吗?,C4rpeDime,https://cloud.tencent.com/developer/article/1348394

[3] 搞反诈需要知道的“术语(含黑话)”集合(2),明不可欺,https://mp.weixin.qq.com/s/ahm-eX8CMgtlYuReFhtG5w

[4] 互联网上的犯罪“黑话”(1),信息时代的犯罪侦查,https://mp.weixin.qq.com/s/cRcqjLorHWPlIrJlxhKb6w

[5] DataCon2020优秀解题思路分享:网络黑产方向,浙江大学matrix战队,https://datacon.qianxin.com/blog/archives/196