Python3 在字符串中提取字母+数字组合微信账号、电话等

Song • 8199 次浏览 • 0 个回复 • 2020年12月17日

今天处理数据要提取字符串中的微信,字符串中包含中文英文Emoji,标点符号等

python 提取字符串中的电话

提取电话相对简单,多个电话也可以提取

import re

desstr = "视频同款18588888888微信同步"
phone = re.findall('(13\d{9}|14[5|7]\d{8}|15\d{9}|166{\d{8}|17[3|6|7]{\d{8}|18\d{9})', desstr)
print(phone)

python提取微信账号

这里我使用python移除了Emoji,标点符号,换行等,完整代码如下:

import re
desstr="""视频同款Emoji Emoji
Emoji:草莓树莓是姐妹
Emoji:8888888888(注来意)
Emoji日常视频
分享全国旅行照片!
Emoji私信不回"""

# 过滤除中,英文及数字以外的其他字符
words = re.compile("[^\\u4e00-\\u9fa5^a-z^A-Z^0-9]").sub("-", desstr).replace(":","-").replace(":","-").replace("\n","-").replace("--", "-").replace("--", "-")
# 打印过滤后的数据
print(words)

# 判断是否包含中文,包含则不是账号,这里可以自行提前移除中文
def is_chinese(string):
    for ch in string:
        if u'\u4e00' <= ch <= u'\u9fff':
            return True
    return False

# 拆分字符串提取账号
keywords = re.split("-", words)
print(keywords)
for keyword in keywords:
    # 微信号长度为6-20
    if len(keyword) > 6 and len(keyword) < 20:
        chinese = is_chinese(keyword)
        if not chinese:
            print(keyword)

原创文章,转载请注明 :Python3 在字符串中提取字母+数字组合微信账号、电话等 - pytorch中文网
原文出处: https://ptorch.com/news/264.html
问题交流群 :168117787
提交评论
要回复文章请先登录注册
用户评论
  • 没有评论
Pytorch是什么?关于Pytorch! Python/Java 中Appium如何获取android / Ios 粘贴板剪切板上的内容