一个简单的word拼音文字分离工具

   日期:2020-05-04     浏览:104    评论:0    
核心提示:最近老妈在用word给文字添加拼音的时候遇到了这样的问题,对于一段话,word的拼音是直接放在文字的python

最近老妈在用word给文字添加拼音的时候遇到了这样的问题,对于一段话,word的拼音是直接放在文字的头上,因此对这段话复制的时候就会出现文字拼音交杂的情况(如下图),想要得到这段文字完整的拼音需要手动处理。(因为她不懂正则表达式,笑)

因此我用python简单的对这项任务进行了封装,以下是我的代码:

#使用了tkinter图形化界面
import re
import tkinter
import tkinter.messagebox

root= tkinter.Tk()
root.title('文字拼音分离')
root.geometry('700x650') #窗口大小


contentVar=tkinter.StringVar(root,'')
contentEntry=tkinter.Entry(root,textvariable=contentVar)
contentEntry.place(x=50,y=50,width=600,height=200)
hz = tkinter.Entry(root) #汉字输出框
hz.place(x=50,y=500,width=600,height=50)
py = tkinter.Entry(root) #拼音输出框
py.place(x=50,y=570,width=600,height=50)

btn=tkinter.Button(root,text='开始转换',bg = 'pink',command=lambda:Click()) #点击按钮开始转换
btn.place(x=310,y=400,width=80,height=40)

def Click(): #根据正则表达式的替换
    content=contentVar.get() #获取输入框内容
    hanzi = ''.join(re.findall('[\u4e00-\u9fa5]|[\(\)\《\》\——\;\,\。\“\”\<\>\!]',content))
    pinyin = ''.join(re.findall('[^\u4e00-\u9fa5]|[\(\)\《\》\——\;\,\。\“\”\<\>\!]',content)).replace('(','').replace(')',' ') #在词与词之间添加一些空格

    hz.insert(0,hanzi)     
    py.insert(0,pinyin)


root.mainloop()

这一工具简单实现了拼音文字分离的问题,并且容易上手,不足之处在于

(1)输出的文字选中需要按快捷键ctrl+A进行全选

(2)不能自动识别分离拼音中的词语,比如měidāng,可以考虑添加拼音分割的功能,设计规则实现词的分割。

 
打赏
 本文转载自:网络 
所有权利归属于原作者,如文章来源标示错误或侵犯了您的权利请联系微信13520258486
更多>最近资讯中心
更多>最新资讯中心
0相关评论

推荐图文
推荐资讯中心
点击排行
最新信息
新手指南
采购商服务
供应商服务
交易安全
关注我们
手机网站:
新浪微博:
微信关注:

13520258486

周一至周五 9:00-18:00
(其他时间联系在线客服)

24小时在线客服