首先安装运行环境:
apt update apt install -y python3 python3-pip python3-venv unzip wget curl
创建虚拟环境:(如果你的能直接运行就不需要创建虚拟坏境,大部分需要虚拟坏境,所以就创建这步骤。)
python3 -m venv ~/baidu-env source ~/baidu-env/bin/activate
跟着需要依赖,安装依赖:
pip install requests beautifulsoup4
后台运行的指令:nohup python3 download_文件名.py > 日志.iog 2>&1 &
看日志:tail -f baidu_dict.log。
完成后,能看到格式 “日期+词库.txt” 。
项目地址:点击跳转
小白操作流程指导:
- 拥有一台安装了 Debian / Ubuntu 的 VPS 或服务器;
- 已将以下三个文件上传到
/root
目录:convert_to_xiaohe_txt.py
(转换核心脚本)run_auto.sh
(自动部署与运行脚本)run_xiaohe.sh
(后续快捷运行脚本)
- 已准备好一个词库文件
dictionary.txt
,格式要求如下:
词频 汉字
1000 你好
800 世界
首次使用(推荐方式):
执行自动部署 + 转换:
bash run_auto.sh
功能说明:
- 自动检查或创建 Python 虚拟环境
- 自动安装依赖(pypinyin)
- 检查脚本是否存在
- 后台执行转换任务,日志文件为
xiaohe.log
- 生成结果文件
gboard_xiaohe.txt
后续快速使用(无需再次部署):
bash run_xiaohe.sh
功能说明:
- 激活已有虚拟环境
- 执行
convert_to_xiaohe_txt.py
脚本 - 直接生成
gboard_xiaohe.txt
文件
词库文件说明:
请放置一个名为 dictionary.txt
的文件在 /root
目录下,格式为:
词频[TAB]汉字
1000 你好
900 世界
转换结果:
执行成功后将输出 gboard_xiaohe.txt
,格式如下:
xh 你好
uj 世界
该文件可导入至 Gboard、讯飞输入法 或其他支持码表导入的输入法中使用。