8000 GitHub - Sam-CXM/fixWord: fixWord是一个基于python的Word文档修复工具,能够自动修复Word文档中的常见错误,如拼写错误、格式错误等。
[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Skip to content

fixWord是一个基于python的Word文档修复工具,能够自动修复Word文档中的常见错误,如拼写错误、格式错误等。

License

Notifications You must be signed in to change notification settings

Sam-CXM/fixWord

Repository files navigation

fixWord

项目简介

fixWord是一个基于python开发的Word文档修复工具,能够自动修复Word文档中的常见错误,如拼写错误、格式错误等。

开发环境

  • Python 3.10.7
  • python-docx 1.1.0
  • pyinstaller 5.6.1

项目特点

  • 支持多种常见错误修复,如拼写错误、格式错误等。
  • 支持单文件和批量修复多个Word文档。
  • 支持选择输出结果格式。
  • 支持添加页码。

运行环境

系统 内存 磁盘 备注
Windows10及以上版本 至少2GB 至少40MB /

使用说明

  1. 下载地址1(推荐) 下载地址2
  2. 将安装包解压到本地。
  3. 运行 fixWord_v4.0.exe 文件,点击文件选项或文件夹选项,或输入含有文档的路径
  4. 点击开始处理按钮等待处理完成即可。
  5. 处理完成后,会提示输出路径信息。

功能说明

  • 开发作者:晨小明
  • 开发日期:2024/01/04
  • 开发版本:v13.0__release
  • 发布版本:v4.0__release
  • 修改日期:2025/06/17
  • 主要功能
    • 一、支持单文件处理批量文档处理,输入文件路径或文件夹路径,自动判断。
    • 二、读取.docx文件并设置格式
    • 三、支持添加页码(可选) - 4号半角宋体阿拉伯数字,数字左右各加一条4号“一字线”,奇数页在右侧右空一字,偶数页在左侧左空一字
    • 四、识别文档中的图片并输出(可选)
    • 五、替换功能
      1. 符号替换: 将英文状态下的符号替换为中文状态下的相同符号,包含如下:
        • "(" --> ""
        • ")" --> ""
        • ")、" --> ""
        • ")、" --> ""
        • "," --> ""
        • ":" --> ""
        • ";" --> ""
        • "?" --> ""
        • "[空格]" --> ""
      2. 其他格式: 数字后有顿号替换为点,如:"1、" --> "1."
    • 六、输出文件名称含时间点,方便标记(可选)

更新日志:

  • 维护日期:2025.6.17 全新4.0版本
    • 新增】支持用户手动输入路径,输入类型多样化;
    • 新增】底部版本信息;
    • 新增】全角空格替换;
    • 新增】左侧缩进为0(不是首行缩进);
    • 新增】段前段后为0;
    • 新增】取消孤行控制;
    • 优化】界面排版优化,视觉效果更佳;
    • 优化】去掉控制台显示;
    • 优化】本地项目可直接运行;
    • 修复】两位数字后为顿号(、)时,会丢失相邻数之前的数字;
    • 修复】其他问题。
  • 维护日期:2025.5.6
    • 新增】字体常量,便于统一;
    • 新增】两个版本:学校留存;上交上报;
    • 新增】当前格式显示;
    • 优化】其他内容;
    • 修复】弹窗的路径不准确的情况。
  • 维护日期:2025.1.11
    • 新增】界面交互;
  • 维护日期:2024.8.21
    • 优化】解决了首行缩进 2 字符的问题;
    • 优化】设置基础信息常量。
  • 维护日期:2024.3.12
    • 修复】解决了批量处理时选项需要重复输入的问题。
  • 维护日期:2024.1.22
    • 修复】解决了含有图片的文档处理后图片被删除的问题。
  • 维护日期:2024.1.21
    • 新增】可选项判断;
    • 新增】处理完成后倒计时自动关闭;
    • 优化】图片输出逻辑。

示例截图

基础功能

功能示例后视图

输出图片

输出图片

范文示例

基本功能

项目截图

项目截图1 项目截图2 项目截图3

注意事项

  • 本程序仅处理 .docx 类型的文件;
  • 本程序暂不支持处理含有表格内容的文件;
  • 含有图片的文档图片导出后可能会被压缩;
  • 本程序无法处理图片格式,如果图片独立成段,本程序所用API识别到图片会被默认是空段落。为了防止图片删除,只能放弃处理空段落及图片格式;
  • 为了处理效果,处理前请将全文清除全部格式,操作步骤:全选->开始->样式->清除格式;将文档中所有图片环绕文字改为嵌入型,操作步骤:选中图片->图片格式->排列->环绕文字->嵌入型
  • 本程序已开源,可免费使用。

源文档格式说明

标题格式

  • 独立成段;
  • 在文档的首行。

一级标题

  • 独立成段;
  • 以数字形式的汉字为段首字,其后加上中文形式的
    • 例如: 一、 二、 ……

二级标题

  • 独立成段;
  • 以数字形式的汉字为段首字,其两边加上左右圆括号,中文或英文形式均可,程序会自动将英文格式的括号替换为中文形式。
    • (中文括号)
    • ( ) (英文括号)
    • 例如: (一) (二) …… 或 (一) (二) ……
  • 如果右括号后加 号,程序会自动删除。

数字/英文

  • 数字为 1 2 3 4 5 6 7 8 9 0
  • 英文为 a b c d e f g h i j k l m n o p q r s t u v w x y z A B C D E F G H I J K L M N O P Q R S T U V W X Y Z ;(26个英文大小写字母)
  • 数字后如果有 号,程序会自动替换为 .。(注:只有句首数字加的才会被识别,例如2、10、等,之后的不受影响

未来版本

全新D(DIY)版本

  • 支持用户自定义输出格式:页边距字体字号行距各级标题格式等;
  • 支持用户自定义输出路径;
  • 支持用户自定义输出文件名;

全新版本正在开发中,敬请期待...

联系方式

About

fixWord是一个基于python的Word文档修复工具,能够自动修复Word文档中的常见错误,如拼写错误、格式错误等。

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages

0