Skip to content

Đào Bạch Liên

aVER(lag). aWER(kzeug)

Menu
Menu

CÔNG CỤ BIÊN TẬP aWER Editor

Posted on 2026010620260106 by Alex

Lần trước đã bảo tôi đang làm một cái công cụ biên tập, hitech chúng gọi là text processor. Quy hoạch ban đầu là all-in-one, đủ để thay thế bon 3 và morass trong quy trình xuất bản.

Đại khái là soát lỗi chính tả, typo, chỉnh sửa những từ hay dùng sai, ví dụ nếu “đen” đi với “mắt” thì phải là “đen láy” chứ không phải “đen nhánh”, “nói” thì phải “lạnh lùng” chứ không thể “lạnh lẽo”, “lòng bàn tay” thì phải “trống không” chứ không thể “trống rỗng”…

Gần đây các bản dịch tôi nhận được còn có kiểu ghép từ rất chuối củ: cúi mắt, ngẩng mắt, quay mắt, ngước mặt, nhìn một cái… Ai dạy các bạn tiếng Việt thế? Chưa hết, còn: nước mắt rưng rưng trong mắt, mở miệng nói, cầm cốc trà trong tay… Nước mắt không trong mắt thì ở đâu, nói không mở miệng thì mở chỗ nào, cốc trà có thể cầm trên đầu sao? Ô hay thừa tài nguyên quá nhỉ, có biết đốn cây rừng để in ra những từ rất vô thưởng vô phạt như vại là phí phạm lém không?

Ừ tóm lại cái công cụ biên tập vĩ đại của tôi sẽ giải phóng sức lực con người khỏi các công đoạn thiếu i ốt và sửa sang tiếng Việt tự chế rất dễ điên như thế, để tâm hồn bao la phơi phới của biên tập có thể dồn cả vào việc chỉnh sửa văn phong cho bay bướm, để sách ra với công chúng không còn lỗi chính tả và câu văn lôi thôi, để biển ăn sáng không còn đề trứng vịt nộn bán sôi và tiktok không còn hãy pho nâu tôi.

Dữ liệu thì tôi có vài ngàn cái macro và ghi chép kinh nghiệm của mười mấy năm hiệu đính bản thảo cả chuyên nghiệp và bán chuyên nghiệp, cơ bản tinh tươm đủ dùng.

Nói chung định hướng là có, tài liệu cũng có, giờ chỉ còn công nghệ lõi.

Tôi bắt đầu với python, thêm sqlite để lưu rule, bắt đầu script từ số không như một chiếc ví rỗng, xây dựng core engine, xử lý buffer text, rồi tích hợp các quy tắc.

Ngày đầu khá vui, làm việc đến trưa mới nhớ sữa chua ban sáng quên ăn đã lõng bõng ra rồi, đêm 3 giờ chưa ngủ điều mà từ khi đi tu ngắn hạn ở chùa về tôi đã không phạm phải nữa.

Ham muốn all-in-one khiến tôi nhồi nhét hết thảy vào một file khổng lồ, nghĩ rằng nguyên khối dễ quản lý hơn. Khi gõ đến dòng 1179 thì mờ mắt, nhìn từng kí tự đều thấy lạ mặt. Function lồng function, biến bay tứ tung, gỡ một lỗi nhỏ mất nửa ngày, thay đổi bé tí ở trên làm sập cả đống ở dưới, càng dài càng lảo đảo, bản thân không biết đang ở đoạn nào.

Bản thảo nhận sửa cho khách thì vẫn ngâm một bên chờ tool để được đút con bò vào lấy xúc xích ra trong chớp mắt.

Trong lúc bế tắc, tôi nhớ đến tư duy ban thân ưa thích, đó là từ vĩ mô đến vi mô, nên quyết định đập đi xây lại, lần này quy hoạch mỗi rule thành một cục, hitech chúng gọi là mô đun hóa.

Như vậy giống bàn tiệc đứng, thích món nào gắp món đó, sau này thương mại hóa khách thích cục nào bán cho cục đấy, dễ test, dễ refactor. Ban đầu cũng ổn, mỗi cái chỉ vài trăm dòng, script sạch sẽ, import lẫn nhau mượt mà. Nhưng mà từ lúc nào đấy thì từng plugin cũng bắt đầu phình to và tất cả sánh vai nhau dài ra, giờ đều lăm le chạm mốc nghìn dòng cả rồi.

Học script giống như một khóa tu nghiệp chuyên sâu cho biên tập.
Thẩm Mộng Khê từng nói, “Hiệu đính sách như quét bụi, vừa quét xong đã bám lại. Một cuốn sách dù hiệu đính 3-4 lần vẫn có thể sai sót.”
Các nhà xuất bản lớn thường làm đến bon 3 và đọc morass, các nhà nhỏ thì 1-2 bon tùy nhân lực và hệ thống chất lượng riêng, cá nhân tôi thường đọc đến bon 6-7, vẫn thấy không ưng như thường. Sau đó dừng chỉ vì đọc đã chán, nhìn chữ mà não lì không muốn tiếp nhận nữa, chứ cũng không phải vì không thể sửa tiếp.

Script thì không có chuyện số lần cảm tính như vại, chỉ có khắc nghiệt đúng-sai. In cuốn sách chính tả lăng nhăng hoặc còn nguyên nhắn nhủ của người dịch chỉ ăn chửi là cùng, nhưng script sai một kí tự, ăn gian một dấu cách, nhập nhằng tab với space thì không cần đến lượt khách hàng, python đã cho cả dự án của bạn chết ngạt từ khâu mở máy.

Bị hành quá thành ra lẩn thẩn nghĩ, biên tập viên văn học trước khi làm bản thảo đầu tiên đều nên đi một khóa python, không cần gì lớn, cứ viết được một đoạn mã tử tế (mất chừng 4-7 ngày) là đủ, cốt để rèn luyện tác phong nghiêm cẩn mà làm nghề.

À suýt lạc đề, công cụ biên tập tuy chưa viết xong nhưng hôm qua tôi đã tấp tểnh đi chào hàng và có sẵn tên cho nó rồi: aWER Editor.

© 2026 Đào Bạch Liên | Powered by Hồ Thanh Ái