Chcel som si rýchlo prezrieť počet slov v mojich blogových príspevkoch, aby som si mohol hrubо odhadnúť náklady na preklad. Tu je jednoriadkový príkaz, na ktorý som prišiel:

find . -maxdepth 1 -type f -name "*.md" -exec printf "{} " \; -exec ~/.local/bin/mwc {} \; | awk '{print $2 " " $1}' | sort -rnk1

Výstup by mal vyzerať podobne ako toto:

1862 ./becoming-better-presentation-creator.md
1739 ./make-ssh-prompt-password-keepassxc.md
1619 ./are-otp-secrets-stored-plaintext.md
1602 ./how-not-create-node-executable-arm.md
1596 ./three-reasons-spent-time-nature-programmer.md
1536 ./keep-gnome-shell-settings-dotfiles-yadm.md
1407 ./how-update-gooogle-calendar-pre-push-hook.md
1390 ./story-about-nfc-thinkpad-t470.md
1211 ./building-on-your-previous-work.md
1179 ./lockdown-travel-sms-sync-phone-reset.md
1038 ./most-useful-keyboards-android.md
1033 ./how-use-flashrom-archlinux-arm.md
...

Príkaz mwc by mal vynechávať interpunkciu, poznámky pod čiarou a iné špeciality markdownu, ale zatiaľ som to podrobnejšie nepreskúmal. Napriek tomu by mal byť dostatočný na to, aby som si urobil všeobecnú predstavu o nákladoch na preklad. Zaujíma ma, či sú prekladatelia zvyknutí prekladať markdown.

Požiadavky #

Vyššie uvedený príkaz vyžaduje príkaz mwc, čo je pythonovský skript markdown-word-count. Nainštalovať ho možno cez pip:

pip3 install markdown-word-count

Okrem tohto skriptu príkaz vyžaduje len štandardné GNU nástroje.

Odkazy #

  • Posielanie výstupu ls do xargs môže priniesť veľa bezpečnostných rizík odkaz
  • Môže byť lepšie zvážiť použitie find -exec namiesto toho odkaz
  • Existujú nevyhnutné bezpečnostné problémy pri použití akcie -exec; namiesto nej by ste mali použiť možnosť -execdir odkaz
  • Jednoduché zadanie viacerých parametrov -execdir príkazu find postačí odkaz
  • Zúženie výsledkov príkazu find je voliteľné odkaz
  • Použitie awk na zámen stĺpcov je veľmi jednoduché odkaz
  • Triedenie výstupu podľa stĺpca sa určuje parametrom -k odkaz

Toto je 55. príspevok #100daystooffload.