代码之家  ›  专栏  ›  技术社区  ›  Andreas Grech

LaTeX文档的正确字数

  •  64
  • Andreas Grech  · 技术社区  · 14 年前

    我目前正在搜索一个应用程序或脚本,它执行 对的

    到目前为止,我只遇到只在单个文件上工作的脚本,但我想要的是一个可以安全地忽略LaTeX关键字和 …即跟随 \include \input 链接以生成正确的单词计数 文件。

    ggVGg CTRL+G 但很明显,它显示了当前文件的计数,并且不忽略LaTeX关键字。

    有人知道任何脚本(或应用程序)可以完成这项工作吗?

    8 回复  |  直到 12 年前
        1
  •  72
  •   Geoff    14 年前

    我用 texcount webpage

    它将包括 tex 包含的文件( \input \include )在文档中(请参阅 -inc ),支持宏,并具有许多其他优秀的功能。

    TOTAL COUNT
    Files: 20
    Words in text: 4188
    Words in headers: 26
    Words in float captions: 404
    Number of headers: 12
    Number of floats: 7
    Number of math inlines: 85
    Number of math displayed: 19
    

    如果你只对总数感兴趣,用 -total 争论。

        2
  •  13
  •   Andreas Grech    14 年前

    我接受了icio的评论,并通过管道输出 pdftotext wc :

    pdftotext file.pdf - | wc - w 
    
        3
  •  7
  •   aioobe    14 年前
    latex file.tex
    dvips -o - file.dvi | ps2ascii | wc -w
    

    应该给你一个相当准确的字数。

        4
  •  5
  •   fiacobelli    11 年前

    添加到@aioobe,

    如果你用pdflatex,就这么做

    pdftops file.pdf
    ps2ascii file.ps|wc -w
    

    我将此计数与一个1599word文档中的microsoftword计数进行了比较(根据Word)。 pdftotext 产生了1700多字的文本。 texcount 不包括参考文献,产生1088个单词。 ps2ascii

    我说这是一个很好的计数。不过,我不知道这4个词的区别在哪里

        5
  •  5
  •   Franck Dernoncourt    8 年前

    在Texmaker界面中,您可以通过在PDF预览中单击鼠标右键来获取字数:

    enter image description here

    enter image description here

        6
  •  2
  •   Franck Dernoncourt    6 年前

    背面有字数统计功能:

    enter image description here

    enter image description here

    背面v1:

    enter image description here

    enter image description here

        7
  •  1
  •   Konrad Rudolph    14 年前

    我使用以下VIM脚本:

    function! WC()
        let filename = expand("%")
        let cmd = "detex " . filename . " | wc -w | perl -pe 'chomp; s/ +//;'"
        let result = system(cmd)
        echo result . " words"
    endfunction
    

    但它不遵循链接。这基本上需要 TeX文件来获取所有链接的文件,不是吗?

    许多的 效率更高。

    尽管icios评论在理论上是正确的,但我发现上面的方法给出了相当准确的字数估计。对于大多数文本来说,它在许多作业中使用的5%的范围内。

        8
  •  0
  •   ocket8888    7 年前

    Ctrl+F Command+F 在Mac上),然后在启用regex的情况下,搜索

    (^|\s+|"|((h|f|te){)|\()\w+
    

    \usepackage 声明,包括引语和附加语。它还计算脚注和 \emph 无效文本和将计数 \hyperref

        9
  •  0
  •   Benjamin Chausse    5 年前

    如果vim插件的使用适合您,那么 vimtex texcount 工具很好。

    以下是他们文档的摘录:

    :VimtexCountLetters       Shows the number of letters/characters or words in
    :VimtexCountWords         the current project or in the selected region. The
                              count is created with `texcount` through a call on
                              the main project file similar to: >
    
                                texcount -nosub -sum [-letter] -merge -q -1 FILE
    <
                              Note: Default arguments may be controlled with
                                    |g:vimtex_texcount_custom_arg|.
    
                              Note: One may access the information through the
                                    function `vimtex#misc#wordcount(opts)`, where
                                    `opts` is a dictionary with the following
                                    keys (defaults indicated): >
    
                                    'range' : [1, line('$')]
                                    'count_letters' : 0/1
                                    'detailed' : 0
    <
                                    If `detailed` is 0, then it only returns the
                                    total count. This makes it possible to use for
                                    e.g. statusline functions. If the `opts` dict
                                    is not passed, then the defaults are assumed.
    
                                                 *VimtexCountLetters!*
                                                 *VimtexCountWords!*
    :VimtexCountLetters!      Similar to |VimtexCountLetters|/|VimtexCountWords|, but
    :VimtexCountWords!        show separate reports for included files.  I.e.
                              presents the result of: >
    
                                texcount -nosub -sum [-letter] -inc FILE
    <
                                                 *VimtexImapsList*
                                                 *<plug>(vimtex-imaps-list)*
    
    

    好的一点是它的可扩展性。除了计算当前文件中的字数之外,您还可以进行一个可视选择(例如两段或三段),然后仅对您的选择应用命令。