Pandoc Lua 过滤器 - pandoc.text 模块

UTF-8 文本感知操作函数,用 Haskell 实现。

文本模块也可以以名称 text 加载,尽管这不被推荐并且已被废弃。

-- 将文档中的所有常规文本转换为大写:
function Str(s)
  s.text = pandoc.text.upper(s.text)
  return s
end

Functions

fromencoding

fromencoding (s[, encoding])

将字符串转换为 UTF-8。参数 encoding 指定了输入字符串的编码。在 Windows 上,默认编码为当前 ANSI 代码页;在其他平台上,此函数将尝试使用文件系统的编码。

已知的编码集依赖于系统,但至少包括 UTF-8UTF-16BEUTF-16LEUTF-32BEUTF-32LE。请注意,在 Windows 上默认代码页可通过 CP0 获取。

参数 描述
s 要转换的字符串( string
encoding 目标编码( string

返回:

  • UTF-8 字符串( string

自版本: 3.0

len

len (s)

返回 UTF-8 字符串的长度,即字符的数量。

参数 描述
s UTF-8 编码的字符串( string

返回:

  • 长度(integer|string)

自版本: 2.0.3

lower

lower (s)

返回 UTF-8 字符串的大写副本。

参数 描述
s 要转换为小写的 UTF-8 字符串( string

返回:

  • s的小写副本(string)

自版本: 2.0.3

reverse

reverse (s)

返回 UTF-8 字符串的反转副本。

参数 描述
s 要反转的 UTF-8 字符串( string

返回:

  • 反转的 sstring

自版本: 2.0.3

sub

sub (s, i[, j])

返回 UTF-8 字符串的子串,使用 Lua 的字符串索引规则。

参数 描述
s UTF-8 字符串( string
i 子串起始位置( integer
j 子串结束位置( integer

返回:

  • 文本子串( string

自版本: 2.0.3

toencoding

toencoding (s[, enc])

将 UTF-8 字符串转换为不同的编码。参数 encoding 默认为 Windows 上的当前 ANSI 代码页;在其他平台上,它将尝试猜测文件系统的编码。

已知的编码集依赖于系统,但至少包括UTF-8UTF-16BEUTF-16LEUTF-32BEUTF-32LE 。请注意,在 Windows 上默认代码页可通过 CP0 获取。

参数 描述
s UTF-8 字符串( string
enc 目标编码( string

返回:

  • 重新编码的字符串( string

自版本: 3.0

upper

upper (s)

返回 UTF-8 字符串的大写副本。

参数 描述
s 要转换为大写的 UTF-8 字符串( string

返回:

  • s 的大写副本( string

自版本: 2.0.3

在本文档中