Pandoc Lua 过滤器 - pandoc.text 模块
UTF-8 文本感知操作函数,用 Haskell 实现。
文本模块也可以以名称 text
加载,尽管这不被推荐并且已被废弃。
-- 将文档中的所有常规文本转换为大写:
function Str(s)
s.text = pandoc.text.upper(s.text)
return s
end
Functions
fromencoding
fromencoding (s[, encoding])
将字符串转换为 UTF-8。参数 encoding
指定了输入字符串的编码。在 Windows 上,默认编码为当前 ANSI 代码页;在其他平台上,此函数将尝试使用文件系统的编码。
已知的编码集依赖于系统,但至少包括 UTF-8
、UTF-16BE
、UTF-16LE
、UTF-32BE
和 UTF-32LE
。请注意,在 Windows 上默认代码页可通过 CP0
获取。
参数 | 描述 |
---|---|
s |
要转换的字符串( string ) |
encoding |
目标编码( string ) |
返回:
- UTF-8 字符串(
string
)
自版本: 3.0
len
len (s)
返回 UTF-8 字符串的长度,即字符的数量。
参数 | 描述 |
---|---|
s |
UTF-8 编码的字符串( string ) |
返回:
- 长度(integer|string)
自版本: 2.0.3
lower
lower (s)
返回 UTF-8 字符串的大写副本。
参数 | 描述 |
---|---|
s |
要转换为小写的 UTF-8 字符串( string ) |
返回:
s
的小写副本(string)
自版本: 2.0.3
reverse
reverse (s)
返回 UTF-8 字符串的反转副本。
参数 | 描述 |
---|---|
s |
要反转的 UTF-8 字符串( string ) |
返回:
- 反转的
s
(string
)
自版本: 2.0.3
sub
sub (s, i[, j])
返回 UTF-8 字符串的子串,使用 Lua 的字符串索引规则。
参数 | 描述 |
---|---|
s |
UTF-8 字符串( string ) |
i |
子串起始位置( integer ) |
j |
子串结束位置( integer ) |
返回:
- 文本子串(
string
)
自版本: 2.0.3
toencoding
toencoding (s[, enc])
将 UTF-8 字符串转换为不同的编码。参数 encoding
默认为 Windows 上的当前 ANSI 代码页;在其他平台上,它将尝试猜测文件系统的编码。
已知的编码集依赖于系统,但至少包括UTF-8
、UTF-16BE
、UTF-16LE
、UTF-32BE
和 UTF-32LE
。请注意,在 Windows 上默认代码页可通过 CP0
获取。
参数 | 描述 |
---|---|
s |
UTF-8 字符串( string ) |
enc |
目标编码( string ) |
返回:
- 重新编码的字符串(
string
)
自版本: 3.0
upper
upper (s)
返回 UTF-8 字符串的大写副本。
参数 | 描述 |
---|---|
s |
要转换为大写的 UTF-8 字符串( string ) |
返回:
s
的大写副本(string
)
自版本: 2.0.3