繁饰
繁饰器(Elaborator)是负责将面向用户的 Syntax
转换为编译器可以处理的内容的组件。大多数情况下,这意味着将 Syntax
转换为 Expr
,但也有其他用例,例如 #check
或 #eval
。因此,繁饰器是一大块代码,代码位于这里。
繁饰命令
命令(Command)是最高层级的 Syntax
,一个 Lean 文件由一系列命令组成。最常用的命令是声明,例如:
def
inductive
structure
但也有其他命令,最著名的是 #check
、#eval
等。所有命令都属于 command
语法类别,因此要声明自定义命令,必须在该类别中注册其语法。
为命令赋予意义
下一步是为语法赋予语义。对于命令,这是通过注册一个所谓的命令繁饰器完成的。
命令繁饰器的类型是 CommandElab
,或者说 Syntax → CommandElabM Unit
。它们的作用是获取表示用户想要调用的命令的 Syntax
,并在 CommandElabM
单子上产生某种副作用,毕竟返回值始终是 Unit
。CommandElabM
单子有四种主要的副作用:
- 通过
Monad
扩展MonadLog
和AddMessageContext
向用户记录消息,例如#check
。这是通过Lean.Elab.Log
中的函数完成的,其中最著名的是:logInfo
、logWarning
和logError
。 - 通过
Monad
扩展MonadEnv
与Environment
交互。这里存储了编译器的所有相关信息,所有已知的声明、它们的类型、文档字符串、值等。当前环境可以通过getEnv
获取,并在修改后通过setEnv
设置。请注意,像addDecl
这样的setEnv
包装器通常是向Environment
添加信息的正确方式。 - 执行
IO
,CommandElabM
能够运行任何IO
操作。例如,从文件中读取内容并根据其内容执行声明。 - 抛出错误,因为它可以运行任何类型的
IO
,所以它自然可以通过throwError
抛出错误。
此外,CommandElabM
还支持其他一系列 Monad
扩展:
MonadRef
和MonadQuotation
用于像宏中的Syntax
引用MonadOptions
用于与选项框架交互MonadTrace
用于调试跟踪信息- TODO:还有一些其他的扩展,虽然不确定它们是否相关,可以参见
Lean.Elab.Command
中的实例。
命令繁饰
现在我们已经了解了命令繁饰器的类型,接下来简要看看繁饰过程是如何实际工作的:
- 检查是否有任何宏可以应用于当前的
Syntax
。如果有适用的宏,并且没有抛出错误,那么生成的Syntax
将再次作为命令递归繁饰。 - 如果没有可用的宏,我们将使用
command_elab
属性,搜索为我们正在繁饰的Syntax
的SyntaxKind
注册的所有CommandElab
。 - 然后依次尝试所有这些
CommandElab
,直到其中一个没有抛出unsupportedSyntaxException
,Lean 用这种方式表示繁饰器对这个特定的Syntax
结构「负有责任」。请注意,它仍然可以抛出常规错误,以向用户表明某些地方出了问题。如果没有找到负责的繁饰器,那么命令繁饰将以unexpected syntax
错误消息终止。
如你所见,这个过程背后的总体思路与普通宏扩展非常相似。
创建我们自己的命令
现在我们已经知道什么是 CommandElab
以及它们的使用方式,我们可以开始编写自己的命令了。正如我们上面所学的,步骤如下:
- 声明语法
- 声明繁饰器
- 通过
command_elab
属性要求繁饰器负责该语法。
例子:
import Lean
open Lean Elab Command Term Meta
syntax (name := mycommand1) "#mycommand1" : command -- 声明语法
@[command_elab mycommand1]
def mycommand1Impl : CommandElab := fun stx => do -- 声明并注册繁饰器
logInfo "Hello World"
#mycommand1 -- Hello World
你可能认为这有点模板化,Lean 的开发者们也这么认为,所以他们为此添加了一个宏!
elab "#mycommand2" : command =>
logInfo "Hello World"
#mycommand2 -- Hello World
注意,由于命令繁饰支持为相同语法注册多个繁饰器,我们实际上可以在需要时重载语法。
@[command_elab mycommand1]
def myNewImpl : CommandElab := fun stx => do
logInfo "new!"
#mycommand1 -- new!
此外,也可以仅重载部分语法,在我们希望默认处理器处理的情况下抛出 unsupportedSyntaxException
,或者让 elab
命令处理它。
在以下示例中,我们并没有扩展原始的 #check
语法,而是为这个特定的语法结构添加了一个新的 SyntaxKind
。不过,从用户的角度来看,效果基本相同。
elab "#check" "mycheck" : command => do
logInfo "Got ya!"
这实际上是扩展了原始的 #check
@[command_elab Lean.Parser.Command.check] def mySpecialCheck : CommandElab := fun stx => do
if let some str := stx[1].isStrLit? then
logInfo s!"Specially elaborated string literal!: {str} : String"
else
throwUnsupportedSyntax
#check mycheck -- Got ya!
#check "Hello" -- Specially elaborated string literal!: Hello : String
#check Nat.add -- Nat.add : Nat → Nat → Nat
项目示例
作为本节的最终迷你项目,让我们构建一个实用的命令繁饰器。它将接受一个命令,并使用与 elabCommand
(命令繁饰的入口点)相同的机制,告诉我们哪些宏或繁饰器与我们给出的命令相关。
不过,我们不会费力去真正重新实现 elabCommand
。
elab "#findCElab " c:command : command => do
let macroRes ← liftMacroM <| expandMacroImpl? (←getEnv) c
match macroRes with
| some (name, _) => logInfo s!"下一步是一个宏: {name.toString}"
| none =>
let kind := c.raw.getKind
let elabs := commandElabAttribute.getEntries (←getEnv) kind
match elabs with
| [] => logInfo s!"没有繁饰器可以处理你的语法"
| _ => logInfo s!"你的语法也许可以被以下繁饰器处理: {elabs.map (fun el => el.declName.toString)}"
#findCElab def lala := 12 -- 你的语法也许可以被以下繁饰器处理: [Lean.Elab.Command.elabDeclaration]
#findCElab abbrev lolo := 12 -- 你的语法也许可以被以下繁饰器处理: [Lean.Elab.Command.elabDeclaration]
#findCElab #check foo -- 甚至你自己的语法!: 你的语法也许可以被以下繁饰器处理: [mySpecialCheck, Lean.Elab.Command.elabCheck]
#findCElab open Hi -- 你的语法也许可以被以下繁饰器处理: [Lean.Elab.Command.elabOpen]
#findCElab namespace Foo -- 你的语法也许可以被以下繁饰器处理: [Lean.Elab.Command.elabNamespace]
#findCElab #findCElab open Bar -- 甚至它自己!: 你的语法也许可以被以下繁饰器处理: [«_aux_lean_elaboration___elabRules_command#findCElab__1»]
TODO:也许我们还应该添加一个小型项目来演示非 #
风格的命令,即声明类命令,尽管目前没有想到什么。
TODO:定义一个 conjecture
声明,类似于 lemma/theorem
,不同之处在于它会自动补充 sorry
。该 sorry
可以是一个自定义的,以反映 conjecture
可能被期望为真。
项繁饰
一个项(term)是一个表示某种 Expr
的 Syntax
对象。项繁饰器是处理我们编写的大部分代码的核心。尤其是,它们负责繁饰定义的值、类型(因为这些也只是 Expr
)等。
所有的项都属于 term
语法类别(我们在宏章节中已经看到它的作用)。因此,要声明自定义的项,它们的语法需要在该类别中注册。
为项赋予意义
与命令繁饰一样,下一步是为语法赋予语义。对于项,这是通过注册一个所谓的项繁饰器完成的。
项繁饰器的类型是 TermElab
,或者说 Syntax → Option Expr → TermElabM Expr
:
- 与命令繁饰一样,
Syntax
是用户用于创建此项的内容 Option Expr
是该项的预期类型,由于这一点不总是已知,所以它只是一个Option
参数- 不同于命令繁饰,项繁饰不仅仅是因为其副作用而执行——
TermElabM Expr
的返回值确实包含感兴趣的内容,即表示Syntax
对象的Expr
。
TermElabM
在各个方面基本上都是 CommandElabM
的升级版:它支持我们之前提到的所有功能,再加上两项新功能。第一项非常简单:除了运行 IO
代码之外,它还可以运行 MetaM
代码,因此可以很好地构建 Expr
。第二项功能非常专门,适用于项繁饰循环。
项繁饰
项繁饰的基本思想与命令繁饰相同:展开宏并递归调用,或者运行通过 term_elab
属性为 Syntax
注册的项繁饰器(它们可能会进一步运行项繁饰),直到我们完成。不过,项繁饰器在执行过程中可以执行一项特殊的操作。
项繁饰器可能会抛出 Except.postpone
,表示它需要更多信息才能继续工作。为了表示这些缺失的信息,Lean 使用了所谓的合成元变量。正如你之前知道的,元变量是 Expr
中等待填补的空洞。合成元变量有所不同,它们具有特殊的方法来解决它们,这些方法注册在 SyntheticMVarKind
中。目前有四种:
typeClass
,元变量应通过类型类推导解决coe
,元变量应通过类型转换(类型类的特殊情况)解决tactic
,元变量是一个策略项,应该通过运行策略解决postponed
,这些是在Except.postpone
时创建的
一旦创建了这样的合成元变量,下一个更高层级的项繁饰器将继续执行。在某些时刻,延迟的元变量的执行将由项繁饰器恢复,希望它现在能够完成其执行。我们可以通过以下示例来观察它的运行:
#check set_option trace.Elab.postpone true in List.foldr .add 0 [1,2,3] -- [Elab.postpone] .add : ?m.5695 → ?m.5696 → ?m.5696
这里发生的事情是,函数应用的繁饰器从 List.foldr
开始展开。List.foldr
是一个通用函数,因此它为隐式类型参数创建了元变量。然后,它尝试繁饰第一个参数 .add
。
如果你不清楚 .name
的工作原理,基本想法是,Lean 通常可以推断出函数的输出类型(在这种情况下为 Nat
,即 Nat.add
)。在这种情况下,.name
特性会在 Nat
命名空间中查找一个名为 name
的函数。这在你希望使用某个类型的构造函数而不引用或打开其命名空间时特别有用,也可以像上面那样使用。
回到我们的例子,虽然此时 Lean 已经知道 .add
需要的类型是:?m1 → ?m2 → ?m2
(其中 ?x
表示元变量),但 .add
的繁饰器需要知道 ?m2
的实际值,因此项繁饰器推迟执行(通过内部创建一个合成元变量代替 .add
),然后其他两个参数的繁饰结果表明 ?m2
必须是 Nat
。一旦 .add
的繁饰器继续执行,它就可以利用这些信息完成繁饰。
我们也可以轻松引发无法正常工作的情况。例如:
#check_failure set_option trace.Elab.postpone true in List.foldr .add
-- [Elab.postpone] .add : ?m.5808 → ?m.5809 → ?m.5809
-- 无效的点号标识符表示法,预期类型不符合形式 (... → C ...) 其中 C 是一个常量 ?m.5808 → ?m.5809 → ?m.5809
在这种情况下,.add
首先推迟了执行,随后再次被调用,但没有足够的信息完成繁饰,因此失败了。
创建我们自己的项繁饰器
添加新的项繁饰器的工作方式与添加新的命令繁饰器基本相同,因此我们只会简要地看一下:
syntax (name := myterm1) "myterm 1" : term
def mytermValues := [1, 2]
@[term_elab myterm1]
def myTerm1Impl : TermElab := fun stx type? =>
mkAppM ``List.get! #[.const ``mytermValues [], mkNatLit 0] -- `MetaM` code
#eval myterm 1 -- 1
-- 用 `elab` 亦可
elab "myterm 2" : term => do
mkAppM ``List.get! #[.const ``mytermValues [], mkNatLit 1] -- `MetaM` code
#eval myterm 2 -- 2
项目示例
作为本章的最终小型项目,我们将重现 Lean 中最常用的语法糖之一,即 ⟨a, b, c⟩
表示法,用作单构造器类型的简写:
-- 使用稍微不同的表示法,以避免歧义
syntax (name := myanon) "⟨⟨" term,* "⟩⟩" : term
def getCtors (typ : Name) : MetaM (List Name) := do
let env ← getEnv
match env.find? typ with
| some (ConstantInfo.inductInfo val) =>
pure val.ctors
| _ => pure []
@[term_elab myanon]
def myanonImpl : TermElab := fun stx typ? => do
-- 如果类型未知或是元变量,尝试推迟执行。
-- 元变量被诸如函数繁饰器等用来填充隐式参数的值,
-- 当它们尚未获得足够的信息来确定这些值时。
-- 项繁饰器只能推迟执行一次,以避免陷入无限循环。
-- 因此,我们只尝试推迟执行,否则可能会导致错误。
tryPostponeIfNoneOrMVar typ?
-- 如果推迟后还没有找到类型,则报错
let some typ := typ? | throwError "expected type must be known"
if typ.isMVar then
throwError "expected type must be known"
let Expr.const base .. := typ.getAppFn | throwError s!"type is not of the expected form: {typ}"
let [ctor] ← getCtors base | throwError "type doesn't have exactly one constructor"
let args := TSyntaxArray.mk stx[1].getSepArgs
let stx ← `($(mkIdent ctor) $args*) -- syntax quotations
elabTerm stx typ -- call term elaboration recursively
#check (⟨⟨1, sorry⟩⟩ : Fin 12) -- { val := 1, isLt := (_ : 1 < 12) } : Fin 12
#check_failure ⟨⟨1, sorry⟩⟩ -- expected type must be known
#check_failure (⟨⟨0⟩⟩ : Nat) -- type doesn't have exactly one constructor
#check_failure (⟨⟨⟩⟩ : Nat → Nat) -- type is not of the expected form: Nat -> Nat
最后, 我们可以通过使用 elab
语法的额外语法糖来缩短推迟操作:
As a final note, we can shorten the postponing act by using an additional
syntax sugar of the elab
syntax instead:
-- 这个 `t` 语法将有效地执行 `myanonImpl` 的前两行
elab "⟨⟨" args:term,* "⟩⟩" : term <= t => do
sorry
练习
-
考虑以下代码。使用
elab
重写syntax
+@[term_elab hi]... : TermElab
组合。syntax (name := hi) term " ♥ " " ♥ "? " ♥ "? : term @[term_elab hi] def heartElab : TermElab := fun stx tp => match stx with | `($l:term ♥) => do let nExpr ← elabTermEnsuringType l (mkConst `Nat) return Expr.app (Expr.app (Expr.const `Nat.add []) nExpr) (mkNatLit 1) | `($l:term ♥♥) => do let nExpr ← elabTermEnsuringType l (mkConst `Nat) return Expr.app (Expr.app (Expr.const `Nat.add []) nExpr) (mkNatLit 2) | `($l:term ♥♥♥) => do let nExpr ← elabTermEnsuringType l (mkConst `Nat) return Expr.app (Expr.app (Expr.const `Nat.add []) nExpr) (mkNatLit 3) | _ => throwUnsupportedSyntax
-
以下是从真实的 mathlib 命令
alias
中提取的语法。syntax (name := our_alias) (docComment)? "our_alias " ident " ← " ident* : command
我们希望
alias hi ← hello yes
输出←
之后的标识符,也就是 "hello" 和 "yes"。请添加以下语义:
a) 使用
syntax
+@[command_elab alias] def elabOurAlias : CommandElab
。 b) 使用syntax
+elab_rules
。 c) 使用elab
。 -
以下是从真实的 mathlib 策略
nth_rewrite
中提取的语法。open Parser.Tactic syntax (name := nthRewriteSeq) "nth_rewrite " (config)? num rwRuleSeq (ppSpace location)? : tactic
我们希望
nth_rewrite 5 [←add_zero a] at h
在用户提供位置时输出"rewrite location!"
,如果用户没有提供位置,则输出"rewrite target!"
。请添加以下语义:
a) 使用
syntax
+@[tactic nthRewrite] def elabNthRewrite : Lean.Elab.Tactic.Tactic
。 b) 使用syntax
+elab_rules
。 c) 使用elab
。