十年网站开发经验 + 多家企业客户 + 靠谱的建站团队
量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决
解释器, C#, Scheme, 函数式编程

成都创新互联公司专注于企业营销型网站建设、网站重做改版、久治网站定制设计、自适应品牌网站建设、H5页面制作、商城网站开发、集团公司官网建设、外贸营销网站建设、高端网站制作、响应式网页设计等建站业务,价格优惠性价比高,为久治等各大城市提供网站开发制作服务。
本文介绍了如何使用C#实现一个简化但全功能的Scheme方言——iScheme及其解释器,通过从零开始逐步构建,展示了编程语言/解释器的工作原理。
Lucida a.k.a Luc
如果你是通过移动设备阅读本教程,或者认为本文的代码字体太小的,请使用该链接以获得更好的可读性(博客园的markdown解析器实在诡异,这里就不多吐槽了)。
如果你对下面的内容感兴趣:
那么请继续阅读。
如果你对以下内容感兴趣:
本文则过于初级,你可以跳过本文,但欢迎指出本文的错误 ????
代码示例
- public static int Add(int a, int b) {
 - return a + b;
 - }
 - >> Add(3, 4)
 - >> 7
 - >> Add(5, 5)
 - >> 10
 
这段代码定义了Add函数,接下来的>>符号表示对Add(3, 4)进行求值,再下一行的>> 7表示上一行的求值结果,不同的求值用换行分开。可以把这里的>>理解成控制台提示符(即Terminal中的PS)。
解释器(Interpreter)是一种程序,能够读入程序并直接输出结果,如上图。相对于编译器(Compiler),解释器并不会生成目标机器代码,而是直接运行源程序,简单来说:
| 解释器是运行程序的程序。 | 
计算器就是一个典型的解释器,我们把数学公式(源程序)给它,它通过运行它内部的"解释器"给我们答案。
iScheme是什么?
OK,那么Scheme是什么?
以计算阶乘为例:
C#版阶乘
- public static int Factorial(int n) {
 - if (n == 1) {
 - return 1;
 - } else {
 - return n * Factorial(n - 1);
 - }
 - }
 
iScheme版阶乘
- (def factorial (lambda (n) (
 - if (= n 1)
 - 1
 - (* n (factorial (- n 1))))))
 
由于iScheme只是一个用于演示的语言,所以目前只提供对整数的支持。iScheme使用C#的Int64类型作为其内部的数值表示方法。
iScheme使用def关键字定义变量
- >> (def a 3)
 - >> 3
 - >> a
 - >> 3
 
与常见的编程语言(C#, Java, C++, C)不同,Scheme使用波兰表达式,即前缀表示法。例如:
C#中的算术|逻辑|比较操作
- // Arithmetic ops
 - a + b * c
 - a / (b + c + d)
 - // Logical ops
 - (cond1 && cond2) || cond3
 - // Comparing ops
 - a == b
 - 1 < a && a < 3
 
对应的iScheme代码
- ; Arithmetic ops
 - (+ a (* b c))
 - (/ a (+ b c d))
 - ; Logical ops
 - (or (and cond1 cond2) cond3)
 - ; Comparing ops
 - (= a b)
 - (< 1 a 3)
 
需要注意的几点:
and, or和not代替了常见的&&, ||和!——这在一定程度上增强了程序的可读性。iScheme使用begin关键字标识顺序语句,并以最后一条语句的值作为返回结果。以求两个数的平均值为例:
C#的顺序语句
- int a = 3;
 - int b = 5;
 - int c = (a + b) / 2;
 
iScheme的顺序语句
- (def c (begin
 - (def a 3)
 - (def b 5)
 - (/ (+ a b) 2)))
 
iScheme中的控制流操作只包含if。
if语句示例
- >> (define a (if (> 3 2) 1 2))
 - >> 1
 - >> a
 - >> 1
 
iScheme使用list关键字定义列表,并提供first关键字获取列表的第一个元素;提供rest关键字获取列表除第一个元素外的元素。
iScheme的列表示例
- >> (define alist (list 1 2 3 4))
 - >> (list 1 2 3 4)
 - >> (first alist)
 - >> 1
 - >> (rest alist)
 - >> (2 3 4)
 
iScheme使用func关键字定义函数:
iScheme的函数定义
- (def square (func (x) (* x x)))
 - (def sum_square (func (a b) (+ (square a) (square b))))
 
对应的C#代码
- public static int Square (int x) {
 - return x * x;
 - }
 - public static int SumSquare(int a, int b) {
 - return Square(a) + Square(b);
 - }
 
由于iScheme中没有for或while这种命令式语言(Imperative Programming Language)的循环结构,递归成了重复操作的唯一选择。
以计算最大公约数为例:
iScheme计算最大公约数
- (def gcd (func (a b)
 - (if (= b 0)
 - a
 - (func (b (% a b))))))
 
对应的C#代码
- public static int GCD (int a, int b) {
 - if (b == 0) {
 - return a;
 - } else {
 - return GCD(b, a % b);
 - }
 - }
 
#p#
和Scheme一样,函数在iScheme中是头等对象,这意味着:
iScheme的高阶函数示例
- ; Defines a multiply function.
 - (def mul (func (a b) (* a b)))
 - ; Defines a list map function.
 - (def map (func (f alist)
 - (if (empty? alist)
 - (list )
 - (append (list (f (first alist))) (map f (rest alist)))
 - )))
 - ; Doubles a list using map and mul.
 - >> (map (mul 2) (list 1 2 3))
 - >> (list 2 4 6)
 
对iScheme的介绍就到这里——事实上这就是iScheme的所有元素,会不会太简单了? -_-
接下来进入正题——从头开始构造iScheme的解释程序。
iScheme解释器主要分为两部分,解析(Parse)和求值(Evaluation):
词法分析负责把源程序解析成一个个词法单元(Lex),以便之后的处理。
iScheme的词法分析极其简单——由于iScheme的词法元素只包含括号,空白,数字和变量名,因此C#自带的String#Split就足够。
iScheme的词法分析及测试
- public static String[] Tokenize(String text) {
 - String[] tokens = text.Replace("(", " ( ").Replace(")", " ) ").Split(" \t\r\n".ToArray(), StringSplitOptions.RemoveEmptyEntries);
 - return tokens;
 - }
 - // Extends String.Join for a smooth API.
 - public static String Join(this String separator, IEnumerable
 - return String.Join(separator, values);
 - }
 - // Displays the lexes in a readable form.
 - public static String PrettyPrint(String[] lexes) {
 - return "[" + ", ".Join(lexes.Select(s => "'" + s + "'") + "]";
 - }
 - // Some tests
 - >> PrettyPrint(Tokenize("a"))
 - >> ['a']
 - >> PrettyPrint(Tokenize("(def a 3)"))
 - >> ['(', 'def', 'a', '3', ')']
 - >> PrettyPrint(Tokenize("(begin (def a 3) (* a a))"))
 - >> ['begin', '(', 'def', 'a', '3', ')', '(', '*', 'a', 'a', ')', ')']
 
String.Join这个静态方法,所以这里使用C#的扩展方法(Extension Methods)对String类型做了一个扩展。得到了词素之后,接下来就是进行语法分析。不过由于Lisp类语言的程序即是语法树,所以语法分析可以直接跳过。
以下面的程序为例:
程序即语法树
- ;
 - (def x (if (> a 1) a 1))
 - ; 换一个角度看的话:
 - (
 - def
 - x
 - (
 - if
 - (
 - >
 - a
 - 1
 - )
 - a
 - 1
 - )
 - )
 
更加直观的图片:
这使得抽象语法树(Abstract Syntax Tree)的构建变得极其简单(无需考虑操作符优先级等问题),我们使用SExpression类型定义iScheme的语法树(事实上S Expression也是Lisp表达式的名字)。
抽象语法树的定义
- public class SExpression {
 - public String Value { get; private set; }
 - public List
 Children { get; private set; } - public SExpression Parent { get; private set; }
 - public SExpression(String value, SExpression parent) {
 - this.Value = value;
 - this.Children = new List
 (); - this.Parent = parent;
 - }
 - public override String ToString() {
 - if (this.Value == "(") {
 - return "(" + " ".Join(Children) + ")";
 - } else {
 - return this.Value;
 - }
 - }
 - }
 
然后用下面的步骤构建语法树:
current),然后重设当前节点。抽象语法树的构建过程
- public static SExpression ParseAsIScheme(this String code) {
 - SExpression program = new SExpression(value: "", parent: null);
 - SExpression current = program;
 - foreach (var lex in Tokenize(code)) {
 - if (lex == "(") {
 - SExpression newNode = new SExpression(value: "(", parent: current);
 - current.Children.Add(newNode);
 - current = newNode;
 - } else if (lex == ")") {
 - current = current.Parent;
 - } else {
 - current.Children.Add(new SExpression(value: lex, parent: current));
 - }
 - }
 - return program.Children[0];
 - }
 
new SExpression(value: "", parent: null)比new SExpression("", null)可读。code.Tokenize().ParseAsIScheme比ParseAsIScheme(Tokenize(code))流畅。作用域决定程序的运行环境。iScheme使用嵌套作用域。
以下面的程序为例
- >> (def x 1)
 - >> 1
 - >> (def y (begin (def x 2) (* x x)))
 - >> 4
 - >> x
 - >> 1
 
利用C#提供的Dictionary类型,我们可以很容易的实现iScheme的作用域SScope:
iScheme的作用域实现
- public class SScope {
 - public SScope Parent { get; private set; }
 - private Dictionary
 variableTable; - public SScope(SScope parent) {
 - this.Parent = parent;
 - this.variableTable = new Dictionary
 (); - }
 - public SObject Find(String name) {
 - SScope current = this;
 - while (current != null) {
 - if (current.variableTable.ContainsKey(name)) {
 - return current.variableTable[name];
 - }
 - current = current.Parent;
 - }
 - throw new Exception(name + " is not defined.");
 - }
 - public SObject Define(String name, SObject value) {
 - this.variableTable.Add(name, value);
 - return value;
 - }
 - }
 
iScheme的类型系统极其简单——只有数值,Bool,列表和函数,考虑到他们都是iScheme里面的值对象(Value Object),为了便于对它们进行统一处理,这里为它们设置一个统一的父类型SObject:
- public class SObject { }
 
iScheme的数值类型只是对.Net中Int64(即C#里的long)的简单封装:
- public class SNumber : SObject {
 - private readonly Int64 value;
 - public SNumber(Int64 value) {
 - this.value = value;
 - }
 - public override String ToString() {
 - return this.value.ToString();
 - }
 - public static implicit operator Int64(SNumber number) {
 - return number.value;
 - }
 - public static implicit operator SNumber(Int64 value) {
 - return new SNumber(value);
 - }
 - }
 
注意这里使用了C#的隐式操作符重载,这使得我们可以:
- SNumber foo = 30;
 - SNumber bar = 40;
 - SNumber foobar = foo * bar;
 
而不必:
- SNumber foo = new SNumber(value: 30);
 - SNumber bar = new SNumber(value: 40);
 - SNumber foobar = new SNumber(value: foo.Value * bar.Value);
 
为了方便,这里也为SObject增加了隐式操作符重载(尽管Int64可以被转换为SNumber且SNumber继承自SObject,但.Net无法直接把Int64转化为SObject):
- public class SObject {
 - ...
 - public static implicit operator SObject(Int64 value) {
 - return (SNumber)value;
 - }
 - }
 
由于Bool类型只有True和False,所以使用静态对象就足矣。
- public class SBool : SObject {
 - public static readonly SBool False = new SBool();
 - public static readonly SBool True = new SBool();
 - public override String ToString() {
 - return ((Boolean)this).ToString();
 - }
 - public static implicit operator Boolean(SBool value) {
 - return value == SBool.True;
 - }
 - public static implicit operator SBool(Boolean value) {
 - return value ? True : False;
 - }
 - }
 
这里同样使用了C#的隐式操作符重载,这使得我们可以:
- SBool foo = a > 1;
 - if (foo) {
 - // Do something...
 - }
 
而不用
- SBool foo = a > 1 ? SBool.True: SBool.False;
 - if (foo == SBool.True) {
 - // Do something...
 - }
 
同样,为SObject增加隐式操作符重载:
- public class SObject {
 - ...
 - public static implicit operator SObject(Boolean value) {
 - return (SBool)value;
 - }
 - }
 
#p#
iScheme使用.Net中的IEnumberable实现列表类型SList:
- public class SList : SObject, IEnumerable
 { - private readonly IEnumerable
 values; - public SList(IEnumerable
 values) { - this.values = values;
 - }
 - public override String ToString() {
 - return "(list " + " ".Join(this.values) + ")";
 - }
 - public IEnumerator
 GetEnumerator() { - return this.values.GetEnumerator();
 - }
 - IEnumerator IEnumerable.GetEnumerator() {
 - return this.values.GetEnumerator();
 - }
 - }
 
实现IEnumerable后,就可以直接使用LINQ的一系列扩展方法,十分方便。
iScheme的函数类型(SFunction)由三部分组成:
SExpression。SFunction的实现
- public class SFunction : SObject {
 - public SExpression Body { get; private set; }
 - public String[] Parameters { get; private set; }
 - public SScope Scope { get; private set; }
 - public Boolean IsPartial {
 - get {
 - return this.ComputeFilledParameters().Length.InBetween(1, this.Parameters.Length);
 - }
 - }
 - public SFunction(SExpression body, String[] parameters, SScope scope) {
 - this.Body = body;
 - this.Parameters = parameters;
 - this.Scope = scope;
 - }
 - public SObject Evaluate() {
 - String[] filledParameters = this.ComputeFilledParameters();
 - if (filledParameters.Length < Parameters.Length) {
 - return this;
 - } else {
 - return this.Body.Evaluate(this.Scope);
 - }
 - }
 - public override String ToString() {
 - return String.Format("(func ({0}) {1})",
 - " ".Join(this.Parameters.Select(p => {
 - SObject value = null;
 - if ((value = this.Scope.FindInTop(p)) != null) {
 - return p + ":" + value;
 - }
 - return p;
 - })), this.Body);
 - }
 - private String[] ComputeFilledParameters() {
 - return this.Parameters.Where(p => Scope.FindInTop(p) != null).ToArray();
 - }
 - }
 
部分求值
- >> (def mul (func (a b) (* a b)))
 - >> (func (a b) (* a b))
 - >> (mul 3 4)
 - >> 12
 - >> (mul 3)
 - >> (func (a:3 b) (* a b))
 - >> ((mul 3) 4)
 - >> 12
 
也就是说,当SFunction的实际参数(Argument)数量小于其形式参数(Parameter)的数量时,它依然是一个函数,无法被求值。
这个功能有什么用呢?生成高阶函数。有了部分求值,我们就可以使用
- (def mul (func (a b) (* a b)))
 - (def mul3 (mul 3))
 - >> (mul3 3)
 - >> 9
 
而不用专门定义一个生成函数:
- (def times (func (n) (func (n x) (* n x)) ) )
 - (def mul3 (times 3))
 - >> (mul3 3)
 - >> 9
 
SFunction#ToString可以将其自身还原为源代码——从而大大简化了iScheme的理解和测试。iScheme的内置操作有四种:算术|逻辑|比较|列表操作。
我选择了表达力(Expressiveness)强的lambda方法表来定义内置操作:
首先在SScope中添加静态字段builtinFunctions,以及对应的访问属性BuiltinFunctions和操作方法BuildIn。
- public class SScope {
 - private static Dictionary
 > builtinFunctions = - new Dictionary
 >(); - public static Dictionary
 > BuiltinFunctions { - get { return builtinFunctions; }
 - }
 - // Dirty HACK for fluent API.
 - public SScope BuildIn(String name, Func
 builtinFuntion) { - SScope.builtinFunctions.Add(name, builtinFuntion);
 - return this;
 - }
 - }
 
注意:
Func是C#提供的委托类型,表示一个接受T1和T2,返回TRESULT接下来就可以这样定义内置操作:
- new SScope(parent: null)
 - .BuildIn("+", addMethod)
 - .BuildIn("-", subMethod)
 - .BuildIn("*", mulMethod)
 - .BuildIn("/", divMethod);
 
一目了然。
为了便于进行断言,我对Boolean类型做了一点点扩展。
- public static void OrThrows(this Boolean condition, String message = null) {
 - if (!condition) { throw new Exception(message ?? "WTF"); }
 - }
 
从而可以写出流畅的断言:
- (a < 3).OrThrows("Value must be less than 3.");
 
而不用
- if (a < 3) {
 - throw new Exception("Value must be less than 3.");
 - }
 
iScheme算术操作包含+ - * / %五个操作,它们仅应用于数值类型(也就是SNumber)。
从加减法开始:
- .BuildIn("+", (args, scope) => {
 - var numbers = args.Select(obj => obj.Evaluate(scope)).Cast
 (); - return numbers.Sum(n => n);
 - })
 - .BuildIn("-", (args, scope) => {
 - var numbers = args.Select(obj => obj.Evaluate(scope)).Cast
 ().ToArray(); - Int64 firstValue = numbers[0];
 - if (numbers.Length == 1) {
 - return -firstValue;
 - }
 - return firstValue - numbers.Skip(1).Sum(s => s);
 - })
 
注意到这里有一段重复逻辑负责转型求值(Cast then Evaluation),考虑到接下来还有不少地方要用这个逻辑,我把这段逻辑抽象成扩展方法:
- public static IEnumerable
 Evaluate (this IEnumerable expressions, SScope scope) - where T : SObject {
 - return expressions.Evaluate(scope).Cast
 (); - }
 - public static IEnumerable
 Evaluate(this IEnumerable expressions, SScope scope) { - return expressions.Select(exp => exp.Evaluate(scope));
 - }
 
然后加减法就可以如此定义:
- .BuildIn("+", (args, scope) => (args.Evaluate
 (scope).Sum(s => s))) - .BuildIn("-", (args, scope) => {
 - var numbers = args.Evaluate
 (scope).ToArray(); - Int64 firstValue = numbers[0];
 - if (numbers.Length == 1) {
 - return -firstValue;
 - }
 - return firstValue - numbers.Skip(1).Sum(s => s);
 - })
 
乘法,除法和求模定义如下:
- .BuildIn("*", (args, scope) => args.Evaluate
 (scope).Aggregate((a, b) => a * b)) - .BuildIn("/", (args, scope) => {
 - var numbers = args.Evaluate
 (scope).ToArray(); - Int64 firstValue = numbers[0];
 - return firstValue / numbers.Skip(1).Aggregate((a, b) => a * b);
 - })
 - .BuildIn("%", (args, scope) => {
 - (args.Length == 2).OrThrows("Parameters count in mod should be 2");
 - var numbers = args.Evaluate
 (scope).ToArray(); - return numbers[0] % numbers[1];
 - })
 
iScheme逻辑操作包括            
            网页名称:90分钟实现一门编程语言——极简解释器教程            
            网页URL:http://www.zsjierui.cn/article/ccioesg.html