哈工大编译原理习题及答案 下载本文

1.1何谓源程序、目标程序、翻译程序、编译程序和解释程序?它们之间可能有何种关系?

1.2一个典型的编译系统通常由哪些部分组成?各部分的主要功能是什么?

1.3选择一种你所熟悉的程序设计语言,试列出此语言中的全部关键字,并通过上机使用该语言以判明这些关键字是否为保留字。

1.4选取一种你所熟悉的语言,试对它进行分析,以找出此语言中的括号、关键字END以及逗号有多少种不同的用途。

1.5试用你常用的一种高级语言编写一短小的程序,上机进行编译和运行,记录下操作步骤和输出信息,如果可能,请卸出中间代码和目标代码。

第一章 习题解答

1. 解:源程序是指以某种程序设计语言所编写的程序。目标程序是指编译程序(或解释程序)将

源程序处理加工而得的另一种语言(目标语言)的程序。翻译程序是将某种语言翻译成另一种语言的程序的统称。编译程序与解释程序均为翻译程序,但二者工作方法不同。解释程序的特点是并不先将高级语言程序全部翻译成机器代码,而是每读入一条高级语言程序语句,就用解释程序将其翻译成一段机器指令并执行之,然后再读入下一条语句继续进行解释、执行,如此反复。即边解释边执行,翻译所得的指令序列并不保存。编译程序的特点是先将高级语言程序翻译成机器语言程序,将其保存到指定的空间中,在用户需要时再执行之。即先翻译、后执行。 2. 解:一般说来,编译程序主要由词法分析程序、语法分析程序、语义分析程序、中间代码生成

程序、代码优化程序、目标代码生成程序、信息表管理程序、错误检查处理程序组成。 3. 解:C语言的关键字有:auto break case char const continue default do double else enum extern

float for goto if int long register return short signed sizeof static struct switch typedef union unsigned void volatile while。上述关键字在C语言中均为保留字。

4. 解:C语言中括号有三种:{},[],()。其中,{}用于语句括号;[]用于数组;()用于函数(定

义与调用)及表达式运算(改变运算顺序)。C语言中无END关键字。逗号在C语言中被视为分隔符和运算符,作为优先级最低的运算符,运算结果为逗号表达式最右侧子表达式的值(如:(a,b,c,d)的值为d)。 5. 略

第二章 前后文无关文法和语言

21设有字母表A1={a,b,…,z},A2={0,1,…,9},试回答下列问题: (1) 字母表A1上长度为2的符号串有多少个? (2) 集合A1A2含有多少个元素?

(3) 列出集合A1 (A1∪A2)*中的全部长度不大于3的符号串。 22试分别构造产生下列语言的文法。 (1) {anbn|n≥0};

(2) {anbmcp|n,m,p≥0};

(3) {an#bn|n≥0}∪{cn#dn|n≥0};

(4) {w#wr#|w∈{0,1}*,wr是将w中的符号按逆序排列所得的符号串}; (5) 任何不是以0开始的所有奇整数所组成的集合; (6) 所有由偶数个0和偶数个1所组成的符号串的集合。

23试描述由下列文法所产生的语言的特点 (文法的开始符号均为S)。 (1) S→10S0S→aAA→bAA→a (2) S→SSS→1A0A→1A0A→ε (3) S→1AS→B0A→1AA→C B→B0B→CC→1C0C→ε (4) S→bAdcA→AGSG→εA→a (5) S→aSSS→a

24设已给文法G=(VN,VT,P,S),其中: VN={S}

VT={a1,a2,…,an,∨,∧, ~, [,]}

P={S→ai|i=1,2,…,n}∪{S→~S,S→[S∨S],S→[S∧S]}, 试指出此文法所产生的语言。 25考察文法G=(VN,VT,P,S),其中: VN={S,A,B,C,D,E,F,G} VT={a},

P={S→ABC,C→BC,C→A,BA→GE,BG→GBF,AG→AD, DB→BD,DE→AE,FB→BF,FE→Ea,AA→ε} (1) 指出此文法的类型; (2) 证明此文法所产生的语言为 L(G)={at(n)|n≥1} t(n)=∑n[]i=1i

26设已给文法G[〈程序〉]: 〈程序〉→〈分程序〉|〈复合语句〉

〈分程序〉→〈无标号分程序〉|〈标号〉:〈分程序〉 〈复合语句〉→〈无标号复合语句〉|〈标号〉:〈复合语句〉 〈无标号分程序〉→〈分程序首部〉;〈复合尾部〉 〈无标号复合语句〉→begin〈复合尾部〉

〈分程序首部〉→begin〈说明〉|〈分程序首部〉;〈说明〉 〈复合尾部〉→〈语句〉end|〈语句〉;〈复合尾部〉 〈说明〉→d 〈语句〉→s 〈标号〉→L (1) 给出句子

L: L: begin d; d; s; s end 的最左推导和最右推导。 (2) 画出上述句子的语法树。 27设已给文法G[S]:

S→aAcBS→BdSB→aScAB→cAB A→BaBA→aBcA→aB→b

试检验下列符号串中哪些是G[S]中的句子,给出这些句子的最左推导、最右推导和相应的语法树。 (1) aacb (2) aabacbadcd (3) aacbccb

(4) aacabcbcccaacdca (5) aacabcbcccaacbca

28设G=(VN,VT,P,S)为CFG,α1,α2,…,αn为V上的符号串,试证明: 若 α1α2…αn*β

则存在V上的符号串β1,β2,…,βn,使β=β1β2…βn,且有 ai*βi(i=1,2,…,n)

29设G=(VN,VT,P,S)为CFG,α和β都是V上的符号串,且α*β,试证明:当α的首符号为终结符号时,β的首符号也必为终结符号;当β的首符号为非终结符号时,则α的首符号也必为非终结符号。 210试证明: 文法 S→ABS→DCA→aAA→a B→bBcB→bcC→cCC→c D→aDbD→ab 为二义性文法。

211对于下列的文法和相应的句子,试指出这些句子的全部短语;分别给出句子的最右推导,并指出各步直接推导所得句型的句柄。 (1) S→ABS→cA→bAA→aB→aSbB→c bbaacb

(2) S→(AS)S→(b)A→(SaA)A→(a) (((b) a (a)) (b))

(3) E→ET+E→TT→TF*T→FF→FP↑F→PP→EP→i iii*i+↑

212在自底向上的分析中,用来归约句型句柄的产生式称为句柄产生式。试证明: 一个文法是无二义性的,当且仅当此文法的每一句型至多只有一个句柄和一个句柄产生式。 213化简下列各个文法。

(1) S→aABSS→bCACdA→bABA→cSA A→cCCB→bABB→cSBC→cS C→c

(2) S→aABS→EA→dDAA→e B→bEB→fC→cABC→dSD C→aD→eAE→fAE→g (3) S→acS→bAA→cBCB→SA C→bCC→d

214消去下列文法中的ε产生式。 (1) S→aASS→bA→cSA→ε (2) S→aAAA→bAcA→dAeA→ε

215消去下列文法中的无用产生式和单产生式。

(1) S→aBS→BCA→aAA→c A→aDbB→DBB→CD→B C→b

(2) S→SAS→SBA→BB→[S] A→(S)S→AB→[ ]A→( ) (3) E→E+TE→TT→T*FT→F F→P↑FF→PP→(E)P→i

第二章 习题解答

1.(1)答:26*26=676 (2)答:26*10=260

(3)答:{a,b,c,...,z,a0,a1,...,a9,aa,...,az,...,zz,a00,a01,...,zzz},共26+26*36+26*36*36=34658个 2.构造产生下列语言的文法 (1){anbn|n≥0}

解:对应文法为G(S) = ({S},{a,b},{ S→ε| aSb },S) (2){anbmcp|n,m,p≥0}

解:对应文法为G(S) = ({S,X,Y},{a,b,c},{S→aS|X,X→bX|Y,Y→cY|ε},S) (3){an # bn|n≥0}∪{cn # dn|n≥0}

解:对应文法为G(S) = ({S,X,Y},{a,b,c,d,#}, {S→X, S→Y,X→aXb|#,Y→cYd|# },S) (4){w#wr# | w?{0,1}*,wr是w的逆序排列}

解:G(S) = ({S,W,R},{0,1,#}, {S→W#, W→0W0|1W1|# },S) (5)任何不是以0打头的所有奇整数所组成的集合

解:G(S) = ({S,A,B,I,J},{-,0,1,2,3,4,5,6,7,8,9},{S→J|IBJ,B→0B|IB|e, I→J|2|4|6|8, Jà1|3|5|7|9},S)

(6)所有偶数个0和偶数个1所组成的符号串集合

解:对应文法为 S→0A|1B|e,A→0S|1C B→0C|1S C→1A|0B 3.描述语言特点

(1)S→10S0S→aAA→bAA→a

解:本文法构成的语言集为:L(G)={(10)nabma0n|n, m≥0}。 (2)S→SS S→1A0A→1A0A→ε

解:L(G)={1n10n11n20n2 ? 1nm0nm |n1,n2,?,nm≥0;且n1,n2,?nm不全为零}该语言特点是:产生的句子中,0、1个数相同,并且若干相接的1后必然紧接数量相同连续的0。 (3)S→1AS→B0A→1AA→CB→B0B→CC→1C0C→ε

解:本文法构成的语言集为:L(G)={1p1n0n|p≥1,n≥0}∪{1n0n0q|q≥1,n≥0},特点是具有1p1n0n 或1n0n0q形式,进一步,可知其具有形式1n0mn,m≥0,且n+m>0。 (4)S→bAdcA→AGSG→εA→a 解:可知,S=>?=>baSndc n≥0

该语言特点是:产生的句子中,是以ba开头dc结尾的串,且ba、dc个数相同。 (5)S→aSSS→a

解:L(G)={a(2n-1)|n≥1}可知:奇数个a

4.解:此文法产生的语言是:以终结符a1 、a2 ?an 为运算对象,以∧、∨、~为运算符,以[、]为分隔符的布尔表达式串

5. 5.1解:由于此文法包含以下规则:AA→e,所以此文法是0型文法。 5.2证明:略 6.解:

(1)最左推导:

<程序>T<分程序>T<标号>:<分程序>TL:<分程序> TL:<标号>:<分程序> T L:L:<分程序>

T L:L:<无标号分程序>

T L:L:<分程序首部>;<复合尾部>

T L:L:<分程序首部>;<说明>;<复合尾部> T L:L:begin<说明>;<说明>;<复合尾部> T L:L:begin d;<说明>;<复合尾部> T L:L:begin d;d;<复合尾部>

T L:L:begin d;d;<语句>;<复合尾部> T L:L:begin d;d;s;<复合尾部. T L:L:begin d;d;s;<语句> end T L:L:begin d;d;s;s end 最右推导:

<程序>T<分程序>T<标号>:<分程序> T<标号>:<标号>:<分程序> T<标号>:<标号>:<无标号分程序>

T<标号>:<标号>:<分程序首部>;<复合尾部>

T<标号>:<标号>:<分程序首部>;<语句>;<复合尾部> T<标号>:<标号>:<分程序首部>;<语句>;<语句>;end T<标号>:<标号>:<分程序首部>;<语句>;s;end T<标号>:<标号>:<分程序首部>;s;s;end T<标号>:<标号>:<分程序首部>;说明;s;s;end T<标号>:<标号>:<分程序首部>;d;s;s;end T<标号>:<标号>:begin 说明;d;s;s;end T<标号>:<标号>:begin d;d;s;s;end

T<标号>: L:begin d;d;s;s;end TL:L:begin d;d;s;s;end

(2)句子L:L:begin d;d;s;s end的相应语法树是:

7.解:

aacb是文法G[S]中的句子,相应语法树是:

最右推导:S=>aAcB=>aAcb=>aacb 最左推导:S=>aAcB=>aacB=>aacb

(2)aabacbadcd不是文法G[S]中的句子 因为文法中的句子不可能以非终结符d结尾 (3)aacbccb不是文法G[S]中的句子

可知,aacbccb仅是文法G[S]的一个句型的一部分,而不是一个句子。 (4)aacabcbcccaacdca不是文法G[S]中的句子

因为终结符d后必然要跟终结符a,所以不可能出现?dc?这样的句子。 (5)aacabcbcccaacbca不是文法G[S]中的句子

由(1)可知:aacb可归约为S,由文法的产生式规则可知,终结符c后不可能跟非终结符S,所以不可能出现?caacb?这样的句子。

8.证明:用归纳法于n,n=1时,结论显然成立。设n=k时,对于α1α2...αkT*b,存在βi:i=1,2,..,k,αiT*bi成立,现在设

α1α2... αkαk+1T*b,因文法是前后文无关的,所以α1α2... αk可推导出b的一个前缀b',αk+1可推导出b的一个后缀=b\不妨称为b k+1)。由归纳假设,对于b',存在βi :i=1,2,..,k,b'=β1β2...βk,使得

αiT*bi成立,另外,我们有αk+1T*b\)。即n=k+1时亦成立。证毕。

9.证明:(1)用反证法。假设α首符号为终结符时,β的首符号为非终结符。即设:α=aω;β=Aω’且 α=>*β。

由题意可知:α=aωT ?T Aω’=β,由于文法是CFG,终结符a不可能被替换空串或非终结符,因此假设有误。得证;

(2)同(1),假设:β的首符号为非终结符时,α首符号为终结符。即设:α=aω;β=Aω’且α=aωT ?T Aω’=β,与(1)同理,得证。

10.证明:因为存在句子:abc,它对应有两个语法树(或最右推导): STABTAbcTabc STDCTDcTabc

所以,本文法具有二义性。 11.解:

(1) STABTAaSbTAacbTbAacbTbbAacbTbbaacb

上面推导中,下划线部分为当前句型的句柄。对应的语法树为:

全部的短语:

第一个a (a1)是句子bbaacb相对于非终结符A (A1) (产生式A?a)的短语(直接短语); b1a1是句子bbaacb相对于非终结符A2的短语; b2b1a1是句子bbaacb相对于非终结符A3的短语;

c是句子bbaacb相对于非终结符S1(产生式S?c)的短语(直接短语); a2cb3是句子bbaacb相对于非终结符B的短语; b2b1a1a2cb3是句子bbaacb相对于非终结符S2的短语; 注:符号的下标是为了描述方便加上去的。 (2)句子(((b)a(a))(b))的最右推导:

ST(AS)T(A(b))T((SaA)(b))T((Sa(a))(b)) T(((b)a(a))(b)) 相应的语法树是:

(3)解:iii*i+↑对应的语法树略。

最右推导:E TT=>F=>FP↑T FE↑T FET+↑T FEF+↑T FEP+↑T FEi+↑ TFTi+↑T FTF*i+↑TFTP*i+↑T FTi*i+↑TFFi*i+↑T FPi*i+↑ TFii*i+↑T Pii*i+↑Tiii*i+↑ 12.证明:

充分性:当前文法下的每一符号串仅有一个句柄和一个句柄产生式T对当前符号串有唯一的最左归约T对每一步推导都有唯一的最右推导T有唯一的语法树。

必要性:有唯一的语法树T对每一步推导都有唯一的最右推导T对当前符号串有唯一的最左归约T当前文法下的每一符号串仅有一个句柄和一个句柄产生式

13.化简下列各个文法

(1)解:S→bCACdA→cSA| cCCC→cS | c (2)解:S→aAB | fA | gA→e | dDAD→eAB→f (3)解:S→ac

14.消除下列文法中的ε产生式 (1)解:S→aAS | aS | bA→cS

(2)解:S→aAA | aA | aA→bAc| bc | dAe| de 15.消除下列文法中的无用产生式和单产生式 (1)消除后的产生式如下: S→aB | BC B→DB | b C→b D→b | DB

(2)消除后的产生式如下: S→SA | SB |()|(S)|[] |[S] A→() |(S)|[]|[S] Bà[] |[S]

(3)消除后的产生式如下: E→E+T | T*F | (E) | P↑F | i T→T*F | (E) | P↑F | i F→P↑F | (E) | i P→(E) | i

第三章 词法分析及词法分析程序

3.1试用某种高级语言编写一个FORTRAN源程序的预处理子程序,其功能是: 每调用它一次,即把源程序中的一个完整语句送入扫描缓冲区。要求删去语句中的注释行;删去续行标记字符,把语句中的各行连接起来,并在语句的末端加上语句结束符。此外,还要求此程序具有组织源程序列表输出的功能。

3.2画出用来识别如下三个关键字的状态转移图。 STEP STRING SWITCH

3.3假定有一个猎人带着一只狼、一头山羊和一棵白菜来到一条河的左岸,拟摆渡过河,而岸边只有一条小船,其 大小仅能装载人和其余三件东西中的一件,也就是说,每一次猎人只能将随行者中的一件带到彼岸。若猎人将狼和山羊留在同一岸上而无人照管,那么,狼就会将羊吃掉;如果猎人把山羊和白菜留在同一岸,山羊也会把白菜吃掉。现在,请你用状态转换图作为工具,描述猎人可能采取的种种摆渡方案,并从中找出可将上述三件东西安全地带到右岸的方案来。

3.4设已给文法G=(VN,VT,P,S),其中,P仅含形如 A→αBA→αα∈V*T,B∈VN

的产生式,试证明: 由此种文法所产生的语言是一正规语言。 3.5试证明: 任何有限个符号串所组成的集合 L={x1,x3,?,xn}xi∈Σ+ 都是3型语言。

3.6试构造一右线性文法,使得它与如下的文法等价 S→ABA→UTU→a|aU T→b|bTB→c|cB

并根据所得的右线性文法,构造出相应的状态转换图。 3.7对于如题图37所示的状态转换图 (1) 写出相应的右线性文法; (2) 指出它接受的最短输入串;

(3) 任意列出它接受的另外四个输入串; (4) 任意列出它拒绝接受的四个输入串。 题图37

3.8对于有限自动机 M=(K,Σ,f,S0,Z)

其中,K={S0,S1,S2,S3,S4,S5},Σ={a,b},Z={S1,S4,S5}。 f由如下的状态转移矩阵给出:

[]a[]bS0[]S2[]S1S1[]S3[]S1S2[]S0[]S4S3[]S0[]S0S4[]S5[]S4S5[]S4[]S0 试找出一个长度最小的输入串,使得:

(1) 在识别此输入串的过程中,每一状态至少经历一次; (2) 每一状态转换至少经历一次。 3.9对于下列的状态转换矩阵: []a[]bS[]A[]SA[]A[]BB[]B[]B(i) 初态:S

终态:B[][][]a[]bS[]A[]BA[]B[]AB[]B[]B(ii) 初态:S 终态:A[]a[]bS[]A[]BA[]C[]AB[]B[]CC[]C[]C(iii) 初态:S 终态:A,C[][][]a[]bS[]A[]SA[]C[]BB[]B[]CC[]C[]C(iv) 初态:S 终态:C

(1) 分别画出相应的状态转换图; (2) 写出相应的3型文法;

(3) 用自然语言分别描述它们所识别的输入串的特征。 3.10对于下面所给的文法: G1=({S,A,B,C,D}, {a,b,c,d},P1,S) P1由如下产生式组成: S→aAS→BA→abS A→bBB→bB→cC C→DD→dD→bB

以及G2=({S,A,B,C,D},{a,b,c,d},P2,S) P2由如下产生式组成: S→AaS→BA→Cc A→BbB→BbB→a C→DC→BabD→d

(1) 试分别对G1和G2构造相应的状态转换图 (提示:对于右线性文法,可将形如C→D的产生式视为C→εD;而对左线性文法,则可将它视为C→Dε)。

(2) 对于G1,构造一等价的左线性文法G1′;对于G2构造一等价的右线性文法G2′。 (3) 对于G1和G1′,分别给出如下符号串的推导序列: abbaababbbcdcbb

对于G2和G2′分别给出如下符号串的推导序列: aabaaabcadca

(4) 试给出若干个不能由G1或G2产生的符号串,并验证它们同样不能用G1′和G2′产生。

3.11分别构造将左线性文法转换为右线性文法以及将右线性文法转换为左线性文法的算法。

3.12将如题图312所示的NFA确定化和最小化。 题图312

3.13将如题图313所示的具有ε动作的NFA确定化。 题图313

3.14将如题图314所示的有限自动机最小化。

3.15试用一种高级语言分别写出将NFA确定化以及将DFA最小化的算法。 3.16构造一产生FORTRAN语言COMMON语句的3型文法 (假定分别用λ和μ代表标识符和整常数,它们都是终结符号,且假定数组的维数不加限定),构造相应的DFA,并写出描述COMMON语句的正规式。

3.17设r,s等为任意的正规式,试证明下列的关系式成立: (1) r*=(ε|r)*=ε|rr*=(r*)* (2) (rs)*r=r(sr)*

(3) (r|s)*=(r*s*)*=(r*|s*)*

3.18对于解习题36所得的文法,试用正规式描述它所产生的语言。

[]a[]bS0[]S1[]S5S1[]S2[]S7S2[]S3[]S5S3[]S5[]S7S4[]S5[]S5S5[]S3[]S1S6[]S3[]S0S7[]S0[]S1S8[]S3[]S8(1) 初态:S0 终态:S1,S2,S6,

S7[][][]a[]bS0[]S5[]S2S1[]S6[]S2S2[]S0[]S4S3[]S3[]S5S4[]S6[]S2S5[]S3[]S0S6[]S3[]S1(2) 初态:S0 终态:S4,S5,S6题图314

3.19对于习题310所给的文法G1和G2,试分别用正规式描述它们所产生的语言。 3.20设有如下的文法G[〈标号说明〉]: 〈标号说明〉→′LABEL′〈标号表〉 〈标号表〉→d〈标号段〉

〈标号段〉→d〈标号段〉|,〈标号〉|; 〈标号〉→d〈标号段〉

其中′LABEL′,′d′,′,′,′;′等为终结符号。 (1) 试求出描述此文法所产生语言的正规式; (2) 构造识别此语言的具有最少状态的DFA。

3.21求出描述习题37所给有限自动机所识别语言的正规式。 3.22分别构造识别如下正规语言的DFA: (1) ((0*|1)(1*0))* (2) (b|a(aa*b)*b)* (3) a(abab*|a(bab)*a)*b (4) (b|aa|ac|aaa|aac)*

(5) a(a|b)*b(a|b)*a(a|b)*b(a|b)*

3.23试设计一个识别器,它识别由下列英语单词: ONE, TWO, THREE, ?, NINE, TEN,

ELEVEN, TWELVE, THIRTEEN, ?, NINETEEN, TWENTY, THIRTY, FORTY, ?, NINETY, HUNDRED

所表示的从1到999间的任何整数 (各单词间用空格分隔,如THREE HUNDRED FIFTY SIX),并将它们翻译为相应的阿拉伯数字 (如356)作为输出。 3.24设有辅助定义式 D0=a|b D1=D0D0 D2=D1D1 ?

Dn=Dn-1Dn-1 试回答如下问题:

(1) 由Dn所表述的正规集是什么?

(2) 如果将Dn中所出现的Dn-1用前面已定义的辅助定义式反复进行替换,则可最终将Dn化为Σ={a,b}上的正规式,此正规式有多长? (3) 用来识别Dn的DFA至多需要几个状态?

3.25试将LEX中的“动作子程序”Ai的功能加以扩充,使之可用来生成文本编辑程序。

3.26指出下列LEX正规式所匹配的字符串: (1) \[^{]*\

(2) ^[^a-z][A-Z][0-9]$ (3) [^0-9]|[\r\n]

(4) \′([^′\n]|\′\′)+\′ (5) \\[^\\n]|\\[\\n])*\\

3.27写出一个LEX正规式,它能匹配C语言的所有无符号整数 (例如:OX89ab,0123,45,′Z′,′\t′,′\xab′,′\012′,等等)。 3.28写出一个LEX正规式,它能匹配C语言的标识符。

3.29编写一个LEX源程序,它将一个正文文件中的全部小写字母均换为大写字母,并将其中的制表字符、空白字符序列均用单个空格字符进行替换 (提示: 在语义动作中使用全程变量yytext)。

3.30编写一个LEX源程序,它能统计一个PASCAL程序中所含用户定义之标识符个数,并能找出最长标识符中的字符个数 (提示: 使用全程变量yytext及yyleng)。 上 机 实 习 题

对于如下文法所定义的PASCAL语言子集,试编写并上机调试一个词法分析程序: 〈程序〉→〈变量说明〉BEGIN〈语句表〉END.

〈变量说明〉→VAR〈变量表〉:〈类型〉;|〈空〉 〈变量表〉→〈变量表〉,〈变量〉|〈变量〉 〈类型〉→INTEGER

〈语句表〉→〈语句表〉;〈语句〉|〈语句〉

〈语句〉→〈赋值语句〉|〈条件语句〉|〈WHILE语句〉|〈复合语句〉|〈过程定义〉 〈赋值语句〉→〈变量〉∶=〈算术表达式〉

〈条件语句〉→IF〈关系表达式〉THEN〈语句〉ELSE〈语句〉 〈WHILE语句〉→WHILE〈关系表达式〉DO〈语句〉 〈复合语句〉→BEGIN〈语句表〉END

〈过程定义〉→PROCEDURE〈标识符〉〈参数表〉; BEGIN〈语句表〉END

〈参数表〉→(〈标识符表〉)|〈空〉

〈标识符表〉→〈标识符表〉,〈标识符〉|〈标识符〉 〈算术表达式〉→〈算术表达式〉+〈项〉|〈项〉 〈项〉→〈项〉*〈初等量〉|〈初等量〉

〈初等量〉→(〈算术表达式〉)|〈变量〉|〈无符号数〉 〈关系表达式〉→〈算术表达式〉〈关系符〉〈算术表达式〉 〈变量〉→〈标识符〉

〈标识符〉→〈标识符〉〈字母〉|〈标识符〉〈数学〉|〈字母〉 〈无符号数〉→〈无符号数〉〈数字〉|〈数字〉 〈关系符〉→=|<|<=|>|>=|<> 〈字母〉→A|B|C|?|X|Y|Z 〈数字〉→0|1|2|?|8|9 〈空〉→ 要求和提示: (1) 单词的分类。

可将所有标识符归为一类;将常数归为另一类;保留字和分隔符则可采取一词一类。 (2) 符号表的建立。

可事先建立一保留字表,以备在识别保留字时进行查询。变量名表及常数表则在词法分析过程中建立。 (3) 单词串的输出形式。 所输出的每一单词,均按形如 (CLASS,VALUE)

的二元式编码。对于变量标识符和常数,CLASS字段为相应的类别码,VALUE字段则是该标识符、常数在其符号表中登记项的序号 (要求在变量名表登记项中存放该标识符的字符串,其最大长度为四个字符;常数表登记项中则存放该整数的二进制形式)。对于保留字和分隔号,由于采用一词一类的编码方式,所以仅需在二元式的CLASS字段上放置相应的单词的类别码,VALUE字段则为“空”。不过,为便于查看由词法分析程序所输出的单词串,也可以在CLASS字段上直接放置单词符号串本身。

(4) 可以仿照程序34的结构来编写上述词法分析程序,但其中的若干语义过程有待于具体编写。

(5) 写出它的LEX源程序,并上机进行处理。

第三章 习题解答

1.从略 2.

3 假设W:表示载狐狸过河,G:表示载山羊过河,C:表示载白菜过河

用到的状态1:狐狸和山羊在左岸2:狐狸和白菜载左岸3:羊和白菜在左岸 4:狐狸和山羊在右岸5:狐狸和白菜在右岸 6:山羊和白菜在右岸F:全在右岸

4 证明:只须证明文法G:A→αB 或A→α (A,B∈VN, α∈VT+) 等价于G1:A→aB 或A→a (a∈VT+)

?

G1的产生式中 A→aB, 则B也有B→bC ,C→cD ….

所以有 A →abc?B’,a,b,c?∈VT,B’∈VN

所以与G等价。

2)G的产生式A→αB,α∈VT+,因为α是字符串,所以肯定存在着一个终结符a, 使A→aB 可见两者等价,所以由此文法产生的语言是正规语言。 5

6 根据文法知其产生的语言是 L={ambnci| m,n,i≧1}

可以构造如下的文法VN={S,A,B,C}, VT={a,b,c}

P={ S →aA, A→aA, A→bB, B→bB, B→cC, C→cC, C→c} 其状态转换图如下:

7 (1) 其对应的右线性文法是:

A →0D, B→0A,B→1C,C→1|1F,C→1|0A,F→0|0E|1A,D→0B|1C,E→1C|0B (2) 最短输入串011 (3) 任意接受的四个串 011,0110,0011,000011 (4) 任意以1打头的串. 8 从略。 9

(2)相应的3型文法

(i) S →aAS→bS A→aA A→bB B→a|aB B→b|bB (ii) S→aA|a S→bB B→aB | bB A→aB A→b|bA

(iii) S→aA S→bB A→bA A→aC B→aB B→bC C→a|aC C→b|bC (iv) S→bS S→aA A→aC A→bB B→aB B→bC C→a|aC C→b|bC (3)用自然语言描述输入串的特征

(i) 以任意个(包括0)b开头,中间有任意个(大于1)a,跟一个b,还可以有一个由a,b组成的任意字符串

(ii) 以a打头,后跟任意个(包括0)b

(iii)以a打头,中间有任意个(包括0)b,再跟a,最后由一个a,b所组成的任意串结尾或者 以b打头,中间有任意个(包括0)a,再跟b,最后由一个a,b所组成的任意串结尾 (iv)以任意个(包括0)b开头,中间跟aa最后由一个a,b所组成的任意串结尾或者

以任意个(包括0)b开头,中间跟ab后再接任意(包括0)a再接b,最后由一个a,b所组成的任意串结尾

10 (1)G1的状态转换图:

G2的状态转换图:

(2) G1等价的左线性文法:

S→Bb,S→Dd,D→C,B→Db,C→Bc,B→Ab,B→ε,A→a G2等价的右线性文法:

S→dD,S→aB,D→C,B→abC,B→bB,B→bA,B→ε,C→cA,A→a (3)对G1文法,abb的推导序列是: S=>aA=>abB=>abb

对G1’文法,abb的推导序列是: S=>Bb=>Abb=>abb

对G2文法,aabca的推导序列是: S=>Aa=>Cca=>Babca=>aabca

对G2’文法,aabca的推导序列是: S=>aB=>aabC=>aabcA=>aabca

(4)对串acbd来说,G1,G1’文法都不能产生。 11将右线性文法化为左线性文法的算法:

o (1)对于G中每一个形如A→aB的产生式且A是开始符,将其变为B→a,否则若A

不是开始符,B→Aa;

o (2)对于G中每一个形如A→a的产生式,将其变为S→Aa

12 (1)

状态矩阵是:

记[S]=q0 [B]=q1 [A B]=q2 [S A]=q3 ,最小化和确定化后如图

(2)记 [S]=q0, [A]=q1,[B S]=q2 最小化和确定化后的状态转换图如下

13 (1)将具有ε动作的NFA确定化后,其状态转换图如图: 记 { S0,S1,S3}=q0 {S1}=q1 {S2 S3}=q2 {S3}=q3

(2) 记{S}=q0 {Z}=q1 {U R}=q2 {S X}=q3 {Y U R}=q4 {X S U}=q5 {Y U R Z}=q6 {Z S}=q7

14(1)从略

(2)化简后S0和S1作为一个状态,S5和S6作为一个状态。 状态转换图如图

15从略。 16从略。

?

(1) r*表示的正规式集是{ε,r,rr,rrr,…}

(ε|r)*表示的正规式集是{ε, εε,?}∪{r,rr,rrr,?}={ε,r,rr,rrr,?} ε|rr*表示的正规式集是{ε,r,rr,rrr,?}

(r*)*=r*={ε,r,rr,rrr,?} 所以四者是等价的。

(2)(rs)*r表示的正规式集是{ε,rs,rsrs,rsrsrs,?}r ={r,rsr,rsrsr,rsrsrsr,?} r(sr)* 表示的正规式集是r{ε,sr,srsr,srsrsr,?} ={ r,rsr,rsrsr,rsrsrsr,?} 所以两者等价。 18 写成方程组 S=aT+aS(1) B=cB+c(2) T=bT+bB(3) 所以B=c*cT=b*bc*c S=a*ab*bc*c

?

G1:

S=aA+B(1) B=cC+b(2) A=abS+bB (3) C=D(4) D=bB+d(5)

把(4)(5)代入(2),得B=c(bB+d)+b=cbB+cd+b 得B=(cb)*(cd|b),代入(3)得 A=abS+b(cb)*(cd|b)把它打入(1)得 S=a(abS+b(cb)*(cd|b))+ (cb)*(cd|b) =aabS+ab(cb)*(cd|b) + (cb)*(cd|b) =(aab)*( ab(cb)*(cd|b)| (cb)*(cd|b)) G2:

S=Aa+B (1) A=Cc+Bb (2) B=Bb+a(3) C=D+Bab(4) D=d(5)

可得 D=dB=ab*C=ab*ab|bA=(ab*ab|b)c + ab*b S=(ab*ab|b)ca+ab*ba +ab* =(ab*ab|b)ca| ab*ba| ab* 20

? ?

识别此语言的正规式是S=?LABEL?d(d|,d)*; 从略。

21 从略。 22 构造NFA

其余从略。

23 下面举一个能够识别1,2,3,10,20,100的例子,读者可以推而广之。 %{

#include #include

#include #define ON1 #define TW 2 #define THRE 3 #define TE 10 #define TWENT 20 #define HUNDRE 100 #define WHITE9999 %}

upper[A-Z] %%

ONEreturn ON; TWOreturn TW; THREEreturn THRE; TENreturn TE; TWENTYreturn TWENT; HUNDREDreturn HUNDRE; \\\nreturn0; %%

main(int argc,char *argv[]) {

int c,i=0;

char tmp[30]; if (argc==2) {

if ((yyin=fopen(argv[1],\{

printf(\} }

while ((c=yylex())!=0) {

switch(c) { case ON: c=yylex();

if (c==0) goto {i+=1;label;} c=yylex(); if (c==HUNDRE) i+=100; else i+=1; break;

case TW:c=yylex(); c=yylex(); if (c==HUNDRE)

i+=200; else i+=2; break;

case TWENT: i+=20; break;

case TE:i+=10; break;

default:break; }

}/*while*/

label: printf(\return; }

24 (1)Dn表示的正规集是长度为2n任意a和b组成的字符串。

? ?

此正规式的长度是2n

用来识别Dn的DFA至多需要2n+1个状态。

25 从略。

26(1)由{}括住的,中间由任意个非{组成的字符串, 如{},{}},{a},{defg}等等。 (2)匹配一行仅由一个大写字母和一个数字组成的串,如A1,F8,Z2等。 (3)识别\\r\\n和除数字字符外的任何字符。

?

由?和?括住的,中间由两个??或者非?和\\n组成的任意次的字符串。如????, ?a?,?bb?,?def?,??????等等

27O[Xx][0-9]*[a-fA-F]*|[0-9]+|(\\’([a-zA-Z]|\\\\[Xx][0-7][0-7a-fA-F]|\\\\0[01][0-7][0-7]|\\\\[a-z])\\’)

28^[a-zA-Z_]+[0-9]*[a-zA-Z_]*

29 参考程序如下: %{

#include #include #include #define UPPER2 #define WHITE3 %}

upper[A-Z] %%

{upper}+returnUPPER; \\t|\%%

main(int argc,char *argv[]) { int c,i; if (argc==2) {

if ((yyin=fopen(argv[1],\{

printf(\} }

while ((c=yylex())!=EOF) {

if (c==2) {

for (i=0;yytext[i];i++)

printf(\yytext[0]='\\000'; }

if (c==3) printf(\

else printf(\} return; } yywrap() { return ; }

30 从略。

4.1消除下列文法的左递归性。 (1) S→SAS→A A→SBA→B A→(S)A→( ) B→[S]B→[ ] (2) S→ASS→b

A→SAA→a (3) S→(T)S→a S→εT→S T→T,S

4.2设已给文法: S→AbBS→d A→CAbA→Bf B→CSdB→d C→edC→a

试写出对符号串eddfbbd进行带回溯的自顶向下语法分析的过程。 4.3对于如下的文法,用某种高级语言写出递归下降分析程序。 (1) P→begin d; X end X→d;X X→sY Y→;sY Y→ε

(2) 〈程序〉→begin〈语句〉end 〈语句〉→〈赋值语句〉|〈条件语句〉 〈赋值语句〉→〈变量〉∶=〈表达式〉 〈条件语句〉→if〈表达式〉then〈语句〉 〈表达式〉→〈变量〉

〈表达式〉→〈表达式〉+〈变量〉 〈变量〉→i

4.4对于如下的文法,求出各个FIRST集和FOLLOW集。 S→aABS→bA S→εA→aAb A→εB→bB B→ε

4.5试证明: 任何具有左递归性的前后文无关文法均非LL(1)文法。 4.6试证明: 任何LL(1)文法均为无二义性文法。 4.7验证下列文法是否为LL(1)文法。 (1)S→ABS→CDa A→abA→c B→dEC→eC C→εD→fD D→fE→dE E→ε

(2) S→aABbCDS→ε A→ASdA→ε B→SAcB→eC B→εC→Sf C→CgC→ε

D→aBDD→ε

4.8对于如下的文法G[S]: S→SbS→Ab S→bA→Aa A→a

(1) 构造一个与G等价的LL(1)文法G′; (2) 对于G′,构造相应的LL(1)分析表。 49设已给文法 S→SaBS→bB A→SA→a B→Ac

(1) 求出各个FIRST集和FOLLOW集; (2) 将它改写为LL(1)文法。 410将下面的文法改写为LL(1)文法。

(1) 〈布尔表达式〉→〈布尔表达式〉∨〈布尔因子〉 〈布尔表达式〉→〈布尔因子〉

〈布尔因子〉→〈布尔因子〉∧〈布尔二次量〉 〈布尔因子〉→〈布尔二次量〉 〈布尔二次量〉→〈布尔初等量〉 〈布尔二次量〉→〈布尔初等量〉 〈布尔初等量〉→(〈布尔表达式〉) 〈布尔初等量〉→true | false (2) 习题26中所给的文法。

411设G[S]为LL(1)文法,A为G的非终结符号,A+ε,且由A至少可推出一个非ε的终结符号串,试证明: G中不会含有形如 B→αAAβ

的产生式,其中α,β∈(VT∪VN)*。

412试找出下列文法的全部简单优先关系,并指出它们是否为简单优先文法: (1) S→(AS)S→b A→(SaA)A→a (2) S→(R)S→∧ S→aR→T T→S,TT→S (3) S→(SRS→a R→,SRR→) (4) S→#Z#Z→E Z→E+TZ→T Z→iT→(Z) T→i

413对于文法G[S]: S→A/A→Aa A→ASA→/

(1) 构造G[S]的简单优先矩阵;

(2) 找出其中的多重定义元素,以验证G[S]不是简单优先文法。

414试用某种高级语言编写一个求出给定文法的全部简单优先关系的程序,此程序以某种适当形式表示的文法为输入。

415试证明如下的句柄定理,即证明简单优先文法的任何句型X1X2…Xn的句柄是满足如下关系: Xi-1<·Xi

Xi=·Xi+1=·…=·Xi+k Xi+k>·Xi+k+1

的最左子串XiXi+1…Xi+k。

416对于如下的文法G[〈变量说明〉]: 〈变量说明〉→VAR〈变量表〉:〈类型〉; 〈变量表〉→〈变量表〉,〈变量〉|〈变量〉 〈变量〉→i

〈类型〉→real|integer|boolean|char (1) 将G改造为等价的简单优先文法G′; (2) 求出G′的全部简单优先关系。

417试证明,任何算符文法不会有两个非终结符号相邻的句型。

418试证明,若G不是算符文法,则G至少有一个句型包含相邻的非终结符号。

419试构造这样的产生“简单算术表达式”的文法。此种表达式可含有+、-、*、/、↑等运算符,且以简单变量 (用变量标识符表示)作为运算对象,而上述运算符的优先顺序从高到低排列如下: +,- *,/ ↑

其中,排列在同一行的运算符有相同的优先级,同级的运算符服从右结合规则。 420对于算符文法G[S]: S→EE→E-T E→TT→T*F T→FF→-P F→PP→(E) P→i

(1) 构造G的算符优先矩阵;

(2) 指出G不是算符优先文法,即指出具有多重定义的优先矩阵元素; (3) 将G改写为算符优先文法。

421设G是一算符文法。试证明,在G的句型中,不含紧跟于非终结符号之后或直接居于非终结符号之前的短语,即证明如下两论断成立: (1) 若

α=…Ua…a∈VT, U∈VN

是G的一个句型,则α中任何含有a的短语也必包含U; (2) 若

α=…aU…a∈VT, U∈VN

是G的一个句型,则α中任何含有a的短语也必包含U。 422设G是算符文法,a,b∈VT,U∈VN,试证明:

(1) 若α=…aU…为G的句型,且U+b…,则有a○< b; (2) 若α=…Ub…为G的句型,且U+…a,则有a○> b。

423设G为算符文法,α=…aUb…或α=…ab…是G的一个句型 (a,b∈VT,U∈VN),则算符优先关系a○< b,a○= b或a○> b至少有一个成立。

424设G为算符文法,α是G中至少含有一个终结符号的句型,试证明,在符号串#α#中,必含有一个形如aβc的子串,使如下的关系成立: a○< b1○= b2○= … bn○> cn≥1

其中,a,c∈VT∪{#},而bi为β中的终结符号。

425设G为算符优先文法,α=…aUb…或α=…ab…是G的一个句型 (a,b∈VT,U∈VN),试证明,关系a○< b,a○= b或a○> b之中,必有且仅有一个成立。

426设G为算符优先文法,α=…aUb…或α=…ab…是G的一个句型 (a,b∈VT,U∈VN),试证明: (1) 若a○< b,则α中必有一个含有b但不包含a的短语; (2) 若a○= b,则α中每个含有a的短语也必包含b,反之亦然; (3) 若a○> b,则α中必有一个含有a但不包含b的短语。

427设G为算符优先文法,u是G的某一句型的短语,再设u中含有终结符号b1,b2,…,bn (n≥1),且满足bi○= bi+1 (1≤i≤n-1),试证明,u是该句型的一个素短语。

428设G为算符优先文法,α=…a0uan+1…是G的一个句型,其中a0,an+1∈VT,且u中含有终结符号a1,a2,…,an (n≥1),且满足: a0○< a1

ai○= ai+1(1≤i≤n-1) an○> an+1

试证明,u是α的一个素短语。

429设G为算符优先文法,α是G的一个句型,再设a0uan+1是符号串#α#的子串,且u中含有终结符号a1,a2,…,an (n≥1),试证明,若下列关系: a0○< a1

ai○= ai+1(1<i≤n-1) an○> an+1

成立,则u是α的一个素短语。

430试证明: 算符优先文法的每一句型或是一个单个非终结符号,或含有一个素短语。 431设已给文法G[E]: E→E+TE→T T→T*FT→F F→P↑FF→P P→(E)P→i

(1) 构造此文法的算符优先矩阵;

(2) 用Floyd方式将所得的优先矩阵线性化。 432用Floyd方法对下面的优先矩阵构造优先函数。

[]Z[]b[]M[]L[]a[]([])Zb[4]=·[6]<·[]<·M[3]=·[6]=·L[3]>·[6]>·a[3]>·[6]>·[8]=·([4]<·[]=·[]<·[]>·)[3]>·[6]>· 433对于算符文法: S→A[ ]A→[ A→aAA→B]

B→a

(1) 构造相应的优先矩阵; (2) 用Bell方法求出优先函数; (3) 检验此优先矩阵能否线性化。

434试用某种高级语言编写一个按简单优先分析方法进行语法分析的程序,此分析程序以给定的文法及相应的优先函数作为输入,并输入要分析的终结符号串;作为它的输出,则是这些非终结符号串是否为文法句子的信息。

435对于下列的文法,试分别构造它们的LR(0)项目集规范族及识别全部活前缀的DFA。 (1)S→aSbS→aSc S→ab

(2) S→cAS→ccB A→cAA→a B→ccBB→b

(3) S→aSSbS→aSSS S→c (4)S→AA→Ab A→a

436对于习题435中的各文法,判别哪些是LR(0)文法,并对它们构造相应的LR(0)分析表。 437判断下面的文法是哪一类LR文法,并构造LR分析表。 S→(SRS→a R→,SRR→)

438下列文法是否为SLR(1)文法?若是,构造相应的SLR(1)分析表,若不是,则阐明其理由。 (1) S→SabS→bR R→SR→a (2)S→aSABS→BA A→aAA→B B→b

(3)S→aSbS→bSa S→ab (4)S→aAS→bB A→cAdA→ε B→cBddB→ε

(5) 〈程序〉→〈分程序〉 〈程序〉→〈复合语句〉

〈分程序〉→〈分程序首部〉;〈复合尾部〉 〈分程序首部〉→begin D

〈分程序首部〉→〈分程序首部〉;D 〈复合尾部〉→Send

〈复合尾部〉→S;〈复合尾部〉 〈复合语句〉→begin〈复合尾部〉

(6) 〈程序〉→begin 〈说明表〉〈语句表〉end 〈说明表〉→〈说明表〉d;

〈说明表〉→ε

〈语句表〉→〈语句表〉;〈语句〉 〈语句表〉→〈语句〉 〈语句〉→S 〈语句〉→ε

439对如下的文法分别构造LR(0)及SLR(1)分析表,并比较两者的异同。 S→AAdS→cAd S→bA→ASc A→SbA→cd A→a

440对于文法 S→AA→BA A→εB→aB B→b

(1) 构造LR(1)分析表;

(2) 给出用LR(1)分析表对输入符号串abab的分析过程。

441对于如下的文法,构造LR(1)项目集族,并判断它们是否为LR(1)文法。 (1)S→AA→AB A→εB→aB B→b

(2) E→E+TE→T T→(E)T→a

442下列文法是否为LR(1)文法?若不是,能否将它们改写为等价的LR(1)文法。 (1) E→E+EE→E*E E→i

(2) S→aSaS→bSb S→aS→b

(3) S→V∶=ES→LS L→I:V→I

(4) 〈程序〉→begin〈说明表〉;〈语句表〉end 〈说明表〉→d;〈说明表〉 〈说明表〉→d

〈语句表〉→S;〈语句表〉 〈语句表〉→S

443试证明任何正规集均可由某一LR(1)文法产生。

444对于一个LR(0)文法G而言,如果我们采用SLR(1)分析表而不是采用LR(0)分析表进行语法分析,则对分析的有效性是否会带来一些好处?

445试证明,在LR分析表的GOTO子表中,所有形如GOTO(i,X)=ERROR的表元素都不会在分析过程中访问到。

446设已给文法G[S]: S→AaAbS→BbBa A→eB→ε

试证明G是LL(1)文法,但不是SLR(1)文法。 447设已给文法 (1) G1[S]: S→Aa|bAc|dc|bda A→d

(2) G2[S]: S→Aa|bAc|Bc|bBa A→d B→d

试证明: G1是LALR(1)文法但不是SLR(1)文法;G2是LR(1)文法但不是LALR(1)文法。 448试为如下的文法构造LALR(1)分析表。 E→E+T|T T→TF|F F→F*|a|b 上 机 实 习 题

(一) 对于如下的文法,试编写调试一个语法分析程序: 〈程序〉→PROGRAM〈标识符〉;〈分程序〉 〈分程序〉→〈变量说明〉BEGIN〈语句表〉END 〈变量说明〉→VAR〈变量说明表〉;

〈变量说明表〉→〈变量表〉:〈类型〉|〈变量表〉:〈类型〉;〈变量说明表〉 〈类型〉→INTEGER|REAL

〈变量表〉→〈变量〉|〈变量〉,〈变量表〉 〈语句表〉→〈语句〉|〈语句〉;〈语句表〉

〈语句〉→〈赋值语句〉|〈条件语句〉|〈WHILE语句〉|〈复合语句〉 〈赋值语句〉→〈变量〉∶=〈算术表达式〉

〈条件语句〉→IF〈关系表达式〉THEN〈语句〉ELSE〈语句〉 〈WHILE语句〉→WHILE〈关系表达式〉DO〈语句〉 〈复合语句〉→BEGIN〈语句表〉END

〈算术表达式〉→〈项〉|〈算术表达式〉+〈项〉|〈算术表达式〉-〈项〉 〈项〉→〈因式〉|〈项〉*〈因式〉|〈项〉/〈因式〉 〈因式〉→〈变量〉|〈常数〉|(〈算术表达式〉)

〈关系表达式〉→〈算术表达式〉〈关系符〉〈算术表达式〉 〈变量〉→〈标识符〉

〈标识符〉→〈标识符〉〈字母〉|〈标识符〉〈数字〉|〈字母〉 〈常数〉→〈整数〉|〈浮点数〉 〈整数〉→〈数字〉|〈数字〉〈整数〉 〈浮点数〉→·〈整数〉|〈整数〉·〈整数〉 〈关系符〉→<|<=|=|>|>=|<> 〈字母〉→A|B|C|…|X|Y|Z 〈数字〉→0|1|2|…|9 要求和提示:

(1) 可选择一种你感兴趣的语法分析方法 (算符优先、LL(1)、递归下降、SLR(1)等)作为编制语法分析

程序的依据;

(2) 对于所选定的分析方法,如有需要,应选择一种合适的数据结构,以构造所给文法的机内表示。 (二) 试编写一个程序,用来判定给定的文法是否为简单优先文法 (或算符优先文法)。 提示:

(1) 确定文法的机内表示方法;

(2) 分别编写计算布尔矩阵B>·,B=·及B<·的程序,为此,还需要编写一个计算布尔矩阵B的闭包B+的子程序,供计算上述各布尔矩阵时调用;

(3) 编制判定优先矩阵是否有多重定义元素的程序,用来判断所给文法是否为简单优先 (算符优先)文法;

(4) 要求输出各优先关系的布尔矩阵以及有关判定结果的信息。

(三) 试编写一个程序,用来计算给定文法的全部FIRST集及FOLLOW集,并判定所给文法是否为LL(1)文法。 要求:

(1) 以给定的文法作为输入 (为此,需确定文法的机内表示);

(2) 程序的输出是各FIRST及FOLLOW集,以及所给文法是否为LL(1)文法等信息。

第四章习题参考答案

?

1.解:

(1)S→(S)Z21|()Z21|[S]Z31|[]Z31 A→(S)Z22|()Z22|[S]Z32|[]Z32 B→(S)Z23|()Z23|[S]Z33|[]Z33 Z11→ε|AZ11|BZ21

Z12→AZ12|BZ22Z13→AZ13|BZ23 Z21→Z11Z22→ε|Z12 Z23→Z13Z31→Z21 Z32→Z22Z33→ε|Z23

(2)S→bZ11|aZ21A→bZ12|aZ22

Z11→ε| AZ21Z12→AZ22Z21→SZ21Z22→ε|SZ22 (3)S→(T)Z11 | aZ11 | Z11S→(T)Z12 | aZ12 | Z12 Z11→ε| Z21Z12→Z22Z21→,SZ21Z22→ε|,SZ22

? S

2.解:

AbB1,1.1(表示第1步,用产生式1.1推导,以下同) CAbbB2,2.1 edAbbB3,4.1 edCAbbB4,2.1 ededAbbbB5,4.1

edaAbbbB5,4.2 (不符合,改写第5步,用4.2) edBfbbB4,2.2 edCSdfbbB5,3.1 ededSdfbbB6,4.1 edaSdfbbB6,4.2 eddfbbB5,3.2 eddfbbCSd6,3.1 eddfbbedSd7,4.1 eddfbbaSd7,4.2 eddfbbd6,3.2 ?

3.解:以下Save表示save token_pointer value, Restore表示restore token_pointer value。

(1)文法没有左递归。 Function P:boolean; Begin Save; P:=true;

If next_token=”begin” then

If next_token=’d’ then If next_token=’;’ then If X then

If next_token=”end” then return; Restore; P:=false; End;

Function X:boolean; Begin Save; X:=true;

If next_token=’d’ then If next_token=’;’ then If X then return; Restore;

If next_token=’s’ then If Y then return; Restore; X:=false; End;

Function Y:boolean; Begin Save;

Y=true;

If next_token=’;’ then If next_token=’s’ then If Y then return; Restore; End;

(2)消去文法左递归,并记为:

P→begin S endS→A|CA→V:=EC→ if E then S E→VE’E’ →+VE’|εV→I Function P:boolean; Begin Save; P:=true;

If next_token=”begin” then If S then

If next_token=”end” then return;; Restore; P:=false; End;

Function A:boolean; Beign Save; A:=true;

If V then

If next_token=”:=” then If E then return; Restore; A:=flase; End;

Function S:boolean; Beign Save; S:=true;

If A then return; Restore;

If C then return; Restore; S:=false; End;

Function C:boolean; Begin Save; C:=true;

If next_token=”if” then If E then

If next_token=”then” then

If S then return; Restore; C:=false; End;

Function E:boolean; Begin Save; E:=true; If V then

If Ep then return; Restore; E:=false; End;

Function Ep:boolean; Being Save; Ep:=true;

If next_token=’+’ then If V then

If E’ then return; Return; End;

?

4.解:

? ?

5.证:因为是左递归文法,所以必存在左递归的非终结符A,及形如A→α|β的产生式,且αT* Ad.

则first(Ad) ∩first(β)≠φ,从而

first(α) ∩first(β)≠φ,即文法不满足LL(1)文法条件。得证。

?

6.证:LL(1)文法的分析句子过程的每一步,永远只有唯一的分析动作可进行。现在,假设LL(1)文法G是二义性文法,则存在句子α,它有两个不同的语法树。即存在着句子α有两个不同的最左推导。从而可知,用LL(1)方法进行句子α的分析过程中的某步中,存在两种不同的产生式替换,且均能正确进行语法分析,即LL(1)分析动作存在不确定性。与LL(1)性质矛盾。所以,G不是LL(1)文法。 ?

7.解:

(1)D产生式两个候选式fD和f的first集交集不为空,所以不是LL(1)的。 (2)此文法具有左递归性,据第5题结论,不是LL(1)的。

?

8.解:

(1)消除左递归性,得:

S→bZ11|aZ21A→bZ12|aZ22Z11→bZ11|εZ12→bZ12 Z21→bZ11|aZ21Z22→bZ12|aZ22|ε

消除无用产生式得:S→bZ11|aZ21Z11→bZ11|εZ21→bZ11|aZ21 此文法已满足LL(1)文法的三个条件,

所以 G’[S]: S→bZ11|aZ21Z11→bZ11|εZ21→bZ11|aZ21 (2) G’文法的各非终结符的FIRST 集和FOLLOW集:

产生式 S→bZ11 →aZ21 Z11→bZ11 →ε Z21→bZ11 →aZ21

LL(1)分析表为: S Z11 Z21

? (1)

产生式 S→SaB →bB A→S →a B→Ac a aZ21 aZ21 9.解:

FIRST 集 {b} {a} {b} {ε} {b} {a}

FOLLOW集 {#}

{#}

{#}

b bZ11 bZ11 bZ11

# ε

first集 {b}

follow集 {#,a,c}

{b} {b}

{c}

{a} {a,b}

{#,a,c}

(2)将S→SaB | bB改写为S→bBS’,S’ →aBS’|ω,可验证,新文法是LL(1)的。

? ?

10.解:

1)为方便书写,记:<布尔表达式>为A,<布尔因子>为B,<布尔二次量>为C,<布尔初等量>为D,原文法可以简化为:

A→A∨B | B B→B∧C | CC→┐D | DD→(A) | true | false, 显然,文法含有左递归,消去后等价LL(1)文法为: A→BA’ A’ →∨BA’|ω B→CB’,

B’ →∧CB’|ωC→┐D|DD→(A)| true|false

(2)略

?

证:若LL(1)文法G有形如B→aAAb的产生式,且AT+ε及AT*ag,根据FIRST集FOLLOW集的构造算法可知,FIRST(A)中一切非ε加到FOLLOW(A)中,则a∈FOLLOW(A);又因为a∈FIRST(ag),所以两集合相交非空,因此,G不是LL(1)文法;与前提矛盾,假设不成立,得证。 ? (1) S A ( a) b S = = A = < = < ( = = < < < <

a > = < > >

> ) > > >> > b > >

不是简单优先文法。 (2)

S RT ( )∧ a, S > = R = T > ( < =< < < < ) > > ∧ > > a > > , < = < < < 是简单优先文法。 (3) S R (a , ) S = < < R > > ( = < < a > >

解:

, = < < ) > >

是简单优先文法。

o 首先消去无用产生式Z→E, Z→E+T

S Z T# i () S Z = = T > > # = < < < I > > ( = < < < ) > >

化简后的文法是简单优先文法;

?

S A / a

=

解:

S

<

< > >

> >

A

/ > =

= A >

A和/之间同时有关系=和<,所以不是简单优先文法;

?

提示:分析教材中给出的算法,选择一种合适的表示给定文法的方法(尽量简单),使得对文法的输入比较简单的同时(需要把输入转化为计算机语言表示,这种转化应该尽量简单),能够比较简单地构造3个基本关系矩阵(=,LEAD和LAST)。 ?

证明:设xjxj+1...xi是满足条件xj-1xi+1的最左子串。由=关系的定义,可知xjxj+1...xi必出现在某产生式的右部中。又因xj-1

解:为描述方便,用符号表示各非终结符:D=<变量说明>,L=<变量表>, V= <变量>,T=<类型>,a=VAR,则消去V,并采用分层法改写文法,得到:D→aW:T;W→LL→L,i|iT→r|n|b|c

其全部简单优先关系是:

D W T L a : ; , i

D

W =

T =

L <

a

: = > >

; = >

, = > >

i < =

r|n|b|c <

r|n|b|c

是简单优先文法。

?

证:设STna,我们对n用归纳法,证明a不含两个非终结符相邻情况。n=1时,STa,即S→a是文法的产生式,根据定义,它不含上述情况。设n=k时,上述结论成立,且设STkdAb,由归纳假设,A两侧必为终结符。我们再进行一步推导,得STkdAbTdub, 其中,A→u是文法中的产生式,由定义,u中不含两个非终结符相邻情况,从而dub两个非终结符相邻情况。得证。 ?

证:由于G不是算符文法,G中至少有一个产生式,其右部含有两个非终结符相邻的情况。不失一般性,设其形为U→xABy,x,y∈V*,由于文法不含无用产生式,则必存在含有U的句型dUb,即存在推导ST*dUbTdxAByb.得证。 ? ?

文法为:E→E↑A | AA→A*T | A/T | TT→T+V | T-V | VV→i | (E) 解:

(1)构造算符优先矩阵: - * ( ) i # > >

- < > < > < < > * > < > < < ( < < < = < ) > > > > I > > > > # < < < <

(2)在(-,-)、(-,*)和(*,-)处有多重定义元素,不是算符优先文法; (3)改写方法:

?

将E→E-T中的减号与F→-P中的赋值运算符强制规定优先关系;

? ?

或者将F-P中的赋值运算符改为别的符号来表示;

(1)证明:由设句型a =…Ua…中含a的短语不含U,即存在A,A=>*ay,则a可归约为a =…Ua…ü*…UA…=b,b是G的一个句型,这与G是算符文法矛盾,所以,a中含有a的短语必含U。

(2)的证明与(1)类似,略。

? ? ? ? ?

证:(1)对于a=…aU…是句型,必有ST*a(=…aU…) T+…ab….即在归约过程中,b先于a被归约,从而,a

证:(1) 用反证法。设没有短语包含b但是不包含a,则a,b一定同时位于某个短语中,从而必使得a,b同时位于同一产生式的右部,所以a=b,与G是算符优先文法(=与<不能并存)矛盾。

(2)、(3)类似可证。

?

证:只要证u中不含有除自身以外的素短语。设有这样的素短语存在,即存在bx···by是素短语,其中1by+1,与bx-1=bx及 by=by+1矛盾,得证。 ? ? ? ?

提示:根据27题的结论,只要证u是句型α的短语,根据=关系的定义容易知道u是句型α的素短语。

证:与28题的不同点只是a0,an+1可以是?#?,不影响结论。

证:设不能含有素短语,则只能是含有短语(不能含有终结符号),则该短语只能含有一个非终结符号,否则不符合算符文法定义,得证。 解:

(1)算符优先矩阵: + *↑ ( ) i # + > << < > < > * > >< < > < > ↑ > >< < > < > ( < << < = < ) > >> > > I > >> > > # < << < <

(2)用Floyd方法将优先矩阵线性化得到得的优先函数为: + * ↑ ( )i # F 3 5 5 1 77 1 G 2 4 6 6 16 1