457ca8f5f6f2ddb7a29e02ec573e4d3090e40288
[YACASL2.git] / src / token.c
1 #include <stdio.h>
2 #include <string.h>
3 #include "cerr.h"
4 #include "cmem.h"
5 #include "assemble.h"
6
7 /**
8  * @brief 「,」区切りの文字列から、オペランドのトークンを取得
9  *
10  * @return オペランドのトークン
11  *
12  * @param *str 「,」区切りの文字列
13  */
14 OPD *opdtok(const char *str);
15
16 /**
17  * @brief 行トークン取得のエラー定義
18  */
19 CERR cerr_linetok[] = {
20     { 104, "label length is too long" },
21     { 105, "no command in the line" },
22 };
23
24 /**
25  * @brief オペランドトークン取得のエラー定義
26  */
27 static CERR cerr_opdtok[] = {
28     { 117, "operand too many in DC" },
29     { 118, "operand length too long" },
30     { 121, "cannot get operand token" },
31     { 123, "unclosed quote" },
32 };
33
34 OPD *opdtok(const char *str)
35 {
36     OPD *opd = malloc_chk(sizeof(OPD), "opd");
37     char *p, *q, *r, *sepp;     /* pは文字列全体の先頭位置、qはトークンの先頭位置、rは文字の位置 */
38     int sepc = ',', rcnt = 0;
39     bool quoting = false;
40
41     opd->opdc = 0;
42     if(str == NULL) {
43         return opd;
44     }
45     p = q = r = strdup_chk(str, "opdtok.p");
46     do {
47         /* オペランド数が多すぎる場合はエラー */
48         if(opd->opdc >= OPDSIZE) {
49             setcerr(117, "");    /* operand is too many */
50             break;
51         }
52         /* 先頭が等号(=)の場合 */
53         if(r[0] == '=') {
54             r++;
55         }
56         /* 「'」の場合 */
57         if(r[0] == '\'') {
58             /* 「''」以外の場合はquote値を反転 */
59             if(r[1] != '\'' && !(q < r && r[-1] == '\'')) {
60                 quoting = !quoting;
61             }
62             /* 文字列の長さを数える。「'」の場合は数えない */
63             if(r[1] != '\'') {
64                 rcnt++;
65             }
66         }
67         if(quoting == true) {
68             /* 閉じ「'」がないまま文字列が終了した場合 */
69             if(!r[0]) {
70                 setcerr(123, str);    /* unclosed quote */
71                 break;
72             }
73             r++;
74         } else {
75             sepp = r + strcspn(r, ", ");
76             sepc = sepp[0];
77             strcpy(sepp, "");
78             if(!q[0]) {
79                 setcerr(121, "");    /* cannot get operand token */
80                 break;
81             }
82             if(strlen(q) - rcnt > OPDSIZE) {
83                 setcerr(118, "");    /* operand length too long */
84                 break;
85             }
86             opd->opdv[(++opd->opdc)-1] = strdup_chk(q, "opd.opdv[]");
87             q = r = sepp + 1;
88             rcnt = 0;
89         }
90     } while(sepc == ',');
91     FREE(p);
92     return opd;
93 }
94
95 /* assemble.hで定義された関数群 */
96 void addcerrlist_tok()
97 {
98     addcerrlist(ARRAYSIZE(cerr_linetok), cerr_linetok);
99     addcerrlist(ARRAYSIZE(cerr_opdtok), cerr_opdtok);
100 }
101
102 CMDLINE *linetok(const char *line)
103 {
104     char *tokens, *p, *sepp;
105     bool quoting = false;
106     CMDLINE *cmdl = NULL;
107
108     if(!line[0]) {
109         return NULL;
110     }
111     tokens = strdup_chk(line, "tokens");
112     /* コメントを削除 */
113     for(p = tokens; p[0]; p++) {
114         /* 「'」で囲まれた文字列の処理。「''」は無視 */
115         if(p[0] == '\'' && p[1] != '\'' && !(p > tokens && p[-1] == '\'')) {
116             quoting = !quoting;
117         } else if(quoting == false && p[0] == ';') {
118             strcpy(p, "");
119             break;
120         }
121     }
122     if(tokens[0] && tokens[0] != '\n') {
123         p = tokens;
124         cmdl = malloc_chk(sizeof(CMDLINE), "cmdl");
125         cmdl->label = malloc_chk(LABELSIZE + 1, "cmdl.label");
126         /* ラベルの取得。行の先頭が空白またはタブの場合、ラベルは空 */
127         if((sepp = p + strcspn(p, " \t\n")) == p){
128             strcpy(cmdl->label, "");
129         } else {        /* ラベルを取得 */
130             strcpy(sepp, "");
131             /* 文字列が長すぎる場合はエラー */
132             if(strlen(p) > LABELSIZE) {
133                 setcerr(104, p);    /* label length is too long */
134             } else {
135                 strcpy(cmdl->label, p);
136             }
137             p = sepp + 1;
138         }
139         /* ラベルと命令の間の空白をスキップ */
140         while(p[0] == ' ' || p[0] == '\t') {
141             p++;
142         }
143         /* 命令とオペランドの取得 */
144         if(!p[0] || p[0] == '\n') {        /* 命令がない場合は、終了 */
145             if(cmdl->label) {      /* ラベルが定義されていて命令がない場合はエラー */
146                 setcerr(105, "");    /* no command in the line */
147             }
148             FREE(cmdl->label);
149             FREE(cmdl);
150         } else {
151             /* 命令の取得 */
152             sepp = p + strcspn(p, " \t\n");
153             strcpy(sepp, "");
154             cmdl->cmd = strdup_chk(p, "cmdl.cmd");
155             p = sepp + 1;
156             /* 命令とオペランドの間の空白をスキップ */
157             while(p[0] == ' ' || p[0] == '\t') {
158                 p++;
159             }
160             /* 改行かタブまでの文字列を取得 */
161             /* 「'」で囲まれた文字列に含まれる場合があるため、空白は無視 */
162             if((sepp = p + strcspn(p, "\t\n")) > p) {
163                 strcpy(sepp, "");
164                 cmdl->opd = opdtok(p);
165             } else {
166                 cmdl->opd = malloc_chk(sizeof(OPD), "cmdl.opd");
167                 cmdl->opd->opdc = 0;
168             }
169         }
170     }
171     FREE(tokens);
172     return cmdl;
173 }