99f2f96b20690d4282cfdbb1e4865e7f2a53d805
[YACASL2.git] / src / assemble.c
1 #include <stdio.h>
2 #include <stdlib.h>
3 #include <string.h>
4 #include <ctype.h>
5 #include <assert.h>
6
7 #include "assemble.h"
8 #include "cerr.h"
9
10 /**
11  * アセンブルモード: src, label, onlylabel, asdetail, onlyassemble
12  */
13 ASMODE asmode = {false, false, false, false, false};
14
15 /**
16  * アセンブル時の、現在およびリテラルのアドレスとプログラム入口名: ptr, lptr, prog
17  */
18 ASPTR *asptr;
19
20 /**
21  * アセンブルのエラー定義
22  */
23 static CERR cerr_assemble[] = {
24     { 106, "operand mismatch in assemble command" },
25     { 107, "no label in START" },
26     { 108, "not command of operand \"r\"" },
27     { 109, "not command of operand \"r1,r2\"" },
28     { 110, "not command of operand \"r,adr[,x]\"" },
29     { 111, "not command of operand \"adr[,x]\"" },
30     { 112, "not command of no operand" },
31     { 113, "operand too many in COMET II command" },
32     { 119, "out of COMET II memory" },
33     { 120, "GR0 in operand x" },
34     { 122, "cannot create hash table" },
35     { 124, "more than one character in literal" },
36     { 125, "not GR in operand x" },
37 };
38
39 void printline(FILE *stream, const char *filename, int lineno, char *line);
40
41 WORD getadr(const char *prog, const char *str, PASS pass);
42
43 WORD getgr(const char *str, bool is_x);
44
45 WORD getliteral(const char *str, PASS pass);
46
47 void writememory(WORD word, WORD adr, PASS pass);
48
49 void writestr(const char *str, bool literal, PASS pass);
50
51 void writedc(const char *str, PASS pass);
52
53 void assemble_start(const CMDLINE *cmdl, PASS pass);
54
55 void assemble_ds(const CMDLINE *cmdl, PASS pass);
56
57 void assemble_end(const CMDLINE *cmdl, PASS pass);
58
59 void assemble_dc(const CMDLINE *cmdl, PASS pass);
60
61 bool assemble_ascmd(const CMDLINE *cmdl, PASS pass);
62
63 void assemble_in(const CMDLINE *cmdl, PASS pass);
64
65 void assemble_out(const CMDLINE *cmdl, PASS pass);
66
67 void assemble_rpush(const CMDLINE *cmdl, PASS pass);
68
69 void assemble_rpop(const CMDLINE *cmdl, PASS pass);
70
71 bool assemble_macrocmd(const CMDLINE *cmdl, PASS pass);
72
73 bool assemble_cometcmd(const CMDLINE *cmdl, PASS pass);
74
75 bool assembletok(const CMDLINE *cmdl, PASS pass);
76
77 bool assembleline(const char *line, PASS pass);
78
79 /**
80  * アセンブルのエラーをエラーリストに追加
81  */
82 void addcerrlist_assemble()
83 {
84     addcerrlist_tok();
85     addcerrlist_word();
86     addcerrlist_label();
87     addcerrlist(ARRAYSIZE(cerr_assemble), cerr_assemble);
88 }
89
90 /**
91  * ファイルストリームの現在行を番号付きで表示する
92  */
93 void printline(FILE *stream, const char *filename, int lineno, char *line)
94 {
95     fprintf(stream, "%s:%5d:%s", filename, lineno, line);
96 }
97
98 /**
99  * アドレスを返す
100  * アドレスには、リテラル/10進定数/16進定数/アドレス定数が含まれる
101  */
102 WORD getadr(const char *prog, const char *str, PASS pass)
103 {
104     WORD adr = 0x0;
105
106     if(*str == '=') {
107         adr = getliteral(str, pass);
108     } else if(isdigit(*str) || *str == '-' || *str == '#') {
109         adr = nh2word(str);
110     } else {
111         if(pass == SECOND && (adr = getlabel(prog, str)) == 0xFFFF) {
112             if(prog != NULL) {
113                 setcerr(103, str);    /* label not found */
114             }
115         }
116     }
117     return adr;
118 }
119
120 /**
121  * 汎用レジスタを表す文字列「GR[0-7]」から、レジスタ番号[0-7]をWORD値で返す
122  * 文字列が汎用レジスタを表さない場合は、0xFFFFを返す
123  * is_xがtrueの場合は指標レジスタ。GR0が指定された場合は、COMET IIの仕様によりエラー発生
124  */
125 WORD getgr(const char *str, bool is_x)
126 {
127     assert(str != NULL);
128     WORD r;
129
130     /* 「GR[0-7]」以外の文字列では、0xFFFFを返して終了 */
131     if(!(strlen(str) == 3 && strncmp(str, "GR", 2) == 0 &&
132          (*(str+2) >= '0' && *(str+2) <= '0' + (GRSIZE - 1))))
133     {
134         return 0xFFFF;
135     }
136     r = (WORD)(*(str+2) - '0');
137     /* GR0は指標レジスタとして用いることができない */
138     if(is_x == true && r == 0x0) {
139         setcerr(120, NULL);    /* GR0 in operand x */
140         return 0x0;
141     }
142     return r;
143 }
144
145 /**
146  * 定数の前に等号(=)をつけて記述されるリテラルを返す
147  * リテラルには、10進定数/16進定数/文字定数が含まれる
148  */
149 WORD getliteral(const char *str, PASS pass)
150 {
151     assert(*str == '=');
152     WORD adr = asptr->lptr;
153
154     if(*(++str) == '\'') {    /* 文字定数 */
155         writestr(str, true, pass);
156     } else {
157         writememory(nh2word(str), (asptr->lptr)++, pass);
158     }
159     return adr;
160 }
161
162 /**
163  * アドレス値をメモリに書き込む
164  */
165 void writememory(WORD word, WORD adr, PASS pass)
166 {
167     /* メモリオーバーの場合、エラー発生 */
168     if(adr >= sys->memsize) {
169         setcerr(119, word2n(adr));    /* out of COMET II memory */
170         return;
171     }
172     (sys->memory)[adr] = word;
173     if(pass == SECOND && asmode.asdetail == true) {
174         fprintf(stdout, "\t#%04X\t#%04X\n", adr, word);
175     }
176 }
177
178 /**
179  * 文字をメモリに書き込む
180  */
181 void writestr(const char *str, bool literal, PASS pass)
182 {
183     assert(*str == '\'');
184     const char *p = str + 1;
185     bool lw = false;
186
187     for(; ;) {
188         /* 閉じ「'」がないまま文字列が終了した場合 */
189         if(*p == '\0') {
190             setcerr(123, str);    /* unclosed quote */
191             break;
192         }
193         /* 「'」の場合、次の文字が「'」でない場合は正常終了 */
194         if(*p == '\'' && *(++p) != '\'') {
195             break;
196         } else if(literal == true && lw == true) {
197             setcerr(124, str);    /* more than one character in literal */
198             break;
199         }
200         /*リテラルの場合はリテラル領域に書込 */
201         if(literal == true) {
202             writememory(*(p++), (asptr->lptr)++, pass);
203             lw = true;
204         } else {
205             writememory(*(p++), (asptr->ptr)++, pass);
206         }
207     }
208 }
209
210 /**
211  * DC命令を書込
212  */
213 void writedc(const char *str, PASS pass)
214 {
215     WORD adr = 0x0;
216
217     if(*str == '\'') {
218         writestr(str, false, pass);
219     } else {
220         if(*str == '#' || isdigit(*str) || *str == '-') {
221             adr = nh2word(str);
222         } else {
223             if(pass == SECOND && (adr = getlabel(asptr->prog, str)) == 0xFFFF) {
224                 setcerr(103, str);    /* label not found */
225             }
226         }
227         writememory(adr, (asptr->ptr)++, pass);
228     }
229 }
230
231 /**
232  * アセンブル命令STARTの処理
233  */
234 void assemble_start(const CMDLINE *cmdl, PASS pass)
235 {
236     if(cmdl->opd->opdc > 1) {
237         setcerr(106, NULL);    /* operand count mismatch */
238         return;
239     }
240     if(cmdl->label == NULL) {
241         setcerr(107, NULL);    /* no label in START */
242         return;
243     }
244     /* プログラム名の設定 */
245     asptr->prog = strdup_chk(cmdl->label, "asptr.prog");
246     /* オペランドがある場合、実行開始アドレスを設定 */
247     if(pass == SECOND && cmdl->opd->opdv[0] != NULL) {
248         if((execptr->start = getlabel(asptr->prog, cmdl->opd->opdv[0])) == 0xFFFF) {
249             setcerr(103, cmdl->opd->opdv[0]);    /* label not found */
250         }
251     }
252 }
253
254 /**
255  * アセンブル命令ENDの処理
256  */
257 void assemble_end(const CMDLINE *cmdl, PASS pass)
258 {
259     if(cmdl->opd->opdc > 0) {
260         setcerr(106, NULL);    /* operand count mismatch */
261         return;
262     }
263     /* 1回目のアセンブルの場合は、リテラル領域開始アドレスを設定 */
264     if(pass == FIRST) {
265         asptr->lptr = asptr->ptr;
266     }
267     /* 2回目のアセンブルの場合は、リテラル領域終了アドレスを実行終了アドレスとして設定 */
268     else if(pass == SECOND) {
269         execptr->end = asptr->lptr;
270     }
271     FREE(asptr->prog);
272 }
273
274 /**
275  * アセンブル命令DSの処理
276  */
277 void assemble_ds(const CMDLINE *cmdl, PASS pass)
278 {
279     int i;
280     if(cmdl->opd->opdc != 1) {
281         setcerr(106, NULL);    /* operand count mismatch */
282         return;
283     }
284     for(i = 0; i < atoi(cmdl->opd->opdv[0]); i++) {
285         writememory(0x0, (asptr->ptr)++, pass);
286         if(cerr->num > 0) {
287             break;
288         }
289     }
290 }
291
292 /**
293  * アセンブル命令DCの処理
294  */
295 void assemble_dc(const CMDLINE *cmdl, PASS pass)
296 {
297     int i;
298     if(cmdl->opd->opdc == 0 || cmdl->opd->opdc >= OPDSIZE) {
299         setcerr(106, NULL);    /* operand count mismatch */
300         return;
301     }
302     for(i = 0; i < cmdl->opd->opdc; i++) {
303         writedc(cmdl->opd->opdv[i], pass);
304         if(cerr->num > 0) {
305             break;
306         }
307     }
308 }
309
310 /**
311  * アセンブラ命令を処理
312  * アセンブラ命令の場合はtrue、それ以外の場合はfalseを返す
313  * エラー発生時は、cerrを設定
314  */
315 bool assemble_ascmd(const CMDLINE *cmdl, PASS pass)
316 {
317     if(strcmp(cmdl->cmd, "START") == 0) {
318         assemble_start(cmdl, pass);
319     } else if(strcmp(cmdl->cmd, "END") == 0) {
320         assemble_end(cmdl, pass);
321     } else if(strcmp(cmdl->cmd, "DS") == 0) {
322         assemble_ds(cmdl, pass);
323     } else if(strcmp(cmdl->cmd, "DC") == 0) {
324         assemble_dc(cmdl, pass);
325     } else {
326         return false;
327     }
328     return true;
329 }
330
331 /**
332  * マクロ命令「IN IBUF,LEN」をアセンブル
333  *      PUSH 0,GR1
334  *      PUSH 0,GR2
335  *      LAD GR1,IBUF
336  *      LAD GR2,LEN
337  *      SVC 1
338  *      POP GR2
339  *      POP GR1
340  */
341 void assemble_in(const CMDLINE *cmdl, PASS pass)
342 {
343     char *line = malloc_chk(LINESIZE + 1, "assemble_in.line");
344     if(cmdl->opd->opdc == 0 || cmdl->opd->opdc > 2) {
345         setcerr(106, NULL);    /* operand count mismatch */
346         return;
347     }
348     assembleline("    PUSH 0,GR1", pass);
349     assembleline("    PUSH 0,GR2", pass);
350     sprintf(line, "    LAD GR1,%s", cmdl->opd->opdv[0]);
351     assembleline(line, pass);
352     sprintf(line, "    LAD GR2,%s", cmdl->opd->opdv[1]);
353     assembleline(line, pass);
354     assembleline("    SVC 1", pass);
355     assembleline("    POP GR2", pass);
356     assembleline("    POP GR1", pass);
357     FREE(line);
358 }
359
360 /**
361  *  マクロ命令「OUT OBUF,LEN」をアセンブル
362  *      PUSH 0,GR1
363  *      PUSH 0,GR2
364  *      LAD GR1,OBUF
365  *      LAD GR2,LEN
366  *      SVC 2
367  *      LAD GR1,=#A
368  *      LAD GR2,=1
369  *      SVC 2
370  *      POP GR2
371  *      POP GR1
372  */
373 void assemble_out(const CMDLINE *cmdl, PASS pass)
374 {
375     char *line = malloc_chk(LINESIZE + 1, "assemble_out.line");
376     if(cmdl->opd->opdc == 0 || cmdl->opd->opdc > 2) {
377         setcerr(106, NULL);    /* operand count mismatch */
378         return;
379     }
380     assembleline("    PUSH 0,GR1", pass);
381     assembleline("    PUSH 0,GR2", pass);
382     sprintf(line, "    LAD GR1,%s", cmdl->opd->opdv[0]);
383     assembleline(line, pass);
384     sprintf(line, "    LAD GR2,%s", cmdl->opd->opdv[1]);
385     assembleline(line, pass);
386     assembleline("    SVC 2", pass);
387     assembleline("    LAD GR1,=#A", pass);
388     assembleline("    LAD GR2,=1", pass);
389     assembleline("    SVC 2", pass);
390     assembleline("    POP GR2", pass);
391     assembleline("    POP GR1", pass);
392     FREE(line);
393 }
394
395 /** マクロ命令「RPUSH」をメモリに書き込む
396  *       PUSH 0,GR1
397  *       PUSH 0,GR2
398  *       PUSH 0,GR3
399  *       PUSH 0,GR4
400  *       PUSH 0,GR5
401  *       PUSH 0,GR6
402  *       PUSH 0,GR7
403  */
404 void assemble_rpush(const CMDLINE *cmdl, PASS pass)
405 {
406     int i;
407     char *line = malloc_chk(LINESIZE + 1, "assemble_rpush.line");
408     if(cmdl->opd->opdc > 0) {
409         setcerr(106, NULL);    /* operand count mismatch */
410         return;
411     }
412     for(i = 1; i <= GRSIZE-1; i++) {
413         sprintf(line, "    PUSH 0,GR%d", i);
414         assembleline(line, pass);
415     }
416     FREE(line);
417 }
418
419 /**
420  * マクロ命令「RPOP」をメモリに書き込む
421  *      POP GR7
422  *      POP GR6
423  *      POP GR5
424  *      POP GR4
425  *      POP GR3
426  *      POP GR3
427  *      POP GR2
428  *      POP GR1
429  */
430 void assemble_rpop(const CMDLINE *cmdl, PASS pass)
431 {
432     int i;
433     char *line = malloc_chk(LINESIZE + 1, "assemble_rpop.line");
434     if(cmdl->opd->opdc > 0) {
435         setcerr(106, NULL);    /* operand count mismatch */
436         return;
437     }
438     for(i = GRSIZE-1; i >= 1; i--) {
439         sprintf(line, "    POP GR%d", i);
440         assembleline(line, pass);
441     }
442     FREE(line);
443 }
444
445 /**
446  * assemble_macrocmd
447  * マクロ命令をアセンブル
448  * マクロ命令の場合はtrue、それ以外の場合はfalseを返す
449  * エラー発生時はcerrを設定
450  */
451 bool assemble_macrocmd(const CMDLINE *cmdl, PASS pass)
452 {
453     if(strcmp(cmdl->cmd, "IN") == 0) {
454         assemble_in(cmdl, pass);
455     } else if(strcmp(cmdl->cmd, "OUT") == 0) {
456         assemble_out(cmdl, pass);
457     } else if(strcmp(cmdl->cmd, "RPUSH") == 0) {
458         assemble_rpush(cmdl, pass);
459     } else if(strcmp(cmdl->cmd, "RPOP") == 0) {
460         assemble_rpop(cmdl, pass);
461     } else {
462         return false;
463     }
464     return true;
465 }
466
467 /**
468  * 機械語命令をアセンブル
469  * 成功した場合はtrue、失敗した場合はfalseを返す
470  */
471 bool assemble_cometcmd(const CMDLINE *cmdl, PASS pass)
472 {
473     WORD cmd, r_r1, x_r2, adr;
474
475     /* オペランドなし */
476     if(cmdl->opd->opdc == 0) {
477         if((cmd = getcmdcode(cmdl->cmd, NONE)) == 0xFFFF) {
478             setcerr(112, cmdl->cmd);    /* not command of no operand */
479             return false;
480         }
481         writememory(cmd, (asptr->ptr)++, pass);
482     }
483     /* 第1オペランドは汎用レジスタ */
484     else if((r_r1 = getgr(cmdl->opd->opdv[0], false)) != 0xFFFF) {
485         /* オペランド数1 */
486         if(cmdl->opd->opdc == 1) {
487             if((cmd = getcmdcode(cmdl->cmd, R_)) == 0xFFFF) {
488                 setcerr(108, cmdl->cmd);    /* not command of operand "r" */
489                 return false;
490             }
491             cmd |= (r_r1 << 4);
492             writememory(cmd, (asptr->ptr)++, pass);
493         }
494         /* オペランド数2。第2オペランドは汎用レジスタ */
495         else if(cmdl->opd->opdc == 2 && (x_r2 = getgr(cmdl->opd->opdv[1], false)) != 0xFFFF) {
496             if((cmd = getcmdcode(cmdl->cmd, R1_R2)) == 0xFFFF) {
497                 setcerr(109, cmdl->cmd);    /* not command of operand "r1,r2" */
498                 return false;
499             }
500             cmd |= ((r_r1 << 4) | x_r2);               /* 第1オペランド、第2オペランドともに汎用レジスタ */
501             /* メモリへの書き込み */
502             writememory(cmd, (asptr->ptr)++, pass);
503         }
504         /* オペランド数2または3 */
505         else if(cmdl->opd->opdc == 2 || cmdl->opd->opdc == 3) {
506             if((cmd = getcmdcode(cmdl->cmd, R_ADR_X)) == 0xFFFF) {
507                 setcerr(110, cmdl->cmd);    /* not command of operand "r,adr[,x]" */
508                 return false;
509             }
510             cmd |= (r_r1 << 4);                    /* 第1オペランドは汎用レジスタ */
511             /* オペランド数3の場合 */
512             if(cmdl->opd->opdc == 3) {             /* 第3オペランドは指標レジスタとして用いる汎用レジスタ */
513                 if((x_r2 = getgr(cmdl->opd->opdv[2], true)) == 0xFFFF) {
514                     setcerr(125, cmdl->cmd);    /* not GR in operand x */
515                     return false;
516                 }
517                 cmd |= x_r2;
518             }
519             adr = getadr(asptr->prog, cmdl->opd->opdv[1], pass); /* 第2オペランドはアドレス */
520             /* メモリへの書き込み */
521             writememory(cmd, (asptr->ptr)++, pass);
522             writememory(adr, (asptr->ptr)++, pass);
523         } else {
524             setcerr(113, cmdl->cmd);    /* operand too many in COMET II command */
525             return false;
526         }
527     }
528     /* オペランド数1または2。第1オペランドはアドレス */
529     else if(cmdl->opd->opdc == 1 || cmdl->opd->opdc == 2) {
530         if((cmd = getcmdcode(cmdl->cmd, ADR_X)) == 0xFFFF) {
531             setcerr(111, cmdl->cmd);    /* not command of operand "adr[,x]" */
532             return false;
533         }
534         /* オペランド数2の場合 */
535         if(cmdl->opd->opdc == 2) {             /* 第2オペランドは指標レジスタとして用いる汎用レジスタ */
536             x_r2 = getgr(cmdl->opd->opdv[1], true);
537             if(cerr->num > 0) {
538                 return false;
539             }
540             cmd |= x_r2;
541         }
542         /* CALLの場合はプログラムの入口名を表すラベルを取得 */
543         /* CALL以外の命令の場合と、プログラムの入口名を取得できない場合は、 */
544         /* 同一プログラム内のラベルを取得 */
545         if(pass == SECOND && cmd == 0x8000) {        /* CALL命令 */
546             adr = getlabel(NULL, cmdl->opd->opdv[0]);
547         }
548         if(cmd != 0x8000 || (pass == SECOND && adr == 0xFFFF)) {
549             adr = getadr(asptr->prog, cmdl->opd->opdv[0], pass);
550         }
551         /* メモリへの書き込み */
552         writememory(cmd, (asptr->ptr)++, pass);
553         writememory(adr, (asptr->ptr)++, pass);
554     }
555     return (cerr->num == 0) ? true : false;
556 }
557
558 /**
559  * トークンをアセンブル
560  */
561 bool assembletok(const CMDLINE *cmdl, PASS pass)
562 {
563     /* 命令がない場合 */
564     if(cmdl->cmd == NULL){
565         return true;
566     }
567     /* アセンブラ命令またはマクロ命令の書込 */
568     if(assemble_ascmd(cmdl, pass) == false && assemble_macrocmd(cmdl, pass) == false) {
569         /* 機械語命令の書込 */
570         if(assemble_cometcmd(cmdl, pass) == false) {
571             if(cerr->num == 0) {
572                 setcerr(113, cmdl->cmd);    /* operand too many in COMET II command */
573             }
574         }
575     }
576     return (cerr->num == 0) ? true : false;
577 }
578
579 /**
580  * 1行をアセンブル
581  * passが1の場合はラベルを登録し、2の場合はラベルからアドレスを読み込む
582  */
583 bool assembleline(const char *line, PASS pass)
584 {
585     CMDLINE *cmdl;
586     bool stat = true;
587     int i;
588
589     cmdl = linetok(line);
590     stat = (cerr->num == 0) ? true : false;
591     if(cmdl != NULL) {
592         if(stat == true) {
593             if(pass == FIRST && cmdl->label != NULL) {
594                 stat = addlabel(asptr->prog, cmdl->label, asptr->ptr);
595             }
596             if(stat == true) {
597                 stat = assembletok(cmdl, pass);
598             }
599             FREE(cmdl->label);
600         }
601         if(cmdl->opd != NULL) {
602             for(i = 0; i < cmdl->opd->opdc; i++) {
603                 FREE(cmdl->opd->opdv[i]);
604             }
605         }
606         FREE(cmdl->opd);
607         FREE(cmdl->cmd);
608     }
609     FREE(cmdl);
610     return stat;
611 }
612
613 /**
614  * 指定された名前のファイルをアセンブル
615  * アセンブル完了時はtrue、エラー発生時はfalseを返す
616  */
617 bool assemblefile(const char *file, PASS pass)
618 {
619     int lineno = 1;
620     char *line;
621     FILE *fp;
622
623     if((fp = fopen(file, "r")) == NULL) {
624         perror(file);
625         return false;
626     }
627     for(line = malloc_chk(LINESIZE + 1, "assemble.line"); fgets(line, LINESIZE, fp); lineno++) {
628         if((pass == FIRST && asmode.src == true) || (pass == SECOND && asmode.asdetail == true)) {
629             printline(stdout, file, lineno, line);
630         }
631         if(assembleline(line, pass) == false) {
632             break;
633         }
634     }
635     if(cerr->num > 0) {
636         fprintf(stderr, "Assemble error - %d: %s\n", cerr->num, cerr->msg);
637         printline(stderr, file, lineno, line);
638     }
639     FREE(line);
640     fclose(fp);
641     return (cerr->num == 0) ? true : false;
642 }
643
644 /**
645  * 引数で指定したファイルにアセンブル結果を書込
646  */
647 void outassemble(const char *file)
648 {
649     FILE *fp;
650
651     if((fp = fopen(file, "w")) == NULL) {
652         perror(file);
653         exit(-1);
654     }
655     fwrite(sys->memory, sizeof(WORD), execptr->end, fp);
656     fclose(fp);
657 }