Valgrindで判明したメモリーに関する問題を修正
[YACASL2.git] / src / assemble.c
1 #include <stdio.h>
2 #include <stdlib.h>
3 #include <string.h>
4 #include <ctype.h>
5 #include <assert.h>
6 #include <errno.h>
7
8 #include "assemble.h"
9 #include "cerr.h"
10
11 /**
12  * アセンブルモード: src, label, onlylabel, asdetail, onlyassemble
13  */
14 ASMODE asmode = {false, false, false, false, false};
15
16 /**
17  * アセンブル時の、現在およびリテラルのアドレスとプログラム入口名: ptr, lptr, prog
18  */
19 ASPTR *asptr;
20
21 /**
22  * アセンブルのエラー定義
23  */
24 static CERR cerr_assemble[] = {
25     { 106, "operand mismatch in CASL II command" },
26     { 107, "no label in START" },
27     { 108, "not command of operand \"r\"" },
28     { 109, "not command of operand \"r1,r2\"" },
29     { 110, "not command of operand \"r,adr[,x]\"" },
30     { 111, "not command of operand \"adr[,x]\"" },
31     { 112, "not command of no operand" },
32     { 113, "operand too many in COMET II command" },
33     { 119, "out of COMET II memory" },
34     { 120, "GR0 in operand x" },
35     { 122, "cannot create hash table" },
36     { 124, "more than one character in literal" },
37     { 125, "not GR in operand x" },
38 };
39
40 void printline(FILE *stream, const char *filename, int lineno, char *line);
41
42 WORD getadr(const char *prog, const char *str, PASS pass);
43
44 WORD getgr(const char *str, bool is_x);
45
46 WORD getliteral(const char *str, PASS pass);
47
48 void writememory(WORD word, WORD adr, PASS pass);
49
50 void writestr(const char *str, bool literal, PASS pass);
51
52 void writedc(const char *str, PASS pass);
53
54 void assemble_start(const CMDLINE *cmdl, PASS pass);
55
56 void assemble_ds(const CMDLINE *cmdl, PASS pass);
57
58 void assemble_end(const CMDLINE *cmdl, PASS pass);
59
60 void assemble_dc(const CMDLINE *cmdl, PASS pass);
61
62 void assemble_in(const CMDLINE *cmdl, PASS pass);
63
64 void assemble_out(const CMDLINE *cmdl, PASS pass);
65
66 void assemble_rpush(const CMDLINE *cmdl, PASS pass);
67
68 void assemble_rpop(const CMDLINE *cmdl, PASS pass);
69
70 bool casl2cmd(CMD *cmdtbl, const CMDLINE *cmdl, PASS pass);
71
72 bool assemble_comet2cmd(const CMDLINE *cmdl, PASS pass);
73
74 bool assembletok(const CMDLINE *cmdl, PASS pass);
75
76 bool assembleline(const char *line, PASS pass);
77
78 /**
79  * アセンブラ命令
80  */
81 static CMD ascmd[] = {
82     { "START", assemble_start },
83     { "END", assemble_end },
84     { "DS", assemble_ds },
85     { "DC", assemble_dc },
86     { "", NULL }
87 };
88
89 /**
90  * マクロ命令
91  */
92 static CMD macrocmd[] = {
93     { "OUT", assemble_out },
94     { "IN", assemble_in },
95     { "RPUSH", assemble_rpush },
96     { "RPOP", assemble_rpop },
97     { "", NULL }
98 };
99
100 /**
101  * アセンブルのエラーをエラーリストに追加
102  */
103 void addcerrlist_assemble()
104 {
105     addcerrlist_tok();
106     addcerrlist_word();
107     addcerrlist_label();
108     addcerrlist(ARRAYSIZE(cerr_assemble), cerr_assemble);
109 }
110
111 /**
112  * ファイルストリームの現在行を番号付きで表示する
113  */
114 void printline(FILE *stream, const char *filename, int lineno, char *line)
115 {
116     fprintf(stream, "%s:%5d:%s", filename, lineno, line);
117 }
118
119 /**
120  * アドレスを返す\n
121  * アドレスには、リテラル/10進定数/16進定数/アドレス定数が含まれる
122  */
123 WORD getadr(const char *prog, const char *str, PASS pass)
124 {
125     WORD adr = 0x0;
126
127     if(*str == '=') {
128         adr = getliteral(str, pass);
129     } else if(isdigit(*str) || *str == '-' || *str == '#') {
130         adr = nh2word(str);
131     } else {
132         if(pass == SECOND) {
133             if((adr = getlabel(prog, str)) == 0xFFFF) {
134                 setcerr(103, str);    /* label not found */
135             }
136         }
137     }
138     return adr;
139 }
140
141 /**
142  * 汎用レジスタを表す文字列 "GR[0-7]" から、レジスタ番号 [0-7] をWORD値で返す\n
143  * 文字列が汎用レジスタを表さない場合は、0xFFFFを返す\n
144  * is_xがtrueの場合は指標レジスタ。GR0が指定された場合は、COMET IIの仕様によりエラー発生
145  */
146 WORD getgr(const char *str, bool is_x)
147 {
148     WORD r;
149
150     /*  "GR[0-7]" 以外の文字列では、0xFFFFを返して終了 */
151     if(!(strlen(str) == 3 && strncmp(str, "GR", 2) == 0 &&
152          (*(str+2) >= '0' && *(str+2) <= '0' + (GRSIZE - 1))))
153     {
154         return 0xFFFF;
155     }
156     r = (WORD)(*(str+2) - '0');
157     /* GR0は指標レジスタとして用いることができない */
158     if(is_x == true && r == 0x0) {
159         setcerr(120, "");    /* GR0 in operand x */
160         return 0x0;
161     }
162     return r;
163 }
164
165 /**
166  * 定数の前に等号(=)をつけて記述されるリテラルを返す\n
167  * リテラルには、10進定数/16進定数/文字定数が含まれる
168  */
169 WORD getliteral(const char *str, PASS pass)
170 {
171     assert(*str == '=');
172     WORD adr = asptr->lptr;
173
174     if(*(++str) == '\'') {    /* 文字定数 */
175         writestr(str, true, pass);
176     } else {
177         writememory(nh2word(str), (asptr->lptr)++, pass);
178     }
179     return adr;
180 }
181
182 /**
183  * アドレス値をメモリに書き込む
184  */
185 void writememory(WORD word, WORD adr, PASS pass)
186 {
187     char *n;
188
189     /* メモリオーバーの場合、エラー発生 */
190     if(adr >= sys->memsize) {
191         setcerr(119, (n = word2n(adr)));    /* out of COMET II memory */
192         FREE(n)
193         return;
194     }
195     (sys->memory)[adr] = word;
196     if(pass == SECOND && asmode.asdetail == true) {
197         fprintf(stdout, "\t#%04X\t#%04X\n", adr, word);
198     }
199 }
200
201 /**
202  * 文字をメモリに書き込む
203  */
204 void writestr(const char *str, bool literal, PASS pass)
205 {
206     assert(*str == '\'');
207     const char *p = str + 1;
208     bool lw = false;
209
210     for(; ;) {
211         /* 閉じ「'」がないまま文字列が終了した場合 */
212         if(*p == '\0') {
213             setcerr(123, str);    /* unclosed quote */
214             break;
215         }
216         /* 「'」の場合、次の文字が「'」でない場合は正常終了 */
217         if(*p == '\'' && *(++p) != '\'') {
218             break;
219         } else if(literal == true && lw == true) {
220             setcerr(124, str);    /* more than one character in literal */
221             break;
222         }
223         /*リテラルの場合はリテラル領域に書込 */
224         if(literal == true) {
225             writememory(*(p++), (asptr->lptr)++, pass);
226             lw = true;
227         } else {
228             writememory(*(p++), (asptr->ptr)++, pass);
229         }
230     }
231 }
232
233 /**
234  * DC命令を書込
235  */
236 void writedc(const char *str, PASS pass)
237 {
238     WORD adr = 0x0;
239
240     if(*str == '\'') {
241         writestr(str, false, pass);
242     } else {
243         if(*str == '#' || isdigit(*str) || *str == '-') {
244             adr = nh2word(str);
245         } else {
246             if(pass == SECOND && (adr = getlabel(asptr->prog, str)) == 0xFFFF) {
247                 setcerr(103, str);    /* label not found */
248             }
249         }
250         writememory(adr, (asptr->ptr)++, pass);
251     }
252 }
253
254 /**
255  * アセンブラ命令STARTの処理
256  * \relates casl2cmd
257  */
258 void assemble_start(const CMDLINE *cmdl, PASS pass)
259 {
260     if(cmdl->opd->opdc > 1) {
261         setcerr(106, "");    /* operand count mismatch */
262         return;
263     }
264     if(*(cmdl->label) == '\0') {
265         setcerr(107, "");    /* no label in START */
266         return;
267     }
268     /* プログラム名の設定 */
269     strcpy(asptr->prog, cmdl->label);
270     /* オペランドがある場合、実行開始アドレスを設定 */
271     if(pass == SECOND && cmdl->opd->opdv[0] != NULL) {
272         if((execptr->start = getlabel(asptr->prog, cmdl->opd->opdv[0])) == 0xFFFF) {
273             setcerr(103, cmdl->opd->opdv[0]);    /* label not found */
274         }
275     }
276 }
277
278 /**
279  * アセンブラ命令ENDの処理
280  * \relates casl2cmd
281  */
282 void assemble_end(const CMDLINE *cmdl, PASS pass)
283 {
284     if(cmdl->opd->opdc > 0) {
285         setcerr(106, "");    /* operand count mismatch */
286         return;
287     }
288     /* 1回目のアセンブルの場合は、リテラル領域開始アドレスを設定 */
289     if(pass == FIRST) {
290         asptr->lptr = asptr->ptr;
291     }
292     /* 2回目のアセンブルの場合は、リテラル領域終了アドレスを実行終了アドレスとして設定 */
293     else if(pass == SECOND) {
294         execptr->end = asptr->lptr;
295     }
296     *(asptr->prog) = '\0';
297 }
298
299 /**
300  * アセンブラ命令DSの処理
301  * \relates casl2cmd
302  */
303 void assemble_ds(const CMDLINE *cmdl, PASS pass)
304 {
305     int i;
306     if(cmdl->opd->opdc != 1) {
307         setcerr(106, "");    /* operand count mismatch */
308         return;
309     }
310     for(i = 0; i < atoi(cmdl->opd->opdv[0]); i++) {
311         writememory(0x0, (asptr->ptr)++, pass);
312         if(cerr->num > 0) {
313             break;
314         }
315     }
316 }
317
318 /**
319  * アセンブラ命令DCの処理
320  * \relates casl2cmd
321  */
322 void assemble_dc(const CMDLINE *cmdl, PASS pass)
323 {
324     int i;
325     if(cmdl->opd->opdc == 0 || cmdl->opd->opdc >= OPDSIZE) {
326         setcerr(106, "");    /* operand count mismatch */
327         return;
328     }
329     for(i = 0; i < cmdl->opd->opdc; i++) {
330         writedc(cmdl->opd->opdv[i], pass);
331         if(cerr->num > 0) {
332             break;
333         }
334     }
335 }
336
337 /**
338  * マクロ命令 "IN IBUF,LEN" をアセンブル\n
339  * \code
340  *      PUSH 0,GR1
341  *      PUSH 0,GR2
342  *      LAD GR1,IBUF
343  *      LAD GR2,LEN
344  *      SVC 1
345  *      POP GR2
346  *      POP GR1
347  * \endcode
348  * \relates casl2cmd
349  */
350 void assemble_in(const CMDLINE *cmdl, PASS pass)
351 {
352     char *line = malloc_chk(LINESIZE + 1, "assemble_in.line");
353     if(cmdl->opd->opdc == 0 || cmdl->opd->opdc > 2) {
354         setcerr(106, "");    /* operand count mismatch */
355         return;
356     }
357     assembleline("    PUSH 0,GR1", pass);
358     assembleline("    PUSH 0,GR2", pass);
359     sprintf(line, "    LAD GR1,%s", cmdl->opd->opdv[0]);
360     assembleline(line, pass);
361     sprintf(line, "    LAD GR2,%s", cmdl->opd->opdv[1]);
362     assembleline(line, pass);
363     assembleline("    SVC 1", pass);
364     assembleline("    POP GR2", pass);
365     assembleline("    POP GR1", pass);
366     FREE(line);
367 }
368
369 /**
370  * マクロ命令 "OUT OBUF,LEN" をアセンブル\n
371  * \code
372  *      PUSH 0,GR1
373  *      PUSH 0,GR2
374  *      LAD GR1,OBUF
375  *      LAD GR2,LEN
376  *      SVC 2
377  *      LAD GR1,=#A
378  *      LAD GR2,=1
379  *      SVC 2
380  *      POP GR2
381  *      POP GR1
382  * \endcode
383  * \relates casl2cmd
384  */
385 void assemble_out(const CMDLINE *cmdl, PASS pass)
386 {
387     char *line = malloc_chk(LINESIZE + 1, "assemble_out.line");
388     if(cmdl->opd->opdc == 0 || cmdl->opd->opdc > 2) {
389         setcerr(106, "");    /* operand count mismatch */
390         return;
391     }
392     assembleline("    PUSH 0,GR1", pass);
393     assembleline("    PUSH 0,GR2", pass);
394     sprintf(line, "    LAD GR1,%s", cmdl->opd->opdv[0]);
395     assembleline(line, pass);
396     sprintf(line, "    LAD GR2,%s", cmdl->opd->opdv[1]);
397     assembleline(line, pass);
398     assembleline("    SVC 2", pass);
399     assembleline("    LAD GR1,=#A", pass);
400     assembleline("    LAD GR2,=1", pass);
401     assembleline("    SVC 2", pass);
402     assembleline("    POP GR2", pass);
403     assembleline("    POP GR1", pass);
404     FREE(line);
405 }
406
407 /**
408  * マクロ命令 "RPUSH" をメモリに書き込む
409  * \code
410  *       PUSH 0,GR1
411  *       PUSH 0,GR2
412  *       PUSH 0,GR3
413  *       PUSH 0,GR4
414  *       PUSH 0,GR5
415  *       PUSH 0,GR6
416  *       PUSH 0,GR7
417  * \endcode
418  * \relates casl2cmd
419  */
420 void assemble_rpush(const CMDLINE *cmdl, PASS pass)
421 {
422     int i;
423     char *line = malloc_chk(LINESIZE + 1, "assemble_rpush.line");
424     if(cmdl->opd->opdc > 0) {
425         setcerr(106, "");    /* operand count mismatch */
426         return;
427     }
428     for(i = 1; i <= GRSIZE-1; i++) {
429         sprintf(line, "    PUSH 0,GR%d", i);
430         assembleline(line, pass);
431     }
432     FREE(line);
433 }
434
435 /**
436  * マクロ命令 "RPOP" をメモリに書き込む\n
437  * \code
438  *      POP GR7
439  *      POP GR6
440  *      POP GR5
441  *      POP GR4
442  *      POP GR3
443  *      POP GR3
444  *      POP GR2
445  *      POP GR1
446  * \endcode
447  * \relates casl2cmd
448  */
449 void assemble_rpop(const CMDLINE *cmdl, PASS pass)
450 {
451     int i;
452     char *line = malloc_chk(LINESIZE + 1, "assemble_rpop.line");
453     if(cmdl->opd->opdc > 0) {
454         setcerr(106, "");    /* operand count mismatch */
455         return;
456     }
457     for(i = GRSIZE-1; i >= 1; i--) {
458         sprintf(line, "    POP GR%d", i);
459         assembleline(line, pass);
460     }
461     FREE(line);
462 }
463
464 /**
465  * アセンブラ言語CASL IIの命令を処理\n
466  * 命令が表で定義されている場合はtrue、それ以外の場合はfalseを返す\n
467  * エラー発生時は、cerrを設定\n
468  * 関数へのポインタで呼び出す関数は、Class Reference 参照
469  * \class casl2cmd
470  */
471 bool casl2cmd(CMD *cmdtbl, const CMDLINE *cmdl, PASS pass)
472 {
473     int i;
474     void (*cmdptr)();
475     for(i = 0; *(cmdtbl[i].name) != '\0'; i++) {
476         if(strcmp(cmdl->cmd, cmdtbl[i].name) == 0) {
477             cmdptr = cmdtbl[i].ptr;
478             (*cmdptr)(cmdl, pass);
479             return true;
480         }
481     }
482     return false;
483 }
484
485 /**
486  * システムCOMET IIの命令をアセンブル\n
487  * アセンブルに成功した場合はtrue、失敗した場合はfalseを返す
488  */
489 bool assemble_comet2cmd(const CMDLINE *cmdl, PASS pass)
490 {
491     WORD cmd, r_r1, x_r2, adr;
492
493     /* オペランドなし */
494     if(cmdl->opd->opdc == 0) {
495         if((cmd = getcmdcode(cmdl->cmd, NONE)) == 0xFFFF) {
496             setcerr(112, cmdl->cmd);    /* not command of no operand */
497             return false;
498         }
499         writememory(cmd, (asptr->ptr)++, pass);
500     }
501     /* 第1オペランドは汎用レジスタ */
502     else if((r_r1 = getgr(cmdl->opd->opdv[0], false)) != 0xFFFF) {
503         /* オペランド数1 */
504         if(cmdl->opd->opdc == 1) {
505             if((cmd = getcmdcode(cmdl->cmd, R_)) == 0xFFFF) {
506                 setcerr(108, cmdl->cmd);    /* not command of operand "r" */
507                 return false;
508             }
509             cmd |= (r_r1 << 4);
510             writememory(cmd, (asptr->ptr)++, pass);
511         }
512         /* オペランド数2。第2オペランドは汎用レジスタ */
513         else if(cmdl->opd->opdc == 2 && (x_r2 = getgr(cmdl->opd->opdv[1], false)) != 0xFFFF) {
514             if((cmd = getcmdcode(cmdl->cmd, R1_R2)) == 0xFFFF) {
515                 setcerr(109, cmdl->cmd);    /* not command of operand "r1,r2" */
516                 return false;
517             }
518             cmd |= ((r_r1 << 4) | x_r2);               /* 第1オペランド、第2オペランドともに汎用レジスタ */
519             /* メモリへの書き込み */
520             writememory(cmd, (asptr->ptr)++, pass);
521         }
522         /* オペランド数2または3 */
523         else if(cmdl->opd->opdc == 2 || cmdl->opd->opdc == 3) {
524             if((cmd = getcmdcode(cmdl->cmd, R_ADR_X)) == 0xFFFF) {
525                 setcerr(110, cmdl->cmd);    /* not command of operand "r,adr[,x]" */
526                 return false;
527             }
528             cmd |= (r_r1 << 4);                    /* 第1オペランドは汎用レジスタ */
529             /* オペランド数3の場合 */
530             if(cmdl->opd->opdc == 3) {             /* 第3オペランドは指標レジスタとして用いる汎用レジスタ */
531                 if((x_r2 = getgr(cmdl->opd->opdv[2], true)) == 0xFFFF) {
532                     setcerr(125, cmdl->cmd);    /* not GR in operand x */
533                     return false;
534                 }
535                 cmd |= x_r2;
536             }
537             adr = getadr(asptr->prog, cmdl->opd->opdv[1], pass); /* 第2オペランドはアドレス */
538             /* メモリへの書き込み */
539             writememory(cmd, (asptr->ptr)++, pass);
540             writememory(adr, (asptr->ptr)++, pass);
541         } else {
542             setcerr(113, cmdl->cmd);    /* operand too many in COMET II command */
543             return false;
544         }
545     }
546     /* オペランド数1または2。第1オペランドはアドレス */
547     else if(cmdl->opd->opdc == 1 || cmdl->opd->opdc == 2) {
548         if((cmd = getcmdcode(cmdl->cmd, ADR_X)) == 0xFFFF) {
549             setcerr(111, cmdl->cmd);    /* not command of operand "adr[,x]" */
550             return false;
551         }
552         /* オペランド数2の場合 */
553         if(cmdl->opd->opdc == 2) {             /* 第2オペランドは指標レジスタとして用いる汎用レジスタ */
554             x_r2 = getgr(cmdl->opd->opdv[1], true);
555             if(cerr->num > 0) {
556                 return false;
557             }
558             cmd |= x_r2;
559         }
560         /* CALLの場合はプログラムの入口名を表すラベルを取得 */
561         /* CALL以外の命令の場合と、プログラムの入口名を取得できない場合は、 */
562         /* 同一プログラム内のラベルを取得 */
563         if(pass == SECOND && cmd == 0x8000) {        /* CALL命令 */
564             adr = getlabel("", cmdl->opd->opdv[0]);
565         }
566         if(cmd != 0x8000 || (pass == SECOND && adr == 0xFFFF)) {
567             adr = getadr(asptr->prog, cmdl->opd->opdv[0], pass);
568         }
569         /* メモリへの書込 */
570         writememory(cmd, (asptr->ptr)++, pass);
571         writememory(adr, (asptr->ptr)++, pass);
572     }
573     return (cerr->num == 0) ? true : false;
574 }
575
576 /**
577  * トークンをアセンブル
578  */
579 bool assembletok(const CMDLINE *cmdl, PASS pass)
580 {
581     /* 命令がない場合 */
582     if(*(cmdl->cmd) == '\0') {
583         return true;
584     }
585     /* アセンブラ命令またはマクロ命令の書込 */
586     if(casl2cmd(ascmd, cmdl, pass) == false && casl2cmd(macrocmd, cmdl, pass) == false) {
587         /* 機械語命令の書込 */
588         if(assemble_comet2cmd(cmdl, pass) == false) {
589             if(cerr->num == 0) {
590                 setcerr(113, cmdl->cmd);    /* operand too many in COMET II command */
591             }
592         }
593     }
594     return (cerr->num == 0) ? true : false;
595 }
596
597 /**
598  * 1行をアセンブル\n
599  * passが1の場合はラベルを登録し、2の場合はラベルからアドレスを読み込む
600  */
601 bool assembleline(const char *line, PASS pass)
602 {
603     CMDLINE *cmdl;
604     bool stat = true;
605     int i;
606
607     cmdl = linetok(line);
608     stat = (cerr->num == 0) ? true : false;
609     if(cmdl != NULL) {
610         if(stat == true) {
611             if(pass == FIRST && *(cmdl->label) != '\0') {
612                 stat = addlabel(asptr->prog, cmdl->label, asptr->ptr);
613             }
614         }
615         if(stat == true) {
616             stat = assembletok(cmdl, pass);
617         }
618         FREE(cmdl->label);
619         if(cmdl->opd != NULL) {
620             for(i = 0; i < cmdl->opd->opdc; i++) {
621                 FREE(cmdl->opd->opdv[i]);
622             }
623         }
624         FREE(cmdl->opd);
625         FREE(cmdl->cmd);
626     }
627     FREE(cmdl);
628     return stat;
629 }
630
631 /**
632  * 指定された名前のファイルをアセンブル\n
633  * アセンブル完了時はtrue、エラー発生時はfalseを返す
634  */
635 bool assemblefile(const char *file, PASS pass)
636 {
637     int lineno = 1;
638     char *line;
639     FILE *fp;
640
641     if((fp = fopen(file, "r")) == NULL) {
642         cerr->num = errno;
643         perror(file);
644         return false;
645     }
646     for(line = malloc_chk(LINESIZE + 1, "assemble.line"); fgets(line, LINESIZE, fp); lineno++) {
647         if((pass == FIRST && asmode.src == true) || (pass == SECOND && asmode.asdetail == true)) {
648             printline(stdout, file, lineno, line);
649         }
650         if(assembleline(line, pass) == false) {
651             break;
652         }
653     }
654     if(cerr->num > 0) {
655         fprintf(stderr, "Assemble error - %d: %s\n", cerr->num, cerr->msg);
656         printline(stderr, file, lineno, line);
657     }
658     FREE(line);
659     fclose(fp);
660     return (cerr->num == 0) ? true : false;
661 }
662
663 /**
664  * 引数で指定したファイルにアセンブル結果を書込
665  */
666 void outassemble(const char *file)
667 {
668     FILE *fp;
669
670     if((fp = fopen(file, "w")) == NULL) {
671         perror(file);
672         exit(1);
673     }
674     fwrite(sys->memory, sizeof(WORD), execptr->end, fp);
675     fclose(fp);
676 }