strip_casl2_commentの、''があるときの動作を修正
[YACASL2.git] / src / token.c
index 96ddcaa..22f33ba 100644 (file)
-#include "casl2.h"
-#include "assemble.h"
+#include "token.h"
+
+/**
+ * @brief 「,」区切りの文字列から、オペランドのトークンを取得
+ *
+ * @return オペランドのトークン
+ *
+ * @param *str 「,」区切りの文字列
+ */
+OPD *opdtok(const char *str);
+
+/**
+ * @brief 行トークン取得のエラー定義
+ */
+CERR cerr_linetok[] = {
+    { 104, "label length is too long" },
+    { 105, "no command in the line" },
+};
+
+/**
+ * @brief オペランドトークン取得のエラー定義
+ */
+static CERR cerr_opdtok[] = {
+    { 117, "operand too many in DC" },
+    { 118, "operand length too long" },
+    { 121, "cannot get operand token" },
+    { 123, "unclosed quote" },
+};
 
-/* 「,」区切りの文字列から、オペランドのトークンを取得 */
 OPD *opdtok(const char *str)
 {
-    OPD *opd = malloc(sizeof(OPD));
-    char *p, *q, *sepp;
-    int sepc = ',';
+    OPD *opd = malloc_chk(sizeof(OPD), "opd");
+    char *tok, *p, sepc = ',';
+    int i = 0, cnt_quote = 0;
     bool quoting = false;
 
     opd->opdc = 0;
-    if(str == NULL) {
+    if(!str || !str[0]) {
         return opd;
     }
-    p = q = strdup(str);
+    tok = p = strdup_chk(str, "opdtok.p");
     do {
         /* オペランド数が多すぎる場合はエラー */
         if(opd->opdc >= OPDSIZE) {
-            setcerr(117, str);    /* operand is too many */
+            setcerr(117, "");    /* operand is too many */
             break;
         }
-        /* 先頭が「=」の場合の処理 */
-        if(*q == '=') {
-            q++;
+        /* 先頭が等号(=)の場合 */
+        if(p[i] == '=') {
+            i++;
         }
-        /* 「'」で囲まれた文字列の処理。「''」は無視 */
-        if(*q == '\'' && *(q+1) != '\'' && !(p < q && *(q-1) == '\'')) {
-            quoting = !quoting;
+        /* 「'」の場合 */
+        if(p[i] == '\'') {
+            /* 「''」以外の場合はquote値を反転する */
+            if(p[i+1] != '\'' && (quoting == false || p[i-1] != '\'')) {
+                quoting = !quoting;
+            }
+            /* 「'」をカウントする。「''」の場合は1をカウント */
+            if(p[i+1] != '\'') {
+                cnt_quote++;
+            }
         }
         if(quoting == true) {
-            /* 閉じ「'」がないまま文字列が終了した場合 */
-            if(*q == '\0') {
-                setcerr(123, str);    /* illegal string */
+            /* 「'」で開いたまま文字列が終了した場合 */
+            if(!p[i]) {
+                setcerr(123, str);    /* unclosed quote */
                 break;
             }
-            q++;
+            i++;
         } else {
-            sepp = q + strcspn(q, ", ");
-            sepc = *sepp;
-            *sepp = '\0';
-            if(strlen(p) == 0) {
-                setcerr(121, NULL);    /* cannot get operand token */
+            i += strcspn(p + i, ", ");
+            if(i == 0) {
+                setcerr(121, "");    /* cannot get operand token */
                 break;
             }
-            if(strlen(p) > OPDSIZE + 2) {    /* OPDSIZE + 「'」2文字分 */
-                setcerr(118, p);    /* operand length is too long */
+            if(i - cnt_quote > OPDSIZE) {
+                setcerr(118, "");    /* operand length too long */
                 break;
             }
-            opd->opdv[(++opd->opdc)-1] = strdup(p);
-            p = q = sepp + 1;
+            sepc = p[i];
+            opd->opdv[(opd->opdc)++] = strndup_chk(p, i, "opd->opdv[]");
+            p += i + 1;
+            i = cnt_quote = 0;
         }
     } while(sepc == ',');
+    FREE(tok);
     return opd;
 }
 
-/* 空白またはタブで区切られた1行から、トークンを取得 */
-CMDLINE *linetok(const char *line)
+/* assemble.hで定義された関数群 */
+void addcerrlist_tok()
 {
-    char *tokens, *p, *sepp;
+    addcerrlist(ARRAYSIZE(cerr_linetok), cerr_linetok);
+    addcerrlist(ARRAYSIZE(cerr_opdtok), cerr_opdtok);
+}
+
+char *strip_casl2_comment(char *s)
+{
+    int i;
     bool quoting = false;
-    CMDLINE *cmdl = malloc(sizeof(CMDLINE));
 
-    if(line == NULL || strlen(line) == 0) {
-        return NULL;
-    }
-    tokens = strdup(line);
-    /* コメントを削除 */
-    for(p = tokens; *p != '\0'; p++) {
-        /* 「'」で囲まれた文字列の処理。「''」は無視 */
-        if(*p == '\'' && *(p+1) != '\'' && !(p > tokens && *(p-1) == '\'')) {
+    for(i = 0; s[i]; i++) {
+        /* 「'」で囲まれた文字列の場合。「''」は無視 */
+        if(s[i] == '\'' && s[i+1] != '\'' && (quoting == false || s[i-1] != '\'')) {
             quoting = !quoting;
-        } else if(quoting == false && *p == ';') {
-            *p = '\0';
+        /* 「'」で囲まれた文字列でない場合、文字列末尾の「;」以降を削除 */
+        } else if(quoting == false && s[i] == ';') {
+            s[i] = '\0';
             break;
         }
     }
-    if(*tokens == '\0') {
+    return s;
+}
+
+CMDLINE *linetok(const char *line)
+{
+    char *tok = NULL, *p = NULL;
+    int i;
+    CMDLINE *cmdl = NULL;
+
+    assert(line);
+    if(!line[0] || line[0] == '\n') {
         return NULL;
     }
-    p = tokens;
+    tok = p = strdup_chk(line, "tok");
+    /* コメントを削除 */
+    strip_casl2_comment(p);
+    /* 文字列末尾の改行と空白を削除 */
+    strip_end(p);
+    /* 空行の場合、終了 */
+    if(!p[0]) {
+        goto linetokfin;
+    }
+    cmdl = malloc_chk(sizeof(CMDLINE), "cmdl");
+
+    /* ラベルの取得 */
     /* 行の先頭が空白またはタブの場合、ラベルは空 */
-    if((sepp = p + strcspn(p, " \t\n")) == p){
-        cmdl->label = NULL;
-    } else {        /* ラベルを取得 */
-        *sepp = '\0';
-        /* 文字列が長すぎる場合はエラー */
-        if(strlen(p) > LABELSIZE) {
-            setcerr(104, p);    /* label length is too long */
+    if((i = strcspn(p, " \t")) == 0) {
+        cmdl->label = strdup_chk("", "cmdl->label");
+    } else {
+        cmdl->label = strndup_chk(p, i, "cmdl->label");
+        /* ラベルの文字列が長すぎる場合はエラー */
+        if(i > LABELSIZE) {
+            setcerr(104, cmdl->label);    /* label length is too long */
+            FREE(cmdl->label);
+            goto linetokfin;
         }
-        cmdl->label = strdup(p);
-        p = sepp + 1;
     }
-    while(*p == ' ' || *p == '\t') {
-        p++;
-    }
-    /* 命令がない場合、終了 */
-    if(*p == '\n' || *p == '\0') {
-        /* ラベルが定義されていて命令がない場合はエラー */
-        if(cmdl->label != NULL) {
-            setcerr(105, NULL);    /* no command in the line */
+
+    /* 命令の取得 */
+    /* 文字列先頭をラベルの次の文字に移動 */
+    p += i;
+    /* 文字列先頭を、ラベルと命令の間の空白の後ろに移動 */
+    p += strspn(p, " \t");
+    /* 命令がない場合は、終了 */
+    if(!p[0]) {
+        if(cmdl->label) {      /* ラベルが定義されていて命令がない場合はエラー */
+            setcerr(105, "");    /* no command in the line */
         }
-        return NULL;
-    }
-    /* 命令を取得 */
-    sepp = p + strcspn(p, " \t\n");
-    *sepp = '\0';
-    cmdl->cmd = strdup(p);
-    p = sepp + 1;
-    while(*p == ' ' || *p == '\t') {
-        p++;
-    }
-    /* オペランドを取得 */
-    cmdl->opd = malloc(sizeof(OPD));
-    /* 改行かタブまでの文字列を取得。
-       「'」で囲まれた文字列に含まれる場合があるため、空白は無視 */
-    if((sepp = p + strcspn(p, "\t\n")) > p) {
-        *sepp = '\0';
-        cmdl->opd = opdtok(p);
-    } else {
-        cmdl->opd->opdc = 0;
+        FREE(cmdl->label);
+        FREE(cmdl);
+        goto linetokfin;
     }
+    /* 命令取得の実行 */
+    i = strcspn(p, " \t");
+    cmdl->cmd = strndup_chk(p, i, "cmdl.cmd");
+
+    /* オペランドの取得 */
+    /* 文字列先頭を、命令の次の文字に移動 */
+    p += i;
+    /* 文字列先頭を、命令とオペランドの間の空白の後ろに移動 */
+    p += strspn(p, " \t");
+    /* オペランド取得の実行 */
+    cmdl->opd = opdtok(p);
+linetokfin:
+    FREE(tok);
     return cmdl;
 }