labwc/src/theme/xbm/tokenize.c

/*
 * XBM file tokenizer
 *
 * Copyright Johan Malm 2020
 */

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#include "theme/xbm/tokenize.h"

static char *current_buffer_position;
static struct token *tokens;
static int nr_tokens, alloc_tokens;

static void add_token(enum token_type token_type)
{
	if (nr_tokens == alloc_tokens) {
		alloc_tokens = (alloc_tokens + 16) * 2;
		tokens = realloc(tokens, alloc_tokens * sizeof(struct token));
	}
	struct token *token = tokens + nr_tokens;
	memset(token, 0, sizeof(*token));
	nr_tokens++;
	token->type = token_type;
}

static void get_identifier_token()
{
	struct token *token = tokens + nr_tokens - 1;
	token->name[token->pos] = current_buffer_position[0];
	token->pos++;
	if (token->pos == MAX_TOKEN_SIZE - 1)
		return;
	current_buffer_position++;
	switch (current_buffer_position[0]) {
	case '\0':
		return;
	case 'a' ... 'z':
	case 'A' ... 'Z':
	case '0' ... '9':
	case '_':
	case '#':
		get_identifier_token();
		break;
	default:
		break;
	}
}

static void get_number_token()
{
	struct token *token = tokens + nr_tokens - 1;
	token->name[token->pos] = current_buffer_position[0];
	token->pos++;
	if (token->pos == MAX_TOKEN_SIZE - 1)
		return;
	current_buffer_position++;
	switch (current_buffer_position[0]) {
	case '\0':
		return;
	case '0' ... '9':
	case 'a' ... 'f':
	case 'A' ... 'F':
	case 'x':
		get_number_token();
		break;
	default:
		break;
	}
}

static void get_special_char_token()
{
	struct token *token = tokens + nr_tokens - 1;
	token->name[0] = current_buffer_position[0];
	current_buffer_position++;
}

struct token *xbm_tokenize(char *buffer)
{
	current_buffer_position = buffer;

	for (;;) {
		switch (current_buffer_position[0]) {
		case '\0':
			goto out;
		case 'a' ... 'z':
		case 'A' ... 'Z':
		case '_':
		case '#':
			add_token(TOKEN_IDENT);
			get_identifier_token();
			continue;
		case '0' ... '9':
			add_token(TOKEN_INT);
			get_number_token();
			continue;
		case '{':
			add_token(TOKEN_SPECIAL);
			get_special_char_token();
			continue;
		default:
			break;
		}
		++current_buffer_position;
	}
out:
	add_token(TOKEN_NONE); /* vector end marker */
	return tokens;
}
Render window close button 2020-06-29 19:27:59 +01:00			`/*`
			`* XBM file tokenizer`
			`*`
			`* Copyright Johan Malm 2020`
			`*/`

Add src/theme/xbm/tokenize.c 2020-06-22 19:03:02 +01:00			`#include <stdio.h>`
			`#include <stdlib.h>`
			`#include <string.h>`

Render window close button 2020-06-29 19:27:59 +01:00			`#include "theme/xbm/tokenize.h"`
Add src/theme/xbm/tokenize.c 2020-06-22 19:03:02 +01:00
			`static char *current_buffer_position;`
			`static struct token *tokens;`
			`static int nr_tokens, alloc_tokens;`

			`static void add_token(enum token_type token_type)`
			`{`
			`if (nr_tokens == alloc_tokens) {`
			`alloc_tokens = (alloc_tokens + 16) * 2;`
			`tokens = realloc(tokens, alloc_tokens * sizeof(struct token));`
			`}`
			`struct token *token = tokens + nr_tokens;`
			`memset(token, 0, sizeof(*token));`
			`nr_tokens++;`
			`token->type = token_type;`
			`}`

			`static void get_identifier_token()`
			`{`
			`struct token *token = tokens + nr_tokens - 1;`
			`token->name[token->pos] = current_buffer_position[0];`
			`token->pos++;`
			`if (token->pos == MAX_TOKEN_SIZE - 1)`
			`return;`
			`current_buffer_position++;`
			`switch (current_buffer_position[0]) {`
			`case '\0':`
			`return;`
Add src/theme/xbm/parse.c 2020-06-23 07:17:07 +01:00			`case 'a' ... 'z':`
			`case 'A' ... 'Z':`
			`case '0' ... '9':`
Add src/theme/xbm/tokenize.c 2020-06-22 19:03:02 +01:00			`case '_':`
			`case '#':`
			`get_identifier_token();`
			`break;`
			`default:`
			`break;`
			`}`
			`}`

			`static void get_number_token()`
			`{`
			`struct token *token = tokens + nr_tokens - 1;`
			`token->name[token->pos] = current_buffer_position[0];`
			`token->pos++;`
			`if (token->pos == MAX_TOKEN_SIZE - 1)`
			`return;`
			`current_buffer_position++;`
			`switch (current_buffer_position[0]) {`
			`case '\0':`
			`return;`
Add src/theme/xbm/parse.c 2020-06-23 07:17:07 +01:00			`case '0' ... '9':`
			`case 'a' ... 'f':`
			`case 'A' ... 'F':`
Add src/theme/xbm/tokenize.c 2020-06-22 19:03:02 +01:00			`case 'x':`
			`get_number_token();`
			`break;`
			`default:`
			`break;`
			`}`
			`}`

			`static void get_special_char_token()`
			`{`
			`struct token *token = tokens + nr_tokens - 1;`
			`token->name[0] = current_buffer_position[0];`
			`current_buffer_position++;`
			`}`

Add src/theme/xbm/parse.c 2020-06-23 07:17:07 +01:00			`struct token xbm_tokenize(char buffer)`
Add src/theme/xbm/tokenize.c 2020-06-22 19:03:02 +01:00			`{`
			`current_buffer_position = buffer;`

			`for (;;) {`
			`switch (current_buffer_position[0]) {`
			`case '\0':`
			`goto out;`
Add src/theme/xbm/parse.c 2020-06-23 07:17:07 +01:00			`case 'a' ... 'z':`
			`case 'A' ... 'Z':`
Add src/theme/xbm/tokenize.c 2020-06-22 19:03:02 +01:00			`case '_':`
			`case '#':`
			`add_token(TOKEN_IDENT);`
			`get_identifier_token();`
			`continue;`
Add src/theme/xbm/parse.c 2020-06-23 07:17:07 +01:00			`case '0' ... '9':`
Add src/theme/xbm/tokenize.c 2020-06-22 19:03:02 +01:00			`add_token(TOKEN_INT);`
			`get_number_token();`
			`continue;`
			`case '{':`
			`add_token(TOKEN_SPECIAL);`
			`get_special_char_token();`
			`continue;`
			`default:`
			`break;`
			`}`
			`++current_buffer_position;`
			`}`
			`out:`
			`add_token(TOKEN_NONE); /* vector end marker */`
			`return tokens;`
			`}`