Un autocompletador de palabras simple diseñado para usarse en un shell

Aug 19 2020

Problema

Estoy escribiendo un shell simple, y quiero tener la característica de autocompletar que tiene bash cuando escribes parcialmente una palabra y luego presionas tab:

En este momento puede funcionar independientemente de un shell, pero tiene características que le permiten encontrar comandos en el sistema. Ejemplos:

>>> table = make_lookup_table_from(["hell", "water", "help", "air", "hello", "fire", "earth"])
>>> find_matching(table, "hel")
['hell', 'hello', 'help']


>>> table = make_lookup_table_from_path()

>>> find_matching(table, "gcc-")
['gcc-ar', 'gcc-ar-8', 'gcc-ar-9', 'gcc-nm', 'gcc-nm-8', 'gcc-nm-9', 'gcc-ranlib', 'gcc-ranlib-8', 'gcc-ranlib-9', 'gcc-8', 'gcc-9']

>>> find_matching(table, "pyth")
['python3.8', 'python3.8-config', 'python3', 'python3-qr', 'python3-futurize', 'python3-pasteurize', 'python3-tor-prompt', 'python3-config', 'python3-wsdump', 'python', 'python-argcomplete-check-easy-install-script', 'python-argcomplete-check-easy-install-script3', 'python-argcomplete-tcsh', 'python-argcomplete-tcsh3', 'python-config', 'python-faraday', 'python2-config', 'python2-futurize', 'python2-pasteurize', 'python2-pbr', 'python2', 'python2.7-config', 'python2.7']

Cómo funciona:

Cada palabra se coloca en un diccionario anidado letra por letra, luego termina con un carácter nulo para marcar el final de una palabra:

>>> make_lookup_table_from(["hell", "water", "help", "air", "hello", "fire", "earth"])
{'h': {'e': {'l': {'l': {'\x00': {}, 'o': {'\x00': {}}}, 'p': {'\x00': {}}}}}, 'w': {'a': {'t': {'e': {'r': {'\x00': {}}}}}}, 'a': {'i': {'r': {'\x00': {}}}}, 'f': {'i': {'r': {'e': {'\x00': {}}}}}, 'e': {'a': {'r': {'t': {'h': {'\x00': {}}}}}}}

Para hacer una búsqueda para encontrar coincidencias, se recorre el árbol hasta que se encuentra el sub-diccionario común, luego cada palabra se reconstruye de forma recursiva.

Atención:

Honestamente, he estado en la escuela enfocándome en otras cosas además del código, así que me he oxidado un poco. Estoy usando un par de técnicas menos que ideales, por lo que cualquier recomendación es bienvenida:

La función de búsqueda _extract_stringshace uso de la recursividad, porque parecía un problema doloroso de resolver iterativamente. Si me falta una forma alternativa obvia, agradecería cualquier consejo allí.
En la función recursiva, estoy usando cadenas para realizar un seguimiento de la palabra "hasta ahora" y pasando copias concatenadas a los niños para que las usen. Originalmente estaba usando listas para poder simplemente appendsin crear un nuevo objeto cada vez, pero compartir la lista mutable entre recurrentes resultó ser problemático. También estoy devolviendo solo las terminaciones de la función de búsqueda y luego reconstruyo la palabra completa en find_matching. Sin string +embargo, esto es necesario para cada cadena encontrada, lo cual no es genial.

En realidad, estas funciones se realizan sorprendentemente rápido. Iba a configurar un sistema de almacenamiento en caché, carga desde el disco al inicio para evitar la necesidad de reconstruir la tabla constantemente, pero es tan rápido que no parece que valga la pena. Como resultado, mis dos preocupaciones anteriores probablemente se incluyan en "optimizaciones prematuras", pero aún me gustaría recibir sugerencias sobre ellas o cualquier otra cosa, desde el estilo hasta otras mejores prácticas.

Un autocompletador de palabras simple diseñado para usarse en un shell

Problema

Cómo funciona:

Atención:

Código:

Respuestas

En general