Qu'est-ce que -1 & -2 montré par IntelliJ Debugger dans une chaîne UTF8 et comment le supprimer? [dupliquer]
Lors de l'analyse de ma chaîne à partir d'un fichier sur Windows 10, j'ai en quelque sorte deux caractères qui ne sont pas supprimables par les coupes d'espaces blancs et autres.

Voici la preuve du coupable.
Cela fout un peu ma regex ^(\w+)
car il arrive qu'il y ait un espace blanc dedans. Quand je copie la valeur de la chaîne (capture d'écran) dans RegExr par exemple, je vois qu'un espace est ajouté - et c'est pourquoi mon regex fonctionnera en réseau.

J'ai déjà cherché sur Google -1 -2 in UTF-8 string
mais je n'ai rien trouvé et je suis donc très confus avec cela.
Réponses
Votre débogueur est idiot de les montrer respectivement -1 et -2, mais il est assez clair que vous avez affaire à la nomenclature UTF-16 (pas UTF-8 comme vous le prétendez dans la question, celle-ci est un 3 octets marqueur qui est complètement différent).
N'hésitez pas à vérifier leur présence et à les supprimer si vous les rencontrez au début d'un fichier, mais idéalement, vous devriez d'abord enregistrer votre fichier sans la nomenclature.