Смена кодировки utf-8 на unicode у русских букв - C#
Формулировка задачи:
Здравствуйте!
Прошу помощи с перекодировкой строки вида "\u041f\u0440\u0438\u0435\u0442" в русские букафки.
Голову сломал, но в течении 5 часов ничего не смог найти... Одна особенность есть у текста: он приходит в нормализованном виде... На выходе должны получиться буквы "АА".
string utf8String = @"\u0410\u0410"; Encoding unicode = Encoding.Unicode; Encoding utf8 = Encoding.UTF8; byte[] utf8bytes = utf8.GetBytes(utf8String); byte[] unicodeBytes = Encoding.Convert(utf8, unicode, utf8bytes); char[] unicodeChars = new char[unicode.GetCharCount(unicodeBytes, 0, unicodeBytes.Length)]; unicode.GetChars(unicodeBytes, 0, unicodeBytes.Length, unicodeChars, 0); textBox1.Text = new string(unicodeChars);
Решение задачи: «Смена кодировки utf-8 на unicode у русских букв»
textual
Листинг программы
string s = "\u0410\u0410"; s = Regex.Replace(s, @"\\u([a-fA-F\d]{4})", m => ((char)Convert.ToInt32(m.Groups[0].Value, 16)).ToString());
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д