|
Возможна ли замена кодировки текста? |
☑ |
0
Garry1010
24.04.12
✎
14:20
|
Возможна ли замена кодировки текста? А именно: читаю данные HTML-файла, а там нужные данные (ЭлементHTML.ТекстовоеСодержимое) по-русски, но в кодировке UTF-8 (что очевидно). Мне их нужно хотя бы увидеть, а потом сохранить в базе. Как мне их привести в человеческую форму?
|
|
1
andrewks
24.04.12
✎
14:23
|
"по-русски, но в кодировке UTF-8 (что очевидно)" кому очевидно? почему очевидно?
и в чём конкретно проблема?
|
|
2
Wobland
24.04.12
✎
14:25
|
(0) человеческая форма - это почерком врача?
|
|
3
Garry1010
24.04.12
✎
14:30
|
Чего не понятно-то? Потому что обычно html-страницы имеют кодировку UTF-8 - там у них даже в заголовке так прописано. Проблема в том, что вьюер исходного кода показывает так: "<th style="">Место</th>" - а в 1С'е это получается так, что свойство ТекстовоеСодержимое содержит не буквы, дающие слово "Место", а 10 знаков (в кодировке UTF-8), изображающие чёрт-те что. Мне их нужно из чёрт-те чего превратить в слово "Место", чтобы оно именно так и выглядело и чтобы после загрузки в некий текстовый реквизит в базе 1С там хранилось то, что 1С видит СРАЗУ как слово "Место"!
|
|
4
nimoid
24.04.12
✎
14:55
|
>Потому что обычно html-страницы имеют кодировку UTF-8 - там у них даже в заголовке так прописано
вроде бы кои-8 и вин-1251 обычно.. но это не суть)
КодировкаИсточника у документаХТМЛ попробуй посмотри
|
|
5
Garry1010
24.04.12
✎
15:03
|
(4) А зачем смотреть? Чтобы узнать какая? - Я и так знаю; проблема не в этом.
|
|
6
nimoid
24.04.12
✎
15:10
|
а, ну да, там рид-онли..
многа кода? кидай посмотреть, может что найдем
|
|
7
Garry1010
24.04.12
✎
15:14
|
(6) А что кидать-то, html-страницу? :)
|
|
8
nimoid
24.04.12
✎
15:20
|
код твой парсера)
у тебя один (несколько) файл просто или с сайта надо постоянно тянуть?
если файл, можно просто конвертнуть в другую кодировку и не заморачиваться
|
|
9
Garry1010
24.04.12
✎
15:43
|
>файл, можно просто конвертнуть в другую кодировку и не заморачиваться
Хммм, это мысль! Да, у меня просто файл - мне так проще. Надеюсь, объекты типа ЭлементHTML не будут сверять реальную кодировку и ту, что в их заголовке.
|
|
10
nimoid
24.04.12
✎
15:52
|
ну ты после конвертации на всякий открой и поправь вот эту строчку
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
на
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
как-то так..
вообще странная фигня, почему кодировку не понимает..
|
|
11
Garry1010
27.04.12
✎
10:47
|
Короче, 1С сама в непонятках - пришлось писать свою функцию перекодировки.
|
|
Глупец, лишенный способности посмеяться над собой вместе с другими, не сможет долго выносить программирование. Фредерик Брукс-младший