Beautiful Soup, кодировка

 
0
 
Python
ava
Hayate | 02.08.2011, 19:37
Пытаюсь колупать страницу:

import urllib2
from BeautifulSoup import BeautifulSoup

page = urllib2.urlopen("http://www.profvibor.ru/node/4")
charset = page.info().getparam('charset')
print charset
#page = page.read().decode(charset)
#page = page.read()
soup = BeautifulSoup(page)
print soup.originalEncoding

print soup.find('a')


И что не делаю с encode и decode, вывод всегда один:


C:\Users\Егор\Desktop>test2.py
utf-8
utf-8
<a href="/" title="╨У╨╗╨░╨▓╨╜╨░╤П"><img src="/themes/acquia_marina/logo.png" alt
="╨У╨╗╨░╨▓╨╜╨░╤П" /></a>

C:\Users\Егор\Desktop>

C:\Users\Егор\Desktop>


Как правильно надо делать, чтобы вывод был читаемый?
Kommentare (2)
ava
Daevaorn | 07.08.2011, 08:39 #
Какая у вас кодировка терминала?
ava
Hayate | 08.08.2011, 12:37 #
Действительно, в этом проблема и была, уже разобрался. =)
Registrieren Sie sich oder melden Sie sich an, um schreiben zu können.
Unternehmen des Tages
Вы также можете добавить свою фирму в каталог IT-фирм, и публиковать статьи, новости, вакансии и другую информацию от имени фирмы.
Подробнее
Mitwirkende
advanced
Absenden