Парсинг html

153 views
Skip to first unread message

forwo...@gmail.com

unread,
Mar 5, 2015, 12:21:32 PM3/5/15
to gola...@googlegroups.com
Хочу попробовать реализовать парсер на go, подскажите пожалуйста какими библиотеками можно пользоваться для этого?
В python есть замечательная библиотека типо lxml.html, что подобное есть в go? Так же хочется узнать если есть какие-то особые моменты, на которые нужно обратить внимание?

Mykhailo Tsiuptsiun

unread,
Mar 5, 2015, 12:29:00 PM3/5/15
to gola...@googlegroups.com

чт, 5 марта 2015 г. в 19:21, <forwo...@gmail.com>:
Хочу попробовать реализовать парсер на go, подскажите пожалуйста какими библиотеками можно пользоваться для этого?
В python есть замечательная библиотека типо lxml.html, что подобное есть в go? Так же хочется узнать если есть какие-то особые моменты, на которые нужно обратить внимание?

--
Вы получили это сообщение, поскольку подписаны на группу "Golang Russian".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес golang-ru+...@googlegroups.com.
Чтобы настроить другие параметры, перейдите по ссылке https://groups.google.com/d/optout.

Artem Kovardin

unread,
Mar 5, 2015, 12:39:30 PM3/5/15
to gola...@googlegroups.com
https://github.com/PuerkitoBio/goquery не плох

четверг, 5 марта 2015 г., 20:21:32 UTC+3 пользователь forwo...@gmail.com написал:

Silent

unread,
Mar 6, 2015, 1:01:28 AM3/6/15
to gola...@googlegroups.com
Пользуюсь github.com/moovweb/gokogiri (A light libxml wrapper for Go): css/xpath-селекторы, шустрый, простой

forwo...@gmail.com

unread,
Mar 6, 2015, 3:15:02 AM3/6/15
to gola...@googlegroups.com
Silent Спасибо за наводку, обязательно этот вариант поизучаю

Artem Andreenko

unread,
Mar 6, 2015, 4:33:14 PM3/6/15
to gola...@googlegroups.com
Напрашивается бенчмарк этих трех пакетов.

2015-03-06 11:15 GMT+03:00 <forwo...@gmail.com>:
Silent Спасибо за наводку, обязательно этот вариант поизучаю

--

Silent

unread,
Mar 8, 2015, 3:11:22 AM3/8/15
to gola...@googlegroups.com, mio...@gmail.com
Напрашивается бенчмарк этих трех пакетов.

Есть бенч для
exp/html

код можно взять тут https://github.com/seriyps/html-parsers-benchmark - это результаты по статье http://habrahabr.ru/post/163979/, там же можно мнение народа почитать не только для го, но и для многих других языков
Reply all
Reply to author
Forward
0 new messages