package main
import "fmt"import "regexp"import "net/http"import "io/ioutil"
func errorChecker(err error) {
if err != nil { panic(err)
}}
func main() { url := "http://mysite.ru/"
resp, err := http.Get(url) errorChecker(err) defer resp.Body.Close()
ht, err := ioutil.ReadAll(resp.Body) errorChecker(err) website := string(ht) fmt.Println(website)//примерный regexp pattern := `mytext\:\s([^\s]+)`
var validID = regexp.MustCompile(pattern) result := validID.FindAllString(website, -1)
//демонстрация результата for i := range result { fmt.Println(result[i]) }
}
--
Вы получили это сообщение, поскольку подписаны на группу "Golang Russian".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес golang-ru+...@googlegroups.com.
Чтобы настроить другие параметры, перейдите по ссылке https://groups.google.com/d/optout.
> Если ничего нативного нету, то не проблема, сфильтрую как-нибудь регекспами.
package main
import ( "fmt")
func main() { html := []byte(`<html> <head> </head> <body> <p>Lorem Ipsum is simply dummy text of the printing and typesetting industry.</p> <img src='lorem.jpg'/> <p>Lorem Ipsum has been the industry's standard dummy text ever since the 1500s, when an unknown printer took a galley of type and scrambled it to make a type specimen book.</p> <a href='#more'>More >></a> </body></html>`)
doc, _ := gokogiri.ParseHtml(html) fmt.Println(doc.Content()) doc.Free()}
package main
import ( "fmt" "strings")
func main() { html := `<html> <head> </head> <body> <p>Lorem Ipsum is simply dummy text of the printing and typesetting industry.</p> <img src='lorem.jpg'/> <p>Lorem Ipsum has been the industry's standard dummy text ever since the 1500s, when an unknown printer took a galley of type and scrambled it to make a type specimen book.</p> <a href='#more'>More >></a> </body></html>`
doc, _ := goquery.NewDocumentFromReader(strings.NewReader(html)) doc.Find("body").Each(func(i int, s *goquery.Selection) { fmt.Println(s.Text()) })}
> Если ничего нативного нету, то не проблема, сфильтрую как-нибудь регекспами.
Это самое последнее решение, что должно было придти в голову
>Текст нужно примерно как если бы мы на браузере нажали ctrl+a, ctrl+c и в notepad сделали ctrl+v. Далее уже есть понимание как что делать.мой совет использовать gokogiri пролетел мимо. повторюсь, уже с примером: