본문 바로가기

Selector2

[Crawling] 크롤링을 위해 필요한 필수 HTML 지식 이해하기! - (2) 웹페이지에서 데이터 찾기 크롤링을 처음 시작할 때 무턱대고 예시 코드만 보고 시작했다가 다른 사이트에서 크롤링을 시도하게 되면 자꾸 오류만 나고 헤매었던 경험, 크롤링 초보라면 낯설지 않을겁니다. HTML 기초 필수 지식을 익히신다면, 크롤링 예시 코드가 왜 그렇게 구성되어있나!! 하는 것들을 좀 더 잘 익히실 수 있을 겁니다. 실제로 크롤링을 활용해보고 싶은 초보 크롤러분들께 필요한 HTML 기초 필수 지식을 담았습니다. 웹페이지에서 데이터 찾기 지난 포스팅에서 언급한 바와 같이 데이터 수집(크롤링)은 우리가 원하는 내용을 감싸고있는 태그를 찾아 태그가 가지고 있는 데이터를 찾는 것입니다. 그러면 이제 웹페이지의 HTML 문서를 확인하여 문서에서 우리가 원하는 데이터를 찾기 위해, 데이터를 감싸고 있는 대그를 찾는 방법을 알아.. 2021. 5. 25.
[Crawling] 크롤링을 위해 필요한 필수 HTML 지식 이해하기! - (1) HTML이란? 크롤링을 처음 시작할 때 무턱대고 예시 코드만 보고 시작했다가 다른 사이트에서 크롤링을 시도하게 되면 자꾸 오류만 나고 헤매었던 경험, 크롤링 초보라면 낯설지 않을겁니다. 크롤링을 위해 필요한 필수 HTML 지식 이해하기! 포스팅을 따라가며 HTML 기초 필수 지식을 익히신다면, 크롤링 예시 코드가 왜 그렇게 구성되어있나!! 하는 것들을 좀 더 잘 익히실 수 있을 겁니다. 실제로 크롤링을 활용해보고 싶은 초보 크롤러분들께 필요한 HTML 기초 필수 지식을 담았습니다. HTML이란? 웹은 크게 다음의 세 가지로 구성됩니다 HTML은 웹의 뼈대를 구성하는 언어, CSS는 웹의 시각적인 표현을 담당하는 언어, JavaScript는 웹의 동적 처리를 담당하는 언어로, 크롤링을 하는 데에는 웹의 뼈대를 구성하는 .. 2021. 5. 24.
반응형