본문 바로가기
블로거성장기

[블로그용어] URL/크롤링/색인 알고보면 쉽다.

by 율러버 2020. 5. 30.
[블로그용어] URL/크롤링/색인 알고보면 쉽다.


티스토리블로그를 시작하고 누구나 하는 관례처럼 네이버에도, 구글에도 제 티스토리블로그를 등록&사이트맵제출을 했습니다. 구글서치콘솔의 페이지에는 제가 모르는 용어들이 너무나 많더군요. 

저는 컴알못에 쌩초보블로거니까요.

그래서 모르는 단어의 뜻을 찾아 공부하고 정리하여 기록하고자 합니다. 구글서치콘솔의 보고서에 있는 몇가지 단어의 뜻을 정리하고, 뜻을 이해해서 블로그운영을 잘하고자 함이 목적입니다.

저처럼 평소 인터넷검색은 잘하지만 컴퓨터관련 용어는 잘 모르는 분들, 블로그 막 입문하신 분들께 도움이 되었으면 좋겠습니다. 구글서치콘솔의 첫 페이지에서 [개요]에 들어가시면 [실적/색인생성범위/개선사항] 세가지로 크게 나뉘어 각각의 [보고서열기]가 있습니다. 먼저 <실적> 보고서를 열어봅니다.

저는 이제 막 구글에 등록하여 실적이 전혀 없는 것으로 나타납니다. 당연하다면서 일단 패쓰.

그런데 [색인생성범위]를 보니 딱 봐도 뭔가 문제가 있어보입니다.

저는 일단 [색인생성]이라는 용어의 의미도 모르지만, 저기 있는 '제외됨'은 확실히 느낌이 옵니다. 뭐가 잘못되었구나하고 말이죠

그래서 [제외됨]회색칸을 클릭해보니 그 밑에 상세정보가 나옵니다.

저 위에서 일단 파악할 수 있는 것은 내 티스토리블로그에서 3가지 유형으로 각 5,5,3개의 페이지에 오류가 있구나를 감지합니다. 저 3가지 각각의 유형의 뜻을 저는 알지 못하지만요.

일단 오류가 있다고 하니 해결해야 함이 맞는 것이니 저는 제가 이해하지 못하는 용어들을 공부해봅니다.

"발견되었는데 색인이 생성되지 않은건 뭔가?"
"크롤링되었는데 현재 색인이 생성되지 않음은 뭔가?"
"적절한 표준태그가 포함된 대체페이지"는 뭔가?

머리가 아파오지만,계속 블로그를 운영할거라면 알아야만 한다고 생각했습니다. 찾아보니 구글서치콘솔에서 이렇게 안내가 되어있더군요.(초보자분들께 잠시 머리아픔 예고)


크롤링됨 - 현재 색인이 생성되지 않음: Google에서 페이지를 크롤링했지만 색인이 생성되지는 않았습니다. 이후에 색인이 생성될 수도 있고 생성되지 않을 수도 있습니다. 크롤링을 위해 이 URL을 다시 제출할 필요는 없습니다.


발견됨 - 현재 색인이 생성되지 않음: Google에서 페이지를 발견했지만 페이지가 아직 크롤링되지 않았습니다. 일반적으로 Google은 URL을 크롤링하려고 했지만 사이트가 과부하 상태이기 때문에 Google에서 크롤링 일정을 변경했습니다. 그렇기 때문에 보고서에 마지막 크롤링 날짜가 비어 있는 것입니다.

적절한 표준 태그가 포함된 대체 페이지: 이 페이지는 Google에서 표준으로 인식하는 페이지의 중복 페이지입니다. 이 페이지는 표준 페이지로 올바르게 연결되므로 별도의 조치는 필요 없습니다.


여러분들은 이해가 잘 되시나요? 저는 읽고서 무슨 소리야하며 이해안됨을 한탄했지만, 한가지 다행인 것은 바로 세번째 오류 [적절한 표준태그가 포함된 대체페이지]는 별도의 조치가 필요없다고 하는 것이네요. 아무튼 
저는 이걸 읽고 더 머리가 아팠습니다. 왜냐하면 설명에서 [크롤링], [색인], [URL] 이런 용어는 컴알못인 저에게는 너무나 어렵게만 느껴지니까요. 요즘 젊은 사람들은 이정도쯤은 다 알려나 모르겠네요. 용어의 뜻을 알아봤습니다. 


1.URL
Unoform Reseurce Locators의 약자, 인터넷상에 존재하는 각 콘텐츠의 주소 혹은 위치

2.크롤링
신규 또는 업데이트된 웹페이지를 찾는 프로세스로서 검색엔진로봇이 웹에서 수많은 웹페이지들을 발견하고 검토하는 과정을 크롤링이라 한다. 크롤링을 한 후 검섹엔진의 데이터베이스에 저장한다. 

3.색인생성
크롤링을 통해 발견한 웹페이지들을 데이터베이스에 저장하는 행위를 색인(Index)라고 한다. 그 이후에 자체알고리즘을 이용해서 사용자가 어떤 검색어를 입력했을때 그 검색어에 적합하다고 생각하는 색인결과를 보여주는 것이다. 이것은 SEO(검색엔진최적화-검색엔진에서 찾기 쉽도록 사이트를 개선하는 프로세스)의 가장 기본적인 부분이다. 


알아본 뜻을 제가 이해한 바로는 이렇습니다.
"내가 블로그에 글을 쓰면 구글에서 그 페이지 즉, 해당 URL를 발견하고 검토해야한다.  내 블로그 URL 을 크롤링해야 한다. 구글에서 내가 작성한 블로그 글을 데이터베이스에 저장해야하는데, 색인이 생성되지 않았다는 뜻은 아직 데이터베이스에 저장되어 있지않다는 뜻으로 내 블로그글은 검색노출이 되지않는다. 색인이 생성되지 않은 것은 색인생성을 해야 다른 사람에게 내 글이 보여질 수 있다.그렇다면 색인생성은 어떻게 하지?"

정리하고 보니 너무나 간단하네요. URL정도는 알았어야 하는거 아닌가 싶어요. 이제 제가 이해한 내용을 바탕으로, 처음부분에 언급한 [색인생성범위]에 나타난 오류들을 해결하고자 합니다. 내용이 길어져 구글서치콘솔 보고서에 있는 [색인생성범위 제외됨 해결방법]는 다음포스팅에 바로 올리도록 할게요.

♥도움이 되셨다면 좋아요/구독해주시고 댓글도 남겨주세요. 큰 힘이 됩니다♥


댓글