34 Comments

  • 민영

    혹시 Client ID랑 Client Secret 발급?해주는 창 계속 켜놔야되나요?
    그래서 그 창을 끄면 프로그램이 작동을 안하나요?

  • 마이더스

    혹시 ImportError: No module named 'requests' 이렇게 나오는데 cmd 에서 확인했는데 있다고 나오고
    어떻게 해결하는게 좋을까요?

  • 마이더스

    다른 파이썬 버전 다 지우고 다시 진행해도 같은 내용의 오류가 발생하네요 ㅜㅜ 한번 꼭해보고싶은데 검색해도 오류고칠수 있는 방법이 안나오네요 혹시 다른조치 할수 있는 방법없나요?

  • 안민철

    pip install requests 처음에 해도 설치가 되어있다떠도

    ModuleNotFoundError: No module named 'requests'
    계속 나와서
    어떻게 해야하나요

  • 서상우

    안녕하세요! 강의를 듣다가 뜨는 오류를 해결못해서

    urllib.error.HTTPError: HTTP Error 401: Unauthorized

    이 오류가 뜨는데 찾아보니 웹로그인 자격이 없다는거 같은데
    네이버에서 주는 오픈소스는 잘 작동하는데 ㅠㅠ 선생님 강의의 소스를 치면 오류가 납니다ㅠㅠ
    어떻게 해결해야 할까요 ㅠ 오타는 없습니다..

  • 승훈이

    죄송한데 질문하나해도 될까요?? 크롤링을 하는과정에서 웹사이트의 html을 가져왔습니다.

    html code를 find를 통해서 a 태그안의 href 의 url을 가져왔는데요.

    그곳으로 requests.get(url)을 해보니깐 접속이 되지 않더군요.

    직접 브라우저를 사용해서 접속하니깐 href에 써있는 url로 접속되는것이 아닌 다른 url로 접속이 되고있습니다.

    혹시 이런상황에서 바뀐 url을 가져올수있는 방법이 없을까요??

    감사합니다.

  • 박현준

    쿼리명대로 txt파일이 저장되긴하는데 스크랩이 되지않네요 ㅠㅠ 뭐가 문제일까요…

  • 예진

    안녕하세요, 공부하면서 따라해보고 있는데 get_blog_count 함수부분에서는 'lastBuildDate' 이나 'Total' 등 출력하는 부분에서 계속 keyerror 가 나고 get_blog_post 부분에서 response_body_dict['items'] 에 items에서 에러나는데 왜그런걸까요ㅡㅜ

  • 서우석

    안녕하세요.
    영상 보면서 크롤링을 공부중입니다. 그런데 파이썬에서 함수가 오류도 걸리지 않고 잘 돌아갑니다!
    근데.. 계속 같은 내용이 파싱되는데요.
    예를들면, 1-2-3-4-5-6-1-2-3-4-5-6 이런 식으로 계속 동일한 사이클에서 돌아갑니다ㅠㅠ
    혹시..왜그런건지 조언좀 구할 수 있을까요?ㅠㅠㅠ부탁드립니다ㅠㅠ

  • 문곰

    안녕하세요 강의 잘 봤습니다. 궁금한 점이 2가지 있는데요.
    첫째. HTTPError: HTTP Error 429: Too Many Requests에러가 발생합니다. 돌릴때마다 스크래핑 되는 개수는 다른데 왜 발생하며, 어떻게 해결하는지 궁금합니다.
    둘쨰. 스크래핑 결과를 보면 description에 블로그 내용 전문이 아닌 요약본이 보입니다. 전체 내용을 보고싶을땐 어떻게 해야할까요??
    감사합니다!!

  • 유진주

    정상적으로 txt파일까지 만들어지지만 txt파일을 열어보면 비어있습니다ㅜㅜㅜ 왜이럴까요ㅜㅜㅜ 에러도 안뜨네요,,

  • JEONGSEOK KIM

    불러오는 블로그 수도 1000까지고 다 잘되는데, 데이터가 21개 까지만 불러와지다가 멈추는 현상이 발생합니다..

    if _name_ == '__main__':
    no= 0
    query = 'bts'
    display = 10
    start = 1
    sort = "date"

    fs = open(query + ".txt",'a',encoding='utf-8')

    blog_count = get_blog_count(query,display)

    for start_index in range(start, blog_count +1,display):
    get_blog_post(query,display,start_index,sort)

    fs.close()

    문제가 어느부분인지 못찾겠습니다..ㅜ

  • 김혜연

    크롤링 할때 'div#postViewArea' 태그만 사용하면 크롤링이 되지 않는 사이트들이 몇개 있어서
    for selector in ['div#postViewArea','.post-view','.se-module','.se_textarea']:

    blog_post_contents = blog_post_soup.select(selector)

    if len(blog_post_contents) != 0:

    break
    처럼 select조건을 위 처럼 여러개로 두어도 되나요?

  • 안소현

    똑같이 해서 돌렸는데 마지막 if __name__== '__main__': 문구가 자꾸 에러로 'unexpected unindent' 가 뜨는데 어떻게 해결해야 하는걸까요ㅠㅠㅠ

  • 쉐인

    완성했습니다 ^^ 그런데 게임 시작하자마자 배경음악 나오게 하려면 어떻게 하면될까요..?… 게임 시작 화면 -> 스페이스바 누르는 부분이 있다면.. 어떻게 해볼텐데요 ㅠㅠ

  • 비전공자는 알아듣기가 조금힘드네요…..비전공자 배려해서 조금더 상세한 설명해주셨으면 합니다.

  • master rangers

    여기서 막혀서 한시간 째인데 왜이럴까요 ㅠㅠ

    ================= RESTART: C:/Users/J/Desktop/navertest.py =================

    Traceback (most recent call last):

    File "C:/Users/J/Desktop/navertest.py", line 62, in <module>

    blog_count = get_blog_count(query, display)

    File "C:/Users/J/Desktop/navertest.py", line 22, in get_blog_count

    response = urllib.request.urlopen(request)

    File "C:UsersJAppDataLocalProgramsPythonPython37-32liburllibrequest.py", line 222, in urlopen

    return opener.open(url, data, timeout)

    File "C:UsersJAppDataLocalProgramsPythonPython37-32liburllibrequest.py", line 531, in open

    response = meth(req, response)

    File "C:UsersJAppDataLocalProgramsPythonPython37-32liburllibrequest.py", line 641, in http_response

    'http', request, response, code, msg, hdrs)

    File "C:UsersJAppDataLocalProgramsPythonPython37-32liburllibrequest.py", line 569, in error

    return self._call_chain(*args)

    File "C:UsersJAppDataLocalProgramsPythonPython37-32liburllibrequest.py", line 503, in _call_chain

    result = func(*args)

    File "C:UsersJAppDataLocalProgramsPythonPython37-32liburllibrequest.py", line 649, in http_error_default

    raise HTTPError(req.full_url, code, msg, hdrs, fp)

    urllib.error.HTTPError: HTTP Error 401: Unauthorized

    >>>

  • J Na

    네이버 API 이용해서 블로그 내용까지 가져오는 방법을 꼭 알고 싶었습니다. 그러던 중 이 동영상은 정말 반가운 오아시스 같았습니다. ^^ 감사합니다~~ 그런데…….뭐가 잘 못된 것인지 실행하면 print로 나와야할 내용 중 제목과 링크만 나오고 디스크립션, 블로거 이름, 블로거 링크 등은 안나옵니다. 그리고 가장 중요한 블로그 본문 내용….검색어.txt 파일이 생성은 되는데 내용은 비어있습니다(0KB) .댓글들을 보면 저와 비슷한 결과가 블로그 형식이 업데이트 되서일 것이라는 내용도 있네요…..제가 궁금한 것은 저의 이런 결과가 제가 코딩 실수한 것 때문인지…이 코드가 네이버 업데이트 문제때문에 더 이상 실행이 안되는 것인지 알고 싶습니다. 답변 주시면 큰 도움될 것 같아요. 감사합니다~~!!

  • HAKSOO KIM

    와…. 취미삼아 컴퓨팅언어 해보려고 맛보기로 봤는데
    저렇게 길고 복잡한 걸 백지 상태에서 어떻게 구상하고 입력을 하시는거지…
    대단…

  • 신호선

    안녕하세요 스크래핑 예제를 한참 찾다가 결국 올려주신 내용을 보고 감탄을 내며 따라해보았습니다.
    너무 감사합니다~!!
    다른 검색어로 검색하다가 오류가 나서 질문드립니다.
    File "<ipython-input-7-1e9f44083a4e>", line 146, in <module>

    get_blog_post(query, display, start_index, sort)

    File "<ipython-input-7-1e9f44083a4e>", line 87, in get_blog_post

    response = urllib.request.urlopen(request)

    File "C:UsersUserDownloadsWPy-3661python-3.6.6.amd64liburllibrequest.py", line 223, in urlopen

    return opener.open(url, data, timeout)

    File "C:UsersUserDownloadsWPy-3661python-3.6.6.amd64liburllibrequest.py", line 532, in open

    response = meth(req, response)

    File "C:UsersUserDownloadsWPy-3661python-3.6.6.amd64liburllibrequest.py", line 642, in http_response

    'http', request, response, code, msg, hdrs)

    File "C:UsersUserDownloadsWPy-3661python-3.6.6.amd64liburllibrequest.py", line 570, in error

    return self._call_chain(*args)

    File "C:UsersUserDownloadsWPy-3661python-3.6.6.amd64liburllibrequest.py", line 504, in _call_chain

    result = func(*args)

    File "C:UsersUserDownloadsWPy-3661python-3.6.6.amd64liburllibrequest.py", line 650, in http_error_default

    raise HTTPError(req.full_url, code, msg, hdrs, fp)
    HTTPError: Internal Sercer Error

    이러합니다… 왜그런지 혹시 아시나요…?

  • tv쉽알남

    똑같이 잘 따라했고…
    에러없이 잘 작동하는데
    막상 결과물 txt 파일은 텅텅 비어있습니다.
    뭔가 … 잘못 한거 같은데 ㅠㅠ
    스스로 수정이 어렵네요 ㅠㅠ
    힘들게 영상 올려주셨는데 학생 수준이 딸려서 ㅠㅠ 못따라가는것이 아쉽습니다 ㅠㅠ

  • Noname Lee

    29:38 접속이 안되는지 영상처럼 200이 연속해서 뜨지는 않는데요 어디가 잘못 된걸까요? 영상중간중간에 실행한 건 다 괜찮았었어요

Leave a Reply

Your email address will not be published. Required fields are marked *