[Python] 파이썬으로 맞춤법 검사를 할 수 있다고?

2020. 12. 2. 18:42PYTHON

 

자연어 처리를 하다보면 맞춤법이 맞지 않아 곤란을 겪는 경우가 있습니다. 저 또한 현재 맞춤법이 잘못되어 단어의 수가 늘어났습니다. 이런 문제점을 해소하기 위해 이번 글은 파이썬으로 맞춤법 검사를 할 수 있는 코드를 가져왔습니다. 

 

 

네이버 맞춤법 검사기를 사용하여 문법을 교정해보겠습니다. urlopen함수 내 링크는 어디서 확인할 수 있냐구요? 개발자도구>Network 탭을 통해 어디서 요청을 보내는지 확인해보았습니다. 요청 방식은 GET 방식으로 되어있기 때문에 URL 뒤에 파라미터를 입력하는 방식으로 검사를 진행합니다.

 

 

 

아래는 참고 코드입니다. 

 

글을 입력받으면 html에 검사가 된 값이 출력되기 때문에 html의 값을 가져와서 return하는 함수를 생성합니다.

 

import json
import urllib
from bs4 import BeautifulSoup

def spellchecker(q):

    params = urllib.parse.urlencode({
        "_callback": "",
        "q": q
    })
    
    # 네이버 맞춤법 검사기 사용하여 문법 교정 
    data = urllib.request.urlopen("https://m.search.naver.com/p/csearch/ocontent/spellchecker.nhn?" + params)
    data = data.read().decode("utf-8")[1:-2]
    data = json.loads(data)
    data = data["message"]["result"]["html"]
    data = BeautifulSoup(data, "html.parser").getText()
    
    return data

 

728x90

'PYTHON' 카테고리의 다른 글

locals()와 globals() 차이  (0) 2020.05.01
두 개의 리스트를 딕셔너리로 만들기  (0) 2020.03.01