• 목록
  • 아래로
  • 위로

아시다시피 카카오 REST API 중에 문자영역감지 기능이 있습니다.


https://developers.kakao.com/docs/restapi/vision#%EB%AC%B8%EC%9E%90-%EC%98%81%EC%97%AD-%EA%B0%90%EC%A7%80


간단히 설명드리면 이미지를 POST로 전송하면 문자영역을 감지하여 좌표값을 반환합니다.


즉 문자영역감지 API는 좌표값만 반환하고, 이를 다시 OCR API에 넣어줘야 인식한 문자열을 반환합니다.



카카오 문자영역감지 API를 테스트하기 위해 Wavve에서 고독한 미식가 영상의 한 장면을 캡쳐했습니다 ^^





다음과 같은 스크립트를 작성하여 카카오 API를 이용하여 문자영역을 감지하고, Pillow를 이용하여 감지한 영역을 빨간색 사각형으로 표시했습니다.


processing 함수는 제가 주먹구구식으로 대충 만든 것이라서 허접합니다 ㅠㅠ


import requests, json
from PIL import Image, ImageDraw

MYAPP_KEY = 'API 키를 입력하세요'

def detect_area(filename):
    API_URL = 'https://kapi.kakao.com/v1/vision/text/detect'
    headers = {'Authorization': 'KakaoAK {}'.format(MYAPP_KEY)}
    try:
        files = { 'file' : open(filename, 'rb')}
        resp = requests.post(url=API_URL, headers=headers, files=files)
        resp.raise_for_status()
        result = resp.json()['result']['boxes']
        return result
    except Exception as e:
        print(str(e))

def processing(file, box_list):
    im = Image.open(file)
    draw = ImageDraw.Draw(im)
    for box in box_list:
        for a in range(0, 4):
            if a <= 2:
                b = a + 1
            else:
                b = 0
            draw.line(box[a] + box[b], fill=128, width=5)
    return im

file = '파일명'
box_list = detect_area(file)
im = processing(file, box_list)
filename = ''.join(file.split('.')[:-1]) + '_detect.' + file.split('.')[-1]
im.save(filename)




완벽하지는 않지만 어느 정도 성공적이라고 볼 수 있을까요? ^-^


녹색 간판의 상단이 인식되지 않은 것을 보면, Tesseract의 일부 버전에서는 원형으로 나열된 문자열도 인식하는 옵션이 있었던 것 같은데 카카오 API는 아직 이 부분이 약한 것 같네요.





수 백개의 이미지로 테스트해봤는데요.


인식이 의외로 잘 되는 경우도 있고, 그렇지 않은 경우도 있습니다.


제가 우연히 발견한 한 가지 재미있는 점은 문자영역감지 API에서 인식이 되지 않은 이미지라도, 좌표값을 잘 넣어서 OCR API에 보내면 문자를 인식하는 경우가 적지 않더군요 ㄷㄷ

작성자
이니스프리 119 Lv. (1%) 2322080/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

공유

facebooktwitterpinterestbandkakao story
퍼머링크

댓글 0

권한이 없습니다.
  • [리뷰] H.Point -> 네이버페이 포인트 전환[리뷰] H.Point -> 네이버페이 포인트 전환
    https://studyforus.com/deals/966030 [생활정보] H.Point -> 네이버페이 포인트 전환 방법 예전에 현대백화점을 주로 이용하다가 최근 신세계백화점을 주로 이용하다보니 상당히 많은 포인트가 유효기간이 도래하였...
  • [간단리뷰] 카드 연간실적 충족 현황을 앱에서 조회하기[간단리뷰] 카드 연간실적 충족 현황을 앱에서 조회하기
    카드사 어플에서 월간실적 충족 현황은 쉽게 조회할 수 있으나 연간실적 충족 현황은 그렇지 않은 경우도 있습니다. 제가 테스트해본 결과 아래 두 카드사의 경우에는 어플에서 직접 확인이 가능했습니다. IBK : 카드...
  • [ChatGPT] 교보문고 출석체크의 퀴즈를 풀어보기[ChatGPT] 교보문고 출석체크의 퀴즈를 풀어보기
    교보문고 홈페이지에서는 매일 출석체크를 하고 퀴즈를 풀면 쿠폰을 제공합니다 ^-^ 출석체크를 하면 도장 1개 + 퀴즈를 풀면 추가 도장 1개 이런 방식입니다. 물론 제가 인문학적 지식이 부족한 탓이겠지만, 가끔은 ...
  • iPadOS 17 개발자 베타 리뷰iPadOS 17 개발자 베타 리뷰
    • kpj
    • 조회 수 91
    • 23.06.11.20:19
    WWDC 2023이 끝나고 바로 개발자 베타를 설치해 사용 중입니다. 일단 블투 설정에서 MAC주소만 뜨는 버그가 있었는데, 해당 문제는 피드백 넣으니 해결되더라구요 그리고 잠금화면 커스텀에서 멈춰버리는 일도 있었는...
    • 봇커
    • 조회 수 89
    • 23.03.24.01:17
    네 전 이 제품을 2월 쯤에 구매했습니다. 음 처음에 받았을때 알고보니 운영체제 미 포함이였더라고요.(어쩐지 가격이 60만원 이였네요.) 램은 16기가(업체에서 서비스로 8기가를 추가로 넣어줬습니다.), SSD는 256기...
    • 봇커
    • 조회 수 63
    • 23.03.24.01:12
    네, 전 S23 나오기 전인 22년 12월에 s22 울트라를 구입했습니다. 은근 쓸만은 합니다. 그리고 제가 자주하는 게임 등을 돌려봤더니 끊기지 않고 아주 잘됩니다. 제일 중요한 카메라는 화질이 좋습니다.
  • 아멕스 리저브 및 메리어트 본보이 더 베스트 카드 발급 후기아멕스 리저브 및 메리어트 본보이 더 베스트 카드 발급 후기
    이 글에서는 신용카드 발급 과정 및 전반적인 혜택에 대해 대략적으로 리뷰합니다. 구체적인 혜택이나 메리트에 대해서는 스샤샤나 카드고릴라 등 사이트를 참조하시면 도움이 되실 것 같습니다 ^^ 1. 아멕스 리저브 ...
  • 오투잼 온라인 리뷰: 고인능욕오투잼 온라인 리뷰: 고인능욕
    O2Jam Online 개발 밸로프 유통 밸로프 플랫폼 Windows 출시일 2023년 1월 17일 장르 노트 낙하형 리듬 게임 가격 무?료 (사실상 유료 정액제) 국내 심의 등급 전체 이용가 이 표는 나무위키 O2Jam Online 문서 r39 ...
  • [Tesla] USB 메모리 및 SSD 연결 테스트[Tesla] USB 메모리 및 SSD 연결 테스트
    테슬라 차량에 USB 메모리 및 SSD 연결하여 MP3 파일을 재생시키는 것과 관련하여, 제가 직접 USB 메모리 및 SSD을 연결하여 테스트한 결과를 정리해보고자 합니다. 테슬라의 OS는 리눅스 기반이기 때문에 일반 PC처...
  • 앱코 AWK20앱코 AWK20
    • 터두
    • 조회 수 132
    • 22.04.30.18:13
    쿠팡에서 3만원 정도로 산 키보드입니다 https://www.coupang.com/vp/products/6146464332?itemId=11832389560&vendorItemId=79105816115&q=AWK20&itemsCount=35&searchId=427b3393225040acb833f4bdc37c0c8b&rank=1&i...
  • [리뷰] 무선 기계식 키패드(적축)[리뷰] 무선 기계식 키패드(적축)
    안녕하세요? 오래간만에 리뷰를 작성하네요~ 아마존에서 구입하여 1년 정도 사용한 무선 기계식 키패드 리뷰를 올립니다 ^^ https://www.amazon.com/gp/product/B07SYPL5JB/ Mechanical Numeric Keypad GATERON Red S...
  • 오피스텔 입주 !! 5평형오피스텔 입주 !! 5평형
    ㄷ 이전에는 본가에서 사진을 찍어서 올렷지만 이제는 독립하여 오피스텔 에서 적용된 모습 5평이라 그런지 딱 이불 싱글형 크기가 적당히 들어가내요 ㅎㅎ
  • [리뷰] 테슬라 차량 인도 팁[리뷰] 테슬라 차량 인도 팁
    아래 내용은 2021년 6월을 기준으로 작성되었습니다 ^^ 1. 위치 인도 장소는 테슬라 발산 딜리버리 센터입니다. 얼마 전 수원에서 이전한 것으로 알고 있습니다. 위치는 이대 서울병원 부속주차장 지하 5층에 소재하...
  • [리뷰] 9키 기계식 키보드[리뷰] 9키 기계식 키보드
    알리익스프레스에서 주문한 9키 기계식 키보드가 도착을했네요. 제목 그대로 9개의 키가 있구요. 기계식방식이고 오테뮤 스위치를 사용합니다. 청축과 적축중에 저는 소음이 적은 레드 스위치 (적축)으로 주문했습니...
  • [리뷰] Campsaver 직구 후기 및 약간의 팁(?)[리뷰] Campsaver 직구 후기 및 약간의 팁(?)
    요새 Campsaver에서 한창 FW 상품을 세일하고 있는데, 간략한 직구 후기 및 팁에 관해 글을 남깁니다 ^^ Campsaver에 새 계정을 생성한 후 첫 번째 주문에 대하여 결제를 하면 신용카드 유효성 검증을 거쳐야 합니다!...
  • [Python] MoviePy를 이용한 MP4 -> GIF 변환 및 resize 테스트[Python] MoviePy를 이용한 MP4 -> GIF 변환 및 resize 테스트
    MoviePy를 이용하여 MP4 -> GIF 변환을 하고 resize 하여 파일 크기를 비교하는 테스트를 진행해봤습니다. 테스트 파일의 출처는 아래 유튜브 채널입니다. (원 출처는 영상에 표기되어 있습니다.) https://www.youtub...
  • [리뷰] VPN 등을 활용한 BackCountry 직구 테스트[리뷰] VPN 등을 활용한 BackCountry 직구 테스트
    BackCountry는 미국의 아웃도어 전문 온라인 쇼핑몰로서 예전에 NewEgg에서 해외 직구를 막아놓았던 것보다 훨씬 빡세게 직구를 막는 것으로 유명합니다 ㅎㄷㄷ (1) 결제창으로 넘어가는 단계에서 IP 등을 체크하고, ...
  • 테슬라 모델3 렌트 후기 (내돈내후)테슬라 모델3 렌트 후기 (내돈내후)
    1. 序 테슬라 구매 전에 테스트 목적으로 렌트를 하려고 알아보던 중에 운좋게 이번 연휴 기간에 서울 SK 렌터카 지점 중 단 한 군데에 예약이 가능한 차량이 있어서 렌트를 하게 되었습니다 ^^ 렌트 차량은 모델3 스...
  • [테스트] 네이버 Clova Face Recognition의 유명인 얼굴 인식 API[테스트] 네이버 Clova Face Recognition의 유명인 얼굴 인식 API
    네이버 Clova Face Recognition에는 얼굴 인식 및 유명인 얼굴 인식 API가 있으며, 이 중 후자에 대해 테스트해봤습니다. 아래 가이드의 소스를 다음과 같이 살짝 수정했습니다. https://developers.naver.com/docs/c...
  • akg n5005 이어폰이 도착했네요akg n5005 이어폰이 도착했네요
    AKG N5005 이어폰이 도착했네요. 국내 정가 100만원짜리 제품인데.... 지난달 12일에 akg 공홈에 $199.99에 풀렸습니다. 뒤늦게 알아서 초기 품절로 인해 못샀다가 새벽에 다시 풀린 물량을 구매했네요. 하지만.... ...