목록
아래로
위로

이북리더 아이리버 스토리의 신기한 PDF 사전검색 기능...

6
네모
2018.04.07. 19:31
조회 수 495

제가 2~3년전에 아이리버 스토리라는 이북리더기를 사용했던게 갑자기 생각이나서 과거를 회상하고 있었습니다.

그러던 도중에 굉장히 신기한 점이 기억나더군요. 그 당시에는 아무 생각이 없었는데, 다시 생각해보니 정말 신기한 일이네요.

아이리버 스토리의 장점 중 하나가 본문내 단어 실시간 사전 검색 기능인데,

책을 읽다가 이해가 되지 않는 단어가 있다면 방향키를 통해 해당 단어를 선택하면 화면 끄트머리에 사전 검색 결과가 나옵니다.

한국어와 영어가 지원되고, 한국어는 해당 단어의 설명이 표시되고, 영어는 당연히 한글단어로 표시되었죠.

그런데, 신기한 점이... 제가 소장중이던 이미지로 구성된 책에서도 단어를 찾아내 사전 검색을 진행한다는 것입니다.

이미지로 구성되어 있다면 OCR을 통해 문자를 인식하는게 아닌가 싶었지만,

파일 열기, 페이지 넘김, 단어 위치 변경, 단어 검색등 어떠한 프로세스에서도 1초 이상의 시간은 걸리지 않았습니다.

대부분의 파일이 가로 800 세로 1024 이상의 사이즈에, 200페이지 이상이니 파일을 열면서 OCR을 구동했다고 생각되지도 않습니다.

애초에 OCR을 구동할만한 성능이 되는지도 모르겠네요. 리눅스 기반이었는데 부팅하는데만 5~7초는 걸리는 성능이니까요.

그래서... 제가 궁금한건....

혹 PDF의 구성에는 이미지가 통으로 들어가도 내부의 텍스트를 인식하는 공식적인 API같은게 존재하는건가요...?

아니면 아이리버의 기술력이 매우 뛰어나서 OCR.. 또는 전혀 새로운 방법을 찾아낸걸까요..?

작성자

네모 71 Lv. (51%) 409190/414720EXP

인스타그램 : http://instg.me/nemo_9l

abnoeh

선택한 이미지를 통채로 서버로 보내고 서버서 OCR을 돌리는 방법도 있죠

2018.04.07. 20:12

"abnoeh님의 댓글"

이 댓글을 신고 하시겠습니까?

네모 작성자 → abnoeh

인터넷 없이 사용하는거라서요. 와이파이 가능한 기종도 있긴 한데, 제가 쓰던건 와이파이 미지원 기종..!

2018.04.07. 20:34

"네모님의 댓글"

이 댓글을 신고 하시겠습니까?

Dobob

충공깽이군요! 상당히 신기하군요 내장 OCR인데 작동도 잘한다니 신기할 따름입니다

2018.04.07. 20:45

"Dobob님의 댓글"

이 댓글을 신고 하시겠습니까?

humit

제 생각엔 pdf 파일 자체에서 텍스트 내용을 이미 포함하고 있는 것 같네요.

한 번 아래 툴을 이용해서 조회해보는 것도 나쁘진 않을 것 같네요.

https://github.com/jesparza/peepdf

2018.04.07. 22:15

"humit님의 댓글"

이 댓글을 신고 하시겠습니까?

이니스프리

저는 안드로이드 기반의 오닉스를 두 대 사용했는데요.

오닉스 기본 앱에는 그런 기능이 없었습니다 ㅠㅠ

200페이지라면 아무리 활자가 큰 책이라고 하더라도

i7 CPU 16GB RAM PC에서도 OCR 돌려도 1분 이상 시간이 소모될텐데요 ㅎㄷㄷ

시판되는 OCR 프로그램과 아이리버 스토리의 가격 및 용량을 놓고보더라도

OCR 프로그램을 자체 내장했을 가능성은 낮아보이네요 ㅜㅜ

제가 6~7년 전에 펜티엄이나 셀러론 노트북에서 펜스캐너도 사용해봤는데요.

펜스캐너로 실시간으로 OCR 처리를 한다고 하더라도

사실 손으로 긋는 동작에 시간이 많이 소요되기 때문에

빨라봐야 1초에 1문장 정도 수준이겠죠.

이미 OCR 처리된 PDF 파일의 경우를 제외한다면

아이리버 스토리 스펙으로 실시간으로 각 페이지마다 OCR 처리를 하는 것은

얏빠리 무리데스라고 생각됩니다 ㅠㅠ

추신:

저도 humit 님 말씀에 동감합니다 ^^

PDF 파일에 별도의 레이어로 텍스트를 입힐 수는 있어요.

(심지어 보이는 활자와 ctrl+c, v하면 긁어지는 글자가 다른 경우도 있습니다)

2018.04.07. 22:17

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

NoYeah

OCR이 이미지에서도 처리 되려면 꽤 큰 리소스를 차지 할텐데..

제 생각은 이러지 않나 싶습니다.

한번에 200장 분량을 먼저 OCR스캔하는게 아니라 각 페이지 별로 따로 스캔.

근데 그 파일을 불러올 때 스캔하는게 아니라 이미지 부터 불러 놓고 백그라운에서 OCR을 실행

(이럴 때 보통 읽다가 모르는 단어를 검색하기 때문에 스캔되기까지 충분한 시간을 벌지 않을까 합니다.)

요는. OCR을 페이지 별로 (각 이미지 별로) 인식

먼저 이미지를 불러온 후 나중에 후처리 방식으로 OCR 인식을 실행

이게 가능한지는 모르겠고, OCR 기능이 가능한 장비인지 또 모르겠습니다.

하지만 가능하다면 이런식이지 않을까 합니다.

혹시 페이지 이동 후(이미지가 불러오자마자) 바로 단어 검색하신 적이 있으신가요?

2018.04.08. 00:54

"NoYeah님의 댓글"

이 댓글을 신고 하시겠습니까?

권한이 없습니다.

번호	제목	글쓴이	날짜	조회 수
공지	시스템 점검 작업 완료 안내 10	마스터	24.09.05.16:25	3938
공지	[중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4	마스터	23.01.14.02:23	10943
공지	[필독] 질문하는 방법 17	마스터	18.02.23.03:09	5008
327	리버티 스킨 색상수정 default.css 도움좀 주세요. 10	AA	18.04.10.16:39	535
326	개근 기준이 무엇인가요 4	260578	18.04.09.18:35	566
325	혹시 반디캠으로 찍은 영상 도 올릴수잇습니까? 3	핫슈	18.04.09.17:37	309
324	간혈적으로 컨트롤키 눌림현상 3	크로스하트	18.04.09.12:15	1642
323	ssh 유저로는 DB를 못 건드리나요? 6	abnoeh	18.04.08.10:09	558
322	레이아웃 로그인시 백지현상? 1	핫슈	18.04.07.21:12	212
	이북리더 아이리버 스토리의 신기한 PDF 사전검색 기능... 6	네모	18.04.07.19:31	495
320	무슨 문제일까요 3	260578	18.04.07.11:35	221
319	http://joyul.ml/ 접속 불가 4	맛수타	18.04.06.18:39	335
318	클론질라로 랜부팅해서 윈도우 설치시 느려짐 현상 질문입니다. 3	크로스하트	18.04.06.18:14	570
317	[라이믹스] "이 게시물을" 버튼과 SNS공유 버튼 제거하는 방법 부탁드립니다. 2	260578	18.04.05.19:48	755
316	프린터가 지 맘대로 프린트를 하네요. 3	곰도리푸	18.04.04.18:20	6471
315	사이트 연결이 안되네요 4	260578	18.03.31.14:42	330
314	라즈베리 파이로 1인용 서버를 돌릴 수 있을까요? 18	제르엘	18.03.31.12:40	1360
313	서버 기계를 추천해주세요 7	260578	18.03.31.08:06	435
312	주간개근이 작동을 안 하네요? 3	abnoeh	18.03.31.00:15	344
311	MS 오피스 365와 MS 오피스 2016(단품 패키지)의 차이는 무엇이고 어떤 것을 추천해주시는가요? 9	이니스프리	18.03.29.13:33	1504
310	expert 에 있는 와일드카드 서브도메인이 뭔지 모르겠네요 1	abnoeh	18.03.27.13:23	603
309	Study for us hosting 호스팅 결제를 할려다가 취소하려고 했는데 권한이 없데요. 3	노트북	18.03.24.22:10	260
308	호스팅 Expert 1GB 신청 후 모르겠네요 2	변익수	18.03.23.00:32	260

번호

제목

글쓴이

날짜

조회 수

공지

시스템 점검 작업 완료 안내 10

마스터

24.09.05.16:25

3938

공지

[중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4

마스터

23.01.14.02:23

10943

공지

[필독] 질문하는 방법 17

마스터

18.02.23.03:09

5008

327

리버티 스킨 색상수정 default.css 도움좀 주세요. 10

18.04.10.16:39

535

326

개근 기준이 무엇인가요 4

260578

18.04.09.18:35

566

325

혹시 반디캠으로 찍은 영상 도 올릴수잇습니까? 3

핫슈

18.04.09.17:37

309

324

간혈적으로 컨트롤키 눌림현상 3

크로스하트

18.04.09.12:15

1642

323

ssh 유저로는 DB를 못 건드리나요? 6

abnoeh

18.04.08.10:09

558

322

레이아웃 로그인시 백지현상? 1

핫슈

18.04.07.21:12

212

이북리더 아이리버 스토리의 신기한 PDF 사전검색 기능... 6

네모

18.04.07.19:31

495

320

무슨 문제일까요 3

260578

18.04.07.11:35

221

319

http://joyul.ml/ 접속 불가 4

맛수타

18.04.06.18:39

335

318

클론질라로 랜부팅해서 윈도우 설치시 느려짐 현상 질문입니다. 3

크로스하트

18.04.06.18:14

570

317

[라이믹스] "이 게시물을" 버튼과 SNS공유 버튼 제거하는 방법 부탁드립니다. 2

260578

18.04.05.19:48

755

316

프린터가 지 맘대로 프린트를 하네요. 3

곰도리푸

18.04.04.18:20

6471

315

사이트 연결이 안되네요 4

260578

18.03.31.14:42

330

314

라즈베리 파이로 1인용 서버를 돌릴 수 있을까요? 18

제르엘

18.03.31.12:40

1360

313

서버 기계를 추천해주세요 7

260578

18.03.31.08:06

435

312

주간개근이 작동을 안 하네요? 3

abnoeh

18.03.31.00:15

344

311

MS 오피스 365와 MS 오피스 2016(단품 패키지)의 차이는 무엇이고 어떤 것을 추천해주시는가요? 9

이니스프리

18.03.29.13:33

1504

310

expert 에 있는 와일드카드 서브도메인이 뭔지 모르겠네요 1

abnoeh

18.03.27.13:23

603

309

Study for us hosting 호스팅 결제를 할려다가 취소하려고 했는데 권한이 없데요. 3

노트북

18.03.24.22:10

260

308

호스팅 Expert 1GB 신청 후 모르겠네요 2

변익수

18.03.23.00:32

260

도와주세요

이북리더 아이리버 스토리의 신기한 PDF 사전검색 기능...

작성자

네모 71 Lv. (51%) 409190/414720EXP

댓글 6

신고

신고

신고

신고

신고

신고

검색

스터디 최근글 [1/]

로그인

작성자 네모 71 Lv. (51%) 409190/414720EXP

댓글 6

신고

신고

신고

신고

신고

신고

검색

로그인

작성자

네모 71 Lv. (51%) 409190/414720EXP