본문 바로가기
일본어

일본어 작문에 유용한 사이트 - 코퍼스편

by INAEN 2021. 6. 22.

참고사이트 : https://readingmonkey.blog.fc2.com/blog-entry-715.html?sp 

 

無料でここまでできる→日本語を書くのに役立つサイト20選まとめ | 読書猿Classic: between / beyo

 

readingmonkey.blog.fc2.com

전편 : 일본어 작문에 유용한 사이트 - 사전편

일본어로 작문을 할 때, 자신이 쓰는 이 문장이 일본어로서 자연스러운 것인지, 확신이 가지 않을 때가 있습니다. 무의식적으로 한국어로 생각하고 그걸 직역해서 쓰고 있을지도 모릅니다. 아니면 이 주어 다음에는 어떤 동사를 쓸 지 헷갈리거나, 자신이 의도한 뉘앙스를 품고 있는 건지 등 고심을 하게 될 것입니다.

즉 자신의 쓴 일본어 문장이 자연스러운 지 알 수가 없을 때 바로 빛을 발하는 사이트들을 소개하고자 합니다.

이 사이트들은 일본어 코퍼스(주석) 데이터를 기반으로 자신이 찾고 하는 키워드 단어나 문장의 사용빈도를 알 수 있으며 전후 맥락을 보여주고 어느 맥락에 주로 쓰이는 지 알 수 있도록 도와줄 것입니다.

그 외 글 자체의 난이도를 평가하거나 오탈자를 체크해주는 교정 사이트도 있습니다.

목차

    코퍼스

    츄나곤(中納言)

    회원가입을 해야 볼 수 있는 검색창

    츄나곤

    츄나곤은 일본의 국립국어연구소(이하, 국어연)에서 개발한 코퍼스 검색 웹 어플리케이션입니다. 단순한 문자열검색부터 형태론 정보를 활용한 여러가지의 검색기능을 제공하고 있습니다. 다양하고 방대한 데이터베이스를 기반으로 통합검색은 물론 각각의 데이터 베이스에서 별도로 검색 또한 가능하고, 검색 결과를 바탕으로 학습 및 연구에 활용할 수 있습니다.

    무료로 이용할 수 있지만 회원가입이 필요하며, 누구나 가입할 수 있지만 심사를 걸치기 때문에 짧으면 1시간 이내, 길면 일주일이 걸립니다.(+저는 1시간 이내로 가입이 완료됐습니다)

    보텐(梵天)

    BCCWJ판

    NWCJ판

    이전에는 국어연에서 츄나곤과 함께 제공하던 쇼나곤(小納言)이라는 누구나 이용가능하던 코퍼스 사이트가 있었지만, 보완문제로 2021년 2월 12일 이후로 서비스 종료가 되었습니다. 현재 쇼나곤 사이트에 들어가면 보텐(梵天;범천)과 츄나곤를 안내하는 문구가 나옵니다.

     

    그 중 보텐은 로그인없이 누구나 문자열을 검색할 수 있는 사이트입니다.

    현대일본어균형문어균형코퍼스[각주:1](이하, BCCWJ)와 국어연일본어웹코퍼스[각주:2](이하, NWCJ)으로 나누어져 있으며 필요에 따라 골라 검색하시면 됩니다.

    츄나곤보다 가벼워 검색속도가 빠르며, 품사별 검색과 주술관계(係り受け)검색을 지원하고 있습니다.

    코퍼스검색툴 NINJAL-LWP

    NINJAL-LWP for BCCWJ의 검색결과화면

    NINJAL-LWP for BCCWJ

    NINJAL-LWP for TWC

    코퍼스검색툴 NINJAL-LWP은 국어연이 구축한 BCCWJ와 NWCJ을 검색하기 위해 국어연와 Lago언어연구소가 공동개발한 코퍼스 검색 시스템입니다. 앞서 소개한 국어연의 츄나곤과 보텐보다 한 번에 알아보기 쉽게 정리되어 나온다는 특징이 있습니다.

    일본어작문작성지원시스템 나츠메

    일본어작문작성지원시스템 나츠메

    BCCWJ이나 위키피디아, 과학기술논문의 데이터를 사용해서 일본어를 외국어로 배우는 사람을 위한 일본어작문지원 사이트입니다. 도쿄공업대학 유학생센터 이과연구그룹이 개발한 일본어학습지원시스템(히노키프로젝트[링크])의 일부입니다. 일본어로 된 신문과 논문, 블로그의 데이터베이스으로부터 단어가 실제로 어떻게 사용되는 지 조사할 수가 있습니다.

     

    예를 들어 '桜'를 입력후 noun를 선택하고 검색을 하면 '桜'+조사에 어떤 단어가 함께 쓰이지는 지 빈도순으로 표시됩니다. 짙은 분홍색의 비율이 클수록 높은 빈도이고, 반대로 작을수록 낮은 빈도를 뜻합니다.

    활용되는 단어를 클릭을 하면 빈도의 출처를 볼 수 있다

    일본어표현인포

    일본어표현인포 - 소설, 칼럼, 블로그 등을 쓸 때의 참고서

    감정, 감각, 인물, 생활, 음식으로 그룹으로 나누어 표현과 묘사를 수집한 데이터 베이스입니다. 비슷한 뜻의 단어가 정리되어 있어 편리합니다.

    난이도 평가

    대3(帯3) - 일본어 텍스트의 난이도를 측정

    텍스트는 優駿 오피셜 사이트의 今月の立ち読み 日本競馬の最強コンビ ディープインパクトと武豊(文 = 島田明宏) 일부

    대3-일본어 텍스트의 난이도를 측정

    대3(帯3)은 텍스트를 붙여넣고 측정 버튼을 누르면 초등학교부터 대학교에 걸친 교과서 127권부터 인용한 1478개의 샘플, 약 100만자의 코퍼스를 사용하여, 초1부터 고3+대학레벨의 13단계(T13)와 BCCWJ의 코퍼스를 활용한 9단계(B9)로 일본어 텍스트의 난이도를 측정합니다.

    측정결과 B9에서는 5(평범), T13에는 9(중3수준)으로 나왔다

    소설형태소해석CGI( β )

    일본어형태소해석CGI( β )

    최대 25,000자를 분석할 수 있고, 글의 히라가나/카타카나/한자 비율을 측정하고 형태소의 비율을 측정합니다. 그리고 이를 기반으로 문장의 느낌을 해석하여 '설명과 요약위주의 글이다' '사물의 묘사보단 움직임의 묘사가 많다'같은 평가를 해줍니다.

    교정

    Enno

    Enno - 일본어 타이핑 미스/변환 미스/오탈자를 체크

    문장에서 확실한 틀린 글자(타이핑 미스, 공백 미스, 오탈자, 변환 미스, 입력후 편집 미스, 글자 깨짐)을 자동으로 체크해주는 사이트입니다.

    1. 現代日本語書き言葉均衡コーパスBCCWJ ; 출판물을 기반으로 구축한 코퍼스 [본문으로]
    2. 国語研日本語ウェブコーパスNWCJ ; 웹을 기반으로 구축한 코퍼스 [본문으로]

    '일본어' 카테고리의 다른 글

    일본어 작문 및 번역에 유용한 사이트 - 사전편  (1) 2021.06.21

    댓글