intchoson

ー北朝鮮を「評価」するー

intchosonは北朝鮮を対象として、広く情報を蓄積し、共有することを目的とした活動です。 現在、新聞記事や映像、画像の収集と公開、それを基にした分析の発表を行っています。

利用規約

一般 原則として、本WEBサイトのドメイン(intchoson.com)内に存在するすべてのコンテンツ(文章、画像等)を無断で転載することを禁止します。 例外として、北朝鮮において創作された著作物は、著作権が本サイトの管理人に帰属せず、この限りではありません。ただし、公開に責任を負うという観点から、後述するような書き方に従って、出典を記載するようにしてください。 その他の著作物についても、著作権上、公正な慣行に合致するものであり、かつ目的上正当な範囲内でコンテンツの「引用」が認められますが、具体的には 主従関係が成り立つ(つまり、引用部とそうでない部分が質的量的に主と従の関係にある) 明瞭区分性がある(つまり、引用部とそうでない部分が明確に区分されている) 必然性がある(つまり、引用しなければならない必然性がある という条件の下で、以下のルール 出典を明示する (最低限、そのコンテンツ(文章、画像)が含まれるWEBページのURLを記載する。引用されたコンテンツを見た他人が、同じコンテンツにたどり着けるようにする) 引用部を改変しない に従って引用を行うようにしてください。 北朝鮮の著作物にintchoson側で加工を行ったものについて 例えば画像に図形や文章を加えたもの、映像に字幕を付けたものなど、北朝鮮の著作物にintchoson側で加工を行ったものは、二次的著作物として、加工を行った人物にも著作権が生じています。 これは当然引用の対象となりますが、北朝鮮の著作物そのもののように、無断で転載、利用できるわけではないことをご理解ください。 北朝鮮の著作物を、個人の範囲を超えて利益が生じる場で使用する場合について 新聞、テレビ、ネットニュースなど、個人の範囲を超えた組織・団体が、それにより何かしらの利益が発生する場において、intchosonの取得した北朝鮮の著作物を利用する場合、著作権的に問題はないにせよ、我々がそれらの利用状況を正確に認識するためにも、可能な限りintchoson@gmail.comへご連絡いただきたく存じます。 度を越した著作物の利用と転載について 北朝鮮の著作物に著作権が認められないとしても、量的・質的な意味でもし通常想定され得る以上の利用・転載を行う人物・団体が現れた場合、intchosonはその人物・団体に対して利用・転載の量・方法を変えるよう申し入れを行うことがあります。 これは我々の持続的な活動と、全ての北朝鮮について調べる人々のための措置であり、我々の目が行き届く範囲で問題の発生を未然に防ぐための手段となります。ご了承ください。 望ましい出典の書き方 朝鮮中央テレビ・朝鮮の声・朝鮮中央通信ストリーミングの場合 必ずスクリーンショット等画像や映像の画面内、あるいは転載先の文章部分に、 Source: KCTV 2025-10-12 via https://intchoson.com/kctv という形式のソーステキスト(出典)を記載する。 ※この文章は"Copy Source Text"ボタンでコピ-することができます。 ※過去のスクリーンショットを共有する場合は、日時はそのスクリーンショットの撮影日(放送日)に合わせる。 ※事情によりリンクが記載できない場合は、(h)ttps://~とする。 ここで、転載先の文章部分というのは、SNS投稿であればその投稿に紐づく文章、Twitter(X)であればそのツイートのことを言います。 ※ツイッター(X)で、リプライやスレッドによりツリーを作る場合、2つ目以降のポストにはソーステキストを付けなくとも構いません。(同じ日の放送に限る) 具体例

intchosonのポリシー

 前提として、私がここで用いる「北朝鮮について調べている人々」という言葉は、以下で説明するように、科学的以外の例えば政治的その他主義主張とは、異なる価値基準から調べごとを行っている人々のことを指します。ご承知おき下さい。 目次 はじめに ー設立前夜潭- 活動内容と「評価」による分析の手法 研究の必要性と三つのintについて 資金の調達と寄付のお願い、その用途について はじめに ー設立前夜潭- 2025年2月、当時労働新聞のホームページで公開されていた朝鮮語記事のデータベース公開と共に、intchosonのWEBページは始まりました。元々私は朝鮮民主主義人民共和国(以下、北朝鮮)の地理や歴史に興味をもって調べごとをしていたので、調べる際の利便性を確保するためのツールとして労働新聞の記事を検索できるようにしようと思い立ちました。 同時に、このことを思いついた2024年というのは、北朝鮮について調べる人々にとって衝撃と困惑、意気消沈の一年でした。 2月には対南政策の転換が発表されると同時に、膨大な量の写真と動画、記事を公開していたほぼすべての対外向けサイトが予告なく一斉に閉鎖。それ以前に公開されていた多くのコンテンツが公式のWEBサイトからは閲覧不可能に。 6月末から7月の頭にかけては、朝露関係の変化に応じてか、中国所有のChinaSat12から送信されていた衛星放送の朝鮮中央テレビが突然停波し、代わりにロシア所有Express103からの送信が開始。これにより朝鮮中央テレビの受信難易度が大幅に上昇。 さらに12月には、個人で朝鮮中央テレビやWEBサイト上の映像をアップロードしていたYoutubeチャンネルの多くが、Youtubeのポリシーに違反しているとして停止。過去の映像がインターネット上からほとんどなくなってしまいました。 このように北朝鮮自身と、それを取り巻く環境、それぞれの変化によって、多くの情報リソースが失われ、また、新しい情報を誰もが手軽に入手できるような環境すらなくなってしまいました。 北朝鮮が公式に発信している情報は、それがたとえ見せたい部分のみを見せるものであったとしても、非常に重要な情報源です。一般民衆からの情報発信がない中、(それそのものが厳然たる事実として現れる)公式の情報を端から端まで、隅から隅まで、言葉や編集で飾れない部分を読み解くことが、より細かな「評価」を行う助けになります。 私は、志を同じくし、北朝鮮について調べている人々の力を合わせ、これら情報を永続的に収集・保存・公開する仕組みを持たなければならないと考えました。 活動内容と「評価」による分析の手法 intchosonが行う活動の内容は、主に2つあります。 1つ目はその開設動機からもわかるように、記事、画像、映像等、北朝鮮が公式に発信するあらゆる情報の収集、保存、公開。 2つ目は、それらの情報、またそれに対していくらか分析を加えた結果を公開、発表することです。 この分析という試みにおいて、唯一依拠するものが、「評価」という行いであると私たちは考えています。 これは私N.Sが独自的に考え出した概念ではありますが、私にとってそれは、現代の科学的な視点から現実を見るとき、すべての根幹となる考え方なのではないかと思われます。 「評価」とはすなわち、現実のあらゆる事象に整合性を持つように、そのものの立ち位置を考えることであり、その整合性の高さを「確からしさ」と定義します。 とはいえ実際のところ、個々人あるいは人々が認識できるあらゆる事象、というのは、初めは限られた範囲のものでしかなく、しばしば増えていくものです。ですから現実的には狭い範囲で我々が認知するものとしての「確からしさ」は変動しますし、それに応じて「評価」は変化していかなければならないものです。 我々が目指すのは、その時点で最も「確からしい」、「評価」を与えようと努力することであり、そうして行われた分析すら、個々人の狭い範囲に限定された「確からしさ」のもとに、人々の「評価」の対象になると考えています。 そこで必要になってくるのが、世に発信した分析の説明性であり、特に私は、そこで大きな役割を担うのが、情報源(ソース)の情報であると考えています。 少なくとも、ある情報源(ソース)が、その情報を社会に向けて発信したということは揺るがない事実と捉える事ができ、メタ的な視点をそこに置くことで、情報の「確からしさ」に必然的、恒常的な留保を担保することができます。 ゆえに、最低限の事実としてここがこういうことを発信した、ここはこう発信したということに対して、それらを突き合わせるとこういったことが考えられるが、おそらくこれが最も「確からしい」、という不安定な「評価」を、段階的に分離したものとしてとらえることが可能になります。 そういった冷酷なまでの現実主義のみを、我々が北朝鮮に向けるまなざしとしたとき、あらゆる政治的主義主張は棄却されるはずであり、現にそうなっていなければならないということを、我々は心に刻んでいるつもりです。 その意味で、本intchosonはどのような政治的主義主張にも与せず、ただ現れたソースたちを基にした分析を、至上の命題とする団体であるということをご理解いただきたく存じます。 研究の必要性と三つのintについて では、そもそもなぜ分析をするのか、ということについて、何事についてもより「確からしい」ものが突き詰められている状態こそが健全な社会であろうことは自明の理ではないかと思いますが、こと北朝鮮については、年々そのような、より「確からしい」情報が求められるようになってきているのではないかということを説明します。 第二次世界大戦後に建国されて以来、長らく北朝鮮は日本にとって内情がよくわからない国として存在してきたように思います。拉致事件の追及や日朝首脳会談の開催を経てなお、誰もがという点では、人々はその時々の北朝鮮の実態について知る術を持たなかったといえるでしょう。 しかし現代ではインターネットの発達や衛星画像サービス等公共的リソースの拡充により、主にOSINTという領域で分析の基盤となる、公開情報の範囲が広がると共に、誰もがそれらの情報を手に入れられるようになりました。 そうして興味さえ持っていれば、より多くの情報をもとに、全く一般の人々であっても手ずから高度な分析を行うことができるようになりました。言うまでもありませんが、そこでより多くの人々が力を合わせるためには、もちろん本サイトの存在のように、それを行うための仕組みが備わっている必要があります。 他方で、安っぽい情報の流通も拡大したといえるでしょう。アテンションエコノミーと呼ばれていますが、情報の流通環境が利益第一主義的になってしまうと注目性のみが追求され、またポストトゥルースといって、依拠するものがわからず感情論から情報を認識する人々が現れたことで、「確からしさ」を追い求めることが蔑ろにされ、ソースを示さず、説明性さえ放棄した情報の発信で溢れかえるようになってしまいました。これは北朝鮮が関連することに限らず、現代のすべての情報に対して言えることです。 そのような中で北朝鮮は、現実的な問題として、その国家的なプレゼンスを高め続けており、同じ東アジア圏のなか、隣接する日本は継続してこれに対応していく必要に迫られています。 ここで、対応を行う主体が、政府のみならず、国民一人一人からなる日本という国家であることに留意が必要でしょう。そのための判断には、常により深く、より緻密な、「評価」された情報としての分析が必要であり、かつそれが人々の間に共有されていなければなりません。 北朝鮮のみならず、中国やロシアも同様にその存在感を高めている中、一般の人々の間でも安全保障を筆頭とした意識が高まりつつあるように思うのですが、先のような情報環境に鑑みると、社会的な意味合いでの北朝鮮に対する知見というのは、他の2国に比べても希薄であると言わざるを得ないでしょう。 そういった意味で、政治家や学者に限らない一般の人々にも求められているのが、生の情報のみならず分析をして共有するインテリジェンス(intelligence)と、それを行うシンクタンクであり、かつその手法においては、今まで考えられなかったものとして、興味(interest)に導かれた一般の人々による分析が活用できる、という点に存在意義を見出したのがintchosonというわけです。 加えて一般の人々である我々の分析が、その妥当性を示す論理に裏打ちされ、道を外れぬように、感情論などではない「確からしさ」という現実的な指標を用いることを、OSINT的手法に有効な手段であるプログラミングにおいて整数を格納した変数を定義するint型(integer)に象徴させ、3つのintという特徴を表しました。 我々はこのような特徴に基づき、あくまで一般の人々として一般の人々のために、北朝鮮を「評価」することを理念として掲げる情報の集積場所であることを目指します。 資金の調達と寄付のお願い、その用途について 活動のための資金について、本ページを公開する2025年10月9日時点までに支出されたものは、全てが運営メンバー個々人の貯蓄から出されたものとなっています。 朝鮮中央テレビ受信のためのアンテナやチューナーは私N.Sが、公開するしないにせよ映像を集めて分析したいからという理屈で個人的に用意したもので、ホームページのサーバーもキャンペーン中に申し込んだため当分の間は格安で提供されており、労働新聞や中央通信は無料でホームページに公開されていたもの、辞書はインターネット上で有志が公開している辞書アプリのデータ、またメンバーが古書店から入手した紙の辞書をもとに作成しているものです。 ホームページのシステム・デザインに関しても、高い技術力を持つメンバーの尽力により、外部に発注することなく創造されたものとなっています。 これまでは外部から調達した資金を用いずにコンテンツを整えてきたものの、今後長きにわたって活動を行っていく上では、継続的に、かつ多様化する出費を賄わなければなりません。そこで我々は、閲覧している皆様からの寄付を集めさせていただきたいと考えています。 寄付の方法については別途寄付の方法についてのページをご覧ください。 集まった寄付については、継続的なホームページの公開に必要なレンタルサーバー費用や自前サーバー、ハードディスク等の機器更新費用、中央テレビの中継に必要な光回線費用や電気代、また資料(主に書籍)の購入費用などに充てさせていただきたく存じます。 皆様のご支援をお待ちしております。なにとぞよろしくお願いいたします。 N.S

支援の方法

intchosonのポリシーでも説明しているように、intchosonは継続的に活動を行うため、閲覧してくださる皆様からの寄付を募っております。 集まった寄付については、継続的なホームページの公開に必要なレンタルサーバー費用や自前サーバー、ハードディスク等の機器更新費用、中央テレビの中継に必要な光回線費用や電気代、また資料(主に書籍)の購入費用などに充てさせていただきたく存じます。 寄付の手段については、Buy Me a coffeeというサービスを用いるもののみとさせていただきます。 クレジットカード決済が可能ですが、日本の銀行口座からの寄付はできません。また、デフォルトでは支払う単位がアメリカドル(USD)となっていることに注意してください。 送金を取り消したいといったお問い合わせ等は、intchoson@gmail.comへご連絡ください。よろしくお願いいたします。 Buy me a coffeeによる寄付の方法 各ページ下部にある黄色いボタンをクリックするか、 https://buymeacoffee.com/intchoson にアクセスします。 アクセス後、右列の上から順に、 ・ 金額(“デフォルトは**アメリカドル(USD)**です!) ・ 支払後に左列に表示される名前(空欄でも可) ・ 同じく支払後に表示されるコメント(空欄でも可) を入力し、「Pay」を押します。 その後現れるフォームに ・ メールアドレス(運営が見ることはできますが、一般には公開されません) ・ クレジットカードの情報 を入力し、「Support」を押すと、寄付が可能です(optionalの電話番号などは入力しないで大丈夫です)。 支払い後は初めに入力した名前とコメントが表示されますが、コメントは編集でき、また"Make this private"を押すことで名前とコメントを非表示にできます(反映されるまで少し時間がかかります。反映後は名前がSomeoneとなります)。 支払い額がデフォルトではアメリカドルになっていることに注意してください。下部のUSDというところを選択し、ユーロ、オーストラリアドルなどを選ぶことができますが、日本円はありません。 しかし、いずれの通貨で決済を行っても、それを日本円に換算した金額がクレジットカードの口座から引き落とされます。換算額は各クレジットカード会社のページでお調べください(例えばVISAの場合はこちらからUSD⇔JPYを選択し、寄付金額を入力して確認できます)。 手数料は受け取り手の負担となります。こちらが入力金額から引かれる形で寄付を受け取ります。 N.S

茂山鉱山、金策製鉄所における生産能力拡大の動き?

2025年3月17日、産経新聞が独自のニュースとして、対北情報筋による衛星画像の分析により、北朝鮮にベラルーシ製のダンプ車が輸入されていたことが明らかになったと報じた1。記事中では2024年11月6日の衛星写真が示され、豆満江駅の荷役ホームにダンプと思しき黄色い荷物を押せた貨車が横付けされている様子を確認できる。 影の形から一つの貨車に大きく2つのパーツが積載されているようで、これらがそれぞれ荷台部分とシャーシの部分であれば、確かに4両分のダンプが輸出されたことになる。 記事中ではこれらの車両が軍用車両に改造される恐れがあるとしているが、本来の用途の通り、鉱山にて使用される可能性は考えられないだろうか。 実は現在、北朝鮮北部に位置し、国内最大の鉄鉱山とされる茂山鉱山にて、施設の更新が見られるとともに、その鉱石が運ばれる金策製鉄所においても同様の動きが見られる。今回はこれらの動向を通じて北朝鮮の製鉄業にどのようなことが起こっているのか、見ていきたい。 金正恩氏は2021年に行われた朝鮮労働党第8次大会において、次のように発言している。 「新しい国家経済発展5ヵ年計画の中心課業は金属工業と化学工業を経済発展の関鍵的円環として握りしめ…(中略)…ることです」「金属工業と化学工業発展を先立たせる原則で国家的な経済組織事業をうまく組織しなければなりません」2 これに合わせてここ数年の間、各鉄鉱石鉱山と製鉄所にて様々な動きが見られる。今回見ていくのは以下のとおりである。 茂山鉱山における破砕機の導入とベルトコンベアのベルト交換 茂山鉱山と清津・金策製鉄所との間を結ぶ精鉱輸送管の復旧 金策製鉄所への新型の溶鉱炉、酸素分離機の設置 1. 茂山鉱山における破砕機の導入とベルトコンベアのベルト交換 茂山鉱山連合企業所(以下、茂山鉱山)は北朝鮮北部、豆満江沿いの茂山に位置する鉄鉱山であり、日本統治時代の三菱鉱業株式会社茂山鉱山を前身としている。三菱時代に探鉱の結果、埋蔵量が10億tを超えることが判明したものの、その品位の低さ(鉄以外の不純物の多さ)からクルップ=レン法による直接還元製鉄を行うべく、三菱鉱業清津精錬所が設立され、半製品としてのルッペの製造、後に製鋼までが行われた3。同時に日本製鉄株式会社も清津製鉄所を竣工し、こちらは高炉による製銑を行った4。これらがそれぞれ現在の清津製鋼所と金策製鉄連合企業所の原型であると考えられる5。クルップ=レン法による製鉄ではコークスの量がさほど必要とされないというメリットがあり、コークスの原料となる瀝青炭の産出がほとんどない北朝鮮では、この技術をもとにした製鉄方法の研究開発が進み、コークスをあまり用いないで作った鉄のことを総称して主体鉄と呼ぶようになったようだ6。 図1:茂山鉱山と金策製鉄所、精鉱輸送管の位置(2022年9月26日) (LC09_L1TP_115031_20220926_20230327_02_T1_B8等から筆者作成, courtesy of USGS) 2023/11/7[労]によると、「党大会が決定した装備補強計画を基本的に終えることを今年経済事業の中心課業と打ち出した党中央委員会第8期第6次全員会議決定を受けた連合企業所では」「何台かの粗砕用円錐形破砕機設置及び1万8000m区間の長距離ベルトコンベアベルト交替工事を」行い、結果「粗砕工程の現代化がより高い水準で実現され、粗鉱運搬及び剥土処理能力が向上された」としている7。 破砕機についてから見ていこう。粗砕は破砕の前にある工程と思われ、おそらくダンプから岩石を下ろす際の破砕機を設置したということなのだと思うが、茂山鉱山の場合、まずどこで荷下ろしをしているのか判然としない。 ベルト交換の結果、粗鉱運搬能力が向上したとあることから複数個所で荷下ろしが行われているものと思われ、選鉱場の直上のそれらしき建屋と似たような建物を探すと、露天鉱の全体に三か所の存在が見つかる。記事中には「去る8月初め、初となる粗砕用円錐形破砕機を設置し…」とあることから、何か大きな変化があればGoogle Earthに存在する2023年9月8日の衛星写真とそれ以前の衛星写真を比べることで何かしらの動きを察知できると思われるが、特段の変化があるようには見られない。そのため、この粗砕用破砕機がどこに設置されたのか、どれぐらいの規模のものなのかといったことが確認できていない。 ベルトコンベアについても同様で、選鉱場の上部に接続された細長い構造物たちがそれであると思われるものの、屋根に覆われているため工事をしていた様子をうかがうことができない。 さらに言えば2024/5/5[労]では「回転式鑿井機をはじめとする大型設備たちの大補修」したという文言も現れているものの、これは特定の場所で行われる類のものではないので、衛星写真などによっては確認しえないものと思われる8。 前者の2つの工事については、毎日の20時報道などを通して映像から裏付けを取る事ができるかもしれないが、今回はそこまで手を付けられていない。 図2:荷下ろし場所と思われる建物 (1/2) ではこれらによって生産能力はどのように変化しているのかということだが、本サイトの労働新聞検索機で「무산광산련합기업소 대발파」と調べると、昨年2024年の中で4回、50万産大発破というのを行っていることがわかる(1/8,4/12,6/18,10/8、すべて翌日報道)9。 この50万産大発破というのは、報道によってブレがあり50万㎥なのか50万tなのか判然としないのであるが、総量50万の土砂岩石を産み出す発破のことらしく10、4回で総量200万の処理前岩石を得たということになるらしい。岩石の密度は基本1t/㎥を超えるため、量が少なくなる200万tとしても、日本統治時代の昭和17年には整えられていた処理能力の最大が200万tであった11というから、現在、少なくともこの水準は超えているということがわかる。 2023年の労働新聞の記事中には~万産大発破をしたという記事が見当たらないため、ベルトコンベア等設備の更新により、生産量が増加しているとみることができるのではないだろうか。 図4:2023/3/22[労]인민경제발전 12개 중요고지점령을 위해 기세차게 내달린다より、茂山鉱山の様子。 手前のダンプ車はBELAZ-7555シリーズと思われる。 図5:2024/9/5[労]전진과 비약의 숨결로 약동하는 철산봉より、茂山鉱山の様子。 中央に映っているのが回転式鑿井機(회전식착정기)であると思われる。 2. 茂山鉱山と清津・金策製鉄所との間を結ぶ精鉱輸送管の復旧 2023/6/9付、NKタイムズ12が内部消息筋の話として、3月から富寧郡において茂山鉱山と金策製鉄所を結ぶ精鉱輸送管交替工事が進行していると伝えた。同消息筋によるとこれは1974年4月に建設が始まり、翌1975年11月から試運転が始まったものらしく、茂山鉱山の選鉱場が位置する鉄山から新站、章興などを通り清津市松坪区域松林洞の後処理場まで連結されており、後処理場で媒体である水を取り払い、選鉱した鉄鉱石である精鉱をさらに2300mのベルトコンベアに載せて金策製鉄所と清津製鋼所の焼結場に輸送するものであるという。 この精鉱輸送管は2020年9月の台風(台風9号と思われる)によって一部区間が破壊され、その際は2020/11/10[労]にある通り復旧工事を行ったが、精鉱が流れる速度が遅くなり、2022年11月からは運搬が完全に止められた状態だったという。 そこで台風の後のような「復旧次元の作業ではなく、完全交替工事を進行しているもの」と伝え、「今年は新しい鉄の管をはじめ、国家的な投資が積極的になされ、特に中央の幹部たちまで工事現場に出ていることを見ると、党の指導下に年末までには精鉱輸送管工事を必ずや終えようということらしい」としている。 実際に水害後の2021/6/1[央]、当時首相であった金徳訓氏が金策製鉄所を現地了解した際の報道にて「精鉱輸送体系を完備することに対して強調した」とあり13、また2023/10/29[労]「金策製鉄連合企業所で1万余区間の長距離精鉱輸送管交替工事結束」という記事14でその完了を伝えていることは、交換工事が行われているという消息筋の発言を裏付けるものと言えるだろう。 図6:精鉱輸送管修復の様子(41°56'38.8"N 129°43'02.9"E) (1/3) 図7:精鉱輸送管修復の様子(42°01'08.3"N 129°42'31.4"E) (1/3) 以上は共にGoogle Earthで見た富寧郡内における輸送管と思しきものの様子を2019年、2021年、2023年の順で表したものであるが、確かに2019年に比べて2021年では埋められていた管がむき出しになっていたりするところ、2023年では新たに堤防状に埋め戻されていることがわかる。以上のようにして採掘され、輸送された鉄鉱石が運ばれる先の一つ、金策製鉄所でも大きな変化が見られる。 ...

Whisperを使って映画「72時間」のセリフ書き起こしをしてみる

年明け早々の2025年1月2日、前年に北朝鮮国内での公開が確認されていた新作映画「72시간(72時間)」が朝鮮中央テレビで放送され1、日本をはじめとする諸外国の人々の初めて目にするところとなった。 本映画は2022年公開の「하루낮 하루밤(一昼一夜)」に続き、2020年代に入って2作目の長編映画であり、冒頭で説明がある通り、金正恩氏が直々に指導を行い、また一部シーンはカザフスタンにて撮影される2など、大掛かりな撮影が行われた力作であることが以前から示唆されており3、北朝鮮について調べている人々の間では話題となっていた。 十分な大きさのパラボラアンテナが入手できず、映像を受信できなかったことは痛恨の極みであったが、1月4日、朝鮮総連が保有していると思われるYoutubeアカウント「elufa tv」に、前後編がそれぞれアップロードされた4。 無論これらは朝鮮語のままであり、字幕なども付けられていないので、日本語でこの映画を楽しみたいと求める人々の間で、全編翻訳の機運が高まった。 しかしながらこの映画、前編2時間11分、後編1時間51分と、長さが合計4時間近くもある。すべて人力で聞き取り、書き起こしを行おうとするなら、どれだけ手間がかかるか計りしれない。 折しも、将来的に入手した映像の機械的な音声文字起こしが必要になるだろうと考えていたため、せっかくならこの機会にと、AIによる文字起こしを試してみることにした。 筆者はAIについての専門家ではないので、改善の余地は至る所にあると考えられるが、一見したところかなり精度の良い5書き起こしを得られたと思っているので、ぜひその成果物を活用してもらいたい(ただし成果物を活用する際は少なくともintchoson.comのURLを出典として記載していただけるよう、お願い申し上げる)。 firefoxプラグインの「Video DownloadHelper」と「えこでこツール」を使って音声を取得、「Online MP3 Cutter」を使って前編7分割、後編6分割にする。分割したファイルをGoogleDrive上にアップロードし、GoogleColab上に書いたpythonのコードで処理を行う。 ここでOpenAIの開発しているAI、「Whisper」を使うが、無音シーンが多いとrepetition(繰り返し、幻聴)が起こるので、「Silero VAD」という音がある部分とない部分を判別してくれるAIで下処理をする。が、どうもこの処理を行うとセリフの最初の部分が切れがちになってしまう模様である。 VADを使ったものと使わないでそのままWhisperに投げたもの、どちらも作成したので、両方を見比べながら翻訳をしていくのがよいかと思われる。 なお、Whisperのモデルにはtinyからlargeまで種類があり、精度と情報の処理量に違いがあるが、今回はlargeに次いで大きいmediumを使用した。largeでも試行してみたものの、モデルが大きすぎて処理が追い付いていないのか、むしろmediumよりも聞き取り精度は落ちているように思われた。 以下にそれぞれ実行した際の結果(テキストファイル、ログをコピーアンドペーストしたもの)のダウンロードリンクを設ける。 前編、VADなし:72hours1_novad.txt 前編、VADあり:72hours1_vad.txt 後編、VADなし:72hours2_novad.txt 後編、VADあり:72hours2_vad.txt googlecolab上に書いたpythonのコードは以下の通り。 VADなし !pip install git+https://github.com/openai/whisper.git import whisper lang = "ko" tra_model = whisper.load_model("medium") name = 72hours1 #今回は前編を7等分して72hours1_番号.wavという形でGoogleDrive上にupしている。その72hours1の部分 for i in range(1,8): audio = whisper.load_audio(f"/content/drive/MyDrive/"+name+"_"+str(i)+".wav") results = tra_model.transcribe(audio,verbose=True,language=lang) for result in results["segments"]: with open(f"/content/drive/MyDrive/72hours.txt", "a") as txt1: txt1.write(result["text"]+"\n") VADあり !pip install git+https://github.com/snakers4/silero-vad.git !pip install git+https://github.com/openai/whisper.git import whisper import torch import torchaudio from silero_vad import load_silero_vad, read_audio, get_speech_timestamps from torchaudio.transforms import Resample vad_model = load_silero_vad(onnx=True) lang = "ko" tra_model = whisper.load_model("medium") name = 72hours1 #同上、GoogleDrive上にupした音声ファイルの名前。 for i in range(1,7): waveform, sample_rate = torchaudio.load(f"/content/drive/MyDrive/"+name+"_"+str(i)+".wav") #Silero VADはサンプリングレート16000に最適化されているようなので、サンプリングレートを変換 if sample_rate != 16000: resample_transform = Resample(orig_freq=sample_rate, new_freq=16000) waveform = resample_transform(waveform) sample_rate = 16000 #ステレオ音源だとWhisperがエラーになるので、モノラル音源に変換 #参考:https://note.com/owlet_notes/n/n4ba64137456a if waveform.shape[0] > 1: waveform = torch.mean(waveform, dim=0, keepdim=True) #VADで音声を切り出し、tempファイルとしてdriveに一時保存、逐次Whisperで聞き取り speech_segments = get_speech_timestamps(waveform,vad_model,sampling_rate=sample_rate) for segment in speech_segments: segment = waveform[:, (segment["start"]):(segment["end"])] temp_audio_path = "/content/drive/MyDrive/temp_audio.wav" torchaudio.save(temp_audio_path, segment, sample_rate) results = tra_model.transcribe(temp_audio_path,verbose=True,language=lang) for result in results["segments"]: with open(f"/content/drive/MyDrive/72hours.txt", "a") as txt1: txt1.write(result["text"]+"\n") 参考文献 磯部太郎丸(@iso_taro_maru)氏のツイート ののじのじ(@nnjnoji)氏のツイート ↩︎ ...

サイトを開設しました

サイトを開設しました intchoson.comを開設しました。 2025年2月23日

intchosonとは? / What is intchoson?

一言でいえば、北朝鮮に特化したシンクタンクのようなものを作りたいのです。

それは一般の人々による、一般の人々のためのものであり、北朝鮮を「評価」することを理念として掲げる情報の集積場所となるものです。

本活動はN.Sをはじめ数人の有志によって運営されています。

intchoson

In short, we want to establish a think tank in Japan specialized in North Korea.

We aims to be a storage of whole information by common people for common people, advocating “Evaluating North Korea".

Our organization is managed by N.S. and several other volunteers.

寄付のお願い / Could you make a donation?

継続的に活動を行うため、intchosonは閲覧者の皆様から寄付を募っています。
下のボタンからBuy me a coffeeのページに遷移し、寄付を行うことができます。
ご支援のほどよろしくお願いいたします。

To maintain our service and activities, we are asking for donations from our readers.
You can donate by clicking the button above to visit our page of Buy me a coffee.
We sincerely appreciate your support.