国際調査報道ジャーナリスト連合(ICIJ)が 明らかにした「パラダイス文書」の作成を、 Talendのソリューションがサポート

Talend Data Integrationが、オフショアのタックスヘイブンを利用する実力者や有名企業の調査委に携わる多くの調査報道記者を支援 2018年2月14日 <本リリースは2018年1月30日に米国で発表されたプレスリリースの日本語抄訳版です>

米国カリフォルニア州レッドウッドシティー - 2018年1月30日 - クラウド及びビッグデータ統合ソリューションの世界的リーダーであるTalend(NASDAQ:TLND)は、国際調査報道ジャーナリスト連合(ICIJ: International Consortium of Investigative Journalists)が世界の政治家や大企業による金融取引を保護する2つのオフショアのタックスヘイブンと19の国と地域からの暗号化文書含む1,340万件の文書を公表した「パラダイス文書(Paradise Papers)」の調査の一部に、Talendのデータ統合管理ソリューション「Talend Data Fabric」を使用していることを発表しました。

ICIJは、情報の整理とアクセスのためにTalendを使用して1.4 TB以上の非構造化データをNeo4jグラフデータベースにロードし、Linkuriousグラフ可視化プラットフォームを活用しました。データには、租税回避のために構築された隠れたシステムを使用している法人や個人に関するテキストや画像を含む電子メール、Excel、CSV、PDF文書が含まれます。さらにICIJは他のオープンソースツールを使用し、「ナレッジセンター」をサポートして記者が情報を検索できるようにしました。

「ICIJが受け取るデータのクリーニング、変換、統合には、Talendが最適です。ICIJが堅牢なデータベースの構築を実現するうえで、Talendは不可欠なメカニズムとして機能しています」と、ICIJのCTO、Pierre Romera氏は述べています。「ICIJと連携する多くの調査報道記者は、テラバイト規模のファイルを扱っており、Talendのようなオープンソースツールを使うことによって、データのセキュリティと信頼性が保証されます。コミュニティから幅広い支援を受けるオープンソースソリューションには、データ処理、抽出、可視化の最新のイノベーションを利用できるというメリットもあります。」

ICIJのデータ処理ではクラウドも中心的な役割を果たしており、ICIJは全データの処理とアクセスの拡大のためにAmazon Web Services(AWS)を活用しています。AWSではデータ抽出を並列化するための一時的なマシンをセットアップし、Ubuntu、TesseractさらにExtractという独自ツールを使用して、文字の光学認識とファイルからのテキスト抽出を行っています。

「ICIJの使命と大量の処理データを考慮すると、クラウドへ移行する必要性は明らかでした。クラウドテクノロジーのおかげで必要なスケーラビリティを随時得ることができるので、ワークロードの管理が容易にできます。AWSは処理とセキュリティのための堅牢なパワーを備えており、私たちにとって最善の選択肢でした」と、Pierre氏は説明します。

租税回避行為に関する1,340万件の文書は、南ドイツ新聞がバミューダからシンガポールまでの国で活動する2つのオフショアのタックスヘイブンと19の国と地域から入手したものです。ICIJは、約1年かけて数百人の記者やメディアパートナーと協力し、著名人や大企業に大きな影響を与えるトップニュースとして公開しました。

Talendの製品担当SVP、Ciaran Dynesは次のように述べています。「ICIJが2016年に、後にピュリツァー賞を受賞することになる“パナマ文書”を公開して以来、Talendはデータ管理と処理のテクノロジーがいかに社会に大きく影響を与えるのかを目の当たりにしてきました。Talendにとって、綿密な調査報道と、データに有意義な知見を求める人々を支持できるのは喜ばしいことです。」

パラダイス文書をめぐるICIJの活動については、こちらのビデオをご覧ください。https://www.youtube.com/watch?v=JmXPHP-KglM&feature=youtu.be

Talend統合ソリューションが提供する機能の詳細は、www.talend.comをご覧ください。

以上