非構造化データ管理:オンプレミスおよびクラウドのセキュリティガイド
文書や電子メールから動画、プロジェクトファイルに至るまで、ビジネスに不可欠なデータの多くは非構造化データであり、その量は急速に増加しています。しかし、こうしたデータには明確な管理責任者や構造、保護対策が欠けていることが多く、ランサムウェアや人的ミス、コンプライアンス上のリスクにさらされやすい状態にあります。
本ガイドでは、非構造化データ管理における最大の課題を探り、NAS、ファイルサーバー、クラウド環境を横断してデータを保護する方法について解説します。
非構造化データとは何ですか?
非構造化データとは、あらかじめ定義されたデータモデルに従わない、あるいは体系的に整理されていない情報のことです。リレーショナルデータベース内で行と列に整然と配置される構造化データとは異なり、非構造化データはファイルシステムやオブジェクトストレージに保存されたファイルです。非構造化データは、テキスト、音声、写真、動画などの形式で、特定のファイル形式として保存されます。
非構造化データの例としては、次のようなものがあります:
- テキスト文書: PDF、DOC、TXT、RTF などのファイル。
- マルチメディアコンテンツ画像、動画、音声ファイルなど:RAW、JPG、PNG、TIF、CDR、PSD、AVI、MOV、MPG、MP4、MP3、M4A、WAV、およびその他のファイル形式。
- メールとメッセージ.
- センサーデータとログ.
世界中で生成されるデータの大部分は非構造化データに分類されるため、その保護が必要不可欠である。
非構造化データの保存と管理におけるNASの役割
ネットワーク接続ストレージ(NAS)は、ファイルなどの非構造化データを保存する手段として、中小企業や個人ユーザーの間で広く利用されています。構造化データの保存には高度な知識を要するリレーショナルデータベースの管理が必要ですが、NASへのファイル保存は手頃な価格で便利に行えます。NASをファイル保存に利用する主な利点は、拡張性、信頼性、そしてアクセス性の高さです:
- NASのストレージ容量を増やすために、HDDやSSDなどのディスクを追加することができます。ディスク用の空きポートがない場合は、拡張ユニットを使用することができます。
- ソフトウェアRAID 1およびRAID 10を設定することで、ハードディスクドライブに障害が発生した場合でもデータの冗長性が確保され、データ損失を防ぎ、正常なディスク上のデータを使用してアレイを再構築することが可能になります。
- ファイル共有を設定することで、データを一元管理し、複数のユーザーがアクセスできるようになり、効果的な共同作業が可能になります。NASデバイスは、SMB、NFS、AFPなどの複数のファイル共有プロトコルに対応しており、Windows、Linux、macOS向けのファイル共有を設定できます。
NASデバイスは、主に大企業で利用される高度なストレージエリアネットワーク(SAN)システムに比べ、中小企業にとってコスト効率に優れています。場合によっては、非構造化データの保存先としてNASを利用することが、従来のファイルサーバーを使用するよりも合理的であることがあります。
非構造化データの保護における主なリスクと課題
他の重要なデータと同様、非構造化データも保護する必要があります。しかし、その多様性やデータ量、その他の特性により、非構造化データの保護体制を構築するには、いくつかのリスクや課題が伴います。
データ量の増加と複雑化
組織が生成するデータ量は絶えず増加しており、非構造化データのバックアップにはより多くのストレージが必要となります。ストレージの増設には追加コストがかかるため、ストレージ容量を節約する手法を採用し、不要なデータの保存を最小限に抑えることが不可欠です。 レプリケーションは、特にリアルタイムレプリケーションを使用する場合、より高いストレージ性能を必要とするため、バックアップよりもコストが高くなります。また、本番システムのスケールアップには、バックアップストレージのスケールアップも必要となります。
非構造化データはさまざまな形式のファイルで構成されており、最も重要なデータを保護するために必要となる場合があります。 必要なデータのみを保護することで、時間とストレージを節約できます。例えば、ログファイルや一時ファイルのバックアップは不要な場合があります。非構造化データには通常、バックアップ対象を分類・優先順位付けするための一貫したメタデータが欠けています。
非構造化データは、ファイルサーバー、NASデバイス、クラウドストレージなど、複数の場所に保存される可能性があります。データの保存場所(プラットフォーム)に応じて、異なるバックアップアプローチが必要になる場合があります。ソースシステムに変更を加えた後、バックアップ構成を調整することができます。
データ損失およびシステム停止のリスク
アプリケーション、サービス、およびユーザーは、日常業務において重要な非構造化データを利用しています。非構造化データは、メディア業界や医療業界で広く利用されているほか、ファイル共有によるユーザー間の共同作業にも活用されています。このデータを失うと、システム停止や業務の中断など、深刻な影響が生じる可能性があります。非構造化データの増加と変化のスピードが速いため、もし 復旧時点目標 (RPO)が高すぎる。
非構造化データには、文書、プロジェクトファイル、写真、動画、その他の重要なファイルなど、独自のコンテンツが含まれていることがよくあります。これらを紛失することは、ユーザーや企業にとって致命的な事態となり得ます。サービスレベル契約(SLA)に違反した場合、罰則が科される可能性があります。
セキュリティ上の脅威とデータプライバシーに関するリスク
高度なサイバー攻撃は、非構造化データに対する脅威となっています。攻撃が発生した場合、ランサムウェアはデータを暗号化しますが、最も危険なランサムウェアは、暗号化の前にデータを攻撃者に送信して盗み出すこともあります。ランサムウェアはエンドユーザーのコンピュータに感染し、アクセスされたファイル共有上のファイルを破壊することがあります。
ランサムウェア攻撃は、多くの場合、電子メールを通じてエンドユーザーを標的にすることから始まります。 フィッシングやソーシャルエンジニアリング、その他の高度な手口を用いて、ユーザーを騙し、感染したファイルや悪意のあるリンクを開かせるのです。また、ランサムウェアはソフトウェアの脆弱性を悪用してシステムに侵入し、感染させ、ネットワーク上で拡散し、ファイルを破壊または暗号化します。ランサムウェアがデータを攻撃者に送信した場合、非構造化データには個人情報が含まれていることが多いため、深刻なプライバシーリスクとなります。
非構造化データのガバナンス およびGDPRへの準拠
一般データ保護規則(GDPR)などの規制基準への準拠GDPR)、非構造化データの保護を一層複雑なものにしています。GDPRの要件を満たすために保護が必要な機密データを特定することは重要です。なぜなら、こうしたデータは複数の場所に分散していたり、他のデータタイプと混在していたりする可能性があるからです。
GDPRは、個人を特定できる情報(PII)の保護を義務付けています。電子メール、契約書、動画などの非構造化データには、非構造化形式のPIIが含まれていることが多く、その特定や追跡が困難です。 異なる地理的場所に保存された非構造化データは、国境を越えたデータ転送に関するGDPRの規則に準拠する必要があり、コンプライアンスを複雑にしています。
GDPRでは、組織は個人データを必要な期間のみ保持することが求められています。非構造化データはその無秩序な性質上、保持ポリシーを適用することが困難です。GDPRに準拠するために、冗長または古い非構造化データを特定して削除することは、多大なリソースを要する可能性があります。GDPRによると、組織はユーザーからの要求があった場合、ユーザーの個人データを削除しなければなりません。
非構造化データのガバナンスや管理における課題には、データを分類するためのメタデータの欠如や、データ量の増加に伴うデータの拡散(データスプロール)などが挙げられます。したがって、データの保存やバックアップを行うソリューションは、拡張性(スケーラビリティ)を備えている必要があります。データは組織内外で共有されることが多いため、すべての関係者の要件を満たし、一貫したポリシーを実施するためのアクセス制御を適切に設定することは困難な場合があります。
~のための戦略 オンプレミス環境におけるデータ保護
オンプレミスに保存された非構造化データに対する最適なデータ保護戦略は、データ損失のリスクを最小限に抑えることができます。これらの戦略は、データの完全性、可用性、機密性を確保すると同時に、サイバー攻撃、ハードウェアの故障、または内部関係者による不正利用のリスクを低減します。検討すべき主なポイントの一つは、非構造化データストレージの保護です。
定期的なバックアップ 非構造化データの保護
定期的なバックアップは、あらゆるデータ保護戦略において不可欠な要素です。サーバーやNASデバイスにローカルで保存されているデータについては、定期的な自動バックアップを実行するように設定できます。
- データの重要度や組織のニーズに応じて、バックアップの頻度を決定してください。
- 以下の組み合わせを使用してください 完全バックアップと増分バックアップ ストレージ効率と復旧速度のバランスをとるため。
- 以下の手順に従って 3-2-1バックアップルール 効果的かつ信頼性の高いオンプレミス型データ保護戦略を実現するために。
- バックアップのテスト データの一貫性を確保し、必要な時に復元できるようにするためです。
- 有効にする バックアップの暗号化 サイバー攻撃が発生した場合に、不正アクセスやデータ漏洩を防ぐため。
- 有効にする バックアップの不変性 ランサムウェアによるデータの暗号化、改ざん、および破壊を防ぐため。
NASシステムのセキュリティ確保に関するベストプラクティス
NASデバイスは、オンプレミスで大量の非構造化データを保存するためのストレージプラットフォームとして広く利用されています。一方で、NASデバイスはサイバー犯罪者にとって格好の標的となっているため、組織は NASを保護する システムおよび保存データ。以下のベストプラクティスに従うことで、NASデバイス上の非構造化データの保護に役立ちます:
- デフォルトのアカウントを無効にし、管理者用に強固なパスワードを設定したカスタムアカウントを作成してください。
- アクセス権限を正しく設定してください。
- ファイアウォールを設定し、NASへのアクセスが許可された場所から、許可されたプロトコルおよびポートを通じてのみ行われるようにします。NASの設定で不要なプロトコルを無効にしてください。
- NASベンダーが提供するセキュリティパッチや更新プログラムを適用し、既知の脆弱性を修正してください。
- NASに保存されているデータは定期的にバックアップしてください。
- NASデバイスの設置場所のセキュリティを確保し、許可されたユーザーのみにアクセスを制限してください。
- セキュリティ更新プログラムは、公開され次第、直ちにインストールしてください。
オンプレミスデータの効果的なガバナンス戦略
非構造化データ管理のための効果的な戦略は、セキュリティとコンプライアンスを確保しつつ、さまざまな形式(文書、画像、動画など)のデータを管理するのに役立ちます。非構造化データは分散している性質上、効果的なガバナンスを実施するには、ポリシー、ツール、プロセスを組み合わせて活用する必要があります。
- 非構造化データを、その機密性、価値、およびコンプライアンス要件(機密情報、公開情報、個人データ)に基づいて分類する。
- "機密""制限付き""公開"などのカテゴリを定義し、保護対策の優先順位を決定します。
- ロールベースのアクセス制御を設定し、アクセスを制限して、ユーザーが必要なデータのみにアクセスできるようにします。
- データ保持およびライフサイクル管理ポリシーを策定します。さまざまな種類の非構造化データについて保持期間を定義し、データが必要最小限の期間のみ保存されるようにします。法的トラブルを回避するため、保持ポリシーをコンプライアンス要件(GDPR、HIPAAなど)に適合させます。保存コストを削減し、情報漏洩のリスクを最小限に抑えるため、保持期間を過ぎたデータの自動削除を設定します。
- インフラストラクチャを監視する 深刻な障害が発生する前に、問題を早期に検知し、速やかに修正するためです。データ損失防止システムを活用して、ランサムウェア感染に関連する不審な活動を検知してください。自動通知とアラートを設定してください。
- 従業員に対し、サイバー脅威、サイバー攻撃の主な手口、およびランサムウェア感染の兆候について教育してください。ユーザーがサイバー攻撃の兆候を察知し、適切な対応をとることができれば、攻撃の未然防止につながります。ユーザーは、サイバー攻撃の兆候となり得る不審な動きを報告する必要があります。
- インシデント対応計画を作成し、 災害復旧計画 そして 事業継続計画. これらの計画が、障害や災害発生時に想定どおりに機能するかどうかを確認してください。
クラウド上のデータをどのように保護すればよいでしょうか?
クラウドプラットフォームは、その信頼性と可用性の高さから、ますます普及が進んでいます。 Amazon S3 また、Azure Blob Storageは、パブリッククラウド上で非構造化データを保存するためのオブジェクトストレージとして最もよく知られた例です。しかし、クラウドに保存されたデータは、誤削除、人的ミス、ソフトウェアのエラー、あるいはサイバー攻撃によって失われる可能性があります。そのため、パブリッククラウドにデータを保存する際には、非構造化データの保護策を検討する必要があります。
クラウドデータ保護の主要な戦略
パブリッククラウド上のデータを保護するために、以下の非構造化データ保護戦略を検討してください:
- クラウドストレージへのアクセスには、暗号化された接続を使用してください。転送中および保存中のファイルに対して暗号化を有効にしてください。この対策により、第三者によるデータの傍受や、それに伴う情報漏洩を防ぐことができます。
- ロールベースのアクセス制御を設定します。ロールを定義し、ユーザーへの権限を設定します。"最小権限の原則"に従い、ユーザーが必要なタスクを実行できる最小限の権限のみを付与するように設定します。有効にする 多要素認証 クラウドリソースにアクセスするためです。アイデンティティおよびアクセス管理(IAM)ツールを使用して、ポリシーを作成し、クラウドサービス全体で権限を管理します。
- クラウド上の非構造化データストレージ向けのバックアップを設定します。以下の計画を作成し、テストを行います。 クラウド型災害復旧.
- データ保護戦略が、非構造化データを保護するための具体的な措置を義務付けているGDPR、HIPAA、PCI-DSSなどの規制枠組みに準拠していることを確認してください。
- クラウドプロバイダーとのセキュリティにおける責任分担モデルを理解してください。このモデルでは、プロバイダーがインフラストラクチャのセキュリティを確保し、顧客はデータとアクセスのセキュリティ確保に責任を負います。
クラウドネイティブツールと自動化
クラウドストレージのベンダーは通常、復旧作業に利用できるネイティブツールを提供しています。これらのツールには、アイデンティティおよびアクセス管理(IAM)や多要素認証などが含まれます。 暗号化、ACL、ファイアウォールなど。
- バージョン管理(バージョン管理機能)を有効にすると、最新バージョンが破損した場合や誤った変更が書き込まれた場合に、変更を元に戻してファイルの以前のバージョンを復元できます。
- クラウドでオブジェクトストレージを使用する場合は、WORM(Write Once Read Many)方式を用いて不変性を確保してください。
- ストレージ階層を活用し、プライマリデータ、セカンダリデータ、およびクラウドに保存されたバックアップのコストを最適化します。
- データガバナンスおよび古いデータの自動化には、ライフサイクル管理ツールの導入を検討してください。
- クラウドネイティブの監視ツールを使用して、クラウドに保存されたデータを監視し、異常な活動を特定します。
- クラウドベンダーがデータ損失防止システムを提供している場合は、それを有効にしてください。
マルチクラウドおよびハイブリッド環境におけるプライバシーの確保
組織が複数のパブリッククラウド、あるいはパブリッククラウドとプライベートクラウドの両方にデータを保存している場合(オンプレミスとクラウドストレージを組み合わせた構成はハイブリッド環境と呼ばれる)、その環境においてプライバシーを確保するための対策を講じる必要があります。その際、異なるプラットフォームにデータが分散していること、コンプライアンス要件が異なること、複数の拠点にわたるデータのセキュリティ確保など、複雑な課題が生じる可能性があります。ハイブリッド環境におけるデータ保護には、主にクラウド環境とオンプレミス環境それぞれの保護対策を組み合わせることが含まれます。
- すべての環境でデータ暗号化を有効にします。一元化されたキー管理システム(KMS)を使用して、暗号化キーを管理します。クライアント側暗号化を利用して、データをクラウドに転送する前に暗号化します。
- クラウドストレージやオンプレミスなど、あらゆる場所に保存されているデータをバックアップします。データが保存されているすべてのクラウドプロバイダーやローカルプラットフォームに対応したバックアップソリューションを選択してください。
有効 非構造化データの管理 およびガバナンスのヒント
電子メール、文書、動画、その他のメディアコンテンツなどの非構造化データは、組織のデータの大半を占めていますが、構造化されていないことが多く、管理や保護が困難になりがちです。堅固なガバナンスと管理戦略を導入することで、組織はこうしたデータをより効果的に扱うことができます。
非構造化データ管理戦略の一環としてアクセス制御を設定する際は、以下の点を考慮してください。
- ユーザーにはどのような権限が必要ですか?
- ユーザーに変更内容を書き込むことを許可すべきでしょうか?
- このユーザーに読み取り専用アクセス権を与えるだけで十分でしょうか?
- ユーザーは誰とコンテンツを共有できますか?
- データを共有するにはどのような方法がありますか?NASでのファイル共有ですか、それともクラウドストレージプラットフォームですか?
組織は、データへのアクセスと利用をきめ細かく制御できるだけでなく、データ中心のアクセス制御を提供できる必要があります。こうした戦略は、不正アクセスやデータ損失の防止に役立ちます。
NAKIVOがNASのデータ保護をいかに簡素化するのか
NAKIVO Backup & Replication は、ファイルサーバー、NASデバイス、およびクラウドに保存された非構造化データをバックアップできる、専用のデータ保護ソリューションです。NAKIVOのソリューションは、以下のファイル共有のバックアップに対応しています NFS と SMB 高性能と信頼性を確保する、さまざまな便利な機能を備えたファイル共有機能。
- ファイル共有の自動バックアップバックアップジョブをスケジュール設定し、バックアップを見逃さないようにしましょう。
- 柔軟な保持設定. 設定 情報保持方針 さまざまな期間にわたって必要なリカバリポイントを保持するため。 GFS保持スキーム その他、複雑な保存期間設定にも対応しています。必要なコンプライアンス要件を満たすよう、保存期間の設定を行うことができます。
- バックアップの暗号化. 転送中(ネットワーク経由でデータを転送する際)および保存時(バックアップリポジトリ内)にバックアップを暗号化します。出典 バックアップの暗号化 ソース側でバックアップを暗号化し、暗号化されたデータを転送して、 バックアップリポジトリ.
- 変更不可能なバックアップ. 有効にする バックアップの不変性 ランサムウェアやその他の不正な改ざん・削除からバックアップを保護するため。
- 省スペース性. 増分バックアップを実行することで、変更されたデータのみをコピーし、ストレージ容量の消費を抑えることができます。増分バックアップと定期的な完全バックアップを併用することで、信頼性が向上し、増分バックアップの連鎖が破損するリスクを軽減できます。バックアップの圧縮機能を利用すれば、バックアップリポジトリのストレージ容量をさらに節約できます。
- 複数のバックアップ先バックアップは、オンプレミスやクラウド上のさまざまな保存先に保存できます。ローカルストレージとしては、ローカルフォルダー、SMB/NFSファイル共有、テープを利用できます。パブリッククラウド上でコスト効率の高いバックアップストレージを利用するには、Azure Blob Storage、AWS S3、およびその他のS3互換ストレージなど、サポートされているオブジェクトストレージを利用できます。
- 粒状回復バックアップから特定のファイルを選択して、必要なデータを素早く復元できます。完全復元にも対応しています。
NAKIVO Backup & Replication また、以下の機能もサポートしています Microsoft 365 のバックアップこれには、Exchange Online、OneDrive for Business、SharePoint Online、およびMicrosoft Teamsに電子メール、ドキュメント、その他の情報として保存されている非構造化データも含まれます。
結論
非構造化データの保護には、データの可用性を確保し、データ損失やシステム停止のリスクを最小限に抑えるために、バックアップの実施が必要です。また、コンプライアンス要件を満たすよう、ファイル共有へのアクセス制御を設定することも可能です。暗号化、不変性、およびアクセス制御を活用して、バックアップを不正アクセスから保護してください。使用 NAKIVO Backup & Replication ファイルサーバーやNASデバイスでホストされているファイル共有、およびクラウド上に保存された非構造化データをバックアップするため。