banner

ブログ

May 13, 2023

一般化された深層学習

Scientific Reports volume 13、記事番号: 9079 (2023) この記事を引用

716 アクセス

1 オルトメトリック

メトリクスの詳細

畳み込みニューラル ネットワーク (CNN) に基づくサロゲート モデルの使用は、微細構造分析と特性予測において大幅に増加しています。 既存のモデルの欠点の 1 つは、マテリアル情報の供給が制限されていることです。 これに関連して、モデルが構造と特性の関係に加えて材料情報を学習できるように、材料特性を微細構造画像にエンコードする簡単な方法が開発されています。 これらのアイデアは、繊維とマトリックスの弾性率の比が 5 ~ 250、繊維の体積分率が 25 ~ 75% で、端から端までの繊維強化複合材料に使用できる CNN モデルを開発することによって実証されます。 -実用範囲を終了します。 平均絶対誤差パーセンテージを対象メトリクスとする学習収束曲線は、トレーニング サンプルの最適な数を見つけ、モデルのパフォーマンスを実証するために使用されます。 トレーニングされたモデルの一般性は、繊維の体積分率と弾性率のコントラストの外挿領域からサンプルが抽出された、まったく目に見えない微細構造の予測を通じて示されます。 また、予測を物理的に許容できるようにするために、Hashin-Shtrikman 境界を強制することによってモデルがトレーニングされ、外挿された領域でのモデルのパフォーマンスが向上しました。

機械学習 (ML) モデル、特にそのサブドメイン人工ニューラル ネットワーク (ANN) は、複合材料の設計と解析において貴重なツールであることが証明されています 1、2、3。 まず、これらのモデルは、シミュレーションによって生成された、または実験から収集されたデータ ポイントから学習することによって開発されます。 その後、展開中に、このモデルは、学習中に使用されたものと同じ特性を持つデータ ポイントに関する推論を行うために使用されます。 一般に、初期のモデル開発プロセスには、データの生成とモデルのトレーニングのための計算コスト (メモリと時間) がかかります。 期待される利点は、開発されたモデルを使用すると、予測を大幅に短縮できることです。 ここで、モデルのトレーニングに必要なポイントの数は、トレーニング プロセスで使用されるシステムの事前知識の量4、入出力関係の複雑さ、モデルの期待精度などの複数の要因に依存します。 活発な研究は、モデルのトレーニング中に支配方程式や構成方程式などの既知の物理学を利用することに焦点を当てています。 この方向では、基礎となる物理学の偏微分方程式を正確に解くために、物理情報に基づくニューラル ネットワーク (PINN)5、6、7 が多くの注目を集めています。 入力の知識ベースのサンプリングは、モデルのトレーニングで問題の物理学を利用するもう 1 つの方法です 8,9。 事前知識の注入に加えて、ANN アーキテクチャのタイプは、効果的かつ楽な学習において重要な役割を果たします。 成功した ANN アーキテクチャには次のものがあります。 画像の種類のデータには畳み込みニューラル ネットワーク (CNN)、逐次または時系列データにはリカレント ニューラル ネットワーク (RNN)、特定のデータの分布を学習するには敵対的生成ネットワーク (GAN) があります。

複合材料の特性の評価は、さまざまな長さスケールでの不均一性と、成分の分布と形態の統計的性質により、簡単な作業ではありません。 実験方法は時間がかかり、経済的にコストがかかるため、複合材料と同様に反応する同等の仮説上の均質材料の特性を見つけるための分析ソリューションが開発されています。 これらの解は特定の仮定によって得られるため、構成要素の形状と分布に制限があるより単純な場合にのみ適用できます。 これらの欠点は、有限要素解析 (FEA) ベースの均質化 10,11 で対処できます。これにより、異なる荷重ケースを使用して代表体積要素 (RVE) で複数の境界値の問題が解決されます。 この従来の FEA アプローチのいくつかのバリエーション 12、13 は、計算コストを削減するために開発されました。 たとえば、変分漸近法 (VAM) ベースの均質化では、従来のアプローチで同様に要求の厳しい後処理ステップを実行しながら複数のケースを解決するのとは対照的に、後処理なしで単一の有限要素解析を使用して効果的な材料マトリックスが得られます。 それでも、必要な計算時間とリソースは、より優れた複合材料の探索を遅らせるのに十分な量です。 したがって、計算マイクロメカニクスとデータ駆動型人工知能 (AI) 手法を組み合わせて代理モデルを構築するための積極的な研究が進められています6、7、14、15、16、17。

CNN モデルは、一般に画像形式 (2D の場合) またはボクセル化された形式 (3D の場合) で微細構造情報が利用できるため、マイクロメカニクスで広く使用されています 15、16、18、19、20、21。 単純な人工ニューラル ネットワークに対する CNN アーキテクチャの成功は、その自己特徴学習機能と、次の 2 つの基本的な仮定を使用したローカル接続特性の利用に起因すると考えられます22。 1 つ目は、低レベルの特徴はローカルであり、空間的に遠く離れた特徴に依存しないと想定されており、これは、畳み込み演算のカーネル (またはフィルター) を介して、下流のニューロンを上流の空間的に隣接するニューロンのみと接続することによって実装されます。 2 番目の仮定は、ある空間的位置で学習された特徴が他の場所でも役立つということです。 したがって、同じ重みを持つカーネルが画像のすべての場所で使用されます。 一般に、CNN モデルは 2 段階で構築されます。 まず、入力サンプルに対する一連の畳み込みおよびプーリング操作を通じてデータ特徴が学習されます。 第 2 ステージには、第 1 ステージの出力を平坦化された配列として受け取る従来の多層パーセプトロンが含まれています。 最後のステージの接続が密であると、学習可能なパラメータの数が大幅に増加するため、計算コストが増大し、トレーニング時間が長くなります。 したがって、Mann と Kaidindi20 は、第 1 ステージの出力が出力に直接マッピングされる CNN モデルを開発しました。 また、最初の段階の終わりに、単純な平坦化の代わりにグローバルに平均化されたプーリングを使用すると、モデル内のパラメーターの数と過剰適合が削減されることが証明されました 18,23。 第 1 段階の革新的なアーキテクチャにより、AlexNet、VGG、ResNet などの効率的な CNN モデルが誕生しました。 これらの中で、VGG モデルは、転移学習によって直接、または遅延プーリング操作で畳み込み層を積み重ねる原理を使用して、多くのマイクロメカニカル モデルで広く採用されています。 たとえば、Li et al.19 は、計算コストを削減するために高レベル層または入力層から離れた層が削除された微細構造特徴の学習と再構築に枝刈り VGG-16 モデルを使用しました。 このシンプルで標準的なアーキテクチャの動作原理を使用しました。これは、現在の作業の主な焦点がマテリアル情報を認識するデータセットを開発し、モデルのパフォーマンスに対するその影響を評価することであるためです。 CNN モデルには特徴量エンジニアリングが含まれていませんが、一部のモデルは、単純な生画像の代わりに変更された入力を提供することにより、モデル学習機能を強化できることを実証しています17、20、25。 たとえば、Mann と Kalidindi20 は、微細構造の 2 点の空間相関を使用しました。 Cheng と Wagner17 は、荷重条件とパラメータ化されたジオメトリ (レベル セット フィールドによる) を入力として使用する RVE-net を開発しました。 ラベルの準備には大量の計算が必要であるため、一部の CNN モデルは、ラベルを暗黙的に学習するために物理情報を使用して開発されました 17,26。 Li と Chen26 は、CNN モデルに平衡条件を埋め込むことで、超弾性材料の構成的挙動をモデル化しました。

複合材料の場合、繊維体積分率 (\(V_f\)) と構成特性のより包括的な範囲にわたって使用できる代替モデルを用意することが望ましいです。 既存のモデルは、特定の繊維体積分率または狭い範囲の繊維体積分率 (50% 未満) および特定の繊維とマトリックス材料の組み合わせ向けに構築されています。 この研究では、より広範囲の繊維体積分率 \(V_f \in [25\%, 75\%]\) と繊維マトリックスの弾性率コントラスト (比) \(E_{cr } \in [5, 250]\) であり、トレーニングされたモデルの予測能力も \(V_f \in [10\%, 75\%]\) および \(E_{cr} \ の外挿領域で評価されます。 [5,500]\)で。 微細構造のグレースケール画像は \(V_f\) のような幾何学的特徴を提供しますが、材料情報は提供しません。 したがって、モデルがさまざまな材料システムで動作する必要がある場合は、構成材料の特性を検出する方法を学習する必要があります。 この目的のために、材料情報が各相の材料特性を微細構造のグレースケール画像にエンコードすることによって準備される高次テンソルとして供給される、単純かつ新規な方法が開発される。 構成プロパティを取り込むもう 1 つの代替方法は、マルチモーダルまたは混合入力を使用することです。 このアプローチでは、畳み込み演算の後に構成プロパティの数値を平坦化された配列に連結することができ、エンコード演算を回避できます27。 ただし、このアプローチでは、材料特性の空間的位置を学習するためにより多くのサンプルが必要となる可能性がありますが、直接エンコードから作成されたサンプルは構成要素の空間的位置についての情報を得ることができます。 また、モデル予測の物理的な許容可能性は、物理ベースの境界を使用して評価されます。 パフォーマンス メトリックの許容レベルにもかかわらず、ドメインの特定の領域でかなりの数の境界からの外れ値が観察されます。 これらの外れ値は、境界を厳密に適用してモデルをトレーニングすることによって完全に排除されます。 この目的のために、モデルのトレーニングで Hashin-Shtrikman 境界 28,29 を使用しました。

この論文は次のように構成されています。最初に、データセットの生成について、微細構造の生成、材料特性のエンコード、およびラベルの作成の詳細を説明します。 次に、CNN モデルが構築され、絶対パーセント誤差プロットを使用して、トレーニング データ セット ドメインとその外挿ドメインの目に見えないサンプルでそのパフォーマンスが調査されます。 最終的には、物理​​ベースの境界を使用して、物理的に許容できないモデル予測を定量化し、排除します。

データセットは RVE サンプルのスタックで構成されており、各サンプルには入力としての RVE のバイナリ画像と、ターゲット ラベルとしての正規化された横方向弾性特性が含まれています。 ここで、RVE は、円形断面の繊維がランダムに分布した一方向複合材の代表的な体積要素です。 \({\mathscr {X}}_{bw} \in {\mathbb {R}}^{n_s \times n_w \times n_h \times 1}\) を \(n_s\ を含むデータセットの入力部分とします) ) 幅と高さに沿ってそれぞれ \(n_w\) ピクセルと \(n_h\) ピクセルを持つ RVE 画像の数。 \({\mathscr {X}}_{bw}\) とともに、構成要素の材料特性を指定する必要があります。これは、材料情報配列の準備で説明したように、それぞれの空間位置で RVE 画像にエンコードされます。セクション。 この前処理ステップの最後に、高次テンソル \({\mathscr {X}} \in {\mathbb {R}}^{n_s \times n_w \times n_h \times n_m}\) を取得します。対象となるさまざまなプロパティを表す各画像の \(n_m\) レイヤーが含まれています。 入力 (\({\mathscr {X}}_{bw}\))、材料情報配列 (\({\mathscr {X}}\))、ラベル (\({\mathscr {Y}}\) ) のデータセットを図 1 に模式的に示します。

RVE バイナリ イメージ (モデルへの入力)、材料情報配列 (モデル推論の開始時に準備)、およびそれぞれのマトリックス係数で正規化された横弾性特性 (モデルの出力) を示すデータ セット要素の概略図。

より広範な実用的なアプリケーションに適用できる汎用の代用モデルを開発するために、広範囲の繊維体積分率 \((V_f \in [25\%, 75\%])\) と構成材料特性を使用してデータセットが作成されます。対照的です (\(E_{cr} = E_f/E_m \in [5, 250]\))。 Adam と Doner30 の観察によると、特定の \(V_f\) に対して、一方向複合材料の横方向弾性特性は、繊維とマトリックスの弾性率のコントラスト \(E_{cr}=E_f/E_m\) が低いほど急速に増加し、その後安定します。 この現象は \(V_f\) が高くなるほど顕著になります。 \(V_f=75\%\)30 の場合、横弾性係数は \(E_{cr}=250\) 程度で安定することがわかっているため、この研究では最大 \(E_{cr}\) を 250 として選択しました。 各 RVE について、繊維体積分率 (\(V_f\)) と材料特性 (\(E_f\) および \(E_m\)) は、それぞれの範囲から均一の確率でランダムに抽出されます。 ランダムに選択された \(E_f\) と \(E_m\) が \(E_{cr}\) が範囲外にある場合、 \(E_{cr}\) が選択された範囲内に収まるまで新しいペアが描画されます。範囲。 30,000 RVE の \(V_f\) と \(E_{cr}\) の散布図を図 2a に示します。 繊維体積分率に関してはサンプルが均一に広がっているが、\(E_{cr}\) に関しては不均一であることがわかります。 これは、\(E_{m} \in [1~\text { GPa}, 10~\text {GPa}]\)、\(E_{cr}\) 範囲の制約付き。 Adam と Doner30 および図 2b からわかるように、特定の \(V_f\) に対して、横方向の弾性特性は \(E_{cr}\) が低くなると急速に変化し、\(E_{cr}\) が高くなると安定します。 したがって、プロパティの変動が無視できる領域にあるサンプルが少なくても、モデルのパフォーマンスに与える影響は小さいと仮定します。

データセット \({\mathscr {D}}_1\) の特徴。 (a) 30,000 RVE の \(V_f\) と \(E_{cr}\) の分布、(b–d) 正規化された横弾性特性 \({\overline{E}}_{22} = E_{22) }/E_m\) と \(V_f\) および \(E_{cr}\) のバリエーション。 (c) と (d) の赤い色の泡で示されているように、\({\overline{E}}_{22}\) は \(E_{cr}\) が低くなり、\(V_f\) が高くなると急激に変化することに注意してください。 。

この研究で開発されたデータセット \({\mathscr {D}}_1\) には、入力 \({\mathscr {X}}_{bw} \in {\mathbb {N}}^{ 30,000 \times 256 \times 256 \times 1}\) とラベル \({\mathscr {Y}}\in {\mathbb {R}}^{30,000 \times 3}\) は 2 に分割されますモデルのトレーニングとテストのパフォーマンスの比率はそれぞれ :1 です。 ここで、RVE バイナリ イメージ (つまり、行列を 0、ファイバーを 1 で表す) のサイズは、次のセクションで説明するように、収束研究に従って \(256 \times 256\) として選択されます。

データセットは 120 個のチャンクの結合として設計されており、250 個のサンプルを含む各チャンクはデータセット全体と同じ分布 (\(V_f\) と \(E_{cr}\) の分布に従います) に従うことに注意してください。 これは、最適な画像サイズと最適なトレーニング セット サイズを見つけるための収束研究で使用される、より小さいデータ セットの同一の分布を保証するためです。 以下にデータセットの準備に必要な手順を示しますが、詳細な手順はこのセクションの後半で説明します。

各 RVE について、

選択した範囲から \(V_f\) と \(E_{cr}\) を描画します。

それぞれの繊維体積分率 \(V_f\) の RVE を生成します。

RVE を白黒のバイナリ イメージとして保存し、マトリックスを 0、ファイバーを 1 で表します。

材料情報配列は式(1)を使用して準備されます。 (4)、予測中のバイナリ画像から。

横方向の弾性特性は物理ベースのシミュレーションを使用して決定され、それぞれのマトリックス係数で正規化されます。

円形繊維がランダムに分布した一方向複合材料の周期的 RVE は、著者らによって最近開発された最適化ベースのアルゴリズムを使用して生成されます 31。 ここで、RVEの周期性は、図3aに示すように、RVEが空間内で繰り返されるときにRVEが連続になるように、エッジを出るファイバーが反対側のエッジから入らなければならないことを意味します。 このような周期性は、有効特性を評価するために RVE の均質化中に周期的境界条件を適用するために必要です。 このアルゴリズムを使用して生成された RVE は、統計的およびマイクロメカニカル分析を使用して、繊維分布のランダム性と実際の微細構造としての横方向等方性を証明しました 31。 最初に、繊維断面の中心 \(\varvec{x} = (x, y)\) は、繊維の重複を許容しながら RVE ドメイン \(\Omega\) 内にランダムに配置されます。 次に、式 1 に示すように、制約付きの最適化問題を解いて、ファイバーのオーバーラップ f の大きさを最小化します。 (1)。

サンプル RVE バイナリ イメージ (a ~ d)、解像度 \(256 \times 256\)、4 つの繊維体積分率 (\(V_f\))。 (a) は RVE の周期性を示しています。

オーバーラップ f の合計の大きさとその勾配は、式 31 に示すように明示的に評価できます 31。 (2)

ここで、\(C_{ij}\) は j 番目のファイバーへの i 番目のファイバー侵入の大きさ、\(\varvec{H}\) はヘーブサイド ステップ関数、\(d_{ij}\) は実際の繊維 i と j の中心間の距離、\({\overline{d}}_{ij}\) は繊維が互いに外側で接触しているときの繊維の中心間の距離、N は繊維の総数です。 RVE のファイバー。 Julia 言語 32 を使用して最適化問題式を解決しました。 (1)。 Intel Xeon CPU 2.40 GHz プロセッサと 64 GB RAM を搭載したコンピューターで、\(V_f \in [25\%, 75\%]\) を均一に分布させて 30,000 個の RVE を生成するのに 106.8 分かかりました。 \(V_f\) の確率的性質と各 RVE の最適化の収束により、計算時間はわずかに異なる場合があります。 このアプローチを使用して生成された 4 つのサンプル RVE 画像が \(256 \times 256\) の解像度で図 3 に示されています。

このセクションでは、RVE 画像から材料情報配列を作成する手順を開発します。 配列 \({\textbf{I}}^{(g)} \in {\mathbb {R}}^{n_w \times n_h}\) が \(N_{ph}\ による RVE のグレースケール画像を表すものとします。 ) 物質相。一意のピクセル値 \(p_i \in [0, 1 ] \subset {\mathbb {R}}\) が \(i の i 番目の相 \(\Omega _i\) を示すために使用されます。 = 1,2,...,N_{ph}\)。 微細構造の連続相マトリックスとの混同を避けるために、アレイという用語は数学的マトリックス、より具体的には画像ピクセル値の長方形配列を意味するために使用されます。

\({\textbf{I}}^{(g)}\) と同じサイズですが、異なるピクセル値を使用して \({\textbf{I}}^{(\lambda )}\) を構築します。材料定数またはプロパティ \(\lambda \in [\lambda _{min}, \lambda _{max}]\)。 \({\textbf{I}}^{(\lambda )}\) のピクセル値は、次の式を使用して評価できます。 (3)。 ここで、境界 \(\lambda _{min}\) と \(\lambda _{max}\) を選択する基準は、プロパティ \(\lambda\) の許容性に基づく必要はなく、むしろデータセットの構築に使用される値の範囲。 たとえば、表 1 から、弾性係数の制限は、すべてのデータセット。

ここで、 \(\delta (x)\) は、\(x=0\) の場合は値 1、それ以外の場合は 0 となるディラック デルタ関数です。 式ですが。 (3) 複雑に見えますが、i 番目のフェーズのプロパティ \(\lambda _i\) をその境界に関して [0, 1] に正規化しているだけです。

二相材料の特殊な場合、式(1)は次のようになります。 (3) は式 (3) に簡略化できます。 (4)。 \({\textbf{I}}^{(g)}\) の位相 \(\Omega _1\) と位相 \(\Omega _2\) をそれぞれピクセル値 0 と 1 で表すとします。 次に、配列全体 \({\textbf{I}}^{(\lambda )}\) は、フェーズ \(\Omega _1\) と \(\lambda _2\ の情報 \(\lambda _1\) を表します。 ) 位相 \(\Omega _2\) は、次の式を使用して取得できます。 (4)。

ここで \({\textbf{J}} \in {\mathbb {R}}^{n_w \times n_h}\) はすべて 1 の配列です。 式1を使用して評価された弾性率情報配列の概略図。 (4) を図 4 に示します。材料情報配列を画像形式で保存する際には注意が必要であることを強調しておきます。 ピクセル値は通常、[0, 255] の整数値を取得してバイト (8 ビット) として保存されます。 これにより、浮動小数点値は整数に四捨五入されるため、マテリアル プロパティの選択した範囲が連続値ではなく 256 個の個別の分割につながる可能性があります。 この問題を回避するために、計算コストは​​若干増加しますが、図 5 に示すように、モデルの前処理段階でモデル予測中に材料情報配列を評価することにしました。

二相材料の材料配列準備の概略図 (a) マトリックス材料と繊維材料をそれぞれ 0 と 1 で示すバイナリ画像 \({\textbf{I}}^{(g)}\) (b ) 弾性率配列 \({\textbf{I}}^{(E)}\)、\(E_{matrix}=10\) GPa、\(E_{fibre}=400\) GPa、\ で作成(E_{min}=1\) GPa と \(E_{max}=500\) GPa。

現在の研究では、解析の複雑さを軽減するために、繊維とマトリックスのポアソン比は同じ \(\nu _f\) = \(\nu _m\) = 0.25 として選択されています。 ただし、この仮定は、ポアソン比の不一致が横方向の弾性特性に弱い依存性があるため正当化されます 33,34。 したがって、ポアソン比情報配列は入力に含まれないため、各サンプルには弾性率情報配列のみが含まれます。

データセットのターゲット値には、横方向の弾性特性 \({\overline{E}}_{22}、{\overline{E}}_{33}\) および \({\overline{G}}_{ 23}\)、それぞれの行列係数で正規化されます。 RVE の数 (30,000) が比較的大きいため、この作業では変分漸近法 (VAM)13 に基づく計算効率の高い均質化手法が使用されます。 このアプローチでは、有効弾性行列 \({\overline{D}}\) 全体を、式 1 を使用した 1 回のシミュレーションで評価できます。 (5a)13,35,36

ここで、\(\Omega\) は RVE ドメインのボリュームです。 D は、サイズ \(p \times p\) の各相の材料剛性行列です。 B はひずみ-変位行列、\(n_a\) はアクティブな合計自由度の数です (つまり、周期的境界条件による依存自由度を除きます)。 Julia32 言語で書かれた均質化ツールは、式 1 に示す有効材料行列 \({\overline{D}}\) を評価するために開発されました。 (5)。 VAM ベースの均質化では、式 1 の項を評価するために FEA も使用されることに注意してください。 (5b) これにより、RVE 形態を捕捉し、ソリューションの高忠実度を保証できるようになります。 従来の FEA ベースの実装 10、11 では、材料マトリックスの列の数と同数の境界値問題 (BVP) と後処理ステップを解く必要があるのとは対照的に、VAM ベースの均質化では \({\overline{D }}\) は単一の BVP ソリューションを使用します。 たとえば、Intel Xeon CPU 2.40 GHz プロセッサと 64 GB RAM を搭載したコンピュータでは、平面ひずみ解析を使用した 20 個の RVE の二次元均質化に、VAM では約 8.3 分かかりましたが、同じメッシュと従来の FEA アプローチでは約 32.5 分かかりました。ロード中。 計算時間に関するこの利点は、3 次元均質化の場合により顕著になります。

生成された RVE は、ファイバーとマトリックス間の完璧なインターフェイスでモデル化されます。 次に、周期境界条件 (PBC) を適用するために必要な周期メッシュが、オープン ソース ソフトウェア gmsh37 を使用して、平面ひずみ要素とともに生成されます。 次に、式。 (5) は横方向有効材料行列 \({\overline{D}}\) を求めるために使用されます。 \(V_f \in [25\%, 75\%]\) と \(E_{cr} \in [5, 250]\) の範囲の極値の 4 つの組み合わせで実行されたメッシュ収束研究では、約 50 ~ 60,000 個の要素で横方向の弾性特性が収束します。 メッシュには四角形要素が多く含まれ、三角形要素はより少ない割合で含まれます (\(<2\%\))。 次に、RVE サイズを変化させることによる別の横方向弾性特性の収束研究に従って、最適な RVE サイズ (繊維半径に対する RVE 側の長さの比) が 30 と決定されます。

このセクションでは、VGG アーキテクチャ 38 に触発された CNN モデルが設計され、データセット \({\mathscr {D}}_1\) を使用してトレーニングされます。 データセットは、モデルのトレーニングとテストのためにそれぞれ 2:1 の比率で分割されます。 最初に、最適な RVE 画像サイズを見つけるために、ピクセル サイズ 32、64、128、256、512 に対して収束調査が実行されます。 次に、モデルのパフォーマンスに対するデータ セット サイズの影響を理解するために、さまざまなトレーニング セット サイズで CNN モデルが構築およびトレーニングされます。 モデルのパフォーマンスは特定のトレーニング セット サイズに収束し、それを超えるとパフォーマンスの向上は計算コストに比べてわずかであることが観察されます。 その後、モデルのパフォーマンスが繊維体積分率と弾性率のコントラストに関して評価されます。 トレーニングされたモデルの予測能力は、外挿された (または目に見えない) ドメインで研究されます。 最後に、物理ベースの Hashin-Shtrikman 境界を使用して、これらの境界から外れる予測を定量化し、排除します。

Simonyan と Zisserman は参考文献 38 で、小さなカーネル サイズ (\(3 \times 3\)) と遅延プーリング操作を組み合わせた、より深いネットワークで効率が向上することを示しました。 VGG CNN として知られる、このアイデアを備えた CNN アーキテクチャは、いくつかの微細構造アプリケーションを含むさまざまな分野で広く使用されています 18、19、24。 大きなカーネルよりも深度を増やした (またはより多くの層を) 小さいカーネル サイズを使用する利点は、トレーニング パラメーターの数が減り、非線形活性化関数が深度を通じてより多くの回数適用されるため、おそらく学習能力が向上することです。 また、プーリング操作を遅延させることで情報損失を最小限に抑えます。 したがって、現在の作業では、図5に示すように、モデルの構築にVGG種類のCNNアーキテクチャを採用しました。すべての畳み込み層で、カーネルサイズとストライドは(3, 3)と(1, 1)に固定されています。 )、各畳み込み演算に対するフィルタの数を図 5 に示します。 最大プーリング操作との比較検討の後、平均プーリングはサイズ (2, 2) およびストライド (2, 2) で選択されます。 活性化関数は、非線形性を導入するための深層学習モデルに不可欠な要素です。 したがって、すべての畳み込み層の後に、修正線形単位 (relu) のアクティベーションが適用されます。 モデルは連続実数値を予測するように構築されているため、出力層では線形アクティベーション (またはアクティベーションなし) が使用されます。 データセットが大きすぎてメモリに収まらないため、サンプルはサイズ \(n_{bs}=64\) のバッチで提供されることに注意してください。 モデル パラメーターは、反復と呼ばれるバッチが通過するたびに更新されます。 エポックはそのようなすべての反復で構成され、完全なトレーニング データがモデルを通じて送信されます。 モデル間で比較するため、この作業ではエポック数は 200 に固定されています。 モデルの予測値 (\({\mathscr {Y}}^{(p)}\)) のグランド トゥルース値 (\({\mathscr {Y}}^{(t)}\)) からの偏差。式 1 に示すように、バッチ内のすべてのサンプルは平均二乗誤差 (MSE) 損失関数を使用して定量化されます。 (6)。

ここで、 \(y_{ij}^{(t)}\) と \(y_{ij}^{(p)}\) はサンプルの真の予測特性です。 次に、学習率 0.001 の Adam 最適化アルゴリズム 39 を使用して、MSE が最小化されるようにモデルの重みを更新します。 これらの手順は、CNN モデルの構築とトレーニングのために、Python プログラミング インターフェイスを備えたオープンソースの深層学習ライブラリである PyTorch40 を使用して実装されます。 前述のハイパーパラメーターと 1 万サンプルを使用してモデルをトレーニングするには、32 GB RAM、3.7 GHz プロセッサ、8 GB NVIDIA GPU RTX-3050 を搭載したマシンで約 80 分かかりました。

CNN モデルの概略図。 ここで、 \(n_{bs}\) はバッチ サイズ、 \(n_m\) は材料情報配列 (それぞれ \(n_w\) 行と \(n_h\) 列を持つ) の数です。 \({\ mathscr {Y}}^{(t)}\) と \({\mathscr {Y}}^{(p)}\) は真の値と予測値です。

モデルのトレーニングと推論の計算コストは​​、画像のサイズに直接関係します。 画像サイズが小さいほど計算需要は安くなりますが、画像を貪欲にダウンサンプリングすると微細構造の詳細が大幅に変化する可能性があります。 したがって、このセクションでは、モデルのパフォーマンスへの影響を評価することによって、適切な RVE 画像サイズ (したがってマテリアル情報配列のサイズ) を決定します。 画像の解像度が低くなると、ピクセル化により微細構造情報が失われる可能性があります。 たとえば、繊維体積分率 \(54.7\%\) のサンプルの RVE を、それぞれ \(128 \times 128\) および \(512 \times 512\) の分解能で図 6a、b に示します。

最適な RVE 画像サイズの選択。 (a) と (b) は、それぞれ 1 辺あたり 128 ピクセルと 512 ピクセルのサンプル RVE 画像を示しています。RVE 辺の長さはファイバー半径の 30 倍です。 (c) 異なる解像度での RVE 画像 \(V_f\) と真の \(V_f\) との絶対パーセント偏差。 (d) 画像解像度による平均絶対パーセント誤差 (MAPE) の変化。

\(128 \times 128\) を使用すると、2 つの繊維表面間のマトリックスが繊維材料に置き換えられ、繊維断面の滑らかなプロファイルが粗くなっていることがわかります。 この研究では、5 つの異なる解像度 (\(32 \times 32\)、\(64 \times 64\)、\(128 \times 128\)、\(256 \times 256\)、\(512 \) を検討します。 512 倍 \)) を計算すると、情報損失とそれがモデル トレーニングに及ぼす影響を理解できます。 まず、画像のピクセル化による繊維体積分率の絶対パーセント偏差 (APD) が、式 1 を使用して定量化されます。 (7) であり、図 6c にプロットされています。 ここで、\(V_f^{(image)}\) は、RVE 画像内の白いピクセル (繊維を表す) の割合として評価されます。 たとえば、 \(V_f^{(true) の場合、 \(64 \times 64\) の解像度で RVE を保存すると、 \(V_f^{(true)}\) に約 2 ~ 4% の偏差が生じることがわかります。 }\) は 75% に近いです。 この偏差は、\(256 \times 256\) を超える解像度では 1% 未満の偏差で、画像の解像度を上げることによって減少することがわかります。 ただし、より高い解像度を選択すると、計算負荷が指数関数的に増加するため、モデルのトレーニング時間が長くなります。

次に、3 つの異なるデータ セット サイズ (500、1500、2500) で、考慮された 5 つの解像度すべてを使用してモデルがトレーニングされます。 さらに、データセットのサイズと解像度の各組み合わせで、トレーニング プロセスの統計的性質を考慮して、(同じトレーニング サンプルとハイパーパラメーターを使用して) モデルの 10 個の実現が開発されます。 次に、これらのモデルのパフォーマンスがテスト サンプルで評価され、平均絶対パーセント誤差 (MAPE) で定量化されます。 図6dでは、10回の実現にわたって評価されたMAPEの平均が、MAPEの標準偏差をエラーバーとして画像解像度に対してプロットされています。 解像度とトレーニング セット サイズが増加するにつれて、MAPE と不確実性が減少していることがわかります。

上記の分析から、 \(V_f\) 偏差 (図 6c を参照) と MAPE (図 6d を参照) の減少は有意ではないため、モデル トレーニングには \(256 \times 256\) 画像解像度を選択しました。計算コストの増加と比較して、画像サイズが 256 から 512 に増加しました。

効果的な学習に必要な最適なサンプル数を見つけるために、さまざまなモデルがサンプル数 \(n_s \in \{500\)、1000、1500、2000、4000、6000、8000、10,000、15,000、 20,000\(\}\)。 前のセクションで説明したように、データ セットのこれらのサブセットは、データ セット全体の分布と同じ種類の分布を持つことが保証されます。 さらに、トレーニング プロセスの統計的性質を理解するために、同じサンプルとハイパーパラメーターのセットを使用して、\(n_s\) のそれぞれで同じモデルの 10 個の異なる実現がトレーニングされます。 したがって、合計 100 個のモデルが、データセットの 10 個のサブセットと各サブセットでの 10 個の実現を使用してトレーニングされます。 次に、これらのトレーニングされたモデルは、テスト セット サイズがトレーニング セットの半分のサイズとして選択される、トレーニング中に見られなかったサンプルでテストされます。 言い換えれば、たとえば、5000 個のサンプルでトレーニングされたモデルは、2500 個の未確認のサンプルを使用してテストされます。 式で定義される平均絶対パーセント誤差 (MAPE)。 (8) は、トレーニングされたモデルの予測能力を測定するために使用されます。

ここで、 \(n_{test}\) はテスト サンプルの数であり、上付き文字 t と p は y の真の値と予測値を示します。 MAPE は解釈が簡単でスケールに依存しませんが、真の値がゼロに近づくかゼロに等しい場合に無限大または未定義になる傾向があるなど、特定の制限があります。 しかし、今回の研究では、それぞれの行列係数で実効特性を正規化することで、真の値または目標値 \(y_i^{(t)}\) が常に 1 以上であるなどの問題がなくなりました。 また、絶対パーセント誤差では過小評価と過大評価が異なるように扱われることに注意することが重要です。

10 回の実現にわたるテストセットで評価された MAPE の平均と標準偏差の変動が、トレーニング例の数に対してプロットされているのが図 7 です。これらの曲線を学習収束曲線 (LCC) と呼びます。 図 7 では、3 つの正規化された横方向特性 (\({\overline{E}}_{22}\)、\({\overline{E}}_{33}\)、\) の MAPE がすべて一致していることがわかります。 ({\overline{G}}_{23}\)) は、約 10,000 サンプルのトレーニング セットで収束しました。 また、エラーバーで示されているように、標準偏差はトレーニング セットのサイズとともに大幅に減少しています。 この収束分析から、最適なトレーニング セット サイズ 10000 を選択し、このデータ セット サイズでトレーニングされたモデルを厳密に分析します。

データセット \({\mathscr {D}}_1\) でトレーニングされたモデルの学習収束曲線は、トレーニング セットのサイズによる各プロパティの MAPE の変化を示しています。 エラーバーは、同じサンプルとハイパーパラメーターのセットを使用してトレーニングされたモデルの 10 回の実現にわたる MAPE の標準偏差を示します。

横方向の弾性特性 (つまり、ターゲット特性) は、図 2 に示すように、繊維体積分率 \(V_f\) と弾性率コントラスト \(E_{cr}\) に依存します。 MAPE を使用してこれらのパラメータに変換すると、すべて \(V_f\) またはすべての \(E_{cr}\) の情報が 1 つの値に圧縮されるため、式 1 を参照してください。 (8)。 したがって、モデルの予測能力を明確に理解するために、各予測の絶対パーセント誤差 (APE) が調査されます。 図 8 の散布図は、\(V_f\) と \(E_{cr}\) に関する 5000 個のテスト サンプルの 3 つの特性予測すべての APE を示しています。 少数の外れ値を除いて、絶対パーセント誤差は 5% 未満であることがわかります。 図 8 の右側の累積分布関数は、特定の APE を下回るサンプルの割合を示しています。 たとえば、サンプルの 86% では絶対予測誤差が 3% 未満であり、テスト サンプルの 97% では APE が 5% 未満です。

散布図は、\(V_f\) と \(E_{cr}\) を使用した 5000 個のテスト サンプルにおけるターゲット特性予測の絶対誤差 (APE) を示します。 右側の累積分布関数は、特定の APE におけるサンプルの割合を示します。 たとえば、モデル予測の APE がテスト サンプルの 97% で 5% 未満であることが示されています。

前のセクションでは、\(V_f \in [25\%, 75\%]\) と \(E_{cr} = E_f/E_m \ in [5 、250]\)。 また、これらのモデルは、同じ範囲に属する未確認のサンプルでテストされ、パフォーマンスが許容レベル内であることが判明しています。 トレーニング中に考慮されなかった外挿領域でモデルがどのように動作するかを確認するのは興味深いでしょう。 図 9 では、データセットの外挿領域 (\({\mathscr {D}}_2\)、\({\mathscr {D}}_3\)、および \({\mathscr {D}}_4\))メインデータセット \({\mathscr {D}}_1\) のドメインに関して模式的に示します。 図 9 の中央と右側の図に示すように、これらの外挿ドメインでは、ネイティブ ドメインの接続領域からの特性の変動は大きくありません。したがって、このモデルは、図 9 と同様にかなり高い精度で予測することが期待されます。ネイティブドメイン。 重要なのは、このような演習は、CNN モデルの一般性と、トレーニング データセットに特性が存在しない完全に目に見えない微細構造の特性を予測する能力を評価するのに役立ちます。 これらの地球外ドメインでモデルのパフォーマンスをテストするために、データ セットのサイズはドメイン サイズに比例して選択されます。 \(E_{cr}\) の範囲はすべてのドメインでほぼ同じであるため、テストサンプルの数は \(V_f\) の範囲に基づいて計算されます。 データセット \({\mathscr {D}}_1\) と \({\mathscr {D}}_2\) の場合、\(V_f\) 範囲が 50% の場合、5000 個のテスト サンプルが使用され、残りの 2 個にはテスト サンプルが使用されます。 15% \(V_f\) 範囲のデータセットでは、1500 個のテストサンプルが使用されます。 これらのデータセットに対するモデル予測の APE を、\(V_f\) と \(E_{cr}\) に関して、APE の累積分布関数とともに図 10 に示します。 \({\mathscr {D}}_3\) と \({\mathscr {D}}_4\) の場合、図 10b,c に示すように、APE は \(V_f\ の減少とともに増加傾向を示します) )。 これは、ターゲット特性が大きく変化していないにもかかわらず、 \(V_f\) の減少に伴う RV​​E の構造情報の偏差による可能性があります。 3 つの外挿ドメインすべてにおいて、テスト サンプルの少なくとも 85 ~ 90% のモデル予測の APE は 5% 未満です。 これは、訓練されたモデルが \(V_f\) と \(E_{cr}\) の域外領域で使用できることを示唆しています。

3 つの外挿ドメインの概略図 (データセット \({\mathscr {D}}_2\)、\({\mathscr {D}}_3\)、および \({\mathscr {D}}_4\) を使用)メイン データ セット \({\mathscr {D}}_1\) のドメインとともに。 より高い \(V_f\) と \(E_{cr}\) における \({\overline{E}}_{22}\) の変動は示されていないことに注意してください。

外挿ドメイン \({\mathscr {D}}_2\)、\({\mathscr {D}}_3\) および \({\mathscr {D} でテストしたときのモデル予測の絶対パーセント誤差 (APE) }_4\)。 (a ~ c​​) の各サブプロットでは、最初の 2 つの散布図は、繊維体積分率 \(V_f\) と弾性率コントラスト \(E_{cr}\) に関する 3 つすべての特性の APE を示しています。 APE の累積分布関数を右側に示します。

前のセクションでは、トレーニングされたデータ セット ドメインの未確認のサンプルと外挿されたドメインのデータ セットでのモデルのパフォーマンスを分析しました。 予測の絶対パーセント誤差が許容範囲内であることが観察されます。 ただし、モデルの予測は物理的に許容できる場合と許容できない場合があります。 このセクションでは、文献 29 で入手可能な物理ベースの境界を使用して、これらの予測の許容可能性を評価します。 我々は、より単純で比較的厳密な Hashin-Shtrikman (HS) 境界 28 を使用します。これは、式 2 を使用して評価できます。 (10)。 一般に、図 11a に示すように、複合材料の有効特性の下限と上限は大きく異なります。 \(V_f\) とコントラスト比 \(E_{cr}\) が増加するにつれて境界が広くなることがわかります。 また、横方向の特性は下限に近いところにあるため (図 11b、c に示すように)、モデルの予測が下限から外れる可能性があります。

ここで、接尾辞 f と m は繊維とマトリックスを表し、K は体積弾性率、G はせん断弾性率、E はヤング率、超修正 \((-)\) と \((+)\) は下限と上限を示します。 。

繊維体積分率 \(V_f\) と弾性係数のコントラスト \(E_{cr}\) を使用したデータセット \({\mathscr {D}}_1\) のハシン・シュトリックマン境界の変化。 (a) は、行列法 \(E_m\) で正規化された境界間の分離の範囲を示しています。 (b) と (c) は、有効なプロパティ \(E_{22}\) が下限の非常に近くにあることを示しています。

HS 下限の外れ値の数は、データセット \({\mathscr {D}}_1\) の 10,000 サンプルでトレーニングされたモデルの 10 個の実現すべてで評価されます。 4 つのデータ セットすべてにおける各プロパティの外れ値の最大数を表 2 に示します。

これは、データセット \({\mathscr {D}}_3\) と \({\mathscr {D}}_4\) に対するモデル予測の多くが下限を下回っていることを示しています。 ここで、モデルのトレーニング中にこれらの境界を強制し、すべてのモデル予測が境界内に収まるようにします。 モデルのトレーニング中、一般に 2 つの方法で境界を強制できます。 ソフトエンフォースメントとして知られる最初のアプローチでは、モデルの損失関数は、境界からの予測の偏差の平均二乗誤差の加重加算によって正規化されます。 一般に、これらの追加の損失項の重みは、手動で調整する必要があるハイパーパラメーターです。 ハードエンフォースメントとして知られる 2 番目のアプローチでは、モデルの予測が境界内に収まるように変換され、追加のハイパーパラメーターが回避されます。 今回の作業では、厳しい方法で境界を強制することを選択しました。 このアプローチでは、モデルのアーキテクチャとトレーニングは、ネットワークの端でのいくつかの変更を除いて、図 5 に示したものと似ています。 ネットワークの最後の層の出力は、\(\tanh\) 活性化関数を適用することによって \([-1, 1]\) にマッピングされます。 次に、式 1 に示すように、これらの値が下限と上限の間に収まるようにさらにスケーリングされます。 (11)。 モデルの出力は境界に制約されませんが、モデルは境界間の値を予測するようにトレーニングされていることに言及する価値があります。

ここで、 \(y^{*} \in [-1, 1]\) は、最後の層 \(y^{(-)}\) および \(y) の \(\tanh\) 活性化関数の出力です。 ^{(+)}\) は下限と上限です。 境界なしのトレーニングとは異なり、境界ありのトレーニングは学習率の影響を受けやすいことがわかります。 境界適用モデルは、最適な学習率 0.0005 でトレーニングされます。 200 エポック後のモデル予測の全体的な MAPE は、境界なしでトレーニングされたモデルと同じ範囲の約 1.72 です (表 1 を参照)。 それにもかかわらず、図 12 に示すように、外挿領域 \({\mathscr {D}}_3\) および \({\mathscr {D}}_4\) における予測の絶対誤差パーセンテージは改善されています。すべてのドメインについて外れ値の数を排除します。 これは、外挿領域での予測、特により低い繊維体積分率の予測では、物理的に有効な特性を予測する上で境界を強制することが重要であることを示唆しています。

データセット \({\mathscr {D}}_1\)、\({\mathscr {D}}_2\)、\({\mathscr) でテストしたときの、境界適用モデル予測の絶対パーセント誤差 (APE) {D}}_3\) と \({\mathscr {D}}_4\)。 (a–d) では、最初の 2 つの散布図は、繊維体積分率 \(V_f\) と弾性率コントラスト \(E_{cr}\) に関するモデル予測の APE を示しています。 右側には、APE の累積分布関数が、3% APE および 5% APE 未満のサンプルの割合を示します。

CNN モデルは、繊維強化複合材料の正規化された横弾性特性を予測するために開発されました。 モデルの適用性を高めるために、モデルは [25%、75%] の広範囲の繊維体積分率と [5、250] の繊維マトリックスの弾性率コントラスト比でトレーニングされています。 このモデルは、体積分率 ([10%、25%]) および弾性率比 ([250、500]) の考慮範囲外にある、まったく目に見えない微細構造であっても、非常に優れた予測を提供することが示されています。 さらに、この研究では、より優れたモデルのパフォーマンスを達成するには、慎重なデータセットの準備とトレーニングの設計が重要であることが実証されました。 要約すれば、

モデルが幾何学的情報とともに材料情報を学習できるように、微細構造のグレースケール画像内の構成要素の材料特性をエンコードするための簡単で新しい方法が開発されました。

\(256 \times 256\) の解像度を持つ RVE バイナリ イメージには、真の \(V_f\) からの最小 \(V_f\) 偏差 (\(<1\%\)) があることがわかります。 また、MAPE はこの RVE 画像解像度で収束していることがわかります。

トレーニング プロセスの確率的性質は、MAPE の平均と標準偏差を使用して定量化され、モデル トレーニングの 10 回の実現で評価されます。

学習収束曲線を使用すると、最適なトレーニング セット サイズは 1 万と決定され、それを超えるとモデル予測の MAPE の減少は無視できることがわかります。

トレーニング セット ドメインでは、5000 個のテスト サンプル予測の少なくとも 96% の絶対パーセント誤差 (APE) が 5% 未満です。

外挿されたドメインの場合、テストサンプルの少なくとも約 85 ~ 90% の APE は 5% 未満です。

最後に、モデルの予測が常に物理的に許容されるように、物理ベースの HS 境界を厳密に適用してモデルをトレーニングしました。 また、これにより、外挿領域 \({\mathscr {D}}_3\) および \({\mathscr {D}}_4\) におけるモデルのパフォーマンス指標 APE が向上しました。

提案された材料エンコーディングのアイデアは、関連する材料情報配列のスタックをネットワークへの入力として使用することにより、さまざまな成分の組み合わせからなる異種異方性材料の代理モデルを構築するために採用できます。 また、モデルは広範囲の繊維体積分率と弾性率のコントラストに及ぶため、トレーニングされたモデルは、目的の特性を与える微細構造の逆設計に使用できます。

現在の研究中に使用および/または分析されたデータセットは、次のリンク https://github.com/338rajesh/mpi-cnn から入手できます。

Liu, X.、Tian, S.、Tao, F.、Yu, W. 複合材料の構成モデリングにおける人工ニューラル ネットワークのレビュー。 コンポ。 パート B 工学 224、109152。https://doi.org/10.1016/j.compositesb.2021.109152 (2021)。

記事 Google Scholar

Lefik, M.、Boso, D. & Schrefler, B. 複合材料の数値モデリングにおける人工ニューラル ネットワーク。 計算します。 メソッドの適用。 自分。 工学 198、1785 ~ 1804 年。 https://doi.org/10.1016/j.cma.2008.12.036 (2009)。

記事 ADS MATH Google Scholar

Chakraborty, D. 人工ニューラル ネットワークに基づいた積層複合材料の層間剥離予測。 メーター。 デザイン 26、1 ~ 7。 https://doi.org/10.1016/j.matdes.2004.04.008 (2005)。

記事 CAS Google Scholar

Karniadakis、GE et al. 物理学に基づいた機械学習。 ナット。 Rev. Phys. 3、422–440。 https://doi.org/10.1038/s42254-021-00314-5 (2021)。

記事 Google Scholar

Raissi, M.、Perdicaris, P. & Karniadakis, G. 物理学に基づいたニューラル ネットワーク: 非線形偏微分方程式を含む順問題および逆問題を解決するための深層学習フレームワーク。 J.Comput. 物理学。 378、686–707。 https://doi.org/10.1016/j.jcp.2018.10.045 (2019)。

記事 ADS MathSciNet MATH Google Scholar

Rezaei、S.、Harandi、A.、Moeineddin、A.、Xu、B.-X。 & Reese, S. 異種領域における工学問題の潜在的なソルバーとしての物理学に基づいたニューラル ネットワークの混合定式化: 有限要素法との比較。 https://doi.org/10.48550/ARXIV.2206.13103 (2022)。

Henkes, A.、Wessels, H.、Mahnken, R. 物理学に基づいた連続マイクロメカニクスのニューラル ネットワーク。 計算します。 メソッドの適用。 メカ。 工学 393、114790。https://doi.org/10.1016/j.cma.2022.114790 (2022)。

記事 ADS MathSciNet MATH Google Scholar

Bessa, M. et al. 不確実性の下での材料のデータ駆動型分析のためのフレームワーク: 次元の呪いに対抗します。 計算します。 メソッドの適用。 メカ。 工学 320、633–667。 https://doi.org/10.1016/j.cma.2017.03.037 (2017)。

記事 ADS MathSciNet MATH Google Scholar

Morand, L.、Link, N.、Iraki, T.、Dornheim, J. & Helm, D. アクティブ ラーニングによる微細構造特性空間の効率的な探索。 フロント。 メーター。https://doi.org/10.3389/fmats.2021.824441 (2022)。

記事 Google Scholar

Melro, A.、Camanho, P.、Pinho, S. 一方向複合材料の弾性応答に対する幾何学的パラメーターの影響。 コンポ。 構造体。 94、3223–3231。 https://doi.org/10.1016/j.compstruct.2012.05.004 (2012)。

記事 Google Scholar

Tian, W.、Qi, L.、Chao, X.、Liang, J. & Fu, M. 複雑な微細構造を持つ複合材料の効果的な機械的特性を評価するための周期境界条件とその数値実装アルゴリズム。 コンポ。 パート B 工学 162、1-10。 https://doi.org/10.1016/j.compositesb.2018.10.053 (2019)。

記事 Google Scholar

樋口 良、横関 達、長島 達、青木 達。XFEM ベースの計算マイクロメカニクスを用いた非円形炭素繊維強化プラスチックの機械的特性の評価。 コンポ。 パート A 応用例科学。 製造。 126、105556。https://doi.org/10.1016/j.compositesa.2019.105556 (2019)。

記事 CAS Google Scholar

Yu, W. & Tang, T. 周期的に不均質な材料の単位セル均質化のための変分漸近法。 内部。 J. ソリッド構造。 44、3738–3755。 https://doi.org/10.1016/j.ijsolstr.2006.10.020 (2007)。

記事 MathSciNet MATH Google Scholar

パタン、MV et al. 教師あり機械学習による一方向繊維複合材料の機械的特性の予測。 科学。 代表者https://doi.org/10.1038/s41598-019-50144-w (2019)。

記事 PubMed PubMed Central Google Scholar

Liu, H. & Zhang, Y. 深層学習アルゴリズムを使用した画像駆動型構造用鋼の損傷状態評価手法。 測定 133、168 ~ 181。 https://doi.org/10.1016/j.measurement.2018.09.081 (2019)。

記事 ADS Google Scholar

Rao, C. & Liu, Y. 異種材料の均質化のための 3 次元畳み込みニューラル ネットワーク (3d-cnn)。 計算します。 メーター。 科学。 184、109850。https://doi.org/10.1016/j.commatsci.2020.109850 (2020)。

記事 Google Scholar

Cheng, L. & Wagner, GJ RVE 解析、マイクロスケール材料の特定、欠陥の特性評価を加速するための代表的な体積要素ネットワーク (RVE-net)。 計算します。 メソッドの適用。 メカ。 工学 390、114507。https://doi.org/10.1016/j.cma.2021.114507 (2022)。

記事 ADS MathSciNet MATH Google Scholar

近藤隆、山川伸、増岡裕、田島伸、朝日隆。セラミックスのイオン伝導度予測のための畳み込みニューラルネットワークを用いた微細構造認識。 アクタ・マテリアリア 141、29–38。 https://doi.org/10.1016/j.actamat.2017.09.004 (2017)。

記事 ADS CAS Google Scholar

リー、Xら。 微細構造の再構築と構造特性の予測のための転移学習アプローチ。 科学。 代表者https://doi.org/10.1038/s41598-018-31571-7 (2018)。

記事 PubMed PubMed Central Google Scholar

Mann, A. & Kalidindi, SR 微細構造と特性の関連性を捕捉し、材料設計をサポートする特性クロージャーを構築するための堅牢な CNN モデルの開発。 フロント。 メーター。https://doi.org/10.3389/fmats.2022.851085 (2022)。

記事 Google Scholar

Ejaz、F.ら。 cu-CNT 複合材料の電気伝導率と熱伝導率を近似するための畳み込みニューラル ネットワーク。 科学。 代表者https://doi.org/10.1038/s41598-022-16867-z (2022)。

記事 PubMed PubMed Central Google Scholar

Khan, A.、Sohail, A.、Zahoora, U.、Qureshi, AS 深層畳み込みニューラル ネットワークの最近のアーキテクチャの調査。 アーティフ。 知性。 改訂 53、5455–5516。 https://doi.org/10.1007/s10462-020-09825-6 (2020)。

記事 Google Scholar

Lin, M.、Chen, Q.、Yan, S. ネットワーク内のネットワーク。 https://doi.org/10.48550/ARXIV.1312.4400 (2013)。

Zhou, K.、Sun, H.、Enos, R.、Zhang, D. & Tang, J. 深層学習を活用して、微細構造の不確実性を伴う複合強度を物理学に基づいて予測します。 計算します。 メーター。 科学。 197、110663。https://doi.org/10.1016/j.commatsci.2021.110663 (2021)。

記事 Google Scholar

Cecen, A.、Dai, H.、Yabansu, YC、Kalidindi, SR & Song, L. 3 次元畳み込みニューラル ネットワークを使用した材料構造と特性の連携。 アクタ マテリア 146、76–84。 https://doi.org/10.1016/j.actamat.2017.11.053 (2018)。

記事 ADS CAS Google Scholar

Li, L. & Chen, C. 超弾性材料の構成モデリングのための平衡ベースの畳み込みニューラル ネットワーク。 J. Mech. 物理学。 ソリッド 164、104931。https://doi.org/10.1016/j.jmps.2022.104931 (2022)。

記事 Google Scholar

リー、M.ら。 炭素繊維の機械的特性を予測するための深層学習畳み込みニューラル ネットワークと多層パーセプトロンのハイブリッド融合モデル。 メーター。 デザイン 227、111760。https://doi.org/10.1016/j.matdes.2023.111760 (2023)。

記事 CAS Google Scholar

Hashin, Z. 任意の横相形状の繊維強化材料の弾性挙動について。 J. Mech. 物理学。 固体 13、119 ~ 134。 https://doi.org/10.1016/0022-5096(65)90015-3 (1965)。

記事 ADS Google Scholar

Qu, J. & Cherkaoui, M. 固体のマイクロメカニクスの基礎 (Wiley、2006)。

Google Scholar を予約する

Adams, DF & Doner, DR 一方向複合材の横法線荷重。 J.コンポス。 メーター。 1、152–164。 https://doi.org/10.1177/002199836700100205 (1967)。

記事 ADS Google Scholar

Nakka, R.、Harursampath, D.、Pathan, M.、Ponnusami, SA さまざまな内包物/繊維形状の RVE を生成するための計算効率の高いアプローチ。 コンポ。 構造体。 291、115560。https://doi.org/10.1016/j.compstruct.2022.115560 (2022)。

記事 Google Scholar

Jung, J.、Yoon, JI、Park, HK、Kim, JY & Kim, HS 構造と特性の関連性を確立するための効率的な機械学習アプローチ。 計算します。 メーター。 科学。 156、17-25。 https://doi.org/10.1016/j.commatsci.2018.09.034 (2019)。

記事 Google Scholar

ギブソン、複合材料力学の RF 原理 (CRC Press、2016)。

Google Scholar を予約する

Whitney, JM & Riley, MB 繊維強化複合材料の弾性特性。 AIAA J. 4、1537 ~ 1542 年。 https://doi.org/10.2514/3.3732 (1966)。

記事 ADS CAS Google Scholar

Tang, T. & Yu, W. 異種圧電材料の変分漸近マイクロメカニクス モデリング。 メカ。 メーター。 40、812–824。 https://doi.org/10.1016/j.mechmat.2008.04.007 (2008)。

記事 Google Scholar

Pitchai, P.、Berger, H. & Guruprasad, P. 変分漸近法ベースの均質化技術を使用して、三相複合材料における界面の影響を調査。 コンポ。 構造体。 233、111562。https://doi.org/10.1016/j.compstruct.2019.111562 (2020)。

記事 Google Scholar

ジュゼーヌ、C. & レマクル、J.-F. Gmsh: 前処理機能と後処理機能が組み込まれた 3 次元有限要素メッシュ ジェネレーター。 内部。 J.Numer. メソッド工学 79、1309–1331。 https://doi.org/10.1002/nme.2579 (2009)。

記事 MathSciNet MATH Google Scholar

Simonyan, K. & Zisserman, A. 大規模な画像認識のための非常に深い畳み込みネットワーク。 https://doi.org/10.48550/ARXIV.1409.1556 (2014)。

Kingma, DP & Ba, J. Adam: 確率的最適化の手法。 https://doi.org/10.48550/ARXIV.1412.6980 (2014)。

Paszke、A. et al. Pytorch: 命令型スタイルの高性能深層学習ライブラリ。 上級ニューラルインフォーム。 プロセス。 システム。 32、8026–8037 (2019)。

Google スカラー

リファレンスをダウンロードする

インド科学大学航空宇宙工学部、NMCAD 研究所、バンガロール、カルナータカ州、インド

ラジェシュ・ナッカ & ディネシュクマール・ハルルサンパス

航空宇宙航空研究センター、ロンドン大学都市工学部、ノーサンプトン広場、ロンドン、英国

サティクマール・ポンヌサミ

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

RN は研究を計画、実行し、元の論文草案を書きました。 RN と SAP が研究を考案し、計画しました。 SAP と DH が RN を監督。 SAP、DH、RN が原稿を校正、レビュー、編集しました。

Sathiskumar A Ponnusami への通信。

著者らは競合する利害関係を宣言していません。

シュプリンガー ネイチャーは、発行された地図および所属機関における管轄権の主張に関して中立を保ちます。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Nakka, R.、Harursampath, D. & Ponnusami, SA 材料特性のエンコーディングと物理ベースの境界を利用した、均質化のための一般化された深層学習ベースのサロゲート モデル。 Sci Rep 13、9079 (2023)。 https://doi.org/10.1038/s41598-023-34823-3

引用をダウンロード

受信日: 2022 年 11 月 11 日

受理日: 2023 年 5 月 9 日

公開日: 2023 年 6 月 5 日

DOI: https://doi.org/10.1038/s41598-023-34823-3

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。

共有