RAMスティックを抜き差しして、RAMエラー/問題を解決できますか?
私はAskUbuntuでこの質問をしましたが、今ここで尋ねているより具体的なハードウェアの質問があります。
Memtest86 +で約6000のエラーが見つかり、1時間で10回以上のフリーズとハードリブートが発生したため、RAMが不良だったようですが、両方のRAMモジュールを取り外してから再度接続したので、できます。 t新しいエラーが1つ発生します。保証期間中なので、デルは今週、マザーボード全体と両方のRAMスティック(各8 GB)を無料で交換する用意がありますが、申し出を拒否する必要があると考えていますが、ハードウェアがまだ不良である可能性があるのではないかと心配しています。 。エラーが発生しなくなったので、マザーボード全体を交換するために今必要なリスクよりもリスクが高いのではないかと思います。特に、再生部品を使用するため、また、再生ハードウェア部品全般に関する私の経験(Dellではない)まったく-しかし一般的には)私が本当に選択の余地がない限り、遠ざかるように私に言います。
私は何をすべきか?私のRAMは今までに悪かったですか?それとも、RAMのプラグを抜き差しするだけで、どういうわけか解決されたのは、機械的なピンの位置合わせや破片の問題でしたか?
私のコンピューターは1年前のものであることに注意してください。これは、ハイエンドのデルのノートパソコンです。最近、Windows 10を完全に消去し、Ubuntu20.04をインストールしました。
これがデルのサポートチームに送信した完全な説明ですが、エンジニアが私の説明を確認したことは一度もないので、ここの誰かが何が起こったのか、そして解決策が何であるかを知っているかどうかを確認したいと思います。
[デルに送信したメッセージ(開始)]
トラブルシューティングを行ったのですが、困惑しています。
私のオペレーティングシステムはLinuxUbuntu20.04であることに注意してください。
過去2週間、フリーズが発生することがありますが、まれに、通常は起動時またはシャットダウン時にフリーズします。起動中にフリーズすることがあり、再試行するには電源ボタンを押したままにする必要がありました。あまり考えていませんでしたが、それでも戸惑いました。3日前、Linuxコンピューターのソフトリブートに使用される特別なCtrl + Alt + PrScr + REISUBシーケンスでLinuxカーネルを中断することなく、ソフトリブートの形式が機能しない完全なフリーズを繰り返し経験しました。私は毎回完全なハードリブートをしなければなりませんでした。これは何度も何度も発生しました-1時間以内に約10回以上。システムは完全に使用できませんでした。
Dell Diagnosticsメニューを起動し、診断を2回実行しました。それらがメモリテスト画面で約15分間フリーズするたびに、画面上で4分20秒のようなものがフリーズしたままになるため、毎回ハードリブートして終了しました。
その後、その時点(3日前)にBIOSを1.9から1.15.1にアップグレードしましたが、フリーズが続きました。次に、BIOS / UEFIでレガシーブートを有効にし、Memtest86 + v5.01(https://www.memtest.org/)でブートして、メモリテストを実行しました。6分以内に数千のエラーが見つかり、2時間程度で合計5632のエラーが見つかりました。それから私はあなたに電話しました。
これらのエラーのスクリーンショットを次に示します。このスクリーンショットは、アドレス003e295861cでのテスト10のエラーを示しています。例:

このスクリーンショットは、アドレスからDIMMスロットへのメモリマッピングを示しています。ご覧のとおり、このアドレスはDIMM Bにマップされています。これは、メモリが不良であることを意味します。

このスクリーンショットは、たとえば、アドレス0017dfdf1b8でのテスト7のエラーを、テスト開始からわずか5分35秒以内に示しています。これはDIMMAにマップされます。これは、メモリが不良であることを意味します。したがって、両方の記憶が悪いです:

ただし、エラーを再現することはできなくなりました(これで、以降のテスト中にRAMスティックを交換しました)。メモリを個別にテストする場合でも、一緒にテストする場合でも、DIMMAまたはDIMMBでテストすると、合格します。さらに、ブートメニューからのDell診断テストが完了するまで実行され、合格します。これは意味がありますか!?1時間あたり10回以上のフリーズと5632エラーから何もなくなりましたか?マザーボードに問題があるのではないかと思いますが、ブートメニューから実行したすべてのDellDiagnosticsテストにも合格しました。このコンピュータが機能し、信頼性が高く、メモリが破損しないようにする必要があります。どう思いますか?ありがとう!
[デルに送信したメッセージ(終了)]
また、このコマンドを使用してストレステストを実行しました。CPU使用率100%(4コアすべて/ハードウェアスレッド100%)で8時間、RAM使用率は最大98%で、正常に実行されました。 :
stress-ng --cpu 8 --vm 8 --vm-bytes 100% --timeout 8h --metrics
そして、両方のRAMスティックを再挿入した状態でMemtest86 +を30時間以上実行しましたが、エラーは発生しません。
5632エラーからゼロにするにはどうすればよいですか?
注:Memtest86 + v5.01もシングルスレッドモードでのみ実行したため、マルチスレッドモードでの実行に関する既知のバグが原因でエラーが発生することはありませんでした。
関連:
- 関連しているが、間違いなく決定的ではなく、重複していない:ほこりがDDR RAMエラーを引き起こす可能性はありますか?
- ちょっと-ソート関連-これも重複ではありません:RAMが使用するスロットを交換することでRAMエラーが解決されました
将来のトラブルシューティングに関する注意事項(振り返って:私がやりたかったこと):
- 私は希望私は<1時間Memtest86スタンド+テストを毎回2または3回以上を実行しているだろう前に私がされた場合だけ見るために、任意のRAMモジュールを抜い一貫障害のそれらの何千もを取得します。
- 次に、エラーに一貫性があると仮定して、トラブルシューティングを行うために最初に行ったのは、両方のRAMモジュールを取り外してから、元の状態に戻すことでした。次に、テストを再実行します。テストがすぐに合格した場合、直前に数回連続して失敗した後、RAMモジュールが何らかの理由で正しく取り付けられていないことが確実にわかり、プラグを抜いてから再度差し込むと問題が解決しました。 !!
参照:
stress-ng
Linuxストレステストコマンドラインツールについて最初に学び始めた方法:https://www.cyberciti.biz/faq/stress-test-linux-unix-server-with-stress-ng/
回答
RAMを取り出して、元に戻すと、この種の問題を確実に修正できます。
(ただし、問題は数か月以内に再発する可能性があります。)
基本的に、ここには3つの個別の問題があります。
- 機械的公差によるソケットの不安定な接触と、長期間の使用で何度も加熱/冷却することにより、RAM /ソケットがわずかに収縮/拡張します。これにより、接触不良や、接触部に非常に薄い錆の層が形成された可能性があります。RAMを取り付け直すと、接点を機械的に再調整したり、錆を削ったりすることで、これを修正できます。
- RAMとソケットの接点の金属は、通常、化学的にまったく同じではありません(異なる合金)。これにより、金属間の化学反応が発生し、金属間の境界に反応材料の非常に薄い膜が徐々に作成されます。この層は通常、接点自体よりも電気的特性が悪いため、安定性の問題が発生する可能性があります。
RAMを取り出したり戻したりすると、その層が削り取られ、再び形成されるまで準備が整います。特に湿度の高い環境で使用されるコンピュータはこれにさらされる可能性がありますが、これが問題になるまでには通常数年かかります。 - RAMが人によって取り扱われた場合にのみ適用されます:皮膚は油性の残留物を与えます。それがRAMの接点に付着すると、金属とわずかに反応し、接点上に再び薄膜を形成して電気的特性に影響を与える可能性があります。
上記の3つの効果は、組み合わせて表示され、互いに増幅することができます。そして、彼らは問題なくコンピュータを使用して長期間後にポップアップを開始することができます。工場出荷時から内部に触れたことのないコンピュータでも、発生する可能性があります。
疑わしいRAMのテストは、特に利用可能な他の優れたシステムがわからない場合は注意が必要です。
不良RAMが疑われる場合の一般的な方法は、最初にRAMを取り出すことです。
曲がり接触がないか目視検査します。何かある場合は、すぐに捨てます。二度と100%信頼できることはありません。
次に、接点をクリーニングし、RAMを同じスロットに取り付け直します。その後、再テストします。
それでもテストが悪い場合は、そのスロットで正常なRAMを試すことができます。(マザーボードで特定のスロットの組み合わせを使用する必要がある場合は、常に可能とは限りません。)それでもテストが不良の場合は、通常、スロット自体が原因です。
また、別のスロットにある疑わしいRAMのみでテストできます。
マザーボード/メモリコントローラでは、同じスロットでテストするRAMが不良に見えるという問題があります。ただし、メモリのレイアウト/構成を変更する場合(たとえば、RAMストリップのサイズが小さい、または異なる場合)、問題が別のスロットに移動する可能性があることに注意してください。一部のメモリの組み合わせでは不安定で、他の組み合わせでは安定していることが保証されている可能性もあります(存在するRAMの物理レイアウトによって異なります)。
また、BIOSのRAMタイミングを常に標準タイミングに設定してテストしてください。オーバークロックされたRAMは、それ自体の問題を引き起こし、テストの信頼性を低下させる可能性があります。
良好であることがわかっている別のコンピューターがある場合は、問題のあるシステムのRAMを1つだけ使用して2台目のコンピューターを実行するのがおそらく最も簡単です。すべてのRAMを1つずつテストします。次に、前のテストで問題がないことを確認したRAMを使用してマザーボードを実行し、フレーク状のコンピューターでマザーボードをテストします。
接点のクリーニングに関する一言:
マザーボードのスロットをクリーニングしようとしないでください。それらを損傷するのは非常に簡単です。
取り出し/挿入されるRAMストリップの摩擦は、接点をきれいにこすり落とすのに十分です。
RAMストリップ自体について:
鉛筆消しゴムで正しい方向にそっとこすります。(接点を下に向けてRAMを水平に保持する場合は、上から下にこすります。したがって、スロットに挿入した場合のスロットの方向に接点に沿って進みます。)
両側を行い、触れないようにしますあなたの指との接触。
それらに触れた場合(または単に安全のために)、イソプロピルアルコール(任意の薬局で入手可能)にQティップ/綿棒を軽くたたき、それを接点にかけます。Qティップに暗い汚れが見られなくなるまで繰り返します。