2年ぶりにPCをいじくる
GPT 関連のモデルを自分で回したいと思い、2年前から使っているPCにGPUを増設することにした。
2年前に初めて作ってから、素人がとりあえずで触るものではないなと思ったので、ずっと触らずにきたが、満を持して。
2年前にもお世話になった友人に再度手伝ってもらい、GPUのおすすめ等を聞いてたら、一緒に秋葉原に行くことになった。
GPU3060を買いに行ったが、不思議なことに帰り道ではSSD と RAM も袋に入っていた。
取り付け
100%初心者でよく分かっていないが、すでに取り付け済みのものがあるので、それに倣って設置すればいいと考えた。
なお、2年分のほこりがすごかった
RAM は押す
RAMを取り付けようとして、全然はまらなくて焦った。
ツメが片方しか開かなくて、正常には見えたが、調べて出るサイトだと全て両側にツメがあるタイプで、迷った。
結局、はまらないのはサイドの滑りが悪いから、と出てきたので、いくつかの角度から強めに押しこんでみて、挿した。
さて、2枚目のRAMをさそうとしたら、CPUクーラーの出っ張りがRAMの取り付け位置にはみ出していて、付けられなかった。
そこでCPUクーラー(その時は何のファンだったかは意識せず、ただのファンだと思っていた)を外すことにした。
CPU クーラー
壊したかと思った
なんか2種類ネジがあったが、ファン側だけ外せばよかったので外そうとした。
しかしネジが外れなかった。
諦めてマザボに近い方のネジを外すことにした。プッシャー(バネみたいな)がついていたので、外す時に勢い良く外れた。電動ドリルで作業してたので、ちょっとしたパニックだった。
また、CPUとグリスでくっついていたところをおそらくねじ切ったので、それも変な力が入って壊れたんじゃないかと大いに焦った。
外してから、このファンはCPUの上に乗ってるやつだと思いだした。外しては行けない、と聞いていた気がしたので、やらかしたと思った。
あと、外す時にいろんな音がしたので、CPUが壊れてないか心配だった。この心配は最後に電源をつけて動かすまで続いた
再取り付け
向きを変えてCPU クーラーを取り付けようとしたら、 ネジが明らかにマザボに届いていなかった。ネジはジャンパーを持っていてそれを押し込みながら回さないといけないのかと思いどう頑張っても力が入らないので詰みかと思った
ケースを立てようとしたときに何かが動く音がして、偶然にもケースの逆側に板が落ちていることを発見した。サイズ的にマザボの裏側からファンを取り付けのためのものだと理解して、ボードを抑えながらで大変だったが、ファンも取り付けられた。
グリスを持っていなかったので、熱効率が悪くなるらしいと知りつつ、とりあえず付けた。前のグリスが固まった破片が飛び散っていて、静電気が怖かったので、慎重にとった
SSD
取り付ける場所を見つけるのが大変だった
ネジが、2年前の箱の中にそれっぽいのがあって良かった。別で買う必要があるのかと焦った
ななめに差し込んだあと、ゆっくり押さえつけた。これも割れそうで怖かった。
監視
温度監視には lm-sensors
というツールを使う
https://kaworu.jpn.org/ubuntu/lm-sensors
sudo apt install lm-sensors sudo sensors-detect #全部yes sensors
平常時は50度くらい
適当に繰り返し実行するスクリプトを書く
while true; do sensors | tee -a temperature.log && sleep 2; done
負荷
負荷には stress
というツールがあるらしい
stress コマンドを使ってマシンに負荷をかける - CUBE SUGAR CONTAINER
sudo apt-get -y install stress pcp util-linux
cat /proc/cpuinfo | grep processor | wc -l 12
上記の監視コマンドを流しながら、別のターミナルで負荷をかけてみた
stress -c 4 stress: info: [40492] dispatching hogs: 4 cpu, 0 io, 0 vm, 0 hdd
結果、90度まで行ってしまった
$ cat temperature.log | grep Tctl Tctl: +49.4°C Tctl: +49.9°C Tctl: +49.6°C Tctl: +50.2°C Tctl: +65.5°C Tctl: +83.1°C Tctl: +86.6°C Tctl: +89.4°C Tctl: +91.1°C Tctl: +91.0°C Tctl: +92.5°C Tctl: +94.1°C Tctl: +94.9°C Tctl: +95.0°C Tctl: +95.1°C Tctl: +94.8°C Tctl: +89.0°C Tctl: +83.2°C Tctl: +78.1°C Tctl: +73.8°C
総評
調達から組み立て、検証までを一人でやるのはやっぱり無理な分野だと思う。
わからないことを予想を建てて、調べて、なんとかする、はソフトウェアエンジニアリングと近しいところがあるが、ミスった時に数万円が消えると考えると、メンタル的に重労働だった。
追記:グリス塗った
重い腰を上げて、CPUグリスを塗った。 同時に、フロンガスのスプレーを買ってホコリを除去したが、恐ろしいほどにホコリが俟った。
グリスを塗って無事に再起動できた後、同様の負荷実験をしてみた。
平常時:40℃ 負荷最高温度 81℃
というところだった。
追記:ダブルディスプレイにした
グリスは塗っていたが 50度前後になっていた。