[Kubernetes] PyTorch 학습 시 Pod의 빠른 종료를 위한 yaml 설계 방법

기존 방법으로는 kubectl delete 시 –force –grace-period=0 옵션을 주어야만 강제 종료되고, 학습 process에 실제로 Ctrl+C를 주는 것과 동일하게 SIGTERM 을 보낼 수는 없었습니다. 이러한 문제점은 학습 프로세스의 종료시 callback들 (wandb 등)이 정상 작동하지 않는다는 문제점이 있습니다.이를 해결할 수 있는 방안을 소개 드립니다.다만 아래와 같은 몇 가지 drawback이 있으므로 참고하여주시고, 더 좋은 방법이 있다면 공유 부탁드립니다. pip install 이 불가능하므로 미리 requirements.txt를 설치한 …

[OpenWRT] 외부 네트워크로부터 WOL(Wake on LAN) 패킷 보내기

OpenWRT에서 외부 네트워크로부터 WOL packet을 전달하여 PC나 NAS 기기를 켜는 방법입니다. OpenWRT의 경우 PC를 종료하면 자동으로 ARP Table이 날라갑니다 (심지어는 Permanent로 지정해주어도 PC를 켰다가 다시 종료하면 또 날라갑니다.) IP주소와 MAC 주소가 ARP Table에 있어야만 WOL packet이 해당 PC에 정상적으로 전달되기 때문에, 여기서는 1분에 한 번씩 ARP cache를 확인하여 없으면 추가해주는 방식으로 진행하도록 하겠습니다. firewall-based 방식도 …

Windows 멀티부팅 폴더 접근권한 삭제(복원)하기

Windows를 멀티부팅하게 되면, 서로 다른 OS 내의 홈폴더 (예를 들어, D:\Users\jungin500)에 접근해야할 일이 생깁니다. 다만 폴더 접근 권한 때문에 이런 창이 한번은 뜨게 되고, <계속> 버튼을 누르면 오랜 시간이 걸린 뒤 어찌되었든 해당 폴더에는 이제부터 접근할 수 있게 됩니다. 문제 제기 다른 OS로 다시 부팅해서 C:\Users\jungin500 폴더의 속성 내 보안 탭을 보면, 기존에 없던 새로운 …

Raspberry Pi Compute Module 4 (CM4) I/O Board RTC 사용하기

환경 Raspberry Pi CM4 2GB w/o eMMC/WiFi Raspberry Pi CM4 I/O Board PCF85063A RTC module CR2032 battery Ubuntu Server 20.04 aarch64 (Raspberry Pi build) 사용 방법 /etc/rc.local /lib/systemd/system/rc-local.service /etc/rc.local 권한 설정 crontab 재부팅 후 dmesg로 결과 확인 참고자료 https://tutorials-raspberrypi.com/controlling-the-raspberry-pi-rtc-module-i2c-real-time-clock/ https://forums.raspberrypi.com/viewtopic.php?t=293632

[DSM 7.0] Synology DSM Docker에서 Docker-in-Docker (dind) 실행하기

서론 Docker-in-Docker는 이미 존재하는 Docker Daemon에서 새로운 Container를 구동하고, 그 안에서 새로운 Daemon을 구동하는 기법이다. 기존에는 docker:dind 이미지와 –privileged 플래그를 이용하여 새로운 컨테이너를 생성하면 바로 가능한 간단한 문제였으나, Synology DSM 7.0에서는 기본 docker의 storage-driver가 aufs로 설정되어 있고 overlay2 드라이버를 지원하지 않으므로 이러한 기본적인 접근방식은 불가능하였다. 해결 방법 기존에는 아래와 같이 dind 컨테이너를 생성하였다. 위 명령어는 …

[해결됨] WSL2 CUDA undefined symbol: devicesetgpcclkvfoffset 문제 해결하기

[추가] 현재는 Fix된 이슈임 Windows 11 Insider Preview Build 22000.51이 나온 뒤에는 해결된 문제입니다. 아래 환경에서 테스트하였으니 apt 패키지와 드라이버를 업데이트 해보시기 바랍니다. OS: Windows 11 Insider Preview Build 22000.51 Driver: NVIDIA 470.76 APT Package Version List Inst libnvidia-container1 (1.4.0-1 NVIDIA CORPORATION [email protected]:1.0/bionic [amd64]) Inst libnvidia-container-tools (1.4.0-1 NVIDIA CORPORATION [email protected]:1.0/bionic [amd64]) Inst nvidia-container-toolkit (1.5.1-1 NVIDIA …