
모든 트랜지스터는 매끄럽고 균형 잡힌 완벽한 트랜지스터로 시작합니다.
그런 다음 시간이 흐르기 시작합니다.
전류는 흐르고, 전압은 오르내리며, 열은 조용히 쌓입니다.
한때 안정적이었던 것이 움직이기 시작합니다.
칩은 한꺼번에 고장나지 않고, 마치 살아있는 것처럼 노화됩니다.
전자는 터널을 파고, 필드는 생각보다 얇은 재료를 늘리고, 원자는 움직이기 시작합니다.
신뢰성은 추가하는 기능이 아니라 다른 모든 것이 작동한 후 싸우는 대결입니다.
방정식은 깨끗해 보이고, 웨이퍼는 완벽해 보이지만 표면 아래에서는 아무도 청소할 수 없는 작은 먼지처럼 스트레스가 쌓입니다.
핫 캐리어 주입
핫 캐리어 인젝션은 극적으로 들립니다.
트랜지스터가 스위칭할 때 캐리어(전자 또는 정공)는 높은 전기장 하에서 가속합니다.
대부분은 안전하게 통과하지만 일부는 과한 에너지를 얻습니다.
게이트 산화물에 부딪혀 결합이 끊어지고 트랩이 생성되어 장치의 임계 전압이 이동합니다.
각 충돌마다 작은 상처가 남습니다.
하나의 이벤트는 아무 의미가 없고 수십억 개의 이벤트는 실패를 경험합니다.
트랜지스터는 보정을 잊어버리기 시작합니다.
전류는 필요하지 않을 때 흐르거나 필요하지 않을 때 흐릅니다.
엔지니어는 낮은 전압, 짧은 채널, 새로운 산화물 등 보호 기능을 설계하지만 문제는 스위칭이라는 행위 자체에 숨겨져 있습니다.
모든 논리 연산에는 장치의 건강에 아주 작은 비용이 듭니다.
느리고 보이지 않는 마모입니다.
산의 침식처럼 알아차리는 데 수년이 걸리다가 갑자기 모든 것이 달라집니다.
핫 캐리어 인젝션은 장치를 폭력적으로 부러뜨리지 않고 조용히 피곤하게 만듭니다.
바이어스 온도 불안정성
그리고 또 다른 조용한 드리프트인 바이어스 온도 불안정성(BTI)이 있습니다.
트랜지스터가 너무 오랫동안 바이어스 상태를 유지하면(같은 전압, 같은 온도) 실리콘과 산화물 사이의 인터페이스가 변합니다.
전하가 갇힙니다.
임계값이 이동합니다.
PMOS 장치에서는 이를 음수 BTI, NMOS에서는 양수 BTI라고 부릅니다.
이 효과는 느리지만 지속적이며 시간이 지남에 따라 트랜지스터가 다르게 반응하는 점진적인 슬라이드입니다.
회로는 마진, 예측, 보정으로 보상합니다.
마치 기억 손실을 설계하는 것과 같아서 곧 다가올 기억 손실을 알고 시스템을 스스로 수정합니다.
엔지니어들은 이를 끝없이 연구하며 고온에서 스트레스 테스트를 실행하고 수년 후 기기가 어떻게 작동할지 추측하려고 노력합니다.
지루하고 반복적인 작업입니다.
긴 시간, 작은 교대 근무, 끝없는 데이터.
하지만 모든 그래프는 내구성에 대한 이야기를 들려주며, 오래 지속되도록 만들어진 재료도 결국 자신의 완벽함 아래에서 어떻게 구부러지는지에 대한 이야기를 들려줍니다.
전기 이주
그리고 전자가 아니라 원자의 움직임도 있습니다.
전류 자체가 금속을 움직이기 시작할 때 전자기 이동이 일어납니다.
처음에는 미세합니다.
원자 몇 개가 표류하다가 몇 개가 더 표류하고 천천히 모든 것을 연결하는 선에 빈 공간이 나타납니다.
이 선은 칩의 정맥으로, 한 논리 블록에서 다른 논리 블록으로 전하를 운반합니다.
이 선이 끊어지면 회로는 즉시 죽습니다.
BTI나 HCI와 달리 전자기는 조용하지 않고 재앙적입니다.
하지만 거기까지 도달하는 데는 시간이 걸립니다.
열은 전기를 가속화하고, 높은 전류 밀도가 전기를 공급하며, 작은 상호 연결을 가진 최신 칩은 상황을 악화시킵니다.
엔지니어들은 장벽, 새로운 합금, 두꺼운 선을 추가하지만 그 어느 것도 영원히 지속되지 않습니다.
모든 개선은 시간을 벌어주며, 그 이상은 아닙니다.
전자기 이동은 갑작스럽지도, 극적이지도 않고, 너무 오래 같은 일을 해서 피할 수 없는 마모가 아니라 가장 인간적인 실패처럼 느껴집니다.
신뢰성 연구는 반복적이고 좌절감을 주며 이상하게도 시적입니다.
완벽함은 결코 유지되지 않기 때문에 작업은 끝나지 않습니다.
장치는 작동하기 시작하는 순간 노화되며, 한 문제를 해결하려는 모든 시도는 다른 문제를 드러냅니다.
그럼에도 불구하고 엔지니어들은 새로운 노드가 도착하면 잊혀질 결과를 계속 테스트하고 측정하고 기록합니다.
영광을 위한 것이 아니라 연속성을 위한 것입니다.
내일의 칩이 어제처럼 고장나지 않도록 하기 위해서입니다.
결국 고장날 것을 고치고, 일시적이라는 것을 알고, 어쨌든 해내는 데에는 조용한 존엄성이 있습니다.
어쩌면 그것이 바로 지치지 않는 세상에서 무언가를 계속 작동시키려는 끈기일지도 모릅니다.