Linuxx86_64 커널에서는 마이크로아키텍처별 최적화가 매우 일반적이며 Intel과 AMD CPU 제품군 모두 다양한 성능 트릭을 사용하는 반면, ARM64 Linux 커널 유지관리자는 새로운 마이크로아키텍처별 최적화가 새로운 ARM 프로세서에 영향을 미치기 때문에 도입에 반대합니다.

Ampere Computing은 새로운 AmpereOne 서버 프로세서에 대한 최적화를 제공하기 위해 4개의 패치 세트를 보냈습니다. Ampere Computing은 이러한 새로운 코어 수가 많은 ARM 서버 프로세서가 4K 페이지 크기를 사용할 때 공격적인 프리페치의 이점을 누릴 수 있다는 사실을 발견했습니다. 순차 읽기 성능 테스트에서는 HugeTLB나 Tmpfs를 사용할 때의 이점이 "최대 1.3~1.4x"인 것으로 보고되었습니다.

테스트 결과에 따르면 hugetlb 또는 tmpfs에서는 연속 읽기 성능을 1.3x~1.4x로 크게 향상시킬 수 있습니다.이러한 개선 사항은 AmpereOneLinux 성능을 향상시키는 데 흥미롭지만 현재 이 작업은 메인라인 Linux 커널에 업로드되지 않을 것으로 보입니다.

잘 알려진 ARMLinux 커널 개발자 WillDeacon은 AmpereOneCPU의 성능 향상 패치에 대한 자신의 견해를 표현했습니다.

"우리는 arm64 커널의 마이크로아키텍처별 최적화를 기피하는 경향이 있습니다. 이러한 최적화는 유지 관리가 매우 어렵고, 적절한 테스트가 어렵고, 종종 부풀어오르고, 라이브러리 루틴 업데이트에 추가 장벽이 추가되기 때문입니다.

물론 우리는 copy_page()(ARM64_HAS_NO_HW_PREFETCH로 위장)에 Thunder-X1에 대한 도움이 있지만 솔직히 말해서 해당 머신에는 얻을 수 있는 모든 도움이 필요합니다.

그러므로 나는 병합을 기대하지 않습니다. 최신 CPU는 데이터 복사 작업을 더 잘 수행해야 합니다. 이것은 로켓 과학이 아닌 copy_to_user()입니다. "

ARM의 Mark Rutland도 Deacon의 의견에 동의하고 Thunder-X1의 목표 최적화를 취소하는 데 동의했습니다. 커널 개발자 MarcZyngier는 이에 동의하고 이미 Thunder-X1 관련 코드를 제거하기 위한 패치 작업을 진행하고 있습니다.

코드를 유지 관리 가능하게 유지하고 지나치게 복잡한 ARM64Linux 커널 코드를 피하기 위해 더 이상 CPU/마이크로 아키텍처 관련 최적화를 추구하지 않습니다. 향후 ARMLinux에 초점을 맞춘 배포판이 이러한 패치를 자체적으로 포함할 것인지, 아니면 AmpereOne에 최적화된 Linux 배포판이 앞으로 나아갈 것인지 지켜볼 가치가 있습니다. 특히 Ampere가 고성능 및 에너지 효율적인 ARMLinux 서버에 중점을 두고 있다는 점을 고려하면, 특히 AMDEPYC 및 IntelXeon 서버와 경쟁하는 것을 목표로 한다는 점을 고려하면 최적화의 흔적을 남기고 싶지 않을 가능성이 높습니다.