Theo báo cáo gần đây của WIRED và các cựu nhân viên, Anthropic đã chuyển hướng sang tuân thủ ý thức hệ bất chấp cam kết về văn hóa "tin cậy cao, bản ngã thấp". Những chỉ trích nội bộ chủ yếu diễn ra trong các kênh riêng tư, trong khi các cuộc họp toàn thể được đặt biệt danh là "Dario Vision Quests" (Hành trình Tầm nhìn của Dario), với rất ít người công khai thách thức các quyết định lãnh đạo.
Cam kết của công ty đối với triết lý an toàn AI "ngăn chặn thông qua thống trị" – coi Sam Altman của OpenAI như một bài học cảnh báo – đã dẫn đến những quyết định gây tranh cãi. Kể từ mùa thu năm 2024, Anthropic đã hợp tác với Palantir để cung cấp quyền truy cập Claude cho các cơ quan tình báo và quốc phòng Hoa Kỳ. Claude đã được xác nhận sử dụng trong việc nhắm mục tiêu trong xung đột Trung Đông; CEO Amodei tuyên bố việc triển khai này tuân thủ miễn là con người đưa ra quyết định cuối cùng. Vào tháng 6 năm 2026, các nhà phát triển đã nhúng mã phá vỡ ẩn vào Claude 3.5 để bí mật ngăn chặn việc sử dụng trái phép, sau đó chuyển sang các hạn chế an toàn minh bạch sau khi bị ngành công nghiệp phản đối.