Kỹ thuật tự giám sát, phân tích và báo cáo (S.M.A.R.T: Self-Monitoring, Anylysis, and Reporting Technology) là một tiêu chuẩn công nghiệp phục vụ cho việc dự đoán lỗi của ổ đĩa. Khi S.M.A.R.T được kích hoạt cho một ổ đĩa, ổ đĩa giám sát các thuộc tính định trước mà dễ bị ảnh hưởng đến sự giảm chất lượng của ổ đĩa hay chỉ ra sự giám sát chất lượng của ổ đĩa. Dự trên những thay đổi ở các thuộc tính bị giám sát, một dự đoán lỗi có thể được thực hiện. Nếu trên những thay đổi ở các thuộc tính bị giám sát, một dự đoán lỗi có thể được thực hiện. Nếu trên những thay đổi ở các thuộc tính bị giám sát, một dự đoán lỗi có thể được thực hiện. Nếu một lỗi được cho rằng sắp xảy ra, S.M.A.R.T sẽ tạo ra một báo cáo tình trạng để phần mềm BIOS hệ thống hoặc trình điều khiển có thể thông báo cho người sử dụng các vấn đề sắp xảy đến, có thể cho phép người sử dụng sao chép dự phòng dữ liệu trong ổ đĩa trước khi bất kỳ sự cố thực sự nào xảy ra.
Các lỗi có thể dự đoán là các loại lỗi mà S.M.A.R.T cố gắng để phát hiện ra. Các lỗi này bắt nguồn từ sự giảm chất lượng dần dần của hiệu suất ổ đĩa. Theo Seagate, 60% lỗi ổ đĩa là từ cơ học, chính xác loại mà S.M.A.R.T, được thiết kế để dự đoán.
Tất nhiên, không phải tất cả các lỗi đều có thể dự đoán S.M.A.R.T không thể làm gì được khi xảy ra các lỗi không thể dự đoán mà không có bất kỳ cảnh báo trước nào. Các lỗi này có thể đo tĩnh điện, vận chuyển không đúng quy cách, va chạm bất ngờ hay hỏng mạch điện gây ra, như là các vấn đề hợp kim hàn có liên quan đến nhiệt hay hỏng linh kiện.
S.M.A.R.T đầu tiên được IBM tạo ra vào năm 1992. Năm đó IBM bắt đầu bán ra các ổ cứng 3 ½” được trang bị phân tích lỗi dự đoán (PFA: Predictive Failure Analysis), một kỹ thuật được IBM phát triển do định kỳ các thuộc tính ổ đĩa được chọn lựa và gửi một cảnh báo khi một ngưỡng giới hạn bị vượt qua. IBM chuyển công nghệ này sang tổ chức ANSI, sau đó nó đã trở thành giao thức S.M.A.R.T chuẩn ANSI cho các ổ đĩa SCSI, như đã được định nghĩa trong ANSI-SCSI Informational Exception Control (IEC) tài liệu X3t 10/94-190.
Thích thú với việc mở rộng công nghệ này vào ổ đĩa ATA dẫn đến việc tạo ra nhóm nghiên cứu S.M.A.R.T vào năm 1995. Bên cạnh IBM, các công ty khác đại diện trong nhóm đầu tiên là Seagate Technology, Conner Peripherals (nay là một thành phần của Seagate), Fujitu, Hewlett-Packard, Maxtor, Quantum và Western Digital. Đặc điểm kỹ thuật S.M.A.R.T do nhóm này tạo ra và được đặt thành lĩnh vực chung bao trùm cả hai ổ cứng ATA và SCSI và vẫn có thể được tìm thấy trong hầu hết các ổ đĩa được sản xuất gần đây trên thị trường.
Thiết kế các thuộc tính và giới hạn của S.M.A.R.T tương tự với các môi trường ATA và SCSI, nhưng báo cáo thông tin lại khác nhau.
Trong một môi trường ATA, trình điều khiển trong hệ thống biên dịch các tín hiệu báo động từ ổ đĩa do lệnh “Report status” của S.M.A.R.T tạo ra. Trình điều khiển này thăm dò ổ đĩa thường xuyên để kiểm tra tình trạng của lệnh này, nếu nó báo tín hiệu lỗi sắp xảy ra, gửi một báo động đến hệ điều hành, người sử dụng sẽ nhận được một thông báo lỗi trên màn hình. Kiến trúc này cũng cho phép các cải tiến trong tương lai,mà có thể cho phép báo cao các thông tin hơn là chỉ báo cáo các tình trạng lỗi của ổ đĩa. Hệ thống có thể đọc, đánh giá các thuộc tính và các báo động được báo cao thêm vào lệnh “Report Status” cơ bản.
Các ổ đĩa SCSI có S.M.A.R.T coi là đáng tin cậy chỉ khi hoặc là tốt hoặc là lỗi. Trong một môi trường SCSI, quyết định lỗi xảy ra tại các ổ đĩa và máy chủ thông báo cho người sử dụng về các thao tác. Đặc điểm kỹ thuận SCSI cung cấp một bit phán đoán để đánh dấu nếu ổ đãi xác thực độ tin cậy. Hệ thống sau đó báo người dùng thông qua một thông báo.
Lưu ý rằng các chuẩn đoán đĩa truyền thống như là Scandisk chỉ hoạt động trên các sector dữ liệu của bề mặt đĩa và không giám sát tất cả các chức năng ổ đĩa mà S.M.A.R.T, giám sát. Hầu hết các ổ đĩa hiện đại đều giữ các sector dự phòng sẵn sàng để sử dụng thay thế cho các sector lỗi. Khi một trong những sector dự trữ này được định rõ lại, ổ đĩa báo cáo hoạt động cho máy đếm S.M.A.R.T, nhưng vẫn tỏ ra hoàn toàn không lỗi đối với tiện ích phân tích bề mặt như Scandisk.
Các ổ đĩa có S.M.A.R.T giám sát sự đa dạng thuộc tính thay đổi mỗi nhà sản xuất. Các thuộc tính được lựa chọn bởi nhà sản xuất thiết bị dựa trên khả năng của họ đóng góp vào dự đoán các tình trạng lỗi hay giảm chất lượng hay các điều kiện lỗi cho ổ đĩa cụ thể đó. Hầu hết các nhà sản xuất ổ đĩa đều quan tâm đến bộ thuộc tính cụ thể đang được sử dụng và tính đồng nhất của các thuộc tính này giống như cái đặc thù và quyền sở hữu của nhà kinh doanh.
Một số ổ đĩa giám sát chiều cao nổi của các đầu từ bên trên môi trường từ tính. Nếu chiều cao này thay đổi một số không đáng kể, ổ đĩa có thể bị lỗi. Các ổ đĩa khác, có thể giám sát theo thuộc tính khác nhau, như là hệ mạch điện ECC cho biết liệu các lỗi phần mềm có xảy ra khi đọc hoặc ghi dữ liệu hay không. Một số các thuộc tính được giám sát trong các ổ đĩa khác nhau bao gồm những điều sau đây:
+ Chiều cao nổi của đầu từ (Head floating height)
+ Tốc độ băng thông của dữ liệu (Dât throughput performance)
+ Thời gian quay (Spin-up time)
+ Đếm sector (dự phòng) được định rõ lại (Reallocated (spared) sector count)
+ Tỷ lệ lỗi tìm kiếm (Seek error rate)
+ Hiệu suất thời gian tìm kiếm (Seek time performance)
+ Đếm lại vòng quay của ổ đĩa (Drive spin-up retry count)
+ Đếm lại định cỡ của ổ đĩa (Drive calibration retry count)
Mỗi thuộc tính có một giới hạn được sử dụng để xác định sự tồn tại của một điều kiện xuống cấp hay lỗi. Các ngưỡng này được nhà sản xuất ổ đĩa thiết lập, chúng có thể khác nhau theo các nhà sản xuất và các model và không thể thay đổi.
Các yêu cầu cơ bản để S.M.A.R.T thực hiện chức năng trong một hệ thống rất đơn giản. Bạn chỉ cần có một ổ cứng có khả năng S.M.A.R.T và một BIOS biết nhận diện S.M.A.R.T hay trình điều khiển ổ cứng biết nhận diện S.M.A.R.T cho hệ điều hành cụ thể của bạn. Nếu BIOS của bạn không hỗ trợ S.M.A.R.T, các chương trình tiện ích có sẵn có thể hỗ trợ S.M.A.R.T trong một hệ thống cho trước. Các chương trình này bao gồm Norton Utilities của Symantec, EZ Druve của StorageSoft và Data Advisor Ontrack.
Khi các thay đổi thích đáng xảy ra trong các thuộc tính được giám sát để gây ra một báo động S.M.A.R.T ổ đĩa gửi một cảnh báo qua một lệnh IDE/ATA hoặc SCSI (tùy thuộc vào việc bạn sử dụng loại ổ đĩa cứng nào) đến trình điều khiển ổ cứng trong BIOS hệ thống nơi thường báo sự cố trong suốt quy trình POST mà lần kế tiếp hệ thống khởi động.
Nếu muốn báo cao ngay lập tức, bạn có thể chạy một tiện ích chất vấn S.M.A.R.Tvề hiện trạng của ổ đĩa, như là S.M.A.R.T, Explirer của Adenix (www.adenix.net) hay HDD Health của Panterasoft (www.panterasoft .com).
Việc đầu tiên phải làm nếu bạn nhận được một cảnh báo S.M.A.R.T là sao dự phòng tất cả các dữ liệu trong ổ đĩa. Tôi đề nghị bạn nên sao dự phòng vào đĩa mới và không ghi đè lên bất cứ sao lưu trước đó, chỉ trong trường hợp ổ đĩa bị hỏng trước khi việc sao dự phòng mới được hoàn tất.
Sau khi sao lưu dữ liệu, bạn nên làm gì? Các báo động S.M.A.R.T có thể được gây ra bởi một nguồn bên ngoài và có thể không thật sự chỉ ra bản thân ổ đĩa đang bị hỏng. Ví dụ, các thay đổi môi trường như là nhiệt độ xung quanh cao hay thấp đều có thể gây ra báo động S.M.A.R.T cũng như các nguồn bên ngoài có thể gây chấn động quá mức trong ổ đĩa. Ngoài ra, sự nhiễu điện từ các motor hay các thiết bị khác trong cùng một mạch điện với PC của bạn có thể tạo ra các báo động này.
Nếu những báo động không do một nguồn bên ngoài gây ra, thì nên thay một ổ đĩa mới. Nếu ổ đĩa vẫn còn được bảo hành, hãy liên hệ với nhà cung cấp và hỏi liệu họ có thay nó hay không. Nếu không có thêm cảnh báo nào xảy ra, có thể đấy là lỗi bất thường, bạn có thể không cần thay ổ đĩa khác. Nếu bạn nhận được thêm các báo động, đề nghị nên thay ổ đĩa khác. Nếu có thể két nối với cả hai ổ đĩa mới và cũ (bị lỗi) vào cùng một hệ thống, bạn nên sao chép toàn bộ nội dung của ổ cứng cũ vào ổ cứng mới, cứu nguy cho bạn khỏi phải cài đặt hay tải lại tất cả bộ nội dung của ổ cứng cũ vào ổ cứng mới, cứu nguy cho bạn khởi phải cài đặt hay tải lại tất cả các ứng dụng và dữ liệu từ sao dự phòng của bạn. Bởi vì các lệnh copy tiêu chuẩn hay các phương pháp kéo và thả (drag and drop) không sao chép các tập tin hệ thống, các tập tin ẩn hoặc các tập tin đang được mở để sao chép toàn bộ đĩa một cách thành công và có ban ghi copy mà vẫn có thể khởi động được, bạn cần có một ứng dụng đặc biệt như Symantec Norton Ghost hoặc Acronis True Image.
Giá thành
Giá thành của ổ cứng lưu trữ vẫn đang tiếp tục giảm. Bây giờ bạn có thể mua một ổ đĩa 1TB với khoảng $90, khoảng 9 cent/gigabyte.
Một ổ đĩa tôi mua năm 1983 có dung lượng tối đa 10MB và có giá $1.800. Với giá hiện tại (180.000$/gigabyte). Giá hiện tại ($0.09/gigabyte) ổ đĩa có giá ít hơn 1/10 penny!
Tất nhiên, giá thành của ổ đĩa tiếp tục giảm, chúng ta có thể mong đợi trong tương lai các dung lượng lớn hơn và các giá thành thấp hơn nữa.
Theo “Nâng cấp và sửa chữa máy tính” Scott Mueller