“又是硬盘惹的祸!”当硬盘的声音突然由原来正常的摩擦音变成了怪音,或者出现开机慢、系统卡死等情况,你可能早就在心中抱怨了千百遍。
统计数据显示,当前数据中心硬件故障中有48%为硬盘故障,且运维人员往往会“后知后觉”,这极大地影响了IT系统的运维效率和成本。
有AI,一切问题都不是事儿
遇到硬盘故障,你会怎么做?把它交给专业人员处理,听天由命?现在,随着人工智能(AI)、机器学习等技术的落地,包括硬盘在内的各种硬件设备故障都可以准确检测甚至预知,使得业务连续性得到更好的保障。
AI不是数据科学家、AI架构师、AI算法工程师的事吗?对于大量像你我这样非人工智能专业人士来说,即使知道AI可以更好地“挽救”硬盘,但似乎也于事无补。
不可否认,AI在行业落地过程中确实存在着诸如技术门槛高、开发周期长、专业人才短缺、模型的可复制性差等若干问题和挑战。由于专业技能的缺失或不系统,即使具有一定AI基础的专业人士有时也很难判断自己构建的模型是不是优化的。专业人士尚且如此,那么对于零基础或者刚刚入门AI的人来说,自己通过搭建AI模型来检测硬盘故障是不是不可能完成的任务呢?
功夫不负有心人,终于让我在华为云学院上找到了NAIE AutoML(Automatic Machine Learning)的一项微认证课程。通过自助式的在线学习,即使是非AI专业人士也能很快掌握AutoML的开发技巧。有了AutoML作后盾,硬盘故障检测成了小菜一碟。
有AutoML,硬盘故障检测小菜一碟
AutoML是一个既能满足专业开发人员需求,又非常适合AI初学者的工具。AutoML是一个自动化机器学习分析系统,可以让普通的开发人员、业务人员参与机器学习建模,同时把数据科学家从繁琐、反复的算法调优中解放出来,从而降低机器学习的使用门槛,提升工作效率。AutoML不愧为一个灵巧的“多面手”,这是因为它将机器学习中的数据预处理、特征工程、算法模型、集成学习等经验性工作自动化,大幅度提升了开发效率。
通过华为云学院提供的NAIE AutoML微认证课程,即使是“小白”也可以亲自动手查找和分析硬盘故障,而不用再求助他人,心里一种满满的成就感油然而生。
基于硬盘SMART特征,可以通过机器学习实现硬盘故障提前预测故障时间点,估算数据修复窗口,并根据负载制定修复计划,提前进行修复操作。这样做的好处显而易见:实现主动响应,提前规划故障处理窗口,将现网业务的影响降到最低;减少大量数据恢复的人力;实现主动规划,可预测故障时间点,估算数据提前规划故障的处理窗口,将运维人员被动响应、临时突发的工作状态转变为主动规划、统一处理,从而减轻运维人员的压力。
使用过NAIE AutoML的人都有同感,入门易、上手快。因为NAIE AutoML框架具备强大的超参优化引擎、集成学习、可扩展、可复现等关键特性,极大地降低了机器学习的门槛,可以显著提高模型开发的效率。具体来说,针对硬盘故障检测,基于AutoML建模,虽然要通过加载依赖包和数据、定义业务目标、AutoML模型训练、模型保存和加载、模型推理、模型评估等几个环节,但这些环节都可以通过直接调用AutoML自动化完成,从而大大提高了开发效率,同时降低了复杂度。
笔者亲自体验了基于WebIDE的实验流程:只要注册一个华为云账号,进入模型训练服务,就可以轻松完成项目创建并导入数据;接下来,就可以创建并进入WebIDE开发环境;在最核心的模型训练、推理和评估阶段,基于AutoML可以开发硬盘故障代码,并调试、运行代码;最后一步,删除WebIDE开发环境。整个过程体验下来,十分流畅,也并没有想象中那样复杂。
普通AI开发者可以直接调用NAIE AutoML来处理大部分业务场景问题;对于专业AI开发者,NAIE AutoML可以提供高可扩展的接口,供用户针对业务场景自定义相关模块以解决相应的业务问题。
俗话说,工欲善其事,必先利其器。NAIE AutoML可以辅助用户更高效、更迅速地解决AI开发问题。
有华为云微认证,随时随地提升专业技能
说到这,不管你是一个专业的AI开发者,或者只是对AI感兴趣、想尝试一下的“小白”,是不是都有一种想利用NAIE AutoML一展身手的冲动?
快速加入:
https://edu.huaweicloud.com/certifications/c6976dcfac5644c79987337e01e6d844