引言 根据外媒获得的亚马逊内部文件,因该公司没有足够的服务器来处理Prime Day的流量激增,导致它启动一个缩小的备份页面,并暂时关闭了所有国际流量。
根据外媒获得的亚马逊内部文件,因该公司没有足够的服务器来处理Prime Day的流量激增,导致它启动一个缩小的备份页面,并暂时关闭了所有国际流量。
据审查文件的专家称,这家电子商务巨头必须手动添加服务器,以满足流量需求,其自动伸缩功能可能在系统导致崩溃之前不能正常工作。
文件显示,亚马逊用于向其零售和数字业务提供计算和存储服务的内部系统故障,导致其依赖于其他服务的一系列故障,包括Prime,身份验证、Alexa、Prime Now和Twitch等服务。甚至一些仓库表示,那段时间,仓库员工无法扫描产品或打包订单。
这些文件揭示了亚马逊在Prime Day对高于预期的流量激增的反应。流量激增导致其网站出现数小时的故障。这也说明了亚马逊在应对这一需求方面面临的困难,尽管它在运营大型网站和云计算平台方面经验丰富。
业内人士表示:“亚马逊不能使用他们现有的所有资源,因为他们的软件存在bug或其他问题。”看完这件文件报告之后,小编借用国内网友的说法就是,看看我国内的双十一,流量肯定更大,但是系统完全扛得住。
尽管在Prime Day系统故障达数小时,不过对整体销售的影响微乎其微。亚马逊表示,这是公司历史上“最大的购物活动”,在长达36小时的活动中,Prime会员购买了超过1亿件商品。
外媒采访的六位亚马逊卖家也表示,他们对今年Prime Day的销售感到满意,即便是遇到了短暂的无法售卖现象。
亚马逊还没有就这次宕机事件公开发表过多评论。该公司在网站崩溃两小时后发表了一份单独的声明,简洁地说“一些客户在购物时遇到了困难”,并表示正在努力“尽快解决问题”。
在亚马逊的一封内部电子邮件中,贝索斯指出,他对负责网络的团队感到“失望”,并表示,该公司已经在研究如何防止此类事件再次发生。贝索斯在邮件中写道:“技术团队已经在努力改进我们的架构,我相信明年我们将提供更好的体验。”
亚马逊在当地时间周一中午推出Prime Day后就发现网站上出现了小故障。随后,它匆忙制定了备份计划,并在活动开始的第一个小时内迅速做出了改变。
下午12点的更新显示,亚马逊将首页改成了一个更简单的“后退”页面,因为它看到了越来越多的错误。业内人士指出,亚马逊Prime Day的主页看上去非常简单,设计也很糟糕,简化后的网页很可能是为了减少服务器的负载。
其中一份文件写道:下午12:15分。在美国,亚马逊决定暂时切断所有国际流量,以“减轻”系统的压力。在美国,它将默认的首页重新开放到只有25%的流量。大约半小时后,亚马逊做的一些改进提高了系统性能。
即使在做出这些改变之后,亚马逊网站的“错误率”仍然持续恶化,直到下午1点10分左右,系统才大幅改善,内部网站性能图表显示正常。其中一项更新称,亚马逊部分地区的订单率“显着高于预期”两倍,一位熟悉此事的人士称,当时亚马逊办公室场景“混乱”,并且一度说超过300人接听了紧急电话会议。
在系统故障之时,亚马逊选择不关闭其网站。相反,它根据文件手动添加服务器,以逐步改善网站性能。有消息称,由于增长额外流量,亚马逊正在考虑添加50到150个“主机”或虚拟服务器。
扫码关注二维码
扫码加入社群
扫一扫
关注亿恩公众号