一、断点续传是什么$ K; H. U$ b% D w- G
不管怎样简单的需求,在量级达到一定层次时,都会变得异常复杂。文件上传简单,文件变大就复杂,上传大文件时,以下几个变量会影响我们的用户体验:/ z( |/ U- k& B/ H) H
服务器处理数据的能力
请求超时
网络波动. a. l7 v/ G% B7 P3 f
上传时间会变长,高频次文件上传失败,失败后又需要重新上传等等。为了解决上述问题,我们需要对大文件上传单独处理,这里涉及到分片上传及断点续传两个概念。$ b/ E1 b# U& c 1、分片上传; l8 A; O5 c9 k' h
分片上传,就是将所要上传的文件,按照一定的大小,将整个文件分隔成多个数据块(Part)来进行分片上传。如下图: - A' F- j4 L3 D: H # K+ G' k2 I9 K) |$ ^5 M; \8 W 上传完之后再由服务端对所有上传的文件进行汇总整合成原始的文件 % O3 I2 y J& [. }1 Q 大致流程如下: " \, W' r# J* x/ R
将需要上传的文件按照一定的分割规则,分割成相同大小的数据块;
初始化一个分片上传任务,返回本次分片上传唯一标识;
按照一定的策略(串行或并行)发送各个分片数据块;
发送完成后,服务端根据判断数据上传是否完整,如果完整,则进行数据块合成得到原始文件 8 Y% v4 M* v& W$ h
2、断点续传+ O' J( |, d: e- l1 u; b [
断点续传指的是在下载或上传时,将下载或上传任务人为的划分为几个部分,每一个部分采用一个线程进行上传或下载,如果碰到网络故障,可以从已经上传或下载的部分开始继续上传下载未完成的部分,而没有必要从头开始上传下载。用户可以节省时间,提高速度。# a' V& K, x( A N& Q6 {) e
一般实现方式有两种:; @1 ?8 K4 O* d! G% J2 O r
服务器端返回,告知从哪开始
浏览器端自行处理. Q: T3 p/ h% A# A2 z
上传过程中将文件在服务器写为临时文件,等全部写完了(文件上传完),将此临时文件重命名为正式文件即可,如果中途上传中断过,下次上传的时候根据当前临时文件大小,作为在客户端读取文件的偏移量,从此位置继续读取文件数据块,上传到服务器从此偏移量继续写入文件即可。. e$ o8 V1 Z& z7 D1 ]# g8 R% q: ` 二、实现思路 # ]* |! g! k8 ^2 P8 V% W 整体思路比较简单,拿到文件,保存文件唯一性标识,切割文件,分段上传,每次上传一段,根据唯一性标识判断文件上传进度,直到文件的全部片段上传完毕。 9 L. E; O/ A% \6 I5 \# B4 Z3 X: b8 W
: D9 \, |4 J- R
下面的内容都是伪代码。9 r' p7 h. A% a
读取文件内容: " ^- V) | z0 s+ T2 ]- q# ~( y