cnn classifier and HAR

sunilmallya · Nov 25, 2017 · b760adc · b760adc
1 parent 1e722ff
commit b760adc
Show file tree

Hide file tree

Showing 5 changed files with 860 additions and 17 deletions.
diff --git a/base_rnn_classifier.py b/base_rnn_classifier.py
@@ -0,0 +1,214 @@
+# RNN Helper class
+
+import mxnet as mx
+import numpy as np
+import math
+from mxnet import nd, autograd
+
+def detach(hidden):
+    if isinstance(hidden, (tuple, list)):
+        hidden = [i.detach() for i in hidden]
+    else:
+        hidden = hidden.detach()
+    return hidden
+
+class BaseRNNClassifier(mx.gluon.Block):
+    '''
+    Exensible RNN class with LSTM that can operate with MXNet NDArray iter or DataLoader.
+    Includes fit() function to mimic the symbolic fit() function
+    '''
+
+    @classmethod
+    def get_data(cls, batch, iter_type, ctx):
+        ''' get data and label from the iterator/dataloader '''
+        if iter_type == 'mxiter':
+            X = batch.data[0].as_in_context(ctx)
+            y = batch.label[0].as_in_context(ctx)
+        elif iter_type in ["numpy", "dataloader"]:
+            X = batch[0].as_in_context(ctx)
+            y = batch[1].as_in_context(ctx)
+        else:
+            raise ValueError("iter_type must be mxiter or numpy")
+        return X, y
+
+    @classmethod
+    def get_all_labels(cls, data_iterator, iter_type):
+        if iter_type == 'mxiter':
+            pass
+        elif iter_type in ["numpy", "dataloader"]:
+            return data_iterator._dataset._label
+
+    def __init__(self, ctx):
+        super(BaseRNNClassifier, self).__init__()
+        self.ctx = ctx
+
+    def build_model(self, n_out, rnn_size=128, n_layer=1):
+        self.rnn_size = rnn_size
+        self.n_layer = n_layer
+        self.n_out = n_out
+
+        # LSTM default; #TODO(Sunil): make this generic
+        self.lstm = mx.gluon.rnn.LSTM(self.rnn_size, self.n_layer, layout='NTC')
+        #self.lstm = mx.gluon.rnn.GRU(self.rnn_size, self.n_layer)
+        self.output = mx.gluon.nn.Dense(self.n_out)
+
+    def forward(self, x, hidden):
+        out, hidden = self.lstm(x, hidden)
+        out = out[:, out.shape[1]-1, :]
+        out = self.output(out)
+        return out, hidden
+
+    def compile_model(self, loss=None, lr=3E-3):
+        self.collect_params().initialize(mx.init.Xavier(), ctx=self.ctx)
+        self.criterion = mx.gluon.loss.SoftmaxCrossEntropyLoss()
+        self.loss = mx.gluon.loss.SoftmaxCrossEntropyLoss() if loss is None else loss
+        self.lr = lr
+        self.optimizer = mx.gluon.Trainer(self.collect_params(), 'adam', 
+                                          {'learning_rate': self.lr})
+
+    def top_k_acc(self, data_iterator, iter_type='mxiter', top_k=3, batch_size=128):
+        batch_pred_list = []
+        true_labels = []
+        init_state = mx.nd.zeros((self.n_layer, batch_size, self.rnn_size), self.ctx)
+        hidden = [init_state] * 2
+        for i, batch in enumerate(data_iterator):
+            data, label = BaseRNNClassifier.get_data(batch, iter_type, self.ctx)
+            batch_pred = self.forward(data, hidden)
+            #batch_pred = mx.nd.argmax(batch_pred, axis=1)
+            batch_pred_list.append(batch_pred.asnumpy())
+            true_labels.append(label)
+        y = np.vstack(batch_pred_list)
+        true_labels = np.vstack(true_labels)
+        argsorted_y = np.argsort(y)[:,-top_k:]
+        return np.asarray(np.any(argsorted_y.T == true_labels, axis=0).mean(dtype='f'))
+
+    def evaluate_accuracy(self, data_iterator, metric='acc', iter_type='mxiter', batch_size=128):
+        met = mx.metric.Accuracy()
+        init_state = mx.nd.zeros((self.n_layer, batch_size, self.rnn_size), self.ctx)
+        hidden = [init_state] * 2
+        for i, batch in enumerate(data_iterator):
+            data, label = BaseRNNClassifier.get_data(batch, iter_type, self.ctx)
+            # Lets do a forward pass only!
+            output, hidden = self.forward(data, hidden)
+            preds = mx.nd.argmax(output, axis=1)
+            met.update(labels=label, preds=preds)
+
+        #if self.all_labels is None:
+        #    self.all_labels = BaseRNNClassifier.get_all_labels(data_iterator, iter_type)
+        #preds = self.predict(data_iterator, iter_type=iter_type, batch_size=batch_size)
+        #met.update(labels=mx.nd.array(self.all_labels[:len(preds)]), preds=preds)
+
+        return met.get()                   
+
+    def predict(self, data_iterator, iter_type='mxiter', batch_size=128):
+        batch_pred_list = []
+        init_state = mx.nd.zeros((self.n_layer, batch_size, self.rnn_size), self.ctx)
+        hidden = [init_state] * 2
+        for i, batch in enumerate(data_iterator):
+            data, label = BaseRNNClassifier.get_data(batch, iter_type, self.ctx)
+            output, hidden = self.forward(data, hidden)
+            batch_pred_list.append(output.asnumpy())
+        #return np.vstack(batch_pred_list)
+        return np.argmax(np.vstack(batch_pred_list), 1)
+
+    def fit(self, train_data, test_data, epochs, batch_size, verbose=True):
+        '''
+        @train_data:  can be of type list of Numpy array, DataLoader, MXNet NDArray Iter
+        '''
+
+        moving_loss = 0.
+        total_batches = 0
+
+        train_loss = []
+        train_acc = []
+        test_acc = []
+
+        iter_type = 'numpy'
+        train_iter = None
+        test_iter = None
+        print "Data type:", type(train_data), type(test_data), iter_type, type(train_data[0])
+
+        # Can take MX NDArrayIter, or DataLoader
+        if isinstance(train_data, mx.io.NDArrayIter):
+            train_iter = train_data
+            test_iter = test_data
+            iter_type = 'mxiter'
+            #total_batches = train_iter.num_data // train_iter.batch_size
+
+        elif isinstance(train_data, list):
+            if isinstance(train_data[0], np.ndarray) and isinstance(train_data[1], np.ndarray):
+                X, y = np.asarray(train_data[0]).astype('float32'), np.asarray(train_data[1]).astype('float32')
+                tX, ty = np.asarray(test_data[0]).astype('float32'), np.asarray(test_data[1]).astype('float32')
+
+                total_batches = X.shape[0] // batch_size
+                train_iter = mx.gluon.data.DataLoader(mx.gluon.data.ArrayDataset(X, y), 
+                                    batch_size=batch_size, shuffle=True, last_batch='discard')
+                test_iter = mx.gluon.data.DataLoader(mx.gluon.data.ArrayDataset(tX, ty), 
+                                    batch_size=batch_size, shuffle=False, last_batch='discard')
+
+        elif isinstance(train_data, mx.gluon.data.dataloader.DataLoader) and isinstance(test_data, mx.gluon.data.dataloader.DataLoader):
+            train_iter = train_data
+            test_iter = test_data
+            total_batches = len(train_iter)
+        else:
+            raise ValueError("pass mxnet ndarray or numpy array as [data, label]")
+
+        print "Data type:", type(train_data), type(test_data), iter_type
+        print "Sizes", self.n_layer, batch_size, self.rnn_size, self.ctx
+
+        for e in range(epochs):
+            #print self.lstm.collect_params()
+
+            # reset iterators if of MXNet Itertype
+            if iter_type == "mxiter":
+                train_iter.reset()
+                test_iter.reset()
+
+            init_state = mx.nd.zeros((self.n_layer, batch_size, self.rnn_size), self.ctx)
+            hidden = [init_state] * 2                
+            #hidden = self.begin_state(func=mx.nd.zeros, batch_size=batch_size, ctx=self.ctx)
+            yhat = []
+            for i, batch in enumerate(train_iter):
+                data, label = BaseRNNClassifier.get_data(batch, iter_type, self.ctx)
+                #print "Data Shapes:", data.shape, label.shape
+                hidden = detach(hidden)
+                with mx.gluon.autograd.record(train_mode=True):
+                    preds, hidden = self.forward(data, hidden)
+                    #print preds[0].shape, hidden[0].shape, label.shape
+                    loss = self.loss(preds, label) 
+                    yhat.extend(preds)
+                loss.backward()                                        
+                self.optimizer.step(batch_size)
+                preds = mx.nd.argmax(preds, axis=1)
+
+                batch_acc = mx.nd.mean(preds == label).asscalar()
+
+                if i == 0:
+                    moving_loss = nd.mean(loss).asscalar()
+                else:
+                    moving_loss = .99 * moving_loss + .01 * mx.nd.mean(loss).asscalar()
+
+                if verbose and i%100 == 0:
+                    print('[Epoch {}] [Batch {}/{}] Loss: {:.5f}, Batch acc: {:.5f}'.format(
+                          e, i, total_batches, moving_loss, batch_acc))                    
+
+            train_loss.append(moving_loss)
+
+            t_acc = self.evaluate_accuracy(train_iter, iter_type=iter_type, batch_size=batch_size)
+            train_acc.append(t_acc[1])
+
+            tst_acc = self.evaluate_accuracy(test_iter, iter_type=iter_type, batch_size=batch_size)
+            test_acc.append(tst_acc[1])
+
+            print("Epoch %s. Loss: %.5f Train Acc: %s Test Acc: %s" % (e, moving_loss, t_acc, tst_acc))
+        return train_loss, train_acc, test_acc
+
+    def predict(self, data_iterator, iter_type='mxiter', batch_size=128):
+        batch_pred_list = []
+        init_state = mx.nd.zeros((self.n_layer, batch_size, self.rnn_size), self.ctx)
+        hidden = [init_state] * 2
+        for i, batch in enumerate(data_iterator):
+            data, label = BaseRNNClassifier.get_data(batch, iter_type, self.ctx)
+            output, hidden = self.forward(data, hidden)
+            batch_pred_list.append(output.asnumpy())
+        return np.argmax(np.vstack(batch_pred_list), 1)
diff --git a/base_rnn_regressor.py b/base_rnn_regressor.py
@@ -41,21 +41,20 @@ def build_model(self, rnn_type='lstm', rnn_size=128, n_layer=1, n_out=1):
     #@override 
     def forward(self, inp, hidden):
         rnn_out, hidden = self.net(inp, hidden)
-        #simplify
         logits = self.output(rnn_out.reshape((-1, self.rnn_size)))
         return logits, hidden
 
     def detach(self, arrs):
         return [arr.detach() for arr in arrs]
 
-    def compile_model(self, optimizer='adam', lr=1E-3):
+    def compile_model(self, optimizer='adam', lr=1E-3, loss=None):
         self.collect_params().initialize(mx.init.Xavier(), ctx=self.ctx)
-        self.loss = mx.gluon.loss.L1Loss()
+        self.loss = mx.gluon.loss.L1Loss() if loss is None else loss
         self.optimizer = mx.gluon.Trainer(self.collect_params(), 
                                     optimizer, {'learning_rate': lr})
 
-
     def evaluate_accuracy(self, data_iterator, metric='mae', iter_type='mxiter'):
+        # TODO: handle multiple metrics   
         met = mx.metric.MAE()
         for i, batch in enumerate(data_iterator):
             data, label = get_data(batch, iter_type)
@@ -114,8 +113,6 @@ def fit(self, train_data, test_data, epochs):
                 else:
                     moving_loss = .99 * moving_loss + .01 * mx.nd.mean(loss).asscalar()
             train_loss.append(moving_loss)
-            # TODO: add prediction?
-
             test_err = self.evaluate_accuracy(test_iter, iter_type=iter_type)
             val_loss.append(test_err[1])
             print("Epoch %s. Loss: %.10f Test MAE: %s" % (e, moving_loss, test_err))

diff --git a/cnn_mnist_gluon_simplified.ipynb b/cnn_mnist_gluon_simplified.ipynb
@@ -11,7 +11,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 1,
+   "execution_count": 11,
    "metadata": {
     "collapsed": true
    },
@@ -81,6 +81,7 @@
     "            for i, (data, label) in enumerate(train_data):\n",
     "                data = data.as_in_context(ctx)\n",
     "                label = label.as_in_context(ctx)\n",
+    "                #print data.shape, label.shape\n",
     "                with autograd.record(train_mode=True):\n",
     "                    output = self.net(data)\n",
     "                    loss = self.loss(output, label)\n",
@@ -101,9 +102,9 @@
   },
   {
    "cell_type": "code",
-   "execution_count": null,
+   "execution_count": 6,
    "metadata": {
-    "collapsed": true
+    "collapsed": false
    },
    "outputs": [],
    "source": [
@@ -122,11 +123,23 @@
   },
   {
    "cell_type": "code",
-   "execution_count": null,
+   "execution_count": 7,
    "metadata": {
-    "collapsed": true
+    "collapsed": false
    },
-   "outputs": [],
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "{'_batch_sampler': <mxnet.gluon.data.sampler.BatchSampler at 0x111573850>,\n",
+       " '_dataset': <mxnet.gluon.data.vision.MNIST at 0x111573750>}"
+      ]
+     },
+     "execution_count": 7,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
    "source": [
     "train_data.__dict__"
    ]
@@ -135,15 +148,15 @@
    "cell_type": "code",
    "execution_count": null,
    "metadata": {
-    "collapsed": true
+    "collapsed": false
    },
    "outputs": [],
    "source": [
     "num_fc = 512\n",
     "num_classes = 10 #num_outputs\n",
     "convs = [(20,5,2), (50,5,2)]\n",
     "\n",
-    "ctx = mx.gpu()\n",
+    "ctx = mx.cpu() #mx.gpu()\n",
     "cnn = BaseCNNClassifier(ctx)\n",
     "cnn.build_model(convs, num_fc, num_classes)\n",
     "cnn.compile_model(optimizer='adam')\n",