Fix formatting, reduce diff

bigscience-workshop · mryab · Sep 4, 2023 · Sep 3, 2023 · Sep 3, 2023 · Sep 3, 2023
commit 67764fea9e595e711d949105bcafade86553f0c4
diff --git a/src/petals/models/falcon/block.py b/src/petals/models/falcon/block.py
@@ -24,7 +24,6 @@
     rotate_half,
 )
 
-
 KVCache = Tuple[torch.Tensor, torch.Tensor]
 INFERENCE_MAX_LENGTH = 8192
 
@@ -225,6 +224,7 @@ def __init__(self, config: FalconConfig):
         self.hidden_dropout = config.hidden_dropout
         self.config = config
 
+        assert not self.config.alibi
         assert config.new_decoder_architecture
         self.ln_attn = LayerNorm(hidden_size, eps=config.layer_norm_epsilon)
         self.ln_mlp = LayerNorm(hidden_size, eps=config.layer_norm_epsilon)
@@ -299,10 +299,6 @@ def forward(
 
 
 class WrappedFalconBlock(OptimizedFalconDecoderLayer):
-    def __init__(self, config: FalconConfig):
-        super().__init__(config)
-        assert not self.config.alibi
-
     def forward(
         self,
         hidden_states: torch.Tensor,

diff --git a/tests/test_optimized_layers.py b/tests/test_optimized_layers.py
@@ -1,9 +1,10 @@
+import torch
+
 from petals.models.falcon.block import UnoptimizedWrappedFalconBlock
+from petals.server.block_utils import resolve_block_dtype
 from petals.server.from_pretrained import load_pretrained_block
 from petals.utils.auto_config import AutoDistributedConfig
-from petals.server.block_utils import resolve_block_dtype
 from petals.utils.convert_block import QuantType, convert_block
-import torch
 
 
 def test_falcon():