From c9b9adc77c395730e1bd7235076103db9c99b744 Mon Sep 17 00:00:00 2001
From: andrewor14 <andrewor14@gmail.com>
Date: Tue, 6 May 2025 13:35:30 -0400
Subject: [PATCH 001/165] Bump version to 0.12.0 (#2178)

---
 version.txt | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/version.txt b/version.txt
index d9df1bbc0c..ac454c6a1f 100644
--- a/version.txt
+++ b/version.txt
@@ -1 +1 @@
-0.11.0
+0.12.0

From 72e3c1169efdbf2ecbfdc601e93fc83a5f79208e Mon Sep 17 00:00:00 2001
From: Nikita Shulga <2453524+malfet@users.noreply.github.com>
Date: Wed, 7 May 2025 09:07:09 -0700
Subject: [PATCH 002/165] [BE] Fix MPS experimental workflow (#2181)

* [BE] Fix MPS tests

By actually running them in the conda env that is being created

* Update torchao_experimental_test.yml

* Update torchao_experimental_test.yml
---
 .github/workflows/torchao_experimental_test.yml | 17 +++++++++++------
 1 file changed, 11 insertions(+), 6 deletions(-)

diff --git a/.github/workflows/torchao_experimental_test.yml b/.github/workflows/torchao_experimental_test.yml
index 4d0a1eaaf6..1987670d70 100644
--- a/.github/workflows/torchao_experimental_test.yml
+++ b/.github/workflows/torchao_experimental_test.yml
@@ -92,26 +92,31 @@ jobs:
           conda activate test-mps-ops-env
       - name: Install torch
         run: |
-          pip install torch --index-url "https://download.pytorch.org/whl/nightly/cpu"
+          conda run -n test-mps-ops-env pip install torch --index-url "https://download.pytorch.org/whl/nightly/cpu"
       - name: Print torch version
         run: |
-          python -c "import torch; print(torch.__version__)"
+          
+          conda run -n test-mps-ops-env python -c "import torch; print(torch.__version__)"
       - name: Install requirements
         run: |
+          source activate base
+          conda activate test-mps-ops-env
           pip install -r dev-requirements.txt
           pip install pyyaml importlib-metadata
       - name: Print pip freeze
         run: |
-          pip freeze
+          conda run -n test-mps-ops-env pip freeze
       - name: Print current directory
         run: |
-          python -c "import os; print(os.getcwd())"
+          conda run -n test-mps-ops-env python -c "import os; print(os.getcwd())"
       - name: Build ao with experimental mps ops
         run: |
+          source activate base
+          conda activate test-mps-ops-env
           USE_CPP=1 TORCHAO_BUILD_EXPERIMENTAL_MPS=1 pip install .
       - name: Run mps tests
         run: |
           pushd torchao/experimental/ops/mps/test
-          python test_lowbit.py
-          python test_quantizer.py
+          conda run -n test-mps-ops-env python test_lowbit.py
+          conda run -n test-mps-ops-env python test_quantizer.py
           popd

From e5d9a977d5e7a4ceb521d5e3bea136234bb40671 Mon Sep 17 00:00:00 2001
From: Scott Roy <161522778+metascroy@users.noreply.github.com>
Date: Wed, 7 May 2025 11:11:31 -0700
Subject: [PATCH 003/165] Fix cuda compile error with bf16

Differential Revision: D73562284

Pull Request resolved: https://github.com/pytorch/ao/pull/2122
---
 torchao/csrc/cuda/fp6_llm/utils_parallel_dequant.cuh | 2 --
 1 file changed, 2 deletions(-)

diff --git a/torchao/csrc/cuda/fp6_llm/utils_parallel_dequant.cuh b/torchao/csrc/cuda/fp6_llm/utils_parallel_dequant.cuh
index 8c5f77df9c..63afa0694c 100644
--- a/torchao/csrc/cuda/fp6_llm/utils_parallel_dequant.cuh
+++ b/torchao/csrc/cuda/fp6_llm/utils_parallel_dequant.cuh
@@ -25,9 +25,7 @@
 
 #include <cuda.h>
 #include <cuda_fp16.h>
-#if !defined(__CUDA_ARCH__) || __CUDA_ARCH__ >= 800
 #include <cuda_bf16.h>
-#endif
 #include <cuda_runtime.h>
 
 /*

From 8369268afecdc87f9917075a1d352785176489dd Mon Sep 17 00:00:00 2001
From: Apurva Jain <apurvajain.kota@gmail.com>
Date: Wed, 7 May 2025 13:48:13 -0700
Subject: [PATCH 004/165] Generate speedup for inference (#2151)

---
 benchmarks/microbenchmarks/README.md          | 14 ++++++++
 .../microbenchmarks/benchmark_inference.py    | 34 ++++++++++++++++---
 .../microbenchmarks/benchmark_runner.py       | 16 ++++++++-
 .../microbenchmarks/test/benchmark_config.yml | 14 +++-----
 benchmarks/microbenchmarks/utils.py           | 14 ++++++--
 5 files changed, 73 insertions(+), 19 deletions(-)

diff --git a/benchmarks/microbenchmarks/README.md b/benchmarks/microbenchmarks/README.md
index 42e704a99c..f300bbab23 100644
--- a/benchmarks/microbenchmarks/README.md
+++ b/benchmarks/microbenchmarks/README.md
@@ -130,6 +130,18 @@ Currently, quantization string is in same format as the one being passed in llam
       max_power: 11
   ```
 
+- `small_sweep`: Generate a small sweep of shapes with increasing powers of 2 for M, K, N dimensions
+  - Parameters:
+    - `min_power`: Minimum power of 2 (default: 10, which is 1024)
+    - `max_power`: Maximum power of 2 (default: 14, which is 16,384)
+  - Note: This generates shapes where M <= K <= N (ensuring increasing order), which produces fewer combinations than the full sweep, and could be good to use for plots like heatmap
+  ```yaml
+  matrix_shapes:
+    - name: "small_sweep"
+      min_power: 10  # 2^10 = 1024
+      max_power: 15  # 2^15 = 32,768
+  ```
+
 - `sweep`: Generate a sweep of shapes with different powers of 2 for M, K, N dimensions
   - Parameters:
     - `min_power`: Minimum power of 2 (default: 8, which is 256)
@@ -142,6 +154,8 @@ Currently, quantization string is in same format as the one being passed in llam
       max_power: 9  # 2^9 = 512
   ```
 
+
+
 ## Output
 
 Results are saved to a CSV file in the specified output directory
diff --git a/benchmarks/microbenchmarks/benchmark_inference.py b/benchmarks/microbenchmarks/benchmark_inference.py
index cc6e819523..4ea5d05105 100644
--- a/benchmarks/microbenchmarks/benchmark_inference.py
+++ b/benchmarks/microbenchmarks/benchmark_inference.py
@@ -51,9 +51,28 @@ def run(config: BenchmarkConfig) -> BenchmarkResult:
             high_precision_dtype=config.high_precision_dtype,
             device=config.device,
         )
+        # Copy base model for quantizing
+        m_copy = deepcopy(base_model)
+
+        # Run benchmarks
+        result = BenchmarkResult(config=config)
+
+        # Store result in model for memory profiling
+        base_model._benchmark_result = result
+
+        # Run baseline benchmarking
+        base_model = base_model.eval().to(config.device)
+        if config.use_torch_compile:
+            print("Compiling baseline model....")
+            base_model = torch.compile(
+                base_model, mode=config.torch_compile_mode, fullgraph=True
+            )
+        # Benchmark time to run an inference call for baseline model
+        print("Benchmarking baseline inference.....")
+        result.baseline_inference_time_in_ms = model_inference_time_in_ms(
+            model=base_model, input_data=input_data
+        )
 
-        # Use quantize_ to apply each quantization function to the model
-        m_copy = deepcopy(base_model).eval().to(config.device)
         ao_base_config = string_to_config(
             config.quantization,
             config.sparsity,
@@ -79,24 +98,29 @@ def run(config: BenchmarkConfig) -> BenchmarkResult:
             pass  # No quantization or sparsity specified, do nothing
         else:
             print("Quantizing model....")
+            m_copy = m_copy.eval().to(config.device)
             quantize_(m_copy, ao_base_config)
 
         if config.use_torch_compile:
-            print("Compiling model....")
+            print("Compiling quantized model....")
             m_copy = torch.compile(
                 m_copy, mode=config.torch_compile_mode, fullgraph=True
             )
 
-        # Run benchmarks
-        result = BenchmarkResult(config=config)
         # Store result in model for memory profiling
         m_copy._benchmark_result = result
 
         # Benchmark time to run an inference call for quantized model
+        print("Benchmarking quantized model.....")
         result.model_inference_time_in_ms = model_inference_time_in_ms(
             model=m_copy, input_data=input_data
         )
 
+        # Calculate speedup w.r.t. baseline
+        result.speedup = round(
+            result.baseline_inference_time_in_ms / result.model_inference_time_in_ms, 2
+        )
+
         # Run profiler if enabled
         if config.enable_profiler:
             print("Running profiler...")
diff --git a/benchmarks/microbenchmarks/benchmark_runner.py b/benchmarks/microbenchmarks/benchmark_runner.py
index fbd7f08388..8066b71714 100644
--- a/benchmarks/microbenchmarks/benchmark_runner.py
+++ b/benchmarks/microbenchmarks/benchmark_runner.py
@@ -76,6 +76,20 @@ def get_shapes_for_config(
                 val2 = 2**power_of_2 + 2 ** (power_of_2 - 1)
                 shapes.append((f"{name}_{idx * 2}", [val1, val1, val1]))
                 shapes.append((f"{name}_{idx * 2 + 1}", [val2, val2, val2]))
+        elif name == "small_sweep":
+            # Generate a small sweep of shapes with increasing powers of 2 for M, K, N
+            min_p2 = shape_config.get("min_power", 10)  # 1024
+            max_p2 = shape_config.get("max_power", 14)  # 16,384
+            counter = 0
+            for M_p2 in range(min_p2, max_p2 + 1):
+                M = 2**M_p2
+                for K_p2 in range(min_p2, max_p2 + 1):
+                    K = 2**K_p2
+                    for N_p2 in range(min_p2, max_p2 + 1):
+                        N = 2**N_p2
+                        if M <= K <= N:  # Ensure increasing order
+                            shapes.append((f"{name}_{counter}", [M, K, N]))
+                            counter += 1
         elif name == "sweep":
             # Generate a sweep of shapes with different powers of 2 for M, K, N
             min_p2 = shape_config.get("min_power", 8)  # 256
@@ -202,7 +216,7 @@ def run_inference_benchmarks_from_config(configs: List[BenchmarkConfig]) -> None
         print("----------------------------------------")
         try:
             print(
-                f"Running: {config.name} for Quantization: {config.quantization} and Sparsity: {config.sparsity}"
+                f"Running: {config.name} for Quantization: {config.quantization} and Sparsity: {config.sparsity} for {config.shape_name}: {config.m, config.k, config.n}"
             )
             result = run_inference(config)  # Pass the config object directly
             if result is not None:  # Only add successful results
diff --git a/benchmarks/microbenchmarks/test/benchmark_config.yml b/benchmarks/microbenchmarks/test/benchmark_config.yml
index 6c28cbfc04..4fd5eb2018 100644
--- a/benchmarks/microbenchmarks/test/benchmark_config.yml
+++ b/benchmarks/microbenchmarks/test/benchmark_config.yml
@@ -3,18 +3,15 @@ benchmark_mode: "inference"
 quantization_config_recipe_names: # Will run a baseline inference for model by default, without quantization for comparison
   - "int8wo"
   - "int8dq"
-  - "float8dq"
+  - "float8dq-tensor"
   - "float8wo"
 output_dir: "benchmarks/microbenchmarks/results"
 model_params:
   - name: "small_bf16_linear"
     matrix_shapes:
-      - name: "custom"
-        shapes: [
-          [1024, 1024, 1024],  # [m, k, n]
-          [2048, 4096, 1024],
-          [4096, 4096, 1024]
-        ]
+      - name: "small_sweep"
+        min_power: 14
+        max_power: 16
     high_precision_dtype: "torch.bfloat16"
     use_torch_compile: true
     torch_compile_mode: "max-autotune"
@@ -60,9 +57,6 @@ model_params:
       - name: "pow2_extended"  # Example of using extended power of 2 shapes
         min_power: 10  # 1024
         max_power: 11  # 2048
-      - name: "sweep"  # Example of using sweep shapes (commented out as it generates many shapes)
-        min_power: 8   # 256
-        max_power: 9   # 512
     high_precision_dtype: "torch.bfloat16"
     use_torch_compile: true
     torch_compile_mode: "max-autotune"
diff --git a/benchmarks/microbenchmarks/utils.py b/benchmarks/microbenchmarks/utils.py
index f591ec3669..cbd864d6fe 100644
--- a/benchmarks/microbenchmarks/utils.py
+++ b/benchmarks/microbenchmarks/utils.py
@@ -124,7 +124,9 @@ def __init__(
     ):
         self.config = config
         self.output_dir = config.output_dir
+        self.baseline_inference_time_in_ms = 0.0
         self.model_inference_time_in_ms = 0.0
+        self.speedup = 0.0
         self.profiler_json_path: Optional[str] = None
         self.memory_profile_path: Optional[str] = None
         self.memory_visualization_path: Optional[str] = None
@@ -134,7 +136,9 @@ def to_dict(self) -> Dict[str, Any]:
         """Convert result to dictionary for main function"""
         result_dict = {
             **self.config.to_dict(),
+            "baseline_inference_time_in_ms": self.baseline_inference_time_in_ms,
             "model_inference_time_in_ms": self.model_inference_time_in_ms,
+            "speedup": self.speedup,
             "profiler_json_path": self.profiler_json_path,
             "memory_profile_path": self.memory_profile_path,
             "memory_visualization_path": self.memory_visualization_path,
@@ -299,7 +303,7 @@ def model_inference_time_in_ms(model, input_data):
         input_data: Input data for the model
 
     Returns:
-        float: Median inference time in microseconds
+        float: Median inference time in milliseconds
     """
     # First run to trigger any compilation/lazy initialization
 
@@ -315,8 +319,8 @@ def model_inference_time_in_ms(model, input_data):
     measurement = timer.timeit(number=100)
     res = measurement.mean
 
-    # Convert to microseconds
-    return res * 1e6
+    # Convert to milliseconds
+    return (res * 1e6) / 1000  # Convert microseconds to milliseconds
 
 
 def clean_caches():
@@ -386,7 +390,9 @@ def print_results(results: List[BenchmarkResult]):
             result.config.quantization or "baseline",
             result.config.sparsity or "none",
             f"{result.config.shape_name} ({result.config.m}, {result.config.k}, {result.config.n})",
+            f"{result.baseline_inference_time_in_ms:.2f}",
             f"{result.model_inference_time_in_ms:.2f}",
+            f"{result.speedup:.2f}x",
             str(result.config.enable_profiler),
         ]
 
@@ -398,7 +404,9 @@ def print_results(results: List[BenchmarkResult]):
         "Quantization",
         "Sparsity",
         "Shape",
+        "Baseline Inference Time (ms)",
         "Inference Time (ms)",
+        "Speedup",
         "Profiler Enabled",
     ]
 

From b01514c573e002010968c4a5f74ddb3648c89d02 Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Thu, 8 May 2025 10:00:43 -0700
Subject: [PATCH 005/165] Add serialization support for `AOPerModuleConfig`
 (#2186)

Summary:
att

Test Plan:
python test/quantization/test_config_serialization.py

Reviewers:

Subscribers:

Tasks:

Tags:
---
 test/quantization/test_config_serialization.py | 15 +++++++++++++++
 torchao/core/config.py                         |  8 ++++++++
 2 files changed, 23 insertions(+)

diff --git a/test/quantization/test_config_serialization.py b/test/quantization/test_config_serialization.py
index 3caaa6efc5..ba52b446b1 100644
--- a/test/quantization/test_config_serialization.py
+++ b/test/quantization/test_config_serialization.py
@@ -1,3 +1,9 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
 import json
 import os
 import tempfile
@@ -14,6 +20,7 @@
     config_to_dict,
 )
 from torchao.quantization.quant_api import (
+    AOPerModuleConfig,
     Float8DynamicActivationFloat8WeightConfig,
     Float8WeightOnlyConfig,
     FPXWeightOnlyConfig,
@@ -63,6 +70,14 @@
     # Sparsity configs
     SemiSparseWeightConfig(),
     BlockSparseWeightConfig(blocksize=128),
+    AOPerModuleConfig({}),
+    AOPerModuleConfig({"_default": Int4WeightOnlyConfig(), "linear1": None}),
+    AOPerModuleConfig(
+        {
+            "linear1": Int4WeightOnlyConfig(),
+            "linear2": Int8DynamicActivationInt4WeightConfig(),
+        }
+    ),
 ]
 
 
diff --git a/torchao/core/config.py b/torchao/core/config.py
index fe03ac225b..a041130835 100644
--- a/torchao/core/config.py
+++ b/torchao/core/config.py
@@ -255,6 +255,14 @@ def config_from_dict(data: Dict[str, Any]) -> AOBaseConfig:
                 else item
                 for item in value
             ]
+        elif isinstance(value, dict):
+            # Handle dicts of possible configs
+            processed_data[key] = {
+                k: config_from_dict(v)
+                if isinstance(v, dict) and "_type" in v and "_data" in v
+                else v
+                for k, v in value.items()
+            }
         else:
             processed_data[key] = value
 

From e417afc1af66171200180626429dd771cee03197 Mon Sep 17 00:00:00 2001
From: HDCharles <39544797+HDCharles@users.noreply.github.com>
Date: Thu, 8 May 2025 15:44:40 -0400
Subject: [PATCH 006/165] Remove broken test (#2188)

* Remove broken test

Summary:

this test is weird, autoquant has potential to not alter model size, if
we're testing aqt, this is a bad test, if we're testing get_model_size
there's another test that's better. This is breaking CI and doesn't make
a lot of sense so lets remove it

Test Plan: see CI

Reviewers:

Subscribers:

Tasks:

Tags:

* ruff format

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* undo overzealous delete

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:
---
 test/integration/test_integration.py | 37 ----------------------------
 1 file changed, 37 deletions(-)

diff --git a/test/integration/test_integration.py b/test/integration/test_integration.py
index c7428e72bd..2f498ea5c1 100644
--- a/test/integration/test_integration.py
+++ b/test/integration/test_integration.py
@@ -2049,43 +2049,6 @@ def forward(self, x):
 
 
 class TestUtils(unittest.TestCase):
-    @parameterized.expand(COMMON_DEVICE_DTYPE)
-    @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_5, "autoquant requires 2.5+.")
-    def test_get_model_size_autoquant(self, device, dtype):
-        if device != "cuda" and dtype != torch.bfloat16:
-            self.skipTest(f"autoquant currently does not support {device}")
-        if device != "cuda" or not torch.cuda.is_available():
-            self.skipTest(f"autoquant currently does not support {device}")
-        if torch.cuda.is_available() and torch.cuda.get_device_capability() < (8, 0):
-            if dtype == torch.bfloat16:
-                self.skipTest("bfloat16 requires sm80+")
-        m, k, n = 16, 128, 128
-        model = (
-            torch.nn.Sequential(
-                torch.nn.ReLU(),
-                torch.nn.Linear(k, n),
-                torch.nn.ReLU(),
-            )
-            .to(device)
-            .to(dtype)
-        )
-        example_input = torch.randn(m, k, device=device, dtype=dtype)
-        size = torchao.utils.get_model_size_in_bytes(model)
-
-        from torchao.quantization.autoquant import (
-            AQInt8WeightOnlyQuantizedLinearWeight2,
-        )
-
-        qtensor_class_list = (AQInt8WeightOnlyQuantizedLinearWeight2,)
-        mod = torchao.autoquant(
-            torch.compile(model),
-            qtensor_class_list=qtensor_class_list,
-            set_inductor_config=False,
-        )
-        mod(example_input)
-        size2 = torchao.utils.get_model_size_in_bytes(mod)
-        self.assertTrue(size2 < size)
-
     @parameterized.expand(
         list(itertools.product(TENSOR_SUBCLASS_APIS, COMMON_DEVICES, COMMON_DTYPES)),
     )

From 7192edffe9df060edcce1733a9b333c44d70d19c Mon Sep 17 00:00:00 2001
From: HDCharles <39544797+HDCharles@users.noreply.github.com>
Date: Thu, 8 May 2025 16:55:08 -0400
Subject: [PATCH 007/165] Enabling MOE Quantization using linear decomposition
 (#2043)

* Enabling MOE Quantization using linear decomposition

Summary: This PR is a first step at optimizing moe inference using
torchAO. The goal for this step is to enable existing quantization
kernels and workflows to work for moe quantization by decomposing the
group gemm into a sequence of unbalanced linear ops that can use the
existing quantized kernels. To enable this we had to add support for
quantizing these 3D tensors as well as slicing and indexing. 2 methods
of achieving this were implemented. for int8wo, int8dq, int4wo, fp8wo,
fp8dq, the underlying quantized tensor subclass was adapted to both
support 3D tensors, indexing and slicing, as well as an updated
transformation function that can handle the
ConditionalFeedForwardAOQuantizable modules if the filter funciton in
quantize_ is used to target the aforementioned module. For some complex kernels
which use packed data that couldn't be made to easily work in 3D, we
also added FakeExtraDimTensor which can transform any
quantized tensor subclass into supporting the necessary slice and index
operations for moe quantization. This option is enabled by using
MoeQuantConfig.

This can be applied to huggingface llama4 for instance as shown int he
llama4_quant.py example. Since the hf moe module is implemented in a way
that's not condusive to quantization, it first requires a module swap to
the MOEFeedForwardAOQuantizable.

TODO final benchmark numbers from run.sh, consolidate 3x implementation
of MOEFeedForwardAOQuantizable and ConditionalFeedForwardAOQuantizable.
verify hqq

Test Plan:
python test/quantization/test_moe_quant.py

python
test/torchao/experimental/tests/test_int8_dynamic_activation_intx_weight.py
-k "test_moe_quant_intx"

sh torchao/_models/mixtral-moe/run.sh

Reviewers:

Subscribers:

Tasks:

Tags:

* fixing CI

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* fixing CI

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* fixing CI

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* lint

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* remove test code

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* fixing exp test

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* fixing experimental test

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* fixing experimental CI

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* fixing generate.py device stuff

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* fixing tests that aren't skipping

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* ruff format

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* removing test code

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* fixing CI

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* update API and remove branching on quant_api.py transform functions

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* ruff format

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* fix weird ci error

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* remove change to test_integration.py

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:
---
 test/quantization/test_moe_quant.py           | 361 +++++++++++++
 torchao/_models/mixtral-moe/README.md         |   8 +
 torchao/_models/mixtral-moe/generate.py       | 506 ++++++++++++++++++
 torchao/_models/mixtral-moe/model.py          | 464 ++++++++++++++++
 torchao/_models/mixtral-moe/run.sh            |  39 ++
 .../scripts/convert_hf_checkpoint.py          | 115 ++++
 .../_models/mixtral-moe/scripts/download.py   |  48 ++
 .../_models/mixtral-moe/scripts/prepare.sh    |   2 +
 torchao/dtypes/affine_quantized_tensor_ops.py |  59 +-
 torchao/dtypes/floatx/float8_layout.py        |  45 +-
 ...8_dynamic_activation_intx_weight_layout.py |   4 +
 torchao/dtypes/uintx/plain_layout.py          |   8 +
 .../dtypes/uintx/tensor_core_tiled_layout.py  | 146 +++--
 ...est_int8_dynamic_activation_intx_weight.py |  47 ++
 .../linear_activation_quantized_tensor.py     |  30 ++
 .../prototype/moe_quant/README.md             |  51 ++
 .../prototype/moe_quant/__init__.py           |   0
 .../prototype/moe_quant/llama4_quant.py       |  92 ++++
 .../moe_quant/quantizable_moe_modules.py      | 191 +++++++
 .../quantization/prototype/moe_quant/utils.py | 308 +++++++++++
 torchao/quantization/quant_api.py             | 166 ++++--
 torchao/quantization/transform_module.py      |   1 +
 torchao/quantization/utils.py                 |  13 +-
 torchao/utils.py                              |   4 +-
 24 files changed, 2585 insertions(+), 123 deletions(-)
 create mode 100644 test/quantization/test_moe_quant.py
 create mode 100644 torchao/_models/mixtral-moe/README.md
 create mode 100644 torchao/_models/mixtral-moe/generate.py
 create mode 100644 torchao/_models/mixtral-moe/model.py
 create mode 100644 torchao/_models/mixtral-moe/run.sh
 create mode 100644 torchao/_models/mixtral-moe/scripts/convert_hf_checkpoint.py
 create mode 100644 torchao/_models/mixtral-moe/scripts/download.py
 create mode 100644 torchao/_models/mixtral-moe/scripts/prepare.sh
 create mode 100644 torchao/quantization/prototype/moe_quant/README.md
 create mode 100644 torchao/quantization/prototype/moe_quant/__init__.py
 create mode 100644 torchao/quantization/prototype/moe_quant/llama4_quant.py
 create mode 100644 torchao/quantization/prototype/moe_quant/quantizable_moe_modules.py
 create mode 100644 torchao/quantization/prototype/moe_quant/utils.py

diff --git a/test/quantization/test_moe_quant.py b/test/quantization/test_moe_quant.py
new file mode 100644
index 0000000000..842468a769
--- /dev/null
+++ b/test/quantization/test_moe_quant.py
@@ -0,0 +1,361 @@
+import unittest
+
+import torch
+from parameterized import parameterized
+
+from torchao.dtypes.floatx.float8_layout import Float8AQTTensorImpl
+from torchao.dtypes.uintx.plain_layout import PlainAQTTensorImpl
+from torchao.dtypes.uintx.tensor_core_tiled_layout import TensorCoreTiledAQTTensorImpl
+from torchao.quantization.prototype.moe_quant.quantizable_moe_modules import (
+    MOEFeedForwardAOQuantizable,
+)
+from torchao.quantization.prototype.moe_quant.utils import (
+    FakeExtraDimTensor,
+    MoEQuantConfig,
+    UseFakeExtraDimTensor,
+    cond_ffn_filter,
+)
+from torchao.quantization.quant_api import (
+    AffineQuantizedTensor,
+    Float8DynamicActivationFloat8WeightConfig,
+    Float8WeightOnlyConfig,
+    Int4WeightOnlyConfig,
+    Int8DynamicActivationInt8WeightConfig,
+    Int8WeightOnlyConfig,
+    LinearActivationQuantizedTensor,
+    quantize_,
+)
+from torchao.quantization.utils import compute_error
+from torchao.utils import (
+    TORCH_VERSION_AT_LEAST_2_5,
+    TORCH_VERSION_AT_LEAST_2_6,
+    is_sm_at_least_90,
+)
+
+
+class TestMoEQuantCompile(unittest.TestCase):
+    DEFAULT_PARAMS = (512, 256, 8, 2)  # hidden_dim, expert_dim, num_experts, top_k
+
+    @torch.no_grad()
+    def _test_impl_moe_quant(
+        self,
+        config,
+        num_tokens=1,
+        model_params=None,
+        base_class=AffineQuantizedTensor,
+        tensor_impl_class=None,
+        dtype=torch.bfloat16,
+        device="cuda",
+        fullgraph=False,
+    ):
+        """
+        Tests moe quant for techniques using fake extra dim
+        """
+        if model_params is None:
+            model_params = self.DEFAULT_PARAMS
+
+        input_shape = (num_tokens, model_params[0])
+        model = (
+            MOEFeedForwardAOQuantizable(*model_params, empty_init=False)
+            .to(dtype)
+            .to(device)
+        )
+        input = torch.randn(input_shape, dtype=torch.bfloat16, device=device)
+
+        out = model(input)
+
+        quantize_(model, config, cond_ffn_filter)
+
+        if (
+            isinstance(config, MoEQuantConfig)
+            and config.use_fake_extra_dim_tensor == UseFakeExtraDimTensor.TRUE
+        ):
+            self.assertIsInstance(model.experts.w1, FakeExtraDimTensor)
+            if base_class is not None:
+                self.assertIsInstance(model.experts.w1.head_tensor, base_class)
+            if tensor_impl_class is not None:
+                self.assertIsInstance(
+                    model.experts.w1.head_tensor.tensor_impl, tensor_impl_class
+                )
+        else:
+            if base_class is not None:
+                self.assertIsInstance(model.experts.w1, base_class)
+            if tensor_impl_class is not None:
+                self.assertIsInstance(model.experts.w1.tensor_impl, tensor_impl_class)
+
+        out_q = model(input)
+
+        torch._dynamo.config.capture_scalar_outputs = True
+        torch._dynamo.config.capture_dynamic_output_shape_ops = True
+        model_c = torch.compile(model, mode="reduce-overhead", fullgraph=fullgraph)
+
+        model_c(input)
+        model_c(input)
+        out_qc = model_c(input).clone()
+
+        for i in range(10):
+            input = torch.randn(input_shape, dtype=torch.bfloat16, device=device)
+            model_c(input)
+
+        self.assertGreaterEqual(compute_error(out_q, out), 10)
+        self.assertGreaterEqual(compute_error(out_qc, out), 10)
+
+    @parameterized.expand(
+        [
+            ("single_token", 1, False),
+            ("multiple_tokens", 8, False),
+        ]
+    )
+    def test_int4wo_fake_dim(self, name, num_tokens, fullgraph):
+        if not torch.cuda.is_available():
+            self.skipTest("Need CUDA available")
+        if not TORCH_VERSION_AT_LEAST_2_5:
+            self.skipTest("Test only enabled for 2.5+")
+
+        config = MoEQuantConfig(
+            Int4WeightOnlyConfig(), use_fake_extra_dim_tensor=UseFakeExtraDimTensor.TRUE
+        )
+        tensor_impl_class = TensorCoreTiledAQTTensorImpl
+
+        self._test_impl_moe_quant(
+            config=config,
+            num_tokens=num_tokens,
+            tensor_impl_class=tensor_impl_class,
+            fullgraph=fullgraph,
+        )
+
+    @parameterized.expand(
+        [
+            ("single_token", 1, True),
+            ("multiple_tokens", 8, False),
+        ]
+    )
+    def test_int4wo_base(self, name, num_tokens, fullgraph):
+        if not torch.cuda.is_available():
+            self.skipTest("Need CUDA available")
+        if not is_sm_at_least_90():
+            self.skipTest("Requires CUDA capability >= 9.0")
+        if not TORCH_VERSION_AT_LEAST_2_5:
+            self.skipTest("Test only enabled for 2.5+")
+
+        config = MoEQuantConfig(Int4WeightOnlyConfig())
+        tensor_impl_class = TensorCoreTiledAQTTensorImpl
+
+        self._test_impl_moe_quant(
+            config=config,
+            num_tokens=num_tokens,
+            tensor_impl_class=tensor_impl_class,
+            fullgraph=fullgraph,
+        )
+
+    @parameterized.expand(
+        [
+            ("single_token", 1, False),
+            ("multiple_tokens", 8, False),
+        ]
+    )
+    def test_int8wo_fake_dim(self, name, num_tokens, fullgraph):
+        if not torch.cuda.is_available():
+            self.skipTest("Need CUDA available")
+        if not TORCH_VERSION_AT_LEAST_2_5:
+            self.skipTest("Test only enabled for 2.5+")
+
+        config = MoEQuantConfig(
+            Int8WeightOnlyConfig(), use_fake_extra_dim_tensor=UseFakeExtraDimTensor.TRUE
+        )
+        tensor_impl_class = PlainAQTTensorImpl
+
+        self._test_impl_moe_quant(
+            config=config,
+            num_tokens=num_tokens,
+            tensor_impl_class=tensor_impl_class,
+            fullgraph=fullgraph,
+        )
+
+    @parameterized.expand(
+        [
+            ("single_token", 1, True),
+            ("multiple_tokens", 8, False),
+        ]
+    )
+    def test_int8wo_base(self, name, num_tokens, fullgraph):
+        if not torch.cuda.is_available():
+            self.skipTest("Need CUDA available")
+        if not TORCH_VERSION_AT_LEAST_2_6:
+            self.skipTest("Test only enabled for 2.6+")
+
+        config = MoEQuantConfig(Int8WeightOnlyConfig())
+        tensor_impl_class = PlainAQTTensorImpl
+
+        self._test_impl_moe_quant(
+            config=config,
+            num_tokens=num_tokens,
+            tensor_impl_class=tensor_impl_class,
+            fullgraph=fullgraph,
+        )
+
+    @parameterized.expand(
+        [
+            ("single_token", 1, True),
+            ("multiple_tokens", 8, False),
+        ]
+    )
+    def test_int8wo_base_cpu(self, name, num_tokens, fullgraph):
+        if not TORCH_VERSION_AT_LEAST_2_6:
+            self.skipTest("Test only enabled for 2.6+")
+
+        config = MoEQuantConfig(Int8WeightOnlyConfig())
+        tensor_impl_class = PlainAQTTensorImpl
+
+        self._test_impl_moe_quant(
+            config=config,
+            num_tokens=num_tokens,
+            tensor_impl_class=tensor_impl_class,
+            fullgraph=fullgraph,
+            device="cpu",
+        )
+
+    @parameterized.expand(
+        [
+            ("multiple_tokens", 32, False),
+        ]
+    )
+    def test_int8dq_fake_dim(self, name, num_tokens, fullgraph):
+        if not torch.cuda.is_available():
+            self.skipTest("Need CUDA available")
+        if not TORCH_VERSION_AT_LEAST_2_5:
+            self.skipTest("Test only enabled for 2.5+")
+
+        config = MoEQuantConfig(
+            Int8DynamicActivationInt8WeightConfig(),
+            use_fake_extra_dim_tensor=UseFakeExtraDimTensor.TRUE,
+        )
+        base_class = LinearActivationQuantizedTensor
+
+        self._test_impl_moe_quant(
+            model_params=(512, 256, 2, 2),
+            config=config,
+            num_tokens=num_tokens,
+            base_class=base_class,
+            fullgraph=fullgraph,
+        )
+
+    @parameterized.expand(
+        [
+            ("multiple_tokens", 32, False),
+        ]
+    )
+    def test_int8dq_base(self, name, num_tokens, fullgraph):
+        if not torch.cuda.is_available():
+            self.skipTest("Need CUDA available")
+        if not TORCH_VERSION_AT_LEAST_2_5:
+            self.skipTest("Test only enabled for 2.5+")
+
+        config = MoEQuantConfig(Int8DynamicActivationInt8WeightConfig())
+        base_class = LinearActivationQuantizedTensor
+
+        self._test_impl_moe_quant(
+            model_params=(512, 256, 2, 2),
+            config=config,
+            num_tokens=num_tokens,
+            base_class=base_class,
+            fullgraph=fullgraph,
+        )
+
+    @parameterized.expand(
+        [
+            ("single_token", 1, False),
+            ("multiple_tokens", 8, False),
+        ]
+    )
+    def test_fp8wo_fake_dim(self, name, num_tokens, fullgraph):
+        if not torch.cuda.is_available():
+            self.skipTest("Need CUDA available")
+        if not is_sm_at_least_90():
+            self.skipTest("Requires CUDA capability >= 9.0")
+
+        config = MoEQuantConfig(
+            Float8WeightOnlyConfig(),
+            use_fake_extra_dim_tensor=UseFakeExtraDimTensor.TRUE,
+        )
+        tensor_impl_class = Float8AQTTensorImpl
+
+        self._test_impl_moe_quant(
+            config=config,
+            num_tokens=num_tokens,
+            tensor_impl_class=tensor_impl_class,
+            fullgraph=fullgraph,
+        )
+
+    @parameterized.expand(
+        [
+            ("single_token", 1, True),
+            ("multiple_tokens", 8, False),
+        ]
+    )
+    def test_fp8wo_base(self, name, num_tokens, fullgraph):
+        if not torch.cuda.is_available():
+            self.skipTest("Need CUDA available")
+        if not is_sm_at_least_90():
+            self.skipTest("Requires CUDA capability >= 9.0")
+
+        config = MoEQuantConfig(Float8WeightOnlyConfig())
+        tensor_impl_class = Float8AQTTensorImpl
+
+        self._test_impl_moe_quant(
+            config=config,
+            num_tokens=num_tokens,
+            tensor_impl_class=tensor_impl_class,
+            fullgraph=fullgraph,
+        )
+
+    @parameterized.expand(
+        [
+            ("single_token", 1, False),
+            ("multiple_tokens", 8, False),
+        ]
+    )
+    def test_fp8dq_fake_dim(self, name, num_tokens, fullgraph):
+        if not torch.cuda.is_available():
+            self.skipTest("Need CUDA available")
+        if not is_sm_at_least_90():
+            self.skipTest("Requires CUDA capability >= 9.0")
+
+        config = MoEQuantConfig(
+            Float8DynamicActivationFloat8WeightConfig(),
+            use_fake_extra_dim_tensor=UseFakeExtraDimTensor.TRUE,
+        )
+        base_class = LinearActivationQuantizedTensor
+
+        self._test_impl_moe_quant(
+            config=config,
+            num_tokens=num_tokens,
+            base_class=base_class,
+            fullgraph=fullgraph,
+        )
+
+    @parameterized.expand(
+        [
+            ("single_token", 1, True),
+            ("multiple_tokens", 8, False),
+        ]
+    )
+    def test_fp8dq_base(self, name, num_tokens, fullgraph):
+        if not torch.cuda.is_available():
+            self.skipTest("Need CUDA available")
+        if not is_sm_at_least_90():
+            self.skipTest("Requires CUDA capability >= 9.0")
+
+        config = MoEQuantConfig(Float8DynamicActivationFloat8WeightConfig())
+        base_class = LinearActivationQuantizedTensor
+
+        self._test_impl_moe_quant(
+            config=config,
+            num_tokens=num_tokens,
+            base_class=base_class,
+            fullgraph=fullgraph,
+        )
+
+
+if __name__ == "__main__":
+    unittest.main()
diff --git a/torchao/_models/mixtral-moe/README.md b/torchao/_models/mixtral-moe/README.md
new file mode 100644
index 0000000000..22c318aab9
--- /dev/null
+++ b/torchao/_models/mixtral-moe/README.md
@@ -0,0 +1,8 @@
+## Mixtral-MoE
+
+This folder contains code and scripts for benchmarking the Mixtral-MoE model.
+Running
+
+`sh scripts/prepare.sh`
+
+should download the model and `sh run.sh` will run teh benchmarks.
diff --git a/torchao/_models/mixtral-moe/generate.py b/torchao/_models/mixtral-moe/generate.py
new file mode 100644
index 0000000000..0dcd86e74f
--- /dev/null
+++ b/torchao/_models/mixtral-moe/generate.py
@@ -0,0 +1,506 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+
+# This source code is licensed under the license found in the
+# LICENSE file in the root directory of this source tree.
+import itertools
+import sys
+import time
+from pathlib import Path
+from typing import Optional, Tuple
+
+import torch
+import torch._dynamo.config
+import torch._inductor.config
+
+from torchao.utils import get_model_size_in_bytes
+
+torch.manual_seed(0)
+
+
+def device_sync(device):
+    if "cuda" in device:
+        torch.cuda.synchronize(device)
+    elif "cpu" in device:
+        pass
+    else:
+        print(f"device={device} is not yet suppported")
+
+
+torch._inductor.config.coordinate_descent_tuning = True
+torch._inductor.config.triton.unique_kernel_names = True
+torch._inductor.config.fx_graph_cache = True  # Experimental feature to reduce compilation times, will be on by default in future
+torch._dynamo.config.capture_scalar_outputs = True
+
+# support running without installing as a package
+wd = Path(__file__).parent.parent.resolve()
+sys.path.append(str(wd))
+
+from model import Transformer
+from sentencepiece import SentencePieceProcessor
+
+
+def multinomial_sample_one_no_sync(
+    probs_sort,
+):  # Does multinomial sampling without a cuda synchronization
+    q = torch.empty_like(probs_sort).exponential_(1)
+    return torch.argmax(probs_sort / q, dim=-1, keepdim=True).to(dtype=torch.int)
+
+
+def logits_to_probs(logits, temperature: float = 1.0, top_k: Optional[int] = None):
+    logits = logits / max(temperature, 1e-5)
+
+    if top_k is not None:
+        v, _ = torch.topk(logits, min(top_k, logits.size(-1)))
+        pivot = v.select(-1, -1).unsqueeze(-1)
+        logits = torch.where(logits < pivot, -float("Inf"), logits)
+    probs = torch.nn.functional.softmax(logits, dim=-1)
+    return probs
+
+
+def sample(logits, temperature: float = 1.0, top_k: Optional[int] = None):
+    probs = logits_to_probs(logits[:, -1], temperature, top_k)
+    idx_next = multinomial_sample_one_no_sync(probs)
+    return idx_next, probs
+
+
+def prefill(
+    model: Transformer, x: torch.Tensor, input_pos: torch.Tensor, **sampling_kwargs
+) -> torch.Tensor:
+    # input_pos: [B, S]
+    logits = model(x, input_pos)
+    return sample(logits, **sampling_kwargs)[0]
+
+
+def decode_one_token(
+    model: Transformer, x: torch.Tensor, input_pos: torch.Tensor, **sampling_kwargs
+) -> Tuple[torch.Tensor, torch.Tensor]:
+    # input_pos: [B, 1]
+    assert input_pos.shape[-1] == 1
+    logits = model(x, input_pos)
+    return sample(logits, **sampling_kwargs)
+
+
+def decode_n_tokens(
+    model: Transformer,
+    cur_token: torch.Tensor,
+    input_pos: torch.Tensor,
+    num_new_tokens: int,
+    callback=lambda _: _,
+    **sampling_kwargs,
+):
+    new_tokens, new_probs = [], []
+    for i in range(num_new_tokens):
+        with torch.backends.cuda.sdp_kernel(
+            enable_flash=False, enable_mem_efficient=False, enable_math=True
+        ):  # Actually better for Inductor to codegen attention here
+            next_token, next_prob = decode_one_token(
+                model, cur_token, input_pos, **sampling_kwargs
+            )
+            next_token, next_prob = next_token.clone(), next_prob.clone()
+
+            input_pos += 1
+            new_tokens.append(next_token.clone())
+            callback(new_tokens[-1])
+            new_probs.append(next_prob.clone())
+            cur_token = next_token
+
+    return new_tokens, new_probs
+
+
+def model_forward(model, x, input_pos):
+    return model(x, input_pos)
+
+
+@torch.no_grad()
+def generate(
+    model: Transformer,
+    prompt: torch.Tensor,
+    max_new_tokens: int,
+    batch_size: int,
+    *,
+    interactive: bool,
+    callback=lambda x: x,
+    **sampling_kwargs,
+) -> torch.Tensor:
+    """
+    Takes a conditioning sequence (prompt) as input and continues to generate as many tokens as requested.
+    """
+    device, _ = prompt.device, prompt.dtype
+
+    T = prompt.size(-1)
+    max_seq_length = (
+        min(T + max_new_tokens, model.config.block_size) if not interactive else 350
+    )
+    new_tokens = max_seq_length - T
+
+    # duplicate prompt for batch_size
+    prompt = prompt.repeat(batch_size, 1)
+
+    # create an empty tensor of the expected final shape and fill in the current tokens
+    seq = torch.empty(batch_size, max_seq_length, dtype=prompt.dtype, device=device)
+    seq[:, :T] = prompt
+
+    with torch.device(device):
+        model.setup_caches(max_batch_size=batch_size, max_seq_length=max_seq_length)
+
+    input_pos = torch.arange(0, T, device=device)
+    next_token = prefill(
+        model, prompt.view(batch_size, -1), input_pos, **sampling_kwargs
+    )
+    seq[:, T] = next_token.squeeze()
+
+    input_pos = torch.tensor([T], device=device, dtype=torch.int)
+    generated_tokens, _ = decode_n_tokens(
+        model,
+        next_token.view(batch_size, -1),
+        input_pos,
+        new_tokens - 1,
+        callback=callback,
+        **sampling_kwargs,
+    )
+    seq = torch.cat((seq[:, : T + 1], *generated_tokens), dim=-1)
+
+    return seq
+
+
+def encode_tokens(tokenizer, string, bos=True, device="cuda"):
+    tokens = tokenizer.encode(string)
+    if bos:
+        tokens = [tokenizer.bos_id()] + tokens
+    return torch.tensor(tokens, dtype=torch.int, device=device)
+
+
+def _load_model(checkpoint_path, device, precision):
+    with torch.device("meta"):
+        model = Transformer.from_name(checkpoint_path.parent.name)
+
+    try:
+        checkpoint = torch.load(str(checkpoint_path), mmap=True, weights_only=True)
+        model.load_state_dict(checkpoint, assign=True)
+    except:
+        model = Transformer.from_name(checkpoint_path.parent.name)
+
+    model = model.to(device=device, dtype=precision)
+    return model.eval()
+
+
+B_INST, E_INST = "[INST]", "[/INST]"
+
+
+def main(
+    prompt: str = "Hello, my name is",
+    interactive: bool = False,
+    num_samples: int = 5,
+    max_new_tokens: int = 100,
+    batch_size: int = 1,
+    top_k: int = 200,
+    temperature: float = 0.8,
+    checkpoint_path: Path = Path("checkpoints/mistralai/Mixtral-8x7B-v0.1/model.pth"),
+    compile: bool = True,
+    compile_prefill: bool = False,
+    moe_quant: Optional[str] = None,
+    profile: Optional[Path] = None,
+    memory_profile: Optional[Path] = None,
+    device="cuda",
+) -> None:
+    """Generates text samples based on a pre-trained Transformer model and tokenizer."""
+    assert checkpoint_path.is_file(), checkpoint_path
+    tokenizer_path = checkpoint_path.parent / "tokenizer.model"
+    assert tokenizer_path.is_file(), str(tokenizer_path)
+    print(f"Using device={device}")
+    precision = torch.bfloat16
+    is_chat = "chat" in str(checkpoint_path)
+
+    if device == "cuda" and memory_profile is not None:
+        torch.cuda.memory._record_memory_history(
+            True, trace_alloc_max_entries=500000, trace_alloc_record_context=True
+        )
+
+    print("Loading model ...")
+    t0 = time.time()
+    model = _load_model(checkpoint_path, "cpu", precision)
+
+    print(f"Time to load model: {time.time() - t0:.02f} seconds")
+    t0 = time.time()
+
+    tokenizer = SentencePieceProcessor(model_file=str(tokenizer_path))
+    encoded = encode_tokens(tokenizer, prompt, bos=True, device=device)
+    prompt_length = encoded.size(0)
+
+    torch.manual_seed(1234)
+    model_size = sum(
+        [
+            p.numel() * p.dtype.itemsize
+            for p in itertools.chain(model.parameters(), model.buffers())
+        ]
+    )
+
+    from torchao.quantization.prototype.moe_quant.utils import (
+        MoEQuantConfig,
+        UseFakeExtraDimTensor,
+        cond_ffn_filter,
+    )
+    from torchao.quantization.quant_api import (
+        Float8DynamicActivationFloat8WeightConfig,
+        Float8WeightOnlyConfig,
+        Int4WeightOnlyConfig,
+        Int8DynamicActivationInt8WeightConfig,
+        Int8DynamicActivationIntxWeightConfig,
+        Int8WeightOnlyConfig,
+        PackedLinearInt8DynamicActivationIntxWeightLayout,
+        PerRow,
+        quantize_,
+    )
+
+    if moe_quant:
+        torch._dynamo.config.capture_dynamic_output_shape_ops = True
+        config = None
+        if "int8wo-base" in moe_quant:
+            config = MoEQuantConfig(Int8WeightOnlyConfig())
+
+        elif "int8wo" in moe_quant:
+            config = MoEQuantConfig(
+                Int8WeightOnlyConfig(),
+                use_fake_extra_dim_tensor=UseFakeExtraDimTensor.TRUE,
+            )
+
+        elif "int8dq-base" in moe_quant:
+            config = MoEQuantConfig(Int8DynamicActivationInt8WeightConfig())
+
+        elif "int8dq" in moe_quant:
+            config = MoEQuantConfig(
+                Int8DynamicActivationInt8WeightConfig(),
+                use_fake_extra_dim_tensor=UseFakeExtraDimTensor.TRUE,
+            )
+
+        elif "int4wo-base" in moe_quant:
+            config = MoEQuantConfig(Int4WeightOnlyConfig())
+
+        elif "int4wo" in moe_quant:
+            config = MoEQuantConfig(
+                Int4WeightOnlyConfig(),
+                use_fake_extra_dim_tensor=UseFakeExtraDimTensor.TRUE,
+            )
+
+        elif "fp8wo-base" in moe_quant:
+            config = MoEQuantConfig(Float8WeightOnlyConfig())
+
+        elif "fp8wo" in moe_quant:
+            config = MoEQuantConfig(
+                Float8WeightOnlyConfig(),
+                use_fake_extra_dim_tensor=UseFakeExtraDimTensor.TRUE,
+            )
+
+        elif "fp8dq-base" in moe_quant:
+            config = MoEQuantConfig(
+                Float8DynamicActivationFloat8WeightConfig(granularity=PerRow())
+            )
+
+        elif "fp8dq" in moe_quant:
+            config = MoEQuantConfig(
+                Float8DynamicActivationFloat8WeightConfig(granularity=PerRow()),
+                use_fake_extra_dim_tensor=UseFakeExtraDimTensor.TRUE,
+            )
+
+        elif "intxdq" in moe_quant:
+            config = MoEQuantConfig(
+                Int8DynamicActivationIntxWeightConfig(
+                    layout=PackedLinearInt8DynamicActivationIntxWeightLayout(),
+                ),
+                use_fake_extra_dim_tensor=UseFakeExtraDimTensor.TRUE,
+            )
+        else:
+            assert config is not None, (
+                f"expected moe_quant to match one of the options but got {moe_quant}"
+            )
+
+        if config is not None:
+            quantize_(model, config, filter_fn=cond_ffn_filter, device=device)
+            print(
+                f"Time to apply quantization with config {config} to model: {time.time() - t0:.02f} seconds"
+            )
+
+    model.to(device=device)
+    device_sync(device=device)
+
+    if compile:
+        # moe quant + compile causes repeated warnings
+        import warnings
+
+        warnings.simplefilter("ignore", lineno=84)
+        warnings.simplefilter("ignore", lineno=105)
+
+        torch._inductor.config.assert_indirect_indexing = False
+
+        global decode_one_token, prefill
+
+        if batch_size == 1 and (isinstance(moe_quant, str) and "base" in moe_quant):
+            decode_one_token = torch.compile(
+                decode_one_token, mode="reduce-overhead", fullgraph=True
+            )
+        else:
+            decode_one_token = torch.compile(decode_one_token, mode="reduce-overhead")
+
+        if args.compile_prefill:
+            prefill = torch.compile(prefill, fullgraph=True, dynamic=True)
+
+    aggregate_metrics = {
+        "tokens_per_sec": [],
+    }
+    start = -1 if compile else 0
+
+    for i in range(start, num_samples):
+        device_sync(device=device)  # MKG
+        if i >= 0 and interactive:
+            prompt = input("What is your prompt? ")
+            if is_chat:
+                prompt = f"{B_INST} {prompt.strip()} {E_INST}"
+            encoded = encode_tokens(tokenizer, prompt, bos=True, device=device)
+
+        if interactive and i >= 0:
+            buffer = []
+            period_id = tokenizer.encode(".")[0]
+            done_generating = False
+
+            def callback(x):
+                nonlocal done_generating
+                if done_generating:
+                    return
+                buffer.append(tokenizer.decode([period_id] + x.tolist())[1:])
+                if x.item() == tokenizer.eos_id():
+                    done_generating = True
+                if len(buffer) == 4 or done_generating:
+                    print("".join(buffer), end="", flush=True)
+                    buffer.clear()
+                # print(, end='', flush=True)
+        else:
+            callback = lambda x: x
+        t0 = time.perf_counter()
+        import contextlib
+
+        if i != num_samples - 1 or not profile:
+            prof = contextlib.nullcontext()
+        else:
+            torch.profiler._utils._init_for_cuda_graphs()
+            prof = torch.profiler.profile()
+        with prof:
+            y = generate(
+                model,
+                encoded,
+                max_new_tokens,
+                batch_size,
+                interactive=interactive,
+                callback=callback,
+                temperature=temperature,
+                top_k=top_k,
+            )
+        if i == -1:
+            print(f"Compilation time: {time.perf_counter() - t0:.2f} seconds")
+            continue
+        if hasattr(prof, "export_chrome_trace"):
+            prof.export_chrome_trace(f"{profile}.json")
+        device_sync(device=device)  # MKG
+        t = time.perf_counter() - t0
+
+        if not interactive:
+            pass
+            print(tokenizer.decode(y[0].tolist()))
+        else:
+            print()
+        tokens_generated = y.size(-1) - prompt_length
+        tokens_sec = tokens_generated / t
+        aggregate_metrics["tokens_per_sec"].append(tokens_sec)
+        print(
+            f"Time for inference {i + 1}: {t:.02f} sec total, {tokens_sec:.02f} tokens/sec"
+        )
+        print(f"Bandwidth achieved: {model_size * tokens_sec / 1e9:.02f} GB/s")
+
+        if i == 0 and device == "cuda" and memory_profile is not None:
+            snapshot = torch.cuda.memory._snapshot()
+            with open(f"{memory_profile}.pickle", "wb") as f:
+                from pickle import dump
+
+                dump(snapshot, f)
+            print(
+                f"\nmemory profile {memory_profile}.pickle saved, to convert that to a usable file, use",
+                "python pytorch/torch/cuda/_memory_viz.py trace_plot <pickle file> -o <desired output name>.html",
+            )
+            break
+
+    tokpersec = torch.mean(torch.tensor(aggregate_metrics["tokens_per_sec"])).item()
+    print(f"Average tokens/sec: {tokpersec:.2f}")
+    if batch_size > 1:
+        print(f"Average tokens/sec including batches {batch_size * tokpersec:.2f}")
+    print(f"Memory used: {torch.cuda.max_memory_reserved() / 1e9:.02f} GB")
+    print(f"model size: {get_model_size_in_bytes(model) / 1e9:.02f}")
+
+
+if __name__ == "__main__":
+    import argparse
+
+    parser = argparse.ArgumentParser(description="Your CLI description.")
+
+    parser.add_argument(
+        "--prompt", type=str, default="Hello, my name is", help="Input prompt."
+    )
+    parser.add_argument(
+        "--interactive",
+        action="store_true",
+        help="Whether to launch in interactive mode",
+    )
+    parser.add_argument("--num_samples", type=int, default=5, help="Number of samples.")
+    parser.add_argument(
+        "--max_new_tokens", type=int, default=200, help="Maximum number of new tokens."
+    )
+    parser.add_argument(
+        "--batch_size", type=int, default=1, help="Batch size to benchmark with"
+    )
+    parser.add_argument("--top_k", type=int, default=200, help="Top-k for sampling.")
+    parser.add_argument(
+        "--temperature", type=float, default=0.8, help="Temperature for sampling."
+    )
+    parser.add_argument(
+        "--checkpoint_path",
+        type=Path,
+        default=Path("checkpoints/meta-Transformer/Transformer-2-7b-chat-hf/model.pth"),
+        help="Model checkpoint path.",
+    )
+    parser.add_argument(
+        "--compile", action="store_true", help="Whether to compile the model."
+    )
+    parser.add_argument(
+        "--compile_prefill",
+        action="store_true",
+        help="Whether to compile the prefill (improves prefill perf, but higher compile times)",
+    )
+    # parser.add_argument('-q', '--quantization', type=str, help='Which quantization techniques to apply: int8dq, int8wo, int4wo, fp8')
+    parser.add_argument(
+        "--moe_quant",
+        type=str,
+        help="Which quantization techniques to apply: int8dq, int8wo, int4wo, fp8wo, fp8dq",
+    )
+    parser.add_argument("--profile", type=Path, default=None, help="Profile path.")
+    parser.add_argument(
+        "--memory_profile", type=Path, default=None, help="filename for memory profile."
+    )
+    parser.add_argument("--device", type=str, default="cuda", help="device to use")
+
+    args = parser.parse_args()
+    print(args)
+    main(
+        args.prompt,
+        args.interactive,
+        args.num_samples,
+        args.max_new_tokens,
+        args.batch_size,
+        args.top_k,
+        args.temperature,
+        args.checkpoint_path,
+        args.compile,
+        args.compile_prefill,
+        args.moe_quant,
+        args.profile,
+        args.memory_profile,
+        args.device,
+    )
diff --git a/torchao/_models/mixtral-moe/model.py b/torchao/_models/mixtral-moe/model.py
new file mode 100644
index 0000000000..46a4ce79be
--- /dev/null
+++ b/torchao/_models/mixtral-moe/model.py
@@ -0,0 +1,464 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+
+# This source code is licensed under the license found in the
+# LICENSE file in the root directory of this source tree.
+from dataclasses import dataclass
+from typing import Optional
+
+import torch
+import torch.nn as nn
+from torch import Tensor
+from torch.nn import functional as F
+
+from torchao.quantization.prototype.moe_quant.utils import FakeExtraDimTensor
+
+
+def find_multiple(n: int, k: int) -> int:
+    if n % k == 0:
+        return n
+    return n + k - (n % k)
+
+
+@dataclass
+class ModelArgs:
+    block_size: int = 2048
+    vocab_size: int = 32000
+    n_layer: int = 32
+    n_head: int = 32
+    dim: int = 4096
+    intermediate_size: int = None
+    n_local_heads: int = -1
+    head_dim: int = 64
+    rope_base: float = 10000
+    norm_eps: float = 1e-5
+    num_experts: int = 8
+    num_activated_experts: int = 2
+
+    def __post_init__(self):
+        if self.n_local_heads == -1:
+            self.n_local_heads = self.n_head
+        if self.intermediate_size is None:
+            hidden_dim = 4 * self.dim
+            n_hidden = int(2 * hidden_dim / 3)
+            self.intermediate_size = find_multiple(n_hidden, 256)
+        self.head_dim = self.dim // self.n_head
+
+    @classmethod
+    def from_name(cls, name: str):
+        if name in transformer_configs:
+            return cls(**transformer_configs[name])
+        # fuzzy search
+        config = [
+            config
+            for config in transformer_configs
+            if config in str(name).upper() or config in str(name)
+        ]
+        assert len(config) == 1, name
+        return cls(**transformer_configs[config[0]])
+
+
+transformer_configs = {
+    "Mixtral-8x7B-Instruct-v0.1": dict(
+        block_size=32768,
+        n_layer=32,
+        n_head=32,
+        n_local_heads=8,
+        dim=4096,
+        intermediate_size=14336,
+        rope_base=1000000.0,
+        num_experts=8,
+        num_activated_experts=2,
+    ),
+}
+
+
+class KVCache(nn.Module):
+    def __init__(
+        self, max_batch_size, max_seq_length, n_heads, head_dim, dtype=torch.bfloat16
+    ):
+        super().__init__()
+        cache_shape = (max_batch_size, n_heads, max_seq_length, head_dim)
+        self.register_buffer("k_cache", torch.zeros(cache_shape, dtype=dtype))
+        self.register_buffer("v_cache", torch.zeros(cache_shape, dtype=dtype))
+
+    def update(self, input_pos, k_val, v_val):
+        # input_pos: [S], k_val: [B, H, S, D]
+        assert input_pos.shape[0] == k_val.shape[2]
+
+        k_out = self.k_cache
+        v_out = self.v_cache
+        k_out[:, :, input_pos] = k_val
+        v_out[:, :, input_pos] = v_val
+
+        return k_out, v_out
+
+
+class Transformer(nn.Module):
+    def __init__(self, config: ModelArgs) -> None:
+        super().__init__()
+        self.config = config
+
+        self.tok_embeddings = nn.Embedding(config.vocab_size, config.dim)
+        self.layers = nn.ModuleList(
+            TransformerBlock(config) for _ in range(config.n_layer)
+        )
+        self.norm = RMSNorm(config.dim, eps=config.norm_eps)
+        self.output = nn.Linear(config.dim, config.vocab_size, bias=False)
+
+        self.freqs_cis: Optional[Tensor] = None
+        self.mask_cache: Optional[Tensor] = None
+        self.max_batch_size = -1
+        self.max_seq_length = -1
+
+    def setup_caches(self, max_batch_size, max_seq_length):
+        if (
+            self.max_seq_length >= max_seq_length
+            and self.max_batch_size >= max_batch_size
+        ):
+            return
+        head_dim = self.config.dim // self.config.n_head
+        max_seq_length = find_multiple(max_seq_length, 8)
+        self.max_seq_length = max_seq_length
+        self.max_batch_size = max_batch_size
+        for b in self.layers:
+            b.attention.kv_cache = KVCache(
+                max_batch_size, max_seq_length, self.config.n_local_heads, head_dim
+            )
+
+        self.freqs_cis = precompute_freqs_cis(
+            self.config.block_size,
+            self.config.dim // self.config.n_head,
+            self.config.rope_base,
+        )
+        self.causal_mask = torch.tril(
+            torch.ones(self.max_seq_length, self.max_seq_length, dtype=torch.bool)
+        )
+
+    def forward(self, idx: Tensor, input_pos: Optional[Tensor] = None) -> Tensor:
+        assert self.freqs_cis is not None, "Caches must be initialized first"
+        mask = self.causal_mask[None, None, input_pos]
+        freqs_cis = self.freqs_cis[input_pos]
+        x = self.tok_embeddings(idx)
+
+        for i, layer in enumerate(self.layers):
+            x = layer(x, input_pos, freqs_cis, mask)
+        x = self.norm(x)
+        logits = self.output(x)
+        return logits
+
+    @classmethod
+    def from_name(cls, name: str):
+        return cls(ModelArgs.from_name(name))
+
+
+class TransformerBlock(nn.Module):
+    def __init__(self, config: ModelArgs) -> None:
+        super().__init__()
+        self.attention = Attention(config)
+        self.block_sparse_moe = MOEFeedForwardAOQuantizable(config)
+        self.ffn_norm = RMSNorm(config.dim, config.norm_eps)
+        self.attention_norm = RMSNorm(config.dim, config.norm_eps)
+
+    def forward(
+        self, x: Tensor, input_pos: Tensor, freqs_cis: Tensor, mask: Tensor
+    ) -> Tensor:
+        h = x + self.attention(self.attention_norm(x), freqs_cis, mask, input_pos)
+        out = h + self.block_sparse_moe(self.ffn_norm(h))
+        return out
+
+
+class Attention(nn.Module):
+    def __init__(self, config: ModelArgs):
+        super().__init__()
+        assert config.dim % config.n_head == 0
+
+        total_head_dim = (config.n_head + 2 * config.n_local_heads) * config.head_dim
+        # key, query, value projections for all heads, but in a batch
+        self.wqkv = nn.Linear(config.dim, total_head_dim, bias=False)
+        self.wo = nn.Linear(config.dim, config.dim, bias=False)
+        self.kv_cache = None
+
+        self.n_head = config.n_head
+        self.head_dim = config.head_dim
+        self.n_local_heads = config.n_local_heads
+        self.dim = config.dim
+        self._register_load_state_dict_pre_hook(self.load_hook)
+
+    def load_hook(self, state_dict, prefix, *args):
+        if prefix + "wq.weight" in state_dict:
+            wq = state_dict.pop(prefix + "wq.weight")
+            wk = state_dict.pop(prefix + "wk.weight")
+            wv = state_dict.pop(prefix + "wv.weight")
+            state_dict[prefix + "wqkv.weight"] = torch.cat([wq, wk, wv])
+
+    def forward(
+        self,
+        x: Tensor,
+        freqs_cis: Tensor,
+        mask: Tensor,
+        input_pos: Optional[Tensor] = None,
+    ) -> Tensor:
+        bsz, seqlen, _ = x.shape
+
+        kv_size = self.n_local_heads * self.head_dim
+        q, k, v = self.wqkv(x).split([self.dim, kv_size, kv_size], dim=-1)
+
+        q = q.view(bsz, seqlen, self.n_head, self.head_dim)
+        k = k.view(bsz, seqlen, self.n_local_heads, self.head_dim)
+        v = v.view(bsz, seqlen, self.n_local_heads, self.head_dim)
+
+        q = apply_rotary_emb(q, freqs_cis)
+        k = apply_rotary_emb(k, freqs_cis)
+
+        q, k, v = map(lambda x: x.transpose(1, 2), (q, k, v))
+
+        if self.kv_cache is not None:
+            k, v = self.kv_cache.update(input_pos, k, v)
+
+        k = k.repeat_interleave(self.n_head // self.n_local_heads, dim=1)
+        v = v.repeat_interleave(self.n_head // self.n_local_heads, dim=1)
+        y = F.scaled_dot_product_attention(q, k, v, attn_mask=mask, dropout_p=0.0)
+
+        y = y.transpose(1, 2).contiguous().view(bsz, seqlen, self.dim)
+
+        y = self.wo(y)
+        return y
+
+
+# class ConditionalFeedForward(nn.Module):
+#     def __init__(self, config):
+#         super().__init__()
+#         self.w1 = nn.Parameter(torch.empty(config.num_experts, config.intermediate_size, config.dim))
+#         self.w2 = nn.Parameter(torch.empty(config.num_experts, config.dim, config.intermediate_size))
+#         self.w3 = nn.Parameter(torch.empty(config.num_experts, config.intermediate_size, config.dim))
+
+#     def forward(self, x: Tensor, expert_indices: Tensor) -> Tensor:
+#         w1_weights = self.w1[expert_indices] # [T, A, D, D]
+#         w3_weights = self.w3[expert_indices] # [T, A, D, D]
+#         w2_weights = self.w2[expert_indices]  # [T, A, D, D]
+#         x1 = F.silu(torch.einsum('ti,taoi -> tao', x, w1_weights))
+#         x3 = torch.einsum('ti, taoi -> tao', x, w3_weights)
+#         expert_outs =  torch.einsum('tao, taio -> tai', (x1 * x3), w2_weights)
+#         return expert_outs
+
+
+# class MOEFeedForward(nn.Module):
+#     def __init__(self, config) -> None:
+#         super().__init__()
+#         self.gate = nn.Linear(config.dim, config.num_experts, bias=False)
+#         self.cond_ffn = ConditionalFeedForward(config)
+#         self.dim = config.dim
+#         self.num_activated_experts = config.num_activated_experts
+#     def forward(self, x: Tensor) -> Tensor:
+#         x = x.view(-1, self.dim)
+#         # T = num_tokens, E = num_experts, D = hidden dim, A = activated experts
+#         # x: [T, D]
+#         scores = self.gate(x) # [T, E]
+#         expert_weights = F.softmax(scores, dim=-1)
+#         expert_weights, expert_indices = torch.topk(expert_weights, self.num_activated_experts, dim=-1) # [T, A], [T, A]
+#         expert_weights /= expert_weights.sum(dim=-1, keepdim=True) # [T, A]
+#         expert_outs = self.cond_ffn(x, expert_indices)
+#         return torch.einsum('tai,ta -> ti', expert_outs, expert_weights)
+
+
+class RMSNorm(nn.Module):
+    def __init__(self, dim: int, eps: float = 1e-5):
+        super().__init__()
+        self.eps = eps
+        self.weight = nn.Parameter(torch.ones(dim))
+
+    def _norm(self, x):
+        return x * torch.rsqrt(torch.mean(x * x, dim=-1, keepdim=True) + self.eps)
+
+    def forward(self, x: Tensor) -> Tensor:
+        output = self._norm(x.float()).type_as(x)
+        return output * self.weight
+
+
+def precompute_freqs_cis(seq_len: int, n_elem: int, base: int = 10000) -> Tensor:
+    freqs = 1.0 / (
+        base ** (torch.arange(0, n_elem, 2)[: (n_elem // 2)].float() / n_elem)
+    )
+    t = torch.arange(seq_len, device=freqs.device)
+    freqs = torch.outer(t, freqs)
+    freqs_cis = torch.polar(torch.ones_like(freqs), freqs)
+    cache = torch.stack([freqs_cis.real, freqs_cis.imag], dim=-1)
+    return cache.to(dtype=torch.bfloat16)
+
+
+def apply_rotary_emb(x: Tensor, freqs_cis: Tensor) -> Tensor:
+    xshaped = x.float().reshape(*x.shape[:-1], -1, 2)
+    freqs_cis = freqs_cis.view(1, xshaped.size(1), 1, xshaped.size(3), 2)
+    x_out2 = torch.stack(
+        [
+            xshaped[..., 0] * freqs_cis[..., 0] - xshaped[..., 1] * freqs_cis[..., 1],
+            xshaped[..., 1] * freqs_cis[..., 0] + xshaped[..., 0] * freqs_cis[..., 1],
+        ],
+        -1,
+    )
+
+    x_out2 = x_out2.flatten(3)
+    return x_out2.type_as(x)
+
+
+# T tokens
+# E experts
+# D dim
+# I intermediate dim
+# A activated experts
+# T'(e) tokens for expert e
+
+
+class MOEFeedForwardAOQuantizable(nn.Module):
+    def __init__(self, config) -> None:
+        super().__init__()
+        self.gate = nn.Linear(config.dim, config.num_experts, bias=False)
+        self.cond_ffn = ConditionalFeedForwardAOQuantizable(config)
+        self.dim = config.dim
+        self.num_activated_experts = config.num_activated_experts
+
+    def forward(self, x: Tensor) -> Tensor:
+        batch_size = x.shape[0]
+        x = x.view(-1, self.dim)  # x: [T, D]
+        scores = self.gate(x)  # [T, E]
+        expert_weights = F.softmax(scores, dim=-1)
+        expert_weights, expert_indices = torch.topk(
+            expert_weights, self.num_activated_experts, dim=-1
+        )  # [T, A], [T, A]
+        expert_weights /= expert_weights.sum(dim=-1, keepdim=True).to(x.dtype)  # [T, A]
+        out = self.cond_ffn(
+            x, expert_indices, expert_weights, self.num_activated_experts
+        )
+        return out.reshape(batch_size, -1, self.dim)
+
+
+class ConditionalFeedForwardAOQuantizable(nn.Module):
+    def __init__(self, config):
+        super().__init__()
+        self.config = config
+        self.w1 = nn.Parameter(
+            torch.empty(config.num_experts, config.intermediate_size, config.dim)
+        )  # E, I, D
+        self.w2 = nn.Parameter(
+            torch.empty(config.num_experts, config.dim, config.intermediate_size)
+        )  # E, D, I
+        self.w3 = nn.Parameter(
+            torch.empty(config.num_experts, config.intermediate_size, config.dim)
+        )  # E, I, D
+        self.num_experts = config.num_experts
+
+    def forward(
+        self,
+        x: Tensor,  # T, D
+        expert_indices: Tensor,  # T, A
+        expert_weights: Tensor,  # T, A
+        num_activated_experts: int,
+    ) -> Tensor:
+        num_tokens, dim = x.shape
+        num_token_activations = num_tokens * num_activated_experts
+        if x.shape[0] == 1 and not isinstance(
+            self.w1, FakeExtraDimTensor
+        ):  # only 1 token (can be done without graph breaks when compiled)
+            outs = []
+            expert_indices = expert_indices.view(num_activated_experts)
+            # collect used experts
+            w1 = self.w1[expert_indices]
+            w2 = self.w2[expert_indices]
+            w3 = self.w3[expert_indices]
+
+            # run token through each expert
+            for index in range(num_activated_experts):
+                y1 = F.silu(F.linear(x, w1[index]))
+                y3 = F.linear(x, w3[index])
+                y2 = w2[index]
+                cur_out = F.linear(y1 * y3, y2)
+                outs.append(cur_out)
+
+            # combine outputs
+            final_out = (
+                (torch.cat(outs, dim=0) * expert_weights.view(-1, 1))
+                .sum(dim=0)
+                .unsqueeze(-1)
+            )
+            return final_out
+        else:
+            expert_list = [x for x in range(self.num_experts)]
+
+            # shuffle tokens into groups for each expert
+            ordered_token_activations = expert_indices.view(-1).argsort(
+                stable=True
+            )  # [A]
+            ordered_token_indices = (
+                ordered_token_activations.div(num_activated_experts)
+                .floor()
+                .to(torch.int64)
+            )  #  [T]
+
+            if not expert_indices.is_cuda:  # histc doesn't work on cpu for integers
+                num_tokens_per_expert = torch.bincount(
+                    expert_indices.view(-1) + 1, minlength=self.num_experts + 1
+                )
+            else:
+                num_tokens_per_expert = torch.histc(
+                    expert_indices,
+                    bins=self.num_experts + 1,
+                    min=-1,
+                    max=self.num_experts,
+                )  #  [E+1] (added leading 0 so can be used for indexing)
+            cum_tokens_per_expert = num_tokens_per_expert.cumsum(0).to(
+                torch.int64
+            )  #  [E+1]
+
+            @torch._dynamo.disable()
+            def group_tokens_by_expert(
+                ordered_token_indices, cum_tokens_per_expert, expert_list
+            ):
+                token_indices_per_expert = [
+                    ordered_token_indices[
+                        cum_tokens_per_expert[expert] : cum_tokens_per_expert[
+                            expert + 1
+                        ]
+                    ]
+                    for expert in expert_list
+                ]  # [T'(e1)], [T'(e2)] ...
+                return token_indices_per_expert
+
+            token_indices_per_expert = group_tokens_by_expert(
+                ordered_token_indices, cum_tokens_per_expert, expert_list
+            )
+            tokens_grouped_by_expert = [
+                x[indices] for indices in token_indices_per_expert
+            ]
+
+            # calculate outputs for each expert
+            outs = []
+            for cur_x, expert in zip(tokens_grouped_by_expert, expert_list):
+                w1 = self.w1[expert]  # I, D
+                w2 = self.w2[expert]  # D, I
+                w3 = self.w3[expert]  # I, D
+
+                cur_out = F.linear(
+                    F.silu(F.linear(cur_x, w1)) * F.linear(cur_x, w3), w2
+                )  # [T'(e), D]
+                outs.append(cur_out)
+
+            # weigh outputs
+            ordered_outs = torch.cat(outs, dim=0)  # [T*A, D]
+            ordered_token_activation_weights = expert_weights.view(-1, 1)[
+                ordered_token_activations
+            ].view(-1, 1)  # [T*A, 1]
+            weighted_ordered_outs = (
+                ordered_outs * ordered_token_activation_weights
+            )  # [T*A, D]
+
+            # sum weighted token-activation outputs together for each token
+            final_out = torch.zeros_like(x)  #  [T, D]
+            final_out = final_out.scatter_add(
+                dim=0,
+                index=ordered_token_indices.unsqueeze(-1)
+                .expand(num_token_activations, dim)
+                .to(torch.int64),
+                src=weighted_ordered_outs,
+            )
+        return final_out
diff --git a/torchao/_models/mixtral-moe/run.sh b/torchao/_models/mixtral-moe/run.sh
new file mode 100644
index 0000000000..d9e3a50405
--- /dev/null
+++ b/torchao/_models/mixtral-moe/run.sh
@@ -0,0 +1,39 @@
+export MODEL_REPO=mistralai/Mixtral-8x7B-Instruct-v0.1
+export CHECKPOINT_PATH=checkpoints/
+
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 1 --compile
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 8 --compile
+
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 1 --moe_quant int8wo --compile
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 8 --moe_quant int8wo --compile
+
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 1 --moe_quant int8wo-base --compile
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 8 --moe_quant int8wo-base --compile
+
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 1 --moe_quant int4wo --compile
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 8 --moe_quant int4wo --compile
+
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 1 --moe_quant int4wo-base --compile
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 8 --moe_quant int4wo-base --compile
+
+# # EXPERT CHOICE
+# # python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 1 --moe_quant int8dq --compile
+# # # # python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 8 --moe_quant int8dq --compile
+# # python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 1 --moe_quant int8dq-base --compile
+# # # # python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 8 --moe_quant int8dq-base --compile
+
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 1 --moe_quant fp8wo --compile
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 8 --moe_quant fp8wo --compile
+
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 1 --moe_quant fp8wo-base --compile
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 8 --moe_quant fp8wo-base --compile
+
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 1 --moe_quant fp8dq --compile
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 8 --moe_quant fp8dq --compile
+
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 1 --moe_quant fp8dq-base --compile
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 8 --moe_quant fp8dq-base --compile
+
+# ARM
+# python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 8 --moe_quant intxdq --device cpu
+# python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --batch_size 8 --moe_quant intxdq --compile --device cpu
diff --git a/torchao/_models/mixtral-moe/scripts/convert_hf_checkpoint.py b/torchao/_models/mixtral-moe/scripts/convert_hf_checkpoint.py
new file mode 100644
index 0000000000..6a39578e32
--- /dev/null
+++ b/torchao/_models/mixtral-moe/scripts/convert_hf_checkpoint.py
@@ -0,0 +1,115 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+
+# This source code is licensed under the license found in the
+# LICENSE file in the root directory of this source tree.
+import glob
+import re
+import sys
+from pathlib import Path
+from typing import Optional
+
+import torch
+
+# support running without installing as a package
+wd = Path(__file__).parent.parent.resolve()
+sys.path.append(str(wd))
+
+from model import ModelArgs
+
+
+@torch.inference_mode()
+def convert_hf_checkpoint(
+    *,
+    checkpoint_dir: Path = Path("checkpoints/mistralai/Mixtral-8x7B-v0.1"),
+    model_name: Optional[str] = None,
+) -> None:
+    if model_name is None:
+        model_name = checkpoint_dir.name
+
+    config = ModelArgs.from_name(model_name)
+    print(f"Model config {config.__dict__}")
+
+    weight_map = {
+        "tok_embeddings.weight": "tok_embeddings.weight",
+        "layers.{}.attention.wq.weight": "layers.{}.attention.wq.weight",
+        "layers.{}.attention.wk.weight": "layers.{}.attention.wk.weight",
+        "layers.{}.attention.wv.weight": "layers.{}.attention.wv.weight",
+        "layers.{}.attention.wo.weight": "layers.{}.attention.wo.weight",
+        "layers.{}.block_sparse_moe.w1": "layers.{}.block_sparse_moe.cond_ffn.w1",
+        "layers.{}.block_sparse_moe.w2": "layers.{}.block_sparse_moe.cond_ffn.w2",
+        "layers.{}.block_sparse_moe.w3": "layers.{}.block_sparse_moe.cond_ffn.w3",
+        "layers.{}.block_sparse_moe.gate.weight": "layers.{}.block_sparse_moe.gate.weight",
+        "layers.{}.attention_norm.weight": "layers.{}.attention_norm.weight",
+        "layers.{}.ffn_norm.weight": "layers.{}.ffn_norm.weight",
+        "norm.weight": "norm.weight",
+        "output.weight": "output.weight",
+    }
+
+    pt_files = glob.glob(str(checkpoint_dir / "*.pt"))
+
+    merged_result = {}
+    for file in sorted(pt_files):
+        state_dict = torch.load(
+            str(file), map_location="cpu", mmap=True, weights_only=True
+        )
+        merged_result.update(state_dict)
+    final_result = {}
+    for key, value in merged_result.items():
+        if "layers" in key:
+            abstract_key = re.sub(r".(\d+).", ".{}.", key)
+            layer_num = re.search(r"\d+", key).group(0)
+            new_key = weight_map[abstract_key]
+            if new_key is None:
+                continue
+            new_key = new_key.format(layer_num)
+        else:
+            new_key = weight_map[key]
+
+        final_result[new_key] = value
+
+    for key in tuple(final_result.keys()):
+        if "wq" in key:
+            q = final_result[key]
+            k = final_result[key.replace("wq", "wk")]
+            v = final_result[key.replace("wq", "wv")]
+            final_result[key.replace("wq", "wqkv")] = torch.cat([q, k, v])
+            del final_result[key]
+            del final_result[key.replace("wq", "wk")]
+            del final_result[key.replace("wq", "wv")]
+        elif "w1" in key or "w3" in key:
+            final_result[key] = (
+                final_result[key]
+                .reshape(config.num_experts, config.intermediate_size, config.dim)
+                .contiguous()
+            )
+        elif "w2" in key:
+            final_result[key] = (
+                final_result[key]
+                .reshape(config.num_experts, config.intermediate_size, config.dim)
+                .permute(0, 2, 1)
+                .contiguous()
+            )
+        elif "gate" in key:
+            final_result[key] = final_result[key].contiguous()
+
+    print(f"Saving checkpoint to {checkpoint_dir / 'model.pth'}")
+    torch.save(final_result, checkpoint_dir / "model.pth")
+
+
+if __name__ == "__main__":
+    import argparse
+
+    parser = argparse.ArgumentParser(description="Convert HuggingFace checkpoint.")
+    parser.add_argument(
+        "--checkpoint_dir",
+        type=Path,
+        default=Path("checkpoints/mistralai/Mixtral-8x7B-v0.1"),
+    )
+    parser.add_argument("--model_name", type=str, default=None)
+
+    args = parser.parse_args()
+    convert_hf_checkpoint(
+        checkpoint_dir=args.checkpoint_dir,
+        model_name=args.model_name,
+    )
diff --git a/torchao/_models/mixtral-moe/scripts/download.py b/torchao/_models/mixtral-moe/scripts/download.py
new file mode 100644
index 0000000000..8a451b001d
--- /dev/null
+++ b/torchao/_models/mixtral-moe/scripts/download.py
@@ -0,0 +1,48 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+
+# This source code is licensed under the license found in the
+# LICENSE file in the root directory of this source tree.
+import os
+from typing import Optional
+
+from requests.exceptions import HTTPError
+
+
+def hf_download(repo_id: Optional[str] = None, hf_token: Optional[str] = None) -> None:
+    from huggingface_hub import snapshot_download
+
+    os.makedirs(f"checkpoints/{repo_id}", exist_ok=True)
+    try:
+        snapshot_download(
+            repo_id,
+            local_dir=f"checkpoints/{repo_id}",
+            local_dir_use_symlinks=False,
+            token=hf_token,
+            ignore_patterns="*.safetensors",
+        )
+    except HTTPError as e:
+        if e.response.status_code == 401:
+            print(
+                "You need to pass a valid `--hf_token=...` to download private checkpoints."
+            )
+        else:
+            raise e
+
+
+if __name__ == "__main__":
+    import argparse
+
+    parser = argparse.ArgumentParser(description="Download data from HuggingFace Hub.")
+    parser.add_argument(
+        "--repo_id",
+        type=str,
+        default="mistralai/Mixtral-8x7B-Instruct-v0.1",
+        help="Repository ID to download from.",
+    )
+    parser.add_argument(
+        "--hf_token", type=str, default=None, help="HuggingFace API token."
+    )
+
+    args = parser.parse_args()
+    hf_download(args.repo_id, args.hf_token)
diff --git a/torchao/_models/mixtral-moe/scripts/prepare.sh b/torchao/_models/mixtral-moe/scripts/prepare.sh
new file mode 100644
index 0000000000..8ca60b165b
--- /dev/null
+++ b/torchao/_models/mixtral-moe/scripts/prepare.sh
@@ -0,0 +1,2 @@
+python scripts/download.py --repo_id mistralai/Mixtral-8x7B-Instruct-v0.1
+python scripts/convert_hf_checkpoint.py --checkpoint_dir checkpoints/mistralai/Mixtral-8x7B-Instruct-v0.1
diff --git a/torchao/dtypes/affine_quantized_tensor_ops.py b/torchao/dtypes/affine_quantized_tensor_ops.py
index bf1bdacb68..1d70f5c7f3 100644
--- a/torchao/dtypes/affine_quantized_tensor_ops.py
+++ b/torchao/dtypes/affine_quantized_tensor_ops.py
@@ -476,12 +476,15 @@ def _(func, types, args, kwargs):
     shape = list(self.shape)
     shape[dim] = end - start
     block_size = self.block_size
-    assert len(block_size) == 2, (
-        f"Slice only works for 2d block_size right now, got: {block_size}"
-    )
+    assert len(block_size) in [
+        2,
+        3,
+    ], f"Slice only works for 2 and 3d block_size right now, got: {block_size}"
     # with slice, some shape dimension might be smaller than block_size dimension, so
     # we need to make sure there is no overflow
-    block_size = (min(shape[0], block_size[0]), min(shape[1], block_size[1]))
+    if len(block_size) == 2:
+        block_size = (min(shape[0], block_size[0]), min(shape[1], block_size[1]))
+
     new = self.__class__(
         aten.slice.Tensor(self.tensor_impl, dim, start, end, step),
         block_size,
@@ -490,7 +493,53 @@ def _(func, types, args, kwargs):
         self.quant_max,
         self.zero_point_domain,
         dtype=self.dtype,
-        strides=self.stride(),
+        strides=self.stride() if len(block_size) == 2 else None,
+    )
+    return return_and_correct_aliasing(func, args, kwargs, new)
+
+
+@implements(aten.index.Tensor)
+def _(func, types, args, kwargs):
+    self, indices = args
+    assert len(indices) == 1, (
+        f"op {func} currently only implemented for single dimensional indexing but got indices: {indices}"
+    )
+    new_tensor_impl = aten.index.Tensor(self.tensor_impl, indices)
+    shape = tuple([indices[0].numel(), *self.shape[1:]])
+
+    block_size = self.block_size
+    new = self.__class__(
+        new_tensor_impl,
+        block_size,
+        shape,
+        self.quant_min,
+        self.quant_max,
+        self.zero_point_domain,
+        dtype=self.dtype,
+    )
+    return return_and_correct_aliasing(func, args, kwargs, new)
+
+
+@implements(aten.select.int)
+def _(func, types, args, kwargs):
+    self, dim, index = fill_defaults(args, 3, [0, 0])
+    assert dim == 0, f"op {func} currently only implemented for dim=0 but got dim={dim}"
+    assert self.dim() == 3, (
+        f"op {func} currently only implemented for 3 dimensional tensors but got shape={self.shape}"
+    )
+
+    new_tensor_impl = aten.select.int(self.tensor_impl, dim, index)
+
+    shape = self.shape[1:]
+    block_size = self.block_size[1:]
+    new = self.__class__(
+        new_tensor_impl,
+        block_size,
+        shape,
+        self.quant_min,
+        self.quant_max,
+        self.zero_point_domain,
+        dtype=self.dtype,
     )
     return return_and_correct_aliasing(func, args, kwargs, new)
 
diff --git a/torchao/dtypes/floatx/float8_layout.py b/torchao/dtypes/floatx/float8_layout.py
index 872179bd9a..5914f00102 100644
--- a/torchao/dtypes/floatx/float8_layout.py
+++ b/torchao/dtypes/floatx/float8_layout.py
@@ -56,6 +56,9 @@ class Float8Layout(Layout):
     mm_config: Optional[Float8MMConfig] = None
 
 
+_fallback_warning_shown = False
+
+
 @register_layout(Float8Layout)
 class Float8AQTTensorImpl(AQTTensorImpl):
     """
@@ -100,12 +103,35 @@ def __init__(
 
     def _apply_fn_to_data(self, fn):
         """Applys a fn to all tensor components stored on this class"""
-        return self.__class__(
-            fn(self.float8_data),
-            fn(self.scale),
-            self.transposed,
-            self._layout,
-        )
+        global _fallback_warning_shown
+
+        try:
+            return self.__class__(
+                fn(self.float8_data),
+                fn(self.scale),
+                self.transposed,
+                self._layout,
+            )
+        except RuntimeError as e:
+            if '"index_cuda" not implemented for ' in str(e):
+                if not _fallback_warning_shown:
+                    import warnings
+
+                    warnings.warn(
+                        f"When trying to index Float8AQTTensorImpl, got known error {e}, will use slower fallback but "
+                        + "note: You can torch.compile the model to avoid this problem.",
+                        UserWarning,
+                    )
+                    _fallback_warning_shown = True
+
+                return self.__class__(  # do indexing in bfloat16 then convert back
+                    fn(self.float8_data.to(torch.bfloat16)).to(self.float8_data.dtype),
+                    fn(self.scale),
+                    self.transposed,
+                    self._layout,
+                )
+            else:
+                raise e
 
     def to(self, *args, **kwargs):
         kwargs = self._get_to_kwargs(*args, **kwargs)
@@ -159,6 +185,13 @@ def __torch_dispatch__(cls, func, types, args, kwargs):
             raise ValueError(
                 f"Not supported args for copy_ due to metadata mistach: {args[0], args[1]}"
             )
+        elif func in [aten.select.int, aten.index.Tensor]:
+            return return_and_correct_aliasing(
+                func,
+                args,
+                kwargs,
+                args[0]._apply_fn_to_data(lambda x: func(x, *args[1:], **kwargs)),
+            )
         elif func is aten.slice.Tensor:
             self, dim, start, end, step = fill_defaults(args, 5, [0, None, None, 1])
             if dim == 0:
diff --git a/torchao/dtypes/uintx/packed_linear_int8_dynamic_activation_intx_weight_layout.py b/torchao/dtypes/uintx/packed_linear_int8_dynamic_activation_intx_weight_layout.py
index 6caa0784d8..dc7b073f32 100644
--- a/torchao/dtypes/uintx/packed_linear_int8_dynamic_activation_intx_weight_layout.py
+++ b/torchao/dtypes/uintx/packed_linear_int8_dynamic_activation_intx_weight_layout.py
@@ -359,6 +359,7 @@ def _impl_2d_aten(input_tensor, weight_tensor):
 
         m, k = input_tensor.shape
         n, k_ = weight_tensor.shape
+
         assert k_ == k
         group_size = weight_tensor.tensor_impl.get_layout().group_size
         packed_weight = weight_tensor.tensor_impl.packed_weight
@@ -366,6 +367,9 @@ def _impl_2d_aten(input_tensor, weight_tensor):
             input_tensor, packed_weight, group_size, k, n
         )
 
+    if input_tensor.numel() == 0:
+        return input_tensor
+
     target = weight_tensor.tensor_impl.get_layout().target
 
     if weight_tensor.tensor_impl.get_layout().has_bias:
diff --git a/torchao/dtypes/uintx/plain_layout.py b/torchao/dtypes/uintx/plain_layout.py
index 516136bca7..3551214d7e 100644
--- a/torchao/dtypes/uintx/plain_layout.py
+++ b/torchao/dtypes/uintx/plain_layout.py
@@ -154,6 +154,14 @@ def __torch_dispatch__(cls, func, types, args, kwargs):
             )
             return return_and_correct_aliasing(func, args, kwargs, new)
 
+        elif func in [aten.select.int, aten.index.Tensor]:
+            return return_and_correct_aliasing(
+                func,
+                args,
+                kwargs,
+                args[0]._apply_fn_to_data(lambda x: func(x, *args[1:], **kwargs)),
+            )
+
         elif func is aten.slice.Tensor:
             self, dim, start, end, step = fill_defaults(args, 5, [0, None, None, 1])
             if dim == 0:
diff --git a/torchao/dtypes/uintx/tensor_core_tiled_layout.py b/torchao/dtypes/uintx/tensor_core_tiled_layout.py
index 9c37f58ada..3bf9ef6b72 100644
--- a/torchao/dtypes/uintx/tensor_core_tiled_layout.py
+++ b/torchao/dtypes/uintx/tensor_core_tiled_layout.py
@@ -93,11 +93,13 @@ def _linear_bf16_act_uint4_weight_impl(input_tensor, weight_tensor, bias):
     act_mat = torch.nn.functional.pad(act_mat, (0, pad_size - act_mat.shape[-1]))
 
     # groupwise int4 quantization
-    groupsize = weight_tensor.block_size[1]
-    y = torch.ops.aten._weight_int4pack_mm(
-        act_mat.contiguous(), packed_weight, groupsize, scale_and_zero
-    )
-
+    groupsize = weight_tensor.block_size[-1]
+    if act_mat.numel() == 0:  # handling for empty input
+        y = act_mat
+    else:
+        y = torch.ops.aten._weight_int4pack_mm(
+            act_mat.contiguous(), packed_weight, groupsize, scale_and_zero
+        )
     # remove out_feature padding
     orig_out_features = weight_tensor.shape[-2]
     y = y[:, :orig_out_features]
@@ -119,7 +121,7 @@ class TensorCoreTiledLayout(Layout):
     inner_k_tiles: int = 8
 
     def pre_process(self, input: torch.Tensor) -> torch.Tensor:
-        orig_out_features, orig_in_features = input.shape
+        orig_out_features, orig_in_features = input.shape[-2:]
         in_features = find_multiple(orig_in_features, 1024)
         out_features = find_multiple(orig_out_features, 8)
         input = torch.nn.functional.pad(
@@ -160,18 +162,18 @@ def post_process(
         zero_point: torch.Tensor,
         block_size: Tuple[int, ...],
     ) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
-        orig_out_features, orig_in_features = input.shape
+        orig_out_features, orig_in_features = input.shape[-2:]
         in_features = find_multiple(orig_in_features, 1024)
         out_features = find_multiple(orig_out_features, 8)
         input = torch.nn.functional.pad(
             input,
             (0, in_features - orig_in_features, 0, out_features - orig_out_features),
         )
-        assert len(block_size) == 2, (
-            f"TensorCoreTiledLayout only supports len(block_size) == 2, got: {block_size}"
+        assert len(block_size) == 2 or len(block_size) == 3, (
+            f"TensorCoreTiledLayout only supports len(block_size) == 2 or 3, got: {block_size}"
         )
-        scale_pad_dim_0 = (out_features - orig_out_features) // block_size[0]
-        scale_pad_dim_1 = (in_features - orig_in_features) // block_size[1]
+        scale_pad_dim_0 = (out_features - orig_out_features) // block_size[-2]
+        scale_pad_dim_1 = (in_features - orig_in_features) // block_size[-1]
         scale = torch.nn.functional.pad(scale, (0, scale_pad_dim_1, 0, scale_pad_dim_0))
         zero_point = torch.nn.functional.pad(
             zero_point, (0, scale_pad_dim_1, 0, scale_pad_dim_0)
@@ -262,21 +264,44 @@ def from_plain(
         _layout: Layout,
     ):
         assert isinstance(_layout, TensorCoreTiledLayout)
+        assert int_data.dtype == torch.int32, (
+            "torch.ops.aten._convert_weight_to_int4pack in torch 2.4 expects `int32` dtype"
+        )
+
+        def quant_2d(int_data_2d):
+            if TORCH_VERSION_AT_LEAST_2_5:
+                int_data_2d = (int_data_2d[::, ::2] << 4 | int_data_2d[::, 1::2]).to(
+                    torch.uint8
+                )
+            else:
+                assert int_data_2d.dtype == torch.int32, (
+                    "torch.ops.aten._convert_weight_to_int4pack in torch 2.4 expects `int32` dtype"
+                )
+            return torch.ops.aten._convert_weight_to_int4pack(
+                int_data_2d.contiguous(), _layout.inner_k_tiles
+            )
 
-        if TORCH_VERSION_AT_LEAST_2_5:
-            int_data = (int_data[::, ::2] << 4 | int_data[::, 1::2]).to(torch.uint8)
-            assert int_data.dtype == torch.uint8, (
-                "torch.ops.aten._convert_weight_to_int4pack in torch 2.5 expects `uint8` dtype"
+        if int_data.dim() == 3:  # for moe quant
+            num_experts = int_data.shape[0]
+            packed_weight_list = []
+            for expert in range(num_experts):
+                packed_weight_list.append(quant_2d(int_data[expert]).unsqueeze(0))
+            packed_weight = torch.cat(packed_weight_list, dim=0)
+            scale = scale.reshape(int_data.shape[0], int_data.shape[-2], -1)
+            zero_point = (
+                zero_point.reshape(int_data.shape[0], int_data.shape[-2], -1)
+                if zero_point is not None
+                else None
             )
         else:
-            assert int_data.dtype == torch.int32, (
-                "torch.ops.aten._convert_weight_to_int4pack in torch 2.4 expects `int32` dtype"
+            assert int_data.dim() == 2
+            packed_weight = quant_2d(int_data)
+            scale = scale.reshape(int_data.shape[0], -1)
+            zero_point = (
+                zero_point.reshape(int_data.shape[0], -1)
+                if zero_point is not None
+                else None
             )
-        packed_weight = torch.ops.aten._convert_weight_to_int4pack(
-            int_data, _layout.inner_k_tiles
-        )
-        scale = scale.reshape(int_data.shape[0], -1)
-        zero_point = zero_point.reshape(int_data.shape[0], -1)
         from torchao.quantization.utils import pack_tinygemm_scales_and_zeros
 
         scale_and_zero = pack_tinygemm_scales_and_zeros(scale, zero_point, scale.dtype)
@@ -336,6 +361,17 @@ def __torch_dispatch__(cls, func, types, args, kwargs):
                 f"Not supported args for copy_ due to metadata mistach: {args[0], args[1]}"
             )
 
+        if func in [aten.select.int, aten.index.Tensor]:
+            assert not (func is aten.select.int and args[1] != 0), (
+                "aten.select.int currently only has support for dim=0"
+            )
+            return return_and_correct_aliasing(
+                func,
+                args,
+                kwargs,
+                args[0]._apply_fn_to_data(lambda x: func(x, *args[1:], **kwargs)),
+            )
+
         if func is aten.t.default:
             """we don't need to repack the weight and just rely on external
             shape being changed and record the status of transpose/no-transpose
@@ -416,11 +452,16 @@ def block_size(self):
 
         scale, zero = unpack_tinygemm_scales_and_zeros(self.scale_and_zero)
         cur_shape = self.shape
-        assert len(cur_shape) == 4
+        if len(cur_shape) == 5:
+            ones = [1, 1]
+            cur_shape = cur_shape[1:]
+        else:
+            assert len(cur_shape) == 4
+            ones = [1]
         inner_k_tiles = cur_shape[-1] * 2
         original_shape = (cur_shape[0] * 8, cur_shape[1] * (inner_k_tiles * 16))
         groupsize = int(original_shape[1] / scale.shape[-2])
-        return (1, groupsize)
+        return tuple([*ones, groupsize])
 
     def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
         from torchao.quantization.quant_primitives import (
@@ -429,35 +470,50 @@ def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
         )
         from torchao.quantization.utils import unpack_tinygemm_scales_and_zeros
 
-        scale, zero = unpack_tinygemm_scales_and_zeros(self.scale_and_zero)
+        def dequant_4d(self):
+            cur_shape = self.shape
+            scale, zero = unpack_tinygemm_scales_and_zeros(self.scale_and_zero)
+            assert len(cur_shape) == 4
+            inner_k_tiles = cur_shape[-1] * 2
+            original_shape = (cur_shape[0] * 8, cur_shape[1] * (inner_k_tiles * 16))
+            eye_shape = original_shape[1]
+            groupsize = int(original_shape[1] / scale.shape[-2])
+            block_size = (1, groupsize)
+            original_dtype = torch.bfloat16
+            assert len(block_size) == 2 and block_size[0] == 1
+            dequantized = torch.ops.aten._weight_int4pack_mm(
+                torch.eye(eye_shape, device=self.device, dtype=original_dtype),
+                self.packed_weight,
+                groupsize,
+                self.scale_and_zero,
+            )
+            dequantized = dequantized.t().contiguous()
+            return dequantized
 
         cur_shape = self.shape
-        assert len(cur_shape) == 4
-        inner_k_tiles = cur_shape[-1] * 2
-        original_shape = (cur_shape[0] * 8, cur_shape[1] * (inner_k_tiles * 16))
-        eye_shape = original_shape[1]
-        groupsize = int(original_shape[1] / scale.shape[-2])
-        block_size = (1, groupsize)
-        device = self.device
-        original_dtype = torch.bfloat16
+
+        if len(cur_shape) == 4:
+            dequantized = dequant_4d(self)
+        else:
+            assert len(cur_shape) == 5
+            num_experts = cur_shape[0]
+            dequantized_list = []
+            for expert in range(num_experts):
+                dequantized_list.append(dequant_4d(self[expert]).unsqueeze(0))
+            dequantized = torch.cat(dequantized_list, dim=0)
+
+        scale, zero = unpack_tinygemm_scales_and_zeros(self.scale_and_zero)
+        # TODO: move this to `unpack_tinygemm_scales_and_zeros`?
+        scale = scale.reshape(scale.shape[:-1]).contiguous()
+        zero = zero.reshape(zero.shape[:-1]).contiguous()
+
         target_dtype = torch.int32
         quant_min = 0
         quant_max = 15
         zero_point_domain = ZeroPointDomain.FLOAT
-        assert len(block_size) == 2 and block_size[0] == 1
-        dequantized = torch.ops.aten._weight_int4pack_mm(
-            torch.eye(eye_shape, device=device, dtype=original_dtype),
-            self.packed_weight,
-            groupsize,
-            self.scale_and_zero,
-        )
-        dequantized = dequantized.t().contiguous()
-        # TODO: move this to `unpack_tinygemm_scales_and_zeros`?
-        scale = scale.reshape(scale.shape[:-1]).contiguous()
-        zero = zero.reshape(zero.shape[:-1]).contiguous()
         int_data = quantize_affine(
             dequantized,
-            block_size,
+            self.block_size,
             scale,
             zero,
             target_dtype,
diff --git a/torchao/experimental/tests/test_int8_dynamic_activation_intx_weight.py b/torchao/experimental/tests/test_int8_dynamic_activation_intx_weight.py
index da6c98cd6f..d1236e9183 100644
--- a/torchao/experimental/tests/test_int8_dynamic_activation_intx_weight.py
+++ b/torchao/experimental/tests/test_int8_dynamic_activation_intx_weight.py
@@ -629,6 +629,53 @@ def test_identical_to_Int8DynActInt4WeightQATQuantizer(
         sqnr2 = compute_error(prepared_out, converted_out2).item()
         self.assertTrue(sqnr2 == float("inf"))
 
+    def test_moe_quant_intx(self):
+        from torchao.quantization.prototype.moe_quant.quantizable_moe_modules import (
+            MOEFeedForwardAOQuantizable,
+        )
+        from torchao.quantization.prototype.moe_quant.utils import (
+            FakeExtraDimTensor,
+            MoEQuantConfig,
+            UseFakeExtraDimTensor,
+            cond_ffn_filter,
+        )
+        from torchao.quantization.quant_api import (
+            Int8DynamicActivationIntxWeightConfig,
+            PackedLinearInt8DynamicActivationIntxWeightLayout,
+            quantize_,
+        )
+        from torchao.quantization.utils import compute_error
+
+        with torch.device("cpu"):
+            model = MOEFeedForwardAOQuantizable(512, 256, 8, 2, empty_init=False).to(
+                torch.float32
+            )
+            x = torch.randn(8, 512, dtype=torch.float32)
+
+        out = model(x).clone()
+
+        base_config = Int8DynamicActivationIntxWeightConfig(
+            layout=PackedLinearInt8DynamicActivationIntxWeightLayout()
+        )
+        moe_config = MoEQuantConfig(
+            base_config, use_fake_extra_dim_tensor=UseFakeExtraDimTensor.TRUE
+        )
+
+        quantize_(model, moe_config, cond_ffn_filter)
+
+        out_q = model(x).clone()
+        assert isinstance(model.experts.w1, FakeExtraDimTensor)
+
+        mod_c = torch.compile(model, mode="reduce-overhead")
+
+        mod_c(x)
+        mod_c(x)
+
+        out_qc = mod_c(x).clone()
+
+        self.assertGreater(compute_error(out_q, out), 30)
+        self.assertGreater(compute_error(out_qc, out), 30)
+
 
 if __name__ == "__main__":
     unittest.main()
diff --git a/torchao/quantization/linear_activation_quantized_tensor.py b/torchao/quantization/linear_activation_quantized_tensor.py
index e4343a086f..aa946c064f 100644
--- a/torchao/quantization/linear_activation_quantized_tensor.py
+++ b/torchao/quantization/linear_activation_quantized_tensor.py
@@ -82,6 +82,8 @@ def __tensor_unflatten__(
     def _quantized_linear_op(
         input_tensor: torch.Tensor, weight_tensor: torch.Tensor, bias: torch.Tensor
     ):
+        if input_tensor.numel() == 0:
+            return input_tensor
         input_quant_func = weight_tensor.input_quant_func
         original_weight_tensor = weight_tensor.original_weight_tensor
         quant_kwargs = weight_tensor.quant_kwargs
@@ -243,6 +245,34 @@ def _(func, types, args, kwargs):
     )
 
 
+@implements(aten.select.int)
+def _(func, types, args, kwargs):
+    return return_and_correct_aliasing(
+        func,
+        args,
+        kwargs,
+        LinearActivationQuantizedTensor(
+            func(args[0].original_weight_tensor, *args[1:]),
+            args[0].input_quant_func,
+            args[0].quant_kwargs,
+        ),
+    )
+
+
+@implements(aten.index.Tensor)
+def _(func, types, args, kwargs):
+    return return_and_correct_aliasing(
+        func,
+        args,
+        kwargs,
+        LinearActivationQuantizedTensor(
+            func(args[0].original_weight_tensor, *args[1:]),
+            args[0].input_quant_func,
+            args[0].quant_kwargs,
+        ),
+    )
+
+
 # this is needed for DTensor.from_local() and for flattening tensor
 @implements(aten.view.default)
 def _(func, types, args, kwargs):
diff --git a/torchao/quantization/prototype/moe_quant/README.md b/torchao/quantization/prototype/moe_quant/README.md
new file mode 100644
index 0000000000..d774fae8fd
--- /dev/null
+++ b/torchao/quantization/prototype/moe_quant/README.md
@@ -0,0 +1,51 @@
+# MoE Quantization
+
+Our goal with this prototype implementation of moe quantization is to enable usage of existing linear quantization techniques for moe quantization. While it would likely be more performant to use a fused kernel for quantized moe, by decomposing the moe operation into a sequence of linear operations, we can utilize the existing tools and UX that work for lienar quantization and apply them to moe.
+
+Examples of the usage of these apis can be found in both the llama4_quant.py and ao/torchao/_models/mixtral-moe/generate.py
+
+## Quantization API
+
+The API for moe quantization is very similar to linear quantization, given a moe module that is decomposed into linear operations, is quantizable and compilable. In practice this requires us to use the modules found in quantizable_moe_modules.py or something similar. Once this change has been made the API is as follows for a few different quantization techniques:
+
+```python
+
+from torchao.quantization.prototype.moe_quant.utils import cond_ffn_filter,
+from torchao.quantization.quant_api import quantize_, Int8WeightOnlyConfig
+
+quantize_(model, MoEQuantConfig(Int8WeightOnlyConfig()), filter_fn=cond_ffn_filter)
+model=torch.compile(model, mode="reduce-overhead")
+# you can also use fullgraph=True for single token inference
+```
+
+This api is the same as for normal linear quantization but with a specific filter function. This works for several different quantization techniques where the quantized tensor subclass has been adapted to work with 3D tensors. Specifically this means Int8WeightOnlyConfig, Int4WeightOnlyConfig, Int4WeightOnlyConfig, Float8DynamicActivationFloat8WeightConfig, and Int8DynamicActivationInt8WeightConfig. It should be noted that due to the requirements on minimum tensor input size (>16), Int8DynamicActivationInt8WeightConfig is best used for expert choice moe rather than token choice which is what the rest of the framework in this folder supports.
+
+
+## Alternative Quantization API
+
+To make the above api work, each tensor subclass had to be edited to work as 3D tensors. However the only ops we actually need to support are a few indexing and slicing ops on the 0th dimension, the majority of the work was removing hard coded assumptions about the tensor dimensionality. This means its possible to instead create a new tensor subclass that pretends to be a 3D tensor by storing a series of 2D tensors and simulating the slicing and indexing ops until eventually just returning the singular desired 2D quantized tensor subclass. This can be achieved using the alternative api by changing the fake_extra_dim_tensor flag of the MoEQuantConfig:
+
+```python
+
+from torchao.quantization.prototype.moe_quant.utils import cond_ffn_filter, MoEQuantConfig, UseFakeExtraDimTensor
+from torchao.quantization.quant_api import quantize_, Int8DynamicActivationIntxWeightConfig
+
+config = MoEQuantConfig(
+    Int8DynamicActivationIntxWeightConfig(),
+    # this is the only difference from the above api
+    use_fake_extra_dim_tensor=UseFakeExtraDimTensor.TRUE,
+)
+
+quantize_(model, , filter_fn=cond_ffn_filter)
+model=torch.compile(model, mode="reduce-overhead")
+```
+
+It should also be noted that the default value for use_fake_extra_dim_tensor is AS_FALLBACK which means that it will try to use the base method but if not, will use the more general but less performant fake_extra_dim_tensor method.
+
+While this approach turns out to not be especially performant, it does allow for slightly better memory characteristics since all the tensors are held seperately and aren't actually modified or indexed. It is flexible enough to work with all of the existing linear quantization techniques that make use of quantized tensor subclasses without any changes being made to those classes. It is compilable though neither single token nor multi token inference works with fullgraph compilation.
+
+## Model API
+
+In practice the moe implementations of known models tend to not be easy to quantize and even of those that are, they are often either compiled with many graph breaks or impossible to torch.compile at all.
+
+The modules in the quantizable_moe_modules.py file were carefully written to satisfy both of those necessary characteristics but to apply moe quantization to your own model, it will require first a module swap from the existing MoE module type, to these more flexible ones. While there isn't a one size fits all way to do this, an example of how it was done for huggingface's llama4 implementation can be found in llama4_quant.py which can be seen as a proof of concept.
diff --git a/torchao/quantization/prototype/moe_quant/__init__.py b/torchao/quantization/prototype/moe_quant/__init__.py
new file mode 100644
index 0000000000..e69de29bb2
diff --git a/torchao/quantization/prototype/moe_quant/llama4_quant.py b/torchao/quantization/prototype/moe_quant/llama4_quant.py
new file mode 100644
index 0000000000..67ad2ab464
--- /dev/null
+++ b/torchao/quantization/prototype/moe_quant/llama4_quant.py
@@ -0,0 +1,92 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+# T tokens
+# E experts
+# D dim
+# I intermediate dim
+# A activated experts
+# T'(e) tokens for expert e
+
+import torch
+import torch.nn as nn
+from transformers import AutoTokenizer, Llama4ForCausalLM
+from transformers.models.llama4.modeling_llama4 import Llama4TextMoe
+
+from torchao.quantization.prototype.moe_quant.quantizable_moe_modules import (
+    MOEFeedForwardAOQuantizable,
+)
+from torchao.quantization.quant_api import _replace_with_custom_fn_if_matches_filter
+
+
+def llama4_moe_filter_fn(module, fqn):
+    return isinstance(module, Llama4TextMoe)
+
+
+def convert_fn(module):
+    # get data
+    hidden_dim = module.hidden_dim
+    expert_dim = module.experts.expert_dim
+    num_experts = module.num_experts
+    top_k = module.top_k
+    act_fn = module.experts.act_fn
+    shared_expert = module.shared_expert
+    return_scores = True
+    new_mod = MOEFeedForwardAOQuantizable(
+        hidden_dim,
+        expert_dim,
+        num_experts,
+        top_k,
+        act_fn,
+        shared_expert,
+        return_scores,
+    )
+
+    router = module.router
+    up_proj = module.experts.gate_up_proj
+    w1, w3 = up_proj.permute(0, 2, 1).chunk(2, dim=1)
+    w2 = module.experts.down_proj.permute(0, 2, 1)
+
+    new_mod.router = router
+    new_mod.experts.w1 = nn.Parameter(w1, requires_grad=False)
+    new_mod.experts.w2 = nn.Parameter(w2, requires_grad=False)
+    new_mod.experts.w3 = nn.Parameter(w3, requires_grad=False)
+    return new_mod
+
+
+model_id = "meta-llama/Llama-4-Scout-17B-16E-Instruct"
+model = Llama4ForCausalLM.from_pretrained(model_id, torch_dtype=torch.bfloat16)
+tokenizer = AutoTokenizer.from_pretrained(model_id)
+
+_replace_with_custom_fn_if_matches_filter(
+    model,
+    convert_fn,
+    llama4_moe_filter_fn,
+)
+
+model = model
+
+from torchao.quantization import Int4WeightOnlyConfig, quantize_
+from torchao.quantization.prototype.moe_quant.utils import (
+    MoEQuantConfig,
+    cond_ffn_filter,
+)
+
+quantize_(model, MoEQuantConfig(Int4WeightOnlyConfig()), cond_ffn_filter, device="cuda")
+
+model.cuda()
+
+model = torch.compile(model, mode="reduce-overhead")
+
+prompt = "He is here, the one who will tear apart the very stars"
+inputs = tokenizer(prompt, return_tensors="pt")
+model.generate(inputs.input_ids.cuda(), max_length=30)
+model.generate(inputs.input_ids.cuda(), max_length=30)
+generate_ids = model.generate(inputs.input_ids.cuda(), max_length=50)
+out = tokenizer.batch_decode(
+    generate_ids, skip_special_tokens=True, clean_up_tokenization_spaces=False
+)[0]
+print(out)
diff --git a/torchao/quantization/prototype/moe_quant/quantizable_moe_modules.py b/torchao/quantization/prototype/moe_quant/quantizable_moe_modules.py
new file mode 100644
index 0000000000..516341a3a8
--- /dev/null
+++ b/torchao/quantization/prototype/moe_quant/quantizable_moe_modules.py
@@ -0,0 +1,191 @@
+import torch
+import torch.nn.functional as F
+from torch import Tensor, nn
+
+from torchao.quantization.prototype.moe_quant.utils import FakeExtraDimTensor
+
+
+class MOEFeedForwardAOQuantizable(nn.Module):
+    def __init__(
+        self,
+        hidden_dim,
+        expert_dim,
+        num_experts,
+        top_k,
+        act_fn=F.silu,
+        shared_expert=None,
+        return_scores=False,
+        empty_init=True,
+    ) -> None:
+        super().__init__()
+        self.router = nn.Linear(hidden_dim, num_experts, bias=False)
+        self.experts = ConditionalFeedForwardAOQuantizable(
+            num_experts, hidden_dim, expert_dim, act_fn, empty_init
+        )
+        self.hidden_dim = hidden_dim
+        self.top_k = top_k
+        self.shared_expert = shared_expert
+        self.return_scores = return_scores
+
+    def forward(self, x: Tensor) -> Tensor:
+        batch_size = x.shape[0]
+        x = x.view(-1, self.hidden_dim)  # x: [T, D]
+        scores = self.router(x)  # [T, E]
+        scores = F.softmax(scores, dim=-1)
+        scores, expert_indices = torch.topk(
+            scores, self.top_k, dim=-1
+        )  # [T, A], [T, A]
+        scores /= scores.sum(dim=-1, keepdim=True).to(x.dtype)  # [T, A]
+
+        out = self.experts(x, expert_indices, scores, self.top_k)
+        if self.shared_expert:
+            out += self.shared_expert(x)
+
+        if self.return_scores:
+            return out.reshape(batch_size, -1, self.hidden_dim), scores
+        else:
+            return out.reshape(batch_size, -1, self.hidden_dim)
+
+
+class ConditionalFeedForwardAOQuantizable(nn.Module):
+    def __init__(self, num_experts, hidden_dim, expert_dim, act_fn, empty_init=True):
+        super().__init__()
+        if empty_init:
+            self.w1 = nn.Parameter(
+                torch.empty(num_experts, expert_dim, hidden_dim)
+            )  # E, I, D
+            self.w2 = nn.Parameter(
+                torch.empty(num_experts, hidden_dim, expert_dim)
+            )  # E, D, I
+            self.w3 = nn.Parameter(
+                torch.empty(num_experts, expert_dim, hidden_dim)
+            )  # E, I, D
+        else:
+            self.w1 = nn.Parameter(
+                torch.randn(num_experts, expert_dim, hidden_dim)
+            )  # E, I, D
+            self.w2 = nn.Parameter(
+                torch.randn(num_experts, hidden_dim, expert_dim)
+            )  # E, D, I
+            self.w3 = nn.Parameter(
+                torch.randn(num_experts, expert_dim, hidden_dim)
+            )  # E, I, D
+        self.num_experts = num_experts
+        self.act_fn = act_fn
+        self.hidden_dim = hidden_dim
+        self.expert_dim = expert_dim
+
+    def forward(
+        self,
+        x: Tensor,  # T, D
+        expert_indices: Tensor,  # T, A
+        expert_weights: Tensor,  # T, A
+        top_k: int,
+    ) -> Tensor:
+        num_tokens, _hidden_dim = x.shape
+        num_token_activations = num_tokens * top_k
+
+        if x.shape[0] == 1 and not isinstance(
+            self.w1, FakeExtraDimTensor
+        ):  # only 1 token (can be done without graph breaks when compiled)
+            outs = []
+            expert_indices = expert_indices.view(top_k)
+            # collect used experts
+            w1 = self.w1[expert_indices]
+            w2 = self.w2[expert_indices]
+            w3 = self.w3[expert_indices]
+            # run token through each expert
+            for index in range(top_k):
+                y1 = F.silu(F.linear(x, w1[index]))
+                y3 = F.linear(x, w3[index])
+                y2 = w2[index]
+
+                cur_out = F.linear(y1 * y3, y2)
+                outs.append(cur_out)
+
+            # combine outputs
+            final_out = (
+                (torch.cat(outs, dim=0) * expert_weights.view(-1, 1))
+                .sum(dim=0)
+                .reshape(x.shape)
+            )
+            return final_out
+        else:
+            expert_list = [x for x in range(self.num_experts)]
+
+            # shuffle tokens into groups for each expert
+            ordered_token_activations = expert_indices.view(-1).argsort(
+                stable=True
+            )  # [A]
+            ordered_token_indices = (
+                ordered_token_activations.div(top_k).floor().to(torch.int64)
+            )  #  [T]
+            if not expert_indices.is_cuda:  # histc doesn't work on cpu for integers
+                num_tokens_per_expert = torch.bincount(
+                    expert_indices.view(-1) + 1, minlength=self.num_experts + 1
+                )
+            else:
+                num_tokens_per_expert = torch.histc(
+                    expert_indices,
+                    bins=self.num_experts + 1,
+                    min=-1,
+                    max=self.num_experts,
+                )  #  [E+1] (added leading 0 so can be used for indexing)
+            cum_tokens_per_expert = num_tokens_per_expert.cumsum(0).to(
+                torch.int64
+            )  #  [E+1]
+
+            @torch._dynamo.disable()
+            def group_tokens_by_expert(
+                ordered_token_indices, cum_tokens_per_expert, expert_list
+            ):
+                token_indices_per_expert = [
+                    ordered_token_indices[
+                        cum_tokens_per_expert[expert] : cum_tokens_per_expert[
+                            expert + 1
+                        ]
+                    ].to(torch.int64)
+                    for expert in expert_list
+                ]  # [T'(e1)], [T'(e2)] ...
+                return token_indices_per_expert
+
+            token_indices_per_expert = group_tokens_by_expert(
+                ordered_token_indices, cum_tokens_per_expert, expert_list
+            )
+            tokens_grouped_by_expert = [
+                x[indices] for indices in token_indices_per_expert
+            ]
+
+            # calculate outputs for each expert
+            outs = []
+            for cur_x, expert in zip(tokens_grouped_by_expert, expert_list):
+                w1 = self.w1[expert]  # I, D
+                w2 = self.w2[expert]  # D, I
+                w3 = self.w3[expert]  # I, D
+
+                y1 = F.silu(F.linear(cur_x, w1))
+                y3 = F.linear(cur_x, w3)
+                y2 = w2
+
+                cur_out = F.linear(y1 * y3, y2)  # [T'(e), D]
+                outs.append(cur_out)
+
+            # weigh outputs
+            ordered_outs = torch.cat(outs, dim=0)  # [T*A, D]
+            ordered_token_activation_weights = expert_weights.view(-1, 1)[
+                ordered_token_activations
+            ].view(-1, 1)  # [T*A, 1]
+            weighted_ordered_outs = (
+                ordered_outs * ordered_token_activation_weights
+            )  # [T*A, D]
+
+            # sum weighted token-activation outputs together for each token
+            final_out = torch.zeros_like(x)  #  [T, D]
+            final_out = final_out.scatter_add(
+                dim=0,
+                index=ordered_token_indices.unsqueeze(-1)
+                .expand(num_token_activations, self.hidden_dim)
+                .to(torch.int64),
+                src=weighted_ordered_outs,
+            )
+        return final_out
diff --git a/torchao/quantization/prototype/moe_quant/utils.py b/torchao/quantization/prototype/moe_quant/utils.py
new file mode 100644
index 0000000000..16fa8c8d33
--- /dev/null
+++ b/torchao/quantization/prototype/moe_quant/utils.py
@@ -0,0 +1,308 @@
+import torch
+from torch.utils._python_dispatch import (
+    return_and_correct_aliasing,
+)
+
+aten = torch.ops.aten
+
+from enum import Enum, auto
+from typing import List, Optional, Tuple, Union
+
+from torchao.quantization.quant_api import (
+    _QUANTIZE_CONFIG_HANDLER,
+    AOBaseConfig,
+    dataclass,
+    register_quantize_module_handler,
+)
+from torchao.utils import fill_defaults
+
+
+class DummyModule(torch.nn.Module):
+    """This is used because the TorchAO quantization functions tend to operate on modules so to apply the transform to a tensor, we can load a
+    DummyModule with the target tensor and then apply the transformation to the module and then extract the transformed tensor.
+    """
+
+    def __init__(self, weight: torch.Tensor, bias: Optional[torch.Tensor] = None):
+        super().__init__()
+        self.weight = weight
+        self.bias = bias
+
+
+class FakeExtraDimTensor(torch.Tensor):
+    """This is a subclass of torch.Tensor that simulates a tensor of n+1 dimensions, akin to concatenating several tensors along the 0th dimension.
+    It takes a list of tensors with the same dtype, device and shape and creates a representation of shape (num_tensors, orig_shape). It can handle a
+    variety of ops like detach and clone but most importantly, supports any slicing and indexing along the extra dimension.
+    This is most useful when you have another tensor subclass that you'd like to concatenate together but don't want to support all the necessary
+    pieces of 3D scaffolding required to make it work.
+
+    The structure of this tensor subclass is a linked_list of tensors with each instance of FakeExtraDimTensor containing a head tensor and a tail consisting of
+    either another intance of FakeExtraDimTensor or None if we've reached the end of the linked list. This implementation structure is necessary to
+    support compilation of this tensor subclass since compile requires each tensor component of the tensor subclass to have its own attribute.
+    """
+
+    def __new__(
+        cls,
+        tensors: Union[Tuple[torch.Tensor], List[torch.Tensor]],
+        tensor_tail: Optional["FakeExtraDimTensor"] = None,
+    ):
+        assert len(tensors) > 0 or tensor_tail is not None
+        num_tensors = len(tensors)
+        if tensor_tail is not None:
+            num_tensors += tensor_tail.num_tensors
+            test_tensor = tensor_tail.head_tensor
+        else:
+            test_tensor = tensors[0]
+
+        dtype = test_tensor.dtype
+        shape = test_tensor.shape
+        device = test_tensor.device
+        layout = test_tensor.layout
+        for tensor in tensors:
+            assert tensor.dtype == dtype, (
+                f"all tensors in FakeExtraDimTensor must have same dtype but got {tensor.dtype} and {dtype}"
+            )
+            assert tensor.shape == shape, (
+                f"all tensors in FakeExtraDimTensor must have same shape but got {tensor.shape} and {shape}"
+            )
+            assert tensor.device == device, (
+                f"all tensors in FakeExtraDimTensor must have same device but got {tensor.device} and {device}"
+            )
+            assert tensor.layout == layout, (
+                f"all tensors in FakeExtraDimTensor must have same layout but got {tensor.layout} and {layout}"
+            )
+        kwargs = {}
+        kwargs["dtype"] = dtype
+        kwargs["layout"] = layout
+        kwargs["device"] = device
+        kwargs["requires_grad"] = False
+        new_shape = (num_tensors, *shape)
+        return torch.Tensor._make_wrapper_subclass(cls, new_shape, **kwargs)
+
+    def __repr__(
+        self,
+    ):
+        return f"{self.__class__.__name__}(shape={self.shape}, containing {self.num_tensors}: {self.head_tensor})"
+
+    def __init__(
+        self,
+        tensors: Union[Tuple[torch.Tensor], List[torch.Tensor]],
+        tensor_tail: Optional["FakeExtraDimTensor"] = None,
+    ):
+        tensors = list(tensors)
+        assert len(tensors) > 0 or tensor_tail is not None
+
+        # count num_tensors and make tensor_list
+        self.num_tensors = len(tensors)
+        if tensor_tail is not None:
+            self.num_tensors += tensor_tail.num_tensors
+            tail_list = tensor_tail.tensor_list
+        else:
+            tail_list = []
+        self.tensor_list = tensors + tail_list
+
+        # 3 cases
+        # 0) tensors has 0 elements -> take element from tail then do case 1 instead
+        # 1) tensors has 1 element,  -> pop element and tail is None
+        # 2) tensors has >1 elements, -> pop element and recurse
+
+        # convert case 0 to case 1 by taking 1 element from tail
+        if len(tensors) == 0 and tensor_tail is not None:
+            tensors = [
+                tensor_tail.head_tensor,
+            ]
+            tensor_tail = tensor_tail.tensor_tail
+
+        if len(tensors) > 1:
+            # case (1): remove first element from tensors, then recurse
+            self.head_tensor = tensors[0]  # remove one
+            self.tensor_tail = self.__class__(tensors[1:], tensor_tail)  # recurse
+        elif len(tensors) == 1:
+            # case (2) take final element from tensors, attach tensor_tail then stop recursion
+            self.head_tensor = tensors[0]
+            self.tensor_tail = tensor_tail
+
+    def _apply_fn_to_data(self, fn):
+        self.head_tensor = fn(self.head_tensor)
+        if self.tensor_tail is not None:
+            self.tensor_tail = self.tensor_tail._apply_fn_to_data(fn)
+        return self.__class__([self.head_tensor], self.tensor_tail)
+
+    def __tensor_flatten__(self):
+        if self.tensor_tail is None:
+            return [
+                "head_tensor",
+            ], [self.num_tensors]
+        else:
+            return [
+                "head_tensor",
+                "tensor_tail",
+            ], [self.num_tensors]
+
+    @classmethod
+    def __tensor_unflatten__(
+        cls,
+        tensor_data_dict,
+        tensor_attributes,
+        outer_size,
+        outer_stride,
+    ):
+        head_tensor = tensor_data_dict["head_tensor"]
+        tensor_tail = tensor_data_dict.get("tensor_tail", None)
+        return cls([head_tensor], tensor_tail)
+
+    @classmethod
+    def __torch_function__(cls, func, types, args, kwargs=None):
+        kwargs = {} if kwargs is None else kwargs
+        if func is torch.nn.functional.linear:
+            x, w, bias = (
+                args[0],
+                args[1],
+                args[2] if len(args) > 2 else None,
+            )
+            assert w.num_tensors == 1, (
+                "FakeExtraDimTensor used in a linear op when it had multiple tensors"
+            )
+            return func(x, w.head_tensor, bias)
+        try:
+            with torch._C.DisableTorchFunctionSubclass():
+                return func(*args, **kwargs)
+        except Exception as e:
+            print(f"ERR: subclass {cls} doesn't implement {func}, got error: {e}")
+
+    @classmethod
+    def __torch_dispatch__(cls, func, types, args, kwargs):
+        kwargs = {} if kwargs is None else kwargs
+
+        if func == aten.slice.Tensor:
+            self, dim, start, end, step = fill_defaults(args, 5, [0, None, None, 1])
+            if dim == 0:
+                return return_and_correct_aliasing(
+                    func, args, kwargs, cls(self.tensor_list[start:end:step])
+                )
+
+        elif func == aten.select.int:
+            self, dim, index = fill_defaults(args, 3, [0, 0])
+            if dim == 0:
+                return return_and_correct_aliasing(
+                    func, args, kwargs, cls([self.tensor_list[index]])
+                )
+        elif func == aten.index.Tensor:
+            self, indices, dim = fill_defaults(args, 3, [0])
+            if dim == 0:
+                # this handles a weird bug where indices gets turned into a list
+                # between the function dispatch and torch dispatch but just for this function
+                if isinstance(indices, list) and len(indices) == 1:
+                    indices = indices[0]
+                return return_and_correct_aliasing(
+                    func,
+                    args,
+                    kwargs,
+                    cls([self.tensor_list[index] for index in indices]),
+                )
+        try:
+            return return_and_correct_aliasing(
+                func,
+                args,
+                kwargs,
+                args[0]._apply_fn_to_data(lambda x: func(x, *args[1:], **kwargs)),
+            )
+        except Exception as e:
+            print(
+                f"function {func} failed for FakeExtraDimTensor, following error occured when trying to"
+                "run function on its elements: "
+            )
+            raise e
+
+
+class UseFakeExtraDimTensor(Enum):
+    """Enum that indicate whether to use FakeExtraDimTensor"""
+
+    TRUE = auto()
+    FALSE = auto()
+    AS_FALLBACK = auto()
+
+
+@dataclass
+class MoEQuantConfig(AOBaseConfig):
+    """Configuration for applying quantization to MoE
+    Args:
+        `base_config`: normal AO Config
+    """
+
+    base_config: AOBaseConfig
+    use_fake_extra_dim_tensor: UseFakeExtraDimTensor = UseFakeExtraDimTensor.AS_FALLBACK
+    set_inductor_config: bool = True
+
+
+# Module-level flag to track if we've already printed the error
+_moe_quant_tensor_has_printed_error = False
+
+
+def _moe_quant_tensor(weight, config):
+    def _moe_quant_tensor_base(weight, config):
+        base_config_handler = _QUANTIZE_CONFIG_HANDLER[type(config.base_config)]
+        dummy_mod = DummyModule(weight)
+        quant_mod = base_config_handler(dummy_mod, config.base_config)
+        return quant_mod.weight
+
+    def _moe_quant_tensor_fake_extra_dim_tensor(weight, config):
+        base_config_handler = _QUANTIZE_CONFIG_HANDLER[type(config.base_config)]
+        # break 3D tensor
+        tensors = [weight[i] for i in range(weight.shape[0])]
+        # put tensors into modules since the handlers target modules not tensors
+        dummy_modules = [DummyModule(tensor) for tensor in tensors]
+        # apply handler to each module
+        quant_mods = list(
+            map(lambda x: base_config_handler(x, config.base_config), dummy_modules)
+        )
+        # pack quantized subclasses into FakeExtraDimTensor
+        quant_weight = FakeExtraDimTensor([mod.weight for mod in quant_mods])
+        return quant_weight
+
+    global _moe_quant_tensor_has_printed_error
+
+    use_fake = config.use_fake_extra_dim_tensor
+    if use_fake == UseFakeExtraDimTensor.FALSE:
+        return _moe_quant_tensor_base(weight, config)
+    elif use_fake == UseFakeExtraDimTensor.AS_FALLBACK:
+        try:
+            return _moe_quant_tensor_base(weight, config)
+        except Exception as e:
+            if not _moe_quant_tensor_has_printed_error:
+                print(f"tried to do moe_quant but got error: {e}")
+                _moe_quant_tensor_has_printed_error = True
+            return _moe_quant_tensor_fake_extra_dim_tensor(weight, config)
+    else:  # This handles UseFakeExtraDimTensor.TRUE
+        return _moe_quant_tensor_fake_extra_dim_tensor(weight, config)
+
+
+@register_quantize_module_handler(MoEQuantConfig)
+def moe_quant_fn(module, config: MoEQuantConfig):
+    import warnings
+
+    warnings.simplefilter("ignore", lineno=84)
+    warnings.simplefilter("ignore", lineno=105)
+    assert "ConditionalFeedForwardAOQuantizable" in str(type(module))
+
+    for weight_attr in ["w1", "w2", "w3"]:
+        param = getattr(module, weight_attr)
+        assert param.dim() == 3, (
+            f"when applying moe_quant to {module} expected 3D tensor for {weight_attr} but got {param.dim()}"
+        )
+        assert isinstance(config.base_config, AOBaseConfig), (
+            f"MoEQuantConfig expected to be initialized with an AOBaseConfig but got {type(config.base_config)}"
+            + "this can happen if you initiaze with MoEQuantConfig(AOConfig) rather than MoEQuantConfig(AOConfig())"
+        )
+        new_param = _moe_quant_tensor(param, config)
+        new_param = torch.nn.Parameter(new_param, requires_grad=False)
+        setattr(module, weight_attr, new_param)
+        del param
+    return module
+
+
+def moe_filter(module, fqn):
+    return "MOEFeedForwardAOQuantizable" in str(type(module))
+
+
+def cond_ffn_filter(module, fqn):
+    return "ConditionalFeedForwardAOQuantizable" in str(type(module))
diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index 890c2e2038..c20c37a194 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -300,7 +300,7 @@ def _replace_with_custom_fn_if_matches_filter(
                 device,
                 extra_args,
             )
-            if new_child is not child:
+            if new_child is not child and new_child is not None:
                 setattr(model, name, new_child)
         if device is not None:
             model.to(device=device)  # move parent module to device
@@ -1050,31 +1050,25 @@ class Int4WeightOnlyConfig(AOBaseConfig):
 int4_weight_only = Int4WeightOnlyConfig
 
 
-@register_quantize_module_handler(Int4WeightOnlyConfig)
-def _int4_weight_only_transform(
-    module: torch.nn.Module, config: Int4WeightOnlyConfig
-) -> torch.nn.Module:
+def _int4_weight_only_quantize_tensor(weight, config):
     # TODO(future PR): perhaps move this logic to a different file, to keep the API
     # file clean of implementation details
 
     # for now, make these local variables to allow the rest of the function
     # to be a direct copy-paste
-    weight = module.weight
     group_size = config.group_size
     layout = config.layout
     use_hqq = config.use_hqq
     zero_point_domain = config.zero_point_domain
-    if config.set_inductor_config:
-        torchao.quantization.utils.recommended_inductor_config_setter()
 
     if weight.shape[-1] % group_size != 0:
         logger.info(
             f"Skipping quantizing weight with int4 weight only quantization because the shape of weight {weight.shape} is not compatible with group_size {group_size}"
         )
-        return module
+        return weight
 
     mapping_type = MappingType.ASYMMETRIC
-    block_size = (1, group_size)
+    block_size = tuple([1 for _ in range(weight.dim() - 1)] + [group_size])
     target_dtype = torch.int32
     quant_min = 0
     quant_max = 15
@@ -1126,6 +1120,21 @@ def _int4_weight_only_transform(
         _layout=layout,
         use_hqq=use_hqq,
     )
+    return new_weight
+
+
+@register_quantize_module_handler(Int4WeightOnlyConfig)
+def _int4_weight_only_transform(
+    module: torch.nn.Module, config: Int4WeightOnlyConfig
+) -> torch.nn.Module:
+    if config.set_inductor_config:
+        torchao.quantization.utils.recommended_inductor_config_setter()
+
+    assert hasattr(module, "weight"), (
+        "applying int8 weight only quant requires module to have weight attribute"
+        + " but {module} does not have one"
+    )
+    new_weight = _int4_weight_only_quantize_tensor(module.weight, config)
     module.weight = torch.nn.Parameter(new_weight, requires_grad=False)
     module.extra_repr = types.MethodType(_linear_extra_repr, module)
     return module
@@ -1145,20 +1154,15 @@ class Int8WeightOnlyConfig(AOBaseConfig):
 int8_weight_only = Int8WeightOnlyConfig
 
 
-@register_quantize_module_handler(Int8WeightOnlyConfig)
-def _int8_weight_only_transform(module: torch.nn.Module, config: Int8WeightOnlyConfig):
-    group_size = config.group_size
-    weight = module.weight
-    if config.set_inductor_config:
-        torchao.quantization.utils.recommended_inductor_config_setter()
-
+def _int8_weight_only_quantize_tensor(weight, config):
     mapping_type = MappingType.SYMMETRIC
     target_dtype = torch.int8
     eps = torch.finfo(torch.float32).eps
     zero_point_dtype = torch.int64
+    group_size = config.group_size
     if group_size is None:
-        group_size = weight.shape[1]
-    block_size = (1, group_size)
+        group_size = weight.shape[-1]
+    block_size = tuple([1 for x in range(weight.dim() - 1)] + [group_size])
     new_weight = to_affine_quantized_intx(
         weight,
         mapping_type,
@@ -1167,6 +1171,19 @@ def _int8_weight_only_transform(module: torch.nn.Module, config: Int8WeightOnlyC
         eps=eps,
         zero_point_dtype=zero_point_dtype,
     )
+    return new_weight
+
+
+@register_quantize_module_handler(Int8WeightOnlyConfig)
+def _int8_weight_only_transform(module: torch.nn.Module, config: Int8WeightOnlyConfig):
+    if config.set_inductor_config:
+        torchao.quantization.utils.recommended_inductor_config_setter()
+
+    assert hasattr(module, "weight"), (
+        "applying int8 weight only quant requires module to have weight attribute"
+        + " but {module} does not have one"
+    )
+    new_weight = _int8_weight_only_quantize_tensor(module.weight, config)
     module.weight = torch.nn.Parameter(new_weight, requires_grad=False)
     module.extra_repr = types.MethodType(_linear_extra_repr, module)
     return module
@@ -1283,33 +1300,26 @@ class Int8DynamicActivationInt8WeightConfig(AOBaseConfig):
 int8_dynamic_activation_int8_weight = Int8DynamicActivationInt8WeightConfig
 
 
-@register_quantize_module_handler(Int8DynamicActivationInt8WeightConfig)
-def _int8_dynamic_activation_int8_weight_transform(
-    module: torch.nn.Module, config: Int8DynamicActivationInt8WeightConfig
-) -> torch.nn.Module:
+def _int8_dynamic_activation_int8_weight_quantize_tensor(weight, config):
     layout = config.layout
     act_mapping_type = config.act_mapping_type
     weight_only_decode = config.weight_only_decode
-    if config.set_inductor_config:
-        torchao.quantization.utils.recommended_inductor_config_setter()
-
-    weight = module.weight
 
-    in_features = weight.shape[1]
+    in_features = weight.shape[-1]
     # int8 dynamic quantization only has benefit when in_feature > 16
     if in_features <= 16:
         logger.info(
             f"Skipping applying int8_dynamic_activation_int8_weight to weight of shape {weight.shape}"
             f" because `in_feature` is <= 16: {in_features}"
         )
-        return module
+        return weight
 
     # weight settings
     mapping_type = MappingType.SYMMETRIC
     weight_zero_point_domain = ZeroPointDomain.NONE
 
     def get_weight_block_size(x):
-        return (1, x.shape[1])
+        return tuple([1 for _ in range(x.dim() - 1)] + [x.shape[-1]])
 
     target_dtype = torch.int8
     eps = torch.finfo(torch.float32).eps
@@ -1325,7 +1335,7 @@ def get_weight_block_size(x):
             input_quant_func = _int8_asymm_per_token_quant
 
     block_size = get_weight_block_size(weight)
-    weight = to_affine_quantized_intx(
+    new_weight = to_affine_quantized_intx(
         weight,
         mapping_type,
         block_size,
@@ -1335,8 +1345,25 @@ def get_weight_block_size(x):
         _layout=layout,
         zero_point_domain=weight_zero_point_domain,
     )
-    weight = to_linear_activation_quantized(weight, input_quant_func)
-    module.weight = torch.nn.Parameter(weight, requires_grad=False)
+    new_weight = to_linear_activation_quantized(new_weight, input_quant_func)
+    return new_weight
+
+
+@register_quantize_module_handler(Int8DynamicActivationInt8WeightConfig)
+def _int8_dynamic_activation_int8_weight_transform(
+    module: torch.nn.Module, config: Int8DynamicActivationInt8WeightConfig
+) -> torch.nn.Module:
+    if config.set_inductor_config:
+        torchao.quantization.utils.recommended_inductor_config_setter()
+
+    assert hasattr(module, "weight"), (
+        "applying int8 dynamic activation int8 weight quant requires module to have weight attribute"
+        + "but {module} does not have one"
+    )
+    new_weight = _int8_dynamic_activation_int8_weight_quantize_tensor(
+        module.weight, config
+    )
+    module.weight = torch.nn.Parameter(new_weight, requires_grad=False)
     module.extra_repr = types.MethodType(_linear_extra_repr, module)
     return module
 
@@ -1375,17 +1402,10 @@ class Float8WeightOnlyConfig(AOBaseConfig):
 float8_weight_only = Float8WeightOnlyConfig
 
 
-@register_quantize_module_handler(Float8WeightOnlyConfig)
-def _float8_weight_only_transform(
-    module: torch.nn.Module, config: Float8WeightOnlyConfig
-) -> torch.nn.Module:
+def _float8_weight_only_quant_tensor(weight, config):
     from torchao.dtypes import to_affine_quantized_floatx
 
-    if config.set_inductor_config:
-        torchao.quantization.utils.recommended_inductor_config_setter()
-
-    weight = module.weight
-    block_size = (1, weight.shape[1])
+    block_size = tuple([1 for _ in range(weight.dim() - 1)] + [weight.shape[-1]])
     new_weight = to_affine_quantized_floatx(
         input_float=weight,
         block_size=block_size,
@@ -1393,6 +1413,22 @@ def _float8_weight_only_transform(
         scale_dtype=None,
         _layout=Float8Layout(mm_config=None),
     )
+    return new_weight
+
+
+@register_quantize_module_handler(Float8WeightOnlyConfig)
+def _float8_weight_only_transform(
+    module: torch.nn.Module, config: Float8WeightOnlyConfig
+) -> torch.nn.Module:
+    if config.set_inductor_config:
+        torchao.quantization.utils.recommended_inductor_config_setter()
+
+    assert hasattr(module, "weight"), (
+        "applying int8 weight only quant requires module to have weight attribute"
+        + " but {module} does not have one"
+    )
+    new_weight = _float8_weight_only_quant_tensor(module.weight, config)
+
     module.weight = torch.nn.Parameter(new_weight, requires_grad=False)
     module.extra_repr = types.MethodType(_linear_extra_repr, module)
     return module
@@ -1496,11 +1532,12 @@ def _fp8_mm_compat(weight: torch.Tensor) -> bool:
     Returns:
         bool: True if the tensor can be quantized to float8, False otherwise
     """
-    assert weight.dim() == 2, (
-        f"float8 quantization only works for 2-D tensors, got {weight.dim()}D tensor"
-    )
+    assert weight.dim() in [
+        2,
+        3,
+    ], f"float8 quantization only works for 2/3-D tensors, got {weight.dim()}D tensor"
 
-    out_dim, in_dim = weight.shape
+    out_dim, in_dim = weight.shape[-2:]
     is_compatible = (in_dim % 16 == 0) and (out_dim % 16 == 0)
 
     if not is_compatible:
@@ -1547,34 +1584,26 @@ def __post_init__(self):
 float8_dynamic_activation_float8_weight = Float8DynamicActivationFloat8WeightConfig
 
 
-@register_quantize_module_handler(Float8DynamicActivationFloat8WeightConfig)
-def _float8_dynamic_activation_float8_weight_transform(
-    module: torch.nn.Module, config: Float8DynamicActivationFloat8WeightConfig
-):
-    assert is_sm_at_least_89() or is_MI300(), (
-        "Float8 dynamic activation quantization is only supported on CUDA>=8.9 and MI300+"
-    )
-    if config.set_inductor_config:
-        torchao.quantization.utils.recommended_inductor_config_setter()
-
+def _float8_dynamic_activation_float8_weight_quantize_tensor(weight, config):
     activation_dtype = config.activation_dtype
     weight_dtype = config.weight_dtype
     granularity = config.granularity
     mm_config = config.mm_config
-    weight = module.weight
 
     activation_granularity, weight_granularity = _normalize_granularity(granularity)
 
     if not _fp8_mm_compat(weight):
         # TODO(future PR): this should really throw an exception instead of silently
         # not doing what the user asked
-        return module
+        return weight
     if isinstance(weight_granularity, PerRow):
         assert weight.dtype == torch.bfloat16, (
             "PerRow quantization only works for bfloat16 precision input weight"
         )
 
-    block_size = get_block_size(weight.shape, weight_granularity)
+    block_size = get_block_size(weight.shape[-2:], weight_granularity)
+    if weight.dim() == 3:
+        block_size = tuple([1] + list(block_size))
     quantized_weight = to_affine_quantized_floatx(
         input_float=weight,
         block_size=block_size,
@@ -1592,7 +1621,26 @@ def _float8_dynamic_activation_float8_weight_transform(
     quantized_weight = to_linear_activation_quantized(
         quantized_weight, input_quant_func, quant_kwargs=input_quant_kwargs
     )
+    return quantized_weight
 
+
+@register_quantize_module_handler(Float8DynamicActivationFloat8WeightConfig)
+def _float8_dynamic_activation_float8_weight_transform(
+    module: torch.nn.Module, config: Float8DynamicActivationFloat8WeightConfig
+):
+    assert is_sm_at_least_89() or is_MI300(), (
+        "Float8 dynamic activation quantization is only supported on CUDA>=8.9 and MI300+"
+    )
+    if config.set_inductor_config:
+        torchao.quantization.utils.recommended_inductor_config_setter()
+
+    assert hasattr(module, "weight"), (
+        "applying float8 dynamic activation quant requires module to have weight attribute"
+        + f"but {module} does not have one"
+    )
+    quantized_weight = _float8_dynamic_activation_float8_weight_quantize_tensor(
+        module.weight, config
+    )
     module.weight = torch.nn.Parameter(quantized_weight, requires_grad=False)
     module.extra_repr = types.MethodType(_linear_extra_repr, module)
     return module
diff --git a/torchao/quantization/transform_module.py b/torchao/quantization/transform_module.py
index b6fac49ae9..339d46be35 100644
--- a/torchao/quantization/transform_module.py
+++ b/torchao/quantization/transform_module.py
@@ -47,5 +47,6 @@ def _transform(
     @functools.wraps(config_type)
     def decorator(func):
         _QUANTIZE_CONFIG_HANDLER[config_type] = func
+        return func  # needed to make the functions usable externally
 
     return decorator
diff --git a/torchao/quantization/utils.py b/torchao/quantization/utils.py
index 0c30fba713..a9cad8060e 100644
--- a/torchao/quantization/utils.py
+++ b/torchao/quantization/utils.py
@@ -365,22 +365,23 @@ def get_groupwise_affine_qparams(
 def pack_tinygemm_scales_and_zeros(scales, zeros, dtype=torch.bfloat16):
     guard_dtype_size(scales, "scales", dtype=dtype, size=zeros.size())
     guard_dtype_size(zeros, "zeros", dtype=dtype)
+    dim = scales.dim()
     return (
         torch.cat(
             [
-                scales.reshape(scales.size(0), scales.size(1), 1),
-                zeros.reshape(zeros.size(0), zeros.size(1), 1),
+                scales.unsqueeze(-1),
+                zeros.unsqueeze(-1),
             ],
-            2,
+            dim,
         )
-        .transpose(0, 1)
+        .transpose(-3, -2)
         .contiguous()
     )
 
 
 def unpack_tinygemm_scales_and_zeros(scales_and_zeros):
-    assert len(scales_and_zeros.shape) == 3 and scales_and_zeros.shape[2] == 2
-    return torch.split(scales_and_zeros.transpose(0, 1), 1, 2)
+    assert scales_and_zeros.shape[-1] == 2
+    return torch.split(scales_and_zeros.transpose(-3, -2), 1, -1)
 
 
 def convert_weight_to_int4pack_xpu(weight, zero_point_domain_is_int=False):
diff --git a/torchao/utils.py b/torchao/utils.py
index db269b4cb0..280da4e632 100644
--- a/torchao/utils.py
+++ b/torchao/utils.py
@@ -10,7 +10,7 @@
 from functools import reduce
 from importlib.metadata import version
 from math import gcd
-from typing import Any, Callable, Tuple
+from typing import Any, Callable
 
 import torch
 import torch.nn.utils.parametrize as parametrize
@@ -170,7 +170,7 @@ def benchmark_torch_function_in_microseconds(f, *args, **kwargs):
     return measurement.mean * 1e6
 
 
-def find_multiple(n: int, *args: Tuple[int]) -> int:
+def find_multiple(n: int, *args: int) -> int:
     k: int = reduce(lambda x, y: x * y // gcd(x, y), args + (1,))  # type: ignore[9]
     if n % k == 0:
         return n

From 81e48a33fda9f412866032a47642842c114d745c Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Thu, 8 May 2025 17:24:40 -0700
Subject: [PATCH 008/165] Add a triton kernel for swizziling (#2168)

stack-info: PR: https://github.com/pytorch/ao/pull/2168, branch: drisspg/stack/53
---
 benchmarks/mx_formats/cast_bench.py           |   8 +-
 .../{test_custom_cast.py => test_kernels.py}  |  44 +++++--
 test/prototype/mx_formats/test_mx_tensor.py   |   2 +-
 .../prototype/mx_formats/fp_format_spec.py    |   2 +-
 .../mx_formats/{custom_cast.py => kernels.py} | 121 ++++++++++++++++++
 torchao/prototype/mx_formats/mx_linear.py     |   2 +-
 torchao/prototype/mx_formats/mx_tensor.py     |   2 +-
 torchao/prototype/mx_formats/utils.py         |  11 +-
 8 files changed, 175 insertions(+), 17 deletions(-)
 rename test/prototype/mx_formats/{test_custom_cast.py => test_kernels.py} (95%)
 rename torchao/prototype/mx_formats/{custom_cast.py => kernels.py} (92%)

diff --git a/benchmarks/mx_formats/cast_bench.py b/benchmarks/mx_formats/cast_bench.py
index 21ac2a297a..56fbaf1c01 100644
--- a/benchmarks/mx_formats/cast_bench.py
+++ b/benchmarks/mx_formats/cast_bench.py
@@ -1,3 +1,9 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
 from typing import Callable, Tuple
 
 import fire
@@ -5,7 +11,7 @@
 import triton
 from torch._inductor.utils import do_bench_using_profiling
 
-from torchao.prototype.mx_formats.custom_cast import (
+from torchao.prototype.mx_formats.kernels import (
     triton_to_mxfp8_dim1,
 )
 from torchao.prototype.mx_formats.mx_tensor import to_mx
diff --git a/test/prototype/mx_formats/test_custom_cast.py b/test/prototype/mx_formats/test_kernels.py
similarity index 95%
rename from test/prototype/mx_formats/test_custom_cast.py
rename to test/prototype/mx_formats/test_kernels.py
index bce0b3913c..276d180046 100644
--- a/test/prototype/mx_formats/test_custom_cast.py
+++ b/test/prototype/mx_formats/test_kernels.py
@@ -16,7 +16,17 @@
     F6_E2M3_EXP_BIAS,
     F6_E3M2_EXP_BIAS,
 )
-from torchao.prototype.mx_formats.custom_cast import (
+from torchao.prototype.mx_formats.fp_format_spec import (
+    _assert_equals,
+    dtype_to_interesting_values,
+    float4_e2m1_interesting_values,
+    float6_e2m3_interesting_values,
+    float6_e3m2_interesting_values,
+    get_sem_bits,
+    sem_bits_to_sem_vals,
+    sem_vals_to_f32,
+)
+from torchao.prototype.mx_formats.kernels import (
     f4_unpacked_to_f32,
     f6_e2m3_unpacked_to_f32,
     f6_e3m2_unpacked_to_f32,
@@ -33,17 +43,8 @@
     triton_to_mxfp8_dim1_reference,
     unpack_uint4,
 )
-from torchao.prototype.mx_formats.fp_format_spec import (
-    _assert_equals,
-    dtype_to_interesting_values,
-    float4_e2m1_interesting_values,
-    float6_e2m3_interesting_values,
-    float6_e3m2_interesting_values,
-    get_sem_bits,
-    sem_bits_to_sem_vals,
-    sem_vals_to_f32,
-)
 from torchao.prototype.mx_formats.mx_tensor import MXTensor
+from torchao.prototype.mx_formats.utils import to_blocked
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_8,
     is_sm_at_least_89,
@@ -465,3 +466,24 @@ def test_triton_mxfp8_dim1_randn(M, K):
     x_mx_t, x_s_t = triton_to_mxfp8_dim1(x, inner_block_size=32)
     torch.testing.assert_close(x_mx_t, x_mx_ref, rtol=0, atol=0)
     torch.testing.assert_close(x_s_t, x_s_ref, rtol=0, atol=0)
+
+
+@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.parametrize(
+    "shape",
+    [
+        (63, 1023),
+        (128, 4),
+        (128, 8),
+        (256, 8),
+        (300, 9),
+        (133, 512),
+        (528, 512),
+        (128, 1),
+    ],
+)
+def test_rearrange(shape):
+    scales = torch.randint(256, size=shape, device="cuda", dtype=torch.uint8)
+    eager = to_blocked(scales, False)
+    triton = to_blocked(scales, True)
+    torch.testing.assert_close(eager, triton, atol=0, rtol=0)
diff --git a/test/prototype/mx_formats/test_mx_tensor.py b/test/prototype/mx_formats/test_mx_tensor.py
index 76f340dc78..51ede29bcb 100644
--- a/test/prototype/mx_formats/test_mx_tensor.py
+++ b/test/prototype/mx_formats/test_mx_tensor.py
@@ -17,7 +17,7 @@
     DTYPE_FP6_E3M2,
     SUPPORTED_ELEM_DTYPES,
 )
-from torchao.prototype.mx_formats.custom_cast import pack_uint4, pack_uint6
+from torchao.prototype.mx_formats.kernels import pack_uint4, pack_uint6
 from torchao.prototype.mx_formats.mx_tensor import (
     MXTensor,
     ScaleCalculationMode,
diff --git a/torchao/prototype/mx_formats/fp_format_spec.py b/torchao/prototype/mx_formats/fp_format_spec.py
index bdc0cc4dfd..fc9521ef66 100644
--- a/torchao/prototype/mx_formats/fp_format_spec.py
+++ b/torchao/prototype/mx_formats/fp_format_spec.py
@@ -20,7 +20,7 @@
     DTYPE_FP6_E2M3,
     DTYPE_FP6_E3M2,
 )
-from torchao.prototype.mx_formats.custom_cast import get_bits
+from torchao.prototype.mx_formats.kernels import get_bits
 
 dtype_to_bitwidth = {
     torch.float: 32,
diff --git a/torchao/prototype/mx_formats/custom_cast.py b/torchao/prototype/mx_formats/kernels.py
similarity index 92%
rename from torchao/prototype/mx_formats/custom_cast.py
rename to torchao/prototype/mx_formats/kernels.py
index 3f870b4f28..f643ac3106 100644
--- a/torchao/prototype/mx_formats/custom_cast.py
+++ b/torchao/prototype/mx_formats/kernels.py
@@ -1383,6 +1383,124 @@ def triton_to_mxfp8_dim1_reference(
             scale_e8m0_dim1,
         )
 
+    @triton.jit
+    def triton_scale_swizzle(
+        scale_ptr,
+        scale_rows,
+        scale_cols,
+        output_ptr,
+        input_row_stride,
+        output_block_stride,
+        BLOCK_ROWS: tl.constexpr,
+        BLOCK_COLS: tl.constexpr,
+    ):
+        """
+        Rearranges tensor data from row-major to block-scaled swizzle format.
+
+        Args:
+            scale_ptr: Pointer to the input scale tensor
+            scale_rows: Number of rows in the scale tensor
+            scale_cols: Number of columns in the scale tensor
+            output_ptr: Pointer to the output tensor
+            input_row_stride: Stride between rows in the input tensor
+            output_block_stride: Stride between blocks in the output tensor
+            BLOCK_ROWS: Number of rows in a tile (compile-time constant)
+            BLOCK_COLS: Number of columns in a tile (compile-time constant)
+        """
+        pid_row = tl.program_id(0)
+        pid_col = tl.program_id(1)
+
+        rows = tl.arange(0, BLOCK_ROWS)[:, None]
+        cols = tl.arange(0, BLOCK_COLS)[None, :]
+
+        # Calculate starting row and column for this tile
+        start_row = pid_row * BLOCK_ROWS
+        start_col = pid_col * BLOCK_COLS
+        global_rows = start_row + rows
+        global_cols = start_col + cols
+
+        mask = (global_rows < scale_rows) & (global_cols < scale_cols)
+
+        input_scales = tl.load(
+            scale_ptr + global_rows * input_row_stride + global_cols,
+            mask=mask,
+            other=0.0,
+        )
+
+        r_div_32 = rows // 32
+        r_mod_32 = rows % 32
+
+        # 2) Rearrange to (32, 4, 4) then to final (32, 16) coordinates
+        dest_indices = r_mod_32 * 16 + r_div_32 * 4 + cols
+
+        # Flatten
+        dest_indices_flat = tl.reshape(dest_indices, (BLOCK_ROWS * BLOCK_COLS))
+        scales_flat = tl.reshape(input_scales, (BLOCK_ROWS * BLOCK_COLS))
+
+        # Calculate block offset using provided output block stride
+        LOCAL_NUMEL = BLOCK_ROWS * BLOCK_COLS
+        block_offset = pid_col * LOCAL_NUMEL + (pid_row * output_block_stride)
+
+        tl.store(
+            output_ptr + block_offset + dest_indices_flat,
+            scales_flat,
+        )
+
+    def triton_mx_block_rearrange(scale_tensor: torch.Tensor) -> torch.Tensor:
+        """
+        Rearranges an E8M0 tensor scale from row-major format to block-scaled swizzle format.
+
+        This format is suitable for Tmem as described in NVIDIA documentation:
+        https://docs.nvidia.com/cuda/cublas/index.html#d-block-scaling-factors-layout
+
+        Args:
+            scale_tensor: Input tensor in row-major format with 8-bit elements
+
+        Returns:
+            Rearranged tensor in block-scaled swizzle format
+        """
+        assert scale_tensor.element_size() == 1, (
+            "Expected element size to be 1 byte (8 bits)"
+        )
+        assert scale_tensor.is_contiguous(), "Input tensor must be contiguous"
+
+        rows, cols = scale_tensor.shape
+
+        # Calculate blocks needed
+        n_row_blocks = triton.cdiv(rows, 128)
+        n_col_blocks = triton.cdiv(cols, 4)
+        padded_rows = n_row_blocks * 128
+        padded_cols = n_col_blocks * 4
+
+        out = scale_tensor.new_empty((padded_rows, padded_cols))
+
+        # Input stride (for row-major format)
+        input_row_stride = cols
+
+        # We probably want handle multiple blocks per tile but for now keep it simple
+        BLOCK_ROWS, BLOCK_COLS = 128, 4
+
+        # Output block stride for the rearranged format
+        output_block_stride = BLOCK_ROWS * BLOCK_COLS * (padded_cols // BLOCK_COLS)
+
+        grid = lambda META: (
+            triton.cdiv(padded_rows, BLOCK_ROWS),
+            triton.cdiv(padded_cols, BLOCK_COLS),
+        )
+
+        wrap_triton(triton_scale_swizzle)[grid](
+            scale_tensor.view(torch.uint8),
+            rows,
+            cols,
+            out.view(torch.uint8),
+            input_row_stride,
+            output_block_stride,
+            BLOCK_ROWS=BLOCK_ROWS,
+            BLOCK_COLS=BLOCK_COLS,
+        )
+
+        return out
+
 else:
 
     def triton_to_mxfp8_dim1(
@@ -1394,3 +1512,6 @@ def triton_to_mxfp8_dim1_reference(
         x_hp: torch.Tensor, block_size
     ) -> Tuple[torch.Tensor, torch.Tensor]:
         raise AssertionError("needs torch version 2.8+ and triton")
+
+    def triton_mx_block_rearrange(scale_tensor: torch.Tensor) -> torch.Tensor:
+        raise AssertionError("needs torch version 2.8+ and triton")
diff --git a/torchao/prototype/mx_formats/mx_linear.py b/torchao/prototype/mx_formats/mx_linear.py
index 067613afb7..4db029480f 100644
--- a/torchao/prototype/mx_formats/mx_linear.py
+++ b/torchao/prototype/mx_formats/mx_linear.py
@@ -18,7 +18,7 @@
     MXInferenceLinearConfig,
     MXLinearConfig,
 )
-from torchao.prototype.mx_formats.custom_cast import triton_to_mxfp8_dim1
+from torchao.prototype.mx_formats.kernels import triton_to_mxfp8_dim1
 from torchao.prototype.mx_formats.mx_tensor import MXTensor
 from torchao.quantization.transform_module import (
     register_quantize_module_handler,
diff --git a/torchao/prototype/mx_formats/mx_tensor.py b/torchao/prototype/mx_formats/mx_tensor.py
index f3aca15a73..3125f3c0cc 100644
--- a/torchao/prototype/mx_formats/mx_tensor.py
+++ b/torchao/prototype/mx_formats/mx_tensor.py
@@ -45,7 +45,7 @@
     F32_MIN_NORMAL,
     SUPPORTED_ELEM_DTYPES,
 )
-from torchao.prototype.mx_formats.custom_cast import (
+from torchao.prototype.mx_formats.kernels import (
     f4_unpacked_to_f32,
     f6_e2m3_unpacked_to_f32,
     f6_e3m2_unpacked_to_f32,
diff --git a/torchao/prototype/mx_formats/utils.py b/torchao/prototype/mx_formats/utils.py
index 8b186f82d6..2c828e477c 100644
--- a/torchao/prototype/mx_formats/utils.py
+++ b/torchao/prototype/mx_formats/utils.py
@@ -6,6 +6,8 @@
 
 import torch
 
+from torchao.prototype.mx_formats.kernels import triton_mx_block_rearrange
+
 Tensor = torch.Tensor
 
 
@@ -13,7 +15,7 @@ def ceil_div(a, b):
     return (a + b - 1) // b
 
 
-def to_blocked(input_matrix) -> Tensor:
+def to_blocked(input_matrix, use_triton_kernel: bool = True) -> Tensor:
     """
     Rearrange a large matrix by breaking it into blocks and applying the rearrangement pattern.
 
@@ -22,10 +24,15 @@ def to_blocked(input_matrix) -> Tensor:
 
     Args:
         input_matrix: Input tensor of shape (H, W)
+        use_triton_kernel: Whether to use a triton implementation instead of relying on
+            torch.compile
 
     Returns:
         Rearranged tensor of shape (32*ceil_div(H,128), 16*ceil_div(W,4))
     """
+    if use_triton_kernel:
+        return triton_mx_block_rearrange(input_matrix).flatten()
+
     rows, cols = input_matrix.shape
     n_row_blocks = ceil_div(rows, 128)
     n_col_blocks = ceil_div(cols, 4)
@@ -35,6 +42,8 @@ def to_blocked(input_matrix) -> Tensor:
     padded_cols = n_col_blocks * 4
 
     padded = input_matrix
+    # TODO This is to work around VLLM's usage of compile w/ dynamic shapes
+    # if torch.compiler.is_compiling() or (rows, cols) != (padded_rows, padded_cols):
     if (rows, cols) != (padded_rows, padded_cols):
         padded = torch.zeros(
             (padded_rows, padded_cols),

From 2c901b393846ff39d97598abab586d08765f7ea2 Mon Sep 17 00:00:00 2001
From: Peter Yeh <petrex@users.noreply.github.com>
Date: Thu, 8 May 2025 22:29:49 -0700
Subject: [PATCH 009/165] Triaging ROCm wheel build (#2161)

* Enable ROCm support in build workflow and specify runner configuration for MI300 GPU

* Refactor HIP source directory handling in setup.py and remove deprecated runner configuration from build workflow

* Refactor HIP source collection in setup.py for improved readability
---
 .github/workflows/build_wheels_linux.yml |  2 +-
 setup.py                                 | 21 +++++++++++----------
 2 files changed, 12 insertions(+), 11 deletions(-)

diff --git a/.github/workflows/build_wheels_linux.yml b/.github/workflows/build_wheels_linux.yml
index 7c05cbe8bd..a8d96abc8a 100644
--- a/.github/workflows/build_wheels_linux.yml
+++ b/.github/workflows/build_wheels_linux.yml
@@ -28,7 +28,7 @@ jobs:
       os: linux
       with-cpu: enable
       with-cuda: enable
-      with-rocm: disable
+      with-rocm: enable
       with-xpu: enable
       # Note: if free-threaded python is required add py3.13t here
       python-versions: '["3.9"]'
diff --git a/setup.py b/setup.py
index 7e60acbfa8..a269d4410d 100644
--- a/setup.py
+++ b/setup.py
@@ -311,16 +311,17 @@ def get_extensions():
         glob.glob(os.path.join(extensions_cuda_dir, "**/*.cu"), recursive=True)
     )
 
-    extensions_hip_dir = os.path.join(
-        extensions_dir, "cuda", "tensor_core_tiled_layout"
-    )
-    hip_sources = list(
-        glob.glob(os.path.join(extensions_hip_dir, "*.cu"), recursive=True)
-    )
-    extensions_hip_dir = os.path.join(extensions_dir, "cuda", "sparse_marlin")
-    hip_sources += list(
-        glob.glob(os.path.join(extensions_hip_dir, "*.cu"), recursive=True)
-    )
+    # Define HIP source directories
+    hip_source_dirs = [
+        os.path.join(extensions_dir, "cuda", "tensor_core_tiled_layout"),
+        # TODO: Add sparse_marlin back in once we have a ROCm build for it
+        # os.path.join(extensions_dir, "cuda", "sparse_marlin")
+    ]
+
+    # Collect all HIP sources from the defined directories
+    hip_sources = []
+    for hip_dir in hip_source_dirs:
+        hip_sources.extend(glob.glob(os.path.join(hip_dir, "*.cu"), recursive=True))
 
     # Collect CUDA source files if needed
     if not IS_ROCM and use_cuda:

From b95cf189e4aca1a44886258c40e2c834ca0d1045 Mon Sep 17 00:00:00 2001
From: Manuel Candales <42380156+manuelcandales@users.noreply.github.com>
Date: Fri, 9 May 2025 09:22:28 -0400
Subject: [PATCH 010/165] metal lowbit kernels: qmv_fast optimization (#2167)

---
 torchao/experimental/kernels/mps/metal.yaml   |   3 +
 .../kernels/mps/metal/int1mm.metal            |   9 +-
 .../kernels/mps/metal/int2mm_opt.metal        |  19 +-
 .../kernels/mps/metal/int3mm_opt.metal        |  34 +-
 .../kernels/mps/metal/int4mm_opt.metal        |  18 +-
 .../kernels/mps/metal/int5mm.metal            |  26 +-
 .../kernels/mps/metal/int6mm.metal            |  25 +-
 .../kernels/mps/metal/int7mm.metal            |  26 +-
 .../kernels/mps/metal/qmv_fast.metal          | 364 ++++++++++++++++++
 .../experimental/kernels/mps/src/dispatch.h   |  14 +
 torchao/experimental/kernels/mps/src/lowbit.h |  28 +-
 .../experimental/kernels/mps/src/packing.h    | 141 +++----
 .../kernels/mps/test/test_lowbit.mm           |   6 +-
 .../ops/mps/linear_fp_act_xbit_weight_aten.mm |  12 +-
 .../linear_fp_act_xbit_weight_executorch.mm   |   8 +-
 torchao/experimental/ops/mps/mps_op_lib.py    |   4 +-
 .../experimental/ops/mps/test/test_lowbit.py  |   8 +-
 .../ops/mps/test/test_quantizer.py            |   8 +-
 torchao/experimental/quant_api.py             |   4 +-
 19 files changed, 569 insertions(+), 188 deletions(-)
 create mode 100644 torchao/experimental/kernels/mps/metal/qmv_fast.metal

diff --git a/torchao/experimental/kernels/mps/metal.yaml b/torchao/experimental/kernels/mps/metal.yaml
index eb837432c7..dfad7ad715 100644
--- a/torchao/experimental/kernels/mps/metal.yaml
+++ b/torchao/experimental/kernels/mps/metal.yaml
@@ -21,3 +21,6 @@
 
 - func: int7mm
   file: int7mm.metal
+
+- func: qmv_fast
+  file: qmv_fast.metal
diff --git a/torchao/experimental/kernels/mps/metal/int1mm.metal b/torchao/experimental/kernels/mps/metal/int1mm.metal
index a76d66041b..51e8558e9c 100644
--- a/torchao/experimental/kernels/mps/metal/int1mm.metal
+++ b/torchao/experimental/kernels/mps/metal/int1mm.metal
@@ -11,8 +11,8 @@ using namespace metal;
  *
  * @param[A] M x K input tensor of floating point dtype (Float, Half, BFloat16)
  * @param[B] Packed & quantized weight tensor of uint8 dtype. Expected shape is N x (K / 8)
- * @param[scales] 2D tensor containg the scales for each group. Expected shape is #groups x N
- * @param[zeros] 2D tensor containg the zero points for each group. Expected shape is #groups x N
+ * @param[scales] 2D tensor containg the scales for each group. Expected shape is N x #groups
+ * @param[zeros] 2D tensor containg the zero points for each group. Expected shape is N x #groups
  * @param[outputData] M x N output tensor of floating point dtype (same as input)
  * @param[sizes] The sizes involved in the order: M, K, N
  *
@@ -29,6 +29,7 @@ kernel void int1pack_mm(
     uint2                        thread_index   [[thread_position_in_grid]]) {
     const uint K = sizes.y;
     const uint N = sizes.z;
+    const uint num_groups = (K + groupSize - 1) / groupSize;
     const uint m = thread_index.y; // 0..M-1
     const uint n = thread_index.x; // 0..N-1
     const uint32_t k_block = (K + groupSize - 1) / groupSize;
@@ -38,8 +39,8 @@ kernel void int1pack_mm(
     float rc = 0.0;
     uint k = 0;
     for (uint32_t kb = 0; kb < k_block ; kb ++) {
-      const float scale = float(scales[kb * N + n]);
-      const float zero = float(zeros[kb * N + n]);
+      const float scale = float(scales[n * num_groups + kb]);
+      const float zero = float(zeros[n * num_groups + kb]);
       for(uint idx = 0; idx < groupSize && k < K; idx+=8, k+=8) {
         const auto a_val0 = float(A_ptr[k + 0]);
         const auto a_val1 = float(A_ptr[k + 1]);
diff --git a/torchao/experimental/kernels/mps/metal/int2mm_opt.metal b/torchao/experimental/kernels/mps/metal/int2mm_opt.metal
index 6008de6730..f42a6e44e9 100644
--- a/torchao/experimental/kernels/mps/metal/int2mm_opt.metal
+++ b/torchao/experimental/kernels/mps/metal/int2mm_opt.metal
@@ -26,12 +26,11 @@ using namespace metal;
    @param [in] B is weight matrix of size M x K. Each byte contains 4 2-bit
    values, along K dim, packed together.
    @param [in] scales_ptr is scales ptr corresponding each
-   output channel x groups. These are packed as [num_groups = ceil(K / group_size), N]. N = output
+   output channel x groups. These are packed as [N, num_groups = ceil(K / group_size)]. N = output
    channels.
    @param [in] zeros_ptr is zero points corresponding each
-   output channel x groups. These are packed as [num_groups = ceil(K / group_size), N]. N = output
+   output channel x groups. These are packed as [N, num_groups = ceil(K / group_size)]. N = output
    channels.
-   output channel x groups. These are packed as [num_groups = ceil(K / group_size), N, 2]. N = output
    @param [out] output_data is output matrix of size M x N.
    @param [in] sizes array contains values of M, K and N.
    @param [in] thread_index is global thread id.
@@ -51,6 +50,7 @@ kernel void int2pack_mm(constant T *A [[buffer(0)]],
   constexpr uint k_pack_factor = 4;
   const uint K = sizes.y;
   const uint N = sizes.z;
+  const uint num_groups = (K + group_size - 1) / group_size;
   uint n = thread_index.x; // 0..N/4-1
   uint m = thread_index.z; // 0..M
   n = n / threads_per_channel;
@@ -75,13 +75,18 @@ kernel void int2pack_mm(constant T *A [[buffer(0)]],
     // Find specific group to which channels handled by this thread
     // belong.
     uint k_block_index = k / group_size;
-    uint scales_group_offset = (k_block_index * N + n);
+    uint scales_group_offset = (n * num_groups + k_block_index);
 
     vecT scales =
-        (reinterpret_cast<constant vecT *>(scales_ptr + scales_group_offset))[0];
-    // Adding zero point results in 10% perf penalty.
+        vecT(scales_ptr[scales_group_offset],
+             scales_ptr[scales_group_offset + num_groups],
+             scales_ptr[scales_group_offset + 2 * num_groups],
+             scales_ptr[scales_group_offset + 3 * num_groups]);
     vecT zeros =
-        (reinterpret_cast<constant vecT *>(zeros_ptr + scales_group_offset))[0];
+        vecT(zeros_ptr[scales_group_offset],
+             zeros_ptr[scales_group_offset + num_groups],
+             zeros_ptr[scales_group_offset + 2 * num_groups],
+             zeros_ptr[scales_group_offset + 3 * num_groups]);
     float4 zeros_float = float4(zeros);
 
     float4 a_val = float4(A_ptr[k / 4]);
diff --git a/torchao/experimental/kernels/mps/metal/int3mm_opt.metal b/torchao/experimental/kernels/mps/metal/int3mm_opt.metal
index 8ab9862d03..69bd142cea 100644
--- a/torchao/experimental/kernels/mps/metal/int3mm_opt.metal
+++ b/torchao/experimental/kernels/mps/metal/int3mm_opt.metal
@@ -8,15 +8,14 @@
 using namespace metal;
 
 inline void unpack_3bit(const uchar3 b, thread float* w) {
-  w[0] = float(((b[0] & 1) << 2) | (b[1] & 3));
-  w[1] = float(((b[0] & 2) << 1) | ((b[1] & 12) >> 2));
-  w[2] = float((b[0] & 4) | ((b[1] & 48) >> 4));
-  w[3] = float(((b[0] & 8) >> 1) | ((b[1] & 192) >> 6));
-
-  w[4] = float(((b[0] & 16) >> 2) | (b[2] & 3));
-  w[5] = float(((b[0] & 32) >> 3) | ((b[2] & 12) >> 2));
-  w[6] = float(((b[0] & 64) >> 4) | ((b[2] & 48) >> 4));
-  w[7] = float(((b[0] & 128) >> 5) | ((b[2] & 192) >> 6));
+  w[0] = float(b[0] & 0x07);
+  w[1] = float((b[0] & 0x38) >> 3);
+  w[2] = float(((b[0] & 0xc0) >> 6) | ((b[1] & 0x01) << 2));
+  w[3] = float((b[1] & 0x0e) >> 1);
+  w[4] = float((b[1] & 0x70) >> 4);
+  w[5] = float(((b[1] & 0x80) >> 7) | ((b[2] & 0x03) << 1));
+  w[6] = float((b[2] & 0x1c) >> 2);
+  w[7] = float((b[2] & 0xe0) >> 5);
 }
 
 /**
@@ -24,8 +23,8 @@ inline void unpack_3bit(const uchar3 b, thread float* w) {
  *
  * @param[A] M x K input tensor of floating point dtype (Float, Half, BFloat16)
  * @param[B] Packed & quantized weight tensor of uint8 dtype. Expected shape is N x (3 * K / 8)
- * @param[scales] 2D tensor containg the scales for each group. Expected shape is #groups x N
- * @param[zeros] 2D tensor containg the zero points for each group. Expected shape is #groups x N
+ * @param[scales] 2D tensor containg the scales for each group. Expected shape is N x #groups
+ * @param[zeros] 2D tensor containg the zero points for each group. Expected shape is N x #groups
  * @param[outputData] M x N output tensor of floating point dtype (same as input)
  * @param[sizes] The sizes involved in the order: M, K, N
  *
@@ -45,6 +44,7 @@ kernel void int3pack_mm(constant T *A [[buffer(0)]],
   constexpr uint k_pack_factor = 8;
   const uint K = sizes.y;
   const uint N = sizes.z;
+  const uint num_groups = (K + group_size - 1) / group_size;
   uint n = thread_index.x; // 0..N/4-1
   uint m = thread_index.z; // 0..M
   n = n / threads_per_channel;
@@ -64,12 +64,18 @@ kernel void int3pack_mm(constant T *A [[buffer(0)]],
     // Find specific group to which channels handled by this thread
     // belong.
     uint k_block_index = k / group_size;
-    uint scales_group_offset = (k_block_index * N + n);
+    uint scales_group_offset = (n * num_groups + k_block_index);
 
     vecT scales =
-        (reinterpret_cast<constant vecT *>(scales_ptr + scales_group_offset))[0];
+        vecT(scales_ptr[scales_group_offset],
+             scales_ptr[scales_group_offset + num_groups],
+             scales_ptr[scales_group_offset + 2 * num_groups],
+             scales_ptr[scales_group_offset + 3 * num_groups]);
     vecT zeros =
-        (reinterpret_cast<constant vecT *>(zeros_ptr + scales_group_offset))[0];
+        vecT(zeros_ptr[scales_group_offset],
+             zeros_ptr[scales_group_offset + num_groups],
+             zeros_ptr[scales_group_offset + 2 * num_groups],
+             zeros_ptr[scales_group_offset + 3 * num_groups]);
     float4 zeros_float = float4(zeros);
 
     float4 a_val[2];
diff --git a/torchao/experimental/kernels/mps/metal/int4mm_opt.metal b/torchao/experimental/kernels/mps/metal/int4mm_opt.metal
index edee43ec14..f6d0b4935b 100644
--- a/torchao/experimental/kernels/mps/metal/int4mm_opt.metal
+++ b/torchao/experimental/kernels/mps/metal/int4mm_opt.metal
@@ -64,12 +64,11 @@ using namespace metal;
    @param [in] B is weight matrix of size M x K. Each byte contains 2 4-bit
    values, along K dim, packed together.
    @param [in] scales_ptr is scales ptr corresponding each
-   output channel x groups. These are packed as [num_groups = ceil(K / group_size), N]. N = output
+   output channel x groups. These are packed as [N, num_groups = ceil(K / group_size)]. N = output
    channels.
    @param [in] zeros_ptr is zero points corresponding each
-   output channel x groups. These are packed as [num_groups = ceil(K / group_size), N]. N = output
+   output channel x groups. These are packed as [N, num_groups = ceil(K / group_size)]. N = output
    channels.
-   output channel x groups. These are packed as [num_groups = ceil(K / group_size), N, 2]. N = output
    @param [out] output_data is output matrix of size M x N.
    @param [in] sizes array contains values of M, K and N.
    @param [in] thread_index is global thread id.
@@ -89,6 +88,7 @@ kernel void int4pack_mm(constant T *A [[buffer(0)]],
   constexpr uint k_pack_factor = 2;
   const uint K = sizes.y;
   const uint N = sizes.z;
+  const uint num_groups = (K + group_size - 1) / group_size;
   uint n = thread_index.x; // 0..N/4-1
   uint m = thread_index.z; // 0..M
   n = n / threads_per_channel;
@@ -113,13 +113,19 @@ kernel void int4pack_mm(constant T *A [[buffer(0)]],
     // Find specific group to which channels handled by this thread
     // belong.
     uint k_block_index = k / group_size;
-    uint scales_group_offset = (k_block_index * N + n);
+    uint scales_group_offset = (n * num_groups + k_block_index);
 
     vecT scales =
-        (reinterpret_cast<constant vecT *>(scales_ptr + scales_group_offset))[0];
+        vecT(scales_ptr[scales_group_offset],
+             scales_ptr[scales_group_offset + num_groups],
+             scales_ptr[scales_group_offset + 2 * num_groups],
+             scales_ptr[scales_group_offset + 3 * num_groups]);
     // Adding zero point results in 10% perf penalty.
     vecT zeros =
-        (reinterpret_cast<constant vecT *>(zeros_ptr + scales_group_offset))[0];
+        vecT(zeros_ptr[scales_group_offset],
+             zeros_ptr[scales_group_offset + num_groups],
+             zeros_ptr[scales_group_offset + 2 * num_groups],
+             zeros_ptr[scales_group_offset + 3 * num_groups]);
     float4 zeros_float = float4(zeros);
 
     float4 a_val = float4(A_ptr[k / 4]);
diff --git a/torchao/experimental/kernels/mps/metal/int5mm.metal b/torchao/experimental/kernels/mps/metal/int5mm.metal
index 206786b038..c8be33911a 100644
--- a/torchao/experimental/kernels/mps/metal/int5mm.metal
+++ b/torchao/experimental/kernels/mps/metal/int5mm.metal
@@ -11,8 +11,8 @@ using namespace metal;
  *
  * @param[A] M x K input tensor of floating point dtype (Float, Half, BFloat16)
  * @param[B] Packed & quantized weight tensor of uint8 dtype. Expected shape is N x (5 * K / 8)
- * @param[scales] 2D tensor containg the scales for each group. Expected shape is #groups x N
- * @param[zeros] 2D tensor containg the zero points for each group. Expected shape is #groups x N
+ * @param[scales] 2D tensor containg the scales for each group. Expected shape is N x #groups
+ * @param[zeros] 2D tensor containg the zero points for each group. Expected shape is N x #groups
  * @param[outputData] M x N output tensor of floating point dtype (same as input)
  * @param[sizes] The sizes involved in the order: M, K, N
  *
@@ -29,6 +29,7 @@ kernel void int5pack_mm(
     uint2                        thread_index   [[thread_position_in_grid]]) {
     const uint K = sizes.y;
     const uint N = sizes.z;
+    const uint num_groups = (K + groupSize - 1) / groupSize;
     const uint m = thread_index.y; // 0..M-1
     const uint n = thread_index.x; // 0..N-1
     const uint32_t k_block = (K + groupSize - 1) / groupSize;
@@ -38,8 +39,8 @@ kernel void int5pack_mm(
     float rc = 0.0;
     uint k = 0;
     for (uint32_t kb = 0; kb < k_block ; kb ++) {
-      const float scale = float(scales[kb * N + n]);
-      const float zero = float(zeros[kb * N + n]);
+      const float scale = float(scales[n * num_groups + kb]);
+      const float zero = float(zeros[n * num_groups + kb]);
       for(uint idx = 0; idx < groupSize && k < K; idx+=8, k+=8) {
         const auto a_val0 = float(A_ptr[k + 0]);
         const auto a_val1 = float(A_ptr[k + 1]);
@@ -56,15 +57,14 @@ kernel void int5pack_mm(
         uchar b3 = B_ptr[5 * (k / 8) + 3];
         uchar b4 = B_ptr[5 * (k / 8) + 4];
 
-        uchar w_val0 = ((b0 & 1) << 4) | (b1 & 15);
-        uchar w_val1 = ((b0 & 2) << 3) | ((b1 & 240) >> 4);
-        uchar w_val2 = ((b0 & 4) << 2) | (b2 & 15);
-        uchar w_val3 = ((b0 & 8) << 1) | ((b2 & 240) >> 4);
-
-        uchar w_val4 = ((b0 & 16))       | (b3 & 15);
-        uchar w_val5 = ((b0 & 32) >> 1)  | ((b3 & 240) >> 4);
-        uchar w_val6 = ((b0 & 64) >> 2)  | (b4 & 15);
-        uchar w_val7 = ((b0 & 128) >> 3) | ((b4 & 240) >> 4);
+        uchar w_val0 = (b0 & 0x1f);
+        uchar w_val1 = ((b0 & 0xe0) >> 5) | ((b1 & 0x03) << 3);
+        uchar w_val2 = ((b1 & 0x7c) >> 2);
+        uchar w_val3 = ((b1 & 0x80) >> 7) | ((b2 & 0x0f) << 1);
+        uchar w_val4 = ((b2 & 0xf0) >> 4) | ((b3 & 0x01) << 4);
+        uchar w_val5 = ((b3 & 0x3e) >> 1);
+        uchar w_val6 = ((b3 & 0xc0) >> 6) | ((b4 & 0x07) << 2);
+        uchar w_val7 = ((b4 & 0xf8) >> 3);
 
         rc += a_val0 * (scale * float(w_val0) + zero);
         rc += a_val1 * (scale * float(w_val1) + zero);
diff --git a/torchao/experimental/kernels/mps/metal/int6mm.metal b/torchao/experimental/kernels/mps/metal/int6mm.metal
index 55d359a6ba..45f03d9cef 100644
--- a/torchao/experimental/kernels/mps/metal/int6mm.metal
+++ b/torchao/experimental/kernels/mps/metal/int6mm.metal
@@ -11,8 +11,8 @@ using namespace metal;
  *
  * @param[A] M x K input tensor of floating point dtype (Float, Half, BFloat16)
  * @param[B] Packed & quantized weight tensor of uint8 dtype. Expected shape is N x (6 * K / 8)
- * @param[scales] 2D tensor containg the scales for each group. Expected shape is #groups x N
- * @param[zeros] 2D tensor containg the zero points for each group. Expected shape is #groups x N
+ * @param[scales] 2D tensor containg the scales for each group. Expected shape is N x #groups
+ * @param[zeros] 2D tensor containg the zero points for each group. Expected shape is N x #groups
  * @param[outputData] M x N output tensor of floating point dtype (same as input)
  * @param[sizes] The sizes involved in the order: M, K, N
  *
@@ -29,6 +29,7 @@ kernel void int6pack_mm(
     uint2                        thread_index   [[thread_position_in_grid]]) {
     const uint K = sizes.y;
     const uint N = sizes.z;
+    const uint num_groups = (K + groupSize - 1) / groupSize;
     const uint m = thread_index.y; // 0..M-1
     const uint n = thread_index.x; // 0..N-1
     const uint32_t k_block = (K + groupSize - 1) / groupSize;
@@ -38,8 +39,8 @@ kernel void int6pack_mm(
     float rc = 0.0;
     uint k = 0;
     for (uint32_t kb = 0; kb < k_block ; kb ++) {
-      const float scale = float(scales[kb * N + n]);
-      const float zero = float(zeros[kb * N + n]);
+      const float scale = float(scales[n * num_groups + kb]);
+      const float zero = float(zeros[n * num_groups + kb]);
       for(uint idx = 0; idx < groupSize && k < K; idx+=8, k+=8) {
         const auto a_val0 = float(A_ptr[k + 0]);
         const auto a_val1 = float(A_ptr[k + 1]);
@@ -59,15 +60,15 @@ kernel void int6pack_mm(
         uchar b4 = B_ptr[3 * (k / 4) + 4];
         uchar b5 = B_ptr[3 * (k / 4) + 5];
 
-        uchar w_val0 = ((b0 & 3) << 4) | (b1 & 15);
-        uchar w_val1 = ((b0 & 12) << 2) | ((b1 & 240) >> 4);
-        uchar w_val2 = ((b0 & 48)) | (b2 & 15);
-        uchar w_val3 = ((b0 & 192) >> 2) | ((b2 & 240) >> 4);
+        uchar w_val0 = (b0 & 0x3f);
+        uchar w_val1 = ((b0 & 0xc0) >> 6) | ((b1 & 0x0f) << 2);
+        uchar w_val2 = ((b1 & 0xf0) >> 4) | ((b2 & 0x03) << 4);
+        uchar w_val3 = (b2 & 0xfc) >> 2;
 
-        uchar w_val4 = ((b3 & 3) << 4) | (b4 & 15);
-        uchar w_val5 = ((b3 & 12) << 2) | ((b4 & 240) >> 4);
-        uchar w_val6 = ((b3 & 48)) | (b5 & 15);
-        uchar w_val7 = ((b3 & 192) >> 2) | ((b5 & 240) >> 4);
+        uchar w_val4 = (b3 & 0x3f);
+        uchar w_val5 = ((b3 & 0xc0) >> 6) | ((b4 & 0x0f) << 2);
+        uchar w_val6 = ((b4 & 0xf0) >> 4) | ((b5 & 0x03) << 4);
+        uchar w_val7 = (b5 & 0xfc) >> 2;
 
         rc += a_val0 * (scale * float(w_val0) + zero);
         rc += a_val1 * (scale * float(w_val1) + zero);
diff --git a/torchao/experimental/kernels/mps/metal/int7mm.metal b/torchao/experimental/kernels/mps/metal/int7mm.metal
index b97800b448..ce4e5a51d0 100644
--- a/torchao/experimental/kernels/mps/metal/int7mm.metal
+++ b/torchao/experimental/kernels/mps/metal/int7mm.metal
@@ -11,8 +11,8 @@ using namespace metal;
  *
  * @param[A] M x K input tensor of floating point dtype (Float, Half, BFloat16)
  * @param[B] Packed & quantized weight tensor of uint8 dtype. Expected shape is N x (7 * K / 8)
- * @param[scales] 2D tensor containg the scales for each group. Expected shape is #groups x N
- * @param[zeros] 2D tensor containg the zero points for each group. Expected shape is #groups x N
+ * @param[scales] 2D tensor containg the scales for each group. Expected shape is N x #groups
+ * @param[zeros] 2D tensor containg the zero points for each group. Expected shape is N x #groups
  * @param[outputData] M x N output tensor of floating point dtype (same as input)
  * @param[sizes] The sizes involved in the order: M, K, N
  *
@@ -29,6 +29,7 @@ kernel void int7pack_mm(
     uint2                        thread_index   [[thread_position_in_grid]]) {
     const uint K = sizes.y;
     const uint N = sizes.z;
+    const uint num_groups = (K + groupSize - 1) / groupSize;
     const uint m = thread_index.y; // 0..M-1
     const uint n = thread_index.x; // 0..N-1
     const uint32_t k_block = (K + groupSize - 1) / groupSize;
@@ -38,8 +39,8 @@ kernel void int7pack_mm(
     float rc = 0.0;
     uint k = 0;
     for (uint32_t kb = 0; kb < k_block ; kb ++) {
-      const float scale = float(scales[kb * N + n]);
-      const float zero = float(zeros[kb * N + n]);
+      const float scale = float(scales[n * num_groups + kb]);
+      const float zero = float(zeros[n * num_groups + kb]);
       for(uint idx = 0; idx < groupSize && k < K; idx+=8, k+=8) {
         const auto a_val0 = float(A_ptr[k + 0]);
         const auto a_val1 = float(A_ptr[k + 1]);
@@ -58,15 +59,14 @@ kernel void int7pack_mm(
         uchar b5 = B_ptr[7 * (k / 8) + 5];
         uchar b6 = B_ptr[7 * (k / 8) + 6];
 
-        uchar w_val0 = b0 & 127;
-        uchar w_val1 = b1 & 127;
-        uchar w_val2 = b2 & 127;
-        uchar w_val3 = b3 & 127;
-        uchar w_val4 = b4 & 127;
-        uchar w_val5 = b5 & 127;
-        uchar w_val6 = b6 & 127;
-        uchar w_val7 = ((b0 & 128) >> 7) | ((b1 & 128) >> 6) | ((b2 & 128) >> 5) | ((b3 & 128) >> 4)
-          | ((b4 & 128) >> 3) | ((b5 & 128) >> 2) | ((b6 & 128) >> 1);
+        uchar w_val0 = (b0 & 0x7f);
+        uchar w_val1 = (b0 >> 7) | ((b1 & 0x3f) << 1);
+        uchar w_val2 = (b1 >> 6) | ((b2 & 0x1f) << 2);
+        uchar w_val3 = (b2 >> 5) | ((b3 & 0x0f) << 3);
+        uchar w_val4 = (b3 >> 4) | ((b4 & 0x07) << 4);
+        uchar w_val5 = (b4 >> 3) | ((b5 & 0x03) << 5);
+        uchar w_val6 = (b5 >> 2) | ((b6 & 0x01) << 6);
+        uchar w_val7 = (b6 >> 1);
 
         rc += a_val0 * (scale * float(w_val0) + zero);
         rc += a_val1 * (scale * float(w_val1) + zero);
diff --git a/torchao/experimental/kernels/mps/metal/qmv_fast.metal b/torchao/experimental/kernels/mps/metal/qmv_fast.metal
new file mode 100644
index 0000000000..190b122d15
--- /dev/null
+++ b/torchao/experimental/kernels/mps/metal/qmv_fast.metal
@@ -0,0 +1,364 @@
+// Copyright (c) Meta Platforms, Inc. and affiliates.
+// All rights reserved.
+//
+// This source code is licensed under the BSD 3-Clause license found in the
+// LICENSE file in the root directory of this source tree.
+
+/*
+   This code was taken from MLX, and modified to add support for 1, 5 & 7 bit packing.
+   The original code is Copyright © 2023-2024 Apple Inc.
+   https://github.com/ml-explore/mlx/blob/481349495b8c3d094eb699e678077bbe1406392d/mlx/backend/metal/kernels/quantized.h#L1
+   MLX MIT License: https://github.com/ml-explore/mlx/blob/main/LICENSE
+*/
+
+#include <metal_simdgroup>
+#include <metal_stdlib>
+
+static constant constexpr const int SIMD_SIZE = 32;
+
+template <typename T, typename U, int values_per_thread, int bits>
+inline U load_vector(constant T* x, thread U* x_thread) {
+  static_assert(
+      1 <= bits && bits <= 7,
+      "Template undefined for bits not in {1, 2, 3, 4, 5, 6, 7}");
+
+  U sum = 0;
+
+  if (bits == 1) {
+    for (int i = 0; i < values_per_thread; i += 8) {
+      sum += x[i] + x[i + 1] + x[i + 2] + x[i + 3] + x[i + 4] + x[i + 5] +
+          x[i + 6] + x[i + 7];
+      x_thread[i] = x[i];
+      x_thread[i + 1] = x[i + 1] / 2.0f;
+      x_thread[i + 2] = x[i + 2] / 4.0f;
+      x_thread[i + 3] = x[i + 3] / 8.0f;
+      x_thread[i + 4] = x[i + 4] / 16.0f;
+      x_thread[i + 5] = x[i + 5] / 32.0f;
+      x_thread[i + 6] = x[i + 6] / 64.0f;
+      x_thread[i + 7] = x[i + 7] / 128.0f;
+    }
+  }
+
+  else if (bits == 2) {
+    for (int i = 0; i < values_per_thread; i += 4) {
+      sum += x[i] + x[i + 1] + x[i + 2] + x[i + 3];
+      x_thread[i] = x[i];
+      x_thread[i + 1] = x[i + 1] / 4.0f;
+      x_thread[i + 2] = x[i + 2] / 16.0f;
+      x_thread[i + 3] = x[i + 3] / 64.0f;
+    }
+  }
+
+  else if (bits == 3) {
+    for (int i = 0; i < values_per_thread; i += 8) {
+      sum += x[i] + x[i + 1] + x[i + 2] + x[i + 3] + x[i + 4] + x[i + 5] +
+          x[i + 6] + x[i + 7];
+      x_thread[i] = x[i];
+      x_thread[i + 1] = x[i + 1] / 8.0f;
+      x_thread[i + 2] = x[i + 2] / 64.0f;
+      x_thread[i + 3] = x[i + 3] / 2.0f;
+      x_thread[i + 4] = x[i + 4] / 16.0f;
+      x_thread[i + 5] = x[i + 5] / 128.0f;
+      x_thread[i + 6] = x[i + 6] / 4.0f;
+      x_thread[i + 7] = x[i + 7] / 32.0f;
+    }
+  }
+
+  else if (bits == 4) {
+    for (int i = 0; i < values_per_thread; i += 4) {
+      sum += x[i] + x[i + 1] + x[i + 2] + x[i + 3];
+      x_thread[i] = x[i];
+      x_thread[i + 1] = x[i + 1] / 16.0f;
+      x_thread[i + 2] = x[i + 2] / 256.0f;
+      x_thread[i + 3] = x[i + 3] / 4096.0f;
+    }
+  }
+
+  else if (bits == 5) {
+    for (int i = 0; i < values_per_thread; i += 8) {
+      sum += x[i] + x[i + 1] + x[i + 2] + x[i + 3] + x[i + 4] + x[i + 5] +
+          x[i + 6] + x[i + 7];
+      x_thread[i] = x[i];
+      x_thread[i + 1] = x[i + 1] / 32.0f;
+      x_thread[i + 2] = x[i + 2] / 4.0f;
+      x_thread[i + 3] = x[i + 3] / 128.0f;
+      x_thread[i + 4] = x[i + 4] / 16.0f;
+      x_thread[i + 5] = x[i + 5] / 2.0f;
+      x_thread[i + 6] = x[i + 6] / 64.0f;
+      x_thread[i + 7] = x[i + 7] / 8.0f;
+    }
+  }
+
+  else if (bits == 6) {
+    for (int i = 0; i < values_per_thread; i += 4) {
+      sum += x[i] + x[i + 1] + x[i + 2] + x[i + 3];
+      x_thread[i] = x[i];
+      x_thread[i + 1] = x[i + 1] / 64.0f;
+      x_thread[i + 2] = x[i + 2] / 16.0f;
+      x_thread[i + 3] = x[i + 3] / 4.0f;
+    }
+  }
+
+  else if (bits == 7) {
+    for (int i = 0; i < values_per_thread; i += 8) {
+      sum += x[i] + x[i + 1] + x[i + 2] + x[i + 3] + x[i + 4] + x[i + 5] +
+          x[i + 6] + x[i + 7];
+      x_thread[i] = x[i];
+      x_thread[i + 1] = x[i + 1] / 128.0f;
+      x_thread[i + 2] = x[i + 2] / 64.0f;
+      x_thread[i + 3] = x[i + 3] / 32.0f;
+      x_thread[i + 4] = x[i + 4] / 16.0f;
+      x_thread[i + 5] = x[i + 5] / 8.0f;
+      x_thread[i + 6] = x[i + 6] / 4.0f;
+      x_thread[i + 7] = x[i + 7] / 2.0f;
+    }
+  }
+
+  return sum;
+}
+
+template <typename U, int values_per_thread, int bits>
+inline U qdot(
+    constant uint8_t* w,
+    const thread U* x_thread,
+    U scale,
+    U bias,
+    U sum) {
+  static_assert(
+      1 <= bits && bits <= 7,
+      "Template undefined for bits not in {1, 2, 3, 4, 5, 6, 7}");
+
+  U accum = 0;
+
+  if (bits == 1) {
+    for (int i = 0; i < (values_per_thread / 8); i++) {
+      x_thread += 8 * i;
+
+      accum +=
+          (x_thread[0] * (w[i] & 0x01) +
+           x_thread[1] * (w[i] & 0x02) +
+           x_thread[2] * (w[i] & 0x04) +
+           x_thread[3] * (w[i] & 0x08) +
+           x_thread[4] * (w[i] & 0x10) +
+           x_thread[5] * (w[i] & 0x20) +
+           x_thread[6] * (w[i] & 0x40) +
+           x_thread[7] * (w[i] & 0x80));
+    }
+  }
+
+  else if (bits == 2) {
+    for (int i = 0; i < (values_per_thread / 4); i++) {
+      accum +=
+          (x_thread[4 * i] * (w[i] & 0x03) +
+           x_thread[4 * i + 1] * (w[i] & 0x0c) +
+           x_thread[4 * i + 2] * (w[i] & 0x30) +
+           x_thread[4 * i + 3] * (w[i] & 0xc0));
+    }
+  }
+
+  else if (bits == 3) {
+    for (int i = 0; i < (values_per_thread / 8); i++) {
+      x_thread += 8 * i;
+      w += 3 * i;
+
+      accum += (w[0] & 0x07) * x_thread[0];
+      accum += (w[0] & 0x38) * x_thread[1];
+      accum += (w[0] & 0xc0) * x_thread[2];
+      accum += (w[1] & 0x01) * (x_thread[2] * 256.0f);
+
+      accum += (w[1] & 0x0e) * x_thread[3];
+      accum += (w[1] & 0x70) * x_thread[4];
+      accum += (w[1] & 0x80) * x_thread[5];
+      accum += (w[2] & 0x03) * (x_thread[5] * 256.0f);
+
+      accum += (w[2] & 0x1c) * x_thread[6];
+      accum += (w[2] & 0xe0) * x_thread[7];
+    }
+  }
+
+  else if (bits == 4) {
+    constant uint16_t* ws = (constant uint16_t*)w;
+    for (int i = 0; i < (values_per_thread / 4); i++) {
+      accum +=
+          (x_thread[4 * i] * (ws[i] & 0x000f) +
+           x_thread[4 * i + 1] * (ws[i] & 0x00f0) +
+           x_thread[4 * i + 2] * (ws[i] & 0x0f00) +
+           x_thread[4 * i + 3] * (ws[i] & 0xf000));
+    }
+  }
+
+  else if (bits == 5) {
+    for (int i = 0; i < (values_per_thread / 8); i++) {
+      x_thread += 8 * i;
+      w += 5 * i;
+
+      accum += (w[0] & 0x1f) * x_thread[0];
+      accum += (w[0] & 0xe0) * x_thread[1];
+
+      accum += (w[1] & 0x03) * (x_thread[1] * 256.0f);
+      accum += (w[1] & 0x7c) * x_thread[2];
+      accum += (w[1] & 0x80) * x_thread[3];
+
+      accum += (w[2] & 0x0f) * (x_thread[3] * 256.0f);
+      accum += (w[2] & 0xf0) * x_thread[4];
+
+      accum += (w[3] & 0x01) * (x_thread[4] * 256.0f);
+      accum += (w[3] & 0x3e) * x_thread[5];
+      accum += (w[3] & 0xc0) * x_thread[6];
+
+      accum += (w[4] & 0x07) * (x_thread[6] * 256.0f);
+      accum += (w[4] & 0xf8) * x_thread[7];
+    }
+  }
+
+  else if (bits == 6) {
+    for (int i = 0; i < (values_per_thread / 4); i++) {
+      x_thread += 4 * i;
+      w += 3 * i;
+
+      accum += (w[0] & 0x3f) * x_thread[0];
+
+      accum += (w[0] & 0xc0) * x_thread[1];
+      accum += (w[1] & 0x0f) * (x_thread[1] * 256.0f);
+
+      accum += (w[1] & 0xf0) * x_thread[2];
+      accum += (w[2] & 0x03) * (x_thread[2] * 256.0f);
+
+      accum += (w[2] & 0xfc) * x_thread[3];
+    }
+  }
+
+  else if (bits == 7) {
+    for (int i = 0; i < (values_per_thread / 8); i++) {
+      x_thread += 8 * i;
+      w += 7 * i;
+
+      accum += (w[0] & 0x7f) * x_thread[0];
+      accum += (w[0] & 0x80) * x_thread[1];
+
+      accum += (w[1] & 0x3f) * (x_thread[1] * 256.0f);
+      accum += (w[1] & 0xc0) * x_thread[2];
+
+      accum += (w[2] & 0x1f) * (x_thread[2] * 256.0f);
+      accum += (w[2] & 0xe0) * x_thread[3];
+
+      accum += (w[3] & 0x0f) * (x_thread[3] * 256.0f);
+      accum += (w[3] & 0xf0) * x_thread[4];
+
+      accum += (w[4] & 0x07) * (x_thread[4] * 256.0f);
+      accum += (w[4] & 0xf8) * x_thread[5];
+
+      accum += (w[5] & 0x03) * (x_thread[5] * 256.0f);
+      accum += (w[5] & 0xfc) * x_thread[6];
+
+      accum += (w[6] & 0x01) * (x_thread[6] * 256.0f);
+      accum += (w[6] & 0xfe) * x_thread[7];
+    }
+  }
+
+  return scale * accum + sum * bias;
+}
+
+template <typename T, int group_size, int bits>
+[[kernel]] void qmv_fast(
+    constant T* x [[buffer(0)]],
+    constant uchar* w [[buffer(1)]],
+    constant T* scales [[buffer(2)]],
+    constant T* biases [[buffer(3)]],
+    device T* y [[buffer(4)]],
+    constant uint3 &sizes [[buffer(5)]], // M, K, N
+    uint3 tid [[threadgroup_position_in_grid]],
+    uint simd_gid [[simdgroup_index_in_threadgroup]],
+    uint simd_lid [[thread_index_in_simdgroup]]) {
+  const int in_vec_size = static_cast<int>(sizes.y); // K
+  const int out_vec_size = static_cast<int>(sizes.z); // N
+
+  constexpr int power_of_2_bits = (bits & (bits - 1)) == 0;
+  constexpr int packs_per_thread = (bits == 1 || bits == 2) ? 1 : 2;
+  constexpr int num_simdgroups = 2;
+  constexpr int results_per_simdgroup = 4;
+  constexpr int pack_factor = bits == 1 ? 16 : power_of_2_bits ? 32 / bits : bits == 6 ? 4 : 8;
+  constexpr int bytes_per_pack = bits == 1 ? 2 : power_of_2_bits ? 4 : bits == 6 ? 3 : bits;
+  constexpr int values_per_thread = pack_factor * packs_per_thread;
+  constexpr int block_size = values_per_thread * SIMD_SIZE;
+  constexpr int scale_step_per_thread = group_size / values_per_thread;
+
+  constant uint8_t* ws = (constant uint8_t*)w;
+
+  typedef float U;
+
+  thread U x_thread[values_per_thread];
+  thread U result[results_per_simdgroup] = {0};
+
+  // Adjust positions
+  const int in_vec_size_w = in_vec_size * bytes_per_pack / pack_factor;
+  const int in_vec_size_g = in_vec_size / group_size;
+  const int out_row = tid.y * (num_simdgroups * results_per_simdgroup) +
+      simd_gid * results_per_simdgroup;
+
+  ws += out_row * in_vec_size_w + simd_lid * packs_per_thread * bytes_per_pack;
+  scales += out_row * in_vec_size_g + simd_lid / scale_step_per_thread;
+  biases += out_row * in_vec_size_g + simd_lid / scale_step_per_thread;
+  x += tid.x * in_vec_size + simd_lid * values_per_thread;
+  y += tid.x * out_vec_size + out_row;
+
+  for (int k = 0; k < in_vec_size; k += block_size) {
+    U sum = load_vector<T, U, values_per_thread, bits>(x, x_thread);
+
+    for (int row = 0; row < results_per_simdgroup; row++) {
+      auto wl = (constant uint8_t*)(ws + row * in_vec_size_w);
+      constant T* sl = scales + row * in_vec_size_g;
+      constant T* bl = biases + row * in_vec_size_g;
+
+      U s = sl[0];
+      U b = bl[0];
+      result[row] += qdot<U, values_per_thread, bits>(wl, x_thread, s, b, sum);
+    }
+
+    ws += block_size * bytes_per_pack / pack_factor;
+    scales += block_size / group_size;
+    biases += block_size / group_size;
+    x += block_size;
+  }
+
+  for (int row = 0; row < results_per_simdgroup; row++) {
+    result[row] = simd_sum(result[row]);
+    if (simd_lid == 0) {
+      y[row] = static_cast<T>(result[row]);
+    }
+  }
+}
+
+#define INSTANTIATE_QMV_FAST(DTYPE, GSIZE, NBIT)                                 \
+  template [[host_name("qmv_fast_" #NBIT "bit_" #GSIZE "_" #DTYPE)]] kernel void \
+  qmv_fast<DTYPE, GSIZE, NBIT>(                                                  \
+      constant DTYPE * A [[buffer(0)]],                                          \
+      constant uchar * B [[buffer(1)]],                                          \
+      constant DTYPE * scales_ptr [[buffer(2)]],                                 \
+      constant DTYPE * zeros_ptr [[buffer(3)]],                                  \
+      device DTYPE * output_data [[buffer(4)]],                                  \
+      constant uint3 & sizes [[buffer(5)]],                                      \
+      uint3 thread_index [[thread_position_in_grid]],                            \
+      uint simd_gid [[simdgroup_index_in_threadgroup]],                          \
+      uint tid_in_simdgroup [[thread_index_in_simdgroup]])
+
+#define INSTANTIATE_QMV_FAST_DTYPE_GSIZE(DTYPE, GSIZE) \
+  INSTANTIATE_QMV_FAST(DTYPE, GSIZE, 1);               \
+  INSTANTIATE_QMV_FAST(DTYPE, GSIZE, 2);               \
+  INSTANTIATE_QMV_FAST(DTYPE, GSIZE, 3);               \
+  INSTANTIATE_QMV_FAST(DTYPE, GSIZE, 4);               \
+  INSTANTIATE_QMV_FAST(DTYPE, GSIZE, 5);               \
+  INSTANTIATE_QMV_FAST(DTYPE, GSIZE, 6);               \
+  INSTANTIATE_QMV_FAST(DTYPE, GSIZE, 7);
+
+#define INSTANTIATE_QMV_FAST_DTYPE(DTYPE)       \
+  INSTANTIATE_QMV_FAST_DTYPE_GSIZE(DTYPE, 32);  \
+  INSTANTIATE_QMV_FAST_DTYPE_GSIZE(DTYPE, 64);  \
+  INSTANTIATE_QMV_FAST_DTYPE_GSIZE(DTYPE, 128); \
+  INSTANTIATE_QMV_FAST_DTYPE_GSIZE(DTYPE, 256);
+
+INSTANTIATE_QMV_FAST_DTYPE(float);
+INSTANTIATE_QMV_FAST_DTYPE(half);
+#if __METAL_VERSION__ >= 310
+INSTANTIATE_QMV_FAST_DTYPE(bfloat);
+#endif
diff --git a/torchao/experimental/kernels/mps/src/dispatch.h b/torchao/experimental/kernels/mps/src/dispatch.h
index 39acd8d1f0..a04452cece 100644
--- a/torchao/experimental/kernels/mps/src/dispatch.h
+++ b/torchao/experimental/kernels/mps/src/dispatch.h
@@ -34,4 +34,18 @@ inline void dispatch_mm_Mr1xNr4_per_TG(
       threadsPerThreadgroup:MTLSizeMake(32, 1, 1)];
 }
 
+inline void dispatch_qmv_fast(
+    id<MTLComputeCommandEncoder> encoder,
+    int32_t maxThreadsPerGroup,
+    int32_t M,
+    int32_t N,
+    int32_t K) {
+  (void)K;
+  if (maxThreadsPerGroup < 64) {
+    throw std::runtime_error("Can't dispatch!");
+  }
+  [encoder dispatchThreadgroups:MTLSizeMake(M, (N + 7) / 8, 1)
+      threadsPerThreadgroup:MTLSizeMake(32, 2, 1)];
+}
+
 } // namespace torchao::kernels::mps::lowbit::dispatch
diff --git a/torchao/experimental/kernels/mps/src/lowbit.h b/torchao/experimental/kernels/mps/src/lowbit.h
index 9b2d539761..370c6d400c 100644
--- a/torchao/experimental/kernels/mps/src/lowbit.h
+++ b/torchao/experimental/kernels/mps/src/lowbit.h
@@ -111,6 +111,25 @@ inline void linear_lowbit_quant_weights_mps_impl(
   });
 }
 
+template <int nbit>
+std::tuple<const std::string, DispatchFn> get_shader_func_and_dispatch(
+    int64_t qGroupSize,
+    const std::string_view type_str,
+    int32_t M,
+    int32_t N,
+    int32_t K) {
+  if (M == 1 && N % 8 == 0 && K % 512 == 0) {
+    return std::make_tuple(
+        std::string("qmv_fast_") + std::to_string(nbit) + "bit_" +
+            std::to_string(qGroupSize) + "_" + std::string(type_str),
+        dispatch::dispatch_qmv_fast);
+  }
+  return std::make_tuple(
+      std::string(LowBitConfig<nbit>::func_prefix) + std::to_string(qGroupSize) +
+          "_" + std::string(type_str),
+      LowBitConfig<nbit>::dispatch_fn);
+}
+
 // LowBit Quantized Weights Linear on Metal
 template <int nbit>
 void linear_lowbit_quant_weights_mps(
@@ -129,8 +148,11 @@ void linear_lowbit_quant_weights_mps(
   assert(
       qGroupSize == 32 || qGroupSize == 64 || qGroupSize == 128 ||
       qGroupSize == 256);
-  const std::string shader_func = std::string(LowBitConfig<nbit>::func_prefix) +
-      std::to_string(qGroupSize) + "_" + std::string(type_str);
+  std::tuple<const std::string, DispatchFn> shader_func_and_dispatch =
+      get_shader_func_and_dispatch<nbit>(qGroupSize, type_str, M, N, K);
+  const std::string shader_func = std::get<0>(shader_func_and_dispatch);
+  const DispatchFn dispatch_fn = std::get<1>(shader_func_and_dispatch);
+
   return linear_lowbit_quant_weights_mps_impl(
       a_buf,
       b_buf,
@@ -141,7 +163,7 @@ void linear_lowbit_quant_weights_mps(
       K,
       N,
       shader_func,
-      LowBitConfig<nbit>::dispatch_fn);
+      dispatch_fn);
 }
 
 } // namespace
diff --git a/torchao/experimental/kernels/mps/src/packing.h b/torchao/experimental/kernels/mps/src/packing.h
index 09a248da5e..5412c04a12 100644
--- a/torchao/experimental/kernels/mps/src/packing.h
+++ b/torchao/experimental/kernels/mps/src/packing.h
@@ -70,9 +70,7 @@ pack<2>(const uint8_t* w_ptr, uint8_t* b_ptr, int32_t N, int32_t K) {
 
 /**
  * 3-bit packing. Each weight is 3 bits. We can't pack them into a byte, so we
- * pack 8 weights into 3 bytes. But we can't nicely pack the 8 weights
- * continuously. Instead, we pack the upper bits of all weights into the first
- * byte, then the 2 lower bits of all weights into the other 2 bytes.
+ * pack 8 weights into 3 bytes.
  */
 template <>
 inline void
@@ -80,28 +78,18 @@ pack<3>(const uint8_t* w_ptr, uint8_t* b_ptr, int32_t N, int32_t K) {
   for (int32_t n = 0; n < N; n++) {
     int32_t row_base = (n * (K / 8)) * 3;
     for (int32_t k8 = 0; k8 < K / 8; k8++) {
-      uint8_t src_0ab = w_ptr[n * K + k8 * 8 + 0];
-      uint8_t src_1cd = w_ptr[n * K + k8 * 8 + 1];
-      uint8_t src_2ef = w_ptr[n * K + k8 * 8 + 2];
-      uint8_t src_3gh = w_ptr[n * K + k8 * 8 + 3];
-      uint8_t src_4ij = w_ptr[n * K + k8 * 8 + 4];
-      uint8_t src_5kl = w_ptr[n * K + k8 * 8 + 5];
-      uint8_t src_6mn = w_ptr[n * K + k8 * 8 + 6];
-      uint8_t src_7op = w_ptr[n * K + k8 * 8 + 7];
-
-      // b0: 7|6|5|4|3|2|1|0 (upper bits for all values)
-      b_ptr[row_base + 3 * k8 + 0] = ((src_0ab & 4) >> 2) |
-          ((src_1cd & 4) >> 1) | ((src_2ef & 4)) | ((src_3gh & 4) << 1) |
-          ((src_4ij & 4) << 2) | ((src_5kl & 4) << 3) | ((src_6mn & 4) << 4) |
-          ((src_7op & 4) << 5);
-
-      // b1: gh|ef|cd|ab (lower 2 bits for first 4 values)
-      b_ptr[row_base + 3 * k8 + 1] = (src_0ab & 3) | ((src_1cd & 3) << 2) |
-          ((src_2ef & 3) << 4) | ((src_3gh & 3) << 6);
+      uint8_t src_val0 = w_ptr[n * K + k8 * 8];
+      uint8_t src_val1 = w_ptr[n * K + k8 * 8 + 1];
+      uint8_t src_val2 = w_ptr[n * K + k8 * 8 + 2];
+      uint8_t src_val3 = w_ptr[n * K + k8 * 8 + 3];
+      uint8_t src_val4 = w_ptr[n * K + k8 * 8 + 4];
+      uint8_t src_val5 = w_ptr[n * K + k8 * 8 + 5];
+      uint8_t src_val6 = w_ptr[n * K + k8 * 8 + 6];
+      uint8_t src_val7 = w_ptr[n * K + k8 * 8 + 7];
 
-      // b2: op|mn|kl|ij (lower 2 bits for last 4 values)
-      b_ptr[row_base + 3 * k8 + 2] = (src_4ij & 3) | ((src_5kl & 3) << 2) |
-          ((src_6mn & 3) << 4) | ((src_7op & 3) << 6);
+      b_ptr[row_base + 3 * k8 + 0] = src_val0 | (src_val1 << 3) | (src_val2 << 6);
+      b_ptr[row_base + 3 * k8 + 1] = (src_val2 >> 2) | (src_val3 << 1) | (src_val4 << 4) | (src_val5 << 7);
+      b_ptr[row_base + 3 * k8 + 2] = (src_val5 >> 1) | (src_val6 << 2) | (src_val7 << 5);
     }
   }
 }
@@ -123,9 +111,7 @@ pack<4>(const uint8_t* w_ptr, uint8_t* b_ptr, int32_t N, int32_t K) {
 }
 
 /**
- * 5-bit packing. Each weight is 5 bits. So we pack 8 weights into 5 bytes. We
- * pack the upper bits of all weights into the first byte, then the 4 lower
- * bits of all weights into the other 4 bytes.
+ * 5-bit packing. Each weight is 5 bits. We pack 8 weights into 5 bytes.
  */
 template <>
 inline void
@@ -133,41 +119,26 @@ pack<5>(const uint8_t* w_ptr, uint8_t* b_ptr, int32_t N, int32_t K) {
   for (int32_t n = 0; n < N; n++) {
     int32_t row_base = (n * (K / 8)) * 5;
     for (int32_t k8 = 0; k8 < K / 8; k8++) {
-      uint8_t src_0abAB = w_ptr[n * K + k8 * 8 + 0];
-      uint8_t src_1cdCD = w_ptr[n * K + k8 * 8 + 1];
-      uint8_t src_2efEF = w_ptr[n * K + k8 * 8 + 2];
-      uint8_t src_3ghGH = w_ptr[n * K + k8 * 8 + 3];
-      uint8_t src_4ijIJ = w_ptr[n * K + k8 * 8 + 4];
-      uint8_t src_5klKL = w_ptr[n * K + k8 * 8 + 5];
-      uint8_t src_6mnMN = w_ptr[n * K + k8 * 8 + 6];
-      uint8_t src_7opOP = w_ptr[n * K + k8 * 8 + 7];
-
-      // b0: 7|6|5|4|3|2|1|0 (upper bits for all values)
-      b_ptr[row_base + 5 * k8 + 0] = ((src_0abAB & 16) >> 4) |
-          ((src_1cdCD & 16) >> 3) | ((src_2efEF & 16) >> 2) |
-          ((src_3ghGH & 16) >> 1) | ((src_4ijIJ & 16)) |
-          ((src_5klKL & 16) << 1) | ((src_6mnMN & 16) << 2) |
-          ((src_7opOP & 16) << 3);
-
-      // b1: cdCD|abAB (lower 4 bits for first 2 values)
-      b_ptr[row_base + 5 * k8 + 1] = (src_0abAB & 15) | ((src_1cdCD & 15) << 4);
-
-      // b2: ghGH|efEF (lower 4 bits for second 2 values)
-      b_ptr[row_base + 5 * k8 + 2] = (src_2efEF & 15) | ((src_3ghGH & 15) << 4);
-
-      // b3: klKL|ijIJ (lower 4 bits for third 2 values)
-      b_ptr[row_base + 5 * k8 + 3] = (src_4ijIJ & 15) | ((src_5klKL & 15) << 4);
+      uint8_t src_val0 = w_ptr[n * K + k8 * 8];
+      uint8_t src_val1 = w_ptr[n * K + k8 * 8 + 1];
+      uint8_t src_val2 = w_ptr[n * K + k8 * 8 + 2];
+      uint8_t src_val3 = w_ptr[n * K + k8 * 8 + 3];
+      uint8_t src_val4 = w_ptr[n * K + k8 * 8 + 4];
+      uint8_t src_val5 = w_ptr[n * K + k8 * 8 + 5];
+      uint8_t src_val6 = w_ptr[n * K + k8 * 8 + 6];
+      uint8_t src_val7 = w_ptr[n * K + k8 * 8 + 7];
 
-      // b4: opOP|mnMN (lower 4 bits for last 2 values)
-      b_ptr[row_base + 5 * k8 + 4] = (src_6mnMN & 15) | ((src_7opOP & 15) << 4);
+      b_ptr[row_base + 5 * k8 + 0] = src_val0 | (src_val1 << 5);
+      b_ptr[row_base + 5 * k8 + 1] = (src_val1 >> 3) | (src_val2 << 2) | (src_val3 << 7);
+      b_ptr[row_base + 5 * k8 + 2] = (src_val3 >> 1) | (src_val4 << 4);
+      b_ptr[row_base + 5 * k8 + 3] = (src_val4 >> 4) | (src_val5 << 1) | (src_val6 << 6);
+      b_ptr[row_base + 5 * k8 + 4] = (src_val6 >> 2) | (src_val7 << 3);
     }
   }
 }
 
 /**
- * 6-bit packing. Each weight is 6 bits. So we pack 4 weights into 3 bytes. We
- * pack the upper 2 bits of all 4 weights into the first 2 bytes, then the 4
- * lower bits of all weights into the other 4 bytes.
+ * 6-bit packing. Each weight is 6 bits. We pack 4 weights into 3 bytes.
  */
 template <>
 inline void
@@ -175,32 +146,20 @@ pack<6>(const uint8_t* w_ptr, uint8_t* b_ptr, int32_t N, int32_t K) {
   for (int32_t n = 0; n < N; n++) {
     int32_t row_base = (n * (K / 4)) * 3;
     for (int32_t k4 = 0; k4 < K / 4; k4++) {
-      uint8_t src_10abcd = w_ptr[n * K + k4 * 4 + 0];
-      uint8_t src_32efgh = w_ptr[n * K + k4 * 4 + 1];
-      uint8_t src_54ijkl = w_ptr[n * K + k4 * 4 + 2];
-      uint8_t src_76mnop = w_ptr[n * K + k4 * 4 + 3];
-
-      // b0: 76|54|32|10 (upper 2 bits for all values)
-      b_ptr[row_base + 3 * k4 + 0] = ((src_10abcd & 48) >> 4) |
-          ((src_32efgh & 48) >> 2) | ((src_54ijkl & 48)) |
-          ((src_76mnop & 48) << 2);
-
-      // b1: efgh|abcd (lower 4 bits for first 2 values)
-      b_ptr[row_base + 3 * k4 + 1] =
-          (src_10abcd & 15) | ((src_32efgh & 15) << 4);
+      uint8_t src_val0 = w_ptr[n * K + k4 * 4];
+      uint8_t src_val1 = w_ptr[n * K + k4 * 4 + 1];
+      uint8_t src_val2 = w_ptr[n * K + k4 * 4 + 2];
+      uint8_t src_val3 = w_ptr[n * K + k4 * 4 + 3];
 
-      // b2: mnop|ijkl (lower 4 bits for last 2 values)
-      b_ptr[row_base + 3 * k4 + 2] =
-          (src_54ijkl & 15) | ((src_76mnop & 15) << 4);
+      b_ptr[row_base + 3 * k4 + 0] = src_val0 | (src_val1 << 6);
+      b_ptr[row_base + 3 * k4 + 1] = (src_val1 >> 2) | (src_val2 << 4);
+      b_ptr[row_base + 3 * k4 + 2] = (src_val2 >> 4) | (src_val3 << 2);
     }
   }
 }
 
 /**
- * 7-bit packing. Each weight is 7 bits. So we pack 8 weights into 7 bytes.
- * Each of the 7 bytes contains 1 weight, plus 1 bit from the 8th weight. So,
- * this packing spreads the 8th weight across all 7 bytes. The upper bit of
- * each byte is the bit from the 8th weight.
+ * 7-bit packing. Each weight is 7 bits. We pack 8 weights into 7 bytes.
  */
 template <>
 inline void
@@ -208,22 +167,22 @@ pack<7>(const uint8_t* w_ptr, uint8_t* b_ptr, int32_t N, int32_t K) {
   for (int32_t n = 0; n < N; n++) {
     int32_t row_base = (n * (K / 8)) * 7;
     for (int32_t k8 = 0; k8 < K / 8; k8++) {
-      uint8_t src_0 = w_ptr[n * K + k8 * 8 + 0];
-      uint8_t src_1 = w_ptr[n * K + k8 * 8 + 1];
-      uint8_t src_2 = w_ptr[n * K + k8 * 8 + 2];
-      uint8_t src_3 = w_ptr[n * K + k8 * 8 + 3];
-      uint8_t src_4 = w_ptr[n * K + k8 * 8 + 4];
-      uint8_t src_5 = w_ptr[n * K + k8 * 8 + 5];
-      uint8_t src_6 = w_ptr[n * K + k8 * 8 + 6];
-      uint8_t src_7 = w_ptr[n * K + k8 * 8 + 7];
+      uint8_t src_val0 = w_ptr[n * K + k8 * 8 + 0];
+      uint8_t src_val1 = w_ptr[n * K + k8 * 8 + 1];
+      uint8_t src_val2 = w_ptr[n * K + k8 * 8 + 2];
+      uint8_t src_val3 = w_ptr[n * K + k8 * 8 + 3];
+      uint8_t src_val4 = w_ptr[n * K + k8 * 8 + 4];
+      uint8_t src_val5 = w_ptr[n * K + k8 * 8 + 5];
+      uint8_t src_val6 = w_ptr[n * K + k8 * 8 + 6];
+      uint8_t src_val7 = w_ptr[n * K + k8 * 8 + 7];
 
-      b_ptr[row_base + 7 * k8 + 0] = src_0 | ((src_7 & 1) << 7);
-      b_ptr[row_base + 7 * k8 + 1] = src_1 | ((src_7 & 2) << 6);
-      b_ptr[row_base + 7 * k8 + 2] = src_2 | ((src_7 & 4) << 5);
-      b_ptr[row_base + 7 * k8 + 3] = src_3 | ((src_7 & 8) << 4);
-      b_ptr[row_base + 7 * k8 + 4] = src_4 | ((src_7 & 16) << 3);
-      b_ptr[row_base + 7 * k8 + 5] = src_5 | ((src_7 & 32) << 2);
-      b_ptr[row_base + 7 * k8 + 6] = src_6 | ((src_7 & 64) << 1);
+      b_ptr[row_base + 7 * k8 + 0] = src_val0 | (src_val1 << 7);
+      b_ptr[row_base + 7 * k8 + 1] = (src_val1 >> 1) | (src_val2 << 6);
+      b_ptr[row_base + 7 * k8 + 2] = (src_val2 >> 2) | (src_val3 << 5);
+      b_ptr[row_base + 7 * k8 + 3] = (src_val3 >> 3) | (src_val4 << 4);
+      b_ptr[row_base + 7 * k8 + 4] = (src_val4 >> 4) | (src_val5 << 3);
+      b_ptr[row_base + 7 * k8 + 5] = (src_val5 >> 5) | (src_val6 << 2);
+      b_ptr[row_base + 7 * k8 + 6] = (src_val6 >> 6) | (src_val7 << 1);
     }
   }
 }
diff --git a/torchao/experimental/kernels/mps/test/test_lowbit.mm b/torchao/experimental/kernels/mps/test/test_lowbit.mm
index 8a1e0fdb9e..524aee738d 100644
--- a/torchao/experimental/kernels/mps/test/test_lowbit.mm
+++ b/torchao/experimental/kernels/mps/test/test_lowbit.mm
@@ -51,6 +51,7 @@ void reference_linear_lowbit_quant_weights_cpu(
     int32_t M,
     int32_t K,
     int32_t N) {
+  int32_t ceil_K_group_size = (K + group_size - 1) / group_size;
   for (int32_t m = 0; m < M; m++) {
     for (int32_t n = 0; n < N; n++) {
       const int32_t k_block = (K + group_size - 1) / group_size;
@@ -59,8 +60,8 @@ void reference_linear_lowbit_quant_weights_cpu(
       float rc = 0.0;
       int32_t k = 0;
       for (int32_t kb = 0; kb < k_block; kb++) {
-        const float scale = float(s_ptr[kb * N + n]);
-        const float zero = float(z_ptr[kb * N + n]);
+        const float scale = float(s_ptr[n * ceil_K_group_size + kb]);
+        const float zero = float(z_ptr[n * ceil_K_group_size + kb]);
         for (int32_t idx = 0; idx < group_size && k < K; idx++, k++) {
           const auto a_val = float(A_ptr[k]);
           uint8_t w_val = w_ptr[n * K + k];
@@ -217,6 +218,7 @@ void run_test_battery() {
   run_test<T, nbit>(19, 256, 28, 256);
   run_test<T, nbit>(1, 1000, 28, 256);
   run_test<T, nbit>(19, 8, 36, 256);
+  run_test<T, nbit>(1, 1024, 1024, 64);
 }
 
 int main() {
diff --git a/torchao/experimental/ops/mps/linear_fp_act_xbit_weight_aten.mm b/torchao/experimental/ops/mps/linear_fp_act_xbit_weight_aten.mm
index 2aeb7f4460..972caa039a 100644
--- a/torchao/experimental/ops/mps/linear_fp_act_xbit_weight_aten.mm
+++ b/torchao/experimental/ops/mps/linear_fp_act_xbit_weight_aten.mm
@@ -55,19 +55,19 @@ void check_linear_mps_args(
       group_size);
 
   TORCH_CHECK(
-      S.dim() == 2 && S.size(1) == N,
+      S.dim() == 2 && S.size(0) == N,
       __func__,
-      ": expect S to be 2d tensor with shape [:, ",
+      ": expect S to be 2d tensor with shape [",
       N,
-      "]");
+      ",:]");
   TORCH_CHECK(S.is_contiguous(), __func__, " : expect S to be contiguous.");
 
   TORCH_CHECK(
-      Z.dim() == 2 && Z.size(1) == N,
+      Z.dim() == 2 && Z.size(0) == N,
       __func__,
-      ": expect Z to be 2d tensor with shape [:, ",
+      ": expect Z to be 2d tensor with shape [",
       N,
-      "]");
+      ",:]");
   TORCH_CHECK(Z.is_contiguous(), __func__, " : expect Z to be contiguous.");
 }
 
diff --git a/torchao/experimental/ops/mps/linear_fp_act_xbit_weight_executorch.mm b/torchao/experimental/ops/mps/linear_fp_act_xbit_weight_executorch.mm
index a6f417b17d..f8a8ffdae9 100644
--- a/torchao/experimental/ops/mps/linear_fp_act_xbit_weight_executorch.mm
+++ b/torchao/experimental/ops/mps/linear_fp_act_xbit_weight_executorch.mm
@@ -65,12 +65,12 @@ bool check_linear_mps_args(
       "Expect group_size to be 32, 64, 128 or 256");
 
   ET_LOG_MSG_AND_RETURN_IF_FALSE(
-      S.dim() == 2 && S.size(1) == N,
-      "Expect S to be 2d tensor with shape [:, N]");
+      S.dim() == 2 && S.size(0) == N,
+      "Expect S to be 2d tensor with shape [N, :]");
 
   ET_LOG_MSG_AND_RETURN_IF_FALSE(
-      Z.dim() == 2 && Z.size(1) == N,
-      "Expect Z to be 2d tensor with shape [:, N]");
+      Z.dim() == 2 && Z.size(0) == N,
+      "Expect Z to be 2d tensor with shape [N, :]");
 
   return true;
 }
diff --git a/torchao/experimental/ops/mps/mps_op_lib.py b/torchao/experimental/ops/mps/mps_op_lib.py
index 145c77c3de..bee038ce19 100644
--- a/torchao/experimental/ops/mps/mps_op_lib.py
+++ b/torchao/experimental/ops/mps/mps_op_lib.py
@@ -37,10 +37,10 @@ def _(
 
         assert scales.is_contiguous()
         assert scales.dim() == 2
-        assert scales.size(1) == n
+        assert scales.size(0) == n
 
         assert zeros.is_contiguous()
         assert zeros.dim() == 2
-        assert zeros.size(1) == n
+        assert zeros.size(0) == n
 
         return torch.empty(m, n, dtype=activations.dtype, device="meta")
diff --git a/torchao/experimental/ops/mps/test/test_lowbit.py b/torchao/experimental/ops/mps/test/test_lowbit.py
index a3ac7a6431..dc2460110e 100644
--- a/torchao/experimental/ops/mps/test/test_lowbit.py
+++ b/torchao/experimental/ops/mps/test/test_lowbit.py
@@ -64,11 +64,11 @@ def _init_tensors(self, group_size, M, K, N, nbit, device="mps"):
         ceil_K_group_size = (K + group_size - 1) // group_size
         A = torch.rand(M, K, dtype=torch.float32, device=device)
         W = torch.randint(0, 1 << nbit, (N, K), dtype=torch.uint8, device=device)
-        S = torch.rand(ceil_K_group_size, N, dtype=torch.float32, device=device) + 0.01
+        S = torch.rand(N, ceil_K_group_size, dtype=torch.float32, device=device) + 0.01
         Z = torch.randint(
             0,
             1 << nbit,
-            (ceil_K_group_size, N),
+            (N, ceil_K_group_size),
             dtype=torch.float32,
             device=device,
         )
@@ -83,8 +83,8 @@ def _reference_linear_lowbit_quant_weights(self, A, W, group_size, S, Z, nbit):
         N = W.shape[0]
         K = W.shape[1]
         W = W.to(torch.float32)
-        scales = S.t().unsqueeze(2).repeat(1, 1, group_size).view(N, -1)[:, :K]
-        zeros = Z.t().unsqueeze(2).repeat(1, 1, group_size).view(N, -1)[:, :K]
+        scales = S.unsqueeze(2).repeat(1, 1, group_size).view(N, -1)[:, :K]
+        zeros = Z.unsqueeze(2).repeat(1, 1, group_size).view(N, -1)[:, :K]
         W = scales * W + zeros
         return torch.mm(A, W.t())
 
diff --git a/torchao/experimental/ops/mps/test/test_quantizer.py b/torchao/experimental/ops/mps/test/test_quantizer.py
index 7afa91183e..04273fb1af 100644
--- a/torchao/experimental/ops/mps/test/test_quantizer.py
+++ b/torchao/experimental/ops/mps/test/test_quantizer.py
@@ -146,13 +146,14 @@ def _reference_linear_lowbit_quant_weights(self, A, W, group_size, S, Z):
         N = W.shape[0]
         K = W.shape[1]
         W = W.to(torch.float32)
-        scales = S.t().unsqueeze(2).repeat(1, 1, group_size).view(N, -1)[:, :K]
-        zeros = Z.t().unsqueeze(2).repeat(1, 1, group_size).view(N, -1)[:, :K]
+        scales = S.unsqueeze(2).repeat(1, 1, group_size).view(N, -1)[:, :K]
+        zeros = Z.unsqueeze(2).repeat(1, 1, group_size).view(N, -1)[:, :K]
         W = scales * W + zeros
         return torch.mm(A, W.t())
 
     @parameterized.expand(BITWIDTHS)
     def test_accuracy(self, nbit):
+        print(f"nbit: {nbit}")
         group_size = 32
         m = 3
         n = 12
@@ -170,8 +171,7 @@ def test_accuracy(self, nbit):
             weight_qvals_cpu, weight_scales_cpu, weight_zeros_cpu = _quantize(
                 weight_cpu, group_size, nbit, True, torch.uint8
             )
-            weight_scales_cpu = weight_scales_cpu.t()
-            weight_zeros_cpu = -weight_zeros_cpu.t() * weight_scales_cpu
+            weight_zeros_cpu = -weight_zeros_cpu * weight_scales_cpu
             expected = self._reference_linear_lowbit_quant_weights(
                 activations.cpu(),
                 weight_qvals_cpu,
diff --git a/torchao/experimental/quant_api.py b/torchao/experimental/quant_api.py
index b7630cada3..2e50587c2a 100644
--- a/torchao/experimental/quant_api.py
+++ b/torchao/experimental/quant_api.py
@@ -529,8 +529,6 @@ def quantize_and_pack_weights(self, weights, nbit, group_size):
         weight_qvals, weight_scales, weight_zeros = _quantize(
             weights, self.group_size, self.nbit, has_weight_zeros=True, signed=False
         )
-        weight_scales = torch.transpose_copy(weight_scales, 1, 0)
-        weight_zeros = torch.transpose_copy(weight_zeros, 1, 0)
         weight_zeros = -weight_zeros * weight_scales
         self.weight_scales = nn.Parameter(weight_scales, requires_grad=False)
         self.weight_zeros = nn.Parameter(weight_zeros, requires_grad=False)
@@ -550,7 +548,7 @@ def forward(self, x):
 
         lead_shape = x.shape[0:-1]
         k = x.shape[-1]
-        n = self.weight_scales.shape[1]
+        n = self.weight_scales.shape[0]
         return self._linear_op(
             x.reshape(-1, k),
             self.packed_weights,

From 45b39b14beff5aa13eda67ba869ba2102ca26e63 Mon Sep 17 00:00:00 2001
From: andrewor14 <andrewor14@gmail.com>
Date: Fri, 9 May 2025 11:20:18 -0400
Subject: [PATCH 011/165] Set eps in end-to-end QAT flow (#2180)

* Set eps in end-to-end QAT flow

**Summary:** This commit does two things:

(1) Allow users to set eps in `FakeQuantizeConfig`
(2) For other parts of the QAT flow, set eps to
    `torch.finfo(torch.float32).eps` for input linear
    activations to match the existing hardcoded input
    activation scale dtype (which is fp32)

The motivation is to enable users who wish to lower their
models to XNNPACK. This would require them to use the following
combination of dtypes during training for end-to-end numerical
match:

- input activations: bf16
- input activation scales: fp32
- input activation eps: `torch.finfo(torch.float32).eps`
- weight: bf16
- weight scales: bf16
- weight eps: `torch.finfo(torch.bfloat16).eps`

However, today there is no way to specify the above in any
of the QAT flows. For the recommended `FakeQuantizeConfig`
flow, we always use `torch.finfo(x.dtype).eps`, where x is
bf16 in this case, and there is no way for users to configure
this. This is resolved by (1).

For the legacy `Int8DynActInt4QATQuantizer` flow, we hardcode
input activation scales to always use fp32 in
https://github.com/pytorch/ao/pull/2085, but did not set the
corresponding eps. Today, this also uses `torch.finfo(x.dtype).eps`
by default, where x is bf16, and so we use the wrong eps value.
This is resolved by (2).

**Test Plan:**
python test/quantization/test_qat.py -k test_fake_quantize_config_eps
python test/quantization/test_qat.py -k test_qat_8da4w_eps

* up

---------

Co-authored-by: Scott Roy <161522778+metascroy@users.noreply.github.com>
---
 test/quantization/test_qat.py                 | 78 +++++++++++++++++++
 torchao/experimental/quant_passes.py          |  2 +-
 ...est_int8_dynamic_activation_intx_weight.py |  2 +-
 torchao/quantization/GPTQ.py                  |  5 +-
 torchao/quantization/qat/api.py               |  3 +
 torchao/quantization/qat/fake_quantizer.py    |  3 +
 torchao/quantization/qat/linear.py            |  8 +-
 torchao/quantization/quant_api.py             |  2 +
 torchao/quantization/utils.py                 | 10 ++-
 9 files changed, 107 insertions(+), 6 deletions(-)

diff --git a/test/quantization/test_qat.py b/test/quantization/test_qat.py
index 075671a043..d655abaf62 100644
--- a/test/quantization/test_qat.py
+++ b/test/quantization/test_qat.py
@@ -1513,6 +1513,84 @@ def test_qat_8da4w_prepare_vs_convert(self, dtype: torch.dtype):
         )
         self.assertEqual(len(non_inf_sqnr), 0, fail_message)
 
+    @unittest.skipIf(
+        not TORCH_VERSION_AT_LEAST_2_4, "skipping when torch version is 2.4 or lower"
+    )
+    def test_fake_quantize_config_eps(self):
+        """
+        Test that users can set arbitrary eps value in `FakeQuantizeConfig`.
+        """
+        eps = 0.00123
+        x = torch.randn(2, 3).to(torch.float32)
+        scale, zp = choose_qparams_affine(
+            x,
+            mapping_type=MappingType.ASYMMETRIC,
+            block_size=(1, 3),
+            target_dtype=torch.int8,
+            quant_min=-128,
+            quant_max=127,
+            eps=eps,
+        )
+        expected_out = _fake_quantize_per_token(x, scale, zp, -128, 127)
+        config = FakeQuantizeConfig(
+            torch.int8,
+            "per_token",
+            is_symmetric=False,
+            eps=eps,
+        )
+        fake_quantizer = FakeQuantizer(config)
+        actual_out = fake_quantizer(x)
+        torch.testing.assert_close(expected_out, actual_out, atol=0, rtol=0)
+
+    @unittest.skipIf(
+        not TORCH_VERSION_AT_LEAST_2_4, "skipping when torch version is 2.4 or lower"
+    )
+    def test_qat_8da4w_eps(self):
+        """
+        Test that the 8da4w QAT flow uses the expected eps.
+        """
+        from torchao.quantization.qat import Int8DynActInt4WeightQATQuantizer
+        from torchao.quantization.utils import per_token_dynamic_quant
+
+        group_size = 16
+        torch.manual_seed(self.SEED)
+        m = M()
+        quantizer = Int8DynActInt4WeightQATQuantizer(groupsize=group_size)
+
+        # prepare
+        prepared_model = quantizer.prepare(m)
+        self.assertEqual(
+            prepared_model.linear1.activation_fake_quantizer.config.eps,
+            torch.finfo(torch.float32).eps,
+        )
+
+        # convert
+        converted_model = quantizer.convert(m)
+        x = m.example_inputs()[0]
+        _input = per_token_dynamic_quant(
+            x,
+            scale_dtype=torch.float32,
+            zero_point_dtype=torch.float32,
+            eps=torch.finfo(torch.float32).eps,
+        )
+        _weight_dq = dequantize_affine(
+            converted_model.linear1.weight,
+            (1, group_size),
+            converted_model.linear1.scales,
+            converted_model.linear1.zeros,
+            torch.int8,
+            quant_min=-8,
+            quant_max=7,
+            output_dtype=torch.float32,
+        )
+        expected_out = torch.nn.functional.linear(
+            _input,
+            _weight_dq,
+            converted_model.linear1.bias,
+        )
+        actual_out = converted_model.linear1(x)
+        torch.testing.assert_close(expected_out, actual_out, atol=0, rtol=0)
+
 
 if __name__ == "__main__":
     unittest.main()
diff --git a/torchao/experimental/quant_passes.py b/torchao/experimental/quant_passes.py
index 13a0a755fb..6c1fad5bbf 100644
--- a/torchao/experimental/quant_passes.py
+++ b/torchao/experimental/quant_passes.py
@@ -87,7 +87,7 @@ def _get_q_dq_linear_patterns_replacements_and_filters(
     glbs["a_quant_max"] = None
     glbs["a_mapping_type"] = "ASYMMETRIC"
     glbs["a_scale_dtype"] = torch.float32
-    glbs["a_eps"] = None
+    glbs["a_eps"] = torch.finfo(torch.float32).eps
 
     lcls = {}
 
diff --git a/torchao/experimental/tests/test_int8_dynamic_activation_intx_weight.py b/torchao/experimental/tests/test_int8_dynamic_activation_intx_weight.py
index d1236e9183..a655ca1b42 100644
--- a/torchao/experimental/tests/test_int8_dynamic_activation_intx_weight.py
+++ b/torchao/experimental/tests/test_int8_dynamic_activation_intx_weight.py
@@ -361,7 +361,7 @@ def test_export_QDQLayout(self):
         self.assertTrue(torch.allclose(eager_results, exported_results))
 
         expected_lines = [
-            "torch.ops.torchao.choose_qparams_affine.default(input_1, 'ASYMMETRIC', [1, 512], torch.int8, None, None, None, torch.float32, torch.int8)",
+            "torch.ops.torchao.choose_qparams_affine.default(input_1, 'ASYMMETRIC', [1, 512], torch.int8, None, None, 1.1920928955078125e-07, torch.float32, torch.int8)",
             "torch.ops.torchao.quantize_affine.default(input_1, [1, 512], getitem, getitem_1, torch.int8)",
             "torch.ops.torchao.dequantize_affine.default(quantize_affine, [1, 512], getitem, getitem_1, torch.int8)",
             "torch.ops.torchao.dequantize_affine.default",
diff --git a/torchao/quantization/GPTQ.py b/torchao/quantization/GPTQ.py
index 94fccc7bf1..a0ec97d63f 100644
--- a/torchao/quantization/GPTQ.py
+++ b/torchao/quantization/GPTQ.py
@@ -938,7 +938,10 @@ def linear_forward_8da4w(
     # TODO: in future add ability to specify activation_scale_dtype to PTQ configs
     # and enable similar change here
     x = per_token_dynamic_quant(
-        x, scale_dtype=torch.float32, zero_point_dtype=torch.float32
+        x,
+        scale_dtype=torch.float32,
+        zero_point_dtype=torch.float32,
+        eps=torch.finfo(torch.float32).eps,
     )
 
     # TODO: verify and remove following reshape code
diff --git a/torchao/quantization/qat/api.py b/torchao/quantization/qat/api.py
index d7e8f204cc..e025a43d94 100644
--- a/torchao/quantization/qat/api.py
+++ b/torchao/quantization/qat/api.py
@@ -85,6 +85,7 @@ class FakeQuantizeConfig:
     zero_point_domain: ZeroPointDomain
     is_dynamic: bool = True
     range_learning: bool = False
+    eps: Optional[float] = None
 
     def __init__(
         self,
@@ -96,6 +97,7 @@ def __init__(
         zero_point_domain: ZeroPointDomain = ZeroPointDomain.INT,
         is_dynamic: bool = True,
         range_learning: bool = False,
+        eps: Optional[float] = None,
         *,
         group_size: Optional[int] = None,
         is_symmetric: Optional[bool] = None,
@@ -110,6 +112,7 @@ def __init__(
         self.zero_point_domain = zero_point_domain
         self.is_dynamic = is_dynamic
         self.range_learning = range_learning
+        self.eps = eps
 
         # Validate dtype
         all_dtypes = [torch.int8, torch.uint8]
diff --git a/torchao/quantization/qat/fake_quantizer.py b/torchao/quantization/qat/fake_quantizer.py
index 1747f8a4a6..0d2521cac0 100644
--- a/torchao/quantization/qat/fake_quantizer.py
+++ b/torchao/quantization/qat/fake_quantizer.py
@@ -81,6 +81,7 @@ def _per_token_forward(self, x: torch.Tensor):
                 target_dtype=self.config.dtype,
                 quant_min=qmin,
                 quant_max=qmax,
+                eps=self.config.eps,
                 scale_dtype=self.config.scale_precision,
                 zero_point_dtype=self.config.zero_point_precision,
             )
@@ -117,6 +118,7 @@ def _per_channel_or_group_forward(self, x: torch.Tensor):
                     bit_width,
                     group_size,
                     scale_precision,
+                    eps=self.config.eps,
                 )
             else:
                 (self.scale, self.zero_point) = get_groupwise_affine_qparams(
@@ -124,6 +126,7 @@ def _per_channel_or_group_forward(self, x: torch.Tensor):
                     bit_width,
                     group_size,
                     scale_precision,
+                    eps=self.config.eps,
                 )
             self.zero_point = self.zero_point.to(zero_point_precision)
 
diff --git a/torchao/quantization/qat/linear.py b/torchao/quantization/qat/linear.py
index 4b0b160c53..a912f04b83 100644
--- a/torchao/quantization/qat/linear.py
+++ b/torchao/quantization/qat/linear.py
@@ -177,6 +177,8 @@ def __init__(
         self.padding_allowed: bool = padding_allowed
         self.precision: torch.dtype = precision
         self.scales_precision: torch.dtype = scales_precision
+        # TODO: generalize this
+        self.activation_scales_precision = torch.float32
 
     def prepare(
         self, model: torch.nn.Module, *args: Any, **kwargs: Any
@@ -247,7 +249,7 @@ def _convert_qat_linear_8da4w(self, module: torch.nn.Module):
                 self._convert_qat_linear_8da4w(child)
 
     def get_activation_fake_quantize_config(self) -> Optional[FakeQuantizeConfig]:
-        return _get_8da4w_activation_config(self.scales_precision)
+        return _get_8da4w_activation_config(self.activation_scales_precision)
 
     def get_weight_fake_quantize_config(self) -> Optional[FakeQuantizeConfig]:
         return _get_8da4w_weight_config(self.groupsize, self.scales_precision)
@@ -280,6 +282,7 @@ def __init__(
     ) -> None:
         # Use torch.float32 to match torchao.quantization.quant_api._int8_asymm_per_token_quant,
         # which is used in PTQ routines
+        # TODO: generalize this
         activation_config = _get_8da4w_activation_config(torch.float32)
         weight_config = _get_8da4w_weight_config(groupsize, scales_precision)
         super().__init__(
@@ -320,6 +323,8 @@ def _get_8da4w_activation_config(qparams_precision: torch.dtype) -> FakeQuantize
     """
     Return the activation `FakeQuantizeConfig` for `Int8DynActInt4WeightQATQuantizer`.
     """
+    # TODO: generalize this
+    assert qparams_precision == torch.float32
     return FakeQuantizeConfig(
         dtype=torch.int8,
         granularity="per_token",
@@ -327,6 +332,7 @@ def _get_8da4w_activation_config(qparams_precision: torch.dtype) -> FakeQuantize
         is_dynamic=True,
         scale_precision=qparams_precision,
         zero_point_precision=qparams_precision,
+        eps=torch.finfo(qparams_precision).eps,
     )
 
 
diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index c20c37a194..982b8cdd5c 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -627,6 +627,7 @@ def _int8_asymm_per_token_quant(x: torch.Tensor) -> torch.Tensor:
     mapping_type = MappingType.ASYMMETRIC
     target_dtype = torch.int8
     scale_dtype = torch.float32
+    eps = torch.finfo(torch.float32).eps
     zero_point_dtype = torch.int8
     if TORCH_VERSION_AT_LEAST_2_6:
         return to_affine_quantized_intx(
@@ -634,6 +635,7 @@ def _int8_asymm_per_token_quant(x: torch.Tensor) -> torch.Tensor:
             mapping_type,
             _get_per_token_block_size(x),
             target_dtype,
+            eps=eps,
             scale_dtype=scale_dtype,
             zero_point_dtype=zero_point_dtype,
         )
diff --git a/torchao/quantization/utils.py b/torchao/quantization/utils.py
index a9cad8060e..22e14378f5 100644
--- a/torchao/quantization/utils.py
+++ b/torchao/quantization/utils.py
@@ -324,6 +324,7 @@ def get_groupwise_affine_qparams(
     dtype=torch.bfloat16,
     zero_point_domain=ZeroPointDomain.FLOAT,
     preserve_zero=False,
+    eps=None,
 ):
     if groupsize > w.shape[-1]:
         groupsize = w.shape[-1]
@@ -337,7 +338,8 @@ def get_groupwise_affine_qparams(
     block_size = (1, groupsize)
     quant_min = 0
     quant_max = 2**n_bit - 1
-    eps = 1e-6
+    if eps is None:
+        eps = 1e-6
     scale_dtype = dtype
     zero_point_dtype = (
         dtype if zero_point_domain != ZeroPointDomain.INT else torch.int32
@@ -530,6 +532,7 @@ def get_group_qparams_symmetric(
     groupsize=128,
     precision=torch.float32,
     mapping_type=MappingType.SYMMETRIC,
+    eps=None,
 ):
     # needed for GPTQ with padding
     if groupsize > w.shape[-1]:
@@ -540,7 +543,8 @@ def get_group_qparams_symmetric(
     assert n_bit <= 8, f"unsupported n_bit: {n_bit}"
 
     block_size = (1, groupsize)
-    eps = torch.finfo(w.dtype).eps
+    if eps is None:
+        eps = torch.finfo(w.dtype).eps
     ranges = {}
     ranges[1] = (-1, 0)
     # generating ranges for bit 2 to 8
@@ -591,6 +595,7 @@ def per_token_dynamic_quant(
     input: torch.Tensor,
     scale_dtype: torch.dtype = torch.float32,
     zero_point_dtype: torch.dtype = torch.float32,
+    eps: Optional[float] = None,
 ) -> torch.Tensor:
     mapping_type = MappingType.ASYMMETRIC
     block_size = _get_per_token_block_size(input)
@@ -608,6 +613,7 @@ def per_token_dynamic_quant(
         quant_max,
         scale_dtype=scale_dtype,
         zero_point_dtype=zero_point_dtype,
+        eps=eps,
     )
     q = quantize_affine(
         input,

From 709e1da30c1347de2c8218195aa2b76b409ac52e Mon Sep 17 00:00:00 2001
From: HDCharles <39544797+HDCharles@users.noreply.github.com>
Date: Fri, 9 May 2025 15:21:02 -0400
Subject: [PATCH 012/165] Move moe quant to better prototype dir (#2192)

* Move moe quant to better prototype dir

Summary:

The old quantization/prototype dir is being deprecated so moving
moe_quant out into the correct one.

Test Plan: see CI

Reviewers:

Subscribers:

Tasks:

Tags:

* actually adding new folder

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* ruff format

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:
---
 test/quantization/test_moe_quant.py                         | 4 ++--
 torchao/_models/mixtral-moe/generate.py                     | 2 +-
 torchao/_models/mixtral-moe/model.py                        | 2 +-
 .../tests/test_int8_dynamic_activation_intx_weight.py       | 4 ++--
 torchao/{quantization => }/prototype/moe_quant/README.md    | 4 ++--
 torchao/{quantization => }/prototype/moe_quant/__init__.py  | 0
 .../{quantization => }/prototype/moe_quant/llama4_quant.py  | 6 +++---
 .../prototype/moe_quant/quantizable_moe_modules.py          | 2 +-
 torchao/{quantization => }/prototype/moe_quant/utils.py     | 0
 9 files changed, 12 insertions(+), 12 deletions(-)
 rename torchao/{quantization => }/prototype/moe_quant/README.md (95%)
 rename torchao/{quantization => }/prototype/moe_quant/__init__.py (100%)
 rename torchao/{quantization => }/prototype/moe_quant/llama4_quant.py (94%)
 rename torchao/{quantization => }/prototype/moe_quant/quantizable_moe_modules.py (98%)
 rename torchao/{quantization => }/prototype/moe_quant/utils.py (100%)

diff --git a/test/quantization/test_moe_quant.py b/test/quantization/test_moe_quant.py
index 842468a769..71aadaf345 100644
--- a/test/quantization/test_moe_quant.py
+++ b/test/quantization/test_moe_quant.py
@@ -6,10 +6,10 @@
 from torchao.dtypes.floatx.float8_layout import Float8AQTTensorImpl
 from torchao.dtypes.uintx.plain_layout import PlainAQTTensorImpl
 from torchao.dtypes.uintx.tensor_core_tiled_layout import TensorCoreTiledAQTTensorImpl
-from torchao.quantization.prototype.moe_quant.quantizable_moe_modules import (
+from torchao.prototype.moe_quant.quantizable_moe_modules import (
     MOEFeedForwardAOQuantizable,
 )
-from torchao.quantization.prototype.moe_quant.utils import (
+from torchao.prototype.moe_quant.utils import (
     FakeExtraDimTensor,
     MoEQuantConfig,
     UseFakeExtraDimTensor,
diff --git a/torchao/_models/mixtral-moe/generate.py b/torchao/_models/mixtral-moe/generate.py
index 0dcd86e74f..11a53043ad 100644
--- a/torchao/_models/mixtral-moe/generate.py
+++ b/torchao/_models/mixtral-moe/generate.py
@@ -236,7 +236,7 @@ def main(
         ]
     )
 
-    from torchao.quantization.prototype.moe_quant.utils import (
+    from torchao.prototype.moe_quant.utils import (
         MoEQuantConfig,
         UseFakeExtraDimTensor,
         cond_ffn_filter,
diff --git a/torchao/_models/mixtral-moe/model.py b/torchao/_models/mixtral-moe/model.py
index 46a4ce79be..685323843d 100644
--- a/torchao/_models/mixtral-moe/model.py
+++ b/torchao/_models/mixtral-moe/model.py
@@ -11,7 +11,7 @@
 from torch import Tensor
 from torch.nn import functional as F
 
-from torchao.quantization.prototype.moe_quant.utils import FakeExtraDimTensor
+from torchao.prototype.moe_quant.utils import FakeExtraDimTensor
 
 
 def find_multiple(n: int, k: int) -> int:
diff --git a/torchao/experimental/tests/test_int8_dynamic_activation_intx_weight.py b/torchao/experimental/tests/test_int8_dynamic_activation_intx_weight.py
index a655ca1b42..08548b9e9e 100644
--- a/torchao/experimental/tests/test_int8_dynamic_activation_intx_weight.py
+++ b/torchao/experimental/tests/test_int8_dynamic_activation_intx_weight.py
@@ -630,10 +630,10 @@ def test_identical_to_Int8DynActInt4WeightQATQuantizer(
         self.assertTrue(sqnr2 == float("inf"))
 
     def test_moe_quant_intx(self):
-        from torchao.quantization.prototype.moe_quant.quantizable_moe_modules import (
+        from torchao.prototype.moe_quant.quantizable_moe_modules import (
             MOEFeedForwardAOQuantizable,
         )
-        from torchao.quantization.prototype.moe_quant.utils import (
+        from torchao.prototype.moe_quant.utils import (
             FakeExtraDimTensor,
             MoEQuantConfig,
             UseFakeExtraDimTensor,
diff --git a/torchao/quantization/prototype/moe_quant/README.md b/torchao/prototype/moe_quant/README.md
similarity index 95%
rename from torchao/quantization/prototype/moe_quant/README.md
rename to torchao/prototype/moe_quant/README.md
index d774fae8fd..734b409f65 100644
--- a/torchao/quantization/prototype/moe_quant/README.md
+++ b/torchao/prototype/moe_quant/README.md
@@ -10,7 +10,7 @@ The API for moe quantization is very similar to linear quantization, given a moe
 
 ```python
 
-from torchao.quantization.prototype.moe_quant.utils import cond_ffn_filter,
+from torchao.prototype.moe_quant.utils import cond_ffn_filter,
 from torchao.quantization.quant_api import quantize_, Int8WeightOnlyConfig
 
 quantize_(model, MoEQuantConfig(Int8WeightOnlyConfig()), filter_fn=cond_ffn_filter)
@@ -27,7 +27,7 @@ To make the above api work, each tensor subclass had to be edited to work as 3D
 
 ```python
 
-from torchao.quantization.prototype.moe_quant.utils import cond_ffn_filter, MoEQuantConfig, UseFakeExtraDimTensor
+from torchao.prototype.moe_quant.utils import cond_ffn_filter, MoEQuantConfig, UseFakeExtraDimTensor
 from torchao.quantization.quant_api import quantize_, Int8DynamicActivationIntxWeightConfig
 
 config = MoEQuantConfig(
diff --git a/torchao/quantization/prototype/moe_quant/__init__.py b/torchao/prototype/moe_quant/__init__.py
similarity index 100%
rename from torchao/quantization/prototype/moe_quant/__init__.py
rename to torchao/prototype/moe_quant/__init__.py
diff --git a/torchao/quantization/prototype/moe_quant/llama4_quant.py b/torchao/prototype/moe_quant/llama4_quant.py
similarity index 94%
rename from torchao/quantization/prototype/moe_quant/llama4_quant.py
rename to torchao/prototype/moe_quant/llama4_quant.py
index 67ad2ab464..36e684d47d 100644
--- a/torchao/quantization/prototype/moe_quant/llama4_quant.py
+++ b/torchao/prototype/moe_quant/llama4_quant.py
@@ -16,7 +16,7 @@
 from transformers import AutoTokenizer, Llama4ForCausalLM
 from transformers.models.llama4.modeling_llama4 import Llama4TextMoe
 
-from torchao.quantization.prototype.moe_quant.quantizable_moe_modules import (
+from torchao.prototype.moe_quant.quantizable_moe_modules import (
     MOEFeedForwardAOQuantizable,
 )
 from torchao.quantization.quant_api import _replace_with_custom_fn_if_matches_filter
@@ -69,11 +69,11 @@ def convert_fn(module):
 
 model = model
 
-from torchao.quantization import Int4WeightOnlyConfig, quantize_
-from torchao.quantization.prototype.moe_quant.utils import (
+from torchao.prototype.moe_quant.utils import (
     MoEQuantConfig,
     cond_ffn_filter,
 )
+from torchao.quantization import Int4WeightOnlyConfig, quantize_
 
 quantize_(model, MoEQuantConfig(Int4WeightOnlyConfig()), cond_ffn_filter, device="cuda")
 
diff --git a/torchao/quantization/prototype/moe_quant/quantizable_moe_modules.py b/torchao/prototype/moe_quant/quantizable_moe_modules.py
similarity index 98%
rename from torchao/quantization/prototype/moe_quant/quantizable_moe_modules.py
rename to torchao/prototype/moe_quant/quantizable_moe_modules.py
index 516341a3a8..d806f50b4f 100644
--- a/torchao/quantization/prototype/moe_quant/quantizable_moe_modules.py
+++ b/torchao/prototype/moe_quant/quantizable_moe_modules.py
@@ -2,7 +2,7 @@
 import torch.nn.functional as F
 from torch import Tensor, nn
 
-from torchao.quantization.prototype.moe_quant.utils import FakeExtraDimTensor
+from torchao.prototype.moe_quant.utils import FakeExtraDimTensor
 
 
 class MOEFeedForwardAOQuantizable(nn.Module):
diff --git a/torchao/quantization/prototype/moe_quant/utils.py b/torchao/prototype/moe_quant/utils.py
similarity index 100%
rename from torchao/quantization/prototype/moe_quant/utils.py
rename to torchao/prototype/moe_quant/utils.py

From 32b7cd1f2dc43d805f8002f6a59dee7a8095ffa6 Mon Sep 17 00:00:00 2001
From: Syed Tousif Ahmed <syeahmed@nvidia.com>
Date: Fri, 9 May 2025 15:51:43 -0400
Subject: [PATCH 013/165] Uses torch.version.cuda to compile CUDA extensions
 (#2193)

* Uses torch.version.cuda to compile CUDA extensions

* lint
---
 setup.py | 6 ++----
 1 file changed, 2 insertions(+), 4 deletions(-)

diff --git a/setup.py b/setup.py
index a269d4410d..3cb08b3a35 100644
--- a/setup.py
+++ b/setup.py
@@ -255,7 +255,7 @@ def get_extensions():
         print(
             "PyTorch GPU support is not available. Skipping compilation of CUDA extensions"
         )
-    if (CUDA_HOME is None and ROCM_HOME is None) and torch.cuda.is_available():
+    if (CUDA_HOME is None and ROCM_HOME is None) and torch.version.cuda:
         print(
             "CUDA toolkit or ROCm is not available. Skipping compilation of CUDA extensions"
         )
@@ -263,9 +263,7 @@ def get_extensions():
             "If you'd like to compile CUDA extensions locally please install the cudatoolkit from https://anaconda.org/nvidia/cuda-toolkit"
         )
 
-    use_cuda = torch.cuda.is_available() and (
-        CUDA_HOME is not None or ROCM_HOME is not None
-    )
+    use_cuda = torch.version.cuda and (CUDA_HOME is not None or ROCM_HOME is not None)
     extension = CUDAExtension if use_cuda else CppExtension
 
     extra_link_args = []

From 8b96bcdc06858cf33574092b4e9a36ea60462096 Mon Sep 17 00:00:00 2001
From: Xia Weiwen <weiwen.xia@intel.com>
Date: Sat, 10 May 2025 19:45:56 +0800
Subject: [PATCH 014/165] [PT2E][X86] Migrate fusion passes in Inductor to
 torchao (#2140)

* [PT2E][X86] Migrate fusion passes in Inductor to torchao

* Fix conflict after merging main

* Fix CI

* Fix format issues

* Fix format issue

* Fix versioning issue in UT

* Fix format issue

* Fix CI

* Fix CI

* Fix CI

* Move registration of Inductor fusion passes to x86_inductor_quantizer.py

* Fix CI
---
 .../pt2e/test_x86inductor_fusion.py           | 2603 +++++++++++++++
 .../pt2e/inductor_passes/__init__.py          |    0
 .../quantization/pt2e/inductor_passes/x86.py  | 2852 +++++++++++++++++
 torchao/quantization/pt2e/lowering.py         |    2 +-
 .../pt2e/quantizer/x86_inductor_quantizer.py  |   14 +
 5 files changed, 5470 insertions(+), 1 deletion(-)
 create mode 100644 test/quantization/pt2e/test_x86inductor_fusion.py
 create mode 100644 torchao/quantization/pt2e/inductor_passes/__init__.py
 create mode 100644 torchao/quantization/pt2e/inductor_passes/x86.py

diff --git a/test/quantization/pt2e/test_x86inductor_fusion.py b/test/quantization/pt2e/test_x86inductor_fusion.py
new file mode 100644
index 0000000000..78204fb756
--- /dev/null
+++ b/test/quantization/pt2e/test_x86inductor_fusion.py
@@ -0,0 +1,2603 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+# Owner(s): ["oncall: quantization"]
+import contextlib
+import copy
+import itertools
+import unittest
+
+import torch
+from torch._dynamo import config as dynamo_config
+from torch._dynamo.utils import counters
+from torch._inductor import config
+from torch._inductor.test_case import TestCase, run_tests
+from torch._inductor.utils import run_and_get_code
+from torch.export import export_for_training
+from torch.testing._internal.common_quantization import (
+    skipIfNoDynamoSupport,
+    skipIfNoONEDNN,
+    skipIfNoONEDNNBF16,
+)
+from torch.testing._internal.common_utils import (
+    IS_FBCODE,
+    IS_LINUX,
+    IS_X86,
+    instantiate_parametrized_tests,
+    parametrize,
+    skipIfRocm,
+)
+from torch.testing._internal.inductor_utils import (
+    HAS_CPU,
+    _check_has_dynamic_shape,
+)
+
+import torchao
+import torchao.quantization.pt2e.quantizer.x86_inductor_quantizer as xiq
+from torchao.quantization.pt2e.quantize_pt2e import (
+    convert_pt2e,
+    prepare_pt2e,
+    prepare_qat_pt2e,
+)
+from torchao.quantization.pt2e.quantizer.x86_inductor_quantizer import (
+    X86InductorQuantizer,
+)
+from torchao.utils import (
+    TORCH_VERSION_AT_LEAST_2_6,
+    TORCH_VERSION_AT_LEAST_2_8,
+)
+
+if TORCH_VERSION_AT_LEAST_2_6:
+    from torch.testing._internal.common_utils import TEST_ACL
+else:
+    TEST_ACL = False
+
+# The dict value is match_nodes(computation_op+unary_op)
+unary_list = {
+    torch.nn.ReLU(): 2,
+    torch.nn.Sigmoid(): 2,
+    torch.nn.Tanh(): 2,
+    torch.nn.Hardswish(): 6,
+    torch.nn.LeakyReLU(0.1, inplace=False): 4,
+    # Use floats for min/max, otherwise they can get converted to symints
+    torch.nn.Hardtanh(min_val=-0.5, max_val=4.0, inplace=False): 3,
+    torch.nn.Hardtanh(min_val=-0.5, max_val=float("inf"), inplace=False): 3,
+    torch.nn.GELU(approximate="none"): 6,
+    torch.nn.GELU(approximate="tanh"): 10,
+    torch.nn.ReLU6(): 3,
+    torch.nn.SiLU(): 3,
+    torch.nn.Hardsigmoid(): 5,
+}
+
+non_decomposed_unary_list = [
+    torch.nn.ReLU,
+    torch.nn.Sigmoid,
+    torch.nn.Tanh,
+]
+
+# The dict value is (match_count, match_nodes, inplace)
+binary_list = {
+    lambda x, y: torch.add(x, y): (1, 2, False),  # call_function
+    lambda x, y: torch.add(y, x): (1, 2, False),  # call_function
+    lambda x, y: x.add(y): (1, 2, False),  # call_method
+    lambda x, y: x.add_(y): (1, 2, True),  # call_method
+    lambda x, y: torch.sub(x, y): (1, 2, False),  # call_function
+    lambda x, y: x.sub(y): (1, 2, False),  # call_method
+    lambda x, y: x.sub_(y): (1, 2, True),  # call_method
+}
+
+quantization_add_fn_list = [
+    lambda x, y: torch.add(x, y),
+    lambda x, y: x.add(y),
+]
+
+quantization_inplace_add_fn_list = [
+    lambda x, y: x.add_(y),
+]
+
+
+def get_default_quantizer(is_qat, is_dynamic):
+    quantizer = X86InductorQuantizer()
+    quantizer.set_global(
+        xiq.get_default_x86_inductor_quantization_config(
+            is_qat=is_qat, is_dynamic=is_dynamic
+        )
+    )
+    return quantizer
+
+
+def _generate_qdq_quantized_model(
+    mod, inputs, is_qat=False, is_dynamic=False, quantizer=None
+):
+    maybe_no_grad = contextlib.nullcontext() if is_qat else torch.no_grad()
+    with maybe_no_grad:
+        export_model = export_for_training(mod, inputs, strict=True).module()
+        quantizer = (
+            quantizer if quantizer else get_default_quantizer(is_qat, is_dynamic)
+        )
+        prepare_model = (
+            prepare_qat_pt2e(export_model, quantizer)
+            if is_qat
+            else prepare_pt2e(export_model, quantizer)
+        )
+        prepare_model(*inputs)
+        torchao.quantization.pt2e.move_exported_model_to_eval(prepare_model)
+        convert_model = convert_pt2e(prepare_model)
+        return convert_model
+
+
+def cal_conv_generated_kernel_number(mod, input, dtype, dim=4, device="cpu"):
+    # this function is to decide how many kernels are generated
+    # while testing conv2d/3d/deconv2d
+    # the assumption is:
+    #   (1) There will be a to_dtype kernel for input for lp
+    #   (2) inductor always use channel_last format, there will
+    #       be a to_channel_last format for input
+    #   (3) to_dtype and to_channel_last for input can be fused
+    #   (4) inductor always get channel last format from mkldnn_conv_pointwise(binary),
+    #       and force the output to have same stride with eager.
+    #       So there will be a to_contiguous for output if eager output is contiguouse
+    mod = copy.deepcopy(mod)
+    mod = mod.to(device=device)
+    input = input.clone()
+    input = input.to(device)
+
+    if dtype == torch.float32:
+        maybe_autocast = contextlib.nullcontext()
+    else:
+        maybe_autocast = torch.amp.autocast(device_type=device, dtype=dtype)
+    with torch.no_grad(), maybe_autocast:
+        output = mod(input)
+    input_kernel, output_kernel = 0, 0
+    if (
+        input.is_contiguous(memory_format=torch.contiguous_format)
+        or dtype != torch.float32
+        or (TEST_ACL and dim == 4)
+    ):
+        input_kernel = 1
+    if output.is_contiguous(memory_format=torch.contiguous_format) or (
+        TEST_ACL and dtype == torch.bfloat16
+    ):
+        output_kernel = 1
+    return input_kernel + output_kernel
+
+
+@config.patch({"freezing": True})
+class TestPatternMatcherBase(TestCase):
+    def _check_unary_is_decomposed(self, unary_fn):
+        return not any(
+            isinstance(unary_fn, fn)
+            for fn in [torch.nn.ReLU, torch.nn.Sigmoid, torch.nn.Tanh]
+        )
+
+    def _clone_inputs(self, inputs):
+        def clone(x):
+            if not isinstance(x, torch.Tensor):
+                return x
+            return x.clone()
+
+        return tuple(clone(x) for x in inputs)
+
+    def _test_common(
+        self,
+        mod,
+        inputs,
+        matcher_check_fn,
+        atol=1e-5,
+        rtol=1.3e-6,
+        check_autocast=torch.float32,
+        check_quantization=False,
+        is_qat=False,
+        dtype=None,
+        is_dynamic=False,
+        quantizer=None,
+        compile_options={},  # noqa: B006
+    ):
+        if not hasattr(self, "device"):
+            has_xpu = any(
+                isinstance(input, torch.Tensor) and input.device.type == "xpu"
+                for input in inputs
+            )
+            device = "xpu" if has_xpu else "cpu"
+        else:
+            device = self.device
+
+        mod = mod.to(device=device)
+        counters.clear()
+        torch._dynamo.reset()
+        if check_autocast == torch.bfloat16 and (
+            torch.ops.mkldnn._is_mkldnn_bf16_supported() or device == "xpu"
+        ):
+            maybe_autocast = torch.amp.autocast(
+                device_type=device, dtype=torch.bfloat16
+            )
+            atol, rtol = 1e-2, 1e-2
+        elif check_autocast == torch.float16 and (
+            torch.ops.mkldnn._is_mkldnn_fp16_supported() or device == "xpu"
+        ):
+            maybe_autocast = torch.amp.autocast(device_type=device, dtype=torch.float16)
+            atol, rtol = 1e-2, 1e-2
+        else:
+            assert check_autocast == torch.float32
+            maybe_autocast = contextlib.nullcontext()
+        if check_quantization:
+            convert_model = _generate_qdq_quantized_model(
+                mod, inputs, is_qat, is_dynamic, quantizer
+            )
+            with torch.no_grad(), maybe_autocast:
+                _ = torch.compile(convert_model)(*inputs)
+                matcher_check_fn()
+        else:
+            with torch.no_grad(), maybe_autocast:
+                clone_inputs = self._clone_inputs(inputs)
+                expected = mod(*inputs)
+                actual = torch.compile(mod, **compile_options)(*clone_inputs)
+                torch.testing.assert_close(actual, expected, atol=atol, rtol=rtol)
+                matcher_check_fn()
+
+    def _test_code_common(
+        self,
+        mod,
+        inputs,
+        include_ops,
+        exclude_ops,
+        atol=1e-5,
+        rtol=1.3e-6,
+        check_quantization=False,
+        check_dynamic=None,
+        num_include_ops=None,
+        quantizer=None,
+    ):
+        with torch.no_grad():
+            clone_inputs = self._clone_inputs(inputs)
+            if check_quantization:
+                mod = _generate_qdq_quantized_model(mod, inputs, quantizer=quantizer)
+            expected = mod(*inputs)
+            actual, (source_code,) = run_and_get_code(
+                torch.compile(mod, fullgraph=True, dynamic=check_dynamic),
+                *clone_inputs,
+            )
+            for op in include_ops:
+                self.assertIn(op, source_code)
+            if num_include_ops is not None:
+                assert len(include_ops) == len(num_include_ops)
+                for i in range(len(include_ops)):
+                    self.assertEqual(
+                        source_code.count(include_ops[i]), num_include_ops[i]
+                    )
+            for op in exclude_ops:
+                self.assertNotIn(op, source_code)
+            if check_dynamic is not None:
+                _check_has_dynamic_shape(self, source_code)
+            if not check_quantization:
+                # Skip due to reduce range setting for Quantization on preCI system.
+                torch.testing.assert_close(actual, expected, atol=atol, rtol=rtol)
+
+
+@unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_8, "Requires torch 2.8+")
+class TestPatternMatcher(TestPatternMatcherBase):
+    def _qconv2d_test_helper(self, device="cpu", int8_mixed_bf16=False):
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+                **kwargs,
+            ):
+                super().__init__()
+                self.conv = torch.nn.Conv2d(3, 128, kernel_size=3, stride=1)
+                self.conv2 = torch.nn.Conv2d(128, 128, kernel_size=3, stride=1)
+                self.conv3 = torch.nn.Conv2d(
+                    128, 128, kernel_size=3, stride=1, groups=4
+                )
+
+            def forward(self, x):
+                return self.conv3(self.conv2(self.conv(x)))
+
+        mod = M().eval().to(device=device)
+        v = (
+            torch.randn((1, 3, 8, 8), dtype=torch.float32, requires_grad=False)
+            .add(1)
+            .to(device=device)
+        )
+
+        def matcher_check_fn():
+            # 1. Dequant-Conv2D pattern matched in QConv2D weight prepack * 1
+            #    int8_mixed_fp32: [dequant_node, dequantize_per_channel, clone, convolution]
+            #    int8_mixed_bf16: [dequant_node, optional(convert_element_type_4),
+            #     dequantize_per_channel, optional(convert_element_type_3), clone, convolution]
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_count"], 3
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_nodes"],
+                18 if int8_mixed_bf16 else 12,
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_unary_lower_count"], 0 if TEST_ACL else 3
+            )
+
+        self._test_common(
+            mod,
+            (v,),
+            matcher_check_fn,
+            check_quantization=True,
+            check_autocast=torch.bfloat16 if int8_mixed_bf16 else torch.float,
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    @skipIfRocm
+    def test_qconv2d_cpu(self):
+        r"""
+        This testcase will quantize a single Conv2d module.
+        """
+        self._qconv2d_test_helper("cpu")
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    @skipIfRocm
+    def test_qconv2d_int8_mixed_bf16(self):
+        r"""
+        This testcase will quantize a single Conv2d module with int8_mixed_bf16 quantization.
+        """
+        self._qconv2d_test_helper(int8_mixed_bf16=True)
+
+    def _qconv2d_unary_test_helper(
+        self,
+        device="cpu",
+        int8_mixed_bf16=False,
+        unary_op=torch.nn.ReLU(),
+        qconv_unary_matcher_nodes=None,
+    ):
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+                **kwargs,
+            ):
+                super().__init__()
+                self.conv = torch.nn.Conv2d(3, 128, kernel_size=3, stride=1)
+                self.unary_fn = copy.deepcopy(unary_op)
+                self.conv2 = torch.nn.Conv2d(
+                    128, 128, kernel_size=3, stride=1, bias=False
+                )
+                self.unary_fn2 = copy.deepcopy(unary_op)
+
+            def forward(self, x):
+                tmp = self.unary_fn(self.conv(x))
+                return self.unary_fn2(self.conv2(tmp))
+
+        mod = M().eval().to(device=device)
+        v = (
+            torch.randn((1, 3, 8, 8), dtype=torch.float32, requires_grad=False)
+            .add(1)
+            .to(device=device)
+        )
+
+        def matcher_check_fn():
+            # 1. Dequant-Conv2D pattern matched in quantization weight prepack * 2
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_count"], 2
+            )
+            # 2. QConv2D Unary fusion in post-grad fusion pass * 2
+            self.assertEqual(
+                counters["inductor"]["qconv_unary_matcher_count"],
+                0 if TEST_ACL else 2,
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_unary_lower_count"], 0 if TEST_ACL else 2
+            )
+            if qconv_unary_matcher_nodes:
+                self.assertEqual(
+                    counters["inductor"]["qconv_unary_matcher_nodes"],
+                    0 if TEST_ACL else qconv_unary_matcher_nodes,
+                )
+
+        self._test_common(
+            mod,
+            (v,),
+            check_quantization=True,
+            check_autocast=torch.bfloat16 if int8_mixed_bf16 else torch.float,
+            matcher_check_fn=matcher_check_fn,
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qconv2d_relu_cpu(self):
+        r"""
+        This testcase will quantize Conv2d->ReLU pattern.
+        """
+        self._qconv2d_unary_test_helper(device="cpu")
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    def test_qconv2d_relu_int8_mixed_bf16_xpu(self):
+        r"""
+        This testcase will quantize Conv2d->ReLU pattern with int8_mixed_bf16 quantization.
+        """
+        self._qconv2d_unary_test_helper(int8_mixed_bf16=True)
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qconv2d_relu6_cpu(self):
+        r"""
+        This testcase will quantize Conv2d->ReLU6 pattern.
+        """
+        self._qconv2d_unary_test_helper(device="cpu", unary_op=torch.nn.ReLU6())
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qconv2d_hardtanh_cpu(self):
+        r"""
+        This testcase will quantize Conv2d->Hardtanh pattern.
+        """
+        self._qconv2d_unary_test_helper(device="cpu", unary_op=torch.nn.Hardtanh())
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    def test_qconv2d_hardtanh_int8_mixed_bf16_cpu(self):
+        r"""
+        This testcase will quantize Conv2d->Hardtanh pattern.
+        Match.nodes:
+            [qconv2d_pointwise_default, convert_element_type, clamp_min, clamp_max, convert_element_type, quantize_per_tensor]
+            [qconv2d_pointwise_default, convert_element_type, clamp_min, clamp_max, convert_element_type]
+        """
+        self._qconv2d_unary_test_helper(
+            unary_op=torch.nn.Hardtanh(),
+            int8_mixed_bf16=True,
+            qconv_unary_matcher_nodes=11,
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qconv2d_hardswish_cpu(self):
+        r"""
+        This testcase will quantize Conv2d->Hardswish pattern.
+        """
+        self._qconv2d_unary_test_helper(device="cpu", unary_op=torch.nn.Hardswish())
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    def test_qconv2d_hardswish_int8_mixed_bf16_cpu(self):
+        r"""
+        This testcase will quantize Conv2d->Hardswish pattern.
+        Match.nodes:
+            [qconv2d_pointwise_default, convert_element_type, add, clamp_min,
+             clamp_max, mul, div, convert_element_type, quantize_per_tensor]
+            [qconv2d_pointwise_default, convert_element_type, add, clamp_min, clamp_max, mul, div, convert_element_type]
+        """
+        self._qconv2d_unary_test_helper(
+            unary_op=torch.nn.Hardswish(),
+            int8_mixed_bf16=True,
+            qconv_unary_matcher_nodes=17,
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qconv2d_silu_cpu(self):
+        r"""
+        This testcase will quantize Conv2d->SiLU pattern.
+        """
+        self._qconv2d_unary_test_helper(device="cpu", unary_op=torch.nn.SiLU())
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    def test_qconv2d_silu_int8_mixed_bf16_cpu(self):
+        r"""
+        This testcase will quantize Conv2d->SiLU pattern.
+        Match.nodes:
+            [qconv2d_pointwise_default, convert_element_type, sigmoid, mul,
+             convert_element_type, quantize_per_tensor]
+            [qconv2d_pointwise_default, convert_element_type, sigmoid, mul, convert_element_type]
+        """
+        self._qconv2d_unary_test_helper(
+            unary_op=torch.nn.SiLU(),
+            int8_mixed_bf16=True,
+            qconv_unary_matcher_nodes=11,
+        )
+
+    def _qconv2d_add_test_helper(
+        self, device="cpu", use_relu=False, int8_mixed_bf16=False
+    ):
+        r"""
+        This testcase will quantize a Conv2d->Add pattern as:
+                 X
+               /   \
+        Conv1(X)   Conv2(X)
+               \   /
+                Add
+                 |
+           Optional(relu)
+                 |
+                 Y
+        """
+
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+                add_fn,
+                use_relu,
+                **kwargs,
+            ):
+                super().__init__()
+                self.conv1 = torch.nn.Conv2d(3, 6, kernel_size=3, stride=1)
+                self.conv2 = torch.nn.Conv2d(3, 6, kernel_size=3, stride=1)
+                self.add_fn = add_fn
+                self.relu = torch.nn.ReLU()
+                self.conv3 = torch.nn.Conv2d(6, 6, kernel_size=3, stride=1, bias=False)
+                self.conv4 = torch.nn.Conv2d(6, 6, kernel_size=3, stride=1, bias=False)
+                self.add_fn2 = add_fn
+                self.relu2 = torch.nn.ReLU()
+                self.use_relu = use_relu
+
+            def forward(self, x):
+                x1 = self.conv1(x)
+                x2 = self.conv2(x)
+                tmp = self.add_fn(x1, x2)
+                if self.use_relu:
+                    tmp = self.relu(tmp)
+                tmp1 = self.conv3(tmp)
+                tmp2 = self.conv4(tmp)
+                res = self.add_fn2(tmp1, tmp2)
+                if self.use_relu:
+                    res = self.relu2(res)
+                return res
+
+        for add_fn in quantization_add_fn_list + quantization_inplace_add_fn_list:
+            mod = M(add_fn, use_relu).eval().to(device=device)
+            v = (
+                torch.randn((1, 3, 8, 8), dtype=torch.float32, requires_grad=False)
+                .add(1)
+                .to(device=device)
+            )
+
+            def matcher_check_fn():
+                # 1. Dequant-Conv2D pattern matched in quantization weight prepack * 4
+                self.assertEqual(
+                    counters["inductor"]["qconv_weight_prepack_matcher_count"], 4
+                )
+                # 2. Qconv2d Binary Unary fusion in post-grad fusion pass * 2
+                self.assertEqual(
+                    counters["inductor"]["qconv2d_binary_matcher_count"],
+                    0 if TEST_ACL else 2,
+                )
+                self.assertEqual(
+                    counters["inductor"]["qconv2d_binary_lower_count"],
+                    0 if TEST_ACL else 2,
+                )
+
+            self._test_common(
+                mod,
+                (v,),
+                matcher_check_fn,
+                check_quantization=True,
+                check_autocast=torch.bfloat16 if int8_mixed_bf16 else torch.float,
+            )
+
+    def _qconv2d_add_test_helper2(
+        self, device="cpu", use_relu=False, int8_mixed_bf16=False
+    ):
+        r"""
+        This testcase will quantize two Conv2d->Add patterns as:
+
+        Conv(X)   extra input
+               \   /
+                Add
+                 |
+           Optional(relu)
+                 |
+                 Y
+
+        , and
+
+        extra input   Conv(X)
+               \   /
+                Add
+                 |
+           Optional(relu)
+                 |
+                 Y
+        """
+
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+                add_fn,
+                use_relu,
+                swap_inputs,
+                **kwargs,
+            ):
+                super().__init__()
+                self.conv1 = torch.nn.Conv2d(3, 6, kernel_size=3, stride=1)
+                self.add_fn = add_fn
+                self.relu = torch.nn.ReLU()
+                self.conv2 = torch.nn.Conv2d(6, 6, kernel_size=3, stride=1, bias=False)
+                self.add_fn2 = add_fn
+                self.relu2 = torch.nn.ReLU()
+                self.use_relu = use_relu
+                self.swap_inputs = swap_inputs
+
+            def forward(self, x, x2, x3):
+                x1 = self.conv1(x)
+                if self.swap_inputs:
+                    tmp = self.add_fn(x2, x1)
+                else:
+                    tmp = self.add_fn(x1, x2)
+                if self.use_relu:
+                    tmp = self.relu(tmp)
+                tmp1 = self.conv2(tmp)
+                if self.swap_inputs:
+                    res = self.add_fn2(x3, tmp1)
+                else:
+                    res = self.add_fn2(tmp1, x3)
+                if self.use_relu:
+                    res = self.relu2(res)
+                return res
+
+        for add_fn, swap_inputs in itertools.product(
+            quantization_add_fn_list + quantization_inplace_add_fn_list, [False, True]
+        ):
+            mod = M(add_fn, use_relu, swap_inputs).eval().to(device=device)
+            x = torch.randn(
+                (1, 3, 8, 8), dtype=torch.float32, requires_grad=False, device=device
+            )
+            x2 = torch.randn(
+                (1, 6, 6, 6), dtype=torch.float32, requires_grad=False, device=device
+            )
+            x3 = torch.randn(
+                (1, 6, 4, 4), dtype=torch.float32, requires_grad=False, device=device
+            )
+
+            def matcher_check_fn():
+                # 1. Dequant-Conv2D pattern matched in quantization weight prepack * 2
+                self.assertEqual(
+                    counters["inductor"]["qconv_weight_prepack_matcher_count"], 2
+                )
+                # 2. Qconv2d Binary Unary fusion in post-grad fusion pass * 2
+                self.assertEqual(
+                    counters["inductor"]["qconv2d_binary_matcher_count"],
+                    0 if TEST_ACL else 2,
+                )
+                self.assertEqual(
+                    counters["inductor"]["qconv2d_binary_lower_count"],
+                    0 if TEST_ACL else 2,
+                )
+
+            self._test_common(
+                mod,
+                (x, x2, x3),
+                matcher_check_fn,
+                check_quantization=True,
+                check_autocast=torch.bfloat16 if int8_mixed_bf16 else torch.float,
+            )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qconv2d_add_cpu(self):
+        self._qconv2d_add_test_helper()
+        self._qconv2d_add_test_helper2()
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    def test_qconv2d_add_int8_mixed_bf16(self):
+        self._qconv2d_add_test_helper(int8_mixed_bf16=True)
+        self._qconv2d_add_test_helper2(int8_mixed_bf16=True)
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qconv2d_add_relu_cpu(self):
+        self._qconv2d_add_test_helper(use_relu=True)
+        self._qconv2d_add_test_helper2(use_relu=True)
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    def test_qconv2d_add_relu_int8_mixed_bf16(self):
+        self._qconv2d_add_test_helper(use_relu=True, int8_mixed_bf16=True)
+        self._qconv2d_add_test_helper2(use_relu=True, int8_mixed_bf16=True)
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qconv2d_add_broadcast_shapes_cpu(self):
+        r"""
+        This testcase will quantize Conv2d->add pattern using broadcast shape inputs.
+        Conv2d->Add fusion will fail for the broadcast shape inputs case.
+        """
+
+        class M(torch.nn.Module):
+            def __init__(self, use_bias):
+                super().__init__()
+                self.conv = torch.nn.Conv2d(32, 32, kernel_size=3, stride=1)
+
+            def forward(self, x1, x2):
+                return torch.add(self.conv(x1), x2)
+
+        bias_list = [True, False]
+        for bias in bias_list:
+            mod = M(bias).eval()
+            x1 = torch.randn((2, 32, 9, 9))
+            x2 = torch.randn((2, 32, 1, 1))
+
+            def matcher_check_fn():
+                # 1. Dequant-Conv2D pattern matched in quantization weight prepack * 1
+                self.assertEqual(
+                    counters["inductor"]["qconv_weight_prepack_matcher_count"], 1
+                )
+                # 2. Qconv2d Binary Unary fusion in post-grad fusion pass * 0
+                self.assertEqual(
+                    counters["inductor"]["qconv2d_binary_matcher_count"], 0
+                )
+
+            self._test_common(
+                mod,
+                (x1, x2),
+                matcher_check_fn,
+                check_quantization=True,
+            )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qconv2d_with_concat_cpu(self):
+        channel_1 = 32
+        channel_2 = 16
+        channel_3 = 8
+        channel_4 = int(channel_2 * 2 + channel_3)
+
+        class Model(torch.nn.Module):
+            def __init__(
+                self,
+            ):
+                super().__init__()
+                self.conv1 = torch.nn.Conv2d(
+                    channel_1, channel_2, 1, stride=1, dilation=1, padding=0
+                )
+                self.conv2 = torch.nn.Conv2d(
+                    channel_1, channel_2, 1, stride=1, dilation=1, padding=0
+                )
+                self.conv3 = torch.nn.Conv2d(
+                    channel_2, channel_3, 3, stride=1, dilation=1, padding=1
+                )
+
+                self.conv = torch.nn.Conv2d(
+                    channel_4, channel_2, 1, stride=1, dilation=1, padding=0
+                )
+
+            def forward(self, x: torch.Tensor):
+                x1 = self.conv1(x)
+                x2 = self.conv2(x)
+                x3 = self.conv3(x2)
+                res = torch.cat([x1, x2, x3], dim=1)
+                res = self.conv(res)
+                return res
+
+        mod = Model().eval()
+        v = torch.randn(
+            (8, channel_1, 40, 40), dtype=torch.float32, requires_grad=False
+        )
+
+        def matcher_check_fn():
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_count"], 4
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_unary_matcher_count"],
+                0 if TEST_ACL else 3,
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_unary_lower_count"], 0 if TEST_ACL else 4
+            )
+
+        self._test_common(
+            mod,
+            (v,),
+            matcher_check_fn,
+            check_quantization=True,
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qconv2d_add_2(self):
+        r"""
+        This testcase prevents this pattern be matched as a conv_binary fusion by mistake.
+                Conv(X)  3
+                    \   /
+                     Add
+        We see this pattern in Mobilenet v3 large which add is decomposed from torch.nn.Hardswish or torch.nn.Hardsigmoid.
+        """
+
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+                post_op,
+            ):
+                super().__init__()
+                self.conv = torch.nn.Conv2d(3, 6, kernel_size=3, stride=1)
+                self.post_op = post_op
+
+            def forward(self, x):
+                return self.post_op(self.conv(x))
+
+        for post_op in [
+            torch.nn.Hardswish(inplace=True),
+            torch.nn.Hardsigmoid(inplace=True),
+        ]:
+            mod = M(post_op).eval()
+            v = torch.randn((1, 3, 8, 8), dtype=torch.float32, requires_grad=False).add(
+                1
+            )
+
+            def matcher_check_fn():
+                # Shouldn't hit conv binary fusion
+                self.assertEqual(
+                    counters["inductor"]["qconv2d_binary_matcher_count"], 0
+                )
+
+            self._test_common(
+                mod,
+                (v,),
+                matcher_check_fn,
+                check_quantization=True,
+            )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qconv2d_add_3(self):
+        r"""
+        This testcase will test below model:
+             x
+           /   \
+        conv1  maxpool
+          \    /   \
+           add    conv2
+            \     /
+              cat
+        Based on default recipe of x86InductorQuantizer, we will see this pattern after convert:
+        qconv1    maxpool
+         \           |
+          \         q1
+           \       /   \
+            \     dq1  qconv2
+             \   /
+              add
+               |
+               q2
+        Since q1 has 2 users and qconv2 is not ancestor node of qconv1, we shouldn't fuse:
+                int8
+                 /
+        qconv1 dq1
+           \   /
+            add
+             |
+             q2
+             |
+            int8
+        Instead we can match and fuse this pattern into qconv_binary:
+        qconv1  fp32
+            \   /
+             add
+              |
+             fp32
+        """
+
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+            ):
+                super().__init__()
+                self.conv1 = torch.nn.Conv2d(3, 3, kernel_size=3, stride=1)
+                self.conv2 = torch.nn.Conv2d(3, 3, kernel_size=1, stride=1)
+                self.maxpool = torch.nn.MaxPool2d(
+                    kernel_size=3, stride=1, padding=0, dilation=1
+                )
+
+            def forward(self, x):
+                tmp1 = self.conv1(x)
+                tmp2 = self.maxpool(x)
+                add = torch.add(tmp1, tmp2)
+                tmp3 = self.conv2(tmp2)
+                return torch.cat((add, tmp3), dim=1)
+
+        mod = M().eval()
+        v = torch.randn((1, 3, 8, 8), dtype=torch.float32, requires_grad=False).add(1)
+
+        def matcher_check_fn():
+            self.assertEqual(
+                counters["inductor"]["qconv2d_binary_matcher_count"],
+                0 if TEST_ACL else 1,
+            )
+            # The matched qconv binary pattern should have 2 nodes [qconv, add]
+            # instead of 11 which has dequant in binary input and output quant
+            self.assertEqual(
+                counters["inductor"]["qconv2d_binary_matcher_nodes"],
+                0 if TEST_ACL else 2,
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv2d_binary_lower_count"],
+                0 if TEST_ACL else 1,
+            )
+
+        self._test_common(
+            mod,
+            (v,),
+            matcher_check_fn,
+            check_quantization=True,
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    @skipIfRocm
+    def test_qat_qconv2d(self):
+        r"""
+        This testcase will quantize a single Conv2d module with qat flow.
+        """
+
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+                **kwargs,
+            ):
+                super().__init__()
+                self.conv = torch.nn.Conv2d(3, 128, kernel_size=3, stride=1)
+                self.bn = torch.nn.BatchNorm2d(128)
+
+            def forward(self, x):
+                return self.bn(self.conv(x))
+
+        mod = M().train()
+        v = torch.randn((1, 3, 8, 8), dtype=torch.float32, requires_grad=True).add(1)
+
+        def matcher_check_fn():
+            # 1. Dequant-conv pattern matched in quantization weight prepack * 1
+            #    [dequantize_per_tensor, dequantize_per_channel, clone, convolution]
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_count"], 1
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_nodes"], 4
+            )
+            # 2. QConv2D Unary fusion in post-grad fusion pass * 1
+            #    [qconv2d_pointwise_default, quantize_per_tensor]
+            self.assertEqual(
+                counters["inductor"]["qconv_unary_matcher_count"],
+                0 if TEST_ACL else 1,
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_unary_matcher_nodes"],
+                0 if TEST_ACL else 2,
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_unary_lower_count"], 0 if TEST_ACL else 1
+            )
+
+        self._test_common(
+            mod,
+            (v,),
+            matcher_check_fn,
+            check_quantization=True,
+            is_qat=True,
+        )
+
+    def _qat_qconv2d_unary_cpu_test_helper(
+        self,
+        unary_op=torch.nn.ReLU(),
+    ):
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+                **kwargs,
+            ):
+                super().__init__()
+                self.conv = torch.nn.Conv2d(3, 3, kernel_size=3, stride=1)
+                self.unary_fn = copy.deepcopy(unary_op)
+                self.bn = torch.nn.BatchNorm2d(3)
+                self.conv2 = torch.nn.Conv2d(3, 3, kernel_size=3, stride=1)
+                self.unary_fn2 = copy.deepcopy(unary_op)
+                self.bn2 = torch.nn.BatchNorm2d(3)
+
+            def forward(self, x):
+                tmp = self.unary_fn(self.bn(self.conv(x)))
+                return self.unary_fn2(self.bn2(self.conv2(tmp)))
+
+        mod = M()
+        v = torch.randn((1, 3, 8, 8), dtype=torch.float32, requires_grad=True).add(1)
+
+        def matcher_check_fn():
+            # 1. Dequant-conv pattern matched in quantization weight prepack * 1
+            #    [convert_element_type_1, sub, mul_1, dequantize_per_channel, clone, convolution]
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_count"], 2
+            )
+            # 2. QConv2D Unary fusion in post-grad fusion pass * 1
+            #    [qconv2d_pointwise_default, relu, div_1, round_2, add_1, clamp_min_1, clamp_max_1, convert_element_type_2]
+            self.assertEqual(
+                counters["inductor"]["qconv_unary_matcher_count"],
+                0 if TEST_ACL else 2,
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_unary_lower_count"], 0 if TEST_ACL else 2
+            )
+
+        self._test_common(
+            mod,
+            (v,),
+            matcher_check_fn,
+            check_quantization=True,
+            is_qat=True,
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qat_qconv2d_relu(self):
+        r"""
+        This testcase will quantize Conv2d->ReLU pattern with qat flow.
+        """
+
+        self._qat_qconv2d_unary_cpu_test_helper()
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qat_qconv2d_relu6(self):
+        r"""
+        This testcase will quantize Conv2d->ReLU6 pattern with qat flow.
+        """
+        self._qat_qconv2d_unary_cpu_test_helper(unary_op=torch.nn.ReLU6())
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qat_qconv2d_hardtanh(self):
+        r"""
+        This testcase will quantize Conv2d->Hardtanh pattern with qat flow.
+        """
+        self._qat_qconv2d_unary_cpu_test_helper(unary_op=torch.nn.Hardtanh())
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qat_qconv2d_silu(self):
+        r"""
+        This testcase will quantize Conv2d->SiLU pattern with qat flow.
+        """
+        self._qat_qconv2d_unary_cpu_test_helper(unary_op=torch.nn.SiLU())
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qat_qconv2d_hardswish(self):
+        r"""
+        This testcase will quantize Conv2d->Hardswish pattern with qat flow.
+        """
+        self._qat_qconv2d_unary_cpu_test_helper(unary_op=torch.nn.Hardswish())
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    @skipIfRocm
+    def test_qat_qconv2d_add(self):
+        r"""
+        This testcase will quantize a Conv2d->Add pattern as:
+                 X
+               /   \
+        Conv1(X)   Conv2(X)
+               \   /
+                Add
+                 |
+                 Y
+        """
+
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+                **kwargs,
+            ):
+                super().__init__()
+                self.conv1 = torch.nn.Conv2d(3, 6, kernel_size=3, stride=1)
+                self.bn1 = torch.nn.BatchNorm2d(6)
+                self.conv2 = torch.nn.Conv2d(3, 6, kernel_size=3, stride=1)
+                self.bn2 = torch.nn.BatchNorm2d(6)
+
+            def forward(self, x):
+                x1 = self.bn1(self.conv1(x))
+                x2 = self.bn2(self.conv2(x))
+                return x1 + x2
+
+        mod = M().train()
+        v = torch.randn((1, 3, 8, 8), dtype=torch.float32, requires_grad=True).add(1)
+
+        def matcher_check_fn():
+            # 1. Dequant-conv pattern matched in quantization weight prepack * 2
+            #    [dequantize_per_tensor, dequantize_per_channel, clone, convolution]
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_count"], 2
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_nodes"], 8
+            )
+            # 2. Qconv2d Binary fusion in post-grad fusion pass * 1
+            #    [qconv2d_pointwise_default_1, dequantize_per_tensor, add_3, quantize_per_tensor]
+            self.assertEqual(
+                counters["inductor"]["qconv2d_binary_matcher_count"],
+                0 if TEST_ACL else 1,
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv2d_binary_matcher_nodes"],
+                0 if TEST_ACL else 4,
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv2d_binary_lower_count"],
+                0 if TEST_ACL else 1,
+            )
+
+        self._test_common(
+            mod,
+            (v,),
+            matcher_check_fn,
+            check_quantization=True,
+            is_qat=True,
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    @skipIfRocm
+    def test_qat_qconv2d_add_relu(self):
+        r"""
+        This testcase will quantize a Conv2d->Add->ReLU pattern as:
+                 X
+               /   \
+        Conv1(X)   Conv2(X)
+               \   /
+                Add
+                 |
+                ReLU
+                 |
+                 Y
+        """
+
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+                **kwargs,
+            ):
+                super().__init__()
+                self.conv1 = torch.nn.Conv2d(3, 6, kernel_size=3, stride=1)
+                self.bn1 = torch.nn.BatchNorm2d(6)
+                self.conv2 = torch.nn.Conv2d(3, 6, kernel_size=3, stride=1)
+                self.bn2 = torch.nn.BatchNorm2d(6)
+                self.relu = torch.nn.ReLU()
+
+            def forward(self, x):
+                x1 = self.bn1(self.conv1(x))
+                x2 = self.bn2(self.conv2(x))
+                return self.relu(x1 + x2)
+
+        mod = M().train()
+        v = torch.randn((1, 3, 8, 8), dtype=torch.float32, requires_grad=True).add(1)
+
+        def matcher_check_fn():
+            # 1. Dequant-conv pattern matched in quantization weight prepack * 2
+            #    [dequantize_per_tensor, dequantize_per_channel, clone, convolution]
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_count"], 2
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_nodes"], 8
+            )
+            # 2. Qconv2d Binary fusion in post-grad fusion pass * 1
+            #    [qconv2d_pointwise_default_1, dequantize_per_tensor, add_3, relu, quantize_per_tensor]
+            self.assertEqual(
+                counters["inductor"]["qconv2d_binary_matcher_count"],
+                0 if TEST_ACL else 1,
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv2d_binary_matcher_nodes"],
+                0 if TEST_ACL else 5,
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv2d_binary_lower_count"],
+                0 if TEST_ACL else 1,
+            )
+
+        self._test_common(
+            mod,
+            (v,),
+            matcher_check_fn,
+            check_quantization=True,
+            is_qat=True,
+        )
+
+    def _test_qconv2d_dequant_promotion_helper(self, device="cpu"):
+        r"""
+        This testcase tests if dequant node before conv2d is promoted correctly:
+                 X
+                 |
+              Conv1(X)
+               /   \
+        Conv2(X)   Conv3(X)
+               \   /
+                Add
+                 |
+                 Y
+        """
+
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+                **kwargs,
+            ):
+                super().__init__()
+                self.conv1 = torch.nn.Conv2d(3, 6, kernel_size=3, stride=1)
+                self.conv2 = torch.nn.Conv2d(6, 6, kernel_size=3, stride=1)
+                self.conv3 = torch.nn.Conv2d(6, 6, kernel_size=3, stride=1)
+
+            def forward(self, x):
+                temp = self.conv1(x)
+                temp = self.conv2(temp) + self.conv3(temp)
+                return temp
+
+        mod = M().eval().to(device=device)
+        v = (
+            torch.randn((1, 3, 8, 8), dtype=torch.float32, requires_grad=False)
+            .add(1)
+            .to(device=device)
+        )
+
+        def matcher_check_fn():
+            # 1. Dequant pattern matcher for dequant promotion * 1
+            #    [dequantize_per_tensor]
+            self.assertEqual(counters["inductor"]["dequant_promotion_matcher_count"], 1)
+            self.assertEqual(counters["inductor"]["dequant_promotion_matcher_nodes"], 1)
+            # 2. Dequant-conv pattern matched in quantization weight prepack * 3
+            #    [dequantize_per_tensor, dequantize_per_channel, clone, convolution]
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_count"], 3
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_nodes"], 12
+            )
+            # 3. Qconv2d Binary fusion in post-grad fusion pass * 1
+            #    [qconv2d_pointwise_default_1, add_3]
+            self.assertEqual(
+                counters["inductor"]["qconv2d_binary_matcher_count"],
+                0 if TEST_ACL else 1,
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv2d_binary_matcher_nodes"],
+                0 if TEST_ACL else 2,
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv2d_binary_lower_count"],
+                0 if TEST_ACL else 1,
+            )
+
+        self._test_common(
+            mod,
+            (v,),
+            matcher_check_fn,
+            check_quantization=True,
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    @skipIfRocm
+    def test_qconv2d_dequant_promotion_cpu(self):
+        self._test_qconv2d_dequant_promotion_helper()
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qconv1d_relu_cpu(self):
+        r"""
+        This testcase will quantize Conv1d->ReLU pattern.
+        """
+        device = "cpu"
+        unary_op = torch.nn.ReLU()
+
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+            ):
+                super().__init__()
+                self.conv = torch.nn.Conv1d(3, 128, kernel_size=3, stride=1)
+                self.unary_fn = copy.deepcopy(unary_op)
+                self.conv2 = torch.nn.Conv1d(
+                    128, 128, kernel_size=3, stride=1, bias=False
+                )
+                self.unary_fn2 = copy.deepcopy(unary_op)
+
+            def forward(self, x):
+                tmp = self.unary_fn(self.conv(x))
+                return self.unary_fn2(self.conv2(tmp))
+
+        mod = M().eval().to(device=device)
+        v = (
+            torch.randn((1, 3, 8), dtype=torch.float32, requires_grad=False)
+            .add(1)
+            .to(device=device)
+        )
+
+        def matcher_check_fn():
+            # 1. Dequant-Conv2D pattern matched in quantization weight prepack * 2
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_count"], 2
+            )
+            # 2. QConv2D Unary fusion in post-grad fusion pass * 2
+            self.assertEqual(
+                counters["inductor"]["qconv_unary_matcher_count"],
+                0 if TEST_ACL else 2,
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_unary_lower_count"], 0 if TEST_ACL else 2
+            )
+
+        self._test_common(
+            mod,
+            (v,),
+            check_quantization=True,
+            matcher_check_fn=matcher_check_fn,
+        )
+
+    def _qlinear_test_helper(
+        self,
+        inputs,
+        device="cpu",
+        int8_mixed_bf16=False,
+        do_permute=False,
+        matcher_check_fn=None,
+        bias=True,
+        is_dynamic=False,
+        is_qat=False,
+    ):
+        class M(torch.nn.Module):
+            def __init__(self, use_bias, do_permute=False):
+                super().__init__()
+                self.linear = torch.nn.Linear(4, 3, use_bias)
+                self.linear2 = torch.nn.Linear(3, 4, use_bias)
+                self.do_permute = do_permute
+
+            def forward(self, x):
+                if self.do_permute:
+                    x = torch.reshape(torch.permute(x, (0, 2, 3, 1)), (2, 12, 4))
+                return self.linear2(self.linear(x))
+
+        mod = M(bias, do_permute=do_permute).eval().to(device=device)
+        assert isinstance(inputs, tuple)
+
+        def __convert_tensor_to_device(input, device):
+            return input.to(device=device) if isinstance(input, torch.Tensor) else input
+
+        inputs = tuple(__convert_tensor_to_device(input, device) for input in inputs)
+
+        def _default_matcher_check_fn():
+            self.assertEqual(
+                counters["inductor"]["qlinear_weight_prepack_matcher_count"], 2
+            )
+
+        self._test_common(
+            mod,
+            inputs,
+            matcher_check_fn=(
+                matcher_check_fn
+                if matcher_check_fn is not None
+                else _default_matcher_check_fn
+            ),
+            check_autocast=torch.bfloat16 if int8_mixed_bf16 else torch.float,
+            check_quantization=True,
+            is_qat=is_qat,
+            is_dynamic=is_dynamic,
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qlinear_cpu(self):
+        r"""
+        This testcase will quantize a single Linear Moduel.
+        """
+        for bias in [True, False]:
+            self._qlinear_test_helper((torch.randn((2, 4)),), bias=bias)
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_dynamic_qlinear_cpu(self):
+        r"""
+        This testcase will quantize a single Linear Moduel.
+        """
+        for bias in [True, False]:
+            self._qlinear_test_helper(
+                (torch.randn((2, 4)),), bias=bias, is_dynamic=True
+            )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_dynamic_qlinear_qat_cpu(self):
+        r"""
+        This testcase will quantize a single Linear Moduel.
+        """
+        for bias in [True, False]:
+            self._qlinear_test_helper(
+                (torch.randn((2, 4)),), bias=bias, is_dynamic=True, is_qat=True
+            )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_dynamic_qlinear_input_dim_exceeds_2(self):
+        r"""
+        This testcase will quantize a single Linear Moduel.
+        """
+        for bias in [True, False]:
+            self._qlinear_test_helper(
+                (torch.randn((2, 3, 4)),), bias=bias, is_dynamic=True
+            )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    def test_qlinear_int8_mixed_bf16(self):
+        r"""
+        This testcase will quantize a single Linear Moduel with int8_mixed_bf16 quantization.
+        """
+        for bias in [True, False]:
+            self._qlinear_test_helper(
+                (torch.randn((2, 4)),), int8_mixed_bf16=True, bias=bias
+            )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qlinear_input_dim_exceeds_2(self):
+        r"""
+        This testcase will quantize a single Linear Moduel.
+        """
+        for bias in [True, False]:
+            self._qlinear_test_helper((torch.randn((2, 3, 4)),), bias=bias)
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    def test_qlinear_int8_mixed_bf16_input_dim_exceeds_2(self):
+        r"""
+        This testcase will quantize a single Linear Moduel with int8_mixed_bf16 quantization.
+        """
+        for bias in [True, False]:
+            self._qlinear_test_helper(
+                (torch.randn((2, 3, 4)),), int8_mixed_bf16=True, bias=bias
+            )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qlinear_input_dim_exceeds_2_and_not_contiguous(self):
+        r"""
+        This testcase will quantize a single Linear Module.
+        * Input dim exceeds 2
+        * Input not contiguous
+        """
+        for bias in [True, False]:
+
+            def matcher_check_fn():
+                self.assertEqual(
+                    counters["inductor"]["qlinear_weight_prepack_matcher_count"], 2
+                )
+                self.assertEqual(
+                    counters["inductor"]["qlinear_weight_prepack_matcher_nodes"],
+                    13 if bias else 12,
+                )
+
+            self._qlinear_test_helper(
+                (torch.randn((2, 4, 3, 4)),),
+                do_permute=True,
+                matcher_check_fn=matcher_check_fn,
+                bias=bias,
+            )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    def test_qlinear_int8_mixed_bf16_input_dim_exceeds_2_and_not_contiguous(self):
+        r"""
+        This testcase will quantize a single Linear Module for int8_bf16.
+        * Input dim exceeds 2
+        * Input not contiguous
+        """
+        for bias in [True, False]:
+
+            def matcher_check_fn():
+                self.assertEqual(
+                    counters["inductor"]["qlinear_weight_prepack_matcher_count"], 2
+                )
+                self.assertEqual(
+                    counters["inductor"]["qlinear_weight_prepack_matcher_nodes"],
+                    17 if bias else 16,
+                )
+
+            self._qlinear_test_helper(
+                (torch.randn((2, 4, 3, 4)),),
+                int8_mixed_bf16=True,
+                do_permute=True,
+                matcher_check_fn=matcher_check_fn,
+                bias=bias,
+            )
+
+    def _qlinear_unary_test_helper(
+        self, inputs, unary_op=torch.nn.ReLU(), device="cpu", int8_mixed_bf16=False
+    ):
+        class M(torch.nn.Module):
+            def __init__(self, use_bias):
+                super().__init__()
+                self.linear = torch.nn.Linear(4, 4, use_bias)
+                self.unary_fn = copy.deepcopy(unary_op)
+                self.linear2 = torch.nn.Linear(4, 4, use_bias)
+                self.unary_fn2 = copy.deepcopy(unary_op)
+
+            def forward(self, x):
+                tmp = self.unary_fn(self.linear(x))
+                return self.unary_fn2(self.linear2(tmp))
+
+        bias_list = [True, False]
+        for bias in bias_list:
+            mod = M(bias).eval().to(device=device)
+
+            def matcher_check_fn():
+                # 1. dequant-linear pattern matched in quantization weight prepack
+                self.assertEqual(
+                    counters["inductor"]["qlinear_weight_prepack_matcher_count"], 2
+                )
+                # 2. QLinear Unary fusion in post-grad fusion pass
+                self.assertEqual(
+                    counters["inductor"]["qlinear_unary_matcher_count"],
+                    0 if TEST_ACL else 2,
+                )
+                self.assertEqual(
+                    counters["inductor"]["qlinear_unary_lower_count"],
+                    0 if TEST_ACL else 2,
+                )
+
+            self._test_common(
+                mod,
+                inputs,
+                matcher_check_fn,
+                check_autocast=torch.bfloat16 if int8_mixed_bf16 else torch.float,
+                check_quantization=True,
+            )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qlinear_relu_cpu(self):
+        r"""
+        This testcase will quantize a Linear->ReLU pattern.
+        """
+        self._qlinear_unary_test_helper((torch.randn((2, 4)),))
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    def test_qlinear_relu_int8_mixed_bf16(self):
+        r"""
+        This testcase will quantize a Linear->ReLU pattern with int8_mixed_bf16 quantization.
+        """
+        self._qlinear_unary_test_helper((torch.randn((2, 4)),), int8_mixed_bf16=True)
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qlinear_relu_input_dim_exceeds_2(self):
+        r"""
+        This testcase will quantize a Linear->ReLU pattern.
+        """
+        self._qlinear_unary_test_helper((torch.randn((2, 3, 4)),))
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    def test_qlinear_relu_int8_mixed_bf16_input_dim_exceeds_2(self):
+        r"""
+        This testcase will quantize a Linear->ReLU pattern with int8_mixed_bf16 quantization.
+        """
+        self._qlinear_unary_test_helper((torch.randn((2, 3, 4)),), int8_mixed_bf16=True)
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qlinear_gelu_cpu(self):
+        r"""
+        This testcase will quantize a Linear->GELU pattern.
+        """
+        for gelu in [torch.nn.GELU("none"), torch.nn.GELU("tanh")]:
+            self._qlinear_unary_test_helper((torch.randn((2, 4)),), gelu)
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    def test_qlinear_gelu_int8_mixed_bf16(self):
+        r"""
+        This testcase will quantize a Linear->GELU pattern with int8_mixed_bf16 quantization.
+        """
+        for gelu in [torch.nn.GELU("none"), torch.nn.GELU("tanh")]:
+            self._qlinear_unary_test_helper(
+                (torch.randn((2, 4)),), gelu, int8_mixed_bf16=True
+            )
+
+    def _qlinear_add_test_helper(
+        self,
+        device="cpu",
+        use_relu=False,
+        int8_mixed_bf16=False,
+        is_qat=True,
+        is_dynamic=True,
+    ):
+        r"""
+        This testcase will quantize two consecutive Linear->Add(->relu) patterns as:
+                 X
+               /   \
+        linear(X)   linear(X)
+               \   /
+                Add
+                 |
+           Optional(relu)
+               /   \
+        linear(X)   linear(X)
+               \   /
+                Add
+                 |
+           Optional(relu)
+                 |
+                 Y
+        """
+
+        def fake_quant(x):
+            # to produce a float32 result as extra input
+            qlib = torch.ops.quantized_decomposed
+            if device == "cpu":
+                qmin, qmax, dtype = 0, 255, torch.uint8
+            else:
+                qmin, qmax, dtype = -128, 127, torch.int8
+            x = qlib.quantize_per_tensor.default(x, 0.0166785, 42, qmin, qmax, dtype)
+            x = qlib.dequantize_per_tensor.default(x, 0.0166785, 42, qmin, qmax, dtype)
+            return x
+
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+                add_fn,
+                use_relu,
+                fake_quant_before_extra_input,
+            ):
+                super().__init__()
+                self.linear1 = torch.nn.Linear(4, 4)
+                self.linear2 = torch.nn.Linear(4, 4)
+                self.add_fn = add_fn
+                self.relu = torch.nn.ReLU()
+                self.linear3 = torch.nn.Linear(4, 4)
+                self.linear4 = torch.nn.Linear(4, 4)
+                self.add_fn2 = add_fn
+                self.relu2 = torch.nn.ReLU()
+                self.use_relu = use_relu
+                self.fake_quant_before_extra_input = fake_quant_before_extra_input
+
+            def forward(self, x):
+                x1 = self.linear1(x)
+                x2 = self.linear2(x)
+                if self.fake_quant_before_extra_input:
+                    x2 = fake_quant(x2)
+                tmp = self.add_fn(x1, x2)
+                if self.use_relu:
+                    tmp = self.relu(tmp)
+                tmp1 = self.linear3(tmp)
+                tmp2 = self.linear4(tmp)
+                if self.fake_quant_before_extra_input:
+                    tmp2 = fake_quant(tmp2)
+                res = self.add_fn2(tmp1, tmp2)
+                if self.use_relu:
+                    res = self.relu2(res)
+                return res
+
+        add_fn_list = [
+            lambda x, y: x + y,
+            lambda x, y: y + x,
+            lambda x, y: x.add_(y),
+            lambda x, y: y.add_(x),
+        ]
+        fake_quant_x2_list = [False, True] if int8_mixed_bf16 else [False]
+        shape_list = [(4, 4), (4, 4, 4)]
+        cases = itertools.product(add_fn_list, fake_quant_x2_list, shape_list)
+        for add_fn, fq_x2, shape in cases:
+            mod = M(add_fn, use_relu, fq_x2).eval().to(device=device)
+            v = torch.randn(
+                shape, dtype=torch.float32, requires_grad=False, device=device
+            ).add(1)
+
+            def matcher_check_fn():
+                # 1. Dequant-linear pattern matched in quantization weight prepack * 4
+                self.assertEqual(
+                    counters["inductor"]["qlinear_weight_prepack_matcher_count"], 4
+                )
+                # pattern = [dequant_per_tensor, (convert_dtype), dequant_per_channel, (convert_dtype), permute, addmm]
+                nodes_per_match = 6 if int8_mixed_bf16 else 4
+                if len(shape) == 3:
+                    # pattern = [dequant_per_tensor, (convert_dtype), (view), \
+                    #   dequant_per_channel, (convert_dtype), (view), permute, addmm]
+                    nodes_per_match += 2
+                self.assertEqual(
+                    counters["inductor"]["qlinear_weight_prepack_matcher_nodes"],
+                    4 * nodes_per_match,
+                )
+                # 2. Qlinear Binary Unary fusion in post-grad fusion pass * 2
+                self.assertEqual(
+                    counters["inductor"]["qlinear_binary_matcher_count"],
+                    0 if TEST_ACL else 2,
+                )
+                # Two linear-binary patterns are matched
+                # matched patter1 = [qlinear, add, (convert dtype), (relu), quantize_per_tensor]
+                # matched patter2 = [qlinear, add, (convert dtype), (relu)]
+                # If add_fn is x.add_(y), x is bf16 and y is fp32, there is a to_bf16 node after binary
+                to_bf16_after_binary = 2 * (add_fn == add_fn_list[2] and fq_x2)
+                expected_matcher_nodes = (
+                    (4 if is_dynamic else 5) + 2 * use_relu + to_bf16_after_binary
+                )
+                self.assertEqual(
+                    counters["inductor"]["qlinear_binary_matcher_nodes"],
+                    0 if TEST_ACL else expected_matcher_nodes,
+                )
+                self.assertEqual(
+                    counters["inductor"]["qlinear_binary_lower_count"],
+                    0 if TEST_ACL else 2,
+                )
+
+            self._test_common(
+                mod,
+                (v,),
+                matcher_check_fn,
+                check_quantization=True,
+                check_autocast=torch.bfloat16 if int8_mixed_bf16 else torch.float,
+                is_qat=is_qat,
+                is_dynamic=is_dynamic,
+            )
+
+            if TEST_ACL:
+                continue
+
+            if torch._inductor.config.cpp_wrapper:
+                # For CPP wrapper
+                self._test_code_common(
+                    mod,
+                    (v,),
+                    [
+                        "aoti_torch_cpu__qlinear_pointwise_tensor",
+                        "aoti_torch_cpu__qlinear_pointwise_binary_tensor",
+                    ],
+                    [],
+                    check_quantization=True,
+                    num_include_ops=[2, 2],
+                )
+            else:
+                # For python wrapper
+                self._test_code_common(
+                    mod,
+                    (v,),
+                    [
+                        "torch.ops.onednn.qlinear_pointwise.tensor",
+                        "torch.ops.onednn.qlinear_pointwise.binary",
+                    ],
+                    [],
+                    check_quantization=True,
+                    num_include_ops=[2, 2],
+                )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    @parametrize("use_relu", [True, False])
+    @parametrize("is_qat", [True, False])
+    @parametrize("is_dynamic", [True, False])
+    def test_qlinear_add_cpu(self, use_relu, is_qat, is_dynamic):
+        self._qlinear_add_test_helper(
+            use_relu=use_relu, is_qat=is_qat, is_dynamic=is_dynamic
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    @parametrize("use_relu", [True, False])
+    @parametrize("is_qat", [True, False])
+    @parametrize("is_dynamic", [True, False])
+    def test_qlinear_add_int8_mixed_bf16(self, use_relu, is_qat, is_dynamic):
+        self._qlinear_add_test_helper(
+            int8_mixed_bf16=True,
+            use_relu=use_relu,
+            is_qat=is_qat,
+            is_dynamic=is_dynamic,
+        )
+
+    def _qlinear_dequant_promotion_test_helper(
+        self,
+        inputs,
+        device="cpu",
+        int8_mixed_bf16=False,
+        is_dynamic=False,
+        matcher_check_fn=None,
+    ):
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+                **kwargs,
+            ):
+                super().__init__()
+                self.linear1 = torch.nn.Linear(4, 4)
+                self.linear2 = torch.nn.Linear(4, 4)
+                self.linear3 = torch.nn.Linear(4, 4)
+
+            def forward(self, x):
+                temp = self.linear1(x)
+                temp = self.linear2(temp) + self.linear3(temp)
+                return temp
+
+        mod = M().eval().to(device=device)
+
+        def default_matcher_check_fn():
+            # 1. Dequant pattern matcher for dequant promotion * 1
+            self.assertEqual(counters["inductor"]["dequant_promotion_matcher_count"], 1)
+            # 2. dequant-linear pattern matched in quantization weight prepack * 3
+            self.assertEqual(
+                counters["inductor"]["qlinear_weight_prepack_matcher_count"], 3
+            )
+            # 3. QLinear Unary fusion in post-grad fusion pass * 1
+            self.assertEqual(
+                counters["inductor"]["qlinear_unary_matcher_count"],
+                0 if TEST_ACL else 1,
+            )
+
+        self._test_common(
+            mod,
+            inputs,
+            matcher_check_fn=(
+                matcher_check_fn
+                if matcher_check_fn is not None
+                else default_matcher_check_fn
+            ),
+            check_autocast=torch.bfloat16 if int8_mixed_bf16 else torch.float,
+            check_quantization=True,
+            is_dynamic=is_dynamic,
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qlinear_dequant_promotion_cpu(self):
+        r"""
+        This testcase test if dequant node before linear is promoted correctly:
+                  X
+                  |
+               Linear1(X)
+                /   \
+        Linear2(X)   Linear3(X)
+                \   /
+                 Add
+                  |
+                  Y
+        """
+        self._qlinear_dequant_promotion_test_helper((torch.randn((2, 4)),))
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    def test_qlinear_dequant_promotion_int8_mixed_bf16(self):
+        r"""
+        Test with int8_mixed_bf16 quantization.
+        This testcase test if dequant node before linear is promoted correctly:
+                  X
+                  |
+               Linear1(X)
+                /   \
+        Linear2(X)   Linear3(X)
+                \   /
+                 Add
+                  |
+                  Y
+        """
+        self._qlinear_dequant_promotion_test_helper(
+            (torch.randn((2, 4)),), int8_mixed_bf16=True
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qlinear_dequant_promotion_cpu_input_dim_exceeds_2(self):
+        r"""
+        This testcase test if dequant node before linear is promoted correctly:
+                  X
+                  |
+               Linear1(X)
+                /   \
+        Linear2(X)   Linear3(X)
+                \   /
+                 Add
+                  |
+                  Y
+        """
+        self._qlinear_dequant_promotion_test_helper((torch.randn((2, 3, 4)),))
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNNBF16
+    @skipIfNoONEDNN
+    def test_qlinear_dequant_promotion_int8_mixed_bf16_input_dim_exceeds_2(self):
+        r"""
+        Test with int8_mixed_bf16 quantization.
+        This testcase test if dequant node before linear is promoted correctly:
+                  X
+                  |
+               Linear1(X)
+                /   \
+        Linear2(X)   Linear3(X)
+                \   /
+                 Add
+                  |
+                  Y
+        """
+        self._qlinear_dequant_promotion_test_helper(
+            (torch.randn((2, 3, 4)),), int8_mixed_bf16=True
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qlinear_dequant_promotion_dynamic_cpu(self):
+        r"""
+        This testcase test if dequant node before linear is promoted correctly:
+                  X
+                  |
+               Linear1(X)
+                /   \
+        Linear2(X)   Linear3(X)
+                \   /
+                 Add
+                  |
+                  Y
+        """
+
+        def matcher_check_fn():
+            # 1. Dequant pattern matcher for dequant promotion * 1
+            self.assertEqual(counters["inductor"]["dequant_promotion_matcher_count"], 1)
+            # 2. dequant-linear pattern matched in quantization weight prepack * 3
+            self.assertEqual(
+                counters["inductor"]["qlinear_weight_prepack_matcher_count"], 3
+            )
+
+        self._qlinear_dequant_promotion_test_helper(
+            (torch.randn((2, 4)),),
+            matcher_check_fn=matcher_check_fn,
+            is_dynamic=True,
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qlinear_mul_cpu(self):
+        r"""
+        This testcase will quantize a Linear->Mul pattern.
+        """
+
+        class M(torch.nn.Module):
+            def __init__(self, use_bias):
+                super().__init__()
+                self.linear = torch.nn.Linear(4, 5, use_bias)
+
+            def forward(self, x1, x2):
+                return torch.mul(self.linear(x1), x2)
+
+        bias_list = [True, False]
+        for bias in bias_list:
+            mod = M(bias).eval()
+            x1 = torch.randn((2, 4))
+            x2 = torch.randn((2, 5))
+
+            def matcher_check_fn():
+                self.assertEqual(
+                    counters["inductor"]["qlinear_weight_prepack_matcher_count"], 1
+                )
+
+            self._test_common(
+                mod,
+                (x1, x2),
+                matcher_check_fn,
+                check_quantization=True,
+            )
+
+    @skipIfNoDynamoSupport
+    def test_qmaxpool2d(self):
+        r"""
+        This testcase will quantize Conv2d->ReLU->MaxPool2d pattern.
+        """
+
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+                kwargs,
+            ):
+                super().__init__()
+                self.conv = torch.nn.Conv2d(
+                    3, 64, 7, bias=True, stride=2, padding=3, dilation=1
+                )
+                self.relu = torch.nn.ReLU()
+                self.maxpool = torch.nn.MaxPool2d(3, **kwargs)
+
+            def forward(self, x):
+                return self.maxpool(self.relu(self.conv(x)))
+
+        kwargs_list = [
+            {"stride": 2},
+            {"stride": 2, "padding": 1},
+            {"stride": 2, "padding": 1, "dilation": 1},
+            {"stride": 2, "padding": 1, "dilation": 1, "ceil_mode": False},
+        ]
+        for kwargs in kwargs_list:
+            mod = M(kwargs).eval()
+            v = torch.randn((1, 3, 8, 8), dtype=torch.float32, requires_grad=False).add(
+                1
+            )
+
+            def matcher_check_fn():
+                self.assertEqual(
+                    counters["inductor"]["qmaxpool2d_matcher_count"],
+                    0 if TEST_ACL else 1,
+                )
+                self.assertEqual(
+                    counters["inductor"]["qconv_weight_prepack_matcher_count"], 1
+                )
+                self.assertEqual(
+                    counters["inductor"]["qconv_unary_matcher_count"],
+                    0 if TEST_ACL else 1,
+                )
+                self.assertEqual(
+                    counters["inductor"]["qconv_unary_lower_count"],
+                    0 if TEST_ACL else 1,
+                )
+
+            self._test_common(
+                mod,
+                (v,),
+                matcher_check_fn,
+                check_quantization=True,
+            )
+
+    @skipIfNoDynamoSupport
+    def test_qflatten(self):
+        r"""
+        This testcase will quantize Conv2d->AdaptiveAvgPool2d->flatten->cat pattern.
+        """
+
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+            ):
+                super().__init__()
+                self.conv = torch.nn.Conv2d(
+                    3, 64, 7, bias=True, stride=2, padding=3, dilation=1
+                )
+                self.relu = torch.nn.ReLU()
+                self.adaptive_avg_pool2d = torch.nn.AdaptiveAvgPool2d((1, 1))
+
+            def forward(self, x):
+                return torch.cat(
+                    [
+                        torch.flatten(
+                            self.adaptive_avg_pool2d(self.relu(self.conv(x))), 1
+                        )
+                    ]
+                )
+
+        mod = M().eval()
+        v = torch.randn((1, 3, 8, 8), dtype=torch.float32, requires_grad=False).add(1)
+
+        def matcher_check_fn():
+            self.assertEqual(
+                counters["inductor"]["qreshape_matcher_count"], 0 if TEST_ACL else 1
+            )
+
+        self._test_common(
+            mod,
+            (v,),
+            matcher_check_fn,
+            check_quantization=True,
+        )
+
+    @skipIfNoDynamoSupport
+    def test_qcat(self):
+        r"""
+        This testcase will quantize cat based pattern:
+                X
+             /     \
+        Conv1(X)  Pow(x)
+            \        \
+             \     Conv2(X)
+              \    /
+               Cat
+                |
+                Y
+        """
+
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+            ):
+                super().__init__()
+                self.conv = torch.nn.Conv2d(
+                    3, 64, 7, bias=True, stride=2, padding=3, dilation=1
+                )
+                self.conv2 = torch.nn.Conv2d(
+                    3, 64, 7, bias=True, stride=2, padding=3, dilation=1
+                )
+
+            def forward(self, x):
+                temp1 = self.conv(x)
+                temp2 = self.conv2(torch.pow(x, 2))
+                return torch.cat((temp1, temp2), 1)
+
+        mod = M().eval()
+        v = torch.randn((1, 3, 8, 8), dtype=torch.float32, requires_grad=False).add(1)
+
+        def matcher_check_fn():
+            self.assertEqual(
+                counters["inductor"]["qcat_matcher_count"], 0 if TEST_ACL else 1
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_count"], 2
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_unary_matcher_count"],
+                0 if TEST_ACL else 2,
+            )
+            self.assertEqual(
+                counters["inductor"]["qconv_unary_lower_count"], 0 if TEST_ACL else 2
+            )
+
+        self._test_common(
+            mod,
+            (v,),
+            matcher_check_fn,
+            check_quantization=True,
+        )
+
+    def _test_linear_dynamic_fp16_helper(self, use_relu: bool):
+        class M(torch.nn.Module):
+            def __init__(self, bias: bool, use_relu: bool):
+                super().__init__()
+                self.linear = torch.nn.Linear(256, 256, bias=bias)
+                self.relu = torch.nn.ReLU()
+                self.use_relu = use_relu
+
+            def forward(self, x):
+                if self.use_relu:
+                    return self.relu(self.linear(x))
+                return self.linear(x)
+
+        quantizer = X86InductorQuantizer().set_global(
+            xiq.get_default_x86_inductor_quantization_config()
+        )
+        quantizer.set_module_type_qconfig(
+            torch.nn.Linear, xiq.get_x86_inductor_linear_dynamic_fp16_config()
+        )
+        bias_list = [True, False]
+        input_ndim_list = [2, 3]
+        x_contig_list = [True, False]
+        cases = itertools.product(bias_list, input_ndim_list, x_contig_list)
+        for bias, input_ndim, x_contig in cases:
+            x_shape = (4, 256) if input_ndim == 2 else (4, 1, 256)
+            x = torch.randn(x_shape)
+            if not x_contig:
+                x = x[0::2, ...]
+            mod = M(bias, use_relu).eval()
+
+            def matcher_check_fn():
+                self.assertEqual(
+                    counters["inductor"]["qlinear_weight_prepack_matcher_count"], 1
+                )
+                # Matched nodes:
+                # (1) w to fp16, (2) w to fp32, (3) permute w, (4) mm/addmm/bmm
+                # If x.ndim == 3 and x is contiguous, two view nodes are added.
+                # If x.ndim == 3 and x is not contiguous, two expand nodes and one add node are added.
+                nodes_count = 4
+                if input_ndim > 2:
+                    if x_contig:
+                        nodes_count += 2
+                    else:
+                        nodes_count += 3 if bias else 2
+                if use_relu:
+                    nodes_count += 1
+                self.assertEqual(
+                    counters["inductor"]["qlinear_weight_prepack_matcher_nodes"],
+                    nodes_count,
+                )
+
+            self._test_common(
+                mod,
+                (x,),
+                atol=1e-2,
+                rtol=1e-2,
+                matcher_check_fn=matcher_check_fn,
+                check_quantization=True,
+                quantizer=quantizer,
+            )
+            linear_op_str = (
+                "torch.ops.onednn.linear_relu_dynamic_fp16.default"
+                if use_relu
+                else "torch.ops.onednn.linear_dynamic_fp16.default"
+            )
+            self._test_code_common(
+                mod,
+                (x,),
+                [linear_op_str],
+                ["torch.ops.aten.addmm.default", "torch.ops.aten.mm.default"],
+                check_quantization=True,
+                quantizer=quantizer,
+            )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_linear_dynamic_fp16(self):
+        self._test_linear_dynamic_fp16_helper(use_relu=False)
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_linear_relu_dynamic_fp16(self):
+        self._test_linear_dynamic_fp16_helper(use_relu=True)
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    # TODO: investigate options of torch.compile in fbcode
+    @unittest.skipIf(IS_FBCODE, "Failing in fbcode")
+    @parametrize("has_bias", [True, False])
+    @parametrize("dtype", [torch.float, torch.bfloat16])
+    @parametrize("per_channel_quant", [True, False])
+    @parametrize("dynamic", [True, False])
+    def test_smooth_quant_with_int_mm(
+        self, has_bias, dtype, per_channel_quant, dynamic
+    ):
+        r"""
+        This testcase check if we can match the SmoothQuant int8 linear pattern from Torchao.
+        The pattern is:
+            (no bias) reshape -> _int_mm -> convert_element_type -> (expand -> mul) -> mul -> reshape
+        or
+            (with bias) pattern_no_bias -> add -> reshape -> reshape
+        """
+        if dtype == torch.bfloat16 and not torch.ops.mkldnn._is_mkldnn_bf16_supported():
+            return
+        M = 16
+        in_feature = 32
+        out_feature = 64
+        q_min, q_max = -32, 31
+
+        class Mod(torch.nn.Module):
+            def __init__(
+                self, dtype: torch.dtype, has_bias: bool, per_channel_quant: bool
+            ):
+                super().__init__()
+                self.dtype = dtype
+                self.has_bias = has_bias
+                self.b = torch.randint(
+                    q_min, q_max, [in_feature, out_feature], dtype=torch.int8
+                )
+                self.per_channel_quant = per_channel_quant
+                a_scale_per_tensor = torch.rand([1], dtype=dtype) * 0.01 + 0.01
+                a_scale_per_channel = torch.rand([M, 1], dtype=dtype) * 0.01 + 0.01
+                self.a_scale = (
+                    a_scale_per_channel
+                    if self.per_channel_quant
+                    else a_scale_per_tensor
+                )
+                self.b_scale = torch.rand([out_feature]) * 0.01 + 0.01
+                self.b_scale = self.b_scale.to(dtype)
+                self.bias = torch.rand([out_feature], dtype=dtype) if has_bias else None
+
+            def forward(self, a):
+                out_shape = a.shape[:-1] + (self.b.size(-1),)
+                a_reshaped = a.reshape(-1, a.size(-1))
+                c = torch._int_mm(a_reshaped, self.b)
+                c = c.to(self.dtype)
+                c_shape = c.shape
+                a_scale = self.a_scale.expand(c.shape)
+                c = c * a_scale
+                c = c * self.b_scale
+                if self.has_bias:
+                    c = c.reshape([1, *list(c_shape)])
+                    c = c + self.bias
+                    c = c.reshape(c_shape)
+                c = c.reshape(out_shape)
+                return c
+
+        mod = Mod(dtype, has_bias, per_channel_quant).eval()
+        a = torch.randint(q_min, q_max, [1, M, in_feature], dtype=torch.int8)
+
+        def matcher_check_fn():
+            self.assertEqual(
+                counters["inductor"]["qlinear_weight_prepack_matcher_count"], 1
+            )
+            if dynamic:
+                nodes_count = 10 if has_bias else 7
+            else:
+                nodes_count = 7 if has_bias else 6
+            self.assertEqual(
+                counters["inductor"]["qlinear_weight_prepack_matcher_nodes"],
+                nodes_count,
+            )
+
+        self._test_common(
+            mod,
+            (a,),
+            matcher_check_fn=matcher_check_fn,
+            check_autocast=dtype,
+            compile_options={"dynamic": dynamic},
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    # TODO: investigate options of torch.compile in fbcode
+    @unittest.skipIf(IS_FBCODE, "Failing in fbcode")
+    @parametrize("has_bias", [True, False])
+    @parametrize("dtype", [torch.float, torch.bfloat16])
+    @parametrize("dynamic", [True, False])
+    @parametrize("reshape_a", [True, False])
+    @parametrize(
+        "M",
+        [
+            1,
+            32,
+        ],
+    )
+    @parametrize("inplace_add", [True, False])
+    @parametrize("expand_a_scale", [True, False])
+    def test_da8w8_sym_act_sym_wgt_with_int_mm(
+        self, has_bias, dtype, dynamic, reshape_a, M, inplace_add, expand_a_scale
+    ):
+        r"""
+        This testcase check if we can match the int8_dynamic_activation_int8_weight int8 linear pattern from torchao,
+        when activation is symmetrically quantized dynamically & weights are symmetrically quantized (statically)
+        The pattern is:
+            (no bias) _int_mm -> convert_element_type -> ([expand_a] -> mul) -> mul
+        or
+            (with bias) pattern_no_bias -> add
+        Expansion of the scale of activation is optional.
+        The pattern depiction doesn't mean that convert_element_type output is fed into expand_a as input,
+        but simply that activation scale may be applied after an expand operation on it.
+        """
+        if dtype == torch.bfloat16 and not torch.ops.mkldnn._is_mkldnn_bf16_supported():
+            return
+        in_feature = 32
+        out_feature = 64
+        q_min, q_max = -32, 31
+        # we only test for qlinear_binary in this case
+        test_for_pointwise_binary = (
+            True
+            if M == 1
+            and inplace_add
+            and not expand_a_scale
+            and not dynamic
+            and not has_bias
+            else False
+        )
+        if test_for_pointwise_binary and not IS_X86:
+            self.skipTest("Some UTs are only supported on x86_64 CPUs")
+
+        class Mod(torch.nn.Module):
+            def __init__(self, dtype: torch.dtype, has_bias: bool):
+                super().__init__()
+                self.dtype = dtype
+                self.has_bias = has_bias
+                self.b = torch.randint(
+                    q_min, q_max, [in_feature, out_feature], dtype=torch.int8
+                )
+                self.a_scale = torch.rand([M, 1], dtype=dtype) * 0.01 + 0.01
+                self.b_scale = torch.rand([out_feature]) * 0.01 + 0.01
+                self.b_scale = self.b_scale.to(dtype)
+                self.bias = torch.rand([out_feature], dtype=dtype) if has_bias else None
+                self.additive = torch.rand([M, out_feature], dtype=dtype)
+
+            def forward(self, a):
+                if reshape_a:
+                    a_reshaped = a.reshape(-1, a.size(-1))
+                else:
+                    a_reshaped = a
+                c = torch._int_mm(a_reshaped, self.b)
+                c = c.to(self.dtype)
+                if expand_a_scale:
+                    a_scale = self.a_scale.expand(c.shape)
+                else:
+                    a_scale = self.a_scale
+                c = c * a_scale
+                c = c * self.b_scale
+                if self.has_bias:
+                    c = c + self.bias
+                elif inplace_add and test_for_pointwise_binary:
+                    # When M is 1, dynamic shapes are enabled with torch.compile, has_bias is False,
+                    # expand_a_scale is False and inplace_add is true,
+                    # the output's outermost dim's stride can't be determined due to some Inductor bug.
+                    c.add_(self.additive)
+                return c
+
+        mod = Mod(dtype, has_bias).eval()
+        a = torch.randint(q_min, q_max, [M, in_feature], dtype=torch.int8)
+
+        def matcher_check_fn():
+            self.assertEqual(
+                counters["inductor"]["qlinear_weight_prepack_matcher_count"], 1
+            )
+
+        self._test_common(
+            mod,
+            (a,),
+            matcher_check_fn,
+            check_autocast=dtype,
+            compile_options={"dynamic": dynamic},
+        )
+        if test_for_pointwise_binary:
+            self.assertEqual(counters["inductor"]["qlinear_binary_matcher_count"], 1)
+
+
+@dynamo_config.patch(
+    {
+        "dynamic_shapes": True,
+        "assume_static_by_default": False,
+        "specialize_float": True,
+    }
+)
+@unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_8, "Requires torch 2.8+")
+class TestDynamicPatternMatcher(TestPatternMatcherBase):
+    def test_qconv2d_maxpool2d_linear_dynamic_cpu(self, include_ops=None):
+        r"""
+        This testcase will quantize a single Conv2d->Maxpool2d->Linear module
+        with dynamic batch size input.
+        """
+
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+                **kwargs,
+            ):
+                super().__init__()
+                self.conv = torch.nn.Conv2d(
+                    3, 16, (2, 2), stride=(1, 1), padding=(1, 1)
+                )
+                self.relu = torch.nn.ReLU()
+                self.maxpool2d = torch.nn.MaxPool2d(kernel_size=3, stride=2, padding=1)
+                self.avgpool = torch.nn.AdaptiveAvgPool2d((1, 1))
+                self.linear = torch.nn.Linear(16, 16)
+
+            def forward(self, x):
+                temp = self.relu(self.conv(x))
+                temp = self.maxpool2d(temp)
+                temp = self.avgpool(temp)
+                temp = torch.flatten(temp, 1)
+                return self.linear(temp)
+
+        mod = M().eval()
+        v = torch.randn((2, 3, 8, 8), dtype=torch.float32, requires_grad=False).add(1)
+        if include_ops is None:
+            include_ops = [
+                "torch.ops.onednn.qconv_pointwise",
+                "torch.ops.quantized.max_pool2d",
+                "torch.ops.onednn.qlinear_pointwise",
+            ]
+        exclude_ops = []
+        self._test_code_common(
+            mod,
+            (v,),
+            include_ops,
+            exclude_ops,
+            check_quantization=True,
+            check_dynamic=True,
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_qat_bn_conv2d(self):
+        r"""
+        This testcase will quantize a single BN Conv2d module with qat flow.
+        """
+
+        class M(torch.nn.Module):
+            def __init__(
+                self,
+            ):
+                super().__init__()
+                self.conv = torch.nn.Conv2d(3, 3, 3)
+                self.bn1 = torch.nn.BatchNorm2d(3)
+                self.bn2 = torch.nn.BatchNorm2d(3)
+
+            def forward(self, x):
+                x = self.conv(self.bn1(x))
+                return self.bn2(x)
+
+        mod = M().train()
+        v = torch.randn((1, 3, 8, 8), dtype=torch.float32, requires_grad=True).add(1)
+
+        def matcher_check_fn():
+            self.assertEqual(
+                counters["inductor"]["qconv_weight_prepack_matcher_count"], 1
+            )
+
+        self._test_common(
+            mod,
+            (v,),
+            matcher_check_fn,
+            check_quantization=True,
+            is_qat=True,
+        )
+
+    @skipIfNoDynamoSupport
+    @skipIfNoONEDNN
+    def test_q_attention_block(self):
+        class SelfAttnLikeModule(torch.nn.Module):
+            def __init__(
+                self,
+                input_dim,
+                transpose_for_score=False,
+                num_attention_heads=None,
+                attention_head_size=None,
+            ) -> None:
+                super().__init__()
+                self.input_dim = input_dim
+                self.q_proj = torch.nn.Linear(input_dim, input_dim, bias=False)
+                self.k_proj = torch.nn.Linear(input_dim, input_dim, bias=False)
+                self.v_proj = torch.nn.Linear(input_dim, input_dim, bias=False)
+                self.softmax = torch.nn.Softmax(dim=-1)
+                self.transpose_for_score = transpose_for_score
+                if self.transpose_for_score:
+                    assert num_attention_heads is not None
+                    assert attention_head_size is not None
+                    self.num_attention_heads = num_attention_heads
+                    self.attention_head_size = attention_head_size
+
+            def transpose_for_scores(self, x: torch.Tensor) -> torch.Tensor:
+                new_x_shape = x.size()[:-1] + (
+                    self.num_attention_heads,
+                    self.attention_head_size,
+                )
+                x = x.view(new_x_shape)
+                return x.permute(0, 2, 1, 3)
+
+            def forward(self, x):
+                q = self.q_proj(x)
+                k = self.k_proj(x)
+                v = self.v_proj(x)
+                if self.transpose_for_score:
+                    q = self.transpose_for_scores(q)
+                    k = self.transpose_for_scores(k)
+                    v = self.transpose_for_scores(v)
+                scores = torch.matmul(q, k.transpose(-1, -2)) / (self.input_dim**0.5)
+                attention = self.softmax(scores)
+                weighted = torch.matmul(attention, v)
+                return weighted
+
+        for annotate_matmul in [False, True]:
+            mod = SelfAttnLikeModule(
+                input_dim=64 * 16,
+                transpose_for_score=True,
+                num_attention_heads=16,
+                attention_head_size=64,
+            ).eval()
+            v = torch.randn(2, 384, 1024)
+
+            def matcher_check_fn():
+                self.assertEqual(
+                    counters["inductor"]["qlinear_weight_prepack_matcher_count"], 3
+                )
+                self.assertEqual(
+                    counters["inductor"]["qlinear_unary_matcher_count"],
+                    3 if annotate_matmul and not TEST_ACL else 0,
+                )
+
+            quantizer = X86InductorQuantizer()
+            quantizer.set_global(xiq.get_default_x86_inductor_quantization_config())
+            if annotate_matmul:
+                quantizer.set_function_type_qconfig(
+                    torch.matmul, quantizer.get_global_quantization_config()
+                )
+
+            self._test_common(
+                mod,
+                (v,),
+                matcher_check_fn,
+                check_quantization=True,
+                quantizer=quantizer,
+            )
+
+
+instantiate_parametrized_tests(TestPatternMatcher)
+if __name__ == "__main__":
+    if IS_LINUX and HAS_CPU and torch.backends.mkldnn.is_available():
+        # set weight_prepack = False to skip fusion passes in pytorch core
+        import torch._inductor.config
+
+        torch._inductor.config.cpp.weight_prepack = False
+        run_tests()
diff --git a/torchao/quantization/pt2e/inductor_passes/__init__.py b/torchao/quantization/pt2e/inductor_passes/__init__.py
new file mode 100644
index 0000000000..e69de29bb2
diff --git a/torchao/quantization/pt2e/inductor_passes/x86.py b/torchao/quantization/pt2e/inductor_passes/x86.py
new file mode 100644
index 0000000000..4ccb2a1f31
--- /dev/null
+++ b/torchao/quantization/pt2e/inductor_passes/x86.py
@@ -0,0 +1,2852 @@
+# mypy: allow-untyped-decorators
+# mypy: allow-untyped-defs
+import copy
+import functools
+import itertools
+from typing import Any
+
+import torch
+from torch._dynamo.utils import counters
+from torch._inductor.fx_passes.freezing_patterns import register_freezing_graph_pattern
+from torch._inductor.pattern_matcher import (
+    Arg,
+    CallFunction,
+    KeywordArg,
+    Match,
+    filter_nodes,
+)
+from torch.fx.experimental.symbolic_shapes import has_free_symbols
+from torch.fx.node import map_arg
+
+aten = torch.ops.aten
+prims = torch.ops.prims
+quantized_decomposed = torch.ops.quantized_decomposed
+quantized = torch.ops.quantized
+
+# Only for per tensor quant since permute may changes the channel idx
+_PER_TENSOR_QUANTIZE_OPS = [
+    quantized_decomposed.quantize_per_tensor.default,
+    quantized_decomposed.quantize_per_tensor.tensor,
+]
+
+_VIEW_OPS = [
+    aten.transpose.int,
+    aten.permute.default,
+    aten.view.default,
+]
+
+"""
+The quantization.py file primarily incorporates passes related to quantization fusion
+in inductor, includes:
+1. Dequant Promotion;
+2. Conv/GEMM weight prepack with oneDNN Library;
+3. Conv/GEMM quantization fusion with output quant node (if have);
+4. Other pointwise operators' quantization fusion like: qmaxpool2d, qcat and more;
+
+It also involves int8-mixed-fp32 and int8-mixed-bf16 quantization. The main difference
+of patterns for int8-mixed-bf16, comparing with int8-mixed-fp32, is
+1. There is to(dtype=torch.bfloat16) node at the inputs of activation and weight for Conv/GEMM.
+2. There is to(dtype=torch.float32) node at the outputs of Conv/GEMM before inputs to next quant node.
+Refer to: https://github.com/pytorch/pytorch/issues/111640 for detail design of int8-mixed-bf16
+quantization.
+"""
+
+
+def _get_pattern_output_dtype(match: Match):
+    """
+    Get the pattern's output dtype from node's meta
+    Assume only 1 output node in this matched pattern.
+    """
+    pattern_output_nodes = match.output_nodes()
+    assert len(pattern_output_nodes) == 1
+    output_node = pattern_output_nodes[0]
+    assert isinstance(output_node, torch.fx.Node)
+    output_dtype = output_node.meta["val"].dtype
+    assert output_dtype in [torch.int8, torch.uint8, torch.float32, torch.bfloat16]
+    return output_dtype
+
+
+def _may_generate_pattern_with_dtype_convert(
+    pattern, dtype=Arg(), with_dtype_convert=True, users=1
+):
+    if with_dtype_convert:
+        return CallFunction(
+            prims.convert_element_type.default,
+            pattern,
+            dtype,
+            _users=users,
+        )
+    else:
+        return pattern
+
+
+def _may_generate_pattern_with_reshape(pattern, reshape_size=Arg(), with_reshape=True):
+    if with_reshape:
+        return CallFunction(
+            torch.ops.aten.reshape.default,
+            pattern,
+            reshape_size,
+        )
+    else:
+        return pattern
+
+
+def _generate_linear_t_pattern(
+    _dequant_per_channel_pattern,
+    dtype,
+):
+    assert dtype in [torch.float32, torch.bfloat16]
+    t_pattern = CallFunction(
+        aten.permute.default,
+        _may_generate_pattern_with_dtype_convert(
+            _dequant_per_channel_pattern,
+            KeywordArg("autocast_wgt_dtype"),
+            dtype == torch.bfloat16,
+        ),
+        KeywordArg("permute_axes"),
+    )
+    return t_pattern
+
+
+def _unary_fusion_pattern(unary_fusion, call_fn, users, is_bf16):
+    # only insert to_dtype if is_bf16 is True
+    computation_call = _may_generate_pattern_with_dtype_convert(
+        call_fn, dtype=KeywordArg("to_float"), with_dtype_convert=is_bf16, users=users
+    )
+    return unary_fusion(computation_call)
+
+
+def get_dequantize_per_tensor_activation_pattern(is_tensor_overload=False):
+    dequantize_per_tensor_activation_pattern = CallFunction(
+        quantized_decomposed.dequantize_per_tensor.tensor
+        if is_tensor_overload
+        else quantized_decomposed.dequantize_per_tensor.default,
+        KeywordArg("x"),
+        KeywordArg("x_scale"),
+        KeywordArg("x_zp"),
+        KeywordArg("x_quant_min"),
+        KeywordArg("x_quant_max"),
+        KeywordArg("x_dq_dtype"),
+    )
+    return dequantize_per_tensor_activation_pattern
+
+
+dequantize_per_channel_weight_pattern = CallFunction(
+    quantized_decomposed.dequantize_per_channel.default,
+    KeywordArg("q_weight"),
+    KeywordArg("w_scale"),
+    KeywordArg("w_zp"),
+    KeywordArg("w_axis"),
+    KeywordArg("w_quant_min"),
+    KeywordArg("w_quant_max"),
+    KeywordArg("w_dtype"),
+)
+
+dequantize_per_channel_to_bf16_weight_pattern = (
+    _may_generate_pattern_with_dtype_convert(
+        dequantize_per_channel_weight_pattern,
+        KeywordArg("autocast_wgt_dtype"),
+    )
+)
+
+dequantize_per_channel_clone_weight_pattern = CallFunction(
+    aten.clone.default,
+    dequantize_per_channel_weight_pattern,
+    memory_format=KeywordArg("memory_format"),
+)
+
+dequantize_per_channel_to_bf16_clone_weight_pattern = CallFunction(
+    aten.clone.default,
+    dequantize_per_channel_to_bf16_weight_pattern,
+    memory_format=KeywordArg("memory_format"),
+)
+
+
+def get_qconv_pt2e_pattern(users=1):
+    return CallFunction(
+        torch.ops.onednn.qconv_pointwise.default,
+        KeywordArg("x"),
+        KeywordArg("x_scale"),
+        KeywordArg("x_zp"),
+        KeywordArg("packed_weight"),
+        KeywordArg("w_scale"),
+        KeywordArg("w_zp"),
+        KeywordArg("b"),
+        KeywordArg("stride"),
+        KeywordArg("padding"),
+        KeywordArg("dilation"),
+        KeywordArg("groups"),
+        KeywordArg("output_scale"),
+        KeywordArg("output_zero_point"),
+        KeywordArg("output_dtype"),
+        KeywordArg("postop_name"),
+        KeywordArg("postop_args"),
+        KeywordArg("postop_algorithm"),
+        _users=users,
+    )
+
+
+def get_qconv2d_binary_pt2e_pattern(users=1):
+    return CallFunction(
+        torch.ops.onednn.qconv2d_pointwise.binary,
+        KeywordArg("x"),
+        KeywordArg("x_scale"),
+        KeywordArg("x_zp"),
+        KeywordArg("packed_weight"),
+        KeywordArg("w_scale"),
+        KeywordArg("w_zp"),
+        KeywordArg("accum"),
+        KeywordArg("b"),
+        KeywordArg("stride"),
+        KeywordArg("padding"),
+        KeywordArg("dilation"),
+        KeywordArg("groups"),
+        KeywordArg("output_scale"),
+        KeywordArg("output_zero_point"),
+        KeywordArg("output_dtype"),
+        KeywordArg("accum_scale"),
+        KeywordArg("accum_zero_point"),
+        KeywordArg("binary_op_name"),
+        KeywordArg("alpha"),
+        KeywordArg("unary_op_name"),
+        KeywordArg("unary_op_args"),
+        KeywordArg("unary_op_algorithm"),
+        _users=users,
+    )
+
+
+def get_qlinear_pt2e_pattern(x_scale_zp_are_tensors, users=1):
+    qlinear_op = (
+        torch.ops.onednn.qlinear_pointwise.tensor
+        if x_scale_zp_are_tensors
+        else torch.ops.onednn.qlinear_pointwise.default
+    )
+    return CallFunction(
+        qlinear_op,
+        KeywordArg("x"),
+        KeywordArg("x_scale"),
+        KeywordArg("x_zp"),
+        KeywordArg("packed_weight"),
+        KeywordArg("w_scale"),
+        KeywordArg("w_zp"),
+        KeywordArg("b"),
+        KeywordArg("output_scale"),
+        KeywordArg("output_zero_point"),
+        KeywordArg("output_dtype"),
+        KeywordArg("postop_name"),
+        KeywordArg("postop_args"),
+        KeywordArg("postop_algorithm"),
+        _users=users,
+    )
+
+
+def get_qlinear_binary_pt2e_pattern(x_scale_zp_are_tensors, users=1):
+    qlinear_op = (
+        torch.ops.onednn.qlinear_pointwise.binary_tensor
+        if x_scale_zp_are_tensors
+        else torch.ops.onednn.qlinear_pointwise.binary
+    )
+    return CallFunction(
+        qlinear_op,
+        KeywordArg("x"),
+        KeywordArg("x_scale"),
+        KeywordArg("x_zp"),
+        KeywordArg("packed_weight"),
+        KeywordArg("w_scale"),
+        KeywordArg("w_zp"),
+        KeywordArg("x_2"),
+        KeywordArg("b"),
+        KeywordArg("output_scale"),
+        KeywordArg("output_zero_point"),
+        KeywordArg("output_dtype"),
+        KeywordArg("x2_scale"),
+        KeywordArg("x2_zp"),
+        KeywordArg("binary_op_name"),
+        KeywordArg("alpha"),
+        KeywordArg("unary_op_name"),
+        KeywordArg("unary_op_args"),
+        KeywordArg("unary_op_algorithm"),
+        _users=users,
+    )
+
+
+dequantize_accum_pattern = CallFunction(
+    quantized_decomposed.dequantize_per_tensor.default,
+    KeywordArg("accum"),
+    KeywordArg("accum_scale"),
+    KeywordArg("accum_zp"),
+    Arg(),
+    Arg(),
+    KeywordArg("accum_dq_dtype"),
+)
+
+
+def generate_pattern_with_binary(
+    binary_post_op,
+    computation_call,
+    extra_input_pattern,
+    dtype_convert=False,
+    swap_inputs=False,
+):
+    binary_pattern = (
+        CallFunction(
+            binary_post_op,
+            extra_input_pattern,
+            computation_call,
+        )
+        if swap_inputs
+        else CallFunction(
+            binary_post_op,
+            computation_call,
+            extra_input_pattern,
+        )
+    )
+    return _may_generate_pattern_with_dtype_convert(
+        binary_pattern,
+        KeywordArg("convert_dtype_after_inplace_add"),
+        dtype_convert,
+    )
+
+
+def generate_pattern_with_unary(computation_call, unary_post_op):
+    if unary_post_op is not None:
+        return CallFunction(
+            unary_post_op,
+            computation_call,
+        )
+    return computation_call
+
+
+def generate_pattern_with_output_quant(computation_call, with_dtype_convert=False):
+    quantized_op_output_pattern_pt2e = CallFunction(
+        quantized_decomposed.quantize_per_tensor.default,
+        _may_generate_pattern_with_dtype_convert(
+            computation_call,
+            Arg(),
+            with_dtype_convert,
+        ),
+        KeywordArg("o_inv_scale"),
+        KeywordArg("o_zp"),
+        KeywordArg("o_qmin"),
+        KeywordArg("o_qmax"),
+        KeywordArg("o_dtype"),
+    )
+    return quantized_op_output_pattern_pt2e
+
+
+def _check_node_kwarg_arg_value(check_node, kwarg_name, args_index, expected_value):
+    if kwarg_name in check_node.kwargs:
+        actual_value = check_node.kwargs[kwarg_name]
+        return actual_value == expected_value
+    else:
+        assert len(check_node.args) >= (args_index + 1)
+        actual_value = check_node.args[args_index]
+        return actual_value == expected_value
+
+
+def _is_valid_quantized_conv_optimization_pattern():
+    def fn(match):
+        output_dtype = _get_pattern_output_dtype(match)
+        if output_dtype in [torch.float32, torch.bfloat16]:
+            # Only keep matched pattern with same output_dtype
+            qconv_node_after_weight_prepack = filter_nodes(
+                match.nodes, torch.ops.onednn.qconv_pointwise
+            )[0]
+            return _check_node_kwarg_arg_value(
+                qconv_node_after_weight_prepack, "output_dtype", 13, output_dtype
+            )
+        return True
+
+    return fn
+
+
+def _is_valid_qconv_post_op_fusion_pattern(has_binary_post_op=False):
+    return (
+        _is_valid_qconv_binary_optimization_pattern()
+        if has_binary_post_op
+        else _is_valid_quantized_conv_optimization_pattern()
+    )
+
+
+def _is_valid_quantized_linear_optimization_pattern():
+    def fn(match):
+        output_dtype = _get_pattern_output_dtype(match)
+        if output_dtype in [torch.float32, torch.bfloat16]:
+            # Only keep matched pattern with same output_dtype
+            qlinear_node_after_weight_prepack = filter_nodes(
+                match.nodes, torch.ops.onednn.qlinear_pointwise
+            )[0]
+            return _check_node_kwarg_arg_value(
+                qlinear_node_after_weight_prepack, "output_dtype", 9, output_dtype
+            )
+        return True
+
+    return fn
+
+
+def _is_valid_qlinear_post_op_fusion_pattern(has_binary_post_op=False):
+    return (
+        _is_valid_qlinear_binary_optimization_pattern()
+        if has_binary_post_op
+        else _is_valid_quantized_linear_optimization_pattern()
+    )
+
+
+def _is_valid_qconv_binary_optimization_pattern():
+    return _is_valid_quantized_op_binary_optimization_pattern(
+        torch.ops.onednn.qconv_pointwise
+    )
+
+
+def _is_valid_qlinear_binary_optimization_pattern():
+    return _is_valid_quantized_op_binary_optimization_pattern(
+        torch.ops.onednn.qlinear_pointwise,
+        # we don't insert q-dq for extra input due to accuracy issues
+        extra_input_from_dequant=False,
+    )
+
+
+def _is_valid_quantized_op_binary_optimization_pattern(
+    qop, extra_input_from_dequant=True
+):
+    # Check if it's a valid Binary Pattern for qconv2d and qlinear:
+    # * qop_pointwise should only has one users
+    # * If extra_input_from_dequant is True, extra input of binary node should come from dequant pattern
+    # * the two inputs of binary node should have attribute "meta" and should be tensors
+    # * the two inputs of binary node should have the same shape
+    # * All users of the extra input in this pattern should be
+    #   ancestor nodes of the compute node, except for the binary node
+    #   connected to the compute node.
+    def fn(match):
+        output_dtype = _get_pattern_output_dtype(match)
+        compute_node = filter_nodes(match.nodes, qop)[0]
+        # qop_pointwise should only have one user
+        if len(compute_node.users) != 1:
+            return False
+        binary_node_inputs = next(iter(compute_node.users)).args
+        assert len(binary_node_inputs) == 2, "Expects binary node with 2 inputs"
+        if output_dtype in [torch.float32, torch.bfloat16]:
+            extra_input_of_binary_node = None
+            for arg in binary_node_inputs:
+                if arg != compute_node:
+                    extra_input_of_binary_node = arg
+                    break
+            assert extra_input_of_binary_node is not None
+            # Extra input of binary node comes from dequant pattern
+            if extra_input_from_dequant and (
+                (not isinstance(extra_input_of_binary_node, torch.fx.Node))
+                or (
+                    extra_input_of_binary_node.target
+                    != quantized_decomposed.dequantize_per_tensor.default
+                )
+            ):
+                return False
+
+        # the two inputs of binary node should have attribute "meta" and should be tensors
+        if not (
+            hasattr(binary_node_inputs[0], "meta")
+            and isinstance(binary_node_inputs[0].meta.get("val", None), torch.Tensor)  # type: ignore[union-attr]
+        ) or not (
+            hasattr(binary_node_inputs[1], "meta")
+            and isinstance(binary_node_inputs[1].meta.get("val", None), torch.Tensor)  # type: ignore[union-attr]
+        ):
+            return False
+        # the two inputs of binary node should have the same shape
+        if (
+            binary_node_inputs[0].meta["val"].size()  # type: ignore[union-attr]
+            != binary_node_inputs[1].meta["val"].size()  # type: ignore[union-attr]
+        ):
+            return False
+
+        # All users of the extra input in this pattern should be
+        # ancestor nodes of the compute node, except for the binary node
+        # connected to the compute node.
+
+        from torch._inductor.fx_passes.mkldnn_fusion import _get_remaining_users
+
+        extra_input_of_pattern = (
+            match.kwargs["other"]
+            if "other" in match.kwargs
+            else (
+                match.kwargs["accum"]
+                if (output_dtype in [torch.uint8, torch.int8])
+                or (not extra_input_from_dequant)
+                else match.kwargs["accum_after_dequant"]
+            )
+        )
+        if (
+            len(_get_remaining_users(extra_input_of_pattern, compute_node)) > 1
+            or extra_input_of_pattern == compute_node.args[0]
+        ):
+            return False
+        return True
+
+    return fn
+
+
+def _is_valid_dequant_promotion_pattern(dtype=torch.float32):
+    def _inner(match):
+        assert dtype in [torch.float32, torch.bfloat16]
+        dequant_pattern_end_node = match.output_node()
+        if dequant_pattern_end_node.target not in [
+            quantized_decomposed.dequantize_per_tensor.default,
+            quantized_decomposed.dequantize_per_tensor.tensor,
+            prims.convert_element_type.default,
+            aten.reshape.default,
+        ]:
+            return False
+
+        if dequant_pattern_end_node.target is aten.reshape.default:
+            dequant_node = (
+                dequant_pattern_end_node.args[
+                    0
+                ]  # pattern: linear <- reshape <- dequant
+                if dtype == torch.float32
+                else dequant_pattern_end_node.args[0].args[
+                    0
+                ]  # pattern: linear <- reshape <- to_bf16 <- dequant
+            )
+        else:
+            dequant_node = (
+                dequant_pattern_end_node  # pattern: linear <- dequant
+                if dtype == torch.float32
+                else dequant_pattern_end_node.args[
+                    0
+                ]  # pattern: linear <- to_bf16 <- dequant
+            )
+
+        if (
+            dequant_node.target
+            in [
+                quantized_decomposed.dequantize_per_tensor.default,
+                quantized_decomposed.dequantize_per_tensor.tensor,
+            ]
+            and len(list(dequant_pattern_end_node.users)) > 1
+        ):
+            # If dequant pattern has more than 1 users, then do dequant promoted
+            return True
+        return False
+
+    return _inner
+
+
+def _register_dequant_promotion_pass(pattern, pass_number, dtype=torch.float32):
+    @register_freezing_graph_pattern(
+        pattern,
+        extra_check=_is_valid_dequant_promotion_pattern(dtype),
+        pass_number=pass_number,
+    )
+    def dequant_promotion(match: Match, *args, **kwargs):
+        # Dequant_promotion will transform
+        # graph 1:
+        #            quant
+        #      + - - - | - - - +
+        #      |    dequant    |
+        #      |    /     \    |
+        #      |  node1  node2 |
+        #      + - | - - - | - +
+        #        quant   quant
+        # into:
+        # graph 2:
+        #            quant
+        #      + - - / - \ - - +
+        #      |dequant dequant|
+        #      |    |      |   |
+        #      | node1 node2   |
+        #      + - | - - - | - +
+        #        quant   quant
+        # In graph 1, the dequant node is shared by node1 and node2,
+        # as a result, neither node1 nor node2 could form an int8
+        # fusion pattern.
+        # After this transformation, the graph 2 could hit the int8
+        # fusion pattern: dequant-node-quant, respectively for
+        # node1 and node2.
+        assert dtype in [torch.float32, torch.bfloat16]
+
+        def clone_to_new_node(graph, source_node, user_node):
+            # Clone the source_node to a new node
+            # Replace user_node's input from source_node to new_node
+            assert source_node.op == "call_function", (
+                "clone_to_new_node only support node.op call_function"
+            )
+            with graph.inserting_before(user_node):
+                new_node = graph.call_function(
+                    source_node.target,
+                    args=source_node.args,
+                    kwargs=source_node.kwargs,
+                )
+                new_node.meta = copy.copy(source_node.meta)
+                user_node.replace_input_with(source_node, new_node)
+            return new_node
+
+        # Find the start node and end node of a dequant pattern
+        # * End node should be the match.output_node()
+        # * Start node should be the node of dequantize_per_tensor
+        dequant_pattern_end_node = match.output_node()
+        assert dequant_pattern_end_node.target in [
+            quantized_decomposed.dequantize_per_tensor.default,
+            quantized_decomposed.dequantize_per_tensor.tensor,
+            prims.convert_element_type.default,
+            aten.reshape.default,
+        ]
+
+        # For a dequant pattern, we should expect see the node list as:
+        # * OPT(aten.reshape.default)
+        # * OPT(prims.convert_element_type.default) (to_bf16)
+        # * dequantize_per_tensor
+        def _find_first_node_in_dequant_pattern(_node):
+            if _node.target in [
+                quantized_decomposed.dequantize_per_tensor.default,
+                quantized_decomposed.dequantize_per_tensor.tensor,
+            ]:
+                # For a dequant pattern, we expect the start node is a dequantize_per_tensor node
+                return _node
+            else:
+                assert len(_node.args) >= 1, (
+                    "In in dequant pattern, each node should have more than 1 arg."
+                )
+                return _find_first_node_in_dequant_pattern(_node.args[0])
+
+        dequant_pattern_start_node = _find_first_node_in_dequant_pattern(
+            dequant_pattern_end_node
+        )
+
+        assert dequant_pattern_start_node.target in [
+            quantized_decomposed.dequantize_per_tensor.default,
+            quantized_decomposed.dequantize_per_tensor.tensor,
+        ]
+
+        # Clone the dequant pattern for each user node
+        graph = match.graph
+        user_node_list = list(dequant_pattern_end_node.users)
+        for user_node in user_node_list[1:]:
+            _source_node = dequant_pattern_end_node
+            _user_node = user_node
+            while _source_node != dequant_pattern_start_node.args[0]:
+                _user_node = clone_to_new_node(graph, _source_node, _user_node)
+                _source_node = _source_node.args[0]  # type: ignore[assignment]
+
+        counters["inductor"]["dequant_promotion_matcher_count"] += 1
+        counters["inductor"]["dequant_promotion_matcher_nodes"] += len(match.nodes)
+
+
+def _is_valid_dequant_conv_pattern(dtype):
+    def _inner(match):
+        # Here we do some further check to ensure:
+        # 1. It's a conv2d node with dim of 4, since we only support lowering of conv2d now.
+        # 2. The dequant pattern has only 1 user of conv2d node.
+        # If these conditions don't meet, we will not
+        # insert weight prepack node into the matched pattern.
+        conv_node = match.output_node()
+        assert conv_node.target is aten.convolution.default
+        input_meta_value = conv_node.args[0].meta.get("val")
+        weight_meta_value = conv_node.args[1].meta.get("val")
+        for meta_value in [input_meta_value, weight_meta_value]:
+            if (
+                meta_value is None
+                or (meta_value.device.type != "cpu" and meta_value.device.type != "xpu")
+                or meta_value.dim() not in [3, 4]
+            ):
+                # Only support conv1d/2d now
+                return False
+
+        assert dtype in [torch.float32, torch.bfloat16]
+
+        if dtype == torch.float32:
+            dequant_node = conv_node.args[0]
+        else:
+            convert_to_bf16 = conv_node.args[0]
+            dequant_node = convert_to_bf16.args[0]
+
+        if len(list(dequant_node.users)) != 1:
+            # Ensure the dequant pattern only has 1 user
+            # since we will delete the dequant pattern here
+            return False
+        return True
+
+    return _inner
+
+
+def _register_qconv_weight_prepack_pass(pattern, pass_number, dtype=torch.float32):
+    @register_freezing_graph_pattern(
+        pattern,
+        extra_check=_is_valid_dequant_conv_pattern(dtype),
+        pass_number=pass_number,
+    )
+    def qconv_weight_prepack(match: Match, *args, **kwargs):
+        """
+        Match the pattern:
+        int8 activation
+          |
+        dequant_per_tensor
+          |
+        Conv2d <- optional(aten.clone.default) <- dequant_per_channel <- int8_weight
+
+        Insert weight prepack node and change the pattern to:
+        int8 activation
+          |
+        onednn.qconv_pointwise <- onednn.qconv_prepack <- int8_weight
+        """
+        assert dtype in [torch.float32, torch.bfloat16]
+        conv_node = match.output_node()
+        assert conv_node.target is aten.convolution.default
+        if dtype == torch.float32:
+            dequant_node = conv_node.args[0]
+        else:
+            convert_to_bf16 = conv_node.args[0]
+            dequant_node = convert_to_bf16.args[0]  # type: ignore[union-attr]
+        has_clone_to_channel_last_node_in_pattern = (
+            conv_node.args[1].target is aten.clone.default  # type: ignore[union-attr]
+        )
+        clone_node = (
+            conv_node.args[1] if has_clone_to_channel_last_node_in_pattern else None
+        )
+
+        if dtype == torch.float32:
+            dequant_per_channel = (
+                clone_node.args[0]  # type: ignore[union-attr]
+                if has_clone_to_channel_last_node_in_pattern
+                else conv_node.args[1]
+            )
+        else:
+            weight_to_bf16_node = (
+                clone_node.args[0]  # type: ignore[union-attr]
+                if has_clone_to_channel_last_node_in_pattern
+                else conv_node.args[1]
+            )
+            dequant_per_channel = weight_to_bf16_node.args[0]  # type: ignore[union-attr]
+
+        assert (
+            dequant_per_channel.target  # type: ignore[union-attr]
+            is quantized_decomposed.dequantize_per_channel.default
+        )
+
+        # Activation QParams
+        qx, x_zp, x_scale = (
+            kwargs["x"],
+            kwargs["x_zp"],
+            kwargs["x_scale"],
+        )
+
+        # Weight QParams
+        qw, w_scale, w_zp = (
+            kwargs["q_weight"],
+            kwargs["w_scale"],
+            kwargs["w_zp"],
+        )
+
+        # Conv Params
+        bias, stride, padding, dilation, groups = (
+            kwargs["b"],
+            kwargs["stride"],
+            kwargs["padding"],
+            kwargs["dilation"],
+            kwargs["groups"],
+        )
+
+        x_shape = qx.meta.get("tensor_meta").shape
+        if has_free_symbols(x_shape):
+            # For dynamic shape case, we can't get activation shape ahead of runtime.
+            x_shape = None
+        graph = match.graph
+        with graph.inserting_before(conv_node):
+            # Insert weight prepack node and the QConv node
+            packed_weight_inputs = (
+                qw,
+                w_scale,
+                x_scale,
+                x_zp,
+                stride,
+                padding,
+                dilation,
+                groups,
+                x_shape,
+            )
+            packed_weight_op = torch.ops.onednn.qconv_prepack
+            prepack_weight_node = graph.call_function(
+                packed_weight_op, args=packed_weight_inputs
+            )
+
+            new_args: tuple[Any, ...] = (
+                qx,
+                x_scale,
+                x_zp,
+                prepack_weight_node,
+                w_scale,
+                w_zp,
+                bias,
+                stride,
+                padding,
+                dilation,
+                groups,
+                1.0,  # output_scale
+                0,  # output_zero_point
+                dtype,  # output_dtype
+                "none",  # attr
+                [],  # scalars
+                "",  # algorithm
+            )
+            new_conv_node = graph.call_function(
+                torch.ops.onednn.qconv_pointwise.default, args=new_args
+            )
+            conv_node.replace_all_uses_with(new_conv_node)
+            new_conv_node.meta.update(conv_node.meta)
+
+            # Erase the original conv node
+            graph.erase_node(conv_node)
+            # Erase the dequant pattern
+            if dtype == torch.bfloat16:
+                graph.erase_node(convert_to_bf16)  # type: ignore[possibly-undefined, arg-type]
+            graph.erase_node(dequant_node)  # type: ignore[arg-type]
+            # Erase the dequant per channel pattern
+            if clone_node is not None:
+                graph.erase_node(clone_node)  # type: ignore[arg-type]
+            if dtype == torch.bfloat16:
+                graph.erase_node(weight_to_bf16_node)  # type: ignore[possibly-undefined, arg-type]
+            graph.erase_node(dequant_per_channel)  # type: ignore[arg-type]
+            counters["inductor"]["qconv_weight_prepack_matcher_count"] += 1
+            counters["inductor"]["qconv_weight_prepack_matcher_nodes"] += len(
+                match.nodes
+            )
+
+
+def _generate_dequant_convolution_node_pattern(
+    _dequant_per_channel_pattern, dtype=torch.float32
+):
+    assert dtype in [torch.float32, torch.bfloat16]
+    dequant_convolution_node_pattern = CallFunction(
+        aten.convolution.default,
+        _may_generate_pattern_with_dtype_convert(
+            get_dequantize_per_tensor_activation_pattern(),
+            KeywordArg("autocast_act_dtype"),
+            dtype == torch.bfloat16,
+        ),
+        _dequant_per_channel_pattern,
+        KeywordArg("b"),
+        KeywordArg("stride"),
+        KeywordArg("padding"),
+        KeywordArg("dilation"),
+        KeywordArg("is_transposed"),
+        KeywordArg("out_padding"),
+        KeywordArg("groups"),
+    )
+    return dequant_convolution_node_pattern
+
+
+def _generate_qconv_weight_prepack_patterns(dtype=torch.float32):
+    assert dtype in [torch.float32, torch.bfloat16]
+    return (
+        _generate_dequant_convolution_node_pattern(
+            dequantize_per_channel_weight_pattern
+            if dtype == torch.float32
+            else dequantize_per_channel_to_bf16_weight_pattern,
+            dtype,
+        ),
+        # There is another pattern due to the pass of convert_conv_weights_to_channels_last
+        # https://github.com/pytorch/pytorch/blob/07107919297db3f8ab37f11c12666b6d6d5f692e/torch/_inductor/freezing.py#L338-L362.
+        # Depend on some heuristics, it may or may not insert to(channel_last) node
+        # between convolution and dequant_per_channel node
+        _generate_dequant_convolution_node_pattern(
+            dequantize_per_channel_clone_weight_pattern
+            if dtype == torch.float32
+            else dequantize_per_channel_to_bf16_clone_weight_pattern,
+            dtype,
+        ),
+    )
+
+
+def _get_linear_node(match, input_dim_exceeds_two, input_contiguous):
+    output_reshape_node = None
+    if input_dim_exceeds_two:
+        if input_contiguous:
+            output_reshape_node = match.output_node()
+            assert output_reshape_node.target is aten.reshape.default
+            linear_node = output_reshape_node.args[0]
+        else:
+            linear_nodes = filter_nodes(match.nodes, aten.bmm.default)
+            assert len(linear_nodes) == 1
+            linear_node = linear_nodes[0]
+    else:
+        linear_node = match.output_node()
+
+    assert linear_node.target in (
+        aten.addmm.default,
+        aten.mm.default,
+        aten.bmm.default,
+    )
+    return linear_node, output_reshape_node
+
+
+def _get_linear_dq_node(
+    linear_node, input_index, dtype, input_dim_exceeds_two, input_contiguous
+):
+    act_reshape_node = None
+    activation_to_bf16_node = None
+    act_expand_node = None
+    if input_dim_exceeds_two:
+        if input_contiguous:
+            act_reshape_node = linear_node.args[input_index]
+            assert act_reshape_node.target is aten.reshape.default
+            if dtype == torch.float32:
+                # pattern: linear -> reshape -> dequant
+                dequant_node = act_reshape_node.args[0]
+            else:
+                # pattern: linear -> reshape -> to_bf16 -> dequant
+                activation_to_bf16_node = act_reshape_node.args[0]
+                dequant_node = activation_to_bf16_node.args[0]
+        else:
+            # bmm pattern decomposed from linear when input dim exceeds 2 and not contiguous
+            act_expand_node = linear_node.args[input_index]
+            assert act_expand_node.target is aten.expand.default
+            if dtype == torch.float32:
+                dequant_node = act_expand_node.args[0]
+            else:
+                activation_to_bf16_node = act_expand_node.args[0]
+                dequant_node = activation_to_bf16_node.args[0]
+    else:
+        if dtype == torch.float32:
+            # pattern: linear -> dequant
+            dequant_node = linear_node.args[input_index]
+        else:
+            # pattern: linear -> to_bf16 -> dequant
+            activation_to_bf16_node = linear_node.args[input_index]
+            dequant_node = activation_to_bf16_node.args[0]
+    return dequant_node, act_reshape_node, activation_to_bf16_node, act_expand_node
+
+
+def _is_valid_dequant_linear_pattern(dtype, input_dim_exceeds_two, input_contiguous):
+    def _inner(match):
+        # Check dequant pattern has only 1 user.
+        (
+            linear_node,
+            _,
+        ) = _get_linear_node(match, input_dim_exceeds_two, input_contiguous)
+
+        input_index = 1 if linear_node.target is aten.addmm.default else 0
+        assert dtype in [torch.float32, torch.bfloat16]
+        (
+            dequant_node,
+            _,
+            _,
+            _,
+        ) = _get_linear_dq_node(
+            linear_node, input_index, dtype, input_dim_exceeds_two, input_contiguous
+        )
+
+        assert dequant_node.target in [
+            quantized_decomposed.dequantize_per_tensor.default,
+            quantized_decomposed.dequantize_per_tensor.tensor,
+        ]
+
+        if len(list(dequant_node.users)) != 1:
+            # Ensure the dequant pattern only has 1 user
+            # since we will delete the dequant pattern here
+            return False
+
+        # Extra check for bmm pattern
+        if input_dim_exceeds_two and not input_contiguous:
+            # Check for act
+            # Act expand size should be exactly same as act size
+            act_expand_size = match.kwargs["act_expand_size"]
+            act_node = match.kwargs["x"]
+            if not (
+                hasattr(act_node, "meta")
+                and isinstance(act_node.meta.get("val", None), torch.Tensor)
+                and (act_node.meta["val"].size() == torch.Size(act_expand_size))
+            ):
+                return False
+
+            # Check for wgt
+            # wgt permute dims should be [1, 0]
+            wgt_permute_dims = match.kwargs["permute_axes"]
+            if wgt_permute_dims != [1, 0]:
+                return False
+
+            # Check below wgt size items:
+            # wgt before expand should with dim 2
+            # Expand size should with dim 3
+            # Expand size[0] should same as act size[0]
+            # Expand size[1] should same as wgt size[1]
+            # Expand size[2] should same as wgt size[0]
+            qweight_node = match.kwargs["q_weight"]
+            wgt_expand_size = match.kwargs["wgt_expand_size"]
+            if not (
+                hasattr(qweight_node, "meta")
+                and isinstance(qweight_node.meta.get("val", None), torch.Tensor)
+                and len(qweight_node.meta["val"].size()) == 2
+                and len(wgt_expand_size) == 3
+                and wgt_expand_size[0] == act_node.meta["val"].size()[0]
+                and wgt_expand_size[1] == qweight_node.meta["val"].size()[1]
+                and wgt_expand_size[2] == qweight_node.meta["val"].size()[0]
+            ):
+                return False
+
+        return True
+
+    return _inner
+
+
+def _register_qlinear_weight_prepack_pass(
+    pattern,
+    pass_number,
+    dtype=torch.float32,
+    input_dim_exceeds_two=False,
+    input_contiguous=True,
+):
+    @register_freezing_graph_pattern(
+        pattern,
+        extra_check=_is_valid_dequant_linear_pattern(
+            dtype, input_dim_exceeds_two, input_contiguous
+        ),
+        pass_number=pass_number,
+    )
+    def qlinear_weight_prepack(match: Match, *args, **kwargs):
+        """
+        Match the pattern:
+        int8 activation
+          |
+        dequant_per_tensor
+          |
+        mm/addmm <- t <- dequant_per_channel <- int8_weight
+
+        Insert weight prepack node and change the pattern to:
+        int8 activation
+          |
+        onednn.qlinear_pointwise <- onednn.qlinear_prepack <- int8_weight
+        """
+        assert dtype in [torch.float32, torch.bfloat16]
+        (
+            linear_node,
+            output_reshape_node,
+        ) = _get_linear_node(match, input_dim_exceeds_two, input_contiguous)
+        input_index = 1 if linear_node.target is aten.addmm.default else 0
+        weight_index = input_index + 1
+
+        (
+            dequant_node,
+            act_reshape_node,
+            activation_to_bf16_node,
+            act_expand_node,
+        ) = _get_linear_dq_node(
+            linear_node, input_index, dtype, input_dim_exceeds_two, input_contiguous
+        )
+
+        if input_dim_exceeds_two and not input_contiguous:
+            wgt_expand_node = linear_node.args[weight_index]
+            assert wgt_expand_node.target is aten.expand.default
+            t_node = wgt_expand_node.args[0]
+        else:
+            t_node = linear_node.args[weight_index]
+
+        if dtype == torch.float32:
+            dequant_per_channel = t_node.args[0]
+        else:
+            weight_to_bf16_node = t_node.args[0]
+            dequant_per_channel = weight_to_bf16_node.args[0]
+        assert (
+            dequant_per_channel.target
+            is quantized_decomposed.dequantize_per_channel.default
+        )
+
+        # Activation QParams
+        qx, x_zp, x_scale = (
+            kwargs["x"],
+            kwargs["x_zp"],
+            kwargs["x_scale"],
+        )
+
+        # Weight QParams
+        qw, w_scale, w_zp = (
+            kwargs["q_weight"],
+            kwargs["w_scale"],
+            kwargs["w_zp"],
+        )
+
+        # Params
+        bias = kwargs["b"] if "b" in kwargs else None
+
+        x_shape = qx.meta.get("tensor_meta").shape
+        if has_free_symbols(x_shape):
+            # For dynamic shape case, we can't get activation shape ahead of runtime.
+            x_shape = None
+        graph = match.graph
+        with graph.inserting_before(linear_node):
+            # Insert weight prepack node and the qlinear node
+            packed_weight_inputs = (
+                qw,
+                x_shape,
+            )
+            packed_weight_op = torch.ops.onednn.qlinear_prepack
+            prepack_weight_node = graph.call_function(
+                packed_weight_op, args=packed_weight_inputs
+            )
+
+            new_args: tuple[Any, ...] = (
+                qx,
+                x_scale,
+                x_zp,
+                prepack_weight_node,
+                w_scale,
+                w_zp,
+                bias,
+                1.0,  # output_scale
+                0,  # output_zero_point
+                dtype,  # output_dtype
+                "none",  # post op name
+                [],  # post op args
+                "",  # post op algorithm
+            )
+            Node = torch.fx.node.Node
+            if isinstance(x_scale, Node) and isinstance(x_zp, Node):
+                new_linear_node = graph.call_function(
+                    torch.ops.onednn.qlinear_pointwise.tensor, args=new_args
+                )
+            else:
+                new_linear_node = graph.call_function(
+                    torch.ops.onednn.qlinear_pointwise.default, args=new_args
+                )
+            if input_dim_exceeds_two:
+                if input_contiguous:
+                    output_reshape_node.replace_all_uses_with(new_linear_node)
+                    new_linear_node.meta.update(output_reshape_node.meta)
+                else:
+                    if bias:
+                        output_add_node_for_bias = match.output_node()
+                        assert output_add_node_for_bias.target is aten.add.Tensor
+                        output_add_node_for_bias.replace_all_uses_with(new_linear_node)
+                        new_linear_node.meta.update(output_add_node_for_bias.meta)
+                    else:
+                        linear_node.replace_all_uses_with(new_linear_node)
+                        new_linear_node.meta.update(linear_node.meta)
+            else:
+                linear_node.replace_all_uses_with(new_linear_node)
+                new_linear_node.meta.update(linear_node.meta)
+
+            # Erase the original linear node
+            if input_dim_exceeds_two:
+                if input_contiguous:
+                    graph.erase_node(output_reshape_node)
+                elif not input_contiguous and bias:
+                    graph.erase_node(output_add_node_for_bias)  # type: ignore[possibly-undefined]
+            graph.erase_node(linear_node)
+            if input_dim_exceeds_two:
+                if input_contiguous:
+                    graph.erase_node(act_reshape_node)
+                else:
+                    graph.erase_node(act_expand_node)
+                    graph.erase_node(wgt_expand_node)  # type: ignore[possibly-undefined]
+            if dtype == torch.bfloat16:
+                graph.erase_node(activation_to_bf16_node)
+            # Erase the dequant pattern
+            graph.erase_node(dequant_node)
+            # Erase the dequant per channel pattern
+            graph.erase_node(t_node)
+            if dtype == torch.bfloat16:
+                graph.erase_node(weight_to_bf16_node)  # type: ignore[possibly-undefined]
+            graph.erase_node(dequant_per_channel)
+
+            counters["inductor"]["qlinear_weight_prepack_matcher_count"] += 1
+            counters["inductor"]["qlinear_weight_prepack_matcher_nodes"] += len(
+                match.nodes
+            )
+
+
+def _generate_dequant_linear_node_pattern(
+    _dequant_per_channel_pattern,
+    dtype=torch.float32,
+    input_dim_exceeds_two=False,
+    is_tensor_overload=False,
+):
+    assert dtype in [torch.float32, torch.bfloat16]
+    t_pattern = _generate_linear_t_pattern(_dequant_per_channel_pattern, dtype)
+    dequant_linear_bias_pattern = _may_generate_pattern_with_reshape(
+        CallFunction(
+            aten.addmm.default,
+            KeywordArg("b"),
+            _may_generate_pattern_with_reshape(
+                _may_generate_pattern_with_dtype_convert(
+                    get_dequantize_per_tensor_activation_pattern(is_tensor_overload),
+                    KeywordArg("autocast_act_dtype"),
+                    dtype == torch.bfloat16,
+                ),
+                KeywordArg("act_reshape_size"),
+                input_dim_exceeds_two,
+            ),
+            t_pattern,
+        ),
+        KeywordArg("output_reshape_size"),
+        input_dim_exceeds_two,
+    )
+    dequant_linear_no_bias_pattern = _may_generate_pattern_with_reshape(
+        CallFunction(
+            aten.mm.default,
+            _may_generate_pattern_with_reshape(
+                _may_generate_pattern_with_dtype_convert(
+                    get_dequantize_per_tensor_activation_pattern(is_tensor_overload),
+                    KeywordArg("autocast_act_dtype"),
+                    dtype == torch.bfloat16,
+                ),
+                KeywordArg("act_reshape_size"),
+                input_dim_exceeds_two,
+            ),
+            t_pattern,
+        ),
+        KeywordArg("output_reshape_size"),
+        input_dim_exceeds_two,
+    )
+    return dequant_linear_bias_pattern, dequant_linear_no_bias_pattern
+
+
+def _generate_dequant_bmm_node_pattern(
+    _dequant_per_channel_pattern,
+    dtype=torch.float32,
+    with_bias=False,
+    is_tensor_overload=False,
+):
+    # When activation of linear dim exceed 2 and not contiguous
+    t_pattern = _generate_linear_t_pattern(_dequant_per_channel_pattern, dtype)
+
+    assert dtype in [torch.float32, torch.bfloat16]
+    dequant_bmm_pattern = CallFunction(
+        aten.bmm.default,
+        CallFunction(
+            aten.expand.default,
+            _may_generate_pattern_with_dtype_convert(
+                get_dequantize_per_tensor_activation_pattern(is_tensor_overload),
+                KeywordArg("autocast_act_dtype"),
+                dtype == torch.bfloat16,
+            ),
+            KeywordArg("act_expand_size"),
+        ),
+        CallFunction(
+            aten.expand.default,
+            t_pattern,
+            KeywordArg("wgt_expand_size"),
+        ),
+    )
+
+    def _generate_pattern_with_output_add(_dequant_bmm_pattern, _with_bias):
+        if _with_bias:
+            return CallFunction(
+                aten.add.Tensor,
+                _dequant_bmm_pattern,
+                KeywordArg("b"),
+            )
+        else:
+            return _dequant_bmm_pattern
+
+    return _generate_pattern_with_output_add(dequant_bmm_pattern, with_bias)
+
+
+def _generate_qlinear_weight_prepack_patterns(
+    dtype=torch.float32,
+    input_dim_exceeds_two=False,
+    input_contiguous=True,
+    with_bias=False,
+    is_tensor_overload=False,
+):
+    if input_dim_exceeds_two and not input_contiguous:
+        return _generate_dequant_bmm_node_pattern(
+            dequantize_per_channel_weight_pattern,
+            dtype,
+            with_bias,
+            is_tensor_overload,
+        )
+    else:
+        return _generate_dequant_linear_node_pattern(
+            dequantize_per_channel_weight_pattern,
+            dtype,
+            input_dim_exceeds_two,
+            is_tensor_overload,
+        )
+
+
+def _generate_linear_dynamic_fp16_pattern(
+    _dequant_weight_pattern,
+    input_dim_exceeds_two=False,
+    input_contiguous=True,
+    relu_fused=False,
+):
+    dtype = torch.float32
+    t_pattern = _generate_linear_t_pattern(_dequant_weight_pattern, dtype)
+
+    if input_dim_exceeds_two and not input_contiguous:
+        # pattern is
+        #                   x -> expand -> bmm (-> add) (-> relu)
+        # w -> dequant -> permute -> expand /
+        pattern_no_bias = CallFunction(
+            aten.bmm.default,
+            CallFunction(
+                aten.expand.default,
+                KeywordArg("x"),
+                KeywordArg("act_expand_size"),
+            ),
+            CallFunction(
+                aten.expand.default,
+                t_pattern,
+                KeywordArg("wgt_expand_size"),
+            ),
+        )
+        pattern_with_bias = CallFunction(
+            aten.add.Tensor,
+            pattern_no_bias,
+            KeywordArg("b"),
+        )
+        if relu_fused:
+            pattern_with_bias = CallFunction(aten.relu.default, pattern_with_bias)
+            pattern_no_bias = CallFunction(aten.relu.default, pattern_no_bias)
+        return pattern_with_bias, pattern_no_bias
+
+    x_pattern_with_reshape = _may_generate_pattern_with_reshape(
+        KeywordArg("x"),
+        KeywordArg("act_reshape_size"),
+        input_dim_exceeds_two,
+    )
+    dequant_linear_bias_pattern = generate_pattern_with_unary(
+        _may_generate_pattern_with_reshape(
+            CallFunction(
+                aten.addmm.default,
+                KeywordArg("b"),
+                x_pattern_with_reshape,
+                t_pattern,
+            ),
+            KeywordArg("output_reshape_size"),
+            input_dim_exceeds_two,
+        ),
+        aten.relu.default if relu_fused else None,
+    )
+    dequant_linear_no_bias_pattern = generate_pattern_with_unary(
+        _may_generate_pattern_with_reshape(
+            CallFunction(
+                aten.mm.default,
+                x_pattern_with_reshape,
+                t_pattern,
+            ),
+            KeywordArg("output_reshape_size"),
+            input_dim_exceeds_two,
+        ),
+        aten.relu.default if relu_fused else None,
+    )
+    return dequant_linear_bias_pattern, dequant_linear_no_bias_pattern
+
+
+def _register_dequant_promotion():
+    dequant_pattern_cases = itertools.product(
+        [torch.float32, torch.bfloat16], [True, False], [True, False]
+    )
+    for dtype, input_dim_exceeds_two, is_tensor_overload in dequant_pattern_cases:
+        # 4 dequantization patterns will be matched based on the dtype and input dimension size.
+        # Case 1: int8-mixed-fp32, input dim size is 2
+        # Case 2: int8-mixed-fp32, input dim size exceeds 2
+        # Case 3: int8-mixed-bf16, input dim size is 2
+        # Case 4: int8-mixed-bf16, input dim size exceeds 2
+        #           quant
+        #   + - - - - | - - - - +
+        #   |      dequant      |
+        #   |         |         |
+        #   |    OPT(to_bf16)   |
+        #   |         |         |
+        #   |    OPT(reshape)   |
+        #   |      /     \      |
+        #   |    node1  node2   |
+        #   + - - | - - - | - - +
+        #  OPT(reshape) OPT(reshape)
+        #   + - - | - - - | - - +
+        #  OPT(to_fp32) OPT(to_fp32)
+        #   + - - | - - - | - - +
+        #       quant   quant
+        _register_dequant_promotion_pass(
+            _may_generate_pattern_with_reshape(
+                _may_generate_pattern_with_dtype_convert(
+                    get_dequantize_per_tensor_activation_pattern(
+                        is_tensor_overload=is_tensor_overload
+                    ),
+                    KeywordArg("autocast_act_dtype"),
+                    dtype == torch.bfloat16,
+                ),
+                KeywordArg("act_reshape_size"),
+                with_reshape=input_dim_exceeds_two,
+            ),
+            pass_number=0,
+            dtype=dtype,
+        )  # pass_number=0 to run before weight prepack
+
+
+def _register_qconv_weight_prepack():
+    for dtype in [torch.float32, torch.bfloat16]:
+        weight_prepack_patterns = _generate_qconv_weight_prepack_patterns(dtype)
+        for weight_prepack_pattern in weight_prepack_patterns:
+            # Register to pass_number 1, so we can do dequant promotion in pass_number 0.
+            _register_qconv_weight_prepack_pass(
+                weight_prepack_pattern, pass_number=1, dtype=dtype
+            )
+
+
+def _register_qlinear_weight_prepack():
+    # 6 Linear related patterns will be matched based on the dtype, input dimension size and input contiguous.
+    # Then convert the pattern into a QLinear node with int8_fp32/bf16.
+    # Case 1: int8-mixed-fp32, input dim size is 2
+    # Case 2: int8-mixed-fp32, input dim size exceeds 2 and contiguous
+    # Case 3: int8-mixed-bf16, input dim size is 2
+    # Case 4: int8-mixed-bf16, input dim size exceeds 2 and contiguous
+
+    #   + - - - - | - - - - - - | - - - - - +
+    #   |    dq_per_tensor  dq_per_channel  |
+    #   |         |              |          |
+    #   |    OPT(to_bf16)    OPT(to_bf16)   |
+    #   |         |              |          |
+    #   |     OPT(reshape)   permute        |
+    #   |            \        /             |
+    #   |             addmm/mm              |
+    #   |                |                  |
+    #   |           OPT(reshape)            |
+
+    # Case 5: int8-mixed-fp32, input dim size exceeds 2 and not contiguous
+    # Case 6: int8-mixed-bf16, input dim size exceeds 2 and not contiguous
+
+    #   + - - - - | - - - - - - | - - - - - +
+    #   |    dq_per_tensor  dq_per_channel  |
+    #   |         |              |          |
+    #   |    OPT(to_bf16)    OPT(to_bf16)   |
+    #   |         |              |          |
+    #   |       expand       permute        |
+    #   |          \             |          |
+    #   |                    expand         |
+    #   |                    /              |
+    #   |               bmm                 |
+    #   |                |                  |
+    #   |            OPT(add)               |
+
+    linear_weight_prepack_cases = itertools.product(
+        [torch.float32, torch.bfloat16], [True, False], [True, False]
+    )
+
+    # Step 1: register patterns from mm and addmm
+    for dtype, input_dim_exceeds_two, is_tensor_overload in linear_weight_prepack_cases:
+        weight_prepack_patterns = _generate_qlinear_weight_prepack_patterns(
+            dtype,
+            input_dim_exceeds_two,
+            is_tensor_overload=is_tensor_overload,
+        )
+        for weight_prepack_pattern in weight_prepack_patterns:
+            # Register to pass_number 1, so we can do dequant promotion in pass_number 0.
+            _register_qlinear_weight_prepack_pass(
+                weight_prepack_pattern,
+                pass_number=1,
+                dtype=dtype,
+                input_dim_exceeds_two=input_dim_exceeds_two,
+            )
+
+    # Step 2: register patterns from bmm
+    # Linear might be decomposed into bmm when input dim exceeds 2 and not contiguous
+    # refer to:
+    # https://github.com/pytorch/pytorch/blob/
+    # 80c07df659362a95da7cd4f3ec367abfdace38c4/torch/_decomp/decompositions.py#L3965-L3968
+    # in this case, we can convert it back to qlinear
+    for dtype, with_bias, is_tensor_overload in itertools.product(
+        [torch.float32, torch.bfloat16], [True, False], [True, False]
+    ):
+        bmm_pattern = _generate_qlinear_weight_prepack_patterns(
+            dtype=dtype,
+            input_dim_exceeds_two=True,
+            input_contiguous=False,
+            with_bias=with_bias,
+            is_tensor_overload=is_tensor_overload,
+        )
+        _register_qlinear_weight_prepack_pass(
+            bmm_pattern,
+            pass_number=1
+            if with_bias
+            else 2,  # if with_bias, there is an output add, so we should try to match it firstly
+            dtype=dtype,
+            input_dim_exceeds_two=True,
+            input_contiguous=False,
+        )
+
+
+def _register_linear_dynamic_fp16_weight_prepack_pass(
+    pattern,
+    pass_number,
+    input_dim_exceeds_two=False,
+    input_contiguous=True,
+    relu_fused=False,
+):
+    def _extra_check_fn(match: Match):
+        return match.kwargs["dtype_fp16"] == torch.float16
+
+    @register_freezing_graph_pattern(
+        pattern,
+        extra_check=_extra_check_fn,
+        pass_number=pass_number,
+    )
+    def linear_dynamic_fp16_weight_prepack(match: Match, *args, **kwargs):
+        """
+        Match the pattern:
+        fp32 activation
+          |
+        mm/addmm <- t <- to_fp32 <- to_fp16 <- weight
+          |
+        (reshape) <- (relu)
+
+        OR
+
+        fp32 activation
+          |
+        expand
+          |
+         bmm <- expand <- t <- to_fp32 <- to_fp16 <- weight
+          |
+        (add) <- (relu)
+
+        Insert weight prepack node and change the pattern to:
+        fp32 activation
+          |
+        onednn.linear_dynamic_fp16 <- onednn.linear_prepack_fp16 <- weight
+        (or onednn.linear_relu_dynamic_fp16)
+        """
+        # find params
+        x = kwargs["x"]
+        w = kwargs["w"]
+        bias = kwargs["b"] if "b" in kwargs else None
+
+        # find linear node
+        nodes_to_find = [aten.addmm.default, aten.mm.default, aten.bmm.default]
+        linear_nodes = []
+        for node in nodes_to_find:
+            linear_nodes.extend(filter_nodes(match.nodes, node))
+        assert len(linear_nodes) == 1
+        linear_node = linear_nodes[0]
+        assert isinstance(linear_node, torch.fx.node.Node)
+        input_index = 1 if linear_node.target is aten.addmm.default else 0
+        weight_index = input_index + 1
+
+        # find relu node
+        relu_node = None
+        if relu_fused:
+            relu_node = match.output_node()
+            assert isinstance(relu_node, torch.fx.node.Node)
+
+        # find reshape node, expand node and add node
+        (
+            act_reshape_node,
+            output_reshape_node,
+            expand_x_node,
+            expand_w_node,
+            add_bias_node,
+        ) = (None, None, None, None, None)
+        t_node = None
+        if input_dim_exceeds_two:
+            if input_contiguous:
+                act_reshape_node = linear_node.args[input_index]
+                t_node = linear_node.args[weight_index]
+                output_reshape_node = next(iter(linear_node.users))
+                assert output_reshape_node.target is aten.reshape.default
+            else:
+                expand_x_node = linear_node.args[input_index]
+                expand_w_node = linear_node.args[weight_index]
+                assert isinstance(expand_w_node, torch.fx.node.Node)
+                t_node = expand_w_node.args[0]
+                if bias:
+                    add_bias_node = next(iter(linear_node.users))
+                    assert add_bias_node.target is aten.add.Tensor
+        else:
+            t_node = linear_node.args[weight_index]
+        assert isinstance(t_node, torch.fx.node.Node)
+
+        w_to_fp32_node = t_node.args[0]
+        assert (
+            isinstance(w_to_fp32_node, torch.fx.node.Node)
+            and w_to_fp32_node.target
+            is quantized_decomposed.convert_element_type.no_fuse
+        )
+        w_to_fp16_node = w_to_fp32_node.args[0]
+        assert (
+            isinstance(w_to_fp16_node, torch.fx.node.Node)
+            and w_to_fp16_node.target
+            is quantized_decomposed.convert_element_type.no_fuse
+        )
+
+        x_shape = x.meta.get("tensor_meta").shape
+        if has_free_symbols(x_shape):
+            # For dynamic shape case, we can't get activation shape ahead of runtime.
+            x_shape = None
+        graph = match.graph
+        with graph.inserting_before(linear_node):
+            # Insert weight prepack node and the qlinear node
+            packed_weight_inputs = (
+                w,
+                x_shape,
+            )
+            packed_weight_op = torch.ops.onednn.linear_prepack_fp16
+            prepack_weight_node = graph.call_function(
+                packed_weight_op, args=packed_weight_inputs
+            )
+
+            # create new linear node and insert on graph
+            new_args: tuple[Any, ...] = (
+                x,
+                prepack_weight_node,
+                bias,
+            )
+            linear_op = (
+                torch.ops.onednn.linear_relu_dynamic_fp16.default
+                if relu_fused
+                else torch.ops.onednn.linear_dynamic_fp16.default
+            )
+            new_linear_node = graph.call_function(linear_op, args=new_args)
+            out_node = match.output_node()
+            out_node.replace_all_uses_with(new_linear_node)
+
+            # Erase the original nodes in the reverse order
+            new_linear_node.meta.update(out_node.meta)
+            if relu_node is not None:
+                graph.erase_node(relu_node)
+            if output_reshape_node is not None:
+                graph.erase_node(output_reshape_node)
+            if add_bias_node is not None:
+                graph.erase_node(add_bias_node)
+            graph.erase_node(linear_node)
+            if act_reshape_node is not None:
+                assert isinstance(act_reshape_node, torch.fx.node.Node)
+                graph.erase_node(act_reshape_node)
+            if expand_x_node is not None:
+                assert isinstance(expand_x_node, torch.fx.node.Node)
+                graph.erase_node(expand_x_node)
+            if expand_w_node is not None:
+                assert isinstance(expand_w_node, torch.fx.node.Node)
+                graph.erase_node(expand_w_node)
+            graph.erase_node(t_node)
+            graph.erase_node(w_to_fp32_node)
+            graph.erase_node(w_to_fp16_node)
+
+            counters["inductor"]["qlinear_weight_prepack_matcher_count"] += 1
+            counters["inductor"]["qlinear_weight_prepack_matcher_nodes"] += len(
+                match.nodes
+            )
+
+
+def _register_linear_dynamic_fp16_weight_prepack():
+    to_dtype_op = torch.ops.quantized_decomposed.convert_element_type.no_fuse
+    weight_pattern = CallFunction(
+        to_dtype_op,
+        CallFunction(
+            to_dtype_op,
+            KeywordArg("w"),
+            KeywordArg("dtype_fp16"),
+        ),
+        KeywordArg("dtype_fp32"),
+    )
+    cases = itertools.product(
+        [False, True],  # input_dim_exceeds_two
+        [True, False],  # input_contiguous
+        [False, True],  # relu fused
+    )
+    for input_dim_exceeds_two, input_contiguous, relu_fused in cases:
+        patterns = _generate_linear_dynamic_fp16_pattern(
+            weight_pattern,
+            input_dim_exceeds_two,
+            input_contiguous,
+            relu_fused,
+        )
+        for pattern in patterns:
+            _register_linear_dynamic_fp16_weight_prepack_pass(
+                pattern,
+                pass_number=0 if relu_fused else 1,
+                input_dim_exceeds_two=input_dim_exceeds_two,
+                input_contiguous=input_contiguous,
+                relu_fused=relu_fused,
+            )
+
+
+def _register_smooth_quant_int_mm_pattern():
+    """
+    The pattern is:
+      (no bias) reshape -> _int_mm -> convert_element_type -> (expand ->) mul -> mul -> reshape
+    or
+      (with bias) pattern_no_bias -> add (-> reshape -> reshape)
+    """
+
+    # When torch.compile'ing with dynamic=True, the expand node and the two tailing reshape nodes exist
+    # When torch.compile'ing with dynamic=False, they don't exist
+    def get_pattern_no_bias(expand_a_scale: bool, reshape_a: bool = True):
+        return CallFunction(
+            aten.mul.Tensor,
+            CallFunction(
+                aten.mul.Tensor,
+                CallFunction(
+                    prims.convert_element_type.default,
+                    CallFunction(
+                        aten._int_mm.default,
+                        CallFunction(
+                            aten.reshape.default,
+                            KeywordArg("a"),
+                            KeywordArg("in_shape"),
+                        )
+                        if reshape_a
+                        else KeywordArg("a"),
+                        KeywordArg("b"),
+                    ),
+                    KeywordArg("dtype"),
+                ),
+                (
+                    CallFunction(
+                        aten.expand.default,
+                        KeywordArg("x_scale"),
+                        Arg(),
+                    )
+                    if expand_a_scale
+                    else KeywordArg("x_scale")
+                ),
+            ),
+            KeywordArg("w_scale"),
+        )
+
+    def _with_outer_reshape(pattern):
+        return CallFunction(
+            aten.reshape.default, pattern, KeywordArg("out_shape_no_bias")
+        )
+
+    # for torch.compile(dynamic=False)
+    pattern_no_bias_1 = _with_outer_reshape(get_pattern_no_bias(expand_a_scale=False))
+    pattern_with_bias_1 = CallFunction(
+        aten.add.Tensor,
+        pattern_no_bias_1,
+        KeywordArg("bias"),
+    )
+    # for torch.compile(dynamic=True)
+    pattern_no_bias_2 = _with_outer_reshape(get_pattern_no_bias(expand_a_scale=True))
+    pattern_with_bias_2 = CallFunction(
+        aten.reshape.default,
+        CallFunction(
+            aten.reshape.default,
+            CallFunction(
+                aten.add.Tensor,
+                pattern_no_bias_2,
+                KeywordArg("bias"),
+            ),
+            Arg(),
+        ),
+        KeywordArg("out_shape_with_bias"),
+    )
+
+    # The following patterns are for torchao int8_dynamic_activation_int8_weight linear,
+    # when both activation and weights are symmetrically quantized.
+    # In practice, though, they may also match smooth-quant pattern when a 2D input shape would be used.
+    # Since add is not currently being used as a oneDNN post-op, but is unfused, we don't need these patterns with bias.
+    # Ideally, we should add mul + add post-op support in ATen int8 oneDNN linear op.
+    pattern1_with_no_outer_or_act_reshape = get_pattern_no_bias(
+        expand_a_scale=False, reshape_a=False
+    )
+    pattern2_with_no_outer_or_act_reshape = get_pattern_no_bias(
+        expand_a_scale=True, reshape_a=False
+    )
+
+    def _validate_pattern(match: Match):
+        if len(match.nodes) not in [4, 5, 6, 7, 10]:
+            return False
+        # Make sure weight is a constant
+        aten_int_mm_node = filter_nodes(match.nodes, aten._int_mm.default)[0]
+        if not isinstance(aten_int_mm_node.args[1], torch.fx.node.Node):
+            return False
+        if aten_int_mm_node.args[1].op != "get_attr":
+            return False
+
+        if len(match.nodes) == 10:
+            # Check the two tailing reshape nodes can be fused
+            if match.nodes[9].args[1] != match.nodes[6].args[1]:
+                return False
+        if len(match.nodes) == 10 or (
+            len(match.nodes) == 7 and match.nodes[6].target is aten.add.Tensor
+        ):
+            bias_idx = 7 if len(match.nodes) == 10 else 6
+            # Check bias shape
+            bias_node = match.nodes[bias_idx].args[1]
+            if not isinstance(bias_node, torch.fx.node.Node):
+                return False
+            if len(bias_node.meta.get("tensor_meta").shape) != 1:  # type: ignore[union-attr]
+                return False
+        return True
+
+    pattern_to_pass_number = {
+        pattern_no_bias_2: 0,
+        pattern_with_bias_2: 0,
+        pattern_no_bias_1: 1,
+        pattern_with_bias_1: 1,
+        pattern1_with_no_outer_or_act_reshape: 2,
+        pattern2_with_no_outer_or_act_reshape: 2,
+    }
+    for pattern, pass_number in pattern_to_pass_number.items():
+
+        @register_freezing_graph_pattern(
+            pattern,
+            extra_check=_validate_pattern,
+            pass_number=pass_number,
+        )
+        def _int_mm_weight_prepack(match: Match, *args, **kwargs):
+            bias = kwargs.get("bias", None)
+            x = kwargs["a"]
+            weight = kwargs["b"]
+            dtype = kwargs["dtype"]
+            x_scale = kwargs["x_scale"]
+            w_scale = kwargs["w_scale"]
+            x_shape = x.meta.get("tensor_meta").shape
+            if has_free_symbols(x_shape):
+                # For dynamic shape case, we can't get activation shape ahead of runtime.
+                x_shape = None
+
+            out_node = match.output_node()
+            with match.graph.inserting_before(out_node):
+                transpose_node = match.graph.call_function(
+                    aten.permute.default, args=(weight, [1, 0])
+                )
+                contig_node = match.graph.call_function(
+                    aten.contiguous.default, args=(transpose_node,)
+                )
+                packed_weight_inputs = (
+                    contig_node,
+                    x_shape,
+                )
+                packed_weight_op = torch.ops.onednn.qlinear_prepack
+                prepack_weight_node = match.graph.call_function(
+                    packed_weight_op, args=packed_weight_inputs
+                )
+
+                dummy_zp = None
+                w_scale = match.graph.call_function(
+                    prims.convert_element_type.default, args=(w_scale, torch.float32)
+                )
+
+                x_scale_shape = x_scale.meta.get("tensor_meta").shape
+                x_scale_is_scalar = False
+                if not has_free_symbols(x_scale_shape):
+                    prod = 1
+                    for d in x_scale_shape:
+                        prod *= d
+                    x_scale_is_scalar = prod == 1
+
+                new_args: tuple[Any, ...]
+                if x_scale_is_scalar:
+                    # in this case, we can call onednn.qlinear directly
+                    new_args = (
+                        x,
+                        x_scale,
+                        dummy_zp,  # x_zp
+                        prepack_weight_node,
+                        w_scale,
+                        dummy_zp,  # w_zp
+                        bias,
+                        1.0,  # output_scale
+                        0,  # output_zero_point
+                        dtype,  # output_dtype
+                        "none",  # post op name
+                        [],  # post op args
+                        "",  # post op algorithm
+                    )
+                    new_linear_node = match.graph.call_function(
+                        torch.ops.onednn.qlinear_pointwise.tensor, args=new_args
+                    )
+                    out_node.replace_all_uses_with(new_linear_node)
+                    new_linear_node.meta.update(out_node.meta)
+                else:
+                    # onednn.qlinear does not support per-channel quantization of x
+                    # so in this case, we have to apply x scale and add bias ourselves after qlinear
+                    in_shape = kwargs.get("in_shape", None)
+                    if in_shape is None:
+                        x_reshaped = x
+                    else:
+                        x_reshaped = match.graph.call_function(
+                            aten.reshape.default, args=(x, in_shape)
+                        )
+                    new_args = (
+                        x_reshaped,
+                        1.0,  # x_scale
+                        0,  # x_zp
+                        prepack_weight_node,
+                        w_scale,
+                        dummy_zp,  # w_zp
+                        None,  # bias
+                        1.0,  # output_scale
+                        0,  # output_zero_point
+                        dtype,  # output_dtype
+                        "none",  # post op name
+                        [],  # post op args
+                        "",  # post op algorithm
+                    )
+                    new_linear_node = match.graph.call_function(
+                        torch.ops.onednn.qlinear_pointwise, args=new_args
+                    )
+                    # apply x scale
+                    new_out_node = match.graph.call_function(
+                        aten.mul.Tensor, args=(new_linear_node, x_scale)
+                    )
+
+                    # Add bias and reshape
+                    has_outer_reshape = (
+                        kwargs.get("out_shape_with_bias", None) is not None
+                        or kwargs.get("out_shape_no_bias", None) is not None
+                    )
+
+                    if has_outer_reshape:
+                        out_shape = kwargs.get(
+                            "out_shape_with_bias", kwargs["out_shape_no_bias"]
+                        )
+                    if bias is not None:
+                        new_out_node = match.graph.call_function(
+                            aten.add.Tensor, args=(new_out_node, bias)
+                        )
+                        if has_outer_reshape:
+                            new_out_node = match.graph.call_function(
+                                aten.reshape.default,
+                                args=(new_out_node, out_shape),  # type: ignore[possibly-undefined]
+                            )
+                    else:
+                        if has_outer_reshape:
+                            new_out_node = match.graph.call_function(
+                                aten.reshape.default,
+                                args=(new_out_node, out_shape),  # type: ignore[possibly-undefined]
+                            )
+                    out_node.replace_all_uses_with(new_out_node)
+                    new_out_node.meta.update(out_node.meta)
+                for node in reversed(match.nodes):
+                    match.graph.erase_node(node)
+                counters["inductor"]["qlinear_weight_prepack_matcher_count"] += 1
+                counters["inductor"]["qlinear_weight_prepack_matcher_nodes"] += len(
+                    match.nodes
+                )
+
+
+class PostOpAttr:
+    def __init__(
+        self,
+        binary_op_name: str = "none",
+        alpha=None,
+        unary_op_name: str = "none",
+        scalars_attr=None,
+        algorithm_attr=None,
+    ) -> None:
+        self.binary_op_name = binary_op_name
+        self.alpha = alpha if alpha else 1.0
+        self.unary_op_name = unary_op_name
+        self.scalars_attr = scalars_attr if scalars_attr else []
+        self.algorithm_attr = algorithm_attr if algorithm_attr else ""
+
+
+def _register_qconv_post_op_fusion_pass(
+    pattern,
+    pass_number,
+    computation_op,
+    post_op_attr,
+):
+    has_binary_post_op = post_op_attr.binary_op_name != "none"
+
+    @register_freezing_graph_pattern(
+        pattern,
+        extra_check=_is_valid_qconv_post_op_fusion_pattern(has_binary_post_op),
+        pass_number=pass_number,
+    )
+    def qconv(match: Match, *args, **kwargs):
+        # Activation QParams
+        x, x_scale, x_zp = (
+            kwargs["x"],
+            kwargs["x_scale"],
+            kwargs["x_zp"],
+        )
+        # Weight QParams
+        packed_weight, w_scale, w_zp = (
+            kwargs["packed_weight"],
+            kwargs["w_scale"],
+            kwargs["w_zp"],
+        )
+        # Conv Params
+        b, stride, padding, dilation, groups = (
+            kwargs["b"],
+            kwargs["stride"],
+            kwargs["padding"],
+            kwargs["dilation"],
+            kwargs["groups"],
+        )
+        output_dtype = _get_pattern_output_dtype(match)
+        assert output_dtype in [torch.int8, torch.uint8, torch.float32, torch.bfloat16]
+        # Output QParams
+        o_inv_scale = (
+            kwargs["o_inv_scale"]
+            if (output_dtype == torch.uint8 or output_dtype == torch.int8)
+            else 1.0
+        )
+        o_zero_point = (
+            kwargs["o_zp"]
+            if (output_dtype == torch.uint8 or output_dtype == torch.int8)
+            else 0
+        )
+        assert (
+            kwargs["postop_name"] == "none"
+        )  # Expected no post op fused in weight prepack phase
+        if post_op_attr.unary_op_name == "hardtanh":
+            min_value = kwargs.get("min_value")
+            max_value = kwargs.get("max_value")
+            post_op_attr.scalars_attr = [min_value, max_value]
+
+        out_node = match.output_node()
+        with match.graph.inserting_before(out_node):
+            if not has_binary_post_op:
+                computation_args: tuple[Any, ...] = (
+                    x,
+                    x_scale,
+                    x_zp,
+                    packed_weight,
+                    w_scale,
+                    w_zp,
+                    b,
+                    stride,
+                    padding,
+                    dilation,
+                    groups,
+                    o_inv_scale,
+                    o_zero_point,
+                    output_dtype,
+                    post_op_attr.unary_op_name,
+                    post_op_attr.scalars_attr,
+                    post_op_attr.algorithm_attr,
+                )
+            else:
+                accum = (
+                    kwargs["accum"]
+                    if output_dtype in [torch.uint8, torch.int8]
+                    else kwargs["accum_after_dequant"]
+                )
+                accum_scale = (
+                    kwargs["accum_scale"]
+                    if output_dtype in [torch.uint8, torch.int8]
+                    else 1.0
+                )
+                accum_zp = (
+                    kwargs["accum_zp"]
+                    if output_dtype in [torch.uint8, torch.int8]
+                    else 0
+                )
+                computation_args = (
+                    x,
+                    x_scale,
+                    x_zp,
+                    packed_weight,
+                    w_scale,
+                    w_zp,
+                    accum,
+                    b,
+                    stride,
+                    padding,
+                    dilation,
+                    groups,
+                    o_inv_scale,
+                    o_zero_point,
+                    output_dtype,
+                    accum_scale,
+                    accum_zp,
+                    post_op_attr.binary_op_name,
+                    post_op_attr.alpha,
+                    post_op_attr.unary_op_name,
+                    post_op_attr.scalars_attr,
+                    post_op_attr.algorithm_attr,
+                )
+            new_conv_node = match.graph.call_function(
+                computation_op, args=computation_args
+            )
+            out_node.replace_all_uses_with(new_conv_node)
+            new_conv_node.meta.update(out_node.meta)
+            for node in reversed(match.nodes):
+                match.graph.erase_node(node)
+        count_key = (
+            "qconv2d_binary_matcher_count"
+            if has_binary_post_op
+            else "qconv_unary_matcher_count"
+        )
+        nodes_key = (
+            "qconv2d_binary_matcher_nodes"
+            if has_binary_post_op
+            else "qconv_unary_matcher_nodes"
+        )
+        counters["inductor"][count_key] += 1
+        counters["inductor"][nodes_key] += len(match.nodes)
+
+    return qconv
+
+
+def _register_qconv_unary_fusion():
+    from torch._inductor.fx_passes.mkldnn_fusion import (
+        _hardswish_fusion,
+        _hardtanh_fusion,
+        _silu_fusion,
+    )
+
+    for original_pattern_output_dtype in [torch.float32, torch.bfloat16]:
+        # Priority 1 to match: QConv2d Unary pattern with int8 output
+        # If a pattern1 is a sub-set of pattern2, we should try to match pattern2 firstly.
+        # For example: pattern1 is qconv_fp32 -> relu, pattern2 is qconv_fp32 -> relu -> quant
+        is_bf16 = original_pattern_output_dtype == torch.bfloat16
+        conv_unary_replace_patterns = {
+            PostOpAttr(
+                "none", None, "none", [], ""
+            ): generate_pattern_with_output_quant(
+                get_qconv_pt2e_pattern(1),
+            ),
+            PostOpAttr(
+                "none", None, "relu", [], ""
+            ): generate_pattern_with_output_quant(
+                generate_pattern_with_unary(
+                    get_qconv_pt2e_pattern(1), aten.relu.default
+                ),
+            ),
+            PostOpAttr(
+                "none", None, "hardtanh", [], ""
+            ): generate_pattern_with_output_quant(
+                _unary_fusion_pattern(
+                    _hardtanh_fusion,
+                    get_qconv_pt2e_pattern(1),
+                    1,
+                    is_bf16,
+                ),
+                with_dtype_convert=is_bf16,
+            ),
+            PostOpAttr(
+                "none", None, "hardswish", [], ""
+            ): generate_pattern_with_output_quant(
+                _unary_fusion_pattern(
+                    _hardswish_fusion,
+                    get_qconv_pt2e_pattern(1 if is_bf16 else 2),
+                    2,
+                    is_bf16,
+                ),
+                with_dtype_convert=is_bf16,
+            ),
+            PostOpAttr(
+                "none", None, "swish", [], ""
+            ): generate_pattern_with_output_quant(
+                _unary_fusion_pattern(
+                    _silu_fusion,
+                    get_qconv_pt2e_pattern(1 if is_bf16 else 2),
+                    2,
+                    is_bf16,
+                ),
+                with_dtype_convert=is_bf16,
+            ),
+        }
+
+        for unary_attr, patterns in conv_unary_replace_patterns.items():
+            # Register qconv2d pattern for ExternKernel Lowering
+            _register_qconv_post_op_fusion_pass(
+                patterns,
+                3,  # pass_number
+                torch.ops.onednn.qconv_pointwise.default,  # computation_op
+                unary_attr,  # unary_attr
+            )
+
+        # Priority 2 to match: QConv2d Unary pattern with fp32/bfloat16 output
+        conv_unary_replace_float_out_patterns = {
+            PostOpAttr("none", None, "relu", [], ""): generate_pattern_with_unary(
+                get_qconv_pt2e_pattern(1), aten.relu.default
+            ),
+            PostOpAttr(
+                "none", None, "hardtanh", [], ""
+            ): _may_generate_pattern_with_dtype_convert(
+                _unary_fusion_pattern(
+                    _hardtanh_fusion,
+                    get_qconv_pt2e_pattern(1),
+                    1,
+                    is_bf16,
+                ),
+                Arg(),
+                is_bf16,
+            ),
+            PostOpAttr(
+                "none", None, "hardswish", [], ""
+            ): _may_generate_pattern_with_dtype_convert(
+                _unary_fusion_pattern(
+                    _hardswish_fusion,
+                    get_qconv_pt2e_pattern(1 if is_bf16 else 2),
+                    2,
+                    is_bf16,
+                ),
+                Arg(),
+                is_bf16,
+            ),
+            PostOpAttr(
+                "none", None, "swish", [], ""
+            ): _may_generate_pattern_with_dtype_convert(
+                _unary_fusion_pattern(
+                    _silu_fusion,
+                    get_qconv_pt2e_pattern(1 if is_bf16 else 2),
+                    2,
+                    is_bf16,
+                ),
+                Arg(),
+                is_bf16,
+            ),
+        }
+
+        for unary_attr, patterns in conv_unary_replace_float_out_patterns.items():
+            # Register qconv2d pattern for ExternKernel Lowering
+            _register_qconv_post_op_fusion_pass(
+                patterns,
+                4,  # pass_number
+                torch.ops.onednn.qconv_pointwise.default,  # computation_op
+                unary_attr,  # unary_attr
+            )
+
+
+def _register_qconv_binary_fusion():
+    for int8_mixed_bf16_with_inplace_add in [False, True]:
+        # Priority 1 to match: QConv2d Binary or Binary-Unary pattern with int8 output
+        swap_binary_inputs_list = [False, True]
+        binary_replace_patterns = {}
+        for swap_inputs in swap_binary_inputs_list:
+            binary_replace_patterns.update(
+                {
+                    PostOpAttr(
+                        "sum", 1.0, "none", [], ""
+                    ): generate_pattern_with_output_quant(
+                        generate_pattern_with_binary(
+                            aten.add.Tensor,
+                            get_qconv_pt2e_pattern(1),
+                            dequantize_accum_pattern,
+                            int8_mixed_bf16_with_inplace_add,
+                            swap_inputs=swap_inputs,
+                        ),
+                    ),
+                    PostOpAttr(
+                        "sum", 1.0, "relu", [], ""
+                    ): generate_pattern_with_output_quant(
+                        generate_pattern_with_unary(
+                            generate_pattern_with_binary(
+                                aten.add.Tensor,
+                                get_qconv_pt2e_pattern(1),
+                                dequantize_accum_pattern,
+                                int8_mixed_bf16_with_inplace_add,
+                                swap_inputs=swap_inputs,
+                            ),
+                            aten.relu.default,
+                        ),
+                    ),
+                }
+            )
+
+        for binary_unary_attr, patterns in binary_replace_patterns.items():
+            _register_qconv_post_op_fusion_pass(
+                patterns,
+                3,  # pass_number
+                torch.ops.onednn.qconv2d_pointwise.binary,  # computation_op
+                binary_unary_attr,  # binary_unary_attr
+            )
+
+        # Priority 2 to match: QConv2d Binary-Unary pattern with fp32/bfloat16 output
+        binary_replace_float_out_patterns = {}
+        for swap_inputs in swap_binary_inputs_list:
+            binary_replace_float_out_patterns.update(
+                {
+                    PostOpAttr("sum", 1.0, "relu", [], ""): generate_pattern_with_unary(
+                        generate_pattern_with_binary(
+                            aten.add.Tensor,
+                            get_qconv_pt2e_pattern(1),
+                            KeywordArg("accum_after_dequant"),
+                            int8_mixed_bf16_with_inplace_add,
+                            swap_inputs=swap_inputs,
+                        ),
+                        aten.relu.default,
+                    )
+                }
+            )
+
+        for (
+            binary_unary_attr,
+            patterns,
+        ) in binary_replace_float_out_patterns.items():
+            if int8_mixed_bf16_with_inplace_add:
+                _register_qconv_post_op_fusion_pass(
+                    patterns,
+                    3,  # pass_number
+                    torch.ops.onednn.qconv2d_pointwise.binary,  # computation_op
+                    binary_unary_attr,  # binary_unary_attr
+                )
+            else:
+                _register_qconv_post_op_fusion_pass(
+                    patterns,
+                    4,  # pass_number
+                    torch.ops.onednn.qconv2d_pointwise.binary,  # computation_op
+                    binary_unary_attr,  # binary_unary_attr
+                )
+
+        # Priority 3: QConv2d Binary pattern with fp32/bfloat16 output
+        binary_replace_float_out_patterns = {}
+        for swap_inputs in swap_binary_inputs_list:
+            binary_replace_float_out_patterns.update(
+                {
+                    PostOpAttr(
+                        "sum", 1.0, "none", [], ""
+                    ): generate_pattern_with_binary(
+                        aten.add.Tensor,
+                        get_qconv_pt2e_pattern(1),
+                        KeywordArg("accum_after_dequant"),
+                        int8_mixed_bf16_with_inplace_add,
+                        swap_inputs=swap_inputs,
+                    ),
+                }
+            )
+
+        for (
+            binary_unary_attr,
+            patterns,
+        ) in binary_replace_float_out_patterns.items():
+            _register_qconv_post_op_fusion_pass(
+                patterns,
+                4 if int8_mixed_bf16_with_inplace_add else 5,  # pass_number
+                torch.ops.onednn.qconv2d_pointwise.binary,  # computation_op
+                binary_unary_attr,  # binary_unary_attr
+            )
+
+
+def _register_qlinear_post_op_fusion_pass(
+    pattern,
+    pass_number,
+    computation_op,
+    post_op_attr,
+):
+    has_binary_post_op = post_op_attr.binary_op_name != "none"
+
+    @register_freezing_graph_pattern(
+        pattern,
+        extra_check=_is_valid_qlinear_post_op_fusion_pattern(has_binary_post_op),
+        pass_number=pass_number,
+    )
+    def qlinear_post_op_fusion(match: Match, *args, **kwargs):
+        """
+        Match the pattern:
+        qlinear - post op
+        """
+        output_dtype = _get_pattern_output_dtype(match)
+        # Activation QParams
+        x, x_scale, x_zp = (
+            kwargs["x"],
+            kwargs["x_scale"],
+            kwargs["x_zp"],
+        )
+        # Weight QParams
+        packed_weight, w_scale, w_zp = (
+            kwargs["packed_weight"],
+            kwargs["w_scale"],
+            kwargs["w_zp"],
+        )
+
+        # bias
+        b = kwargs["b"] if "b" in kwargs else None
+
+        # Output QParams
+        o_inv_scale = (
+            kwargs["o_inv_scale"]
+            if (output_dtype in [torch.uint8, torch.int8])
+            else 1.0
+        )
+        o_zero_point = (
+            kwargs["o_zp"] if (output_dtype in [torch.uint8, torch.int8]) else 0
+        )
+        assert (
+            kwargs["postop_name"] == "none"
+        )  # Expected no post op fused in weight prepack phase
+
+        out_node = match.output_node()
+        with match.graph.inserting_before(out_node):
+            if not has_binary_post_op:
+                computation_args: tuple[Any, ...] = (
+                    x,
+                    x_scale,
+                    x_zp,
+                    packed_weight,
+                    w_scale,
+                    w_zp,
+                    b,
+                    o_inv_scale,
+                    o_zero_point,
+                    output_dtype,
+                    post_op_attr.unary_op_name,
+                    post_op_attr.scalars_attr,
+                    post_op_attr.algorithm_attr,
+                )
+            else:
+                other = kwargs["other"] if "other" in kwargs else kwargs["accum"]
+                x2_scale = 1.0
+                x2_zp = 0
+                computation_args = (
+                    x,
+                    x_scale,
+                    x_zp,
+                    packed_weight,
+                    w_scale,
+                    w_zp,
+                    other,
+                    b,
+                    o_inv_scale,
+                    o_zero_point,
+                    output_dtype,
+                    x2_scale,
+                    x2_zp,
+                    post_op_attr.binary_op_name,
+                    post_op_attr.alpha,
+                    post_op_attr.unary_op_name,
+                    post_op_attr.scalars_attr,
+                    post_op_attr.algorithm_attr,
+                )
+            new_linear_node = match.graph.call_function(
+                computation_op, args=computation_args
+            )
+            out_node.replace_all_uses_with(new_linear_node)
+            new_linear_node.meta.update(out_node.meta)
+            for node in reversed(match.nodes):
+                match.graph.erase_node(node)
+        count_key = (
+            "qlinear_binary_matcher_count"
+            if has_binary_post_op
+            else "qlinear_unary_matcher_count"
+        )
+        nodes_key = (
+            "qlinear_binary_matcher_nodes"
+            if has_binary_post_op
+            else "qlinear_unary_matcher_nodes"
+        )
+        counters["inductor"][count_key] += 1
+        counters["inductor"][nodes_key] += len(match.nodes)
+
+
+def _register_qlinear_unary_fusion():
+    from torch._inductor.fx_passes.mkldnn_fusion import (
+        _gelu_fusion_1 as _gelu_fusion_erf,
+    )
+    from torch._inductor.fx_passes.mkldnn_fusion import (
+        _gelu_fusion_2 as _gelu_fusion_tanh,
+    )
+
+    for original_pattern_output_dtype in [torch.float32, torch.bfloat16]:
+        is_bf16 = original_pattern_output_dtype == torch.bfloat16
+        for x_scale_zp_are_tensors in (False, True):
+            qlinear_pattern = get_qlinear_pt2e_pattern(x_scale_zp_are_tensors)
+            computation_op = (
+                torch.ops.onednn.qlinear_pointwise.tensor
+                if x_scale_zp_are_tensors
+                else torch.ops.onednn.qlinear_pointwise.default
+            )
+            # Priority 1 to match: QLinear Unary pattern with int8 output
+            linear_unary_replace_patterns = {
+                PostOpAttr(
+                    "none", None, "none", [], ""
+                ): generate_pattern_with_output_quant(
+                    qlinear_pattern,
+                ),
+                PostOpAttr(
+                    "none", None, "relu", [], ""
+                ): generate_pattern_with_output_quant(
+                    generate_pattern_with_unary(qlinear_pattern, aten.relu.default),
+                ),
+                PostOpAttr(
+                    "none", None, "gelu", [], "none"
+                ): generate_pattern_with_output_quant(
+                    _unary_fusion_pattern(
+                        _gelu_fusion_erf,
+                        get_qlinear_pt2e_pattern(
+                            x_scale_zp_are_tensors, 1 if is_bf16 else 2
+                        ),
+                        2,
+                        is_bf16,
+                    ),
+                    with_dtype_convert=is_bf16,
+                ),
+                PostOpAttr(
+                    "none", None, "gelu", [], "tanh"
+                ): generate_pattern_with_output_quant(
+                    _unary_fusion_pattern(
+                        _gelu_fusion_tanh,
+                        get_qlinear_pt2e_pattern(
+                            x_scale_zp_are_tensors, 1 if is_bf16 else 4
+                        ),
+                        4,
+                        is_bf16,
+                    ),
+                    with_dtype_convert=is_bf16,
+                ),
+            }
+
+            for unary_attr, patterns in linear_unary_replace_patterns.items():
+                _register_qlinear_post_op_fusion_pass(
+                    patterns,
+                    3,  # pass_number
+                    computation_op,
+                    unary_attr,  # unary_attr
+                )
+
+            # Priority 2 to match: QLinear Unary pattern with FP32/BF16 output
+            linear_unary_replace_float_out_patterns = {
+                PostOpAttr("none", None, "relu", [], ""): generate_pattern_with_unary(
+                    qlinear_pattern, aten.relu.default
+                ),
+                PostOpAttr(
+                    "none", None, "gelu", [], "none"
+                ): _may_generate_pattern_with_dtype_convert(
+                    _unary_fusion_pattern(
+                        _gelu_fusion_erf,
+                        get_qlinear_pt2e_pattern(
+                            x_scale_zp_are_tensors, 1 if is_bf16 else 2
+                        ),
+                        2,
+                        is_bf16,
+                    ),
+                    Arg(),
+                    is_bf16,
+                ),
+                PostOpAttr(
+                    "none", None, "gelu", [], "tanh"
+                ): _may_generate_pattern_with_dtype_convert(
+                    _unary_fusion_pattern(
+                        _gelu_fusion_tanh,
+                        get_qlinear_pt2e_pattern(
+                            x_scale_zp_are_tensors, 1 if is_bf16 else 4
+                        ),
+                        4,
+                        is_bf16,
+                    ),
+                    Arg(),
+                    is_bf16,
+                ),
+            }
+
+            for unary_attr, patterns in linear_unary_replace_float_out_patterns.items():
+                _register_qlinear_post_op_fusion_pass(
+                    patterns,
+                    4,  # pass_number
+                    computation_op,
+                    unary_attr,  # unary_attr
+                )
+
+
+def _register_qlinear_binary_fusion():
+    r"""
+    Supported linear-binary(-unary) patterns
+
+        linear(X)   extra input
+               \   /
+                Add
+                 |
+            Optional(relu)
+                 |
+                 Y
+
+    1. int8-mixed-fp32
+    +---+---------------+-----------+------------------------------+---------+
+    | # | Add type      | Quant out | Pattern                      | Post op |
+    +---+---------------+-----------+------------------------------+---------+
+    | 1 | In-/out-place | Yes       | linear + fp32 -> (relu) -> q | add     |
+    +---+---------------+-----------+------------------------------+---------+
+    | 2 | In-/out-place | No        | linear + fp32 -> (relu)      | sum     |
+    +---+---------------+-----------+------------------------------+---------+
+
+    2. int8-mixed-bf16
+    +---+----------+---------------+-----------+-----------------------------------------+---------+
+    | # | X2 dtype | Add type      | Quant out | Pattern                                 | Post op |
+    +---+----------+---------------+-----------+-----------------------------------------+---------+
+    | 1 | BF16     | In-/out-place | Yes       | linear + bf16 -> (relu) -> q            | add     |
+    +---+----------+---------------+-----------+-----------------------------------------+---------+
+    | 2 | BF16     | In-/out-place | No        | linear + bf16 -> (relu)                 | sum     |
+    +---+----------+---------------+-----------+-----------------------------------------+---------+
+    | 3 | FP32     | Out-place     | Yes       | linear + fp32 -> (relu) -> q            | add     |
+    |   |          | In-place right|           |                                         |         |
+    +---+----------+---------------+-----------+-----------------------------------------+---------+
+    | 4 | FP32     | Out-place     | No        | linear + fp32 -> (relu)                 | sum     |
+    |   |          | In-place right|           |                                         |         |
+    +---+----------+---------------+-----------+-----------------------------------------+---------+
+    | 5 | FP32     | In-place left | Yes       | linear + fp32 -> to_bf16 -> (relu) -> q | add     |
+    +---+----------+---------------+-----------+-----------------------------------------+---------+
+    | 6 | FP32     | In-place left | No        | linear + fp32 -> to_bf16 -> (relu)      | add     |
+    +---+----------+---------------+-----------+-----------------------------------------+---------+
+
+    Note
+    (1) The positions of linear and the extra input can be swapped.
+    (2) we don't insert q-dq before the extra input of linear-add by recipe. But if q-dq is found at the
+    extra input, we don't match that pattern because we cannot match all these patterns in 3 passes.
+    """
+    for x_scale_zp_are_tensors in (False, True):
+        qlinear_binary_op = (
+            torch.ops.onednn.qlinear_pointwise.binary_tensor
+            if x_scale_zp_are_tensors
+            else torch.ops.onednn.qlinear_pointwise.binary
+        )
+        unary_postop_list = ["none", "relu"]
+        unary_postop_dict = {
+            "none": None,
+            "relu": aten.relu.default,
+        }
+        convert_dtype_after_binary_list = [False, True]
+
+        # Priority 1 to match: QLinear Binary or Binary-Unary pattern with int8 output
+        # Covers case (1) of int8-mixed-fp32 and case (1)(3)(5) of int8-mixed-bf16,
+        # totally 3 patterns (2 are identical)
+        swap_binary_inputs_list = [False, True]
+        int8_mixed_bf16_list = [False, True]
+        combinations = itertools.product(
+            unary_postop_list,
+            int8_mixed_bf16_list,
+            swap_binary_inputs_list,
+            convert_dtype_after_binary_list,
+        )
+        qlinear_binary_replace_patterns = {}
+        for unary_op, int8_mixed_bf16, swap_inputs, cvt_dtype_binary in combinations:
+            if not int8_mixed_bf16 and cvt_dtype_binary:
+                # No convert node after binary node if dtypes are all fp32
+                continue
+            qlinear_binary_replace_patterns.update(
+                {
+                    PostOpAttr(
+                        "add", 1.0, unary_op, [], ""
+                    ): generate_pattern_with_output_quant(
+                        generate_pattern_with_unary(
+                            generate_pattern_with_binary(
+                                aten.add.Tensor,
+                                get_qlinear_pt2e_pattern(x_scale_zp_are_tensors),
+                                KeywordArg("other"),
+                                # If fp32 extra input is inplace added to bf16 linear output,
+                                # a to_bf16 node is inserted after binary
+                                dtype_convert=cvt_dtype_binary,
+                                swap_inputs=swap_inputs,
+                            ),
+                            unary_postop_dict[unary_op],
+                        ),
+                    )
+                }
+            )
+        for binary_unary_attr, patterns in qlinear_binary_replace_patterns.items():
+            _register_qlinear_post_op_fusion_pass(
+                patterns,
+                3,  # pass_number
+                qlinear_binary_op,  # computation_op
+                binary_unary_attr,
+            )
+
+        # Priority 2.1 to match: QLinear Binary-Unary pattern with fp32/bfloat16 output
+        # Covers case (2) of int8-mixed-fp32 and case (2)(4) of int8-mixed-bf16,
+        # totally 2 patterns (2 are identical)
+        binary_replace_float_out_patterns = {}
+        for swap_binary_inputs in swap_binary_inputs_list:
+            binary_replace_float_out_patterns.update(
+                {
+                    PostOpAttr("sum", 1.0, "relu", [], ""): generate_pattern_with_unary(
+                        generate_pattern_with_binary(
+                            aten.add.Tensor,
+                            get_qlinear_pt2e_pattern(x_scale_zp_are_tensors),
+                            KeywordArg("accum"),
+                            dtype_convert=False,
+                            swap_inputs=swap_binary_inputs,
+                        ),
+                        aten.relu.default,
+                    ),
+                }
+            )
+        for (
+            binary_unary_attr,
+            patterns,
+        ) in binary_replace_float_out_patterns.items():
+            _register_qlinear_post_op_fusion_pass(
+                patterns,
+                4,  # pass_number
+                qlinear_binary_op,  # computation_op
+                binary_unary_attr,
+            )
+        # Priority 2.2 to match: QLinear Binary-Unary pattern with fp32/bfloat16 output
+        # Covers case (6) of int8-mixed-bf16
+        binary_replace_float_out_patterns = {}
+        for swap_binary_inputs in swap_binary_inputs_list:
+            binary_replace_float_out_patterns.update(
+                {
+                    PostOpAttr("add", 1.0, "relu", [], ""): generate_pattern_with_unary(
+                        generate_pattern_with_binary(
+                            aten.add.Tensor,
+                            get_qlinear_pt2e_pattern(x_scale_zp_are_tensors),
+                            KeywordArg("other"),
+                            dtype_convert=True,
+                            swap_inputs=swap_binary_inputs,
+                        ),
+                        aten.relu.default,
+                    ),
+                }
+            )
+        for (
+            binary_unary_attr,
+            patterns,
+        ) in binary_replace_float_out_patterns.items():
+            _register_qlinear_post_op_fusion_pass(
+                patterns,
+                4,  # pass_number
+                qlinear_binary_op,  # computation_op
+                binary_unary_attr,
+            )
+
+        # Priority 3.1: QLinear Binary pattern with fp32/bfloat16 output
+        # Covers case (2) of int8-mixed-fp32 and case (2)(4) of int8-mixed-bf16,
+        # totally 2 patterns (2 are identical)
+        binary_replace_float_out_patterns = {}
+        for swap_binary_inputs in swap_binary_inputs_list:
+            binary_replace_float_out_patterns.update(
+                {
+                    PostOpAttr(
+                        "sum", 1.0, "none", [], ""
+                    ): generate_pattern_with_binary(
+                        aten.add.Tensor,
+                        get_qlinear_pt2e_pattern(x_scale_zp_are_tensors),
+                        KeywordArg("accum"),
+                        dtype_convert=False,
+                        swap_inputs=swap_binary_inputs,
+                    ),
+                }
+            )
+        for (
+            binary_unary_attr,
+            patterns,
+        ) in binary_replace_float_out_patterns.items():
+            _register_qlinear_post_op_fusion_pass(
+                patterns,
+                5,  # pass_number
+                qlinear_binary_op,  # computation_op
+                binary_unary_attr,
+            )
+        # Priority 3.2: QLinear Binary pattern with fp32/bfloat16 output
+        # Covers (6) of int8-mixed-bf16
+        binary_replace_float_out_patterns = {}
+        for swap_binary_inputs in swap_binary_inputs_list:
+            binary_replace_float_out_patterns.update(
+                {
+                    PostOpAttr(
+                        "add", 1.0, "none", [], ""
+                    ): generate_pattern_with_binary(
+                        aten.add.Tensor,
+                        get_qlinear_pt2e_pattern(x_scale_zp_are_tensors),
+                        KeywordArg("other"),
+                        dtype_convert=True,
+                        swap_inputs=swap_binary_inputs,
+                    ),
+                }
+            )
+        for (
+            binary_unary_attr,
+            patterns,
+        ) in binary_replace_float_out_patterns.items():
+            _register_qlinear_post_op_fusion_pass(
+                patterns,
+                5,  # pass_number
+                qlinear_binary_op,  # computation_op
+                binary_unary_attr,
+            )
+
+
+@functools.lru_cache(None)
+def _register_quantization_weight_pack_pass():
+    # Step 1: Dequant promotion for int8-mixed-fp32/bf16
+    _register_dequant_promotion()
+
+    # Step 2: QConv weight prepack
+    _register_qconv_weight_prepack()
+
+    # Step 3: QLinear weight prepack
+    _register_qlinear_weight_prepack()
+    _register_linear_dynamic_fp16_weight_prepack()
+
+    # Step 4: weight prepack for SmoothQuant from Torchao
+    _register_smooth_quant_int_mm_pattern()
+
+    # Step 5: QLinear post op Fusion
+    if not torch.ops.mkldnn._is_mkldnn_acl_supported():
+        # skip fusion on ARM
+        _register_qconv_unary_fusion()
+        _register_qconv_binary_fusion()
+        _register_qlinear_unary_fusion()
+        _register_qlinear_binary_fusion()
+
+
+def quant_lift_up(module_graph: torch.fx.graph.Graph):
+    """
+    Lift up the quant node before view like nodes. It can benefit performance
+    of Attention like block. For example, we have the pattern as:
+
+             DQ
+    DQ       LINEAR
+    LINEAR   VIEW
+    VIEW     PERMUTE
+    PERMUTE  TRANSPOSE
+    Q        Q
+    DQ       DQ
+       Matmul
+        DIV
+        ADD
+      SOFTMAX
+
+    We want to lift up the the quant nodes from matmul before view like nodes
+    as the output of Linear node.
+
+             DQ
+    DQ       LINEAR
+    LINEAR   Q
+    Q        VIEW
+    VIEW     PERMUTE
+    PERMUTE  TRANSPOSE
+    DQ       DQ
+       Matmul
+        DIV
+        ADD
+      SOFTMAX
+
+    It produces a DQ->LINEAR->Q pattern which can be fused by backend.
+    """
+
+    def is_view_op(node):
+        return node.op == "call_function" and node.target in _VIEW_OPS
+
+    for node in module_graph.nodes:
+        # <TODO> Leslie: Here we verify that the quant node has exactly
+        # one input FX node, with constant scalar value for scale and zero point.
+        # For the case input of quant node has more than one input FX nodes,
+        # extend the implementation to lift up all the connected nodes
+        # before the view nodes to keep the topological order.
+        if (
+            node.op == "call_function"
+            and node.target in _PER_TENSOR_QUANTIZE_OPS
+            and len(node.all_input_nodes) == 1
+            and is_view_op(node.all_input_nodes[0])
+        ):
+            quant_node = node
+            input_node_of_quant = quant_node.args[0]
+
+            # Check the nodes along lift up path has only 1 user node
+            # Propagate view like node to find where to insert the new quant node
+            could_lift_up = True
+            current_node = quant_node
+            input_node = current_node.args[0]
+            while is_view_op(input_node):
+                if len(input_node.users) != 1:
+                    could_lift_up = False
+                    break
+                current_node = input_node
+                input_node = current_node.args[0]
+
+            # Further check the input node of the first view node has only 1 user node
+            if could_lift_up and len(input_node.users) == 1:
+                # Replace dequant's input from quant to quant's input
+                quant_node.replace_all_uses_with(input_node_of_quant)
+                # Insert the new quant node
+                with module_graph.inserting_before(current_node):
+                    new_quant_node = module_graph.node_copy(quant_node)
+                    input_node.replace_all_uses_with(new_quant_node)
+
+                    # Update inputs of new_quant_node
+                    def maybe_replace_node(n: torch.fx.Node) -> torch.fx.Node:
+                        if n == input_node_of_quant:
+                            return input_node
+                        else:
+                            return n
+
+                    new_args = map_arg(new_quant_node.args, maybe_replace_node)
+                    new_kwargs = map_arg(new_quant_node.kwargs, maybe_replace_node)
+                    new_quant_node.args = new_args  # type: ignore[assignment]
+                    new_quant_node.kwargs = new_kwargs  # type: ignore[assignment]
+                    module_graph.erase_node(quant_node)
diff --git a/torchao/quantization/pt2e/lowering.py b/torchao/quantization/pt2e/lowering.py
index 5491623b66..76dad800cd 100644
--- a/torchao/quantization/pt2e/lowering.py
+++ b/torchao/quantization/pt2e/lowering.py
@@ -24,7 +24,7 @@ def lower_pt2e_quantized_to_x86(
     * `example_inputs` (tuple[torch.Tensor, ...]): example inputs for the model.
 
     Return:
-    A GraphModule lowered to x86 backend.
+    A module lowered to x86 backend.
     """
 
     def _post_autograd_decomp_table():  # type: ignore[no-untyped-def]
diff --git a/torchao/quantization/pt2e/quantizer/x86_inductor_quantizer.py b/torchao/quantization/pt2e/quantizer/x86_inductor_quantizer.py
index 9b49cadf77..cc296ebe33 100644
--- a/torchao/quantization/pt2e/quantizer/x86_inductor_quantizer.py
+++ b/torchao/quantization/pt2e/quantizer/x86_inductor_quantizer.py
@@ -1625,3 +1625,17 @@ def _same_shape(n1: Node, n2: Node):
 
     def validate(self, model: torch.fx.GraphModule) -> None:
         pass
+
+
+# Register Inductor fusion passes
+import torch._inductor.config
+
+from torchao.quantization.pt2e.inductor_passes.x86 import (
+    _register_quantization_weight_pack_pass,
+    quant_lift_up,
+)
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_8
+
+if TORCH_VERSION_AT_LEAST_2_8:
+    torch._inductor.config.pre_grad_custom_pass = quant_lift_up
+    _register_quantization_weight_pack_pass()

From 4ee2ee1ab7c9f2b52cbffbf2c82ceab66926e53d Mon Sep 17 00:00:00 2001
From: Thien Tran <gau.nernst@yahoo.com.sg>
Date: Sat, 10 May 2025 20:31:28 +0700
Subject: [PATCH 015/165] [optim] Fix low-bit optim when used with
 FSDP2+CPUOffload (#2195)

---
 test/test_low_bit_optim.py | 25 ++++++++++++++++++-------
 torchao/optim/adam.py      |  5 +++++
 2 files changed, 23 insertions(+), 7 deletions(-)

diff --git a/test/test_low_bit_optim.py b/test/test_low_bit_optim.py
index 43941329e1..e116bf610e 100644
--- a/test/test_low_bit_optim.py
+++ b/test/test_low_bit_optim.py
@@ -11,7 +11,11 @@
 import pytest
 import torch
 from torch import nn
-from torch.distributed._composable.fsdp import fully_shard
+from torch.distributed._composable.fsdp import (
+    fully_shard,
+    CPUOffloadPolicy,
+    OffloadPolicy,
+)
 from torch.testing._internal.common_distributed import skip_if_lt_x_gpu
 from torch.testing._internal.common_fsdp import FSDPTest
 from torch.testing._internal.common_utils import (
@@ -427,16 +431,21 @@ def world_size(self) -> int:
     @skip_if_lt_x_gpu(_FSDP_WORLD_SIZE)
     @skip_if_rocm("ROCm enablement in progress")
     def test_fsdp2(self):
-        optim_classes = [optim.AdamW8bit, optim.AdamW4bit]
+        # we do this to avoid all combinations
+        args_list = [
+            (optim.AdamW8bit, OffloadPolicy),
+            (optim.AdamW4bit, OffloadPolicy),
+            (optim.AdamW8bit, CPUOffloadPolicy),
+        ]
         if torch.cuda.get_device_capability() >= (8, 9):
-            optim_classes.append(optim.AdamWFp8)
+            args_list.append((optim.AdamWFp8, OffloadPolicy))
 
         self.run_subtests(
-            {"optim_cls": optim_classes},
+            {"args": args_list},
             self._test_fsdp2,
         )
 
-    def _test_fsdp2(self, optim_cls):
+    def _test_fsdp2(self, args):
         import torch.distributed as dist
         import torch.distributed.checkpoint as dcp
         import torch.utils._pytree as pytree
@@ -447,6 +456,8 @@ def _test_fsdp2(self, optim_cls):
             TransformerBlock,
         )
 
+        optim_cls, offload_policy = args
+
         batch_size = 3
         vocab_size = 1024
         seq_len = 64
@@ -466,8 +477,8 @@ def _test_fsdp2(self, optim_cls):
         fsdp_model = copy.deepcopy(base_model)
         for m in fsdp_model.modules():
             if isinstance(m, TransformerBlock):
-                fully_shard(m)
-        fully_shard(fsdp_model)
+                fully_shard(m, offload_policy=offload_policy)
+        fully_shard(fsdp_model, offload_policy=offload_policy)
         fsdp_optim = optim_cls(fsdp_model.parameters(), lr=1e-2)
 
         torch.manual_seed(42 + self.rank + 1)
diff --git a/torchao/optim/adam.py b/torchao/optim/adam.py
index cba86897d9..ddbdc8b12f 100644
--- a/torchao/optim/adam.py
+++ b/torchao/optim/adam.py
@@ -83,6 +83,11 @@ def _new_buffer(self, p: Tensor, signed: bool):
                 stride=p.stride(),
             )
 
+        # when there is CPU offload, p.device is cpu, but device_mesh.device_type is cuda.
+        # DTensor.from_local() will move local_tensor to device_mesh.device_type.
+        # hence, we need to manually move it back to CPU.
+        # https://github.com/pytorch/pytorch/blob/bc4cf1c1/torch/distributed/tensor/_api.py#L410-L415
+        out = out.to(p.device)
         return out
 
     @torch.no_grad()

From 34f66b6382ae20b7fed55d15335da3096ba9e101 Mon Sep 17 00:00:00 2001
From: Peter Yeh <petrex@users.noreply.github.com>
Date: Sun, 11 May 2025 19:54:59 -0700
Subject: [PATCH 016/165] Skip ROCm MoE Quantization (#2191)

Add ROCm support skip for MoE quantization tests

This commit introduces a conditional skip for the MoE quantization tests when running on ROCm, indicating that support for this feature is still under development. The change ensures that tests do not fail prematurely in environments lacking complete ROCm functionality.

Test Plan:
- Run tests in environments with and without ROCm support to verify the skip behavior.
---
 test/quantization/test_moe_quant.py | 7 +++++++
 1 file changed, 7 insertions(+)

diff --git a/test/quantization/test_moe_quant.py b/test/quantization/test_moe_quant.py
index 71aadaf345..425b881dba 100644
--- a/test/quantization/test_moe_quant.py
+++ b/test/quantization/test_moe_quant.py
@@ -1,5 +1,6 @@
 import unittest
 
+import pytest
 import torch
 from parameterized import parameterized
 
@@ -32,6 +33,12 @@
     is_sm_at_least_90,
 )
 
+if torch.version.hip is not None:
+    pytest.skip(
+        "ROCm support for MoE quantization is under development",
+        allow_module_level=True,
+    )
+
 
 class TestMoEQuantCompile(unittest.TestCase):
     DEFAULT_PARAMS = (512, 256, 8, 2)  # hidden_dim, expert_dim, num_experts, top_k

From 66eb801b0c73581c74acd84f68584977697e3994 Mon Sep 17 00:00:00 2001
From: Mark Saroufim <marksaroufim@meta.com>
Date: Sun, 11 May 2025 21:24:49 -0700
Subject: [PATCH 017/165] Forward fix lint (#2197)

* Forward fix lint

* added some minor docs

* Update CONTRIBUTING.md

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

---------

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>
---
 CONTRIBUTING.md            | 10 +++++++---
 test/test_low_bit_optim.py |  2 +-
 2 files changed, 8 insertions(+), 4 deletions(-)

diff --git a/CONTRIBUTING.md b/CONTRIBUTING.md
index 04cc582066..90588cc4d3 100644
--- a/CONTRIBUTING.md
+++ b/CONTRIBUTING.md
@@ -2,9 +2,6 @@
 We want to make contributing to this project as easy and transparent as
 possible.
 
-## Our Development Process
-... (in particular how this is synced with internal changes to the project)
-
 ## Pull Requests
 We actively welcome your pull requests.
 
@@ -15,6 +12,13 @@ We actively welcome your pull requests.
 5. Make sure your code lints.
 6. If you haven't already, complete the Contributor License Agreement ("CLA").
 
+## Linting
+
+We use [ruff](https://beta.ruff.rs/docs/) for linting.
+1. `pip install ruff==0.11.6`
+2. `ruff check --fix`
+3. `ruff format .`
+
 ## Contributor License Agreement ("CLA")
 In order to accept your pull request, we need you to submit a CLA. You only need
 to do this once to work on any of Meta's open source projects.
diff --git a/test/test_low_bit_optim.py b/test/test_low_bit_optim.py
index e116bf610e..08fdfa569f 100644
--- a/test/test_low_bit_optim.py
+++ b/test/test_low_bit_optim.py
@@ -12,9 +12,9 @@
 import torch
 from torch import nn
 from torch.distributed._composable.fsdp import (
-    fully_shard,
     CPUOffloadPolicy,
     OffloadPolicy,
+    fully_shard,
 )
 from torch.testing._internal.common_distributed import skip_if_lt_x_gpu
 from torch.testing._internal.common_fsdp import FSDPTest

From 9b1256fed12b6fca7ca07c1270b138d91667e166 Mon Sep 17 00:00:00 2001
From: Jesse Cai <jessecai@meta.com>
Date: Mon, 12 May 2025 10:03:44 -0400
Subject: [PATCH 018/165] 2:4 activation sparsity packing kernels (#2012)

This PR is meant to give users the ability to accelerate LLMs with 2:4 activation sparsity, using the approach outlined in our ICLR workshop paper: https://arxiv.org/abs/2503.16672

The main contribution is a cutlass 24_fp8_pack kernel that is able to relatively efficiently calculate the packed data and metadata given a normal dense tensor, which I've copied over from xFormers.
### Performance Benchmarks

```
python benchmarks/benchmark_e2e_fp8_sparse_linear.py

|   num_tokens |   bf16_latency (us) |   bf16_c_latency (us) |   fp8_c_time (us) |   fp8_c_sparse_time (us) |   fp8_c_activation_sparse_time (us) |   speedup |
|-------------:|--------------------:|----------------------:|------------------:|-------------------------:|------------------------------------:|----------:|
|           64 |             166.816 |               163.04  |           103.008 |                   74.304 |                             102.816 |  1.00187  |
|          128 |             156.256 |               151.52  |            99.936 |                   75.456 |                             102.048 |  0.979304 |
|          256 |             172.288 |               159.584 |           114.08  |                   82.432 |                             111.072 |  1.02708  |
|          512 |             218.88  |               204.608 |           144.096 |                  114.56  |                             139.488 |  1.03304  |
|         1024 |             394.4   |               392.544 |           251.104 |                  196.416 |                             227.904 |  1.1018   |
|         2048 |             764.608 |               734.816 |           480.704 |                  381.152 |                             426.688 |  1.12659  |
|         4096 |            1658.82  |              1623.58  |           901.344 |                  779.008 |                             843.392 |  1.06871  |

```

### Tests

```
pytest tests/sparsity/test_activation24.py
```
---
 benchmarks/benchmark_e2e_fp8_sparse_linear.py | 133 +++++
 ...rk_rowwise_scaled_linear_sparse_cutlass.py |  54 +-
 .../benchmark_sparse_conversion_cutlass.py    | 124 +++++
 e2e_fp8_sparse.csv                            |   8 +
 ...led_linear_sparse_cutlass_time_results.csv |   4 +
 setup.py                                      |   1 +
 test/sparsity/test_activation24.py            | 143 ++++++
 .../cuda/activation24/compute_sparse_tile.h   | 103 ++++
 .../cuda/activation24/sparse24_metadata.h     |  81 +++
 torchao/csrc/cuda/activation24/sparsify24.cu  | 419 ++++++++++++++++
 torchao/csrc/cuda/activation24/static_sort.h  |  88 ++++
 torchao/csrc/cuda/activation24/warp_tensor.h  | 468 ++++++++++++++++++
 .../rowwise_scaled_linear_sparse_cutlass.cuh  |   2 +-
 torchao/ops.py                                |  84 ++++
 .../prototype/sparsity/activation/__init__.py |   0
 .../sparsity/activation/srelu_linear.py       |  87 ++++
 .../prototype/sparsity/activation/utils.py    | 115 +++++
 torchao/sparsity/utils.py                     |   2 +-
 18 files changed, 1906 insertions(+), 10 deletions(-)
 create mode 100644 benchmarks/benchmark_e2e_fp8_sparse_linear.py
 create mode 100644 benchmarks/benchmark_sparse_conversion_cutlass.py
 create mode 100644 e2e_fp8_sparse.csv
 create mode 100644 rowwise_scaled_linear_sparse_cutlass_time_results.csv
 create mode 100644 test/sparsity/test_activation24.py
 create mode 100644 torchao/csrc/cuda/activation24/compute_sparse_tile.h
 create mode 100644 torchao/csrc/cuda/activation24/sparse24_metadata.h
 create mode 100644 torchao/csrc/cuda/activation24/sparsify24.cu
 create mode 100644 torchao/csrc/cuda/activation24/static_sort.h
 create mode 100644 torchao/csrc/cuda/activation24/warp_tensor.h
 create mode 100644 torchao/prototype/sparsity/activation/__init__.py
 create mode 100644 torchao/prototype/sparsity/activation/srelu_linear.py
 create mode 100644 torchao/prototype/sparsity/activation/utils.py

diff --git a/benchmarks/benchmark_e2e_fp8_sparse_linear.py b/benchmarks/benchmark_e2e_fp8_sparse_linear.py
new file mode 100644
index 0000000000..fbab8c0671
--- /dev/null
+++ b/benchmarks/benchmark_e2e_fp8_sparse_linear.py
@@ -0,0 +1,133 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+import pandas as pd
+import torch
+from torch import nn
+from tqdm import tqdm
+from triton.testing import do_bench
+
+from torchao.prototype.sparsity.activation.srelu_linear import (
+    SRELUFloat8SemiSparseDynamicActivationFloat8WeightConfig,
+)
+from torchao.prototype.sparsity.activation.utils import SquaredReLU
+from torchao.quantization import (
+    Float8DynamicActivationFloat8SemiSparseWeightConfig,
+    Float8DynamicActivationFloat8WeightConfig,
+    Float8MMConfig,
+    PerRow,
+    quantize_,
+)
+
+
+def benchmark_microseconds(f, *args):
+    return do_bench(lambda: f(*args), return_mode="median") * 1e3
+
+
+def benchmark(num_tokens, hidden_size=8192, intermediate_size=8192):
+    ffn_ref = (
+        nn.Sequential(
+            nn.Linear(hidden_size, intermediate_size, bias=False),
+            SquaredReLU(),
+            nn.Linear(intermediate_size, hidden_size, bias=False),
+        )
+        .to(torch.bfloat16)
+        .cuda()
+    )
+
+    input_tensor = torch.randn(num_tokens, hidden_size).to(torch.bfloat16).cuda()
+    fp16_time = benchmark_microseconds(ffn_ref, input_tensor)
+
+    # bf16
+    ffn_clone = (
+        nn.Sequential(
+            nn.Linear(hidden_size, intermediate_size, bias=False),
+            SquaredReLU(),
+            nn.Linear(intermediate_size, hidden_size, bias=False),
+        )
+        .to(torch.bfloat16)
+        .cuda()
+    )
+    ffn_clone.forward = torch.compile(ffn_clone.forward, fullgraph=True)
+    fp16_c_time = benchmark_microseconds(ffn_clone, input_tensor)
+
+    # fp8
+    ffn_clone = (
+        nn.Sequential(
+            nn.Linear(hidden_size, intermediate_size, bias=False),
+            SquaredReLU(),
+            nn.Linear(intermediate_size, hidden_size, bias=False),
+        )
+        .to(torch.bfloat16)
+        .cuda()
+    )
+    quantize_(
+        ffn_clone,
+        Float8DynamicActivationFloat8WeightConfig(
+            granularity=PerRow(), mm_config=Float8MMConfig(use_fast_accum=True)
+        ),
+    )
+    ffn_clone.forward = torch.compile(ffn_clone.forward, fullgraph=True)
+    fp8_c_time = benchmark_microseconds(ffn_clone, input_tensor)
+
+    # fp8 sparse
+    ffn_clone = (
+        nn.Sequential(
+            nn.Linear(hidden_size, intermediate_size, bias=False),
+            SquaredReLU(),
+            nn.Linear(intermediate_size, hidden_size, bias=False),
+        )
+        .to(torch.bfloat16)
+        .cuda()
+    )
+    quantize_(ffn_clone, Float8DynamicActivationFloat8SemiSparseWeightConfig())
+    ffn_clone.forward = torch.compile(ffn_clone.forward, fullgraph=True)
+    fp8_c_sparse_time = benchmark_microseconds(ffn_clone, input_tensor)
+
+    # activation fp8 sparse
+    ffn_clone = (
+        nn.Sequential(
+            nn.Linear(hidden_size, intermediate_size, bias=False),
+            # no Squared RELU since it will be fused into the second linear
+            nn.Linear(intermediate_size, hidden_size, bias=False),
+        )
+        .to(torch.bfloat16)
+        .cuda()
+    )
+    quantize_(
+        ffn_clone[0],
+        Float8DynamicActivationFloat8WeightConfig(
+            granularity=PerRow(), mm_config=Float8MMConfig(use_fast_accum=True)
+        ),
+    )
+    quantize_(
+        ffn_clone,
+        SRELUFloat8SemiSparseDynamicActivationFloat8WeightConfig(),
+        filter_fn=lambda mod, fqn: "1" in fqn,
+    )
+    ffn_clone.forward = torch.compile(ffn_clone.forward, fullgraph=True)
+    fp8_c_activation_sparse_time = benchmark_microseconds(ffn_clone, input_tensor)
+
+    return {
+        "num_tokens": num_tokens,
+        "bf16_latency (us)": fp16_time,
+        "bf16_c_latency (us)": fp16_c_time,
+        "fp8_c_time (us)": fp8_c_time,
+        "fp8_c_sparse_time (us)": fp8_c_sparse_time,
+        "fp8_c_activation_sparse_time (us)": fp8_c_activation_sparse_time,
+        "speedup": fp8_c_time / fp8_c_activation_sparse_time,
+    }
+
+
+if __name__ == "__main__":
+    with torch.no_grad():
+        results = []
+        for num_tokens in tqdm([64, 128, 256, 512, 1024, 2048, 4096]):
+            results.append(benchmark(num_tokens))
+            torch.compiler.reset()
+
+        df = pd.DataFrame(results)
+        df.to_csv("e2e_fp8_sparse.csv", index=False)
+        print(df.to_markdown(index=False))
diff --git a/benchmarks/benchmark_rowwise_scaled_linear_sparse_cutlass.py b/benchmarks/benchmark_rowwise_scaled_linear_sparse_cutlass.py
index 40e2918805..3c07395e62 100644
--- a/benchmarks/benchmark_rowwise_scaled_linear_sparse_cutlass.py
+++ b/benchmarks/benchmark_rowwise_scaled_linear_sparse_cutlass.py
@@ -16,7 +16,7 @@
 from torchao.sparsity.utils import create_semi_structured_tensor
 
 dtype = torch.bfloat16
-dtypeq_X = torch.float8_e5m2
+dtypeq_X = torch.float8_e4m3fn
 dtypeq_W = torch.float8_e4m3fn
 device = torch.device("cuda")
 
@@ -25,7 +25,7 @@ def benchmark_microseconds(f, *args):
     return do_bench(lambda: f(*args), return_mode="median") * 1e3
 
 
-def get_problem(m: int, n: int, k: int):
+def get_problem_cutlass(m: int, n: int, k: int):
     X_ref = torch.randn((m, k), dtype=dtype, device=device)
     W_ref = create_semi_structured_tensor(n, k, dtype=dtype).to(device)
 
@@ -45,30 +45,68 @@ def get_problem(m: int, n: int, k: int):
     return (X_ref, W_ref), (Xq, X_scale, Wq_sparse, W_meta, W_scale, bias, out_dtype)
 
 
+def get_problem_cusparselt(m: int, n: int, k: int):
+    X_ref = torch.randn((m, k), dtype=dtype, device=device)
+    W_ref = create_semi_structured_tensor(n, k, dtype=dtype).to(device)
+
+    Xq = X_ref.to(dtypeq_W)
+    Wq = W_ref.to(dtypeq_W)
+
+    Wqs = torch._cslt_compress(Wq)
+
+    alg_id, split_k, split_k_one_kernel, _ = torch._C._cusparselt.mm_search(
+        Wqs, Xq.t(), None, None, None, False
+    )
+
+    return (Wqs, Xq.t(), None, None, dtype, False, alg_id, split_k, split_k_one_kernel)
+
+
+def get_problem_scaled_mm(m: int, n: int, k: int):
+    X_ref = torch.randn((m, k), dtype=dtype, device=device)
+    W_ref = create_semi_structured_tensor(n, k, dtype=dtype).to(device)
+
+    X_aqt = _float8_cutlass_quant(X_ref, dtypeq_W)
+    W_aqt = _float8_cutlass_quant(W_ref, dtypeq_W)
+
+    Xq = X_aqt.tensor_impl.float8_data
+    Wq = W_aqt.tensor_impl.float8_data
+    X_scale = X_aqt.tensor_impl.scale.unsqueeze(0)
+    W_scale = W_aqt.tensor_impl.scale.unsqueeze(-1)
+
+    return (Wq, Xq.t(), W_scale, X_scale, None, None, dtype)
+
+
 def benchmark(m: int, k: int, n: int):
-    ref_args, args = get_problem(m, n, k)
+    ref_args, args = get_problem_cutlass(m, n, k)
     fp16_time = benchmark_microseconds(torch.nn.functional.linear, *ref_args)
     rowwise_scaled_linear_sparse_cutlass_f8f8_time = benchmark_microseconds(
         rowwise_scaled_linear_sparse_cutlass_f8f8, *args
     )
 
+    cslt_args = get_problem_cusparselt(m, n, k)
+    cusparselt_time = benchmark_microseconds(torch._cslt_sparse_mm, *cslt_args)
+
+    fp8_args = get_problem_scaled_mm(m, n, k)
+    fp8_time = benchmark_microseconds(torch._scaled_mm, *fp8_args)
+
     return {
         "m": m,
         "k": k,
         "n": n,
         "fp16_latency (ms)": fp16_time,
+        "fp8_latency (ms)": fp8_time,
         "rowwise_scaled_linear_sparse_cutlass_f8f8 latency (ms)": rowwise_scaled_linear_sparse_cutlass_f8f8_time,
-        "f8f8 speedup (d/s)": fp16_time
-        / rowwise_scaled_linear_sparse_cutlass_f8f8_time,
+        "cusparselt latency (ms)": cusparselt_time,
+        "f8f8 speedup (d/s)": fp8_time / rowwise_scaled_linear_sparse_cutlass_f8f8_time,
     }
 
 
 if __name__ == "__main__":
-    k_vals = (8192, 8192, 8192, 28672)
-    n_vals = (8192, 10240, 57344, 8192)
+    k_vals = (8192,)
+    n_vals = (8192,)
 
     results = []
-    for m in tqdm([1 << i for i in range(10)]):
+    for m in tqdm([2048, 4096, 8192]):
         for n, k in zip(n_vals, k_vals):
             results.append(benchmark(m, k, n))
 
diff --git a/benchmarks/benchmark_sparse_conversion_cutlass.py b/benchmarks/benchmark_sparse_conversion_cutlass.py
new file mode 100644
index 0000000000..ea45316def
--- /dev/null
+++ b/benchmarks/benchmark_sparse_conversion_cutlass.py
@@ -0,0 +1,124 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+import pandas as pd
+import torch
+from triton.testing import do_bench
+
+from torchao.ops import (
+    to_sparse_semi_structured_cutlass_sm9x_f8,
+)
+from torchao.quantization.quant_api import (
+    _float8_cutlass_quant,
+    _float8_cutlass_quant_sparse,
+)
+from torchao.sparsity.utils import create_semi_structured_tensor
+
+dtype = torch.bfloat16
+dtypeq_X = torch.float8_e4m3fn
+dtypeq_W = torch.float8_e4m3fn
+device = torch.device("cuda")
+
+
+def benchmark_microseconds(f, *args):
+    return do_bench(lambda: f(*args), return_mode="median") * 1e3
+
+
+def get_problem_cutlass(m: int, n: int, k: int):
+    X_ref = torch.randn((m, k), dtype=dtype, device=device)
+    W_ref = create_semi_structured_tensor(n, k, dtype=dtype).to(device)
+
+    X_quant_func = _float8_cutlass_quant
+    W_quant_func = _float8_cutlass_quant_sparse
+    X_aqt = X_quant_func(X_ref, dtypeq_X)
+    W_aqt = W_quant_func(W_ref, dtypeq_W)
+
+    Xq = X_aqt.tensor_impl.float8_data
+    X_scale = X_aqt.tensor_impl.scale
+    Wq_sparse = W_aqt.tensor_impl.sparse
+    W_meta = W_aqt.tensor_impl.meta
+    W_scale = W_aqt.tensor_impl.scale
+    bias = None
+    out_dtype = dtype
+
+    return (X_ref, W_ref), (Xq, X_scale, Wq_sparse, W_meta, W_scale, bias, out_dtype)
+
+
+def get_problem_cusparselt(m: int, n: int, k: int):
+    X_ref = torch.randn((m, k), dtype=dtype, device=device)
+    W_ref = create_semi_structured_tensor(n, k, dtype=dtype).to(device)
+
+    Xq = X_ref.to(dtypeq_W)
+    Wq = W_ref.to(dtypeq_W)
+
+    Wqs = torch._cslt_compress(Wq)
+
+    alg_id, split_k, split_k_one_kernel, _ = torch._C._cusparselt.mm_search(
+        Wqs, Xq.t(), None, None, None, False
+    )
+
+    return (Wqs, Xq.t(), None, None, dtype, False, alg_id, split_k, split_k_one_kernel)
+
+
+def get_problem_scaled_mm(m: int, n: int, k: int):
+    X_ref = torch.randn((m, k), dtype=dtype, device=device)
+    W_ref = create_semi_structured_tensor(n, k, dtype=dtype).to(device)
+
+    X_aqt = _float8_cutlass_quant(X_ref, dtypeq_W)
+    W_aqt = _float8_cutlass_quant(W_ref, dtypeq_W)
+
+    Xq = X_aqt.tensor_impl.float8_data
+    Wq = W_aqt.tensor_impl.float8_data
+    X_scale = X_aqt.tensor_impl.scale.unsqueeze(0)
+    W_scale = W_aqt.tensor_impl.scale.unsqueeze(-1)
+
+    return (Wq, Xq.t(), W_scale, X_scale, None, None, dtype)
+
+
+def benchmark(m, k):
+    torch.manual_seed(123)
+    W_ref = create_semi_structured_tensor(m, k, dtype=torch.float8_e4m3fn).cuda()
+
+    # packed, meta = torch.ops.torchao.sparse_semi_structured_tile.default(W_ref, "", True)
+    cutlass_reference_args = (W_ref,)
+    cutlass_custom_args = (W_ref, "", True)
+
+    cutlass_reference_compression_time = benchmark_microseconds(
+        to_sparse_semi_structured_cutlass_sm9x_f8, *cutlass_reference_args
+    )
+    cutlass_custom_compression_time = benchmark_microseconds(
+        torch.ops.torchao.sparse_semi_structured_tile.default, *cutlass_custom_args
+    )
+
+    return {
+        "cutlass_reference (ms)": cutlass_reference_compression_time,
+        "cutlass_custom (ms)": cutlass_custom_compression_time,
+    }
+
+
+def profile():
+    torch.manual_seed(123)
+    W_ref = create_semi_structured_tensor(8192, 8192, dtype=torch.float8_e4m3fn).cuda()
+
+    # clear cache
+    new_val = torch.empty(10000, 10000, device="cuda")
+    new_val[:, :] = 0
+
+    packed, meta = torch.ops.torchao.sparse_semi_structured_tile.default(
+        W_ref, "", True
+    )
+
+
+if __name__ == "__main__":
+    results = []
+    for m in (2048, 4096, 8192):
+        results.append(benchmark(m, 8192))
+
+    df = pd.DataFrame(results)
+    df.to_csv("rowwise_scaled_linear_sparse_cutlass_time_results.csv", index=False)
+    print(df.to_markdown(index=False))
+
+    # print("PROFILING")
+    # profile()
diff --git a/e2e_fp8_sparse.csv b/e2e_fp8_sparse.csv
new file mode 100644
index 0000000000..05a80e13b7
--- /dev/null
+++ b/e2e_fp8_sparse.csv
@@ -0,0 +1,8 @@
+num_tokens,bf16_latency (us),bf16_c_latency (us),fp8_c_time (us),fp8_c_sparse_time (us),fp8_c_activation_sparse_time (us),speedup
+64,166.81599617004395,163.03999722003937,103.00800204277039,74.30399954319,102.81600058078766,1.0018674278409796
+128,156.25600516796112,151.5199989080429,99.93600100278854,75.45600086450577,102.04800218343735,0.9793038458817415
+256,172.28800058364868,159.58400070667267,114.07999694347382,82.43200182914734,111.07199639081955,1.0270815385551393
+512,218.87999773025513,204.6079933643341,144.0960019826889,114.56000059843063,139.48799669742584,1.0330351384661336
+1024,394.4000005722046,392.5440013408661,251.10399723052979,196.4160054922104,227.90400683879852,1.1017972027501084
+2048,764.6080255508423,734.8160147666931,480.70400953292847,381.1520040035248,426.68798565864563,1.1265937305239622
+4096,1658.8159799575806,1623.5840320587158,901.3440012931824,779.0079712867737,843.392014503479,1.0687129896811043
diff --git a/rowwise_scaled_linear_sparse_cutlass_time_results.csv b/rowwise_scaled_linear_sparse_cutlass_time_results.csv
new file mode 100644
index 0000000000..09bea2f9bd
--- /dev/null
+++ b/rowwise_scaled_linear_sparse_cutlass_time_results.csv
@@ -0,0 +1,4 @@
+m,k,n,fp16_latency (ms),fp8_latency (ms),rowwise_scaled_linear_sparse_cutlass_f8f8 latency (ms),cusparselt latency (ms),f8f8 speedup (d/s)
+2048,8192,8192,345.7919955253601,243.13600361347198,159.7760021686554,634.2080235481262,1.5217304245528933
+4096,8192,8192,756.3199996948242,500.2880096435547,363.647997379303,628.7999749183655,1.3757480124982768
+8192,8192,8192,1433.568000793457,982.5279712677002,895.3920006752014,859.935998916626,1.0973160029649482
diff --git a/setup.py b/setup.py
index 3cb08b3a35..24d7be20de 100644
--- a/setup.py
+++ b/setup.py
@@ -382,6 +382,7 @@ def get_extensions():
                     "to_sparse_semi_structured_cutlass_sm9x",
                     "to_sparse_semi_structured_cutlass_sm9x_f8.cu",
                 ),
+                os.path.join(extensions_cuda_dir, "activation24", "sparsify24.cu"),
             ]
             for dtypes in ["e4m3e4m3", "e4m3e5m2", "e5m2e4m3", "e5m2e5m2"]:
                 cutlass_90a_sources.append(
diff --git a/test/sparsity/test_activation24.py b/test/sparsity/test_activation24.py
new file mode 100644
index 0000000000..65b7cfd8d2
--- /dev/null
+++ b/test/sparsity/test_activation24.py
@@ -0,0 +1,143 @@
+import torch
+import torch.nn.functional as F
+
+from torchao.ops import to_sparse_semi_structured_cutlass_sm9x_f8
+from torchao.quantization import (
+    Float8DynamicActivationFloat8WeightConfig,
+    Float8MMConfig,
+    PerRow,
+    quantize_,
+)
+
+torch.sparse.SparseSemiStructuredTensor._FORCE_CUTLASS = True
+
+import copy
+import unittest
+
+from torchao.prototype.sparsity.activation.srelu_linear import (
+    SRELUFloat8SemiSparseDynamicActivationFloat8WeightConfig,
+)
+from torchao.sparsity import sparsify_
+from torchao.sparsity.utils import create_semi_structured_tensor
+from torchao.utils import is_sm_at_least_90
+
+
+@unittest.skipIf(not is_sm_at_least_90(), "Need cuda arch greater than SM90")
+def test_sparse24_sm90_sparsify_identity(
+    M=512, K=1024, fp8=torch.float8_e4m3fn
+) -> None:
+    torch.manual_seed(0)
+    A_sp_ref = create_semi_structured_tensor(M, K, dtype=torch.bfloat16).cuda()
+
+    # Test with act="identity"
+    A_packed_ref, A_mdata_ref = to_sparse_semi_structured_cutlass_sm9x_f8(
+        A_sp_ref.to(fp8)
+    )
+    A_packed, A_mdata = torch.ops.torchao.sparse24_sm90_sparsify(
+        A_sp_ref,
+        "cutlass",
+        "identity",
+        sp_selection_algo="largest",
+        dtype=A_packed_ref.dtype,
+    )
+
+    # Note: sparsification is not deterministic (eg if 3 items have the same value in a block of 4 for instance)
+    # so we allow a tiny margin for error
+    assert (A_packed != A_packed_ref).float().mean().item() < 0.005
+    assert (A_mdata != A_mdata_ref).float().mean().item() < 0.005
+    # The sum should always match though
+    assert torch.allclose(A_packed.float().sum(), A_packed_ref.float().sum())
+
+
+@unittest.skipIf(not is_sm_at_least_90(), "Need cuda arch greater than SM90")
+def test_sparse24_sm90_sparsify_identity_scaled(
+    M=512, K=1024, fp8=torch.float8_e4m3fn
+) -> None:
+    torch.manual_seed(0)
+    A_dense = create_semi_structured_tensor(M, K, dtype=torch.bfloat16).cuda()
+    A_scale = torch.randn([M, 1], device="cuda", dtype=torch.float32).abs() + 0.1
+    A_sp_ref = (A_dense / A_scale).bfloat16()
+
+    A_packed_ref, A_mdata_ref = to_sparse_semi_structured_cutlass_sm9x_f8(
+        A_sp_ref.to(fp8)
+    )
+    A_packed, A_mdata = torch.ops.torchao.sparse24_sm90_sparsify(
+        A_dense,
+        "cutlass",
+        "identity",
+        sp_selection_algo="largest",
+        dtype=A_packed_ref.dtype,
+        scale=A_scale,
+    )
+    assert (A_packed != A_packed_ref).float().mean().item() < 0.05
+    assert (A_mdata != A_mdata_ref).float().mean().item() < 0.005
+    assert torch.allclose(
+        A_packed.float().sum(), A_packed_ref.float().sum(), rtol=0.001
+    )
+
+
+@unittest.skipIf(not is_sm_at_least_90(), "Need cuda arch greater than SM90")
+def test_sparse24_sm90_sparsify_srelu(M=512, K=1024, fp8=torch.float8_e4m3fn) -> None:
+    torch.manual_seed(0)
+    A_dense = create_semi_structured_tensor(M, K, dtype=torch.bfloat16).cuda()
+    A_sp_ref = (A_dense.float().relu() ** 2).bfloat16()
+
+    # Test with act="srelu"
+    # NOTE: Due to different rounding strategies, and way more zeros, we don't have the exact same
+    # bitwise packed values, so we bump up the margin here
+    A_packed_ref, _A_mdata_ref = to_sparse_semi_structured_cutlass_sm9x_f8(
+        A_sp_ref.to(fp8)
+    )
+    A_packed, _A_mdata = torch.ops.torchao.sparse24_sm90_sparsify(
+        A_dense,
+        "cutlass",
+        "srelu",
+        sp_selection_algo="largest",
+        dtype=A_packed_ref.dtype,
+    )
+    assert torch.allclose(
+        A_packed.float().sum(), A_packed_ref.float().sum(), rtol=0.005
+    )
+    assert (A_packed != A_packed_ref).float().mean().item() < 0.1
+
+
+@unittest.skipIf(not is_sm_at_least_90(), "Need cuda arch greater than SM90")
+def test_srelu_fp8_semi_sparse_activation_linear(M=512, K=2048, N=1024):
+    with torch.no_grad():
+        torch.manual_seed(0)
+        input_tensor = create_semi_structured_tensor(M, K, dtype=torch.bfloat16).cuda()
+        # we have to wrap in a sequential block for quantize_ to work properly
+        reference_linear = torch.nn.Sequential(
+            torch.nn.Linear(K, N, bias=False).cuda().to(torch.bfloat16)
+        )
+        reference_linear_copy = copy.deepcopy(reference_linear)
+
+        quantize_(
+            reference_linear,
+            Float8DynamicActivationFloat8WeightConfig(
+                granularity=PerRow(), mm_config=Float8MMConfig(use_fast_accum=False)
+            ),
+        )
+
+        # define reference implementation
+        def srelu_linear(x):
+            x = F.relu(x) ** 2
+            return reference_linear(x)
+
+        reference_srelu = torch.compile(srelu_linear, fullgraph=True)
+
+        # this only works with fullgraph=True, errors in eager
+        # TODO figure out exactly why this happens
+        sparsify_(
+            reference_linear_copy,
+            SRELUFloat8SemiSparseDynamicActivationFloat8WeightConfig(),
+        )
+        # (reference_linear_copy)
+        reference_linear_copy.forward = torch.compile(
+            reference_linear_copy.forward, fullgraph=True
+        )
+
+        reference_output = reference_srelu(input_tensor)
+        custom_output = reference_linear_copy(input_tensor)
+
+        torch.testing.assert_close(reference_output, custom_output, rtol=0.1, atol=0.01)
diff --git a/torchao/csrc/cuda/activation24/compute_sparse_tile.h b/torchao/csrc/cuda/activation24/compute_sparse_tile.h
new file mode 100644
index 0000000000..e92a368199
--- /dev/null
+++ b/torchao/csrc/cuda/activation24/compute_sparse_tile.h
@@ -0,0 +1,103 @@
+#pragma once
+
+#include <cutlass/bfloat16.h>
+#include <cutlass/half.h>
+
+// #include "sparse24_pack.h"
+#include <cutlass/arch/memory.h>
+#include <cutlass/array.h>
+#include <cutlass/bfloat16.h>
+#include <cutlass/fast_math.h>
+#include <cutlass/half.h>
+#include <cutlass/integer_subbyte.h>
+#include "static_sort.h"
+
+// Given 4x4 values, computes the selected indices that will remain after 2:4
+// sparsification, as a bitmask.
+// NOTE: Algorithms might select LESS than 8 values in total in some cases.
+
+namespace torchao {
+
+using cutlass::uint1b_t;
+using cutlass::uint2b_t;
+using cutlass::uint4b_t;
+using uint8b_t = cutlass::integer_subbyte<8, false>;
+using ElementInputE = uint16_t;
+
+// Operations that we can apply to rank the values
+struct IdentityOp {
+  template <typename T>
+  static T CUTLASS_HOST_DEVICE to_ordered(T const& x) {
+    return x;
+  }
+};
+// Can be applied to rank based on absolute value
+struct AbsOp {
+  template <typename T>
+  static uint16_t CUTLASS_HOST_DEVICE to_ordered(T const& x) {
+    return cutlass::abs(x).storage;
+  }
+};
+
+template <typename Element, typename Pointwise>
+struct TileValueOrderedT {
+  using ElementCmp = decltype(Pointwise::to_ordered(Element(0)));
+  union {
+    struct {
+      ElementCmp cmp;
+      Element value;
+      uint2b_t col;
+      uint2b_t row;
+    } parts;
+    uint32_t raw;
+  };
+  CUTLASS_DEVICE bool operator<(
+      TileValueOrderedT<Element, Pointwise> const& other) const {
+    return parts.cmp < other.parts.cmp;
+  }
+  CUTLASS_DEVICE TileValueOrderedT() {}
+  CUTLASS_DEVICE TileValueOrderedT(Element value, int col, int row = 0) {
+    parts.value = value;
+    parts.row = uint2b_t{row};
+    parts.col = uint2b_t{col};
+    parts.cmp = Pointwise::to_ordered(value);
+  }
+};
+
+template <typename Op>
+struct Top2 {
+  template <typename ElementT>
+  CUTLASS_DEVICE int operator()(
+      cutlass::Array<ElementT, 4> values,
+      cutlass::Array<ElementT, 2>& packed) const {
+    using TileValueOrdered = TileValueOrderedT<ElementT, Op>;
+    cutlass::Array<TileValueOrdered, 4> values_ordered;
+    CUTLASS_PRAGMA_UNROLL
+    for (int i = 0; i < 4; ++i) {
+      values_ordered[i] = TileValueOrdered(values[i].get(), i);
+    }
+    StaticSort<4> sorter;
+    sorter(values_ordered);
+    TileValueOrdered first, second;
+    first = values_ordered[3];
+    second = values_ordered[2];
+    if (first.parts.col > second.parts.col) {
+      TileValueOrdered tmp;
+      tmp = first;
+      first = second;
+      second = tmp;
+    }
+    packed[0] = first.parts.value;
+    packed[1] = second.parts.value;
+    // returns bitmask of select elements
+    return first.parts.col | (second.parts.col << 2);
+  }
+};
+
+template <typename T>
+void named_algorithms_oneway(T callback) {
+  callback(Top2<IdentityOp>(), "largest");
+  callback(Top2<AbsOp>(), "largest_abs");
+}
+
+} // namespace torchao
diff --git a/torchao/csrc/cuda/activation24/sparse24_metadata.h b/torchao/csrc/cuda/activation24/sparse24_metadata.h
new file mode 100644
index 0000000000..46b268407b
--- /dev/null
+++ b/torchao/csrc/cuda/activation24/sparse24_metadata.h
@@ -0,0 +1,81 @@
+#pragma once
+#include <torch/library.h>
+#include <torch/types.h>
+#include "compute_sparse_tile.h"
+
+namespace torchao{
+template <typename ElementCutlass>
+struct CutlassToAt;
+
+template <>
+struct CutlassToAt<cutlass::half_t> {
+  static auto constexpr value = at::ScalarType::Half;
+};
+template <>
+struct CutlassToAt<cutlass::bfloat16_t> {
+  static auto constexpr value = at::ScalarType::BFloat16;
+};
+template <>
+struct CutlassToAt<cutlass::float_e4m3_t> {
+  static auto constexpr value = at::ScalarType::Float8_e4m3fn;
+};
+template <>
+struct CutlassToAt<uint16_t> {
+  static auto constexpr value = at::ScalarType::UInt16;
+};
+template <>
+struct CutlassToAt<int32_t> {
+  static auto constexpr value = at::ScalarType::Int;
+};
+template <>
+struct CutlassToAt<uint8_t> {
+  static auto constexpr value = at::ScalarType::Byte;
+};
+template <>
+struct CutlassToAt<float> {
+  static auto constexpr value = at::ScalarType::Float;
+};
+
+struct MetadataCutlass8bitsSm90 {
+  template <typename ElementOut>
+  static std::tuple<at::Tensor, at::Tensor> createTensors(at::Tensor input) {
+    auto n_rows = input.size(0);
+    auto n_cols = input.size(1);
+    TORCH_CHECK(n_cols % 128 == 0); // aligned metadata
+    TORCH_CHECK(n_rows % 64 == 0); // aligned metadata
+
+    at::Tensor packed = at::empty(
+        {n_rows, n_cols / 2},
+        input.options().dtype(CutlassToAt<ElementOut>::value));
+    at::Tensor mdata =
+        at::empty({n_rows, n_cols / 8}, input.options().dtype(at::ScalarType::Byte));
+    return std::make_tuple(packed, mdata);
+  }
+  static CUTLASS_HOST_DEVICE int64_t
+  mdataBlockPtrOffset(int row, int col, int64_t n_rows) {
+    constexpr int kStrideRow = 16;
+    return row * kStrideRow + (col / 128 * n_rows * 16) + (col % 128) / 8;
+  }
+};
+
+struct MetadataCusparseLt16bitsSm90 {
+  template <typename ElementOut>
+  static std::tuple<at::Tensor, at::Tensor> createTensors(at::Tensor input) {
+    auto n_rows = input.size(0);
+    auto n_cols = input.size(1);
+    int packed_elements = n_rows * n_cols / 2;
+    int mdata_bytes = n_rows * n_cols / 8;
+
+    // We assume 2 bytes per element
+    at::Tensor sparse_packed = at::empty(
+        {int64_t(packed_elements + mdata_bytes / sizeof(ElementOut))},
+        input.options().dtype(CutlassToAt<ElementOut>::value));
+    using namespace torch::indexing;
+    return std::make_tuple(
+        sparse_packed,
+        sparse_packed.index({Slice(packed_elements, None)})
+            .view(at::ScalarType::Byte));
+  }
+};
+
+} // namespace torchao
diff --git a/torchao/csrc/cuda/activation24/sparsify24.cu b/torchao/csrc/cuda/activation24/sparsify24.cu
new file mode 100644
index 0000000000..e8949fa5d8
--- /dev/null
+++ b/torchao/csrc/cuda/activation24/sparsify24.cu
@@ -0,0 +1,419 @@
+#include <ATen/ScalarOps.h>
+#include <ATen/Tensor.h>
+#include <ATen/autocast_mode.h>
+#include <c10/cuda/CUDAGuard.h>
+#include <torch/library.h>
+#include <torch/types.h>
+
+#include "compute_sparse_tile.h"
+#include "sparse24_metadata.h"
+#include "warp_tensor.h"
+
+using namespace torchao;
+
+namespace {
+// ############################################
+// # CUSPARSELT - 16bits
+// ############################################
+template <typename P>
+__global__ void sparse24_sm90_cusparselt16bits_sparsify_kernel(P p);
+struct MetadataCusparseLt16bits {
+  static constexpr auto kBlockSize0 = 64;
+  static constexpr auto kBlockSize1 = 64;
+  static constexpr auto kNumWarpsPerCTA = 2;
+
+  template <typename ElementOut>
+  static std::tuple<at::Tensor, at::Tensor> createTensors(at::Tensor input) {
+    return MetadataCusparseLt16bitsSm90::template createTensors<ElementOut>(
+        input);
+  }
+
+  template <typename P>
+  CUTLASS_DEVICE static void run(P p) {
+    using Element = typename P::ElementIn; // same as ElementOut
+
+    constexpr int kSmemStride0 = kBlockSize1 / 8 + 1;
+    __shared__ uint32_t smem[kBlockSize0 * kSmemStride0];
+
+    int block_id = blockIdx.x;
+    int num_blocks_rows = p.n_rows / kBlockSize0;
+    int num_blocks_cols = p.n_cols / kBlockSize1;
+
+    int block_row = (block_id / num_blocks_cols) * kBlockSize0;
+    int block_col = (block_id % num_blocks_cols) * kBlockSize1;
+
+    int warp_id = threadIdx.x / 32;
+    WarpTensor<Element, 4, 64> load_dense_tensor;
+    int warp_row = warp_id * load_dense_tensor.kRows;
+    CUTLASS_PRAGMA_UNROLL
+    for (int it_row = 0; it_row < kBlockSize0;
+         it_row += kNumWarpsPerCTA * load_dense_tensor.kRows) {
+      CUTLASS_PRAGMA_UNROLL
+      for (int it_col = 0; it_col < kBlockSize1;
+           it_col += load_dense_tensor.kCols) {
+        // gmem -> RF
+        load_dense_tensor.load(
+            p.input_ptr + (it_row + warp_row + block_row) * p.input_s0 +
+                it_col + block_col,
+            p.input_s0);
+
+        // RF -> RF (sparsify)
+        auto [packed, mdata] = load_dense_tensor.sparsify_pack(p.algo);
+
+        // RF -> RF (apply sparsity)
+        packed.data = p.activation(packed.data);
+
+        // RF -> gmem (packed data)
+        packed.store(
+            p.output_ptr + (it_row + warp_row + block_row) * p.output_s0 +
+                (it_col + block_col) / 2,
+            p.output_s0);
+
+        // RF -> smem (mdata)
+        mdata.template store_32bits<kSmemStride0, 1>(
+            smem + (warp_row + it_row) * kSmemStride0 + it_col / 8);
+      }
+    }
+    __syncthreads();
+
+    WarpTensor<uint8_t, 16, 32 / 8> mdata_tensor;
+    int warp_col = warp_id * (8 * mdata_tensor.kCols);
+    static_assert(kBlockSize0 % mdata_tensor.kRows == 0);
+    static_assert(kBlockSize1 % mdata_tensor.kCols == 0);
+    CUTLASS_PRAGMA_UNROLL
+    for (int it_row = 0; it_row < kBlockSize0; it_row += mdata_tensor.kRows) {
+      CUTLASS_PRAGMA_UNROLL
+      for (int it_col = 0; it_col < kBlockSize1;
+           it_col += kNumWarpsPerCTA * (8 * mdata_tensor.kCols)) {
+        mdata_tensor.template load_32bits<kSmemStride0, 1>(
+            smem + it_row * kSmemStride0 + (it_col + warp_col) / 8);
+
+        int current_col = warp_col + it_col + block_col;
+        int current_row = it_row + block_row;
+        int idx = (current_col / 32) * 256;
+        idx +=
+            ((current_row % 8) * 8 + ((current_row % 64) / 16) * 64 +
+             (current_row / 64) * 8 * p.n_cols);
+        store_metadata_reordered(mdata_tensor, p.mdata_ptr + idx);
+      }
+    }
+  }
+
+  template <typename P>
+  static void launch_kernel(P p) {
+    TORCH_CHECK(
+        p.scale_ptr == nullptr, "cusparselt kernel does not support scaling");
+    int num_blocks = cutlass::ceil_div(p.n_cols, kBlockSize1) *
+        cutlass::ceil_div(p.n_rows, kBlockSize0);
+    sparse24_sm90_cusparselt16bits_sparsify_kernel<P>
+        <<<num_blocks,
+           kNumWarpsPerCTA * 32,
+           0,
+           at::cuda::getCurrentCUDAStream()>>>(p);
+  }
+};
+
+template <typename P>
+__global__ void sparse24_sm90_cusparselt16bits_sparsify_kernel(P p) {
+  MetadataCusparseLt16bits::run(p);
+}
+
+// ############################################
+// # CUTLASS - 8bits
+// ############################################
+template <typename P>
+__global__ void sparse24_sm90_cutlass8bits_sparsify_kernel(P p);
+
+struct MetadataCutlass8bits {
+  static constexpr int64_t kBlockSize0 = 32;
+  static constexpr int64_t kBlockSize1 = 128;
+  static constexpr int64_t kNumWarpsPerCTA = 2;
+  static constexpr int64_t kThreadsPerCTA = kNumWarpsPerCTA * 32;
+
+  template <typename ElementOut>
+  static std::tuple<at::Tensor, at::Tensor> createTensors(at::Tensor input) {
+    TORCH_CHECK(input.size(0) % kBlockSize0 == 0);
+    TORCH_CHECK(input.size(1) % kBlockSize1 == 0);
+    return MetadataCutlass8bitsSm90::template createTensors<ElementOut>(input);
+  }
+
+  template <typename P>
+  CUTLASS_DEVICE static void run(P p) {
+    using ElementIn = typename P::ElementIn;
+    using ElementOut = typename P::ElementOut;
+    using ElementScale = typename P::ElementScale;
+
+    __shared__ ElementScale smem_scales[kBlockSize0];
+
+    int block_id = blockIdx.x;
+    int num_blocks_rows = p.n_rows / kBlockSize0;
+    int num_blocks_cols = p.n_cols / kBlockSize1;
+
+    int block_row = (block_id / num_blocks_cols) * kBlockSize0;
+    int block_col = (block_id % num_blocks_cols) * kBlockSize1;
+
+    int warp_id = threadIdx.x / 32;
+
+    if (p.scale_ptr) {
+      int thread_row = threadIdx.x * 4;
+      cutlass::arch::cp_async<
+          sizeof(ElementScale[4]),
+          cutlass::arch::CacheOperation::Global>(
+          smem_scales + thread_row,
+          p.scale_ptr + block_row + thread_row,
+          thread_row < kBlockSize0);
+    } else {
+      CUTLASS_PRAGMA_UNROLL
+      for (int i = 0; i < kBlockSize0; i += kThreadsPerCTA) {
+        int row = i * kThreadsPerCTA + threadIdx.x;
+        if (row < kBlockSize0) {
+          smem_scales[row] = ElementScale(1);
+        }
+      }
+    }
+    cutlass::arch::cp_async_wait<0>();
+    __syncthreads();
+
+    WarpTensor<ElementIn, 2, 128> load_dense_tensor;
+    int warp_row = warp_id * load_dense_tensor.kRows;
+    CUTLASS_PRAGMA_UNROLL
+    for (int it_row = 0; it_row < kBlockSize0;
+         it_row += kNumWarpsPerCTA * load_dense_tensor.kRows) {
+      CUTLASS_PRAGMA_UNROLL
+      for (int it_col = 0; it_col < kBlockSize1;
+           it_col += load_dense_tensor.kCols) {
+        // gmem -> RF
+        load_dense_tensor.load(
+            p.input_ptr + (it_row + warp_row + block_row) * p.input_s0 +
+                it_col + block_col,
+            p.input_s0);
+
+        // RF -> RF (sparsify)
+        auto [packed, mdata] = load_dense_tensor.sparsify_pack(p.algo);
+
+        // RF -> RF (cvt to f32, activation and then scale)
+        auto packedf32 = packed.template to<float>();
+        packedf32.data = p.activation(packedf32.data);
+        auto scale =
+            (1 / smem_scales[it_row + warp_row + packedf32.thread_row()]);
+        packedf32.data = packedf32.data * scale;
+
+        // RF -> RF (convert to fp8)
+        auto packedCvt = packedf32.template to<ElementOut>();
+
+        // RF -> gmem (packed data)
+        packedCvt.store(
+            p.output_ptr + (it_row + warp_row + block_row) * p.output_s0 +
+                (it_col + block_col) / 2,
+            p.output_s0);
+
+        // RF -> gmem (mdata)
+        constexpr int kStrideRow = 16;
+        int col = (it_col + block_col);
+        mdata.store(
+            p.mdata_ptr + (it_row + warp_row + block_row) * kStrideRow +
+                (col / 128 * p.n_rows * 16) + (col % 128) / 8,
+            16);
+      }
+    }
+  }
+
+  template <typename P>
+  static void launch_kernel(P p) {
+    int num_blocks = cutlass::ceil_div(p.n_cols, kBlockSize1) *
+        cutlass::ceil_div(p.n_rows, kBlockSize0);
+    sparse24_sm90_cutlass8bits_sparsify_kernel<P>
+        <<<num_blocks,
+           kNumWarpsPerCTA * 32,
+           0,
+           at::cuda::getCurrentCUDAStream()>>>(p);
+  }
+};
+
+template <typename P>
+__global__ void __launch_bounds__(MetadataCutlass8bits::kThreadsPerCTA, 32)
+    sparse24_sm90_cutlass8bits_sparsify_kernel(P p) {
+  MetadataCutlass8bits::run(p);
+}
+
+template <
+    typename _ElementIn,
+    typename _ElementOut,
+    typename _Algorithm,
+    typename _PostSparsityActivation>
+struct SparsifyKernelParams {
+  using ElementIn = _ElementIn;
+  using ElementOut = _ElementOut;
+  using ElementScale = float;
+  using Algorithm = _Algorithm;
+  using PostSparsityActivation = _PostSparsityActivation;
+
+  Algorithm algo;
+  PostSparsityActivation activation;
+
+  ElementIn const* input_ptr = nullptr;
+  int64_t input_s0 = -1;
+  ElementOut* output_ptr = nullptr;
+  int64_t output_s0 = -1;
+  uint8_t* mdata_ptr = nullptr;
+  ElementScale* scale_ptr = nullptr;
+  int64_t n_rows = -1;
+  int64_t n_cols = -1;
+  uint16_t* positive_count_ptr = nullptr;
+};
+
+template <
+    bool kIsMeta,
+    typename MetadataFormat,
+    typename ElementIn,
+    typename ElementOut,
+    typename PostSparsityActivation>
+std::tuple<at::Tensor, at::Tensor> sparse24_sm90_sparsify_specialized(
+    at::Tensor input,
+    PostSparsityActivation activation,
+    std::string sp_selection_algo,
+    std::optional<at::Tensor> scale) {
+  std::optional<at::cuda::CUDAGuard> device_guard;
+  if (!kIsMeta) {
+    TORCH_CHECK(input.is_cuda(), "All tensors must be on GPU");
+    device_guard.emplace(input.device());
+  }
+
+  TORCH_CHECK(input.dim() == 2, "Can only sparsify 2d tensors");
+  TORCH_CHECK(
+      input.stride(1) == 1,
+      "Can only sparsify contiguous tensors. Sparsify the transpose otherwise.");
+  TORCH_CHECK(input.size(1) % 32 == 0);
+  if (scale.has_value()) {
+    TORCH_CHECK(scale->dim() == 2);
+    TORCH_CHECK(
+        scale->size(0) == input.size(0), "only row-wise scale is supported");
+    TORCH_CHECK(scale->size(1) == 1);
+    TORCH_CHECK(scale->is_contiguous());
+    TORCH_CHECK(scale->scalar_type() == at::ScalarType::Float);
+    TORCH_CHECK(scale->device() == input.device());
+  }
+
+  int n_rows = input.size(0);
+  int n_cols = input.size(1);
+
+  // Half the storage + 1 bit per element in original tensor (metadata)
+  at::Tensor packed, mdata;
+  std::tie(packed, mdata) =
+      MetadataFormat::template createTensors<ElementOut>(input);
+
+  bool kernel_launched = false;
+  auto launchKernel = [&](auto algo, std::string const& algo_name) {
+    if (algo_name == sp_selection_algo) {
+      kernel_launched = true;
+      if (kIsMeta) {
+        return;
+      }
+      using Params = SparsifyKernelParams<
+          ElementIn,
+          ElementOut,
+          decltype(algo),
+          decltype(activation)>;
+      Params p;
+      p.algo = algo;
+      p.activation = activation;
+      p.input_ptr = ((ElementIn const*)input.data_ptr());
+      p.input_s0 = input.stride(0);
+      p.output_ptr = (ElementOut*)(packed.data_ptr());
+      p.output_s0 = input.size(1) / 2;
+      p.mdata_ptr = (uint8_t*)(mdata.data_ptr());
+      p.scale_ptr = (float*)(scale.has_value() ? scale->data_ptr() : nullptr);
+      p.n_rows = n_rows;
+      p.n_cols = n_cols;
+
+      MetadataFormat::launch_kernel(p);
+    }
+  };
+  named_algorithms_oneway(launchKernel);
+  TORCH_CHECK(kernel_launched, "Unknown algorithm \"", sp_selection_algo, "\"");
+  C10_CUDA_KERNEL_LAUNCH_CHECK();
+
+  return std::make_tuple(packed, mdata);
+}
+
+struct SquaredReLU {
+  template <typename T, int N>
+  CUTLASS_DEVICE cutlass::Array<T, N> operator()(cutlass::Array<T, N> x) const {
+    cutlass::multiplies<cutlass::Array<T, N>> mul;
+    cutlass::maximum<cutlass::Array<T, N>> max;
+    x = max(x, T(0));
+    x = mul(x, x);
+    return x;
+  }
+};
+
+template <bool kIsMeta = false>
+std::tuple<at::Tensor, at::Tensor> sparse24_sm90_sparsify(
+    at::Tensor input,
+    std::string metadata_fmt,
+    std::string activation,
+    std::string sp_selection_algo,
+    std::optional<at::ScalarType> out_dtype_,
+    std::optional<at::Tensor> scale) {
+  auto out_dtype =
+      out_dtype_.has_value() ? out_dtype_.value() : input.scalar_type();
+
+  auto runTypedWithAct =
+      [&](auto in_type, auto out_type, auto mdatafmt, auto act) {
+        using ElementIn = decltype(in_type);
+        using ElementOut = decltype(out_type);
+        return sparse24_sm90_sparsify_specialized<
+            kIsMeta,
+            decltype(mdatafmt),
+            ElementIn,
+            ElementOut>(input, act, sp_selection_algo, scale);
+      };
+
+  auto runTyped = [&](auto in_type, auto out_type, auto mdatafmt) {
+    if (activation == "identity") {
+      return runTypedWithAct(in_type, out_type, mdatafmt, Identity());
+    } else if (activation == "srelu") {
+      return runTypedWithAct(in_type, out_type, mdatafmt, SquaredReLU());
+    } else {
+      TORCH_CHECK(false, "Unknown activation:", activation);
+    }
+  };
+
+  TORCH_CHECK(metadata_fmt == "cusparselt" || metadata_fmt == "cutlass");
+  TORCH_CHECK(
+      !scale.has_value() || scale->scalar_type() == at::ScalarType::Float);
+  if (metadata_fmt == "cusparselt") {
+    TORCH_CHECK(
+        input.scalar_type() == at::ScalarType::Half ||
+        input.scalar_type() == at::ScalarType::BFloat16);
+    TORCH_CHECK(out_dtype == input.scalar_type());
+    if (input.scalar_type() == at::ScalarType::Half) {
+      return runTyped(
+          cutlass::half_t(), cutlass::half_t(), MetadataCusparseLt16bits());
+    } else {
+      return runTyped(
+          cutlass::bfloat16_t(),
+          cutlass::bfloat16_t(),
+          MetadataCusparseLt16bits());
+    }
+  } else if (metadata_fmt == "cutlass") {
+    TORCH_CHECK(input.scalar_type() == at::ScalarType::BFloat16);
+    TORCH_CHECK(out_dtype == at::ScalarType::Float8_e4m3fn);
+    return runTyped(
+        cutlass::bfloat16_t(), cutlass::float_e4m3_t(), MetadataCutlass8bits());
+  }
+  TORCH_CHECK(false, "Unknown metadata format: '", metadata_fmt, "'")
+}
+} // namespace
+
+TORCH_LIBRARY_IMPL(torchao, CUDA, m) {
+  m.impl(
+      TORCH_SELECTIVE_NAME("torchao::sparse24_sm90_sparsify"),
+      TORCH_FN(sparse24_sm90_sparsify<false>));
+}
+
+TORCH_LIBRARY_IMPL(torchao, Meta, m) {
+  m.impl(
+      TORCH_SELECTIVE_NAME("torchao::sparse24_sm90_sparsify"),
+      TORCH_FN(sparse24_sm90_sparsify<true>));
+}
diff --git a/torchao/csrc/cuda/activation24/static_sort.h b/torchao/csrc/cuda/activation24/static_sort.h
new file mode 100644
index 0000000000..cc6204a5e6
--- /dev/null
+++ b/torchao/csrc/cuda/activation24/static_sort.h
@@ -0,0 +1,88 @@
+#pragma once
+#include <cutlass/cutlass.h>
+
+/**
+ * A Functor class to create a sort for fixed sized arrays/containers with a
+ * compile time generated Bose-Nelson sorting network.
+ * \tparam NumElements  The number of elements in the array or container to
+ * sort. \tparam T            The element type. \tparam Compare      A
+ * comparator functor class that returns true if lhs < rhs.
+ */
+template <unsigned NumElements> class StaticSort {
+  template <class A> struct Swap {
+    template <class T> CUTLASS_HOST_DEVICE void s(T &v0, T &v1) {
+      // Explicitly code out the Min and Max to nudge the compiler
+      // to generate branchless code.
+      T t = v0 < v1 ? v0 : v1; // Min
+      v1 = v0 < v1 ? v1 : v0;  // Max
+      v0 = t;
+    }
+
+    CUTLASS_HOST_DEVICE Swap(A &a, const int &i0, const int &i1) {
+      s(a[i0], a[i1]);
+    }
+  };
+
+  template <class A, int I, int J, int X, int Y> struct PB {
+    CUTLASS_HOST_DEVICE PB(A &a) {
+      enum {
+        L = X >> 1,
+        M = (X & 1 ? Y : Y + 1) >> 1,
+        IAddL = I + L,
+        XSubL = X - L
+      };
+      PB<A, I, J, L, M> p0(a);
+      PB<A, IAddL, J + M, XSubL, Y - M> p1(a);
+      PB<A, IAddL, J, XSubL, M> p2(a);
+    }
+  };
+
+  template <class A, int I, int J> struct PB<A, I, J, 1, 1> {
+    CUTLASS_HOST_DEVICE PB(A &a) { Swap<A> s(a, I - 1, J - 1); }
+  };
+
+  template <class A, int I, int J> struct PB<A, I, J, 1, 2> {
+    CUTLASS_HOST_DEVICE PB(A &a) {
+      Swap<A> s0(a, I - 1, J);
+      Swap<A> s1(a, I - 1, J - 1);
+    }
+  };
+
+  template <class A, int I, int J> struct PB<A, I, J, 2, 1> {
+    CUTLASS_HOST_DEVICE PB(A &a) {
+      Swap<A> s0(a, I - 1, J - 1);
+      Swap<A> s1(a, I, J - 1);
+    }
+  };
+
+  template <class A, int I, int M, bool Stop = false> struct PS {
+    CUTLASS_HOST_DEVICE PS(A &a) {
+      enum { L = M >> 1, IAddL = I + L, MSubL = M - L };
+      PS<A, I, L, (L <= 1)> ps0(a);
+      PS<A, IAddL, MSubL, (MSubL <= 1)> ps1(a);
+      PB<A, I, IAddL, L, MSubL> pb(a);
+    }
+  };
+
+  template <class A, int I, int M> struct PS<A, I, M, true> {
+    CUTLASS_HOST_DEVICE PS(A &a) {}
+  };
+
+public:
+  /**
+   * Sorts the array/container arr.
+   * \param  arr  The array/container to be sorted.
+   */
+  template <class Container>
+  CUTLASS_HOST_DEVICE void operator()(Container &arr) const {
+    PS<Container, 1, NumElements, (NumElements <= 1)> ps(arr);
+  };
+
+  /**
+   * Sorts the array arr.
+   * \param  arr  The array to be sorted.
+   */
+  template <class T> CUTLASS_HOST_DEVICE void operator()(T *arr) const {
+    PS<T *, 1, NumElements, (NumElements <= 1)> ps(arr);
+  };
+};
diff --git a/torchao/csrc/cuda/activation24/warp_tensor.h b/torchao/csrc/cuda/activation24/warp_tensor.h
new file mode 100644
index 0000000000..b952e482e1
--- /dev/null
+++ b/torchao/csrc/cuda/activation24/warp_tensor.h
@@ -0,0 +1,468 @@
+#pragma once
+
+#include <cutlass/arch/memory.h>
+#include <cutlass/array.h>
+#include <cutlass/numeric_conversion.h>
+
+#include "static_sort.h"
+
+namespace torchao {
+
+template <typename Element, int kRows_, int kCols_>
+struct WarpTensor {
+  // This class represents a Tensor sharded across an entire warp,
+  // on registers. The sharding is row-major, eg looks like this
+  // for a `WarpTensor<T, 8, 32>`:
+  // [row 0]   [thread0][thread1]...
+  // [row 1]   [thread4][thread5]...
+  //...
+  // [row 8]   [thread28][thread29]...
+  // Each thread would hold 8 values. This format is optimized to
+  // load from gmem efficiently (coalescing)
+
+  static constexpr int kRows = kRows_;
+  static constexpr int kCols = kCols_;
+  // NOTE: Stored in Row-Major
+  static constexpr int kElementsPerThread = (kRows * kCols / 32);
+  static constexpr int kThreadsPerRow = 32 / kRows;
+  static_assert(32 % kRows == 0);
+
+  cutlass::Array<Element, kElementsPerThread> data; // < current thread data
+  int lane = threadIdx.x % 32;
+
+  CUTLASS_DEVICE int thread_row() const {
+    return lane / kThreadsPerRow;
+  }
+  CUTLASS_DEVICE int thread_col() const {
+    return kElementsPerThread * (lane % kThreadsPerRow);
+  }
+  // load/store in gmem
+  template <typename RowMod>
+  CUTLASS_DEVICE void load(
+      Element const* ptr,
+      int64_t stride0,
+      RowMod row_mod) {
+    cutlass::arch::global_load<decltype(data), sizeof(data)>(
+        data, ptr + stride0 * row_mod(thread_row()) + thread_col(), true);
+  }
+  CUTLASS_DEVICE void load(Element const* ptr, int64_t stride0) {
+    load(ptr, stride0, [](int i) { return i; });
+  }
+  CUTLASS_DEVICE void store_line(Element* ptr) const {
+    cutlass::arch::global_store<decltype(data), sizeof(data)>(
+        data, ptr + thread_col(), true);
+  }
+  CUTLASS_DEVICE void store(Element* ptr, int64_t stride0) const {
+    cutlass::arch::global_store<decltype(data), sizeof(data)>(
+        data, ptr + stride0 * thread_row() + thread_col(), true);
+  }
+
+  // load/store in smem
+  template <int kStride0, int kStride1, typename ElementSmem>
+  CUTLASS_DEVICE void load_32bits(ElementSmem const* ptr) {
+    if constexpr (kStride1 == 1 && std::is_same<Element, ElementSmem>::value) {
+      cutlass::Array<ElementSmem, 4 / sizeof(ElementSmem)> frag32;
+      static_assert(sizeof(frag32) == 4);
+      CUTLASS_PRAGMA_UNROLL
+      for (int i = 0; i < kElementsPerThread / frag32.size(); ++i) {
+        frag32 =
+            *((decltype(frag32) const*)(ptr + thread_col() + frag32.size() * i +
+                                        kStride0 * thread_row()));
+        CUTLASS_PRAGMA_UNROLL
+        for (int j = 0; j < frag32.size(); ++j) {
+          data[frag32.size() * i + j] = Element(frag32[j]);
+        }
+      }
+    } else {
+      CUTLASS_PRAGMA_UNROLL
+      for (int col = 0; col < data.size(); ++col) {
+        data[col] = Element(
+            ptr[kStride0 * thread_row() + kStride1 * (thread_col() + col)]);
+      }
+    }
+  }
+  template <int kStride0, int kStride1, typename ElementSmem = Element>
+  CUTLASS_DEVICE void store_32bits(ElementSmem* ptr) const {
+    if constexpr (
+        kStride1 == 1 && sizeof(Element) == 2 &&
+        std::is_same<Element, ElementSmem>::value) {
+      // store packed as 32bits - Row-Major
+      uint32_t const* pack_ptr = reinterpret_cast<uint32_t const*>(&data);
+      uint32_t* smem_ptr =
+          (uint32_t*)(ptr + kStride0 * thread_row() + kStride1 * thread_col());
+      CUTLASS_PRAGMA_UNROLL
+      for (int c = 0; c < data.size() / 2; ++c) {
+        smem_ptr[c] = pack_ptr[c];
+      }
+    } else if constexpr (
+        kStride0 == 1 && sizeof(Element) == 2 && kRows == 2 &&
+        kElementsPerThread % 2 == 0 &&
+        std::is_same<Element, ElementSmem>::value) {
+      // store packed as 32bits - Col-Major
+      uint32_t const* pack_ptr = reinterpret_cast<uint32_t const*>(&data);
+      bool is_low_thread = threadIdx.x & kThreadsPerRow;
+      CUTLASS_PRAGMA_UNROLL
+      for (int c = 0; c < data.size() / 2; ++c) {
+        uint32_t my_val = pack_ptr[c];
+        uint32_t other_val =
+            __shfl_xor_sync(0xffffffff, my_val, kThreadsPerRow);
+        if (is_low_thread) {
+          my_val = (my_val & 0x0000FFFF) | (other_val << 16);
+        } else {
+          my_val = (my_val & 0xFFFF0000) | (other_val & 0xFFFF);
+        }
+        uint32_t* smem_ptr =
+            (uint32_t*)(ptr +
+                        kStride1 * (thread_col() + is_low_thread + 2 * c));
+        *smem_ptr = my_val;
+      }
+    } else {
+      // not optimized path
+      CUTLASS_PRAGMA_UNROLL
+      for (int col = 0; col < data.size(); ++col) {
+        ptr[kStride0 * thread_row() + kStride1 * (thread_col() + col)] =
+            ElementSmem(data[col]);
+      }
+    }
+  }
+  template <typename ElementOut>
+  CUTLASS_DEVICE WarpTensor<ElementOut, kRows, kCols> to() const {
+    cutlass::NumericArrayConverter<
+        ElementOut,
+        Element,
+        kElementsPerThread,
+        cutlass::FloatRoundStyle::round_to_nearest>
+        converter;
+
+    WarpTensor<ElementOut, kRows, kCols> out;
+    out.data = converter(data);
+    return out;
+  }
+
+  CUTLASS_DEVICE void print(int offs_row = 0) const {
+    for (int i = 0; i < 32; ++i) {
+      if (lane == i) {
+        printf(
+            "[lane=%d][%d, %d:%d] = ",
+            int(lane),
+            int(thread_row() + offs_row),
+            int(thread_col()),
+            int(thread_col() + kElementsPerThread));
+        for (int j = 0; j < data.size(); ++j) {
+          // printf("0x%x ", uint32_t(data[j]));
+          printf("%f ", float(data[j]));
+        }
+        printf("\n");
+      }
+      __syncthreads();
+    }
+  }
+
+  template <typename Algo>
+  CUTLASS_DEVICE std::tuple<
+      WarpTensor<Element, kRows, kCols / 2>,
+      WarpTensor<uint8_t, kRows, kCols / 8>>
+  sparsify_pack(Algo algo) {
+    constexpr int kCount = kElementsPerThread;
+    auto dense_values = data;
+
+    WarpTensor<Element, kRows, kCols / 2> tensor_packed;
+    WarpTensor<uint8_t, kRows, kCols / 8> tensor_mdata;
+    uint8_t metadata = 0;
+    CUTLASS_PRAGMA_UNROLL
+    for (int i = 0; i < kCount / 4; ++i) {
+      cutlass::Array<Element, 4> to_sparsify;
+      CUTLASS_PRAGMA_UNROLL
+      for (int j = 0; j < 4; ++j) {
+        to_sparsify[j] = dense_values[4 * i + j].get();
+      }
+      cutlass::Array<Element, 2> packed2;
+      int m = algo(to_sparsify, packed2);
+      metadata |= (m << (4 * i));
+      tensor_packed.data[2 * i] = packed2[0].get();
+      tensor_packed.data[2 * i + 1] = packed2[1].get();
+    }
+    tensor_mdata.data[0] = metadata;
+    return std::make_tuple(tensor_packed, tensor_mdata);
+  }
+
+  CUTLASS_DEVICE WarpTensor<Element, kRows, kCols / 2> sparsify_as(
+      WarpTensor<uint8_t, kRows, kCols / 8> mdata) const {
+    static_assert(sizeof(Element) == 2);
+    auto* ptr = reinterpret_cast<uint32_t const*>(&data);
+
+    WarpTensor<Element, kRows, kCols / 2> packed;
+
+    CUTLASS_PRAGMA_UNROLL
+    for (int i = 0; i < kElementsPerThread / 4; ++i) {
+      auto a = ptr[2 * i];
+      auto b = ptr[2 * i + 1];
+      auto sparseSelect = [&](uint8_t mdata_element) {
+        int m0 = mdata_element & 0x1;
+        int m1 = (mdata_element >> 1) & 0x1;
+        int out = ((a >> (16 * m0)) * (1 - m1) + (b >> (16 * m0)) * m1);
+        return reinterpret_cast<Element&>(out);
+      };
+      uint8_t mdata_i = mdata.data[i / 2].get() >> (4 * (i % 2));
+      packed.data[2 * i] = sparseSelect(mdata_i);
+      packed.data[2 * i + 1] = sparseSelect(mdata_i >> 2);
+    }
+    return packed;
+  }
+
+  CUTLASS_DEVICE WarpTensor<Element, kRows, kCols * 2> unpack(
+      WarpTensor<uint8_t, kRows, kCols * 2 / 8> mdata) const {
+    static_assert(sizeof(Element) == 2);
+
+    WarpTensor<Element, kRows, kCols * 2> unpacked;
+    auto* ptr_p = reinterpret_cast<uint32_t const*>(&data);
+    auto* ptr_unp = reinterpret_cast<uint32_t*>(&unpacked.data);
+
+    CUTLASS_PRAGMA_UNROLL
+    for (int i = 0; i < kElementsPerThread / 2; ++i) {
+      auto packed = ptr_p[i];
+      uint32_t p0 = packed & 0xFFFF;
+      uint32_t p1 = packed >> 16;
+      uint8_t mdata_i = mdata.data[i / 2].get() >> (4 * (i % 2));
+      uint32_t m0 = mdata_i & 0x3;
+      uint32_t m1 = (mdata_i >> 2) & 0x3;
+      p0 = p0 << ((m0 & 1) * 16);
+      p1 = p1 << ((m1 & 1) * 16);
+
+      uint32_t unp0 = 0;
+      uint32_t unp1 = 0;
+      if (m0 & 0x1) {
+        unp1 = p0;
+      } else {
+        unp0 = p0;
+      }
+      if (m1 & 0x1) {
+        unp1 += p1;
+      } else {
+        unp0 += p1;
+      }
+      ptr_unp[2 * i] = unp0;
+      ptr_unp[2 * i + 1] = unp1;
+    }
+    return unpacked;
+  }
+
+  template <typename BinaryOp>
+  CUTLASS_DEVICE std::tuple<
+      cutlass::Array<Element, kCols / 32>, // reduce elements
+      uint32_t // thread offset
+      >
+  all_reduce(BinaryOp binary_op) const {
+    // reduces across the first dimension (eg `out[i,k]=out[j,k]`)
+    WarpTensor<Element, kRows, kCols> red;
+    red.data = data;
+
+    CUTLASS_PRAGMA_UNROLL
+    for (int xor_lane = kThreadsPerRow; xor_lane < 32; xor_lane *= 2) {
+      CUTLASS_PRAGMA_UNROLL
+      for (int i = 0; i < red.data.size(); ++i) {
+        Element other_val = Element(
+            __shfl_xor_sync(0xffffffff, Element(red.data[i]), xor_lane));
+        red.data[i] = binary_op(red.data[i], other_val);
+      }
+    }
+
+    uint32_t offset = thread_col();
+    cutlass::Array<Element, kCols / 32> out;
+    if constexpr (kThreadsPerRow == 16) {
+      static constexpr int kOffset = kElementsPerThread / 2;
+      if (thread_row() == 1) {
+        offset += kOffset;
+        CUTLASS_PRAGMA_UNROLL
+        for (int i = 0; i < kOffset; ++i) {
+          out[i] = red.data[i + kOffset];
+        }
+      } else {
+        CUTLASS_PRAGMA_UNROLL
+        for (int i = 0; i < kOffset; ++i) {
+          out[i] = red.data[i];
+        }
+      }
+    } else {
+      static_assert(kThreadsPerRow == 16); // Only supported in that case
+    }
+
+    return std::make_tuple(out, offset);
+  }
+
+  template <typename BinaryOp>
+  CUTLASS_DEVICE Element reduce_line(BinaryOp binary_op) const {
+    Element reduced = data[0];
+    // local reduction
+    CUTLASS_PRAGMA_UNROLL
+    for (int i = 1; i < data.size(); ++i) {
+      reduced = binary_op(reduced, Element(data[i]));
+    }
+
+    // reduce with other lanes
+    CUTLASS_PRAGMA_UNROLL
+    for (int xor_lane = 1; xor_lane < kThreadsPerRow; xor_lane *= 2) {
+      Element other_val =
+          Element(__shfl_xor_sync(0xffffffff, reduced, xor_lane));
+      reduced = binary_op(reduced, other_val);
+    }
+    return reduced;
+  }
+
+  struct TileValueOrdered1d {
+    union {
+      struct {
+        Element value;
+        uint16_t pos;
+      } parts;
+      uint32_t raw;
+    };
+    CUTLASS_DEVICE bool operator<(TileValueOrdered1d const& other) const {
+      return parts.value < other.parts.value;
+    }
+    CUTLASS_DEVICE TileValueOrdered1d() {}
+  };
+
+  template <int N, int M, typename SortPreproc>
+  CUTLASS_DEVICE WarpTensor<Element, kRows, kCols> sparsify_dense(
+      SortPreproc sort_preproc) const {
+    static_assert(M == kElementsPerThread);
+
+    WarpTensor<Element, kRows, kCols> out;
+
+    cutlass::Array<TileValueOrdered1d, M> values_ordered;
+    CUTLASS_PRAGMA_UNROLL
+    for (int i = 0; i < data.size(); ++i) {
+      auto& v = values_ordered[i];
+      v.parts.value = sort_preproc(data[i].get());
+      v.parts.pos = i;
+    }
+    StaticSort<M> sorter;
+    sorter(values_ordered);
+
+    // mask out smallest elements
+    uint32_t kept_mask = 0;
+    CUTLASS_PRAGMA_UNROLL
+    for (int i = M - N; i < M; ++i) {
+      kept_mask |= (1 << values_ordered[i].parts.pos);
+    }
+    CUTLASS_PRAGMA_UNROLL
+    for (int i = 0; i < M; ++i) {
+      if (kept_mask & 0x1) {
+        out.data[i] = data[i].get();
+      } else {
+        out.data[i] = Element(0);
+      }
+      kept_mask = kept_mask >> 1;
+    }
+    return out;
+  }
+};
+
+CUTLASS_DEVICE void store_metadata_reordered(
+    WarpTensor<uint8_t, 16, 32 / 8> mdata_tensor,
+    uint8_t* mdata_ptr) {
+  // This function is explained in
+  // https://docs.google.com/spreadsheets/d/1JvEsw9QnoIvXctOnED3Gk0LFnIe8XJTnbCRamxvfFBw/edit?gid=1603247130#gid=1603247130
+  auto lane = mdata_tensor.lane;
+  static_assert(mdata_tensor.kElementsPerThread == 2);
+
+  uint16_t mdata_step0 = reinterpret_cast<uint16_t const&>(mdata_tensor.data);
+  uint16_t other_step0 = __shfl_xor_sync(0xffffffff, mdata_step0, 16);
+
+  // step1
+  uint16_t mdata_step1 = 0;
+  if (lane & 16) { // T16-T31
+    mdata_step1 = ((mdata_step0 & 0xF0F0) | ((other_step0 >> 4) & 0x0F0F));
+  } else { // T0-T15
+    mdata_step1 = ((mdata_step0 & 0x0F0F) | ((other_step0 << 4) & 0xF0F0));
+  }
+
+  // step2
+  uint16_t other_step1 = __shfl_xor_sync(0xffffffff, mdata_step1, 1);
+  uint16_t mdata_gmem = 0;
+  if (lane & 1) { // T1
+    mdata_gmem = ((mdata_step1 & 0xFF00) | ((other_step1 >> 8) & 0x00FF));
+  } else { // T0
+    mdata_gmem = ((mdata_step1 & 0x00FF) | ((other_step1 << 8) & 0xFF00));
+  }
+
+  // read to store to gmem
+  cutlass::arch::global_store<decltype(mdata_gmem), sizeof(mdata_gmem)>(
+      mdata_gmem,
+      mdata_ptr + (lane % 2) * 4 + ((lane % 16) / 2) * 8 + (lane / 16) * 2,
+      true);
+}
+
+struct Identity {
+  template <typename T>
+  T CUTLASS_DEVICE operator()(T x) const {
+    return x;
+  }
+};
+
+template <
+    int kSmemStride0,
+    int kSmemStride1,
+    int kNumRows,
+    int kWarpsPerCTA,
+    typename Algo,
+    typename Element,
+    typename PointwiseFn>
+CUTLASS_DEVICE void warp_dump_sparse_and_dense_from_smem_32cols(
+    Element const* smem,
+    Algo algo,
+    int32_t const* destination_idx_ptr,
+    // sparse part
+    uint8_t* sparse_bitmask_ptr,
+    int64_t sparse_bitmask_s0,
+    int64_t sparse_bitmask_s1,
+    Element* sparse_packed_ptr,
+    int64_t sparse_packed_s0,
+    // dense part
+    Element* dense_ptr,
+    int64_t dense_s0,
+    PointwiseFn pointwise_fn = Identity()) {
+  // 64x32 data is layed out like:
+  // row 0: [T0 (128 bits)][T1 (128 bits)][T2 (128 bits)]...
+  // row 1: [T4 (128 bits)][T5 (128 bits)]...
+  // ...
+  // row 8: [T0 (128 bits)][T1 (128 bits)]...
+  // ..
+  WarpTensor<Element, 8, 32> tensor;
+
+  cutlass::Array<int32_t, kNumRows / 8 / kWarpsPerCTA> destination_idx_array;
+  int warp_row = (threadIdx.x / 32) * tensor.kRows;
+  CUTLASS_PRAGMA_UNROLL
+  for (int row = 0; row < kNumRows; row += kWarpsPerCTA * tensor.kRows) {
+    cutlass::arch::global_load<int32_t, sizeof(destination_idx_array[0])>(
+        destination_idx_array[row / (kWarpsPerCTA * tensor.kRows)],
+        destination_idx_ptr + tensor.thread_row() + row + warp_row,
+        true);
+  }
+
+  CUTLASS_PRAGMA_UNROLL
+  for (int row = 0; row < kNumRows; row += kWarpsPerCTA * tensor.kRows) {
+    tensor.template load_32bits<kSmemStride0, kSmemStride1>(
+        smem + kSmemStride0 * (row + warp_row));
+    tensor.data = pointwise_fn(tensor.data);
+    // RF -> RF (sparsify)
+    auto [packed, bitmask] = tensor.sparsify_pack(algo);
+    int32_t destination_idx =
+        destination_idx_array[row / (kWarpsPerCTA * tensor.kRows)];
+    if (destination_idx >= 0) {
+      // shape: [cols/32, rows, 32/8] (b8)
+      int64_t coord0 = (tensor.thread_col()) / 32;
+      int64_t coord1 = destination_idx;
+      int64_t coord2 = (tensor.thread_col() % 32) / 8;
+      sparse_bitmask_ptr
+          [coord0 * sparse_bitmask_s0 + coord1 * sparse_bitmask_s1 + coord2] =
+              bitmask.data[0];
+      packed.store_line(sparse_packed_ptr + sparse_packed_s0 * destination_idx);
+    } else {
+      destination_idx = -(destination_idx + 1);
+      tensor.store_line(dense_ptr + dense_s0 * destination_idx);
+    }
+  }
+}
+} // namespace torchao
diff --git a/torchao/csrc/cuda/rowwise_scaled_linear_sparse_cutlass/rowwise_scaled_linear_sparse_cutlass.cuh b/torchao/csrc/cuda/rowwise_scaled_linear_sparse_cutlass/rowwise_scaled_linear_sparse_cutlass.cuh
index 4342919d6e..09cbf32f6a 100644
--- a/torchao/csrc/cuda/rowwise_scaled_linear_sparse_cutlass/rowwise_scaled_linear_sparse_cutlass.cuh
+++ b/torchao/csrc/cuda/rowwise_scaled_linear_sparse_cutlass/rowwise_scaled_linear_sparse_cutlass.cuh
@@ -271,7 +271,7 @@ static void select_config(
         return;
       } else {
         using TileShape = cute::Shape<cute::_128, cute::_128, cute::_256>;
-        using ClusterShape = cute::Shape<cute::_1, cute::_1, cute::_1>;
+        using ClusterShape = cute::Shape<cute::_1, cute::_2, cute::_1>;
         rowwise_scaled_linear_sparse_kernel_cutlass_sm9x<
           DtypeXq, DtypeWq, Types..., TileShape, ClusterShape>(
             Xq, X_scale, Wq, W_meta, W_scale, bias, Y);
diff --git a/torchao/ops.py b/torchao/ops.py
index 82de7528ec..0a507a69d7 100644
--- a/torchao/ops.py
+++ b/torchao/ops.py
@@ -39,6 +39,15 @@
 lib.define(
     "to_sparse_semi_structured_cutlass_sm9x_f8(Tensor weight) -> (Tensor, Tensor)"
 )
+lib.define(
+    "sparse24_sm90_sparsify(Tensor input, str metadata_fmt, str activation, str sp_selection_algo, *, ScalarType? dtype = None, Tensor? scale=None) -> (Tensor, Tensor)"
+)
+lib.define(
+    "swizzle_mm(Tensor mat1, Tensor mat2, bool mat1_is_swizzled, bool mat2_is_swizzled) -> Tensor"
+)
+lib.define(
+    "swizzle_scaled_mm(Tensor mat1, Tensor mat2, bool mat1_is_swizzled, bool mat2_is_swizzled, Tensor scale_a, Tensor scale_b, Tensor? bias=None, Tensor? scale_result=None, ScalarType? out_dtype=None) -> Tensor"
+)
 # Note: we need to add the `torch._C.Tag.needs_fixed_stride_order` tag in order for inductor
 # to honor the layout constraints for `b` in the two ops below.
 lib.define(
@@ -729,6 +738,81 @@ def _(
     )
 
 
+def sparse24_sm90_sparsify(
+    input_tensor: Tensor,
+    metadata_format: str,
+    activation: str,
+    algorithm: str,
+    dtype=None,
+    scale=None,
+) -> (Tensor, Tensor):
+    return torch.ops.torchao.sparse24_sm90_sparsify(
+        input_tensor, metadata_format, activation, algorithm, dtype=dtype, scale=scale
+    )
+
+
+def swizzle_mm(
+    mat1: Tensor, mat2: Tensor, mat1_is_swizzled: bool, mat2_is_swizzled: bool
+) -> Tensor:
+    """
+    Similar to torch.mm but Tensor inputs can be SwizzleTensor instances.
+
+    """
+    return torch.ops.torchao.swizzle_mm.default(
+        mat1, mat2, mat1_is_swizzled, mat2_is_swizzled
+    )
+
+
+@register_custom_op("torchao::swizzle_mm")
+def _(
+    mat1: Tensor, mat2: Tensor, mat1_is_swizzled: bool, mat2_is_swizzled: bool
+) -> Tensor:
+    return mat1.new_empty(mat1.shape[0], mat2.shape[1])
+
+
+def swizzle_scaled_mm(
+    mat1: Tensor,
+    mat2: Tensor,
+    mat1_is_swizzled: bool,
+    mat2_is_swizzled: bool,
+    scale_a: Tensor,
+    scale_b: Tensor,
+    bias: Optional[Tensor],
+    scale_result: Optional[Tensor],
+    out_dtype: Optional[torch.dtype],
+) -> Tensor:
+    """
+    Similar to torch.mm but Tensor inputs can be SwizzleTensor instances.
+
+    """
+    return torch.ops.torchao.swizzle_scaled_mm.default(
+        mat1,
+        mat2,
+        mat1_is_swizzled,
+        mat2_is_swizzled,
+        scale_a,
+        scale_b,
+        bias,
+        scale_result,
+        out_dtype,
+    )
+
+
+@register_custom_op("torchao::swizzle_scaled_mm")
+def _(
+    mat1: Tensor,
+    mat2: Tensor,
+    mat1_is_swizzled: bool,
+    mat2_is_swizzled: bool,
+    scale_a: Tensor,
+    scale_b: Tensor,
+    bias: Optional[Tensor],
+    scale_result: Optional[Tensor],
+    out_dtype: Optional[torch.dtype],
+) -> Tensor:
+    return mat1.new_empty(mat1.shape[0], mat2.shape[1])
+
+
 @functools.lru_cache()
 def _get_dtypes():
     """TODO: when e8m0 is hardened and major release lets remove uint8 support"""
diff --git a/torchao/prototype/sparsity/activation/__init__.py b/torchao/prototype/sparsity/activation/__init__.py
new file mode 100644
index 0000000000..e69de29bb2
diff --git a/torchao/prototype/sparsity/activation/srelu_linear.py b/torchao/prototype/sparsity/activation/srelu_linear.py
new file mode 100644
index 0000000000..f8c3288b67
--- /dev/null
+++ b/torchao/prototype/sparsity/activation/srelu_linear.py
@@ -0,0 +1,87 @@
+from dataclasses import dataclass
+
+import torch
+from torch import nn
+
+from torchao.core.config import AOBaseConfig
+from torchao.ops import (
+    rowwise_scaled_linear_sparse_cutlass_f8f8,
+)
+from torchao.quantization.quant_api import (
+    _float8_cutlass_quant,
+)
+from torchao.quantization.transform_module import (
+    register_quantize_module_handler,
+)
+
+
+@dataclass
+class SRELUFloat8SemiSparseDynamicActivationFloat8WeightConfig(AOBaseConfig):
+    """
+    Applies float8 dynamic quantization to activations and float8 quantization followed by compression to sparse semi-structured tensor to weights of linear layers.
+
+    Args:
+        `activation_dtype`: data type for quantized activation tensor.
+        `weight_dtype`: data type for quantized weight tensor.
+    """
+
+    activation_dtype: torch.dtype = torch.float8_e4m3fn
+    weight_dtype: torch.dtype = torch.float8_e4m3fn
+
+
+@register_quantize_module_handler(
+    SRELUFloat8SemiSparseDynamicActivationFloat8WeightConfig
+)
+def _float8_dynamic_activation_float8_semi_sparse_weight_transform(
+    module: torch.nn.Module,
+    config: SRELUFloat8SemiSparseDynamicActivationFloat8WeightConfig,
+):
+    return FP8SemiSparseActivationLinear.from_dense(module, config)
+
+
+class FP8SemiSparseActivationLinear(nn.Module):
+    """
+    Replacement nn.Linear that supports runtime fp8 activation sparsity
+    """
+
+    def __init__(self, weight, config) -> None:
+        super().__init__()
+        self.config = config
+
+        W_aqt = _float8_cutlass_quant(weight, self.config.weight_dtype)
+        self.Wq = W_aqt.tensor_impl.float8_data
+        self.W_scale = W_aqt.tensor_impl.scale
+
+    def forward(self, x):
+        X_scale = torch.empty([x.shape[0], 1], device=x.device, dtype=torch.float32)
+        Xq_sparse, X_meta = torch.ops.torchao.sparse24_sm90_sparsify(
+            x,
+            "cutlass",
+            "srelu",
+            "largest",
+            dtype=self.config.activation_dtype,
+            scale=X_scale,
+        )
+
+        result = rowwise_scaled_linear_sparse_cutlass_f8f8(
+            self.Wq,
+            self.W_scale,
+            Xq_sparse,
+            X_meta,
+            X_scale,
+            bias=None,
+            out_dtype=torch.bfloat16,
+        ).t()
+
+        return result
+
+    @classmethod
+    def from_dense(
+        cls, linear, config: SRELUFloat8SemiSparseDynamicActivationFloat8WeightConfig
+    ):
+        if linear.bias is not None:
+            raise NotImplementedError("bias is not supported")
+        if linear.weight.dtype != torch.bfloat16:
+            raise NotImplementedError("weight dtype must be bf16")
+
+        return cls(linear.weight.data, config)
diff --git a/torchao/prototype/sparsity/activation/utils.py b/torchao/prototype/sparsity/activation/utils.py
new file mode 100644
index 0000000000..696649b18c
--- /dev/null
+++ b/torchao/prototype/sparsity/activation/utils.py
@@ -0,0 +1,115 @@
+import os
+from datetime import datetime
+
+import torch
+import torch.nn.functional as F
+
+from torchao.ops import to_sparse_semi_structured_cutlass_sm9x_f8
+
+
+def _dump_metadata_format_cutlass(
+    rows=128, cols=256, device=torch.device("cuda"), dtype=torch.float8_e4m3fn
+):
+    """
+    This is a helper function to dump the metadata packing format for 2:4 sparse GEMMS.
+
+    We create a 2:4 sparse tensor by tiling the same pattern and then changing a singular 1x4 strip of the metadata at a time.
+    This will allow us to find the corresponding location in the metadata that changes.
+    """
+
+    # We tile the same pattern [0, 0, 1, 1] which yields 238 for all metadata values.
+    dense_reference_tensor = (
+        torch.Tensor([0, 0, 1, 1])
+        .to(device=device, dtype=dtype)
+        .tile((rows, cols // 4))
+        .contiguous()
+    )
+    _, meta_reference = to_sparse_semi_structured_cutlass_sm9x_f8(
+        dense_reference_tensor
+    )
+    print("INITIAL")
+    print(meta_reference)
+    print(meta_reference.shape, meta_reference.is_contiguous(), meta_reference.dtype)
+
+    metadata_list = meta_reference.tolist()
+
+    # The probe pattern yields the value 68 in the metadata
+    probe_pattern = [1, 1, 0, 0]
+    for i in range(rows):
+        num_per_tb = 8
+        for j in range(cols // num_per_tb):
+            dense_reference_tensor_c = dense_reference_tensor.clone()
+            dense_reference_tensor_c[i, j * num_per_tb : (j + 1) * num_per_tb] = (
+                torch.Tensor(probe_pattern)
+                .to(device=device, dtype=dtype)
+                .tile((1, 2))
+                .contiguous()
+            )
+            # use the reference cutlass function to pack metadata
+            _, meta_refernece_probe = to_sparse_semi_structured_cutlass_sm9x_f8(
+                dense_reference_tensor_c
+            )
+
+            # find where the reference packed metadata is equal to 68
+            indicies = (meta_refernece_probe == 68).nonzero()
+
+            for r_i, c_i in indicies:
+                metadata_list[r_i][c_i] = (
+                    f"a[{i:2d}, {j * num_per_tb:2d}:{(j + 1) * num_per_tb:2d}]"
+                )
+
+    print("METADATA FORMAT")
+    for line in metadata_list:
+        print(line)
+        print()
+
+
+class SquaredReLU(torch.nn.Module):
+    def __init__(self):
+        super().__init__()
+
+    def forward(self, x):
+        return F.relu(x) ** 2
+
+
+def profiler_runner(path, fn, *args, **kwargs):
+    if path is None:
+        path = os.path.join(
+            os.path.expanduser("~/traces"),
+            f"{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.json.gz",
+        )
+    with torch.profiler.profile(
+        activities=[
+            torch.profiler.ProfilerActivity.CPU,
+            torch.profiler.ProfilerActivity.CUDA,
+        ],
+        record_shapes=True,
+    ) as prof:
+        result = fn(*args, **kwargs)
+    prof.export_chrome_trace(path)
+    print(f"Exported trace to {path}")
+    return result
+
+    # input = create_semi_structured_tensor(4096, 8192, dtype=torch.bfloat16).to(device)
+    # print(input)
+
+    # ffn_clone = copy.deepcopy(test_ffn)
+    # quantize_(ffn_clone.w1, Float8DynamicActivationFloat8WeightConfig(granularity=PerRow()))
+    # ffn_clone.w2 = FP8SemiSparseActivationLinear.from_dense(ffn_clone.w2)
+    # # quantize_(ffn_clone.w2, Float8DynamicActivationFloat8SemiSparseWeightConfig())
+    # ffn_clone.forward = torch.compile(ffn_clone.forward, mode="max-autotune", fullgraph=True)
+    # # warmup
+    # def test():
+    #     for i in range(10):
+    #         ffn_clone(input)
+    # test()
+    # fp8_c_activation_sparse_time = benchmark_microseconds(test)
+    # print(fp8_c_activation_sparse_time / 10)
+
+    # profiler_runner(None, test)
+
+    # test_linear = nn.Linear(8192, 8192).cuda().to(torch.bfloat16)
+    # test_linear.weight.data = torch.ones(8192, 8192).cuda().to(torch.bfloat16)
+    # print(test_linear(input))
+    # sparse_fp8_linear = FP8SemiSparseActivationLinear.from_dense(test_linear)
+    # print(sparse_fp8_linear(input))
diff --git a/torchao/sparsity/utils.py b/torchao/sparsity/utils.py
index 012d86beff..24c0808a02 100644
--- a/torchao/sparsity/utils.py
+++ b/torchao/sparsity/utils.py
@@ -43,7 +43,7 @@ def create_semi_structured_tensor(r, c, dtype):
         .to(torch.int32)
     )
 
-    sparse_weight = torch.rand(r, c).cuda() * mask
+    sparse_weight = mask + (torch.rand(r, c).cuda() * mask)
     return sparse_weight.to(dtype)
 
 
From 34151758a676846a7e1d92ef6008da848fc5a7b3 Mon Sep 17 00:00:00 2001
From: Mark Saroufim <marksaroufim@meta.com>
Date: Mon, 12 May 2025 07:50:47 -0700
Subject: [PATCH 019/165] unpin torch to unbreak mac tests (#2198)

* fix broken mac test

* Update torchao_experimental_test.yml
---
 .github/workflows/torchao_experimental_test.yml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.github/workflows/torchao_experimental_test.yml b/.github/workflows/torchao_experimental_test.yml
index 1987670d70..a712e7a624 100644
--- a/.github/workflows/torchao_experimental_test.yml
+++ b/.github/workflows/torchao_experimental_test.yml
@@ -36,7 +36,7 @@ jobs:
           # Install executorch first because it installs its own version
           # of torch and torchao, which we do not want to use
           pip install executorch
-          pip install torch==2.7.0.dev20250311 --index-url "https://download.pytorch.org/whl/nightly/cpu" --force-reinstall
+          pip install torch==2.7.0 --index-url https://download.pytorch.org/whl/cpu --force-reinstall
           pip install -r dev-requirements.txt
           USE_CPP=1 TORCHAO_BUILD_KLEIDIAI=1 pip install .
       - name: Run python tests

From 0607aa1bb65f03bb1b0bf92868c3684a2fd3894f Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Mon, 12 May 2025 10:10:46 -0700
Subject: [PATCH 020/165] Add subclass based method for inference w/ MXFP8
 (#2132)

stack-info: PR: https://github.com/pytorch/ao/pull/2132, branch: drisspg/stack/50
---
 test/prototype/mx_formats/test_mx_linear.py |  32 +++
 torchao/__init__.py                         |   3 +-
 torchao/core/config.py                      |   1 +
 torchao/prototype/mx_formats/__init__.py    |   4 +
 torchao/prototype/mx_formats/mx_funcs.py    |  43 ++++
 torchao/prototype/mx_formats/mx_ops.py      | 255 +++++++++++++++-----
 torchao/prototype/mx_formats/mx_subclass.py | 157 ++++++++++++
 torchao/prototype/mx_formats/mx_tensor.py   |  43 +++-
 torchao/prototype/mx_formats/utils.py       |   3 +-
 9 files changed, 480 insertions(+), 61 deletions(-)
 create mode 100644 torchao/prototype/mx_formats/mx_funcs.py
 create mode 100644 torchao/prototype/mx_formats/mx_subclass.py

diff --git a/test/prototype/mx_formats/test_mx_linear.py b/test/prototype/mx_formats/test_mx_linear.py
index b0cee1e918..65934fb259 100644
--- a/test/prototype/mx_formats/test_mx_linear.py
+++ b/test/prototype/mx_formats/test_mx_linear.py
@@ -25,6 +25,7 @@
     MXInferenceLinear,
     MXLinear,
 )
+from torchao.prototype.mx_formats.mx_subclass import MXFPInferenceConfig
 from torchao.quantization import quantize_
 from torchao.quantization.utils import compute_error
 from torchao.utils import (
@@ -372,3 +373,34 @@ def test_inference_print_str():
     s = str(m)
     assert "bl_sz=32" in s
     assert "kernel=emulated" in s
+
+
+@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(
+    not TORCH_VERSION_AT_LEAST_2_8, reason="torch.compile requires PyTorch 2.8+"
+)
+@pytest.mark.skipif(not is_sm_at_least_100, reason="Reqs sm100")
+@pytest.mark.parametrize("elem_dtype", [torch.float8_e4m3fn])
+@pytest.mark.parametrize("bias", [True, False])
+@pytest.mark.parametrize("compile", [True, False])
+@torch.no_grad()
+def test_inference_subclass(elem_dtype, bias: bool, compile: bool):
+    """
+    Smoke test for inference compile
+    """
+    if elem_dtype in (torch.float8_e4m3fn, torch.float8_e5m2):
+        if not is_sm_at_least_89():
+            pytest.skip("CUDA capability >= 8.9 required for float8 in triton")
+
+    m = nn.Linear(32, 128, bias=bias, dtype=torch.bfloat16, device="cuda")
+    m_mx = copy.deepcopy(m)
+    config = MXFPInferenceConfig()
+    quantize_(m_mx, config=config)
+    if compile:
+        m_mx = torch.compile(m_mx, fullgraph=True)
+
+    x = torch.randn(128, 32, device="cuda", dtype=torch.bfloat16)
+    y_ref = m(x)
+    y_mx = m_mx(x)
+    sqnr = compute_error(y_ref, y_mx)
+    assert sqnr >= 25.0, f"Got a sqnr of {sqnr} for {elem_dtype} and bias={bias}"
diff --git a/torchao/__init__.py b/torchao/__init__.py
index 752aa94a4f..7cc447d5a7 100644
--- a/torchao/__init__.py
+++ b/torchao/__init__.py
@@ -43,7 +43,7 @@
     quantize_,
 )
 
-from . import dtypes, optim, testing
+from . import dtypes, optim, quantization, testing
 
 __all__ = [
     "dtypes",
@@ -52,4 +52,5 @@
     "quantize_",
     "testing",
     "ops",
+    "quantization",
 ]
diff --git a/torchao/core/config.py b/torchao/core/config.py
index a041130835..519dfe8dfd 100644
--- a/torchao/core/config.py
+++ b/torchao/core/config.py
@@ -175,6 +175,7 @@ def config_to_dict(config: AOBaseConfig) -> Dict[str, Any]:
     "torchao.quantization",
     "torchao.sparsity.sparse_api",
     "torchao.prototype.quantization",
+    "torchao.prototype.mx_formats",
 }
 
 
diff --git a/torchao/prototype/mx_formats/__init__.py b/torchao/prototype/mx_formats/__init__.py
index 7252c33dc9..7c1f0ace55 100644
--- a/torchao/prototype/mx_formats/__init__.py
+++ b/torchao/prototype/mx_formats/__init__.py
@@ -5,6 +5,9 @@
     MXLinearRecipeName,
 )
 
+# Note: Prototype and subject to change
+from torchao.prototype.mx_formats.mx_subclass import MXFPInferenceConfig
+
 # import mx_linear here to register the quantize_ transform logic
 # ruff: noqa: I001
 import torchao.prototype.mx_formats.mx_linear  # noqa: F401
@@ -14,4 +17,5 @@
     "MXInferenceLinearConfig",
     "MXLinearConfig",
     "MXLinearRecipeName",
+    "MXFPInferenceConfig",
 ]
diff --git a/torchao/prototype/mx_formats/mx_funcs.py b/torchao/prototype/mx_formats/mx_funcs.py
new file mode 100644
index 0000000000..13e8ef6da3
--- /dev/null
+++ b/torchao/prototype/mx_formats/mx_funcs.py
@@ -0,0 +1,43 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+
+# This source code is licensed under the license found in the
+# LICENSE file in the root directory of this source tree.
+
+"""
+This file defines the top level torch ops that are extended by MXTensor
+See: https://docs.pytorch.org/docs/stable/notes/extending.html#extending-torch-with-a-tensor-wrapper-type
+for more details.
+"""
+
+from typing import Any, Dict
+
+import torch
+
+from torchao.prototype.mx_formats.mx_ops import _addmm_mx_dispatch
+from torchao.prototype.mx_formats.mx_tensor import (  # noqa: E501
+    MXTensor,
+)
+
+aten = torch.ops.aten
+
+MX_FUNC_TABLE: Dict[Any, Any] = {}
+
+
+def implements_func(torch_ops):
+    """Register torch ops to the mx op table for torch function"""
+
+    def decorator(func):
+        for op in torch_ops:
+            MX_FUNC_TABLE[op] = func
+        return func
+
+    return decorator
+
+
+@implements_func([aten.linear.default])
+def mx_linear(func, types, args, kwargs):
+    a, b = args[0], args[1]
+    assert isinstance(a, MXTensor) and isinstance(b, MXTensor)
+    bias = args[2] if len(args) == 3 else None
+    return _addmm_mx_dispatch(a, b.t(), func, bias=bias)
diff --git a/torchao/prototype/mx_formats/mx_ops.py b/torchao/prototype/mx_formats/mx_ops.py
index af2d89c112..da342c7853 100644
--- a/torchao/prototype/mx_formats/mx_ops.py
+++ b/torchao/prototype/mx_formats/mx_ops.py
@@ -17,9 +17,12 @@
 the underlying data fields to the MX matmul.
 """
 
-from typing import Any, Dict
+from typing import Any, Dict, Optional
 
 import torch
+from torch.utils._python_dispatch import (
+    return_and_correct_aliasing,
+)
 from torch.utils._pytree import tree_map
 
 import torchao.ops
@@ -35,10 +38,12 @@
     tensor_size_hpx3_to_fp6x4,
 )
 from torchao.prototype.mx_formats.utils import to_blocked
+from torchao.utils import fill_defaults
 
 aten = torch.ops.aten
 
 MX_OPS_TABLE: Dict[Any, Any] = {}
+MX_FUNCTION_TABLE: Dict[Any, Any] = {}
 
 
 def implements(aten_ops):
@@ -52,59 +57,77 @@ def decorator(func):
     return decorator
 
 
-@implements([aten.detach.default])
-def mx_desugar_op(aten_op, args, kwargs=None):
-    old = args[0]
-    new_data = aten_op(old._data, *args[1:], **kwargs)
-    new = MXTensor(
-        old._scale_e8m0,
-        new_data,
-        old._elem_dtype,
-        old._block_size,
-        old._orig_dtype,
-        old._use_fp4_custom_triton_dequant_kernel,
-        old._gemm_kernel_choice,
-        old._pack_fp6,
+@implements([aten.detach.default, aten.alias.default])
+def _(func, types, args, kwargs):
+    return return_and_correct_aliasing(
+        func, args, kwargs, args[0]._apply_fn_to_data(func)
     )
-    return new
 
 
-@implements([aten.mm.default, aten.matmul.default])
-def mx_mm(aten_op, args, kwargs=None):
-    a = args[0]
-    b = args[1]
-    assert isinstance(a, MXTensor) and isinstance(b, MXTensor)
-    assert a._gemm_kernel_choice == b._gemm_kernel_choice, "unsupported"
-    if a._gemm_kernel_choice in (MXGemmKernelChoice.CUBLAS, MXGemmKernelChoice.CUTLASS):
+def _get_gemm_choice(
+    choice_a: Optional[MXGemmKernelChoice], choice_b: Optional[MXGemmKernelChoice]
+) -> MXGemmKernelChoice:
+    if choice_a is not None and choice_b is not None:
+        assert choice_a == choice_b, (
+            "Both MXTensor inputs must have the same gemm config if specified"
+        )
+        return choice_a
+
+    # Assert that at least one is set and return that one
+    assert choice_a is not None or choice_b is not None, (
+        "At least one gemm choice must be specified"
+    )
+    return choice_a if choice_a is not None else choice_b
+
+
+def _addmm_mx_dispatch(
+    a: MXTensor, b: MXTensor, aten_op, bias: Optional[torch.Tensor] = None
+) -> torch.Tensor:
+    """
+    Core implementation shared between mx_mm and mx_addmm.
+    The only difference is whether bias is None or not.
+    """
+    gemm_choice = _get_gemm_choice(a._gemm_kernel_choice, b._gemm_kernel_choice)
+
+    if gemm_choice in (MXGemmKernelChoice.CUBLAS, MXGemmKernelChoice.CUTLASS):
         # real MX gemm backed by torchao's CUTLASS kernels
         M, K, N = a.shape[0], a.shape[1], b.shape[1]
         assert a._data.is_contiguous()
         assert b._data.t().is_contiguous()
+        assert a._block_size == 32, f"Invalid block size {a._block_size}"
+        assert b._block_size == 32, f"Invalid block size {b._block_size}"
 
-        # TODO(future PR): use block_size instead of hardcoding 32
-        a_scale = a._scale_e8m0.view(M, K // 32)
-        b_scale = b._scale_e8m0.view(N, K // 32)
+        a_scale = a._scale_e8m0.view(M, K // a._block_size)
+        b_scale = b._scale_e8m0.view(N, K // b._block_size)
         a_scale_block = to_blocked(a_scale)
         b_scale_block = to_blocked(b_scale)
+
         if a._elem_dtype == torch.float8_e4m3fn:
             assert b._elem_dtype == torch.float8_e4m3fn
-            assert a._gemm_kernel_choice is MXGemmKernelChoice.CUBLAS, (
+            assert gemm_choice is MXGemmKernelChoice.CUBLAS, (
                 "CUBLAS is the only supported kernel choice for MX FP8 operations"
             )
+
             res = torch._scaled_mm(
                 a._data,
                 b._data,
                 a_scale_block.view(torch.float8_e8m0fnu),
                 b_scale_block.view(torch.float8_e8m0fnu),
+                bias=bias,
                 out_dtype=torch.bfloat16,
             )
         else:
             assert a._elem_dtype == DTYPE_FP4
             assert b._elem_dtype == DTYPE_FP4
-            assert a._gemm_kernel_choice is MXGemmKernelChoice.CUTLASS, "unsupported"
+            assert gemm_choice is MXGemmKernelChoice.CUTLASS, "unsupported"
+            # FP4 operations
             res = torchao.ops.mx_fp4_bf16(
                 a._data, b._data, a_scale_block, b_scale_block
             )
+            # TODO add optional bias to kernel
+            if bias is not None:
+                res = res + bias
+
     else:
         # emulated MX gemm
         a_hp = a.to_dtype(a._orig_dtype)
@@ -112,12 +135,40 @@ def mx_mm(aten_op, args, kwargs=None):
         # assert memory layout we expect to be required in hardware
         assert a_hp.is_contiguous()
         assert b_hp.t().is_contiguous()
-        res = aten_op(a_hp, b_hp)
+
+        # Call appropriate aten_op based on whether bias is provided
+        if bias is not None:
+            res = aten_op(bias, a_hp, b_hp)  # addmm
+        else:
+            res = aten_op(a_hp, b_hp)  # mm
+
     return res
 
 
+@implements([aten.mm.default, aten.matmul.default])
+def mx_mm(func, types, args, kwargs):
+    a = args[0]
+    b = args[1]
+    assert isinstance(a, MXTensor) and isinstance(b, MXTensor)
+
+    return _addmm_mx_dispatch(a, b, func)
+
+
+@implements([aten.addmm.default])
+def mx_addmm(func, types, args, kwargs):
+    assert (
+        isinstance(args[0], torch.Tensor)
+        and isinstance(args[1], MXTensor)
+        and isinstance(args[2], MXTensor)
+    )
+    bias = args[0]
+    a = args[1]
+    b = args[2]
+    return _addmm_mx_dispatch(a, b, func, bias=bias)
+
+
 @implements([aten.t.default])
-def mx_t(aten_op, args, kwargs=None):
+def mx_t(func, types, args, kwargs):
     # For now, only transpose(input, 0, 1) is supported.
     old = args[0]
     new = MXTensor(
@@ -134,7 +185,7 @@ def mx_t(aten_op, args, kwargs=None):
 
 
 @implements([aten.sum.dim_IntList])
-def mx_cast_up_op(aten_op, args, kwargs=None):
+def mx_cast_up_op(func, types, args, kwargs):
     """Be careful with this function, this is a "fallback" op that
     casts the output of the op to the original precision. And performs the op.
 
@@ -150,11 +201,11 @@ def unwrap(x):
 
     new_args = tree_map(unwrap, args)
     new_kwargs = tree_map(unwrap, kwargs)
-    return aten_op(*new_args, **new_kwargs)
+    return func(*new_args, **new_kwargs)
 
 
 @implements([aten.view.default])
-def mx_view_op(aten_op, args, kwargs=None):
+def mx_view_op(func, types, args, kwargs):
     data = args[0]._data
     new_size = args[1]
     if args[0]._elem_dtype == DTYPE_FP4:
@@ -163,7 +214,7 @@ def mx_view_op(aten_op, args, kwargs=None):
     elif args[0]._elem_dtype in [DTYPE_FP6_E3M2, DTYPE_FP6_E2M3] and args[0]._pack_fp6:
         # special case fp6 as we pack 4 elements in 3 bytes
         new_size = tensor_size_hpx3_to_fp6x4(new_size, data.is_contiguous())
-    new_data = aten_op(data, new_size, *args[2:], **kwargs)
+    new_data = func(data, new_size, *args[2:], **kwargs)
     return MXTensor(
         args[0]._scale_e8m0,
         new_data,
@@ -176,28 +227,120 @@ def mx_view_op(aten_op, args, kwargs=None):
     )
 
 
-@implements([aten._to_copy.default])
-def autocast_to_copy(aten_op, args, kwargs=None):
-    """This gets called when running matmul under autocast
-    when the input is a MXTensor, presenting as a fp32
-    tensor.
-    """
-    assert isinstance(args[0], MXTensor)
-    assert len(kwargs) == 1 and "dtype" in kwargs, (
-        "Only support dtype kwarg for autocast"
+@implements([aten.slice.Tensor])
+def mx_slice(func, types, args, kwargs):
+    x, dim, start, end, step = fill_defaults(args, 5, [0, None, None, 1])
+
+    if step != 1:
+        raise ValueError("Only support aten.slice with step=1")
+
+    M, K = x.shape[0], x.shape[1]
+
+    # TODO why doesn't scale have shape?
+    scale_shaped = x._scale_e8m0.view(M, K // x._block_size)
+
+    if dim == 0:
+        # Slicing along the first dimension (rows) TODO assuming that dim 1 is reduciton dim for now
+        sliced_scale = aten.slice.Tensor(scale_shaped, dim, start, end, step).flatten()
+        sliced_data = aten.slice.Tensor(x._data, dim, start, end, step)
+    elif dim == 1:
+        # Slicing along reduciton dim
+        if start is not None:
+            # Assert start is a multiple of block_size
+            assert start % x._block_size == 0, (
+                f"Start index {start} must be a multiple of block_size {x._block_size}"
+            )
+
+        if end is not None:
+            # Assert end is a multiple of block_size
+            assert end % x._block_size == 0, (
+                f"End index {end} must be a multiple of block_size {x._block_size}"
+            )
+
+        sliced_data = aten.slice.Tensor(x._data, dim, start, end, step)
+
+        # Calculate which scale elements to keep
+        start_block = 0 if start is None else start // x._block_size
+        end_block = -1 if end is None else end // x._block_size
+
+        # Slice the scale tensor accordingly
+        sliced_scale = aten.slice.Tensor(
+            scale_shaped, 1, start_block, end_block, step
+        ).flatten()
+    else:
+        raise ValueError(
+            f"MXTensor only supports slicing along dimensions 0 and 1, got dim={dim}"
+        )
+
+    return return_and_correct_aliasing(
+        func,
+        args,
+        kwargs,
+        MXTensor(
+            sliced_scale,
+            sliced_data,
+            x._elem_dtype,
+            x._block_size,
+            x._orig_dtype,
+            x._use_fp4_custom_triton_dequant_kernel,
+            x._gemm_kernel_choice,
+            x._pack_fp6,
+        ),
     )
-    assert kwargs["dtype"] in {
-        torch.float16,
-        torch.bfloat16,
-    }, "Only support floating point conversion for autocast w/ MXTensor"
-    res = MXTensor(
-        args[0]._scale_e8m0,
-        args[0]._data,
-        args[0]._elem_dtype,
-        args[0]._block_size,
-        kwargs["dtype"],
-        args[0]._use_fp4_custom_triton_dequant_kernel,
-        args[0]._gemm_kernel_choice,
-        args[0]._pack_fp6,
+
+
+@implements([aten.copy_.default])
+def mx_copy_(func, types, args, kwargs):
+    self = args[0]
+    src = args[1]
+    if MXTensor._same_metadata(self, src):
+        self_tensors = self.__tensor_flatten__()[0]
+        for tensor_name in self_tensors:
+            getattr(self, tensor_name).copy_(getattr(src, tensor_name))
+        return
+    raise ValueError(
+        f"Not supported args for copy_ due to metadata mistach: {args[0], args[1]}"
     )
-    return res
+
+
+@implements([aten._to_copy.default])
+def autocast_to_copy(func, types, args, kwargs):
+    """Autocast + device movement"""
+    assert isinstance(args[0], MXTensor)
+
+    # Handle dtype parameter
+    dtype = kwargs.pop("dtype", None)
+    if dtype is not None:
+        assert dtype in {
+            torch.float16,
+            torch.bfloat16,
+        }, "Only support floating point conversion for autocast w/ MXTensor"
+
+    # Handle device parameter
+    device = kwargs.pop("device", None)
+    if device is not None:
+        # Apply device change using _apply_fn_to_data
+        tensor = args[0]._apply_fn_to_data(lambda x: func(x, device=device))
+        tensor = return_and_correct_aliasing(func, args, {}, tensor)
+    else:
+        tensor = args[0]
+
+    # Verify no other kwargs remain
+    assert len(kwargs) == 0, "Only support dtype and device kwargs for autocast"
+
+    # If dtype is specified, create a new MXTensor with the requested dtype
+    if dtype is not None:
+        res = MXTensor(
+            tensor._scale_e8m0,
+            tensor._data,
+            tensor._elem_dtype,
+            tensor._block_size,
+            dtype,
+            tensor._use_fp4_custom_triton_dequant_kernel,
+            tensor._gemm_kernel_choice,
+            tensor._pack_fp6,
+        )
+        return res
+
+    # If only device was changed, return the device-changed tensor
+    return tensor
diff --git a/torchao/prototype/mx_formats/mx_subclass.py b/torchao/prototype/mx_formats/mx_subclass.py
new file mode 100644
index 0000000000..2173c97002
--- /dev/null
+++ b/torchao/prototype/mx_formats/mx_subclass.py
@@ -0,0 +1,157 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+import types
+from dataclasses import dataclass
+from typing import Optional
+
+import torch
+
+import torchao
+from torchao.core.config import AOBaseConfig
+from torchao.prototype.mx_formats import (
+    MXGemmKernelChoice,
+)
+from torchao.prototype.mx_formats.config import (
+    _validate_elem_dtype,
+    _validate_gemm_kernel_choice,
+)
+from torchao.prototype.mx_formats.mx_tensor import MXTensor
+from torchao.quantization.quant_api import to_linear_activation_quantized
+from torchao.quantization.transform_module import (
+    register_quantize_module_handler,
+)
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_5, is_sm_at_least_100
+
+
+# Note: This API is extra prototype and will change in the future
+@dataclass
+class MXFPInferenceConfig(AOBaseConfig):
+    """
+    MX Format Inference Quantization
+
+    This module provides support for running inference with float8 quantization using MX formats.
+    The quantization flow works as follows:
+
+    1. Weight Quantization:
+    - In _mx_inference_linear_transform(), the module's weight is converted to an MXTensor
+    - The weight is quantized to the specified dtype (float8_e4m3fn by default)
+    - This happens when quantize_() is called with an MXFPInferenceConfig
+
+    2. Activation Quantization:
+    - A callable (_input_activation_quant_func_mxfp) is defined that will quantize
+        activations during inference to the same dtype
+    - This function is passed to to_linear_activation_quantized() along with the
+        already-quantized weight
+
+    3. Runtime Flow:
+    - When the quantized module is called, the input goes through the LinearActivationQuantizedTensor
+    - The input (activation) is quantized just-in-time using the provided function
+    - The MX quantized activation and MX weight are used together in F.linear
+
+    Requirements:
+    - NVIDIA SM100+ hardware (Blackwell or newer) is required for execution
+    - PyTorch 2.5+ for proper serialization support
+
+    See also:
+    - LinearActivationQuantizedTensor in torchao.quantization.quant_api
+    - MXTensor in torchao.prototype.mx_formats.mx_tensor
+    """
+
+    block_size: int = 32
+
+    # Dtypes for Input and Weights
+    activation_dtype: torch.dtype = torch.float8_e4m3fn
+    weight_dtype: torch.dtype = torch.float8_e4m3fn
+
+    # Which kernel to run for mm
+    gemm_kernel_choice: MXGemmKernelChoice = MXGemmKernelChoice.CUBLAS
+
+    # Set some magic perf settings
+    set_inductor_config: bool = False
+
+    def __post_init__(self):
+        assert self.activation_dtype == self.weight_dtype, (
+            "For now - we only support matching input/weight dtypes."
+        )
+        _validate_elem_dtype(self.activation_dtype)
+        _validate_elem_dtype(self.weight_dtype)
+        _validate_gemm_kernel_choice(
+            self.gemm_kernel_choice, self.block_size, self.weight_dtype
+        )
+
+
+def _linear_extra_repr(self):
+    return f"in_features={self.weight.shape[1]}, out_features={self.weight.shape[0]}, weight={repr(self.weight)}"
+
+
+def _input_activation_quant_func_mxfp(
+    x: torch.Tensor,
+    activation_dtype: torch.dtype,
+    block_size: int,
+    scale: Optional[torch.Tensor] = None,
+):
+    """ """
+
+    # TODO scale for static quant
+
+    activation = MXTensor.to_mx(
+        x,
+        activation_dtype,
+        block_size=block_size,
+        gemm_kernel_choice=None,  # Get from weight
+        pack_fp6=False,  # TODO
+    )
+    return activation
+
+
+@register_quantize_module_handler(MXFPInferenceConfig)
+def _mx_inference_linear_transform(
+    module: torch.nn.Module, config: MXFPInferenceConfig
+):
+    # TODO Sm120 has slightly more restrictive reqs
+    # TODO handle AMD
+    assert is_sm_at_least_100(), "MXFP is only supported on sm100 machiens for now"
+    if config.set_inductor_config:
+        torchao.quantization.utils.recommended_inductor_config_setter()
+
+    activation_dtype = config.activation_dtype
+    weight_dtype = config.weight_dtype
+    weight = module.weight
+
+    assert weight.dtype == torch.bfloat16, (
+        f"Only supporting bf16 out dtype for now, got {weight.dtype}"
+    )
+
+    # Convert weight to MX Tensor
+    quantized_weight = MXTensor.to_mx(
+        weight,
+        weight_dtype,
+        block_size=config.block_size,
+        gemm_kernel_choice=config.gemm_kernel_choice,
+        pack_fp6=False,  # TODO
+    )
+
+    input_quant_func = _input_activation_quant_func_mxfp
+    input_quant_kwargs = {
+        "block_size": config.block_size,
+        "activation_dtype": activation_dtype,
+        "scale": None,
+    }
+
+    quantized_weight = to_linear_activation_quantized(
+        quantized_weight, input_quant_func, quant_kwargs=input_quant_kwargs
+    )
+
+    module.weight = torch.nn.Parameter(quantized_weight, requires_grad=False)
+    module.extra_repr = types.MethodType(_linear_extra_repr, module)
+    return module
+
+
+if TORCH_VERSION_AT_LEAST_2_5:
+    torch.serialization.add_safe_globals(
+        [MXTensor, MXGemmKernelChoice, _input_activation_quant_func_mxfp]
+    )
diff --git a/torchao/prototype/mx_formats/mx_tensor.py b/torchao/prototype/mx_formats/mx_tensor.py
index 3125f3c0cc..494e53d717 100644
--- a/torchao/prototype/mx_formats/mx_tensor.py
+++ b/torchao/prototype/mx_formats/mx_tensor.py
@@ -18,7 +18,7 @@
 """
 
 from enum import Enum, auto
-from typing import Dict, Union
+from typing import Callable, Dict, Union
 
 import torch
 
@@ -559,10 +559,17 @@ def __repr__(self):
     @classmethod
     def __torch_dispatch__(cls, func, types, args, kwargs=None):
         # avoid circular dependency
+        from torchao.prototype.mx_formats.mx_funcs import MX_FUNC_TABLE
         from torchao.prototype.mx_formats.mx_ops import MX_OPS_TABLE
 
         if func in MX_OPS_TABLE:
-            return MX_OPS_TABLE[func](func, args, kwargs)
+            return MX_OPS_TABLE[func](func, types, args, kwargs)
+
+        # TODO AO BASE_TENSOR doesn't respect dispatch and function modes
+        # We are calling nn.functional.linear from within LinearAct Tensor even though
+        # We are in a __torch__dispatch. This disables the decomposition and we get this op
+        if func == torch.ops.aten.linear.default:
+            return MX_FUNC_TABLE[func](func, types, args, kwargs)
 
         raise NotImplementedError(f"{func} not implemented")
 
@@ -631,5 +638,37 @@ def __tensor_unflatten__(
             metadata["_pack_fp6"],
         )
 
+    def _apply_fn_to_data(self, fn: Callable):
+        """Applies a fn to all tensor components stored on this class"""
+        tensor_names, ctx = self.__tensor_flatten__()
+
+        # Apply the function to each tensor component
+        new_tensors = {}
+        for name in tensor_names:
+            new_tensors[name] = fn(getattr(self, name))
+
+        return self.__class__.__tensor_unflatten__(
+            new_tensors,
+            ctx,
+            None,  # outer_size parameter
+            None,  # outer_stride parameter
+        )
+
     # Do not force the MXTensor type on the returned tensor
     __torch_function__ = torch._C._disabled_torch_function_impl
+
+    @classmethod
+    def _same_metadata(cls, self: "MXTensor", src: "MXTensor") -> bool:
+        return (
+            isinstance(self, MXTensor)
+            and isinstance(src, MXTensor)
+            and self._elem_dtype == src._elem_dtype
+            and self._block_size == src._block_size
+            and self._orig_dtype == src._orig_dtype
+            and self._use_fp4_custom_triton_dequant_kernel
+            == src._use_fp4_custom_triton_dequant_kernel
+            and self._gemm_kernel_choice == src._gemm_kernel_choice
+            and self._pack_fp6 == src._pack_fp6
+            and self._scale_e8m0.shape == src._scale_e8m0.shape
+            and self._data.shape == src._data.shape
+        )
diff --git a/torchao/prototype/mx_formats/utils.py b/torchao/prototype/mx_formats/utils.py
index 2c828e477c..e4777d3899 100644
--- a/torchao/prototype/mx_formats/utils.py
+++ b/torchao/prototype/mx_formats/utils.py
@@ -43,8 +43,7 @@ def to_blocked(input_matrix, use_triton_kernel: bool = True) -> Tensor:
 
     padded = input_matrix
     # TODO This is to work around VLLM's usage of compile w/ dynamic shapes
-    # if torch.compiler.is_compiling() or (rows, cols) != (padded_rows, padded_cols):
-    if (rows, cols) != (padded_rows, padded_cols):
+    if torch.compiler.is_compiling() or (rows, cols) != (padded_rows, padded_cols):
         padded = torch.zeros(
             (padded_rows, padded_cols),
             device=input_matrix.device,

From 69fc240ce47d12ee3994db752029d31916482f5b Mon Sep 17 00:00:00 2001
From: Alan Tuning <136696905+Degnel@users.noreply.github.com>
Date: Tue, 13 May 2025 00:21:10 +0200
Subject: [PATCH 021/165] Feat: Implementation of the DeepSeek blockwise
 quantization for fp8 tensors (#1763)

* Feat: Integration of DeepSeek's blockwise quantization
- fp8 triton gemm
- quant, dequant and linear utils
- time & precision benchmarks
- basic tests

* Doc: init + linting + readme

* Feat: adding triton dependency, adaptative testing dtype

* Fix:
- removing triton dependency
- cleanning adaptative dtype

* Fix:
- fixing W4A8 quantization for cutlass kernel in precision benchmark
- importing triton only if cuda available
- setting a less harsh threshold for quant-dequant and for gemm kernel mm precision

* Fix:
- condition triton import in gemm
- linting

* Fix: triton pytest skip

* Linting

* Fix:
- raising explicit error when running benchmark without cuda
- merging quant, dequant and gemm code into one file
- removing depricated int4/int8 comparison

* Fix:
- fix import in __init__.py and in blockwise_linear.py

* Optim: fixing poor performance on large M values

> the autotuner was optimizing based only on small M sizes at the beginning of the benchmark
	> added a `M_bucket` key to the autotuner to enable tuning based on similar M sizes
> added `128` to the `BLOCK_SIZE_M` configuration, which improves performance for large M values
> launcher now takes `block_size` into account (although using `block_size=128`
  is recommended for best performance)

* Fix: skipping blockwise quant precision test for older versions of triton

* Bench: incressing the bench range to m=8192
---
 ...enchmark_blockwise_scaled_linear_triton.py | 130 ++++++++
 test/prototype/test_blockwise_triton.py       |  72 +++++
 torchao/prototype/blockwise_fp8/README.md     |  29 ++
 torchao/prototype/blockwise_fp8/__init__.py   |  15 +
 .../blockwise_fp8/blockwise_linear.py         |  77 +++++
 .../blockwise_fp8/blockwise_quantization.py   | 279 ++++++++++++++++++
 6 files changed, 602 insertions(+)
 create mode 100644 benchmarks/benchmark_blockwise_scaled_linear_triton.py
 create mode 100644 test/prototype/test_blockwise_triton.py
 create mode 100644 torchao/prototype/blockwise_fp8/README.md
 create mode 100644 torchao/prototype/blockwise_fp8/__init__.py
 create mode 100644 torchao/prototype/blockwise_fp8/blockwise_linear.py
 create mode 100644 torchao/prototype/blockwise_fp8/blockwise_quantization.py

diff --git a/benchmarks/benchmark_blockwise_scaled_linear_triton.py b/benchmarks/benchmark_blockwise_scaled_linear_triton.py
new file mode 100644
index 0000000000..809202170a
--- /dev/null
+++ b/benchmarks/benchmark_blockwise_scaled_linear_triton.py
@@ -0,0 +1,130 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+
+import torch
+
+if torch.cuda.is_available():
+    import pandas as pd
+    from tqdm import tqdm
+    from triton.testing import do_bench
+
+    from torchao.float8.float8_utils import compute_error
+    from torchao.prototype.blockwise_fp8.blockwise_quantization import (
+        blockwise_fp8_gemm,
+        fp8_blockwise_act_quant,
+        fp8_blockwise_weight_quant,
+    )
+    from torchao.utils import is_sm_at_least_89
+else:
+    raise RuntimeError("This benchmark is only avaible on CUDA hardware")
+
+
+def benchmark_microseconds(f, *args, warmup=25, rep=100):
+    return (
+        do_bench(lambda: f(*args), warmup=warmup, rep=rep, return_mode="median") * 1e3
+    )
+
+
+def get_blockwise_problem(
+    m: int, n: int, k: int, block_size: int, dtype: torch.dtype, device
+):
+    assert n % block_size == 0 and k % block_size == 0, (
+        "N and K dims must be divisible by block_size"
+    )
+    assert dtype in [
+        torch.float8_e4m3fn,
+        torch.float8_e5m2,
+    ], "dtype must be torch.float8_e4m3fn or torch.float8_e5m2"
+    dtype_max = torch.finfo(dtype).max
+    A = (dtype_max * (2 * torch.rand(m, k, device=device) - 1)).to(dtype)
+    A_scale = torch.randn((m, k // block_size), dtype=torch.half, device=device)
+    B = (dtype_max * (2 * torch.rand(n, k, device=device) - 1)).to(dtype)
+    B_scale = torch.randn(
+        (n // block_size, k // block_size), dtype=torch.half, device=device
+    )
+
+    return A, A_scale, B, B_scale
+
+
+def benchmark_latency(
+    m: int, k: int, n: int, block_size: int, dtype: torch.dtype, device
+):
+    A_ref = torch.randn((m, k), dtype=torch.half, device=device)
+    B_ref = torch.randn((n, k), dtype=torch.half, device=device)
+    fp16_time = benchmark_microseconds(torch.nn.functional.linear, A_ref, B_ref)
+
+    A, A_scale, B, B_scale = get_blockwise_problem(m, n, k, block_size, dtype, device)
+    blockwise_time = benchmark_microseconds(
+        blockwise_fp8_gemm, A, A_scale, B, B_scale, block_size
+    )
+
+    return {
+        "m": m,
+        "k": k,
+        "n": n,
+        "block_size": block_size,
+        "dtype": dtype,
+        "fp16_latency (ms)": fp16_time,
+        "blockwise_latency (ms)": blockwise_time,
+        "blockwise_speedup": fp16_time / blockwise_time,
+    }
+
+
+def benchmark_precision(
+    m: int, k: int, n: int, block_size: int, dtype: torch.dtype, device
+):
+    lin = torch.nn.Linear(k, n, False, device, torch.half)
+    A = torch.randn((m, k), dtype=torch.half, device=device)
+    W = lin.weight
+    output = A @ W.T
+
+    A_q, A_s = fp8_blockwise_act_quant(A, block_size, dtype)
+    W_q, W_s = fp8_blockwise_weight_quant(W, block_size, dtype)
+    output_blockwise = blockwise_fp8_gemm(A_q, A_s, W_q, W_s, block_size)
+
+    return {
+        "m": m,
+        "k": k,
+        "n": n,
+        "block_size": block_size,
+        "dtype": dtype,
+        "error_blockwise (dB)": compute_error(output, output_blockwise),
+    }
+
+
+if __name__ == "__main__" and torch.cuda.is_available():
+    device = torch.device("cuda")
+    k_vals = (8192, 8192, 8192, 28672)
+    n_vals = (8192, 10240, 57344, 8192)
+    block_size_vals = (128, 128, 128, 128)
+
+    latency_results = []
+    precision_results = []
+
+    available_dtypes = (
+        [torch.float8_e4m3fn, torch.float8_e5m2]
+        if is_sm_at_least_89()
+        else [torch.float8_e5m2]
+    )
+    for m in tqdm([1 << i for i in range(14)]):
+        for dtype in available_dtypes:
+            for n, k, block_size in zip(n_vals, k_vals, block_size_vals):
+                latency_results.append(
+                    benchmark_latency(m, k, n, block_size, dtype, device)
+                )
+                precision_results.append(
+                    benchmark_precision(m, k, n, block_size, dtype, device)
+                )
+
+    df_latency = pd.DataFrame(latency_results)
+    df_precision = pd.DataFrame(precision_results)
+
+    df_latency.to_csv("blockwise_triton_latency_results.csv", index=False)
+    df_precision.to_csv("blockwise_triton_precision_results.csv", index=False)
+
+    print(df_latency.to_markdown(index=False))
+    print(df_precision.to_markdown(index=False))
diff --git a/test/prototype/test_blockwise_triton.py b/test/prototype/test_blockwise_triton.py
new file mode 100644
index 0000000000..8aab73f7e8
--- /dev/null
+++ b/test/prototype/test_blockwise_triton.py
@@ -0,0 +1,72 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+import pytest
+import torch
+
+from packaging import version
+
+triton = pytest.importorskip("triton", reason="Triton required to run this test")
+
+from torchao.prototype.blockwise_fp8.blockwise_quantization import (
+    blockwise_fp8_gemm,
+    fp8_blockwise_act_quant,
+    fp8_blockwise_weight_dequant,
+    fp8_blockwise_weight_quant,
+)
+from torchao.utils import is_sm_at_least_89
+
+BLOCKWISE_SIZE_MNK = [
+    (2, 512, 128),
+    (3, 2048, 2048),
+    (4, 3584, 640),
+    (13, 8704, 8576),
+    (26, 18944, 1664),
+    (67, 6656, 1408),
+]
+
+
+@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.parametrize("_, N, K", BLOCKWISE_SIZE_MNK)
+@pytest.mark.parametrize(
+    "dtype",
+    [torch.float8_e4m3fn, torch.float8_e5m2]
+    if is_sm_at_least_89()
+    else [torch.float8_e5m2],
+)
+def test_blockwise_quant_dequant(_, N, K, dtype):
+    x = torch.randn(N, K).cuda()
+    qx, s = fp8_blockwise_weight_quant(x, dtype=dtype)
+    x_reconstructed = fp8_blockwise_weight_dequant(qx, s)
+    error = torch.norm(x - x_reconstructed) / torch.norm(x)
+    print(f"Relative Error: {error.item():.6f}")
+
+    assert error < 0.1, "Quant-Dequant error is too high"
+
+
+@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(
+    version.parse(triton.__version__) < version.parse("3.3.0"),
+    reason="Triton version < 3.3.0, test skipped",
+)
+@pytest.mark.parametrize("M, N, K", BLOCKWISE_SIZE_MNK)
+@pytest.mark.parametrize(
+    "dtype",
+    [torch.float8_e4m3fn, torch.float8_e5m2]
+    if is_sm_at_least_89()
+    else [torch.float8_e5m2],
+)
+def test_blockwise_fp8_gemm(M, N, K, dtype):
+    A = torch.randn(M, K).cuda()
+    B = torch.randn(N, K).cuda()
+    C = A @ B.T
+    A_q, A_s = fp8_blockwise_act_quant(A, dtype=dtype)
+    B_q, B_s = fp8_blockwise_weight_quant(B, dtype=dtype)
+    C_q = blockwise_fp8_gemm(A_q, A_s, B_q, B_s)
+    error = torch.norm(C - C_q) / torch.norm(C)
+    print(f"Relative Error: {error.item():.6f}")
+
+    assert error < 0.1, "Quantize gemm error is too high"
diff --git a/torchao/prototype/blockwise_fp8/README.md b/torchao/prototype/blockwise_fp8/README.md
new file mode 100644
index 0000000000..16bb5073a1
--- /dev/null
+++ b/torchao/prototype/blockwise_fp8/README.md
@@ -0,0 +1,29 @@
+# Blockwise Quantization Implementation
+
+## Overview
+
+This directory contains the implementation of blockwise quantization introduced by DeepSeek. The method involves quantizing activations and weight matrices in blocks of 128x1 and 128x128, respectively.
+
+## Quantization Process
+
+### Activation Quantization
+- Activations are quantized in blocks of size 128x1 using the FP8 format
+
+### Weight Matrix Quantization
+- Weights are quantized in blocks of size 128x128 using the FP8 format
+
+## Kernel Implementation in Triton
+
+- The kernel for blockwise quantization is implemented using Triton
+- For now, the only supported types are: torch.float8_e4m3fn and torch.float8_e5m2
+
+## Illustration
+
+![Blockwise Quantization Illustration](https://arxiv.org/html/2412.19437v1/x7.png)
+
+*Illustration of the blockwise quantization process.*
+
+## Original Paper
+
+For detailed motivations and technical specifications, please refer to the original paper:
+- [DeepSeek Blockwise Quantization Paper](https://arxiv.org/html/2412.19437v1)
diff --git a/torchao/prototype/blockwise_fp8/__init__.py b/torchao/prototype/blockwise_fp8/__init__.py
new file mode 100644
index 0000000000..f2842417e4
--- /dev/null
+++ b/torchao/prototype/blockwise_fp8/__init__.py
@@ -0,0 +1,15 @@
+from .blockwise_linear import BlockwiseQuantLinear
+from .blockwise_quantization import (
+    blockwise_fp8_gemm,
+    fp8_blockwise_act_quant,
+    fp8_blockwise_weight_dequant,
+    fp8_blockwise_weight_quant,
+)
+
+__all__ = [
+    "blockwise_fp8_gemm",
+    "BlockwiseQuantLinear",
+    "fp8_blockwise_act_quant",
+    "fp8_blockwise_weight_quant",
+    "fp8_blockwise_weight_dequant",
+]
diff --git a/torchao/prototype/blockwise_fp8/blockwise_linear.py b/torchao/prototype/blockwise_fp8/blockwise_linear.py
new file mode 100644
index 0000000000..c25b946732
--- /dev/null
+++ b/torchao/prototype/blockwise_fp8/blockwise_linear.py
@@ -0,0 +1,77 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+import torch
+from torch import nn
+
+from torchao.prototype.blockwise_fp8.blockwise_quantization import (
+    blockwise_fp8_gemm,
+    fp8_blockwise_act_quant,
+)
+
+
+class BlockwiseQuantLinear(nn.Module):
+    """
+    Custom linear layer with support for quantized weights and optional bias.
+
+    Args:
+        in_features (int): Number of input features.
+        out_features (int): Number of output features.
+        bias (bool): Whether to include a bias term. Defaults to False.
+        block_size (int): Block size for quantization. Defaults to 128.
+        dtype (torch.dtype): Data type for the weights. Defaults to torch.float8_e4m3fn.
+    """
+
+    dtype = torch.bfloat16
+
+    def __init__(
+        self,
+        in_features: int,
+        out_features: int,
+        bias: bool = False,
+        block_size: int = 128,
+        dtype: torch.dtype = torch.float8_e4m3fn,
+    ):
+        super().__init__()
+        supported_dtypes = [
+            torch.float8_e4m3fn,
+            torch.float8_e5m2,
+        ]
+        assert dtype in supported_dtypes, (
+            f"Unsupported dtype: {dtype}. Supported dtypes: {supported_dtypes}"
+        )
+        scale_in_features = (in_features + block_size - 1) // block_size
+        scale_out_features = (out_features + block_size - 1) // block_size
+        self.weight = nn.Parameter(torch.empty(out_features, in_features, dtype=dtype))
+        self.weight.scale = self.scale = nn.Parameter(
+            torch.empty(scale_out_features, scale_in_features, dtype=torch.float32)
+        )
+        self.block_size = block_size
+        self.dtype
+
+        if bias:
+            self.bias = nn.Parameter(torch.empty(out_features))
+        else:
+            self.register_parameter("bias", None)
+
+    def forward(self, x: torch.Tensor) -> torch.Tensor:
+        """
+        Forward pass for the custom linear layer.
+
+        Args:
+            x (torch.Tensor): Input tensor.
+
+        Returns:
+            torch.Tensor: Transformed tensor after linear computation.
+        """
+        x, scale = fp8_blockwise_act_quant(x, self.block_size, self.dtype)
+        y = blockwise_fp8_gemm(
+            x, scale, self.weight, self.weight.scale, self.block_size
+        )
+
+        if self.bias is not None:
+            y += self.bias
+        return y
diff --git a/torchao/prototype/blockwise_fp8/blockwise_quantization.py b/torchao/prototype/blockwise_fp8/blockwise_quantization.py
new file mode 100644
index 0000000000..1d296249f9
--- /dev/null
+++ b/torchao/prototype/blockwise_fp8/blockwise_quantization.py
@@ -0,0 +1,279 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+import math
+from typing import Tuple
+
+import torch
+import triton
+import triton.language as tl
+from triton import Config
+
+# Original implementation at https://github.com/deepseek-ai/DeepSeek-V3/blob/main/inference/kernel.py
+
+fp8_gemm_configs = [
+    Config(
+        {"BLOCK_SIZE_M": block_m, "BLOCK_SIZE_N": block_n},
+        num_stages=num_stages,
+        num_warps=8,
+    )
+    for block_m in [16, 32, 64, 128]
+    for block_n in [32, 64, 128]
+    for num_stages in [3, 4, 5, 6]
+]
+
+
+@triton.autotune(configs=fp8_gemm_configs, key=["N", "K", "M_BUCKET", "BLOCK_SIZE_K"])
+@triton.jit
+def blockwise_fp8_gemm_kernel(
+    a_ptr,
+    b_ptr,
+    c_ptr,
+    a_s_ptr,
+    b_s_ptr,
+    M,
+    N: tl.constexpr,
+    K: tl.constexpr,
+    M_BUCKET: tl.constexpr,
+    BLOCK_SIZE_M: tl.constexpr,
+    BLOCK_SIZE_N: tl.constexpr,
+    BLOCK_SIZE_K: tl.constexpr,
+):
+    pid_m = tl.program_id(axis=0)
+    pid_n = tl.program_id(axis=1)
+    k = tl.cdiv(K, BLOCK_SIZE_K)
+    offs_m = (pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M)) % M
+    offs_n = (pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)) % N
+    offs_k = tl.arange(0, BLOCK_SIZE_K)
+    a_ptrs = a_ptr + offs_m[:, None] * K + offs_k[None, :]
+    b_ptrs = b_ptr + offs_n[None, :] * K + offs_k[:, None]
+    a_s_ptrs = a_s_ptr + offs_m * k
+    b_s_ptrs = b_s_ptr + (offs_n // BLOCK_SIZE_K) * k
+
+    accumulator = tl.zeros((BLOCK_SIZE_M, BLOCK_SIZE_N), dtype=tl.float32)
+    for i in range(k):
+        a = tl.load(a_ptrs, mask=offs_k[None, :] < K - i * BLOCK_SIZE_K, other=0.0)
+        b = tl.load(b_ptrs, mask=offs_k[:, None] < K - i * BLOCK_SIZE_K, other=0.0)
+        a_s = tl.load(a_s_ptrs)
+        b_s = tl.load(b_s_ptrs)
+        accumulator += tl.dot(a, b) * a_s[:, None] * b_s[None, :]
+        a_ptrs += BLOCK_SIZE_K
+        b_ptrs += BLOCK_SIZE_K
+        a_s_ptrs += 1
+        b_s_ptrs += 1
+
+    c = accumulator.to(c_ptr.dtype.element_ty)
+    offs_m = pid_m * BLOCK_SIZE_M + tl.arange(0, BLOCK_SIZE_M)
+    offs_n = pid_n * BLOCK_SIZE_N + tl.arange(0, BLOCK_SIZE_N)
+    c_ptrs = c_ptr + offs_m[:, None] * N + offs_n[None, :]
+    mask = (offs_m[:, None] < M) & (offs_n[None, :] < N)
+    tl.store(c_ptrs, c, mask=mask)
+
+
+def blockwise_fp8_gemm(
+    a: torch.Tensor,
+    a_s: torch.Tensor,
+    b: torch.Tensor,
+    b_s: torch.Tensor,
+    block_size: int = 128,
+):
+    assert a.is_contiguous() and b.is_contiguous()
+    assert a_s.is_contiguous() and b_s.is_contiguous()
+    K = a.size(-1)
+    M = a.numel() // K
+    N = b.size(0)
+    M_BUCKET = math.ceil(math.log2(M))
+    c = a.new_empty(*a.size()[:-1], N, dtype=torch.get_default_dtype())
+    grid = lambda META: (
+        triton.cdiv(M, META["BLOCK_SIZE_M"]),
+        triton.cdiv(N, META["BLOCK_SIZE_N"]),
+    )
+    blockwise_fp8_gemm_kernel[grid](
+        a, b, c, a_s, b_s, M, N, K, M_BUCKET, BLOCK_SIZE_K=block_size
+    )
+    return c
+
+
+@triton.jit
+def fp8_blockwise_act_quant_kernel(x_ptr, y_ptr, s_ptr, BLOCK_SIZE: tl.constexpr):
+    """
+    Quantizes the input tensor `x_ptr` and stores the result in `y_ptr` and the scaling factor in `s_ptr`.
+
+    Args:
+        x_ptr (triton.Pointer): Pointer to the input tensor.
+        y_ptr (triton.Pointer): Pointer to the output tensor where quantized values will be stored.
+        s_ptr (triton.Pointer): Pointer to the output tensor where scaling factors will be stored.
+        BLOCK_SIZE (tl.constexpr): The size of the block to be processed by each program instance.
+
+    Returns:
+        None
+    """
+    pid = tl.program_id(axis=0)
+    offs = pid * BLOCK_SIZE + tl.arange(0, BLOCK_SIZE)
+    x = tl.load(x_ptr + offs).to(tl.float32)
+    s = tl.max(tl.abs(x)) / 448.0
+    y = x / s
+    y = y.to(y_ptr.dtype.element_ty)
+    tl.store(y_ptr + offs, y)
+    tl.store(s_ptr + pid, s)
+
+
+def fp8_blockwise_act_quant(
+    x: torch.Tensor, block_size: int = 128, dtype: torch.dtype = torch.float8_e4m3fn
+) -> Tuple[torch.Tensor, torch.Tensor]:
+    """
+    Quantizes the input tensor `x` using block-wise quantization with block size being BLOCK_SIZEx1.
+
+    Args:
+        x (torch.Tensor): The input tensor to be quantized. Must be contiguous and its last dimension size must be divisible by `block_size`.
+        block_size (int, optional): The size of the blocks to be used for quantization. Default is 128.
+        dtype (torch.dtype, optional): The dtype to use for the quantized tensor. Default is `torch.float8_e4m3fn`.
+
+
+    Returns:
+        Tuple[torch.Tensor, torch.Tensor]: A tuple containing:
+            - The quantized tensor with dtype `dtype`.
+            - A tensor of scaling factors with dtype `torch.float32`.
+    """
+    assert x.is_contiguous(), "Input tensor must be contiguous"
+    assert x.size(-1) % block_size == 0, (
+        f"Last dimension size must be divisible by block_size (block_size={block_size})"
+    )
+    assert dtype in [
+        torch.float8_e4m3fn,
+        torch.float8_e5m2,
+    ], "dtype must be torch.float8_e4m3fn or torch.float8_e5m2"
+    y = torch.empty_like(x, dtype=dtype)
+    s = x.new_empty(*x.size()[:-1], x.size(-1) // block_size, dtype=torch.float32)
+    grid = lambda meta: (triton.cdiv(x.numel(), meta["BLOCK_SIZE"]),)
+    fp8_blockwise_act_quant_kernel[grid](x, y, s, BLOCK_SIZE=block_size)
+    return y, s
+
+
+@triton.jit
+def fp8_blockwise_weight_quant_kernel(
+    x_ptr, y_ptr, s_ptr, M, N, BLOCK_SIZE: tl.constexpr
+):
+    """
+    Quantizes the input tensor `x_ptr` and stores the result in `y_ptr` and the scaling factors in `s_ptr`.
+
+    Args:
+        x_ptr (tl.pointer): Pointer to the input tensor.
+        y_ptr (tl.pointer): Pointer to the output tensor where quantized values will be stored.
+        s_ptr (tl.pointer): Pointer to the output tensor where scaling factors will be stored.
+        M (int): Number of rows in the weight matrix.
+        N (int): Number of columns in the weight matrix.
+        BLOCK_SIZE (tl.constexpr): The size of the block to be processed by each program instance.
+    """
+    pid_m = tl.program_id(axis=0)
+    pid_n = tl.program_id(axis=1)
+    n = tl.cdiv(N, BLOCK_SIZE)
+    offs_m = pid_m * BLOCK_SIZE + tl.arange(0, BLOCK_SIZE)
+    offs_n = pid_n * BLOCK_SIZE + tl.arange(0, BLOCK_SIZE)
+    offs = offs_m[:, None] * N + offs_n[None, :]
+    mask = (offs_m[:, None] < M) & (offs_n[None, :] < N)
+    x = tl.load(x_ptr + offs, mask=mask).to(tl.float32)
+    s = tl.max(tl.abs(x)) / 448.0
+    y = x / s
+    y = y.to(y_ptr.dtype.element_ty)
+    tl.store(y_ptr + offs, y, mask=mask)
+    tl.store(s_ptr + pid_m * n + pid_n, s)
+
+
+def fp8_blockwise_weight_quant(
+    x: torch.Tensor, block_size: int = 128, dtype=torch.float8_e4m3fn
+) -> Tuple[torch.Tensor, torch.Tensor]:
+    """
+    Quantizes the given weight tensor using block-wise quantization with block size being BLOCK_SIZExBLOCK_SIZE.
+
+    Args:
+        x (torch.Tensor): The weight tensor to be quantized.
+        block_size (int, optional): The block size to use for quantization. Defaults to 128.
+        dtype (torch.dtype, optional): The dtype to use for the quantized tensor. Defaults to `torch.float8_e4m3fn`.
+
+    Returns:
+        Tuple[torch.Tensor, torch.Tensor]: A tuple containing:
+            - The quantized weight tensor with dtype `dtype`.
+            - A tensor of scaling factors with dtype `torch.float32`.
+    """
+    assert x.is_contiguous(), "Input tensor must be contiguous"
+    assert x.dim() == 2, "Input tensor must have 2 dimensions"
+    assert x.size(0) % block_size == 0 and x.size(1) % block_size == 0, (
+        f"Both dimensions of x must be divisible by block_size (block_size={block_size})"
+    )
+    assert dtype in [
+        torch.float8_e4m3fn,
+        torch.float8_e5m2,
+    ], "dtype must be torch.float8_e4m3fn or torch.float8_e5m2"
+    M, N = x.size()
+    y = torch.empty_like(x, dtype=dtype)
+    s = x.new_empty(M // block_size, N // block_size, dtype=torch.float32)
+    grid = lambda meta: (
+        triton.cdiv(M, meta["BLOCK_SIZE"]),
+        triton.cdiv(N, meta["BLOCK_SIZE"]),
+    )
+    fp8_blockwise_weight_quant_kernel[grid](x, y, s, M, N, BLOCK_SIZE=block_size)
+    return y, s
+
+
+@triton.jit
+def fp8_blockwise_weight_dequant_kernel(
+    x_ptr, s_ptr, y_ptr, M, N, BLOCK_SIZE: tl.constexpr
+):
+    """
+    Dequantizes weights using the provided scaling factors and stores the result.
+
+    Args:
+        x_ptr (tl.pointer): Pointer to the quantized weights.
+        s_ptr (tl.pointer): Pointer to the scaling factors.
+        y_ptr (tl.pointer): Pointer to the output buffer for dequantized weights.
+        M (int): Number of rows in the weight matrix.
+        N (int): Number of columns in the weight matrix.
+        BLOCK_SIZE (tl.constexpr): Size of the block for tiling.
+
+    Returns:
+        None
+    """
+    pid_m = tl.program_id(axis=0)
+    pid_n = tl.program_id(axis=1)
+    n = tl.cdiv(N, BLOCK_SIZE)
+    offs_m = pid_m * BLOCK_SIZE + tl.arange(0, BLOCK_SIZE)
+    offs_n = pid_n * BLOCK_SIZE + tl.arange(0, BLOCK_SIZE)
+    offs = offs_m[:, None] * N + offs_n[None, :]
+    mask = (offs_m[:, None] < M) & (offs_n[None, :] < N)
+    x = tl.load(x_ptr + offs, mask=mask).to(tl.float32)
+    s = tl.load(s_ptr + pid_m * n + pid_n)
+    y = x * s
+    tl.store(y_ptr + offs, y, mask=mask)
+
+
+def fp8_blockwise_weight_dequant(
+    x: torch.Tensor, s: torch.Tensor, block_size: int = 128
+) -> torch.Tensor:
+    """
+    Dequantizes the given weight tensor using the provided scale tensor.
+
+    Args:
+        x (torch.Tensor): The quantized weight tensor of shape (M, N).
+        s (torch.Tensor): The scale tensor of shape (M, N).
+        block_size (int, optional): The block size to use for dequantization. Defaults to 128.
+
+    Returns:
+        torch.Tensor: The dequantized weight tensor of the same shape as `x`.
+
+    Raises:
+        AssertionError: If `x` or `s` are not contiguous or if their dimensions are not 2.
+    """
+    assert x.is_contiguous() and s.is_contiguous(), "Input tensors must be contiguous"
+    assert x.dim() == 2 and s.dim() == 2, "Input tensors must have 2 dimensions"
+    M, N = x.size()
+    y = torch.empty_like(x, dtype=torch.get_default_dtype())
+    grid = lambda meta: (
+        triton.cdiv(M, meta["BLOCK_SIZE"]),
+        triton.cdiv(N, meta["BLOCK_SIZE"]),
+    )
+    fp8_blockwise_weight_dequant_kernel[grid](x, s, y, M, N, BLOCK_SIZE=block_size)
+    return y

From 846b433b9412d4e3567284f8fa49ad23921d3e8d Mon Sep 17 00:00:00 2001
From: Daniel Vega-Myhre <danvm@meta.com>
Date: Mon, 12 May 2025 16:40:25 -0700
Subject: [PATCH 022/165] Add blockwise fp8 gemm benchmarks to README (#2203)

add blockwise fp8 gemm benchmarks
---
 torchao/prototype/blockwise_fp8/README.md | 121 ++++++++++++++++++++++
 1 file changed, 121 insertions(+)

diff --git a/torchao/prototype/blockwise_fp8/README.md b/torchao/prototype/blockwise_fp8/README.md
index 16bb5073a1..2421afef14 100644
--- a/torchao/prototype/blockwise_fp8/README.md
+++ b/torchao/prototype/blockwise_fp8/README.md
@@ -27,3 +27,124 @@ This directory contains the implementation of blockwise quantization introduced
 
 For detailed motivations and technical specifications, please refer to the original paper:
 - [DeepSeek Blockwise Quantization Paper](https://arxiv.org/html/2412.19437v1)
+
+## Benchmarks
+
+Below are performance benchmarks measuring FP8 blockwise GEMM latency against fp16 on a single H100 GPU. 
+These benchmarks can be reproduced using this [benchmarking script](https://github.com/pytorch/ao/blob/main/benchmarks/benchmark_blockwise_scaled_linear_triton.py).
+
+|    m |     k |     n |   block_size | dtype               |   fp16_latency (ms) |   blockwise_latency (ms) |   blockwise_speedup |
+|-----:|------:|------:|-------------:|:--------------------|--------------------:|-------------------------:|--------------------:|
+|    1 |  8192 |  8192 |          128 | torch.float8_e4m3fn |              83.744 |                   52.224 |            1.60355  |
+|    1 |  8192 | 10240 |          128 | torch.float8_e4m3fn |              99.52  |                   61.12  |            1.62827  |
+|    1 |  8192 | 57344 |          128 | torch.float8_e4m3fn |             436.608 |                  234     |            1.86585  |
+|    1 | 28672 |  8192 |          128 | torch.float8_e4m3fn |             233.568 |                  131.168 |            1.78068  |
+|    1 |  8192 |  8192 |          128 | torch.float8_e5m2   |              84.896 |                   52.736 |            1.60983  |
+|    1 |  8192 | 10240 |          128 | torch.float8_e5m2   |             100.224 |                   60.96  |            1.64409  |
+|    1 |  8192 | 57344 |          128 | torch.float8_e5m2   |             441.152 |                  233.968 |            1.88552  |
+|    1 | 28672 |  8192 |          128 | torch.float8_e5m2   |             233.28  |                  130.816 |            1.78327  |
+|    2 |  8192 |  8192 |          128 | torch.float8_e4m3fn |              83.392 |                   53.664 |            1.55397  |
+|    2 |  8192 | 10240 |          128 | torch.float8_e4m3fn |             100.192 |                   61.632 |            1.62565  |
+|    2 |  8192 | 57344 |          128 | torch.float8_e4m3fn |             432.384 |                  233.664 |            1.85045  |
+|    2 | 28672 |  8192 |          128 | torch.float8_e4m3fn |             233.648 |                  133.6   |            1.74886  |
+|    2 |  8192 |  8192 |          128 | torch.float8_e5m2   |              83.232 |                   53.6   |            1.55284  |
+|    2 |  8192 | 10240 |          128 | torch.float8_e5m2   |             100.608 |                   61.664 |            1.63155  |
+|    2 |  8192 | 57344 |          128 | torch.float8_e5m2   |             432.32  |                  235.152 |            1.83847  |
+|    2 | 28672 |  8192 |          128 | torch.float8_e5m2   |             233.824 |                  136.256 |            1.71606  |
+|    4 |  8192 |  8192 |          128 | torch.float8_e4m3fn |              84.16  |                   52.928 |            1.59008  |
+|    4 |  8192 | 10240 |          128 | torch.float8_e4m3fn |             100.544 |                   61.728 |            1.62882  |
+|    4 |  8192 | 57344 |          128 | torch.float8_e4m3fn |             432.768 |                  234.944 |            1.842    |
+|    4 | 28672 |  8192 |          128 | torch.float8_e4m3fn |             234.432 |                  134.432 |            1.74387  |
+|    4 |  8192 |  8192 |          128 | torch.float8_e5m2   |              83.872 |                   53.408 |            1.5704   |
+|    4 |  8192 | 10240 |          128 | torch.float8_e5m2   |              99.84  |                   62.24  |            1.60411  |
+|    4 |  8192 | 57344 |          128 | torch.float8_e5m2   |             433.376 |                  238.272 |            1.81883  |
+|    4 | 28672 |  8192 |          128 | torch.float8_e5m2   |             235.584 |                  134.08  |            1.75704  |
+|    8 |  8192 |  8192 |          128 | torch.float8_e4m3fn |              83.648 |                   53.472 |            1.56433  |
+|    8 |  8192 | 10240 |          128 | torch.float8_e4m3fn |             100.704 |                   62.432 |            1.61302  |
+|    8 |  8192 | 57344 |          128 | torch.float8_e4m3fn |             439.104 |                  238.208 |            1.84336  |
+|    8 | 28672 |  8192 |          128 | torch.float8_e4m3fn |             234.272 |                  135.072 |            1.73442  |
+|    8 |  8192 |  8192 |          128 | torch.float8_e5m2   |              84.128 |                   53.728 |            1.56581  |
+|    8 |  8192 | 10240 |          128 | torch.float8_e5m2   |             100.512 |                   62.976 |            1.59604  |
+|    8 |  8192 | 57344 |          128 | torch.float8_e5m2   |             439.36  |                  238.496 |            1.84221  |
+|    8 | 28672 |  8192 |          128 | torch.float8_e5m2   |             235.04  |                  135.424 |            1.73559  |
+|   16 |  8192 |  8192 |          128 | torch.float8_e4m3fn |              83.808 |                   53.664 |            1.56172  |
+|   16 |  8192 | 10240 |          128 | torch.float8_e4m3fn |              99.584 |                   63.104 |            1.57809  |
+|   16 |  8192 | 57344 |          128 | torch.float8_e4m3fn |             444     |                  244.192 |            1.81824  |
+|   16 | 28672 |  8192 |          128 | torch.float8_e4m3fn |             235.52  |                  133.792 |            1.76034  |
+|   16 |  8192 |  8192 |          128 | torch.float8_e5m2   |              83.488 |                   53.568 |            1.55854  |
+|   16 |  8192 | 10240 |          128 | torch.float8_e5m2   |             101.216 |                   63.232 |            1.60071  |
+|   16 |  8192 | 57344 |          128 | torch.float8_e5m2   |             444.608 |                  245.936 |            1.80782  |
+|   16 | 28672 |  8192 |          128 | torch.float8_e5m2   |             235.36  |                  133.152 |            1.7676   |
+|   32 |  8192 |  8192 |          128 | torch.float8_e4m3fn |              83.872 |                   53.312 |            1.57323  |
+|   32 |  8192 | 10240 |          128 | torch.float8_e4m3fn |             102.688 |                   63.264 |            1.62317  |
+|   32 |  8192 | 57344 |          128 | torch.float8_e4m3fn |             441.792 |                  243.04  |            1.81777  |
+|   32 | 28672 |  8192 |          128 | torch.float8_e4m3fn |             237.12  |                  133.632 |            1.77443  |
+|   32 |  8192 |  8192 |          128 | torch.float8_e5m2   |              86.08  |                   53.216 |            1.61756  |
+|   32 |  8192 | 10240 |          128 | torch.float8_e5m2   |             102.032 |                   63.2   |            1.61443  |
+|   32 |  8192 | 57344 |          128 | torch.float8_e5m2   |             439.168 |                  245.184 |            1.79118  |
+|   32 | 28672 |  8192 |          128 | torch.float8_e5m2   |             238.016 |                  134.336 |            1.7718   |
+|   64 |  8192 |  8192 |          128 | torch.float8_e4m3fn |              85.888 |                   53.632 |            1.60143  |
+|   64 |  8192 | 10240 |          128 | torch.float8_e4m3fn |              93.632 |                   63.936 |            1.46446  |
+|   64 |  8192 | 57344 |          128 | torch.float8_e4m3fn |             471.44  |                  245.2   |            1.92268  |
+|   64 | 28672 |  8192 |          128 | torch.float8_e4m3fn |             240     |                  137.424 |            1.74642  |
+|   64 |  8192 |  8192 |          128 | torch.float8_e5m2   |              85.984 |                   54.016 |            1.59182  |
+|   64 |  8192 | 10240 |          128 | torch.float8_e5m2   |              93.376 |                   64.032 |            1.45827  |
+|   64 |  8192 | 57344 |          128 | torch.float8_e5m2   |             471.36  |                  244.576 |            1.92725  |
+|   64 | 28672 |  8192 |          128 | torch.float8_e5m2   |             242.4   |                  136.096 |            1.7811   |
+|  128 |  8192 |  8192 |          128 | torch.float8_e4m3fn |              91.008 |                   57.184 |            1.59149  |
+|  128 |  8192 | 10240 |          128 | torch.float8_e4m3fn |              96.608 |                   67.936 |            1.42204  |
+|  128 |  8192 | 57344 |          128 | torch.float8_e4m3fn |             449.6   |                  292.48  |            1.5372   |
+|  128 | 28672 |  8192 |          128 | torch.float8_e4m3fn |             247.84  |                  147.232 |            1.68333  |
+|  128 |  8192 |  8192 |          128 | torch.float8_e5m2   |              89.152 |                   57.248 |            1.55729  |
+|  128 |  8192 | 10240 |          128 | torch.float8_e5m2   |              96.64  |                   68.784 |            1.40498  |
+|  128 |  8192 | 57344 |          128 | torch.float8_e5m2   |             450.048 |                  284.16  |            1.58378  |
+|  128 | 28672 |  8192 |          128 | torch.float8_e5m2   |             246.88  |                  148.064 |            1.66739  |
+|  256 |  8192 |  8192 |          128 | torch.float8_e4m3fn |              85.984 |                   62.368 |            1.37866  |
+|  256 |  8192 | 10240 |          128 | torch.float8_e4m3fn |             101.216 |                  104.896 |            0.964918 |
+|  256 |  8192 | 57344 |          128 | torch.float8_e4m3fn |             477.984 |                  452.832 |            1.05554  |
+|  256 | 28672 |  8192 |          128 | torch.float8_e4m3fn |             260.224 |                  215.392 |            1.20814  |
+|  256 |  8192 |  8192 |          128 | torch.float8_e5m2   |              86.432 |                   62.048 |            1.39299  |
+|  256 |  8192 | 10240 |          128 | torch.float8_e5m2   |             101.024 |                  103.904 |            0.972282 |
+|  256 |  8192 | 57344 |          128 | torch.float8_e5m2   |             475.568 |                  433.792 |            1.0963   |
+|  256 | 28672 |  8192 |          128 | torch.float8_e5m2   |             261.824 |                  207.968 |            1.25896  |
+|  512 |  8192 |  8192 |          128 | torch.float8_e4m3fn |             117.952 |                  112.992 |            1.0439   |
+|  512 |  8192 | 10240 |          128 | torch.float8_e4m3fn |             151.504 |                  166.08  |            0.912235 |
+|  512 |  8192 | 57344 |          128 | torch.float8_e4m3fn |             836.848 |                  881.312 |            0.949548 |
+|  512 | 28672 |  8192 |          128 | torch.float8_e4m3fn |             442.528 |                  402.464 |            1.09955  |
+|  512 |  8192 |  8192 |          128 | torch.float8_e5m2   |             121.184 |                  114.592 |            1.05753  |
+|  512 |  8192 | 10240 |          128 | torch.float8_e5m2   |             151.424 |                  163.296 |            0.927298 |
+|  512 |  8192 | 57344 |          128 | torch.float8_e5m2   |             837.312 |                  873.664 |            0.958391 |
+|  512 | 28672 |  8192 |          128 | torch.float8_e5m2   |             437.664 |                  400.928 |            1.09163  |
+| 1024 |  8192 |  8192 |          128 | torch.float8_e4m3fn |             227.008 |                  224.384 |            1.01169  |
+| 1024 |  8192 | 10240 |          128 | torch.float8_e4m3fn |             289.28  |                  283.872 |            1.01905  |
+| 1024 |  8192 | 57344 |          128 | torch.float8_e4m3fn |            1672.13  |                 1673.34  |            0.999273 |
+| 1024 | 28672 |  8192 |          128 | torch.float8_e4m3fn |             800     |                  769.152 |            1.04011  |
+| 1024 |  8192 |  8192 |          128 | torch.float8_e5m2   |             224.48  |                  223.456 |            1.00458  |
+| 1024 |  8192 | 10240 |          128 | torch.float8_e5m2   |             289.408 |                  283.424 |            1.02111  |
+| 1024 |  8192 | 57344 |          128 | torch.float8_e5m2   |            1649.58  |                 1626.88  |            1.01396  |
+| 1024 | 28672 |  8192 |          128 | torch.float8_e5m2   |             805.392 |                  768.416 |            1.04812  |
+| 2048 |  8192 |  8192 |          128 | torch.float8_e4m3fn |             449.344 |                  458.272 |            0.980518 |
+| 2048 |  8192 | 10240 |          128 | torch.float8_e4m3fn |             569.888 |                  586.224 |            0.972134 |
+| 2048 |  8192 | 57344 |          128 | torch.float8_e4m3fn |            3275.84  |                 3251.9   |            1.00736  |
+| 2048 | 28672 |  8192 |          128 | torch.float8_e4m3fn |            1614.37  |                 1555.68  |            1.03772  |
+| 2048 |  8192 |  8192 |          128 | torch.float8_e5m2   |             450.624 |                  461.712 |            0.975985 |
+| 2048 |  8192 | 10240 |          128 | torch.float8_e5m2   |             575.36  |                  582.016 |            0.988564 |
+| 2048 |  8192 | 57344 |          128 | torch.float8_e5m2   |            3363.3   |                 3213.31  |            1.04668  |
+| 2048 | 28672 |  8192 |          128 | torch.float8_e5m2   |            1574.32  |                 1525.66  |            1.03189  |
+| 4096 |  8192 |  8192 |          128 | torch.float8_e4m3fn |             915.216 |                  964.592 |            0.948812 |
+| 4096 |  8192 | 10240 |          128 | torch.float8_e4m3fn |            1157.18  |                 1196.42  |            0.967209 |
+| 4096 |  8192 | 57344 |          128 | torch.float8_e4m3fn |            6409.98  |                 6638.3   |            0.965606 |
+| 4096 | 28672 |  8192 |          128 | torch.float8_e4m3fn |            3173.76  |                 3247.23  |            0.977374 |
+| 4096 |  8192 |  8192 |          128 | torch.float8_e5m2   |             898.432 |                  949.36  |            0.946355 |
+| 4096 |  8192 | 10240 |          128 | torch.float8_e5m2   |            1170.62  |                 1188.45  |            0.985002 |
+| 4096 |  8192 | 57344 |          128 | torch.float8_e5m2   |            6751.25  |                 6573.71  |            1.02701  |
+| 4096 | 28672 |  8192 |          128 | torch.float8_e5m2   |            3155.9   |                 3179.38  |            0.992617 |
+| 8192 |  8192 |  8192 |          128 | torch.float8_e4m3fn |            1868.64  |                 2022.27  |            0.92403  |
+| 8192 |  8192 | 10240 |          128 | torch.float8_e4m3fn |            2336.26  |                 2621.18  |            0.891298 |
+| 8192 |  8192 | 57344 |          128 | torch.float8_e4m3fn |           13004     |                13990.6   |            0.929482 |
+| 8192 | 28672 |  8192 |          128 | torch.float8_e4m3fn |            6781.49  |                 6722.82  |            1.00873  |
+| 8192 |  8192 |  8192 |          128 | torch.float8_e5m2   |            1865.25  |                 1983.23  |            0.940509 |
+| 8192 |  8192 | 10240 |          128 | torch.float8_e5m2   |            2296.66  |                 2523.1   |            0.91025  |
+| 8192 |  8192 | 57344 |          128 | torch.float8_e5m2   |           13170.9   |                14029.6   |            0.938792 |
+| 8192 | 28672 |  8192 |          128 | torch.float8_e5m2   |            6688.51  |                 6699.65  |            0.998338 |
+

From 9902d84eb255aed282ba94255baf233e1ef95ac6 Mon Sep 17 00:00:00 2001
From: Peter Yeh <petrex@users.noreply.github.com>
Date: Mon, 12 May 2025 18:23:14 -0700
Subject: [PATCH 023/165] Skips for ROCm (X86 Inductor Tests) (#2202)

* Refactor ROCm skip decorators in quantization tests

Updated the skip decorators for ROCm in the quantization test suite to use the new `skip_if_rocm` utility, providing more descriptive messages for each test case. This change enhances clarity regarding ROCm support status in the tests.

* Reorganize ROCm skip decorator import in quantization tests

Moved the import statement for `skip_if_rocm` to maintain consistency in the test file structure. This change ensures that the utility is properly utilized in the context of the x86 Inductor quantization tests.

* Update ROCm skip decorator message in quantization test

Changed the message for the `skip_if_rocm` decorator in the `test_qat_qconv2d` test case to clarify that ROCm support is not applicable, enhancing the clarity of the test's intent.
---
 test/quantization/pt2e/test_x86inductor_fusion.py | 14 +++++++-------
 1 file changed, 7 insertions(+), 7 deletions(-)

diff --git a/test/quantization/pt2e/test_x86inductor_fusion.py b/test/quantization/pt2e/test_x86inductor_fusion.py
index 78204fb756..fdf217366d 100644
--- a/test/quantization/pt2e/test_x86inductor_fusion.py
+++ b/test/quantization/pt2e/test_x86inductor_fusion.py
@@ -28,7 +28,6 @@
     IS_X86,
     instantiate_parametrized_tests,
     parametrize,
-    skipIfRocm,
 )
 from torch.testing._internal.inductor_utils import (
     HAS_CPU,
@@ -45,6 +44,7 @@
 from torchao.quantization.pt2e.quantizer.x86_inductor_quantizer import (
     X86InductorQuantizer,
 )
+from torchao.testing.utils import skip_if_rocm
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_6,
     TORCH_VERSION_AT_LEAST_2_8,
@@ -328,7 +328,7 @@ def matcher_check_fn():
 
     @skipIfNoDynamoSupport
     @skipIfNoONEDNN
-    @skipIfRocm
+    @skip_if_rocm("Not applicable to ROCm")
     def test_qconv2d_cpu(self):
         r"""
         This testcase will quantize a single Conv2d module.
@@ -338,7 +338,7 @@ def test_qconv2d_cpu(self):
     @skipIfNoDynamoSupport
     @skipIfNoONEDNNBF16
     @skipIfNoONEDNN
-    @skipIfRocm
+    @skip_if_rocm("Not applicable to ROCm")
     def test_qconv2d_int8_mixed_bf16(self):
         r"""
         This testcase will quantize a single Conv2d module with int8_mixed_bf16 quantization.
@@ -932,7 +932,7 @@ def matcher_check_fn():
 
     @skipIfNoDynamoSupport
     @skipIfNoONEDNN
-    @skipIfRocm
+    @skip_if_rocm("Not applicable to ROCm")
     def test_qat_qconv2d(self):
         r"""
         This testcase will quantize a single Conv2d module with qat flow.
@@ -1075,7 +1075,7 @@ def test_qat_qconv2d_hardswish(self):
 
     @skipIfNoDynamoSupport
     @skipIfNoONEDNN
-    @skipIfRocm
+    @skip_if_rocm("Not applicable to ROCm")
     def test_qat_qconv2d_add(self):
         r"""
         This testcase will quantize a Conv2d->Add pattern as:
@@ -1141,7 +1141,7 @@ def matcher_check_fn():
 
     @skipIfNoDynamoSupport
     @skipIfNoONEDNN
-    @skipIfRocm
+    @skip_if_rocm("Not applicable to ROCm")
     def test_qat_qconv2d_add_relu(self):
         r"""
         This testcase will quantize a Conv2d->Add->ReLU pattern as:
@@ -1281,7 +1281,7 @@ def matcher_check_fn():
 
     @skipIfNoDynamoSupport
     @skipIfNoONEDNN
-    @skipIfRocm
+    @skip_if_rocm("Not applicable to ROCm")
     def test_qconv2d_dequant_promotion_cpu(self):
         self._test_qconv2d_dequant_promotion_helper()
 

From c2d2d13959e41cc1de01d1f9d056cf21eb46c336 Mon Sep 17 00:00:00 2001
From: Jesse Cai <jessecai@meta.com>
Date: Tue, 13 May 2025 00:43:34 -0400
Subject: [PATCH 024/165] Remove `sparsity/prototype/blocksparse` (#2205)

Remove sparsity/prototype/blocksparse

Summary:

att, we should use torchao.prototype.sparsity.blocksparse instead.

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:
---
 .../sparsity/prototype/superblock/__init__.py |  0
 .../prototype/superblock/blocksparse.py       |  8 ------
 .../prototype/superblock/supermask.py         | 12 ---------
 .../sparsity/prototype/superblock/utils.py    | 26 -------------------
 4 files changed, 46 deletions(-)
 delete mode 100644 torchao/sparsity/prototype/superblock/__init__.py
 delete mode 100644 torchao/sparsity/prototype/superblock/blocksparse.py
 delete mode 100644 torchao/sparsity/prototype/superblock/supermask.py
 delete mode 100644 torchao/sparsity/prototype/superblock/utils.py

diff --git a/torchao/sparsity/prototype/superblock/__init__.py b/torchao/sparsity/prototype/superblock/__init__.py
deleted file mode 100644
index e69de29bb2..0000000000
diff --git a/torchao/sparsity/prototype/superblock/blocksparse.py b/torchao/sparsity/prototype/superblock/blocksparse.py
deleted file mode 100644
index 845be888fc..0000000000
--- a/torchao/sparsity/prototype/superblock/blocksparse.py
+++ /dev/null
@@ -1,8 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from torchao.prototype.sparsity.superblock.blocksparse import BlockSparseTensor
-
-__all__ = ["BlockSparseTensor"]
diff --git a/torchao/sparsity/prototype/superblock/supermask.py b/torchao/sparsity/prototype/superblock/supermask.py
deleted file mode 100644
index 1066271013..0000000000
--- a/torchao/sparsity/prototype/superblock/supermask.py
+++ /dev/null
@@ -1,12 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from torchao.sparsity.supermask import (
-    SupermaskLinear,
-)
-
-__all__ = [
-    "SupermaskLinear",
-]
diff --git a/torchao/sparsity/prototype/superblock/utils.py b/torchao/sparsity/prototype/superblock/utils.py
deleted file mode 100644
index e0ef628ebc..0000000000
--- a/torchao/sparsity/prototype/superblock/utils.py
+++ /dev/null
@@ -1,26 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from torchao.prototype.sparsity.superblock.utils import (
-    ClassificationPresetEval,
-    ClassificationPresetTrain,
-    ExponentialMovingAverage,
-    MetricLogger,
-    RandomCutmix,
-    RandomMixup,
-    RASampler,
-    SmoothedValue,
-)
-
-__all__ = [
-    "ClassificationPresetEval",
-    "ClassificationPresetTrain",
-    "ExponentialMovingAverage",
-    "MetricLogger",
-    "RandomCutmix",
-    "RandomMixup",
-    "RASampler",
-    "SmoothedValue",
-]

From a0a0969922000b2c0fc39fbbfd4ec69ee630eeb7 Mon Sep 17 00:00:00 2001
From: Daniel Vega-Myhre <danvm@meta.com>
Date: Tue, 13 May 2025 08:56:54 -0700
Subject: [PATCH 025/165] [float] document e2e training -> inference flow
 (#2190)

* document e2e training -> inference flow

* add save/load checkpoint

* update to how we load checkpoint

* remove debugging

* add more detail

* remove unused import

* lower lr to prevent large optimizer step into weight territory which produces inf

* use actual loss function
---
 torchao/float8/README.md | 92 ++++++++++++++++++++++++++++++++++++++++
 1 file changed, 92 insertions(+)

diff --git a/torchao/float8/README.md b/torchao/float8/README.md
index 7456d724f4..65da67c524 100644
--- a/torchao/float8/README.md
+++ b/torchao/float8/README.md
@@ -230,3 +230,95 @@ including [downloading a tokenizer](https://github.com/pytorch/torchtitan?tab=re
    - float8 rowwise with bf16 all-gather + compile: `TORCHTITAN_ROOT=<path> FLOAT8_RECIPE_WITH_BEST_SETTINGS="rowwise" ./float8_training_benchmark.sh`
 
 See the float8 training benchmarking [guide](.torchao/float8/benchmarking/README.md) for more details.
+
+# E2E training + inference flow
+
+The first step in the E2E is to train your model and save a checkpoint. The second step is to load the checkpoint and optionally apply inference quantization before serving the model.
+#### 1. Train model and save checkpoint
+```python
+import torch
+from torch import nn
+import torch.nn.functional as F
+
+from torchao.float8.float8_linear_utils import convert_to_float8_training
+from torchao.float8.float8_linear import Float8Linear
+from torchao.float8 import convert_to_float8_training
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_5
+
+if not TORCH_VERSION_AT_LEAST_2_5:
+    raise AssertionError("torchao.float8 requires PyTorch version 2.5 or greater")
+
+# create model and sample input
+m = nn.Sequential(
+    nn.Linear(2048, 4096),
+    nn.Linear(4096, 128),
+    nn.Linear(128, 1),
+).bfloat16().cuda()
+x = torch.randn(4096, 2048, device="cuda", dtype=torch.bfloat16)
+optimizer = torch.optim.AdamW(m.parameters(), lr=1e-3)
+
+# optional: filter modules from being eligible for float8 conversion
+def module_filter_fn(mod: torch.nn.Module, fqn: str):
+    # don't convert the last module
+    if fqn == "1":
+        return False
+    # don't convert linear modules with weight dimensions not divisible by 16
+    if isinstance(mod, torch.nn.Linear):
+        if mod.in_features % 16 != 0 or mod.out_features % 16 != 0:
+            return False
+    return True
+
+# convert specified `torch.nn.Linear` modules to `Float8Linear`
+convert_to_float8_training(m, module_filter_fn=module_filter_fn)
+
+# enable torch.compile for competitive performance
+m = torch.compile(m)
+
+# toy training loop
+for _ in range(10):
+    optimizer.zero_grad()
+    output = m(x)
+    # use fake labels for demonstration purposes
+    fake_labels = torch.ones_like(output)
+    loss = F.mse_loss(output, fake_labels)
+    loss.backward()
+    optimizer.step()
+
+# save the model
+torch.save({
+    'model': m,
+    'model_state_dict': m.state_dict(),
+    'optimizer_state_dict': optimizer.state_dict(),
+}, 'checkpoint.pth')
+```
+
+#### 2. Load checkpoint and optionally apply inference quantization
+
+There are 3 float8 inference quantization strategies that be used after training with float8: 1) weight only quantization, and 2) dynamic activation and weight quantization, and 3) static quantization.
+
+Below is an example of dynamic activation and weight quantization. For more details, examples, and inference benchmrks, see the [torchao inference docs](https://github.com/pytorch/ao/blob/main/torchao/quantization/README.md).
+
+```python
+import torch
+
+from torchao.float8.float8_linear import Float8Linear
+from torchao.quantization.granularity import PerTensor
+from torchao.quantization.quant_api import quantize_
+from torchao.quantization import (
+    Float8DynamicActivationFloat8WeightConfig,
+)
+
+# load checkpoint
+checkpoint = torch.load('checkpoint.pth', weights_only=False)
+model = checkpoint['model']
+model.load_state_dict(checkpoint['model_state_dict'])
+
+# optional: apply dynamic float8 quantization on both activations and weights for inference
+quantize_(model, Float8DynamicActivationFloat8WeightConfig(granularity=PerTensor()))
+
+# run inference
+x = torch.randn(1, 4096, 2048, device="cuda", dtype=torch.bfloat16)
+with torch.inference_mode():
+    out = model(x)
+    print(out)
+```

From ec155542a344a7b0b81f3e4d2d40cc56dec74116 Mon Sep 17 00:00:00 2001
From: choudhary-devang <Devang.LNU@fujitsu.com>
Date: Tue, 13 May 2025 23:58:37 +0530
Subject: [PATCH 026/165] Arm_inductor_quantizer for Pt2e quantization  (#2139)

* Enabled pt2e quant flow for Arm

* Fixed ruff CI failure

ruff- I001 standard intrgrated.

* fixing file name:
rename test_arminductor_quantizer.py  -->  test_arm_inductor_quantizer.py
applied ruff format
---
 .../pt2e/test_arm_inductor_quantizer.py       | 1505 +++++++++++++++++
 .../pt2e/quantizer/arm_inductor_quantizer.py  |  396 +++++
 2 files changed, 1901 insertions(+)
 create mode 100644 test/quantization/pt2e/test_arm_inductor_quantizer.py
 create mode 100644 torchao/quantization/pt2e/quantizer/arm_inductor_quantizer.py

diff --git a/test/quantization/pt2e/test_arm_inductor_quantizer.py b/test/quantization/pt2e/test_arm_inductor_quantizer.py
new file mode 100644
index 0000000000..750e88d451
--- /dev/null
+++ b/test/quantization/pt2e/test_arm_inductor_quantizer.py
@@ -0,0 +1,1505 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+# Owner(s): ["oncall: quantization"]
+import copy
+import itertools
+import unittest
+from enum import Enum
+
+import torch
+import torch.nn as nn
+
+import torchao.quantization.pt2e.quantizer.arm_inductor_quantizer as armiq
+from torchao.quantization.pt2e import ObserverBase
+from torchao.quantization.pt2e.quantize_pt2e import (
+    convert_pt2e,
+    prepare_pt2e,
+    prepare_qat_pt2e,
+)
+from torchao.quantization.pt2e.quantizer.arm_inductor_quantizer import (
+    ArmInductorQuantizer,
+)
+from torchao.quantization.pt2e.quantizer.x86_inductor_quantizer import (
+    QUANT_ANNOTATION_KEY,
+)
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_5, TORCH_VERSION_AT_LEAST_2_7
+
+if TORCH_VERSION_AT_LEAST_2_5:
+    from torch.export import export_for_training
+
+import functools
+import platform
+
+from torch.testing._internal.common_quantization import (
+    NodeSpec as ns,
+)
+from torch.testing._internal.common_quantization import (
+    QuantizationTestCase,
+    skipIfNoInductorSupport,
+)
+from torch.testing._internal.common_utils import run_tests, skipIfTorchDynamo
+
+
+def skipIfNoArm(fn):
+    reason = "Quantized operations require Arm."
+    if isinstance(fn, type):
+        if platform.processor() != "aarch64":
+            fn.__unittest_skip__ = True
+            fn.__unittest_skip_why__ = reason
+        return fn
+
+    @functools.wraps(fn)
+    def wrapper(*args, **kwargs):
+        if platform.processor() != "aarch64":
+            raise unittest.SkipTest(reason)
+        else:
+            fn(*args, **kwargs)
+
+    return wrapper
+
+
+class NodePosType(Enum):
+    left = 1
+    right = 2
+    both = 3
+
+
+class TestHelperModules:
+    class SingleConv2dModule(torch.nn.Module):
+        def __init__(self, with_bn=False) -> None:
+            super().__init__()
+            self.conv = nn.Conv2d(3, 6, (2, 2), stride=(1, 1), padding=(1, 1))
+            self.bn = torch.nn.BatchNorm2d(6)
+            self.with_bn = with_bn
+
+        def forward(self, x):
+            x = self.conv(x)
+            if self.with_bn:
+                x = self.bn(x)
+            return x
+
+    class Conv2dAddModule(torch.nn.Module):
+        def __init__(
+            self,
+            inplace_add: bool = False,
+            conv2d_type: NodePosType = NodePosType.left,
+            use_bias: bool = False,
+            with_bn: bool = False,
+        ) -> None:
+            super().__init__()
+            self.conv = torch.nn.Conv2d(
+                in_channels=3,
+                out_channels=3,
+                kernel_size=3,
+                stride=1,
+                padding=1,
+                bias=use_bias,
+            )
+            self.conv2 = torch.nn.Conv2d(
+                in_channels=3,
+                out_channels=3,
+                kernel_size=3,
+                stride=1,
+                padding=1,
+                bias=use_bias,
+            )
+            self.relu = nn.ReLU()
+            self.inplace_add = inplace_add
+            self.conv2d_type = conv2d_type
+            self.bn = torch.nn.BatchNorm2d(3)
+            self.with_bn = with_bn
+
+        def forward(self, x):
+            if self.conv2d_type == NodePosType.left:
+                if self.inplace_add:
+                    tmp = self.conv(x)
+                    if self.with_bn:
+                        tmp = self.bn(tmp)
+                    tmp += self.relu(x)
+                    return tmp
+                else:
+                    tmp = self.conv(x)
+                    if self.with_bn:
+                        tmp = self.bn(tmp)
+                    return tmp + self.relu(x)
+            elif self.conv2d_type == NodePosType.right:
+                if self.inplace_add:
+                    tmp = self.relu(x)
+                    tmp += self.conv(x)
+                    return tmp
+                else:
+                    return self.relu(x) + self.conv(x)
+            elif self.conv2d_type == NodePosType.both:
+                if self.inplace_add:
+                    tmp = self.conv(x)
+                    tmp += self.conv2(x)
+                    return tmp
+                else:
+                    return self.conv(x) + self.conv2(x)
+
+    class Conv2dSingleOpPowModule(nn.Module):
+        def __init__(self, single_op):
+            super().__init__()
+            self.conv = nn.Conv2d(2, 2, 1)
+            self.single_op = single_op
+
+        def forward(self, x):
+            x = self.conv(x)
+            x = self.single_op(x)
+            return torch.pow(x, 2)
+
+    class SingleLinearModule(torch.nn.Module):
+        def __init__(self, use_bias) -> None:
+            super().__init__()
+            self.linear = nn.Linear(4, 4, bias=use_bias)
+
+        def forward(self, x):
+            return self.linear(x)
+
+    class LinearUnaryModule(torch.nn.Module):
+        def __init__(
+            self, use_bias, postop, inplace_postop=False, post_op_algo="none"
+        ) -> None:
+            super().__init__()
+            self.linear = nn.Linear(4, 4, bias=use_bias)
+            if postop == nn.GELU:
+                self.postop = postop(approximate=post_op_algo)
+            else:
+                self.postop = postop(inplace=inplace_postop)
+
+        def forward(self, x):
+            return self.postop(self.linear(x))
+
+    class LinearAddModule(torch.nn.Module):
+        def __init__(
+            self,
+            inplace_add: bool = False,
+            linear_pos: NodePosType = NodePosType.left,
+            use_bias: bool = False,
+        ) -> None:
+            super().__init__()
+            self.linear = torch.nn.Linear(
+                in_features=16, out_features=16, bias=use_bias
+            )
+            self.linear2 = torch.nn.Linear(
+                in_features=16, out_features=16, bias=use_bias
+            )
+            self.relu = nn.ReLU()
+            self.inplace_add = inplace_add
+            self.linear_pos = linear_pos
+
+        def forward(self, x):
+            if self.linear_pos == NodePosType.left:
+                if self.inplace_add:
+                    tmp = self.linear(x)
+                    tmp += self.relu(x)
+                    return tmp
+                else:
+                    tmp = self.linear(x)
+                    return tmp + self.relu(x)
+            elif self.linear_pos == NodePosType.right:
+                if self.inplace_add:
+                    tmp = self.relu(x)
+                    tmp += self.linear(x)
+                    return tmp
+                else:
+                    return self.relu(x) + self.linear(x)
+            elif self.linear_pos == NodePosType.both:
+                if self.inplace_add:
+                    tmp = self.linear(x)
+                    tmp += self.linear2(x)
+                    return tmp
+                else:
+                    return self.linear(x) + self.linear2(x)
+
+    class LinearAddModule2(torch.nn.Module):
+        def __init__(
+            self,
+            inplace_add: bool = False,
+        ) -> None:
+            super().__init__()
+            self.linear = torch.nn.Linear(in_features=16, out_features=16, bias=True)
+            self.linear2 = torch.nn.Linear(in_features=16, out_features=16, bias=True)
+            self.inplace_add = inplace_add
+
+        def forward(self, x):
+            if self.inplace_add:
+                tmp = self.linear(x)
+                tmp += self.linear2(tmp)
+                return tmp
+            else:
+                tmp = self.linear(x)
+                return tmp + self.linear2(tmp)
+
+    class Conv2dAddModule2(torch.nn.Module):
+        def __init__(
+            self,
+            inplace_add: bool = False,
+        ) -> None:
+            super().__init__()
+            self.conv = torch.nn.Conv2d(
+                in_channels=3, out_channels=3, kernel_size=3, stride=1, padding=1
+            )
+            self.conv2 = torch.nn.Conv2d(
+                in_channels=3, out_channels=3, kernel_size=3, stride=1, padding=1
+            )
+            self.inplace_add = inplace_add
+            self.bn = torch.nn.BatchNorm2d(3)
+            self.bn2 = torch.nn.BatchNorm2d(3)
+
+        def forward(self, x):
+            if self.inplace_add:
+                tmp = self.bn(self.conv(x))
+                tmp += self.bn2(self.conv2(tmp))
+                return tmp
+            else:
+                tmp = self.bn(self.conv(x))
+                return tmp + self.bn2(self.conv2(tmp))
+
+    class SelfAttnLikeModule(torch.nn.Module):
+        def __init__(
+            self,
+            input_dim,
+            transpose_for_score=False,
+            num_attention_heads=None,
+            attention_head_size=None,
+        ) -> None:
+            super().__init__()
+            self.input_dim = input_dim
+            self.q_proj = nn.Linear(input_dim, input_dim, bias=False)
+            self.k_proj = nn.Linear(input_dim, input_dim, bias=False)
+            self.v_proj = nn.Linear(input_dim, input_dim, bias=False)
+            self.softmax = nn.Softmax(dim=-1)
+            self.transpose_for_score = transpose_for_score
+            if self.transpose_for_score:
+                assert num_attention_heads is not None
+                assert attention_head_size is not None
+                self.num_attention_heads = num_attention_heads
+                self.attention_head_size = attention_head_size
+
+        def transpose_for_scores(self, x: torch.Tensor) -> torch.Tensor:
+            new_x_shape = x.size()[:-1] + (
+                self.num_attention_heads,
+                self.attention_head_size,
+            )
+            x = x.view(new_x_shape)
+            return x.permute(0, 2, 1, 3)
+
+        def forward(self, x):
+            q = self.q_proj(x)
+            k = self.k_proj(x)
+            v = self.v_proj(x)
+            if self.transpose_for_score:
+                q = self.transpose_for_scores(q)
+                k = self.transpose_for_scores(k)
+                v = self.transpose_for_scores(v)
+            scores = torch.matmul(q, k.transpose(-1, -2)) / (self.input_dim**0.5)
+            attention = self.softmax(scores)
+            weighted = torch.matmul(attention, v)
+            return weighted
+
+
+class ArmInductorQuantTestCase(QuantizationTestCase):
+    def _test_quantizer(
+        self,
+        model,
+        example_inputs,
+        quantizer,
+        expected_node_occurrence,
+        expected_node_list=None,
+        is_qat=False,
+        debug=False,
+        lower=False,
+    ):
+        m_eager = model.train() if is_qat else model.eval()
+
+        # program capture
+        m = copy.deepcopy(m_eager)
+        m = export_for_training(
+            m,
+            example_inputs,
+        ).module()
+
+        # QAT Model failed to deepcopy
+        export_model = m if is_qat else copy.deepcopy(m)
+        m = prepare_qat_pt2e(m, quantizer) if is_qat else prepare_pt2e(m, quantizer)
+        # Calibrate
+        m(*example_inputs)
+        prepare_model = copy.deepcopy(m)
+        m = convert_pt2e(m)
+        convert_model = copy.deepcopy(m)
+        if debug:
+            convert_model.print_readable(True)
+        if lower:
+            from torch._inductor.constant_folding import constant_fold
+            from torch._inductor.fx_passes.freezing_patterns import freezing_passes
+
+            m.recompile()
+            freezing_passes(m, example_inputs)
+            constant_fold(m)
+            m(*example_inputs)
+        node_occurrence = {
+            ns.call_function(k): v for k, v in expected_node_occurrence.items()
+        }
+        if expected_node_list is None:
+            expected_node_list = []
+        node_list = [ns.call_function(n) for n in expected_node_list]
+        self.checkGraphModuleNodes(
+            m, expected_node_occurrence=node_occurrence, expected_node_list=node_list
+        )
+
+        return export_model, prepare_model, convert_model
+
+
+@skipIfNoInductorSupport
+@unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_7, "Requires torch 2.7+")
+class TestQuantizePT2EArmInductor(ArmInductorQuantTestCase):
+    @skipIfNoArm
+    def test_conv2d(self):
+        """
+        Test pattern of single conv2d with ArmInductorQuantizer.
+        """
+        with torch.no_grad():
+            m = TestHelperModules.SingleConv2dModule().eval()
+            example_inputs = (torch.randn(2, 3, 16, 16),)
+            quantizer = ArmInductorQuantizer().set_global(
+                armiq.get_default_arm_inductor_quantization_config()
+            )
+            node_occurrence = {
+                # one for input and weight of the conv
+                torch.ops.quantized_decomposed.quantize_per_tensor.default: 1,
+                torch.ops.quantized_decomposed.dequantize_per_tensor.default: 2,
+                # note: quantize op for weights are const propagated
+                torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+                torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+            }
+            node_list = [
+                torch.ops.quantized_decomposed.quantize_per_tensor.default,
+                torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+                torch.ops.aten.conv2d.default,
+            ]
+            self._test_quantizer(
+                m,
+                example_inputs,
+                quantizer,
+                node_occurrence,
+                node_list,
+            )
+
+    @skipIfNoArm
+    def test_conv2d_binary(self):
+        """
+        Test pattern of conv2d with binary post ops (such as add) with ArmInductorQuantizer.
+        Currently, only add as binary post op is supported.
+        """
+        conv2d_type_list = [NodePosType.left, NodePosType.both]
+        example_inputs = (torch.randn(2, 3, 6, 6),)
+        quantizer = ArmInductorQuantizer().set_global(
+            armiq.get_default_arm_inductor_quantization_config()
+        )
+        with torch.no_grad():
+            for conv2d_type in conv2d_type_list:
+                m = TestHelperModules.Conv2dAddModule(conv2d_type=conv2d_type).eval()
+                if conv2d_type != NodePosType.both:
+                    node_occurrence = {
+                        # one for input and weight of the conv
+                        # one for extra input node of add
+                        torch.ops.quantized_decomposed.quantize_per_tensor.default: 2,
+                        torch.ops.quantized_decomposed.dequantize_per_tensor.default: 3,
+                        # quantize_per_channel for weights are const propagated
+                        torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+                        torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+                    }
+                else:
+                    node_occurrence = {
+                        # one for input of the conv
+                        # one for input of another conv
+                        # 2 conv will share same input quant/dequant
+                        # one for extra input node of add
+                        torch.ops.quantized_decomposed.quantize_per_tensor.default: 2,
+                        torch.ops.quantized_decomposed.dequantize_per_tensor.default: 5,
+                        # quantize_per_channel for weights are const propagated
+                        torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+                        torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+                    }
+                node_list = [
+                    torch.ops.quantized_decomposed.quantize_per_tensor.default,
+                    torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+                    torch.ops.aten.conv2d.default,
+                    torch.ops.aten.add.Tensor,
+                ]
+                self._test_quantizer(
+                    m,
+                    example_inputs,
+                    quantizer,
+                    node_occurrence,
+                    node_list,
+                )
+
+    @skipIfNoArm
+    def test_conv2d_binary2(self):
+        """
+        Test Pattern:
+            tmp = conv2d_1(x)
+            tmp2 = conv2d_2(tmp)
+            return tmp + tmp2
+        Since conv2d_1 has 2 users, we should annotate conv2d_2 for binary fusion instead of conv2d_1
+        """
+        example_inputs = (torch.randn(2, 3, 6, 6),)
+        quantizer = ArmInductorQuantizer().set_global(
+            armiq.get_default_arm_inductor_quantization_config()
+        )
+        inplace_add_list = [True, False]
+        with torch.no_grad():
+            for inplace_add in inplace_add_list:
+                m = TestHelperModules.Conv2dAddModule2(inplace_add=inplace_add).eval()
+                node_occurrence = {
+                    torch.ops.quantized_decomposed.quantize_per_tensor.default: 2,
+                    torch.ops.quantized_decomposed.dequantize_per_tensor.default: 5,
+                    # quantize_per_channel for weights are const propagated
+                    torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+                    torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+                }
+                node_list = [
+                    torch.ops.quantized_decomposed.quantize_per_tensor.default,
+                    torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+                    torch.ops.aten.conv2d.default,
+                    torch.ops.quantized_decomposed.quantize_per_tensor.default,
+                    (
+                        torch.ops.aten.add_.Tensor
+                        if inplace_add
+                        else torch.ops.aten.add.Tensor
+                    ),
+                ]
+                self._test_quantizer(
+                    m,
+                    example_inputs,
+                    quantizer,
+                    node_occurrence,
+                    node_list,
+                )
+
+    def _single_op_share_observer_recipe_test_helper(self, m, x, single_op):
+        quantizer = ArmInductorQuantizer().set_global(
+            armiq.get_default_arm_inductor_quantization_config()
+        )
+        example_inputs = (x,)
+        node_occurrence = {
+            # one for input and weight of the conv, two for input/output for the maxpool2d
+            torch.ops.quantized_decomposed.quantize_per_tensor.default: 3,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default: 3,
+            # quantize_per_channel for weights are const propagated
+            torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+            torch.ops.quantized_decomposed.dequantize_per_channel.default: 1,
+        }
+        node_list = [
+            torch.ops.quantized_decomposed.quantize_per_tensor.default,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            torch.ops.aten.conv2d.default,
+            torch.ops.quantized_decomposed.quantize_per_tensor.default,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            single_op,
+            torch.ops.quantized_decomposed.quantize_per_tensor.default,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+        ]
+        _, prepare_model, _ = self._test_quantizer(
+            m,
+            example_inputs,
+            quantizer,
+            node_occurrence,
+            node_list,
+        )
+        for node in prepare_model.graph.nodes:
+            if node.op == "call_function" and node.target is single_op:
+                single_op_node = node
+                input_obs_of_single_op = getattr(
+                    prepare_model, single_op_node.args[0].target
+                )
+                output_obs_of_single_op = getattr(
+                    prepare_model, next(iter(single_op_node.users)).target
+                )
+            elif (
+                node.op == "call_function"
+                and node.target is torch.ops.aten.conv2d.default
+            ):
+                conv_node = node
+                input_obs_of_conv = getattr(prepare_model, conv_node.args[0].target)
+        self.assertTrue(isinstance(input_obs_of_single_op, ObserverBase))
+        self.assertTrue(isinstance(output_obs_of_single_op, ObserverBase))
+        self.assertTrue(isinstance(input_obs_of_conv, ObserverBase))
+        self.assertTrue(input_obs_of_single_op is output_obs_of_single_op)
+        self.assertTrue(input_obs_of_single_op is not input_obs_of_conv)
+
+    @skipIfNoArm
+    def test_linear(self):
+        """
+        Test pattern of single linear with ArmInductorQuantizer.
+        """
+        with torch.no_grad():
+            for use_bias in [True, False]:
+                m = TestHelperModules.SingleLinearModule(use_bias).eval()
+                example_inputs = (torch.randn(2, 4),)
+                quantizer = ArmInductorQuantizer().set_global(
+                    armiq.get_default_arm_inductor_quantization_config()
+                )
+                node_occurrence = {
+                    # one for input and weight, one for output
+                    torch.ops.quantized_decomposed.quantize_per_tensor.default: 1,
+                    torch.ops.quantized_decomposed.dequantize_per_tensor.default: 2,
+                    # quantize_per_channel for weights are const propagated
+                    torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+                    torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+                }
+                node_list = [
+                    torch.ops.quantized_decomposed.quantize_per_tensor.default,
+                    torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+                    torch.ops.aten.linear.default,
+                ]
+                self._test_quantizer(
+                    m,
+                    example_inputs,
+                    quantizer,
+                    node_occurrence,
+                    node_list,
+                )
+
+    def _test_linear_unary_helper(
+        self,
+        post_op_module,
+        post_op_aten,
+        post_op_aten_inplace,
+        post_op_algo_list=None,
+        is_qat=False,
+        is_dynamic=False,
+    ):
+        """
+        Test pattern of linear with unary post ops (e.g. relu) with ArmInductorQuantizer.
+        """
+        use_bias_list = [True, False]
+        # TODO test for inplace add after refactoring of export_for_training
+        inplace_list = [False]
+        if post_op_algo_list is None:
+            post_op_algo_list = [None]
+        cases = itertools.product(use_bias_list, inplace_list, post_op_algo_list)
+        with torch.no_grad():
+            for use_bias, inplace, post_op_algo in cases:
+                if inplace and post_op_aten_inplace is None:
+                    continue
+                m = TestHelperModules.LinearUnaryModule(
+                    use_bias=use_bias,
+                    postop=post_op_module,
+                    inplace_postop=inplace,
+                    post_op_algo=post_op_algo,
+                ).eval()
+                example_inputs = (torch.randn(2, 4),)
+                quantizer = ArmInductorQuantizer().set_global(
+                    armiq.get_default_arm_inductor_quantization_config(
+                        is_qat=is_qat,
+                        is_dynamic=is_dynamic,
+                    )
+                )
+                quantize_per_tensor_op = (
+                    torch.ops.quantized_decomposed.quantize_per_tensor.tensor
+                    if is_dynamic
+                    else torch.ops.quantized_decomposed.quantize_per_tensor.default
+                )
+                dequantize_per_tensor_op = (
+                    torch.ops.quantized_decomposed.dequantize_per_tensor.tensor
+                    if is_dynamic
+                    else torch.ops.quantized_decomposed.dequantize_per_tensor.default
+                )
+                node_occurrence = {
+                    # one for input of the linear
+                    quantize_per_tensor_op: 1,
+                    dequantize_per_tensor_op: 1 if is_dynamic else 2,
+                    # quantize_per_channel for weights are const propagated
+                    torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+                    torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+                }
+                node_list = [
+                    quantize_per_tensor_op,
+                    dequantize_per_tensor_op,
+                    torch.ops.aten.linear.default,
+                    post_op_aten_inplace if inplace else post_op_aten,
+                ]
+                self._test_quantizer(
+                    m,
+                    example_inputs,
+                    quantizer,
+                    node_occurrence,
+                    node_list,
+                    is_qat=is_qat,
+                )
+
+    @skipIfNoArm
+    def test_linear_unary(self):
+        aten = torch.ops.aten
+        self._test_linear_unary_helper(nn.ReLU, aten.relu.default, aten.relu_.default)
+        self._test_linear_unary_helper(
+            nn.LeakyReLU, aten.leaky_relu.default, aten.leaky_relu_.default
+        )
+        self._test_linear_unary_helper(
+            nn.GELU, aten.gelu.default, None, ["none", "tanh"]
+        )
+
+    @skipIfNoArm
+    def test_linear_unary_qat(self):
+        aten = torch.ops.aten
+        self._test_linear_unary_helper(
+            nn.ReLU, aten.relu.default, aten.relu_.default, is_qat=True
+        )
+        self._test_linear_unary_helper(
+            nn.LeakyReLU, aten.leaky_relu.default, aten.leaky_relu_.default, is_qat=True
+        )
+        self._test_linear_unary_helper(
+            nn.GELU, aten.gelu.default, None, ["none", "tanh"], is_qat=True
+        )
+
+    @skipIfNoArm
+    def test_linear_unary_dynamic(self):
+        aten = torch.ops.aten
+        self._test_linear_unary_helper(
+            nn.ReLU, aten.relu.default, aten.relu_.default, is_dynamic=True
+        )
+        self._test_linear_unary_helper(
+            nn.LeakyReLU,
+            aten.leaky_relu.default,
+            aten.leaky_relu_.default,
+            is_dynamic=True,
+        )
+        self._test_linear_unary_helper(
+            nn.GELU, aten.gelu.default, None, ["none", "tanh"], is_dynamic=True
+        )
+
+    @skipIfNoArm
+    def test_linear_unary_dynamic_qat(self):
+        aten = torch.ops.aten
+        self._test_linear_unary_helper(
+            nn.ReLU, aten.relu.default, aten.relu_.default, is_qat=True, is_dynamic=True
+        )
+        self._test_linear_unary_helper(
+            nn.LeakyReLU,
+            aten.leaky_relu.default,
+            aten.leaky_relu_.default,
+            is_qat=True,
+            is_dynamic=True,
+        )
+        self._test_linear_unary_helper(
+            nn.GELU,
+            aten.gelu.default,
+            None,
+            ["none", "tanh"],
+            is_qat=True,
+            is_dynamic=True,
+        )
+
+    def _check_annotation_stat(self, gm, expected_stat_dict):
+        # Check expected annotation statistics to ensure the annotation is correct
+
+        def _check_annotation(node):
+            annot = node.meta.get(QUANT_ANNOTATION_KEY, None)
+            if annot is None:
+                return False, False
+            return annot._annotated, annot._is_output_of_quantized_pattern
+
+        for node in gm.graph.nodes:
+            if node.target in expected_stat_dict.keys():
+                annotated, is_quant_out = _check_annotation(node)
+                expected_stat_dict[node.target]["annotated"] -= annotated
+                expected_stat_dict[node.target]["is_quant_out"] -= is_quant_out
+        for op_stat in expected_stat_dict.values():
+            assert all(v == 0 for v in op_stat.values())
+
+    def _test_linear_binary_helper(self, is_qat=False, is_dynamic=False):
+        """
+        Test pattern of linear with binary post ops (such as add) with ArmInductorQuantizer.
+        Currently, only add as binary post op is supported.
+        """
+        linear_pos_list = [NodePosType.left, NodePosType.right, NodePosType.both]
+        # TODO test for inplace add after refactoring of export_for_training
+        inplace_add_list = [False]
+        example_inputs = (torch.randn(2, 16),)
+        quantizer = ArmInductorQuantizer().set_global(
+            armiq.get_default_arm_inductor_quantization_config(
+                is_qat=is_qat,
+                is_dynamic=is_dynamic,
+            )
+        )
+        quantize_per_tensor_op = (
+            torch.ops.quantized_decomposed.quantize_per_tensor.tensor
+            if is_dynamic
+            else torch.ops.quantized_decomposed.quantize_per_tensor.default
+        )
+        dequantize_per_tensor_op = (
+            torch.ops.quantized_decomposed.dequantize_per_tensor.tensor
+            if is_dynamic
+            else torch.ops.quantized_decomposed.dequantize_per_tensor.default
+        )
+        cases = itertools.product(linear_pos_list, inplace_add_list)
+        with torch.no_grad():
+            for linear_pos, inplace_add in cases:
+                m = TestHelperModules.LinearAddModule(
+                    inplace_add=inplace_add, linear_pos=linear_pos
+                ).eval()
+                if linear_pos != NodePosType.both:
+                    node_occurrence = {
+                        # Only one 1 q-dq for input of the linear
+                        # No q-dq for extra input node of add
+                        quantize_per_tensor_op: 1,
+                        dequantize_per_tensor_op: 1,
+                        # quantize_per_channel for weights are const propagated
+                        torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+                        torch.ops.quantized_decomposed.dequantize_per_channel.default: 1,
+                    }
+                else:
+                    # convert_pt2e disables duplicate dequant for dynamic quant
+                    num_dequant = 1 if is_dynamic else 2
+                    node_occurrence = {
+                        # One quantize_per_tensor for both linear nodes (shared)
+                        # Two dequantize_per_tensor for two linear nodes
+                        # No q-dq for extra input node of add
+                        quantize_per_tensor_op: 1,
+                        dequantize_per_tensor_op: num_dequant,
+                        # quantize_per_channel for weights are const propagated
+                        torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+                        torch.ops.quantized_decomposed.dequantize_per_channel.default: 2,
+                    }
+                node_list = [
+                    quantize_per_tensor_op,
+                    dequantize_per_tensor_op,
+                    torch.ops.aten.linear.default,
+                    (
+                        torch.ops.aten.add_.Tensor
+                        if inplace_add
+                        else torch.ops.aten.add.Tensor
+                    ),
+                ]
+                fq_m = self._test_quantizer(
+                    m,
+                    example_inputs,
+                    quantizer,
+                    node_occurrence,
+                    node_list,
+                    is_qat=is_qat,
+                )[-1]
+                # One linear and add are fused. The other linear is quantized alone if present
+                aten = torch.ops.aten
+                add_op = aten.add_.Tensor if inplace_add else aten.add.Tensor
+                expected_annotation_stat = {
+                    aten.linear.default: {
+                        "annotated": 2 if linear_pos == NodePosType.both else 1,
+                        "is_quant_out": 1 if linear_pos == NodePosType.both else 0,
+                    },
+                    add_op: {"annotated": 1, "is_quant_out": 1},
+                }
+                self._check_annotation_stat(fq_m, expected_annotation_stat)
+
+    @skipIfTorchDynamo("very slow")
+    @skipIfNoArm
+    def test_qat_conv2d(self):
+        """
+        Test QAT pattern of conv2d_bn with ArmInductorQuantizer.
+        """
+        m = TestHelperModules.SingleConv2dModule(with_bn=True)
+        example_inputs = (torch.randn(2, 3, 16, 16),)
+        quantizer = ArmInductorQuantizer().set_global(
+            armiq.get_default_arm_inductor_quantization_config(is_qat=True)
+        )
+        node_occurrence = {
+            # one for input and weight of the conv, one for output for the conv
+            torch.ops.quantized_decomposed.quantize_per_tensor.default: 2,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default: 3,
+            # note: quantize op for weights are const propagated
+            torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+            torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+            # BN should be folded into Conv
+            torch.ops.aten._native_batch_norm_legit.default: 0,
+        }
+        node_list = [
+            torch.ops.quantized_decomposed.quantize_per_tensor.default,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            torch.ops.aten.conv2d.default,
+            torch.ops.quantized_decomposed.quantize_per_tensor.default,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+        ]
+        self._test_quantizer(
+            m,
+            example_inputs,
+            quantizer,
+            node_occurrence,
+            node_list,
+            is_qat=True,
+        )
+
+    @skipIfTorchDynamo("very slow")
+    @skipIfNoArm
+    def test_qat_conv2d_binary(self):
+        """
+        Test qat pattern of conv2d_bn with binary post ops (such as add) with ArmInductorQuantizer.
+        Currently, only add as binary post op is supported.
+        """
+        example_inputs = (torch.randn(2, 3, 6, 6),)
+        quantizer = ArmInductorQuantizer().set_global(
+            armiq.get_default_arm_inductor_quantization_config(is_qat=True)
+        )
+        for inplace_add in [True, False]:
+            m = TestHelperModules.Conv2dAddModule(inplace_add=inplace_add, with_bn=True)
+            node_occurrence = {
+                # one for input and weight of the conv
+                # one for output for the add
+                # one for extra input node of add
+                torch.ops.quantized_decomposed.quantize_per_tensor.default: 3,
+                torch.ops.quantized_decomposed.dequantize_per_tensor.default: 4,
+                # quantize_per_channel for weights are const propagated
+                torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+                torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+                # BN should be folded into Conv
+                torch.ops.aten._native_batch_norm_legit.default: 0,
+            }
+            node_list = [
+                torch.ops.quantized_decomposed.quantize_per_tensor.default,
+                torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+                torch.ops.aten.conv2d.default,
+                (
+                    torch.ops.aten.add_.Tensor
+                    if inplace_add
+                    else torch.ops.aten.add.Tensor
+                ),
+                torch.ops.quantized_decomposed.quantize_per_tensor.default,
+                torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            ]
+            self._test_quantizer(
+                m,
+                example_inputs,
+                quantizer,
+                node_occurrence,
+                node_list,
+                is_qat=True,
+            )
+
+    @skipIfTorchDynamo("very slow")
+    @skipIfNoArm
+    def test_qat_conv2d_binary2(self):
+        """
+        Test qat Pattern:
+            tmp = bn1(conv2d_1(x))
+            tmp2 = bn2(conv2d_2(tmp))
+            return tmp + tmp2
+        Since conv2d_1 has 2 users, we should annotate conv2d_2 for binary fusion instead of conv2d_1
+        """
+        example_inputs = (torch.randn(2, 3, 6, 6),)
+        quantizer = ArmInductorQuantizer().set_global(
+            armiq.get_default_arm_inductor_quantization_config(is_qat=True)
+        )
+        inplace_add_list = [True, False]
+        with torch.no_grad():
+            for inplace_add in inplace_add_list:
+                m = TestHelperModules.Conv2dAddModule2(inplace_add=inplace_add)
+                node_occurrence = {
+                    torch.ops.quantized_decomposed.quantize_per_tensor.default: 3,
+                    torch.ops.quantized_decomposed.dequantize_per_tensor.default: 6,
+                    # quantize_per_channel for weights are const propagated
+                    torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+                    torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+                    # BN should be folded into Conv
+                    torch.ops.aten._native_batch_norm_legit.default: 0,
+                }
+                node_list = [
+                    torch.ops.quantized_decomposed.quantize_per_tensor.default,
+                    torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+                    torch.ops.aten.conv2d.default,
+                    torch.ops.quantized_decomposed.quantize_per_tensor.default,
+                    (
+                        torch.ops.aten.add_.Tensor
+                        if inplace_add
+                        else torch.ops.aten.add.Tensor
+                    ),
+                ]
+                self._test_quantizer(
+                    m,
+                    example_inputs,
+                    quantizer,
+                    node_occurrence,
+                    node_list,
+                    is_qat=True,
+                )
+
+    @skipIfNoArm
+    def test_dynamic_quant_linear(self):
+        """
+        Test pattern of dynamic quantization of linear with ArmInductorQuantizer.
+        """
+        with torch.no_grad():
+            m = TestHelperModules.SelfAttnLikeModule(input_dim=64).eval()
+            example_inputs = (torch.randn(1, 4, 64),)
+            quantizer = ArmInductorQuantizer().set_global(
+                armiq.get_default_arm_inductor_quantization_config(is_dynamic=True)
+            )
+            node_occurrence = {
+                torch.ops.quantized_decomposed.choose_qparams.tensor: 1,
+                torch.ops.quantized_decomposed.quantize_per_tensor.tensor: 1,
+                torch.ops.quantized_decomposed.dequantize_per_tensor.tensor: 1,
+                # quantize_per_channel for weights are const propagated
+                torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+                torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+            }
+            node_list = [
+                torch.ops.quantized_decomposed.choose_qparams.tensor,
+                torch.ops.quantized_decomposed.quantize_per_tensor.tensor,
+                torch.ops.quantized_decomposed.dequantize_per_tensor.tensor,
+                torch.ops.aten.linear.default,
+            ]
+            self._test_quantizer(
+                m,
+                example_inputs,
+                quantizer,
+                node_occurrence,
+                node_list,
+            )
+
+    @skipIfNoArm
+    def test_qat_dynamic_quant_linear(self):
+        """
+        Test pattern of qat dynamic quantization of linear with ArmInductorQuantizer.
+        """
+        with torch.no_grad():
+            m = TestHelperModules.SelfAttnLikeModule(input_dim=64).eval()
+            example_inputs = (torch.randn(1, 4, 64),)
+            quantizer = ArmInductorQuantizer().set_global(
+                armiq.get_default_arm_inductor_quantization_config(
+                    is_qat=True, is_dynamic=True
+                )
+            )
+            node_occurrence = {
+                torch.ops.quantized_decomposed.choose_qparams.tensor: 1,
+                torch.ops.quantized_decomposed.quantize_per_tensor.tensor: 1,
+                torch.ops.quantized_decomposed.dequantize_per_tensor.tensor: 1,
+                # quantize_per_channel for weights are const propagated
+                torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+                torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+            }
+            node_list = [
+                torch.ops.quantized_decomposed.choose_qparams.tensor,
+                torch.ops.quantized_decomposed.quantize_per_tensor.tensor,
+                torch.ops.quantized_decomposed.dequantize_per_tensor.tensor,
+                torch.ops.aten.linear.default,
+            ]
+            self._test_quantizer(
+                m,
+                example_inputs,
+                quantizer,
+                node_occurrence,
+                node_list,
+                is_qat=True,
+            )
+
+    @skipIfNoArm
+    def test_set_module_name_qconfig(self):
+        """Test case for quantizing a specific submodule by configuring `set_module_name_qconfig`.
+        Expect that all linear layers within the submodule `sub` are quantized.
+        """
+
+        class Sub(torch.nn.Module):
+            def __init__(self) -> None:
+                super().__init__()
+                self.linear1 = torch.nn.Linear(5, 10)
+                self.relu1 = torch.nn.ReLU(inplace=False)
+                self.linear2 = torch.nn.Linear(10, 5)
+
+            def forward(self, x):
+                x = self.linear1(x)
+                x = self.relu1(x)
+                x = self.linear2(x)
+                return x
+
+        class M(torch.nn.Module):
+            def __init__(self) -> None:
+                super().__init__()
+                self.linear = torch.nn.Linear(5, 5)
+                self.sub = Sub()
+
+            def forward(self, x):
+                x = self.linear(x)
+                x = self.sub(x)
+                return x
+
+        m = M().eval()
+        example_inputs = (torch.randn(3, 5),)
+        # Set global to `None` and then default config for a specific submodule.
+        quantizer = ArmInductorQuantizer()
+        quantizer.set_module_name_qconfig(
+            "sub", armiq.get_default_arm_inductor_quantization_config()
+        )
+        node_occurrence = {
+            torch.ops.aten.linear.default: 3,
+            # quantize and dequantize the input of two linear layers from `sub`
+            torch.ops.quantized_decomposed.quantize_per_tensor.default: 2,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default: 4,
+            # dequantize the weight of two linear layers from `sub`
+            torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+        }
+        node_list = [
+            # first linear is not quantized
+            torch.ops.aten.linear.default,
+            # two  Q/DQ pairs for two linear layers from `sub`
+            torch.ops.quantized_decomposed.quantize_per_tensor.default,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            torch.ops.aten.linear.default,
+            torch.ops.quantized_decomposed.quantize_per_tensor.default,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            torch.ops.aten.linear.default,
+        ]
+        self._test_quantizer(
+            m,
+            example_inputs,
+            quantizer,
+            node_occurrence,
+            node_list,
+        )
+
+    @skipIfNoArm
+    def test_set_module_name_qconfig_with_underscores(self) -> None:
+        """Test that if a module name has an underscore, we can still quantize it."""
+
+        class M(torch.nn.Module):
+            def __init__(self) -> None:
+                super().__init__()
+                # This module name has underscores, which can be part of a mangled name.
+                self.foo_bar = torch.nn.Linear(2, 2)
+                self.baz = torch.nn.Linear(2, 2)
+
+            def forward(self, x):
+                return self.baz(self.foo_bar(x))
+
+        # Set global to no quantization and then default config for a specific submodule whose name includes an underscore.
+        quantizer = ArmInductorQuantizer()
+        quantizer.set_module_name_qconfig(
+            "foo_bar", armiq.get_default_arm_inductor_quantization_config()
+        )
+        example_inputs = (torch.randn(2, 2),)
+        m = M().eval()
+        m = export_for_training(m, example_inputs).module()
+        m = prepare_pt2e(m, quantizer)
+        # Use a linear count instead of names because the names might change, but
+        # the order should be the same.
+        count = 0
+        for n in m.graph.nodes:
+            if n.op == "call_function" and n.target == torch.ops.aten.linear.default:
+                # Get the weight observer to see the per-channel vs per-tensor.
+                weight_observer_node = n.args[1]
+                if count == 0:
+                    # for foo_bar.
+                    self.assertEqual(
+                        weight_observer_node.op,
+                        "call_module",
+                        f"The op of linear({count})'s weight_observer_node is {weight_observer_node.op} instead call_module",
+                    )
+                    observer_instance = getattr(m, weight_observer_node.target)
+                    self.assertEqual(
+                        observer_instance.qscheme, torch.per_tensor_symmetric
+                    )
+                else:
+                    # For baz it should have no observer at all.
+                    self.assertNotEqual(
+                        weight_observer_node.op,
+                        "call_module",
+                        f"The op of linear({count})'s weight_observer_node is {weight_observer_node.op} instead call_module",
+                    )
+                count += 1
+
+    @skipIfNoArm
+    def test_set_module_name_and_module_type_case1(self):
+        """Test that set `module_name_qconfig` and `module_type_qconfig` at the same time.
+        Expect that all linear layers are not quantized except the last one.
+        """
+
+        class M(torch.nn.Module):
+            def __init__(self) -> None:
+                super().__init__()
+                self.linear1 = torch.nn.Linear(5, 10)
+                self.linear2 = torch.nn.Linear(10, 5)
+                self.sub = torch.nn.Linear(5, 5)
+
+            def forward(self, x):
+                x = self.linear1(x)
+                x = self.linear2(x)
+                x = self.sub(x)
+                return x
+
+        m = M().eval()
+        example_inputs = (torch.randn(3, 5),)
+        # Set `sub` with default config and then `None` for all `Linear`.
+        # The config set by `set_module_name_qconfig` has higher priority than `set_module_type_qconfig`.
+        quantizer = ArmInductorQuantizer()
+        quantizer.set_module_name_qconfig(
+            "sub", armiq.get_default_arm_inductor_quantization_config()
+        ).set_module_type_qconfig(torch.nn.Linear, None)
+
+        node_occurrence = {
+            torch.ops.aten.linear.default: 3,
+            # quantize and dequantize the input of the last linear
+            torch.ops.quantized_decomposed.quantize_per_tensor.default: 1,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default: 2,
+            # dequantize the weight of the last linear
+            torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+        }
+        node_list = [
+            # first and second linear are not quantized
+            torch.ops.aten.linear.default,
+            torch.ops.aten.linear.default,
+            # last linear is quantized
+            torch.ops.quantized_decomposed.quantize_per_tensor.default,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            torch.ops.aten.linear.default,
+        ]
+        self._test_quantizer(
+            m,
+            example_inputs,
+            quantizer,
+            node_occurrence,
+            node_list,
+        )
+
+    @skipIfNoArm
+    def test_set_module_name_and_module_type_case2(self):
+        """Test that set `module_name_qconfig` and `module_type_qconfig` at the same time.
+        Expect that all linear layers are quantized except the last one.
+        """
+
+        class M(torch.nn.Module):
+            def __init__(self) -> None:
+                super().__init__()
+                self.linear1 = torch.nn.Linear(5, 10)
+                self.linear2 = torch.nn.Linear(10, 5)
+                self.sub = torch.nn.Linear(5, 5)
+
+            def forward(self, x):
+                x = self.linear1(x)
+                x = self.linear2(x)
+                x = self.sub(x)
+                return x
+
+        m = M().eval()
+        example_inputs = (torch.randn(3, 5),)
+        # Set `sub` with None and then default config for a all `Linear`.
+        quantizer = ArmInductorQuantizer()
+        quantizer.set_module_name_qconfig("sub", None).set_module_type_qconfig(
+            torch.nn.Linear, armiq.get_default_arm_inductor_quantization_config()
+        )
+
+        node_occurrence = {
+            torch.ops.aten.linear.default: 3,
+            # quantize and dequantize the input and output of the first and second linear
+            torch.ops.quantized_decomposed.quantize_per_tensor.default: 2,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default: 4,
+            # dequantize the weight of the first and second linear
+            torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+        }
+        node_list = [
+            # Q/DQ for first lienar
+            torch.ops.quantized_decomposed.quantize_per_tensor.default,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            torch.ops.aten.linear.default,
+            # Q/DQ for second lienar
+            torch.ops.quantized_decomposed.quantize_per_tensor.default,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            torch.ops.aten.linear.default,
+            # last linear is not quantized
+            torch.ops.aten.linear.default,
+        ]
+        self._test_quantizer(
+            m,
+            example_inputs,
+            quantizer,
+            node_occurrence,
+            node_list,
+        )
+
+    @skipIfNoArm
+    def test_set_module_name_qconfig_for_dynamic_quant(self):
+        """Test that quantize a specific submodule for dynamic quantization."""
+
+        with torch.no_grad():
+            for is_qat in [False, True]:
+                m = TestHelperModules.SelfAttnLikeModule(input_dim=64).eval()
+                example_inputs = (torch.randn(1, 4, 64),)
+                # only quantize `q_proj` `v_proj`
+                dynamic_config = armiq.get_default_arm_inductor_quantization_config(
+                    is_dynamic=True, is_qat=is_qat
+                )
+                quantizer = (
+                    ArmInductorQuantizer()
+                    .set_module_name_qconfig("q_proj", dynamic_config)
+                    .set_module_name_qconfig("v_proj", dynamic_config)
+                )
+                node_occurrence = {
+                    # quantize and dequantize the input
+                    torch.ops.quantized_decomposed.choose_qparams.tensor: 1,
+                    torch.ops.quantized_decomposed.quantize_per_tensor.tensor: 1,
+                    torch.ops.quantized_decomposed.dequantize_per_tensor.tensor: 1,
+                    # dequantize the weight of q_proj and v_proj
+                    torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+                }
+                node_list = [
+                    # quantize and dequantize the input
+                    torch.ops.quantized_decomposed.choose_qparams.tensor,
+                    torch.ops.quantized_decomposed.quantize_per_tensor.tensor,
+                    torch.ops.quantized_decomposed.dequantize_per_tensor.tensor,
+                    # q_proj
+                    torch.ops.aten.linear.default,
+                    # k_proj
+                    torch.ops.aten.linear.default,
+                    # v_proj
+                    torch.ops.aten.linear.default,
+                ]
+                self._test_quantizer(
+                    m,
+                    example_inputs,
+                    quantizer,
+                    node_occurrence,
+                    node_list,
+                    is_qat=is_qat,
+                )
+
+    @skipIfNoArm
+    def test_set_module_name_with_mixed_configs(self):
+        """Test case for setting module names with mixed static/dynamic or QAT/non-QAT configurations.
+        The config for 'v_proj' will always be ignored and raise a warning.
+        """
+        with torch.no_grad():
+            with self.assertWarns(UserWarning) as context:
+                for q_is_dynamic, v_is_dynamic, q_is_qat, v_is_qat in itertools.product(
+                    [False, True], repeat=4
+                ):
+                    if q_is_dynamic == v_is_dynamic and q_is_qat == v_is_qat:
+                        continue
+                    m = TestHelperModules.SelfAttnLikeModule(input_dim=64).eval()
+                    example_inputs = (torch.randn(1, 4, 64),)
+                    quantizer = (
+                        ArmInductorQuantizer()
+                        .set_module_name_qconfig(
+                            "q_proj",
+                            armiq.get_default_arm_inductor_quantization_config(
+                                is_qat=q_is_qat, is_dynamic=q_is_dynamic
+                            ),
+                        )
+                        .set_module_name_qconfig(
+                            "v_proj",
+                            armiq.get_default_arm_inductor_quantization_config(
+                                is_qat=v_is_qat, is_dynamic=v_is_dynamic
+                            ),
+                        )
+                    )
+                    quant_op = (
+                        torch.ops.quantized_decomposed.quantize_per_tensor.tensor
+                        if q_is_dynamic
+                        else torch.ops.quantized_decomposed.quantize_per_tensor.default
+                    )
+                    dequant_op = (
+                        torch.ops.quantized_decomposed.dequantize_per_tensor.tensor
+                        if q_is_dynamic
+                        else torch.ops.quantized_decomposed.dequantize_per_tensor.default
+                    )
+                    node_occurrence = {
+                        # quantize and dequantize the input
+                        quant_op: 1,
+                        dequant_op: 1 if q_is_dynamic else 2,
+                        # only `q_proj` was quantized, dequantize its weight
+                        torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+                    }
+                    node_list = [
+                        # quantize and dequantize the input
+                        quant_op,
+                        dequant_op,
+                        # q_proj
+                        torch.ops.aten.linear.default,
+                        # k_proj/v_proj
+                        torch.ops.aten.linear.default,
+                        torch.ops.aten.linear.default,
+                    ]
+                    self._test_quantizer(
+                        m,
+                        example_inputs,
+                        quantizer,
+                        node_occurrence,
+                        node_list,
+                        is_qat=q_is_qat,
+                    )
+                    warning_msg = (
+                        "Mixed QAT and Non-QAT"
+                        if q_is_qat != v_is_qat
+                        else "Mixed dynamic and static"
+                    )
+                    self.assertTrue(
+                        any(
+                            warning_msg in msg
+                            for msg in [str(w.message) for w in context.warnings]
+                        )
+                    )
+
+    @skipIfNoArm
+    def test_set_module_name_and_module_type_with_mixed_configs(self):
+        """Test that set `module_name_qconfig` and `module_type_qconfig` at the same time with mixed the configs.
+        Expect that only the last linear(`sub`) is quantized using static quantization.
+        """
+
+        class M(torch.nn.Module):
+            def __init__(self) -> None:
+                super().__init__()
+                self.linear1 = torch.nn.Linear(5, 10)
+                self.linear2 = torch.nn.Linear(10, 5)
+                self.sub = torch.nn.Linear(5, 5)
+
+            def forward(self, x):
+                x = self.linear1(x)
+                x = self.linear2(x)
+                x = self.sub(x)
+                return x
+
+        m = M().eval()
+        example_inputs = (torch.randn(3, 5),)
+        # Set `sub` with static config and then dynamic config for a all `Linear`(ignored).
+        quantizer = ArmInductorQuantizer()
+        quantizer.set_module_name_qconfig(
+            "sub", armiq.get_default_arm_inductor_quantization_config(is_dynamic=False)
+        ).set_module_type_qconfig(
+            torch.nn.Linear,
+            armiq.get_default_arm_inductor_quantization_config(is_dynamic=True),
+        )
+
+        node_occurrence = {
+            torch.ops.aten.linear.default: 3,
+            # quantize and dequantize the input of the last linear
+            torch.ops.quantized_decomposed.quantize_per_tensor.default: 1,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default: 2,
+            # dequantize the weight of the last linear
+            torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+        }
+        node_list = [
+            # first and second linear are not quantized
+            torch.ops.aten.linear.default,
+            torch.ops.aten.linear.default,
+            # Q/DQ pairs for the last linear
+            torch.ops.quantized_decomposed.quantize_per_tensor.default,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            torch.ops.aten.linear.default,
+        ]
+        self._test_quantizer(
+            m,
+            example_inputs,
+            quantizer,
+            node_occurrence,
+            node_list,
+        )
+
+    @skipIfNoArm
+    def test_filter_linear_recipe(self):
+        """
+        Test removing linear from default recipe of ArmInductorQuantizer.
+        """
+        with torch.no_grad():
+            m = TestHelperModules.LinearUnaryModule(
+                use_bias=True,
+                postop=nn.ReLU,
+            ).eval()
+            example_inputs = (torch.randn(2, 4),)
+            quantizer = ArmInductorQuantizer().set_global(
+                armiq.get_default_arm_inductor_quantization_config()
+            )
+            quantizer.set_function_type_qconfig(torch.nn.functional.linear, None)
+            node_occurrence = {
+                # one for input and weight of the conv
+                torch.ops.quantized_decomposed.quantize_per_tensor.default: 0,
+                torch.ops.quantized_decomposed.dequantize_per_tensor.default: 0,
+                # note: quantize op for weights are const propagated
+                torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+                torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+            }
+            node_list = [
+                torch.ops.aten.linear.default,
+                torch.ops.aten.relu.default,
+            ]
+            self._test_quantizer(
+                m,
+                example_inputs,
+                quantizer,
+                node_occurrence,
+                node_list,
+            )
+
+    @skipIfNoArm
+    def test_attention_block(self):
+        """
+        Test pattern of Attention like Block with ArmInductorQuantizer.
+        """
+        for annotate_matmul in [False, True]:
+            with torch.no_grad():
+                m = TestHelperModules.SelfAttnLikeModule(
+                    input_dim=64 * 16,
+                    transpose_for_score=True,
+                    num_attention_heads=16,
+                    attention_head_size=64,
+                ).eval()
+                example_inputs = (torch.randn(2, 384, 1024),)
+
+                m(*example_inputs)
+
+                quantizer = ArmInductorQuantizer().set_global(
+                    armiq.get_default_arm_inductor_quantization_config()
+                )
+
+                if annotate_matmul:
+                    quantizer.set_function_type_qconfig(
+                        torch.matmul, quantizer.get_global_quantization_config()
+                    )
+
+                node_occurrence = {
+                    torch.ops.quantized_decomposed.quantize_per_tensor.default: (
+                        5 if annotate_matmul else 1
+                    ),
+                    torch.ops.quantized_decomposed.dequantize_per_tensor.default: (
+                        10 if annotate_matmul else 6
+                    ),
+                    # quantize_per_channel for weights are const propagated
+                    torch.ops.quantized_decomposed.quantize_per_channel.default: 0,
+                    torch.ops.quantized_decomposed.dequantize_per_channel.default: 0,
+                }
+                if annotate_matmul:
+                    node_list = [
+                        torch.ops.quantized_decomposed.quantize_per_tensor.default,
+                        torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+                        torch.ops.aten.linear.default,
+                        torch.ops.aten.view.default,
+                        torch.ops.aten.permute.default,
+                        torch.ops.quantized_decomposed.quantize_per_tensor.default,
+                        torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+                        torch.ops.aten.matmul.default,
+                        torch.ops.aten.div.Tensor,
+                        torch.ops.aten.softmax.int,
+                    ]
+                else:
+                    node_list = [
+                        torch.ops.quantized_decomposed.quantize_per_tensor.default,
+                        torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+                        torch.ops.aten.linear.default,
+                        torch.ops.aten.view.default,
+                        torch.ops.aten.permute.default,
+                        torch.ops.aten.matmul.default,
+                        torch.ops.aten.div.Tensor,
+                        torch.ops.aten.softmax.int,
+                    ]
+                self._test_quantizer(
+                    m,
+                    example_inputs,
+                    quantizer,
+                    node_occurrence,
+                    node_list,
+                )
+
+
+if __name__ == "__main__":
+    run_tests()
diff --git a/torchao/quantization/pt2e/quantizer/arm_inductor_quantizer.py b/torchao/quantization/pt2e/quantizer/arm_inductor_quantizer.py
new file mode 100644
index 0000000000..af0c04a79d
--- /dev/null
+++ b/torchao/quantization/pt2e/quantizer/arm_inductor_quantizer.py
@@ -0,0 +1,396 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+# mypy: allow-untyped-defs
+import functools
+import operator
+import warnings
+from dataclasses import dataclass
+from typing import TYPE_CHECKING, Any, Callable, Dict, List, Optional
+
+import torch
+import torch.nn.functional as F
+from torch.fx import Node
+from typing_extensions import TypeAlias
+
+from torchao.quantization.pt2e.fake_quantize import (
+    FakeQuantize,
+    FusedMovingAvgObsFakeQuantize,
+)
+from torchao.quantization.pt2e.observer import (
+    HistogramObserver,
+    MinMaxObserver,
+    MovingAverageMinMaxObserver,
+    PlaceholderObserver,
+)
+from torchao.quantization.pt2e.quantizer import (
+    QuantizationConfig,
+    get_module_name_filter,
+)
+from torchao.quantization.pt2e.quantizer.quantizer import (
+    QuantizationAnnotation,
+    QuantizationSpec,
+)
+
+from .x86_inductor_quantizer import (
+    X86InductorQuantizer,
+)
+
+FilterFn: TypeAlias = Callable[[List[Node]], bool]
+
+
+if TYPE_CHECKING:
+    from torchao.quantization.pt2e import _ObserverOrFakeQuantizeConstructor
+
+__all__ = [
+    "ArmInductorQuantizer",
+    "get_default_arm_inductor_quantization_config",
+]
+
+
+@dataclass
+class _ArmInductorQuantizationAnnotation(QuantizationAnnotation):
+    # _is_output_of_quantized_pattern:
+    #  * Node as output node of a fusion pattern.
+    #  * The fusion pattern supports int8 data type.
+    #  * The fusion pattern has inputs annotated to insert observer.
+    #  * The quantization_config is not `None`.
+    _is_output_of_quantized_pattern: bool = False
+
+
+# Operators support the int8 data type
+# and recipe is configured by default in ArmInductorQuantizer.
+default_quantizable_ops = {
+    torch.ops.aten.conv2d.default,
+    torch.ops.aten.linear.default,
+}
+
+# A superset of default_quantizable_ops includes operators support the int8 data type
+# but not enabled by default recipe of ArmInductorQuantizer.
+quantizable_ops = default_quantizable_ops | {
+    torch.ops.aten.matmul.default,
+}
+
+
+def _create_module_name_filter(module_name: str) -> FilterFn:
+    """Create a filter function for a given module name.
+
+    The filter function takes a list of nodes (as determined by the annotate function)
+    and return True if *all* nodes come from the specified module name, False otherwise.
+
+    For example:
+        linear_1: "f32[3, 10]" = torch.ops.aten.linear.default(...) # comes from a module with name `sub.linear1`
+        relu: "f32[3, 10]" = torch.ops.aten.relu.default(linear_1); # comes from a module with name `sub.relu1`
+
+    >> module_name_filter = _create_module_name_filter_inner("sub")
+    >> print(module_name_filter([relu, linear_1]))
+    # True  # These two nodes are determined by `_annotate_linear_unary` function and from "sub".
+    """
+
+    filter_fn = get_module_name_filter(module_name)
+
+    def check_all_nodes_from_module(nodes: list[Node]) -> bool:
+        all_nodes_from_module_name: bool = all(filter_fn(n) for n in nodes)
+        return all_nodes_from_module_name
+
+    return check_all_nodes_from_module
+
+
+def _create_operator_type_filter(
+    operator_type: Callable,
+) -> FilterFn:
+    """Create a filter function for a given operator type.
+
+    The filter function takes a list of nodes and returns True if it contains
+    exactly one node with the specified operator type, False otherwise.
+
+    For example:
+        linear_1: "f32[3, 10]" = torch.ops.aten.linear.default(...) # comes from a module with name `sub.linear1`
+        relu: "f32[3, 10]" = torch.ops.aten.relu.default(linear_1); # comes from a module with name `sub.relu1`
+
+    >> operator_type_filter = _create_operator_type_filter(torch.ops.aten.linear.default)
+    >> print(operator_type_filter([relu, linear_1]))
+    # True  # These two nodes are determined by `_annotate_linear_unary` function and the second node is `linear`.
+    """
+
+    def operator_type_filter(nodes: list[Node]):
+        num_nodes_with_operator_type = sum(
+            node.target == operator_type for node in nodes
+        )
+        if num_nodes_with_operator_type > 1:
+            raise NotImplementedError(
+                f"Several nodes within a single pattern are {operator_type}."
+            )
+        return num_nodes_with_operator_type == 1
+
+    return operator_type_filter
+
+
+def _global_config_filter(nodes: List[Node]) -> bool:
+    """Filter function for global configuration.
+
+    This filter function takes a list of nodes and returns True if there is exactly one node
+    in the list that is a default quantizable operation, False otherwise.
+    """
+    num_nodes_in_default_quantizable_ops = sum(
+        node.target in default_quantizable_ops for node in nodes
+    )
+    if num_nodes_in_default_quantizable_ops > 1:
+        raise NotImplementedError(
+            "Several nodes within a single pattern are default quantizable operations."
+        )
+    return num_nodes_in_default_quantizable_ops == 1
+
+
+def _map_module_function_to_aten_operator_type():
+    module_function_to_aten_operator: Dict[Callable, torch._ops.OpOverloadPacket] = {}
+    map_list = (
+        ([torch.nn.Conv2d, F.conv2d], torch.ops.aten.conv2d.default),
+        ([torch.nn.Linear, F.linear], torch.ops.aten.linear.default),
+        (
+            [
+                torch.matmul,
+            ],
+            torch.ops.aten.matmul.default,
+        ),
+    )
+    for map_item in map_list:
+        module_function_to_aten_operator.update(dict.fromkeys(map_item[0], map_item[1]))  # type: ignore[arg-type, call-overload]
+    return module_function_to_aten_operator
+
+
+@functools.lru_cache
+def get_default_arm_inductor_quantization_config(
+    is_qat: bool = False,
+    is_dynamic: bool = False,
+):
+    extra_args: Dict[str, Any] = {"eps": 2**-12}
+    if is_qat:
+        if is_dynamic:
+            act_observer_or_fake_quant_ctr = FakeQuantize
+            dynamic_quant_observer = MovingAverageMinMaxObserver.with_args(
+                averaging_constant=1
+            )
+            extra_args["observer"] = dynamic_quant_observer
+        else:
+            act_observer_or_fake_quant_ctr = FusedMovingAvgObsFakeQuantize  # type: ignore[assignment]
+    else:
+        if is_dynamic:
+            act_observer_or_fake_quant_ctr = PlaceholderObserver  # type: ignore[assignment]
+        else:
+            act_observer_or_fake_quant_ctr = HistogramObserver  # type: ignore[assignment]
+    # check for the qconfig -------------------------
+    act_quantization_spec = QuantizationSpec(
+        dtype=torch.int8,
+        quant_min=-128,
+        quant_max=127,
+        qscheme=torch.per_tensor_affine,
+        is_dynamic=is_dynamic,
+        observer_or_fake_quant_ctr=act_observer_or_fake_quant_ctr.with_args(
+            **extra_args
+        ),
+    )
+
+    weight_observer_or_fake_quant_ctr: _ObserverOrFakeQuantizeConstructor = (
+        FusedMovingAvgObsFakeQuantize if is_qat else MinMaxObserver
+    )
+
+    if is_qat:
+        # Only support per tensor quant for now
+        extra_args["observer"] = MovingAverageMinMaxObserver  # type: ignore[dict-item]
+    weight_quantization_spec = QuantizationSpec(
+        dtype=torch.int8,
+        quant_min=-128,
+        quant_max=127,
+        qscheme=torch.per_tensor_symmetric,
+        is_dynamic=False,
+        observer_or_fake_quant_ctr=weight_observer_or_fake_quant_ctr.with_args(
+            **extra_args
+        ),
+    )
+    bias_quantization_spec = None  # will use placeholder observer by default
+    quantization_config = QuantizationConfig(
+        act_quantization_spec,
+        act_quantization_spec,
+        weight_quantization_spec,
+        bias_quantization_spec,
+        is_qat,
+    )
+    return quantization_config
+
+
+def _config_checker(method: Callable) -> Callable:
+    @functools.wraps(method)
+    def wrapper(
+        quantizer: "ArmInductorQuantizer",
+        name: Any,
+        quantization_config: Optional["QuantizationConfig"],
+    ) -> "ArmInductorQuantizer":
+        if quantizer._need_skip_config(quantization_config):
+            warnings.warn(
+                f"Skip the quantization config for {name}.",
+            )
+            return quantizer
+        return method(quantizer, name, quantization_config)
+
+    return wrapper
+
+
+class ArmInductorQuantizer(X86InductorQuantizer):
+    module_function_to_aten_operator_type = _map_module_function_to_aten_operator_type()
+
+    def get_global_quantization_config(self):
+        if not isinstance(self.global_config, QuantizationConfig):
+            warnings.warn(
+                "The global_config for ArmInductorQuantizer is currently invalid. \
+                Please ensure that you use set_global to establish the global quantization configuration."
+            )
+        return self.global_config
+
+    @_config_checker
+    def set_function_type_qconfig(
+        self,
+        function_type: Callable,
+        quantization_config: Optional[QuantizationConfig],
+    ) -> "ArmInductorQuantizer":
+        if function_type in ArmInductorQuantizer.module_function_to_aten_operator_type:
+            self._set_aten_operator_qconfig(
+                ArmInductorQuantizer.module_function_to_aten_operator_type[
+                    function_type
+                ],
+                quantization_config,
+            )
+        else:
+            warnings.warn(
+                f"function: Unable to customize quantization config for {function_type} by ArmInductorQuantizer."
+            )
+        return self
+
+    @_config_checker
+    def set_module_type_qconfig(
+        self,
+        module_type: torch.nn.Module,
+        quantization_config: Optional[QuantizationConfig],
+    ) -> "ArmInductorQuantizer":
+        if module_type in ArmInductorQuantizer.module_function_to_aten_operator_type:
+            self._set_aten_operator_qconfig(
+                ArmInductorQuantizer.module_function_to_aten_operator_type[module_type],
+                quantization_config,
+            )
+        else:
+            warnings.warn(
+                f"Module: Unable to customize quantization config for {module_type} by ArmInductorQuantizer."
+            )
+        return self
+
+    @_config_checker
+    def set_module_name_qconfig(
+        self, module_name: str, quantization_config: Optional[QuantizationConfig]
+    ):
+        """Set quantization_config for a submodule with name: `module_name`, for example:
+        quantizer.set_module_name_qconfig("blocks.sub"), it will quantize all supported operator/operator
+        patterns in the submodule with this module name with the given `quantization_config`
+
+        The supported operators include `quantizable_ops` only.
+        """
+        self.module_name_qconfig[module_name] = quantization_config
+        return self
+
+    def _set_aten_operator_qconfig(
+        self,
+        operator_type: torch._ops.OpOverloadPacket,
+        quantization_config: Optional[QuantizationConfig],
+    ) -> "ArmInductorQuantizer":
+        if operator_type in quantizable_ops:
+            self.operator_type_qconfig[operator_type] = quantization_config
+        else:
+            warnings.warn(
+                f"operator: Unable to quantize {operator} by ArmInductorQuantizer."
+            )
+        return self
+
+    def annotate(self, model: torch.fx.GraphModule) -> torch.fx.GraphModule:
+        """Annotate the given model with quantization configurations.
+
+        Annotation contracts:
+        1. Annotate each node according to the user's qconfig in the following order:
+        `module_name_qconfig`, `operator_type_qconfig`, and `global_config`.
+        2. Avoid re-annotating nodes already annotated in prior stages. For example,
+        if `linear1` has been annotated by `module_name_qconfig`, it won't be annotated again
+        during the processing of the 'operator_type_qconfig' or 'global_config'.
+        3. For config is `None`, the node will be annotated with `_ArmInductorQuantizationAnnotation(_annotated=True)`.
+
+        For each pair of (module_name_or_operator_type_or_global, qconfig), a filter function is created.
+        This filter function checks if the node is marked by current stage and not annotated by the previous stage.
+        """
+        for module_name, quantization_config in self.module_name_qconfig.items():
+            self._annotate_with_config(
+                model, quantization_config, _create_module_name_filter(module_name)
+            )
+
+        for operator_type, quantization_config in self.operator_type_qconfig.items():
+            self._annotate_with_config(
+                model, quantization_config, _create_operator_type_filter(operator_type)
+            )
+
+        if self.global_config:
+            self._annotate_with_config(
+                model,
+                self.global_config,
+                _global_config_filter,
+            )
+
+        return model
+
+    def _annotate_with_config(
+        self,
+        model: torch.fx.GraphModule,
+        quantization_config: Optional[QuantizationConfig],
+        filter_fn: FilterFn,
+    ) -> None:
+        """Annotate the model with the given quantization configuration.
+
+        High-level description of quantization recipe for Arm Inductor Backend:
+        Apply quantization recipe for fusion patterns of conv/linear to enable int8 data type actively.
+        """
+
+        # Step1: Recipe of fusion patterns like conv/linear.
+        self._annotate_conv2d_fusion_pattern(model, quantization_config, filter_fn)
+        self._annotate_linear_fusion_pattern(model, quantization_config, filter_fn)
+        self._annotate_matmul(model, quantization_config, filter_fn)
+
+    def _annotate_qat_conv2d_fusion_pattern(
+        self,
+        model: torch.fx.GraphModule,
+        quantization_config: Optional[QuantizationConfig],
+        filter_fn: Optional[FilterFn] = None,
+    ):
+        # Annotate QAT Specific patterns
+        self._annotate_qat_conv2d_bn_binary(model, quantization_config, filter_fn)
+        self._annotate_qat_conv2d_bn(model, quantization_config, filter_fn)
+
+    def _annotate_conv2d_fusion_pattern(
+        self,
+        model: torch.fx.GraphModule,
+        quantization_config: Optional[QuantizationConfig],
+        filter_fn: Optional[FilterFn] = None,
+    ):
+        if (quantization_config is None) or (quantization_config.is_qat):
+            # Annotate QAT specific pattern: mainly due to BN not folded in prepare_qat
+            self._annotate_qat_conv2d_fusion_pattern(
+                model, quantization_config, filter_fn
+            )
+        self._annotate_conv2d_binary(model, quantization_config, filter_fn)
+        self._annotate_conv2d(model, quantization_config, filter_fn)
+
+    def _annotate_linear_fusion_pattern(
+        self,
+        model: torch.fx.GraphModule,
+        quantization_config: Optional[QuantizationConfig],
+        filter_fn: Optional[FilterFn] = None,
+    ):
+        self._annotate_linear_unary(model, quantization_config, filter_fn)
+        self._annotate_linear(model, quantization_config, filter_fn)

From 4bfd7c09ef4592eacbbf990aea6d6bda608865c1 Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Tue, 13 May 2025 13:24:51 -0700
Subject: [PATCH 027/165] Add mx_fp4 path (#2201)

stack-info: PR: https://github.com/pytorch/ao/pull/2201, branch: drisspg/stack/54
---
 test/prototype/mx_formats/test_kernels.py     |  7 ++-
 test/prototype/mx_formats/test_mx_linear.py   | 57 ++++++++++++++-----
 test/prototype/mx_formats/test_mx_mm.py       | 15 +++--
 test/prototype/mx_formats/test_mx_tensor.py   |  7 +--
 torchao/prototype/mx_formats/README.md        | 16 +++---
 .../mx_formats/benchmarks/bench_qdq.py        |  4 +-
 torchao/prototype/mx_formats/config.py        |  8 +--
 torchao/prototype/mx_formats/constants.py     | 12 +++-
 .../prototype/mx_formats/fp_format_spec.py    |  5 +-
 torchao/prototype/mx_formats/mx_ops.py        |  7 +--
 torchao/prototype/mx_formats/mx_tensor.py     | 11 ++--
 11 files changed, 93 insertions(+), 56 deletions(-)

diff --git a/test/prototype/mx_formats/test_kernels.py b/test/prototype/mx_formats/test_kernels.py
index 276d180046..d649b2e04a 100644
--- a/test/prototype/mx_formats/test_kernels.py
+++ b/test/prototype/mx_formats/test_kernels.py
@@ -9,7 +9,6 @@
 from torch.utils._triton import has_triton
 
 from torchao.prototype.mx_formats.constants import (
-    DTYPE_FP4,
     DTYPE_FP6_E2M3,
     DTYPE_FP6_E3M2,
     F4_E2M1_EXP_BIAS,
@@ -335,11 +334,13 @@ def test_fp4_triton_unscaled_cast():
 def test_fp4_triton_scaled_cast():
     size = (256,)
     orig_vals = torch.randn(size, dtype=torch.float, device="cuda") * 100
-    mxtensor_ref = MXTensor.to_mx(orig_vals, block_size=32, elem_dtype=DTYPE_FP4)
+    mxtensor_ref = MXTensor.to_mx(
+        orig_vals, block_size=32, elem_dtype=torch.float4_e2m1fn_x2
+    )
     mxtensor_triton = MXTensor.to_mx(
         orig_vals,
         block_size=32,
-        elem_dtype=DTYPE_FP4,
+        elem_dtype=torch.float4_e2m1fn_x2,
         use_fp4_custom_triton_dequant_kernel=True,
     )
 
diff --git a/test/prototype/mx_formats/test_mx_linear.py b/test/prototype/mx_formats/test_mx_linear.py
index 65934fb259..ff18d09aa4 100644
--- a/test/prototype/mx_formats/test_mx_linear.py
+++ b/test/prototype/mx_formats/test_mx_linear.py
@@ -11,12 +11,12 @@
 import torch.nn as nn
 
 from torchao.prototype.mx_formats.config import (
+    MXGemmKernelChoice,
     MXInferenceLinearConfig,
     MXLinearConfig,
     MXLinearRecipeName,
 )
 from torchao.prototype.mx_formats.constants import (
-    DTYPE_FP4,
     DTYPE_FP6_E2M3,
     DTYPE_FP6_E3M2,
     SUPPORTED_ELEM_DTYPES,
@@ -29,7 +29,6 @@
 from torchao.quantization import quantize_
 from torchao.quantization.utils import compute_error
 from torchao.utils import (
-    TORCH_VERSION_AT_LEAST_2_7,
     TORCH_VERSION_AT_LEAST_2_8,
     is_sm_at_least_89,
     is_sm_at_least_100,
@@ -37,7 +36,7 @@
 
 torch.manual_seed(2)
 
-if not TORCH_VERSION_AT_LEAST_2_7:
+if not TORCH_VERSION_AT_LEAST_2_8:
     pytest.skip("Unsupported PyTorch version", allow_module_level=True)
 
 
@@ -51,19 +50,28 @@ def run_around_tests():
     torch._dynamo.reset()
 
 
-@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
-@pytest.mark.parametrize(
-    "elem_dtype",
-    (
+elem_dtypes = (
+    [
         # test each dtype
         (torch.float8_e4m3fn, torch.float8_e4m3fn, torch.float8_e4m3fn),
         (DTYPE_FP6_E3M2, DTYPE_FP6_E3M2, DTYPE_FP6_E3M2),
         (DTYPE_FP6_E2M3, DTYPE_FP6_E2M3, DTYPE_FP6_E2M3),
-        (DTYPE_FP4, DTYPE_FP4, DTYPE_FP4),
+        (torch.float4_e2m1fn_x2, torch.float4_e2m1fn_x2, torch.float4_e2m1fn_x2),
         # only test one type of mixed-dtype overrides, to save testing time
-        (torch.float8_e4m3fn, DTYPE_FP4, DTYPE_FP4),
-    ),
+        (torch.float8_e4m3fn, torch.float4_e2m1fn_x2, torch.float4_e2m1fn_x2),
+    ]
+    if TORCH_VERSION_AT_LEAST_2_8
+    else [
+        # test each dtype
+        (torch.float8_e4m3fn, torch.float8_e4m3fn, torch.float8_e4m3fn),
+        (DTYPE_FP6_E3M2, DTYPE_FP6_E3M2, DTYPE_FP6_E3M2),
+        (DTYPE_FP6_E2M3, DTYPE_FP6_E2M3, DTYPE_FP6_E2M3),
+    ]
 )
+
+
+@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.parametrize("elem_dtype", elem_dtypes)
 @pytest.mark.parametrize("bias", [True, False])
 @pytest.mark.parametrize("input_shape", [(128, 256), (1, 128, 256), (1, 1, 128, 256)])
 @pytest.mark.parametrize("use_fp8_dim1_cast_triton_kernel", [False, True])
@@ -155,7 +163,7 @@ def test_linear_eager_emulated_vs_real_gemm(recipe_name, mkn):
 
     elem_dtype = torch.float8_e4m3fn
     if recipe_name == MXLinearRecipeName.MXFP4_CUTLASS:
-        elem_dtype = DTYPE_FP4
+        elem_dtype = torch.float4_e2m1fn_x2
 
     config_emulated = MXLinearConfig(block_size=32, elem_dtype=elem_dtype)
     config_real = MXLinearConfig.from_recipe_name(recipe_name)
@@ -375,12 +383,21 @@ def test_inference_print_str():
     assert "kernel=emulated" in s
 
 
+test_dtypes = (
+    [torch.float8_e4m3fn, torch.float4_e2m1fn_x2]
+    if TORCH_VERSION_AT_LEAST_2_8
+    else [
+        torch.float8_e4m3fn,
+    ]
+)
+
+
 @pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
 @pytest.mark.skipif(
     not TORCH_VERSION_AT_LEAST_2_8, reason="torch.compile requires PyTorch 2.8+"
 )
 @pytest.mark.skipif(not is_sm_at_least_100, reason="Reqs sm100")
-@pytest.mark.parametrize("elem_dtype", [torch.float8_e4m3fn])
+@pytest.mark.parametrize("elem_dtype", [torch.float8_e4m3fn, torch.float4_e2m1fn_x2])
 @pytest.mark.parametrize("bias", [True, False])
 @pytest.mark.parametrize("compile", [True, False])
 @torch.no_grad()
@@ -394,7 +411,16 @@ def test_inference_subclass(elem_dtype, bias: bool, compile: bool):
 
     m = nn.Linear(32, 128, bias=bias, dtype=torch.bfloat16, device="cuda")
     m_mx = copy.deepcopy(m)
-    config = MXFPInferenceConfig()
+    kernel_choice = (
+        MXGemmKernelChoice.CUTLASS
+        if elem_dtype == torch.float4_e2m1fn_x2
+        else MXGemmKernelChoice.CUBLAS
+    )
+    config = MXFPInferenceConfig(
+        activation_dtype=elem_dtype,
+        weight_dtype=elem_dtype,
+        gemm_kernel_choice=kernel_choice,
+    )
     quantize_(m_mx, config=config)
     if compile:
         m_mx = torch.compile(m_mx, fullgraph=True)
@@ -403,4 +429,7 @@ def test_inference_subclass(elem_dtype, bias: bool, compile: bool):
     y_ref = m(x)
     y_mx = m_mx(x)
     sqnr = compute_error(y_ref, y_mx)
-    assert sqnr >= 25.0, f"Got a sqnr of {sqnr} for {elem_dtype} and bias={bias}"
+    SQNR_THRESHOLD = 25.0 if elem_dtype == torch.float8_e4m3fn else 15.0
+    assert sqnr >= SQNR_THRESHOLD, (
+        f"Got a sqnr of {sqnr} for {elem_dtype} and bias={bias}"
+    )
diff --git a/test/prototype/mx_formats/test_mx_mm.py b/test/prototype/mx_formats/test_mx_mm.py
index 1b16fa24ab..46380cfb55 100644
--- a/test/prototype/mx_formats/test_mx_mm.py
+++ b/test/prototype/mx_formats/test_mx_mm.py
@@ -10,11 +10,14 @@
 
 from torchao.float8.float8_utils import compute_error
 from torchao.ops import mx_fp4_bf16
-from torchao.prototype.mx_formats.mx_tensor import DTYPE_FP4, MXTensor
+from torchao.prototype.mx_formats.mx_tensor import MXTensor
 from torchao.prototype.mx_formats.utils import to_blocked
-from torchao.utils import TORCH_VERSION_AT_LEAST_2_7, is_sm_at_least_100
+from torchao.utils import (
+    TORCH_VERSION_AT_LEAST_2_8,
+    is_sm_at_least_100,
+)
 
-if not TORCH_VERSION_AT_LEAST_2_7:
+if not TORCH_VERSION_AT_LEAST_2_8:
     pytest.skip("Unsupported PyTorch version", allow_module_level=True)
 
 
@@ -25,7 +28,7 @@ def run_matrix_test(M: int, K: int, N: int, format) -> float:
     a = torch.rand((M, K), dtype=dtype, device=device)
     b = torch.rand((N, K), dtype=dtype, device=device)
 
-    fmt = torch.float8_e4m3fn if format == "fp8" else DTYPE_FP4
+    fmt = torch.float8_e4m3fn if format == "fp8" else torch.float4_e2m1fn_x2
     mx_func = (
         partial(torch._scaled_mm, out_dtype=torch.bfloat16)
         if format == "fp8"
@@ -75,7 +78,9 @@ def run_matrix_test(M: int, K: int, N: int, format) -> float:
     ],
     ids=lambda x: f"{x[0]}x{x[1]}x{x[2]}",
 )
-@pytest.mark.parametrize("format", ["fp8", "fp4"])
+@pytest.mark.parametrize(
+    "format", ["fp8", "fp4"] if TORCH_VERSION_AT_LEAST_2_8 else ["fp8"]
+)
 def test_matrix_multiplication(size, format):
     M, K, N = size
     sqnr = run_matrix_test(M, K, N, format)
diff --git a/test/prototype/mx_formats/test_mx_tensor.py b/test/prototype/mx_formats/test_mx_tensor.py
index 51ede29bcb..59279c9dbb 100644
--- a/test/prototype/mx_formats/test_mx_tensor.py
+++ b/test/prototype/mx_formats/test_mx_tensor.py
@@ -12,7 +12,6 @@
 
 from torchao.prototype.mx_formats.config import MXGemmKernelChoice
 from torchao.prototype.mx_formats.constants import (
-    DTYPE_FP4,
     DTYPE_FP6_E2M3,
     DTYPE_FP6_E3M2,
     SUPPORTED_ELEM_DTYPES,
@@ -363,7 +362,7 @@ def test_exponent_nan_out(elem_dtype, pack_fp6):
         if pack_fp6:
             data_bits = data_bits.reshape(-1, block_size)
             data_bits = pack_uint6(data_bits)
-    elif elem_dtype == DTYPE_FP4:
+    elif elem_dtype == torch.float4_e2m1fn_x2:
         data_bits = torch.tensor(
             [0, 1, 2, 3, 4, 5, 6, 7], dtype=torch.uint8, device="cuda"
         )  # noqa: E501
@@ -407,7 +406,7 @@ def test_block_sizes(elem_dtype, B):
     """
     Smoke test for various block sizes
     """
-    if B == 1 and elem_dtype == DTYPE_FP4:
+    if B == 1 and elem_dtype == torch.float4_e2m1fn_x2:
         pytest.skip("unsupported configuration")
     elif B % 4 != 0 and elem_dtype in [DTYPE_FP6_E2M3, DTYPE_FP6_E3M2]:
         pytest.skip("unsupported configuration")
@@ -422,7 +421,7 @@ def test_transpose(elem_dtype, fp4_triton):
     """
     Verify that transposing an MX tensor works
     """
-    if elem_dtype != DTYPE_FP4 and fp4_triton:
+    if elem_dtype != torch.float4_e2m1fn_x2 and fp4_triton:
         pytest.skip("unsupported configuration")
 
     M, K = 128, 256
diff --git a/torchao/prototype/mx_formats/README.md b/torchao/prototype/mx_formats/README.md
index 955a02704f..587d81f6a6 100644
--- a/torchao/prototype/mx_formats/README.md
+++ b/torchao/prototype/mx_formats/README.md
@@ -1,6 +1,6 @@
 # MX training and inference with native PyTorch
 
-This is a workflow for e2e training and inference with MX dtypes from the [MX OCP spec](https://www.opencompute.org/documents/ocp-microscaling-formats-mx-v1-0-spec-final-pdf) 
+This is a workflow for e2e training and inference with MX dtypes from the [MX OCP spec](https://www.opencompute.org/documents/ocp-microscaling-formats-mx-v1-0-spec-final-pdf)
 in native PyTorch.  We are currently in prototype and are actively working on optimizing these workflows on the NVIDIA B200 hardware.
 
 ## Overall status
@@ -34,8 +34,8 @@ gemm_kernel_choice = MXGemmKernelChoice.CUBLAS
 
 m = torch.nn.Sequential(torch.nn.Linear(32, 32)).cuda()
 config = MXLinearConfig(
-    elem_dtype=torch.float8_e4m3fn, 
-    block_size=32, 
+    elem_dtype=torch.float8_e4m3fn,
+    block_size=32,
     gemm_kernel_choice=gemm_kernel_choice,
 )
 quantize_(m, config)
@@ -55,8 +55,8 @@ from torchao.prototype.mx_formats import MXInferenceLinearConfig, MXGemmKernelCh
 m = torch.nn.Sequential(torch.nn.Linear(32, 32)).cuda()
 gemm_kernel_choice = MXGemmKernelChoice.CUBLAS
 config = MXInferenceLinearConfig(
-    elem_dtype=torch.float8_e4m3fn, 
-    block_size=32, 
+    elem_dtype=torch.float8_e4m3fn,
+    block_size=32,
     gemm_kernel_choice=gemm_kernel_choice,
 )
 quantize_(m, config=config)
@@ -71,10 +71,10 @@ only `torch.float32` and `torch.bfloat16` are supported as high precision format
 ```python
 from torchao.prototype.mx_formats.mx_tensor import MXTensor
 # Note: MX int8 is not implemented yet
-from torchao.prototype.mx_formats.constants import DTYPE_FP6_E2M3, DTYPE_FP6_E3M2, DTYPE_FP4
+from torchao.prototype.mx_formats.constants import DTYPE_FP6_E2M3, DTYPE_FP6_E3M2
 x = torch.randn(32, 32, device='cuda')
 
-# elem_dtype can be torch.float8_e4m3fn, torch.float8_e5m2, DTYPE_FP6_E2M3, DTYPE_FP6_E3M2, DTYPE_FP4
+# elem_dtype can be torch.float8_e4m3fn, torch.float8_e5m2, DTYPE_FP6_E2M3, DTYPE_FP6_E3M2, torch.float4_e2m1fn_x2
 elem_dtype = torch.float8_e4m3fn
 
 # high precision to MX, block size defaults to 32
@@ -88,7 +88,7 @@ x_hp = x_mx.to_dtype(torch.float)
 
 ## mxfp8 gemm
 
-On NVIDIA B200 machines, we use the cuBLAS mxfp8 gemm exposed via the `torch._scaled_mm` op. 
+On NVIDIA B200 machines, we use the cuBLAS mxfp8 gemm exposed via the `torch._scaled_mm` op.
 We observe a speedup of **2x to 3x** vs the bf16 baseline on common shapes.  To reproduce this
 on supported hardware, you can run the following command:
 
diff --git a/torchao/prototype/mx_formats/benchmarks/bench_qdq.py b/torchao/prototype/mx_formats/benchmarks/bench_qdq.py
index 3886a37920..ca0b926ce5 100644
--- a/torchao/prototype/mx_formats/benchmarks/bench_qdq.py
+++ b/torchao/prototype/mx_formats/benchmarks/bench_qdq.py
@@ -17,7 +17,6 @@
 
 from torchao.prototype.mx_formats import config
 from torchao.prototype.mx_formats.constants import (  # noqa: E501
-    DTYPE_FP4,
     SUPPORTED_ELEM_DTYPES,
 )
 from torchao.prototype.mx_formats.mx_tensor import MXTensor
@@ -44,7 +43,8 @@ def run(profile_folder: Optional[str] = None):
             )
 
             if (
-                elem_dtype != DTYPE_FP4 and use_fp4_custom_triton_dequant_kernel  # noqa: E501
+                elem_dtype != torch.float4_e2m1fn_x2
+                and use_fp4_custom_triton_dequant_kernel  # noqa: E501
             ):
                 # custom_triton_kernels only works for fp4
                 continue
diff --git a/torchao/prototype/mx_formats/config.py b/torchao/prototype/mx_formats/config.py
index c49e1595a8..eb1b15228d 100644
--- a/torchao/prototype/mx_formats/config.py
+++ b/torchao/prototype/mx_formats/config.py
@@ -12,7 +12,6 @@
 
 from torchao.core.config import AOBaseConfig
 from torchao.prototype.mx_formats.constants import (
-    DTYPE_FP4,
     DTYPE_FP6_E2M3,
     DTYPE_FP6_E3M2,
     DTYPE_TO_SHORT_STR,
@@ -53,7 +52,7 @@ def _validate_gemm_kernel_choice(gemm_kernel_choice, block_size, elem_dtype):
         assert block_size == 32, (
             f"block_size must be 32 to use the CUTLASS MX gemm kernels, got {block_size}"
         )
-        valid_dtypes = [torch.float8_e4m3fn, DTYPE_FP4]
+        valid_dtypes = [torch.float8_e4m3fn, torch.float4_e2m1fn_x2]
         assert elem_dtype in valid_dtypes, (
             f"elem_dtype must be one of {valid_dtypes} to use the CUTLASS MX gemm kernels, got {elem_dtype}"
         )
@@ -126,10 +125,11 @@ def from_recipe_name(
         elif recipe_name is MXLinearRecipeName.MXFP8_CUBLAS:
             return MXLinearConfig(gemm_kernel_choice=MXGemmKernelChoice.CUBLAS)
         elif recipe_name is MXLinearRecipeName.MXFP4_EMULATED:
-            return MXLinearConfig(elem_dtype=DTYPE_FP4)
+            return MXLinearConfig(elem_dtype=torch.float4_e2m1fn_x2)
         elif recipe_name is MXLinearRecipeName.MXFP4_CUTLASS:
             return MXLinearConfig(
-                elem_dtype=DTYPE_FP4, gemm_kernel_choice=MXGemmKernelChoice.CUTLASS
+                elem_dtype=torch.float4_e2m1fn_x2,
+                gemm_kernel_choice=MXGemmKernelChoice.CUTLASS,
             )
         else:
             raise AssertionError(f"unknown recipe_name {recipe_name}")
diff --git a/torchao/prototype/mx_formats/constants.py b/torchao/prototype/mx_formats/constants.py
index 94c63b11e5..ffac3b1d5f 100644
--- a/torchao/prototype/mx_formats/constants.py
+++ b/torchao/prototype/mx_formats/constants.py
@@ -5,10 +5,11 @@
 # LICENSE file in the root directory of this source tree.
 import torch
 
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_8
+
 # This is conceptually an enum of non-core dtypes
 # TODO(future PR): change to a cleaner way to represent this without
 # regressing torch.compile and while keeping things readable.
-DTYPE_FP4 = "fp4_e2m1"
 DTYPE_FP6_E3M2 = "fp6_e3m2"
 DTYPE_FP6_E2M3 = "fp6_e2m3"
 
@@ -19,16 +20,21 @@
     torch.float8_e5m2,
     DTYPE_FP6_E2M3,
     DTYPE_FP6_E3M2,
-    DTYPE_FP4,
 ]
+SUPPORTED_ELEM_DTYPES = (
+    SUPPORTED_ELEM_DTYPES + [torch.float4_e2m1fn_x2]
+    if TORCH_VERSION_AT_LEAST_2_8
+    else SUPPORTED_ELEM_DTYPES
+)
 
 DTYPE_TO_SHORT_STR = {
     torch.float8_e4m3fn: "f8e4m3",
     torch.float8_e5m2: "f8e5m2",
     DTYPE_FP6_E2M3: "f6e2m3",
     DTYPE_FP6_E3M2: "f6e3m2",
-    DTYPE_FP4: "f4e2m1",
 }
+if TORCH_VERSION_AT_LEAST_2_8:
+    DTYPE_TO_SHORT_STR[torch.float4_e2m1fn_x2] = "f4e2m1"
 
 F8E4M3_MAX = torch.finfo(torch.float8_e4m3fn).max  # 448.0
 F8E5M2_MAX = torch.finfo(torch.float8_e5m2).max  # 57344.0
diff --git a/torchao/prototype/mx_formats/fp_format_spec.py b/torchao/prototype/mx_formats/fp_format_spec.py
index fc9521ef66..d89a3ad2a9 100644
--- a/torchao/prototype/mx_formats/fp_format_spec.py
+++ b/torchao/prototype/mx_formats/fp_format_spec.py
@@ -16,7 +16,6 @@
 import torch
 
 from torchao.prototype.mx_formats.constants import (
-    DTYPE_FP4,
     DTYPE_FP6_E2M3,
     DTYPE_FP6_E3M2,
 )
@@ -494,7 +493,7 @@ def run(dtype):
     headers = ["orig_val", "formula", "s_enc", "e_enc", "m_enc", "note"]
     results = []
 
-    if dtype == DTYPE_FP4:
+    if dtype == torch.float4_e2m1fn_x2:
         results = float4_e2m1_interesting_values
     elif dtype == DTYPE_FP6_E3M2:
         results = float6_e3m2_interesting_values
@@ -539,6 +538,6 @@ def run(dtype):
         torch.float8_e5m2,
         DTYPE_FP6_E3M2,
         DTYPE_FP6_E2M3,
-        DTYPE_FP4,
+        torch.float4_e2m1fn_x2,
     ):
         run(dtype)
diff --git a/torchao/prototype/mx_formats/mx_ops.py b/torchao/prototype/mx_formats/mx_ops.py
index da342c7853..c7e673dc37 100644
--- a/torchao/prototype/mx_formats/mx_ops.py
+++ b/torchao/prototype/mx_formats/mx_ops.py
@@ -28,7 +28,6 @@
 import torchao.ops
 from torchao.prototype.mx_formats.config import MXGemmKernelChoice
 from torchao.prototype.mx_formats.constants import (
-    DTYPE_FP4,
     DTYPE_FP6_E2M3,
     DTYPE_FP6_E3M2,
 )
@@ -117,8 +116,8 @@ def _addmm_mx_dispatch(
                 out_dtype=torch.bfloat16,
             )
         else:
-            assert a._elem_dtype == DTYPE_FP4
-            assert b._elem_dtype == DTYPE_FP4
+            assert a._elem_dtype == torch.float4_e2m1fn_x2
+            assert b._elem_dtype == torch.float4_e2m1fn_x2
             assert gemm_choice is MXGemmKernelChoice.CUTLASS, "unsupported"
             # FP4 operations
             res = torchao.ops.mx_fp4_bf16(
@@ -208,7 +207,7 @@ def unwrap(x):
 def mx_view_op(func, types, args, kwargs):
     data = args[0]._data
     new_size = args[1]
-    if args[0]._elem_dtype == DTYPE_FP4:
+    if args[0]._elem_dtype == torch.float4_e2m1fn_x2:
         # special case fp4 as we pack two elements per byte
         new_size = tensor_size_hp_to_fp4x2(new_size, data.is_contiguous())
     elif args[0]._elem_dtype in [DTYPE_FP6_E3M2, DTYPE_FP6_E2M3] and args[0]._pack_fp6:
diff --git a/torchao/prototype/mx_formats/mx_tensor.py b/torchao/prototype/mx_formats/mx_tensor.py
index 494e53d717..784d3eda6d 100644
--- a/torchao/prototype/mx_formats/mx_tensor.py
+++ b/torchao/prototype/mx_formats/mx_tensor.py
@@ -26,7 +26,6 @@
 from torchao.prototype.mx_formats.constants import (
     BF16_EXP_BIAS,
     BLOCK_SIZE_DEFAULT,
-    DTYPE_FP4,
     DTYPE_FP6_E2M3,
     DTYPE_FP6_E3M2,
     E8M0_EXPONENT_BIAS,
@@ -198,7 +197,7 @@ def to_mx(
         target_max_pow2 = F6_E3M2_MAX_POW2
         mbits = MBITS_F6_E3M2
         max_pos = F6_E3M2_MAX
-    elif elem_dtype == DTYPE_FP4:
+    elif elem_dtype == torch.float4_e2m1fn_x2:
         target_max_pow2 = F4_E2M1_MAX_POW2
         mbits = MBITS_F4_E2M1
         max_pos = F4_E2M1_MAX
@@ -314,7 +313,7 @@ def to_mx(
             data_lp = pack_uint6(data_lp)
         # need to reshape at the end to help inductor fuse things
         data_lp = data_lp.reshape(orig_shape)
-    elif elem_dtype == DTYPE_FP4:
+    elif elem_dtype == torch.float4_e2m1fn_x2:
         # can't reshape at the end without handling it in the packing code,
         # punt until later since we'll need to rethink the torch.compile
         # approach for fp4x2 in any case
@@ -394,7 +393,7 @@ def to_dtype(
         else:
             data_hp = f6_e3m2_unpacked_to_f32(data_lp)
             data_hp = data_hp.to(target_dtype).reshape(orig_shape)
-    elif elem_dtype == DTYPE_FP4:
+    elif elem_dtype == torch.float4_e2m1fn_x2:
         if use_fp4_custom_triton_dequant_kernel:
             data_hp_rescaled = triton_f4_to_scaled_bf16(
                 data_lp,
@@ -479,7 +478,7 @@ def __new__(
         pack_fp6,
     ):
         new_size = data_bits.size()
-        if elem_dtype == DTYPE_FP4:
+        if elem_dtype == torch.float4_e2m1fn_x2:
             # set the tensor size to what it would be without 2x4 packing
             # Note: `is_contiguous` is going to return True for a tensor of size
             # (M, 1) regardless or the order of dims, so this logic is currently
@@ -518,7 +517,7 @@ def __new__(
             torch.float8_e5m2,
         ):
             target_numel = scale_e8m0_bits.numel() * block_size
-        elif elem_dtype == DTYPE_FP4:
+        elif elem_dtype == torch.float4_e2m1fn_x2:
             assert data_bits.dtype is torch.uint8  # fp4
             target_numel = scale_e8m0_bits.numel() * block_size / 2
         elif elem_dtype in [DTYPE_FP6_E2M3, DTYPE_FP6_E3M2]:

From 58ac6c072836a5073a8c4b3c4dc48968e3cce371 Mon Sep 17 00:00:00 2001
From: Scott Roy <161522778+metascroy@users.noreply.github.com>
Date: Tue, 13 May 2025 17:08:22 -0700
Subject: [PATCH 028/165] Update __init__.py (#2206)

Add Int8DynamicActivationIntxWeightConfig to __init__.py
---
 torchao/quantization/__init__.py | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/torchao/quantization/__init__.py b/torchao/quantization/__init__.py
index fa156691ca..dc6431b2cf 100644
--- a/torchao/quantization/__init__.py
+++ b/torchao/quantization/__init__.py
@@ -52,6 +52,7 @@
     Int4WeightOnlyConfig,
     Int8DynamicActivationInt4WeightConfig,
     Int8DynamicActivationInt8WeightConfig,
+    Int8DynamicActivationIntxWeightConfig,
     Int8WeightOnlyConfig,
     IntxWeightOnlyConfig,
     PlainLayout,
@@ -133,6 +134,7 @@
     "Int4DynamicActivationInt4WeightConfig",
     "Int8DynamicActivationInt4WeightConfig",
     "Int8DynamicActivationInt8WeightConfig",
+    "Int8DynamicActivationIntxWeightConfig",
     "Int4WeightOnlyConfig",
     "Int8WeightOnlyConfig",
     "Float8WeightOnlyConfig",

From 720a1779bb9f3a1d5cc0fa008571063b71187449 Mon Sep 17 00:00:00 2001
From: Vasiliy Kuznetsov <vkuzo@users.noreply.github.com>
Date: Wed, 14 May 2025 12:06:27 -0400
Subject: [PATCH 029/165] unbreak CI by fixing MX tests (#2208)

Summary:

https://github.com/pytorch/ao/pull/2201 broke CI:
1. some MX tests for fp4 are running on A10G instances, with skipping
   not being properly applied
   (https://hud.pytorch.org/pytorch/ao/commit/4bfd7c09ef4592eacbbf990aea6d6bda608865c1#42164784332-box)
2. some SQNR thresholds were to tight for fp4
   (https://hud.pytorch.org/pytorch/ao/commit/4bfd7c09ef4592eacbbf990aea6d6bda608865c1#42164784332-box)

This PR fixes both of these to get CI back to green (I hope). Note that
I can't repro 1 locally, so we'll have to land and see if it works.

Test Plan: CI

Reviewers:

Subscribers:

Tasks:

Tags:
---
 test/prototype/mx_formats/test_mx_linear.py | 6 +++++-
 test/prototype/mx_formats/test_mx_tensor.py | 2 +-
 2 files changed, 6 insertions(+), 2 deletions(-)

diff --git a/test/prototype/mx_formats/test_mx_linear.py b/test/prototype/mx_formats/test_mx_linear.py
index ff18d09aa4..25025ed048 100644
--- a/test/prototype/mx_formats/test_mx_linear.py
+++ b/test/prototype/mx_formats/test_mx_linear.py
@@ -396,7 +396,6 @@ def test_inference_print_str():
 @pytest.mark.skipif(
     not TORCH_VERSION_AT_LEAST_2_8, reason="torch.compile requires PyTorch 2.8+"
 )
-@pytest.mark.skipif(not is_sm_at_least_100, reason="Reqs sm100")
 @pytest.mark.parametrize("elem_dtype", [torch.float8_e4m3fn, torch.float4_e2m1fn_x2])
 @pytest.mark.parametrize("bias", [True, False])
 @pytest.mark.parametrize("compile", [True, False])
@@ -405,9 +404,14 @@ def test_inference_subclass(elem_dtype, bias: bool, compile: bool):
     """
     Smoke test for inference compile
     """
+    # TODO(future): figure out why these CUDA capability conditions are not properly
+    # applied when inside `pytest.mark.skipif` for this test
     if elem_dtype in (torch.float8_e4m3fn, torch.float8_e5m2):
         if not is_sm_at_least_89():
             pytest.skip("CUDA capability >= 8.9 required for float8 in triton")
+    elif elem_dtype == torch.float4_e2m1fn_x2:
+        if not is_sm_at_least_100():
+            pytest.skip("CUDA capability >= 10.0 required for float4 gemm")
 
     m = nn.Linear(32, 128, bias=bias, dtype=torch.bfloat16, device="cuda")
     m_mx = copy.deepcopy(m)
diff --git a/test/prototype/mx_formats/test_mx_tensor.py b/test/prototype/mx_formats/test_mx_tensor.py
index 59279c9dbb..6dfd33f9c7 100644
--- a/test/prototype/mx_formats/test_mx_tensor.py
+++ b/test/prototype/mx_formats/test_mx_tensor.py
@@ -66,7 +66,7 @@ def assert_sqnr_gt_threshold(orig, new, threshold):
     if elem_dtype is torch.float8_e4m3fn:
         assert_sqnr_gt_threshold(data_hp, data_mx_dq, 18.0)
     else:
-        assert_sqnr_gt_threshold(data_hp, data_mx_dq, 14.0)
+        assert_sqnr_gt_threshold(data_hp, data_mx_dq, 13.0)
 
 
 @pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")

From 43000791dbe54626f0a7a15e6f5fcaa29c06a0ff Mon Sep 17 00:00:00 2001
From: Victor Moin <victormoin.vm@gmail.com>
Date: Wed, 14 May 2025 21:56:17 +0200
Subject: [PATCH 030/165] Add support for KleidiAI int4 kernels on aarch64
 Linux (#2169)

* Debugging ARM Neoverse-V1

* add comment to cmake

* Debug NEOVERSE ARM

* remove useless comments

* clean

* clean

* debug

* clean

* load multiple potential paths

* remove assertion

* re-introduce assertion and define load_libtorchao_ops fn

* add unit test to ensure

* Ready for merge

* last test

* fix

* PR feedbacks

* debug

* add comments

* add ENABLE_ARM_NEON in build_torchao_ops
---
 setup.py                                      | 35 ++++++++++--
 torchao/experimental/CMakeLists.txt           | 48 +++++++++++++++--
 torchao/experimental/build_torchao_ops.sh     |  1 +
 .../cpu/aarch64/valpacking/interleave.cpp     |  1 +
 torchao/experimental/op_lib.py                | 43 ++++++++++++---
 .../kernel_config.h                           |  6 +--
 .../experimental/ops/packed_weights_header.h  |  8 +--
 torchao/experimental/ops/parallel-aten-impl.h |  2 +-
 .../tests/test_load_libtorchao_ops.py         | 53 +++++++++++++++++++
 9 files changed, 175 insertions(+), 22 deletions(-)
 create mode 100644 torchao/experimental/tests/test_load_libtorchao_ops.py

diff --git a/setup.py b/setup.py
index 24d7be20de..f59917162f 100644
--- a/setup.py
+++ b/setup.py
@@ -49,7 +49,7 @@ def read_version(file_path="version.txt"):
 
 import platform
 
-build_torchao_experimental = (
+build_macos_arm_auto = (
     use_cpp == "1"
     and platform.machine().startswith("arm64")
     and platform.system() == "Darwin"
@@ -119,8 +119,33 @@ def __init__(self):
                 "TORCHAO_BUILD_EXPERIMENTAL_MPS requires MPS be available"
             )
 
+        # TORCHAO_PARALLEL_BACKEND specifies which parallel backend to use
+        # Possible values: aten_openmp, executorch, openmp, pthreadpool, single_threaded
+        self.parallel_backend = os.getenv("TORCHAO_PARALLEL_BACKEND", "aten_openmp")
+
+        # TORCHAO_ENABLE_ARM_NEON_DOT enable ARM NEON Dot Product extension
+        # Enabled by default on macOS silicon
+        self.enable_arm_neon_dot = self._os_bool_var(
+            "TORCHAO_ENABLE_ARM_NEON_DOT",
+            default=(self._is_arm64() and self._is_macos()),
+        )
+        if self.enable_arm_neon_dot:
+            assert self.build_cpu_aarch64, (
+                "TORCHAO_ENABLE_ARM_NEON_DOT requires TORCHAO_BUILD_CPU_AARCH64 be set"
+            )
+
+        # TORCHAO_ENABLE_ARM_I8MM enable ARM 8-bit Integer Matrix Multiply instructions
+        # Not enabled by default on macOS as not all silicon mac supports it
+        self.enable_arm_i8mm = self._os_bool_var(
+            "TORCHAO_ENABLE_ARM_I8MM", default=False
+        )
+        if self.enable_arm_i8mm:
+            assert self.build_cpu_aarch64, (
+                "TORCHAO_ENABLE_ARM_I8MM requires TORCHAO_BUILD_CPU_AARCH64 be set"
+            )
+
     def _is_arm64(self) -> bool:
-        return platform.machine().startswith("arm64")
+        return platform.machine().startswith("arm64") or platform.machine() == "aarch64"
 
     def _is_macos(self) -> bool:
         return platform.system() == "Darwin"
@@ -431,7 +456,8 @@ def get_extensions():
             )
         )
 
-    if build_torchao_experimental:
+    # Build CMakeLists from /torchao/experimental - additional options become available : TORCHAO_BUILD_CPU_AARCH64, TORCHAO_BUILD_KLEIDIAI, TORCHAO_BUILD_MPS_OPS, TORCHAO_PARALLEL_BACKEND
+    if build_macos_arm_auto or os.getenv("BUILD_TORCHAO_EXPERIMENTAL") == "1":
         build_options = BuildOptions()
 
         def bool_to_on_off(value):
@@ -451,6 +477,9 @@ def bool_to_on_off(value):
                         f"-DTORCHAO_BUILD_CPU_AARCH64={bool_to_on_off(build_options.build_cpu_aarch64)}",
                         f"-DTORCHAO_BUILD_KLEIDIAI={bool_to_on_off(build_options.build_kleidi_ai)}",
                         f"-DTORCHAO_BUILD_MPS_OPS={bool_to_on_off(build_options.build_experimental_mps)}",
+                        f"-DTORCHAO_ENABLE_ARM_NEON_DOT={bool_to_on_off(build_options.enable_arm_neon_dot)}",
+                        f"-DTORCHAO_ENABLE_ARM_I8MM={bool_to_on_off(build_options.enable_arm_i8mm)}",
+                        f"-DTORCHAO_PARALLEL_BACKEND={build_options.parallel_backend}",
                         "-DTorch_DIR=" + torch_dir,
                     ]
                     + (
diff --git a/torchao/experimental/CMakeLists.txt b/torchao/experimental/CMakeLists.txt
index e6b2a6aff0..4dd02b2dd7 100644
--- a/torchao/experimental/CMakeLists.txt
+++ b/torchao/experimental/CMakeLists.txt
@@ -15,10 +15,13 @@ if (NOT CMAKE_BUILD_TYPE)
     set(CMAKE_BUILD_TYPE Release)
 endif()
 
+# Platform options
 option(TORCHAO_BUILD_EXECUTORCH_OPS "Building torchao ops for ExecuTorch." OFF)
 option(TORCHAO_BUILD_MPS_OPS "Building torchao MPS ops" OFF)
 option(TORCHAO_BUILD_CPU_AARCH64 "Build torchao's CPU aarch64 kernels" OFF)
 option(TORCHAO_BUILD_KLEIDIAI "Download, build, and link against Arm KleidiAI library (arm64 only)" OFF)
+option(TORCHAO_ENABLE_ARM_NEON_DOT "Enable ARM Neon Dot Product extension" OFF)
+option(TORCHAO_ENABLE_ARM_I8MM "Enable ARM 8-bit Integer Matrix Multiply instructions" OFF)
 
 if(NOT TORCHAO_INCLUDE_DIRS)
   set(TORCHAO_INCLUDE_DIRS ${CMAKE_CURRENT_SOURCE_DIR}/../..)
@@ -28,19 +31,49 @@ if(NOT DEFINED TORCHAO_PARALLEL_BACKEND)
     set(TORCHAO_PARALLEL_BACKEND aten_openmp)
 endif()
 
-include(CMakePrintHelpers)
-
+# Set default compiler options
 add_compile_options("-Wall" "-Werror" "-Wno-deprecated")
 
 include(CMakePrintHelpers)
 message("TORCHAO_INCLUDE_DIRS: ${TORCHAO_INCLUDE_DIRS}")
 include_directories(${TORCHAO_INCLUDE_DIRS})
 
-
 if(TORCHAO_BUILD_CPU_AARCH64)
     message(STATUS "Building with cpu/aarch64")
     add_compile_definitions(TORCHAO_BUILD_CPU_AARCH64)
-    add_compile_definitions(TORCHAO_ENABLE_ARM_NEON_DOT)
+
+    # Set aarch64 compiler options
+    if (CMAKE_SYSTEM_NAME STREQUAL "Linux")
+        message(STATUS "Add aarch64 linux compiler options")
+        add_compile_options(
+            "-fPIC"
+            "-Wno-error=unknown-pragmas"
+            "-Wno-array-parameter"
+            "-Wno-maybe-uninitialized"
+            "-Wno-sign-compare"
+        )
+
+        # Since versions are hierarchical (each includes features from prior versions):
+        # - dotprod is included by default in armv8.4-a and later
+        # - i8mm is included by default in armv8.6-a and later
+        if(TORCHAO_ENABLE_ARM_I8MM)
+            message(STATUS "Using armv8.6-a (includes 'i8mm' and 'dotprod' flags)")
+            add_compile_options("-march=armv8.6-a")
+        elseif(TORCHAO_ENABLE_ARM_NEON_DOT)
+            message(STATUS "Using armv8.4-a (includes '+dotprod' flag)")
+            add_compile_options("-march=armv8.4-a")
+        endif()
+    endif()
+
+    if(TORCHAO_ENABLE_ARM_NEON_DOT)
+        message(STATUS "Building with ARM NEON dot product support")
+        add_compile_definitions(TORCHAO_ENABLE_ARM_NEON_DOT)
+    endif()
+
+    if(TORCHAO_ENABLE_ARM_I8MM)
+        message(STATUS "Building with ARM I8MM support")
+        add_compile_definitions(TORCHAO_ENABLE_ARM_I8MM)
+    endif()
 
     # Defines torchao_kernels_aarch64
     add_subdirectory(kernels/cpu/aarch64)
@@ -51,26 +84,33 @@ if(TORCHAO_BUILD_CPU_AARCH64)
     endif()
 endif()
 
+# Add quantized operation dir
 add_subdirectory(ops/linear_8bit_act_xbit_weight)
 add_subdirectory(ops/embedding_xbit)
 
+# ATen ops lib
 add_library(torchao_ops_aten SHARED)
 target_link_libraries(
     torchao_ops_aten PRIVATE
     torchao_ops_linear_8bit_act_xbit_weight_aten
     torchao_ops_embedding_xbit_aten
 )
+
+# Add MPS support if enabled
 if (TORCHAO_BUILD_MPS_OPS)
     message(STATUS "Building with MPS support")
     add_subdirectory(ops/mps)
     target_link_libraries(torchao_ops_aten PRIVATE torchao_ops_mps_aten)
 endif()
 
+# Install ATen targets
 install(
     TARGETS torchao_ops_aten
     EXPORT _targets
     DESTINATION lib
 )
+
+# Build executorch lib if enabled
 if(TORCHAO_BUILD_EXECUTORCH_OPS)
     add_library(torchao_ops_executorch STATIC)
     target_link_libraries(torchao_ops_executorch PRIVATE
diff --git a/torchao/experimental/build_torchao_ops.sh b/torchao/experimental/build_torchao_ops.sh
index 782e187092..1bcc1a9658 100644
--- a/torchao/experimental/build_torchao_ops.sh
+++ b/torchao/experimental/build_torchao_ops.sh
@@ -22,6 +22,7 @@ cmake -DCMAKE_PREFIX_PATH=${CMAKE_PREFIX_PATH} \
     -DCMAKE_INSTALL_PREFIX=${CMAKE_OUT} \
     -DTORCHAO_BUILD_EXECUTORCH_OPS="${TORCHAO_BUILD_EXECUTORCH_OPS}" \
     -DTORCHAO_BUILD_CPU_AARCH64=ON \
+    -DTORCHAO_ENABLE_ARM_NEON_DOT=ON \
     -S . \
     -B ${CMAKE_OUT}
 cmake --build  ${CMAKE_OUT} -j 16 --target install --config Release
diff --git a/torchao/experimental/kernels/cpu/aarch64/valpacking/interleave.cpp b/torchao/experimental/kernels/cpu/aarch64/valpacking/interleave.cpp
index 8cbf036957..0274b0889e 100644
--- a/torchao/experimental/kernels/cpu/aarch64/valpacking/interleave.cpp
+++ b/torchao/experimental/kernels/cpu/aarch64/valpacking/interleave.cpp
@@ -7,6 +7,7 @@
 #include <torchao/experimental/kernels/cpu/aarch64/valpacking/valpack.h>
 #include <cassert>
 #include <cstring>
+#include <cstdint>
 
 // Interleaves data across channels (row/column) and groups.
 // Each channel is the same size (vals_per_channel) and is
diff --git a/torchao/experimental/op_lib.py b/torchao/experimental/op_lib.py
index 4fe478d1e8..456b0ca160 100644
--- a/torchao/experimental/op_lib.py
+++ b/torchao/experimental/op_lib.py
@@ -10,15 +10,44 @@
 from torch import Tensor
 from torch.library import impl
 
-# Load C++ ops
-lib_path = Path(__file__).parent.parent
-libs = list(lib_path.glob("libtorchao_ops_aten.*"))
-assert len(libs) == 1, (
-    f"Expected to find one libtorchao_ops_aten.* library at {lib_path}, but found {len(libs)}"
-)
-torch.ops.load_library(str(libs[0]))
+# Load C++ ops - use multiple potential paths
+potential_paths = [
+    # Standard path from the module location
+    Path(__file__).parent.parent,
+    # Site-packages installation path
+    Path(torch.__file__).parent.parent / "torchao",
+    # For editable installs
+    Path(__file__).parent.parent.parent / "torchao",
+]
 
 
+def find_and_load_libtorchao_ops(potential_paths):
+    for lib_path in potential_paths:
+        libs = list(lib_path.glob("libtorchao_ops_aten.*"))
+
+        if not libs:
+            continue
+
+        assert len(libs) == 1, (
+            f"Expected to find one libtorchao_ops_aten.* library at {lib_path}, but found {len(libs)}"
+        )
+
+        target_lib = libs[0]
+        print(f"Found library at: {target_lib}")
+
+        try:
+            torch.ops.load_library(str(target_lib))
+            return
+        except Exception as e:
+            print(f"Error loading library from {target_lib}: {e}")
+
+    raise FileNotFoundError(
+        "Could not find libtorchao_ops_aten library in any of the provided paths"
+    )
+
+
+find_and_load_libtorchao_ops(potential_paths)
+
 # Define meta ops.  To support dynamic shapes, some meta ops need to
 # be defined in python instead of C++.
 torchao_lib = torch.library.Library("torchao", "IMPL")
diff --git a/torchao/experimental/ops/linear_8bit_act_xbit_weight/kernel_config.h b/torchao/experimental/ops/linear_8bit_act_xbit_weight/kernel_config.h
index 114e97838c..b699bdd3d3 100644
--- a/torchao/experimental/ops/linear_8bit_act_xbit_weight/kernel_config.h
+++ b/torchao/experimental/ops/linear_8bit_act_xbit_weight/kernel_config.h
@@ -190,7 +190,7 @@ struct UKernelConfig {
     TORCHAO_CHECK(pack_weights != nullptr || pack_weights_with_lut != nullptr, "pack_weights or pack_weights_with_lut must be set");
 
     bool linear_configs_set = true; // first linear config must be set
-    for (int i = 0; i < linear_configs.size(); i++) {
+    for (size_t i = 0; i < linear_configs.size(); i++) {
       if (linear_configs_set) {
         TORCHAO_CHECK(
             linear_configs[i].m_step >= 1,
@@ -225,7 +225,7 @@ struct UKernelConfig {
     assert(m >= 1);
     assert(linear_configs[0].m_step >= 1);
 
-    int i = 0;
+    size_t i = 0;
     while (i + 1 < linear_configs.size() && linear_configs[i + 1].m_step >= 1 &&
            linear_configs[i + 1].m_step <= m) {
       assert(linear_configs[i].m_step < linear_configs[i + 1].m_step);
@@ -235,7 +235,7 @@ struct UKernelConfig {
     assert(i < linear_configs.size());
     assert(linear_configs[i].m_step >= 1);
     assert(i == 0 || linear_configs[i].m_step <= m);
-    return i;
+    return static_cast<int>(i);
   }
 };
 
diff --git a/torchao/experimental/ops/packed_weights_header.h b/torchao/experimental/ops/packed_weights_header.h
index 0869c12ef9..11703e8454 100644
--- a/torchao/experimental/ops/packed_weights_header.h
+++ b/torchao/experimental/ops/packed_weights_header.h
@@ -43,7 +43,7 @@ class PackedWeightsHeader {
     auto header = reinterpret_cast<int*>(packed_weights);
     header[0] = magic;
     header[1] = static_cast<int>(type);
-    for (int i = 0; i < params.size(); i++) {
+    for (size_t i = 0; i < params.size(); i++) {
       header[i + 2] = params[i];
     }
   }
@@ -52,7 +52,7 @@ class PackedWeightsHeader {
     auto header = reinterpret_cast<const int*>(packed_weights);
     assert(header[0] == PackedWeightsHeader::magic);
     params_type params;
-    for (int i = 0; i < params.size(); i++) {
+    for (size_t i = 0; i < params.size(); i++) {
       params[i] = header[i + 2];
     }
     return PackedWeightsHeader(
@@ -63,7 +63,7 @@ class PackedWeightsHeader {
     if (type != other.type) {
       return false;
     }
-    for (int i = 0; i < params.size(); i++) {
+    for (size_t i = 0; i < params.size(); i++) {
       if (params[i] != other.params[i]) {
         return false;
       }
@@ -79,7 +79,7 @@ namespace std {
     struct hash<torchao::ops::PackedWeightsHeader> {
         std::size_t operator()(const torchao::ops::PackedWeightsHeader& f) const {
           std::size_t hash =  std::hash<int>()(static_cast<int>(f.type));
-          for (int i = 0; i < f.params.size(); i++) {
+          for (size_t i = 0; i < f.params.size(); i++) {
             hash ^= std::hash<int>()(f.params[i]);
           }
           return hash;
diff --git a/torchao/experimental/ops/parallel-aten-impl.h b/torchao/experimental/ops/parallel-aten-impl.h
index 07725f70eb..c2eb0b8498 100644
--- a/torchao/experimental/ops/parallel-aten-impl.h
+++ b/torchao/experimental/ops/parallel-aten-impl.h
@@ -5,7 +5,7 @@
 // LICENSE file in the root directory of this source tree.
 
 #pragma once
-#include <Aten/Parallel.h>
+#include <ATen/Parallel.h>
 #include <torch/library.h>
 #include <torch/torch.h>
 
diff --git a/torchao/experimental/tests/test_load_libtorchao_ops.py b/torchao/experimental/tests/test_load_libtorchao_ops.py
new file mode 100644
index 0000000000..4fec52f494
--- /dev/null
+++ b/torchao/experimental/tests/test_load_libtorchao_ops.py
@@ -0,0 +1,53 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+import unittest
+from pathlib import Path
+from unittest.mock import MagicMock, patch
+
+
+class TestLibTorchAoOpsLoader(unittest.TestCase):
+    def test_find_and_load_success(self):
+        mock_paths = [Path("/test/path1")]
+        mock_lib = MagicMock()
+        mock_lib.__str__.return_value = "/test/path1/libtorchao_ops_aten.so"
+
+        with patch("pathlib.Path.glob", return_value=[mock_lib]):
+            with patch("torch.ops.load_library") as mock_load:
+                from ..op_lib import find_and_load_libtorchao_ops
+
+                find_and_load_libtorchao_ops(mock_paths)
+
+                mock_load.assert_called_once_with("/test/path1/libtorchao_ops_aten.so")
+
+    def test_no_library_found(self):
+        mock_paths = [Path("/test/path1"), Path("/test/path2")]
+
+        with patch("pathlib.Path.glob", return_value=[]):
+            from ..op_lib import find_and_load_libtorchao_ops
+
+            with self.assertRaises(FileNotFoundError):
+                find_and_load_libtorchao_ops(mock_paths)
+
+    def test_multiple_libraries_error(self):
+        mock_paths = [Path("/test/path1")]
+        mock_lib1 = MagicMock()
+        mock_lib2 = MagicMock()
+        mock_libs = [mock_lib1, mock_lib2]
+
+        with patch("pathlib.Path.glob", return_value=mock_libs):
+            from ..op_lib import find_and_load_libtorchao_ops
+
+            try:
+                find_and_load_libtorchao_ops(mock_paths)
+                self.fail("Expected AssertionError was not raised")
+            except AssertionError as e:
+                expected_error_msg = f"Expected to find one libtorchao_ops_aten.* library at {mock_paths[0]}, but found 2"
+                self.assertIn(expected_error_msg, str(e))
+
+
+if __name__ == "__main__":
+    unittest.main()

From 554cb60c750e6ef31bbcafec74bb76a4578902da Mon Sep 17 00:00:00 2001
From: Peter Yeh <petrex@users.noreply.github.com>
Date: Wed, 14 May 2025 14:45:59 -0700
Subject: [PATCH 031/165] ROCm mxfp4 Skips (#2209)

Add skip_if_rocm decorator to test_inference_subclass in test_mx_linear.py

This change introduces the skip_if_rocm decorator to the test_inference_subclass function, ensuring that the test is skipped on ROCm platforms due to the requirement for gfx950. This enhances the robustness of the test suite by preventing unnecessary failures on unsupported hardware.
---
 test/prototype/mx_formats/test_mx_linear.py | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/test/prototype/mx_formats/test_mx_linear.py b/test/prototype/mx_formats/test_mx_linear.py
index 25025ed048..bfb6742d14 100644
--- a/test/prototype/mx_formats/test_mx_linear.py
+++ b/test/prototype/mx_formats/test_mx_linear.py
@@ -28,6 +28,7 @@
 from torchao.prototype.mx_formats.mx_subclass import MXFPInferenceConfig
 from torchao.quantization import quantize_
 from torchao.quantization.utils import compute_error
+from torchao.testing.utils import skip_if_rocm
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_8,
     is_sm_at_least_89,
@@ -400,6 +401,9 @@ def test_inference_print_str():
 @pytest.mark.parametrize("bias", [True, False])
 @pytest.mark.parametrize("compile", [True, False])
 @torch.no_grad()
+@skip_if_rocm(
+    "ROCm float4 gemm require gfx950"
+)  # TODO(future): deploy gfx950 in ROCM CI
 def test_inference_subclass(elem_dtype, bias: bool, compile: bool):
     """
     Smoke test for inference compile

From f04ff57c0b2faaadf9bfd5323e8e5e74f76573bc Mon Sep 17 00:00:00 2001
From: Scott Roy <161522778+metascroy@users.noreply.github.com>
Date: Thu, 15 May 2025 14:26:09 -0700
Subject: [PATCH 032/165] Add CI for Arm Linux (#2211)

* Update torchao_experimental_test.yml

Add CI for arm linux

* Update torchao_experimental_test.yml

* Update torchao_experimental_test.yml
---
 .github/workflows/torchao_experimental_test.yml | 15 +++++++++++++--
 1 file changed, 13 insertions(+), 2 deletions(-)

diff --git a/.github/workflows/torchao_experimental_test.yml b/.github/workflows/torchao_experimental_test.yml
index a712e7a624..4c56ec0c0e 100644
--- a/.github/workflows/torchao_experimental_test.yml
+++ b/.github/workflows/torchao_experimental_test.yml
@@ -14,7 +14,7 @@ jobs:
   test-cpu-ops:
     strategy:
       matrix:
-        runner: [macos-14]
+        runner: [macos-14, linux.arm64.2xlarge]
     runs-on: ${{matrix.runner}}
     defaults:
       run:
@@ -30,7 +30,8 @@ jobs:
           python-version: "3.10"
           miniconda-version: "latest"
           activate-environment: venv
-      - name: Install requirements
+      - name: Install requirements mac
+        if: runner.os == 'macOS'
         run: |
           conda activate venv
           # Install executorch first because it installs its own version
@@ -39,6 +40,13 @@ jobs:
           pip install torch==2.7.0 --index-url https://download.pytorch.org/whl/cpu --force-reinstall
           pip install -r dev-requirements.txt
           USE_CPP=1 TORCHAO_BUILD_KLEIDIAI=1 pip install .
+      - name: Install requirements linux
+        if: runner.os == 'Linux'
+        run: |
+          conda activate venv
+          pip install torch==2.7.0 --index-url https://download.pytorch.org/whl/cpu --force-reinstall
+          pip install -r dev-requirements.txt
+          BUILD_TORCHAO_EXPERIMENTAL=1 TORCHAO_BUILD_CPU_AARCH64=1 TORCHAO_BUILD_KLEIDIAI=1 TORCHAO_ENABLE_ARM_NEON_DOT=1 TORCHAO_PARALLEL_BACKEND=OPENMP pip install .
       - name: Run python tests
         run: |
           conda activate venv
@@ -46,6 +54,7 @@ jobs:
           python torchao/experimental/tests/test_embedding_xbit_quantizer.py
           python torchao/experimental/tests/test_quant_passes.py
       - name: Run kernels/cpu/aarch64/tests
+        if: runner.os == 'macOS'
         run: |
           conda activate venv
           pushd torchao/experimental/kernels/cpu/aarch64/tests
@@ -53,6 +62,7 @@ jobs:
           rm -rf /tmp/cmake-out
           popd
       - name: Run torchao/experimental/ops/tests
+        if: runner.os == 'macOS'
         run: |
           conda activate venv
           pushd torchao/experimental/ops/tests
@@ -60,6 +70,7 @@ jobs:
           rm -rf /tmp/cmake-out
           popd
       - name: ET ops build
+        if: runner.os == 'macOS'
         run: |
           conda activate venv
           pushd torchao/experimental

From 5549da8af975be6ff14330feb56c4abe3405b6f9 Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Thu, 15 May 2025 16:41:04 -0700
Subject: [PATCH 033/165] Enable {conv3d, conv_transpose3d} + bn fusion in pt2e
 (#2212)

* Enable {conv3d, conv_transpose3d} + bn fusion in pt2e

Summary:
att, previously only 1d and 2d fusion are supported, this PR
adds 3d support

Test Plan:
python test/quantization/pt2e/test_quantize_pt2e.py -k test_conv3d_bn_relu
python test/quantization/pt2e/test_quantize_pt2e.py -k test_conv_transpose3d_bn_relu

Reviewers:

Subscribers:

Tasks:

Tags:

* comment

* fix test
---
 test/quantization/pt2e/test_quantize_pt2e.py | 186 +++++++++++++++++++
 torchao/quantization/pt2e/utils.py           |   5 +-
 2 files changed, 190 insertions(+), 1 deletion(-)

diff --git a/test/quantization/pt2e/test_quantize_pt2e.py b/test/quantization/pt2e/test_quantize_pt2e.py
index cddaf9b3ef..75701c55ca 100644
--- a/test/quantization/pt2e/test_quantize_pt2e.py
+++ b/test/quantization/pt2e/test_quantize_pt2e.py
@@ -2385,6 +2385,192 @@ def validate(self, model: torch.fx.GraphModule) -> None:
             node_list,
         )
 
+    def test_conv3d_bn_relu(self):
+        class BackendAQuantizer(Quantizer):
+            def annotate(self, model: torch.fx.GraphModule) -> torch.fx.GraphModule:
+                act_qspec = QuantizationSpec(
+                    dtype=torch.uint8,
+                    quant_min=0,
+                    quant_max=255,
+                    qscheme=torch.per_tensor_affine,
+                    is_dynamic=False,
+                    observer_or_fake_quant_ctr=observer.default_observer,
+                )
+                weight_qspec = QuantizationSpec(
+                    dtype=torch.int8,
+                    quant_min=-128,
+                    quant_max=127,
+                    qscheme=torch.per_tensor_affine,
+                    is_dynamic=False,
+                    observer_or_fake_quant_ctr=observer.default_weight_observer,
+                )
+                bias_qspec = QuantizationSpec(
+                    dtype=torch.float32,
+                    is_dynamic=False,
+                    observer_or_fake_quant_ctr=observer.PlaceholderObserver,
+                )
+                # conv_transpose + bn is fused automatically in PTQ (not configurable)
+                # so we just need to annotate conv + relu for conv + bn + relu
+                # pattern
+                for n in model.graph.nodes:
+                    if (
+                        n.op != "call_function"
+                        or n.target != torch.ops.aten.relu.default
+                    ):
+                        continue
+                    relu_node = n
+                    n = n.args[0]
+                    if (
+                        n.op != "call_function"
+                        and n.target != torch.ops.aten.conv3d.input
+                    ):
+                        continue
+                    conv_t_node = n
+                    input_act = conv_t_node.args[0]
+                    weight = conv_t_node.args[1]
+                    bias = conv_t_node.args[2]
+                    conv_t_node.meta["quantization_annotation"] = (
+                        QuantizationAnnotation(
+                            input_qspec_map={
+                                input_act: act_qspec,
+                                weight: weight_qspec,
+                                bias: bias_qspec,
+                            },
+                            _annotated=True,
+                        )
+                    )
+                    relu_node.meta["quantization_annotation"] = QuantizationAnnotation(
+                        output_qspec=act_qspec,
+                        _annotated=True,
+                    )
+
+            def validate(self, model: torch.fx.GraphModule) -> None:
+                pass
+
+        class M(torch.nn.Module):
+            def __init__(self):
+                super().__init__()
+                self.conv = torch.nn.Conv3d(2, 2, 3, padding=1)
+                self.bn = torch.nn.BatchNorm3d(2)
+
+            def forward(self, x):
+                return torch.nn.functional.relu(self.bn(self.conv(x)))
+
+        example_inputs = (torch.randn(1, 2, 2, 5, 5),)
+        node_occurrence = {
+            # two for input of the first conv, one for output for the first conv
+            torch.ops.quantized_decomposed.quantize_per_tensor.default: 2,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default: 3,
+        }
+        node_list = [
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            torch.ops.aten.conv3d.default,
+            torch.ops.aten.relu.default,
+            torch.ops.quantized_decomposed.quantize_per_tensor.default,
+        ]
+        model = M().eval()
+        self._test_quantizer(
+            model,
+            example_inputs,
+            BackendAQuantizer(),
+            node_occurrence,
+            node_list,
+        )
+
+    def test_conv_transpose3d_bn_relu(self):
+        class BackendAQuantizer(Quantizer):
+            def annotate(self, model: torch.fx.GraphModule) -> torch.fx.GraphModule:
+                act_qspec = QuantizationSpec(
+                    dtype=torch.uint8,
+                    quant_min=0,
+                    quant_max=255,
+                    qscheme=torch.per_tensor_affine,
+                    is_dynamic=False,
+                    observer_or_fake_quant_ctr=observer.default_observer,
+                )
+                weight_qspec = QuantizationSpec(
+                    dtype=torch.int8,
+                    quant_min=-128,
+                    quant_max=127,
+                    qscheme=torch.per_tensor_affine,
+                    is_dynamic=False,
+                    observer_or_fake_quant_ctr=observer.default_weight_observer,
+                )
+                bias_qspec = QuantizationSpec(
+                    dtype=torch.float32,
+                    is_dynamic=False,
+                    observer_or_fake_quant_ctr=observer.PlaceholderObserver,
+                )
+                # conv_transpose + bn is fused automatically in PTQ (not configurable)
+                # so we just need to annotate conv_transpose + relu for conv_transpose + bn + relu
+                # pattern
+                for n in model.graph.nodes:
+                    if (
+                        n.op != "call_function"
+                        or n.target != torch.ops.aten.relu.default
+                    ):
+                        continue
+                    relu_node = n
+                    n = n.args[0]
+                    if (
+                        n.op != "call_function"
+                        and n.target != torch.ops.aten.conv_transposed3d.input
+                    ):
+                        continue
+                    conv_t_node = n
+                    input_act = conv_t_node.args[0]
+                    weight = conv_t_node.args[1]
+                    bias = conv_t_node.args[2]
+                    conv_t_node.meta["quantization_annotation"] = (
+                        QuantizationAnnotation(
+                            input_qspec_map={
+                                input_act: act_qspec,
+                                weight: weight_qspec,
+                                bias: bias_qspec,
+                            },
+                            _annotated=True,
+                        )
+                    )
+                    relu_node.meta["quantization_annotation"] = QuantizationAnnotation(
+                        output_qspec=act_qspec,
+                        _annotated=True,
+                    )
+
+            def validate(self, model: torch.fx.GraphModule) -> None:
+                pass
+
+        class M(torch.nn.Module):
+            def __init__(self):
+                super().__init__()
+                self.conv_t = torch.nn.ConvTranspose3d(2, 2, 3, padding=1)
+                self.bn = torch.nn.BatchNorm3d(2)
+
+            def forward(self, x):
+                return torch.nn.functional.relu(self.bn(self.conv_t(x)))
+
+        example_inputs = (torch.randn(1, 2, 2, 5, 5),)
+        node_occurrence = {
+            # two for input of the first conv, one for output for the first conv
+            torch.ops.quantized_decomposed.quantize_per_tensor.default: 2,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default: 3,
+        }
+        node_list = [
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            torch.ops.aten.conv_transpose3d.input,
+            torch.ops.aten.relu.default,
+            torch.ops.quantized_decomposed.quantize_per_tensor.default,
+        ]
+        model = M().eval()
+        self._test_quantizer(
+            model,
+            example_inputs,
+            BackendAQuantizer(),
+            node_occurrence,
+            node_list,
+        )
+
     def test_multi_users_without_output_observer(self):
         """
         Test the case in which a node is used by multiple users,
diff --git a/torchao/quantization/pt2e/utils.py b/torchao/quantization/pt2e/utils.py
index 1cc5d4f4e9..ad5c0ae179 100644
--- a/torchao/quantization/pt2e/utils.py
+++ b/torchao/quantization/pt2e/utils.py
@@ -626,6 +626,7 @@ def _is_conv_node(n: Node):
     return n.op == "call_function" and n.target in [
         torch.ops.aten.conv1d.default,
         torch.ops.aten.conv2d.default,
+        torch.ops.aten.conv3d.default,
     ]
 
 
@@ -638,6 +639,8 @@ def _is_conv_transpose_node(n: Node):
         torch.ops.aten.conv_transpose1d.default,
         torch.ops.aten.conv_transpose2d,
         torch.ops.aten.conv_transpose2d.input,
+        torch.ops.aten.conv_transpose3d,
+        torch.ops.aten.conv_transpose3d.input,
     ]
 
 
@@ -649,7 +652,7 @@ def _is_conv_or_conv_transpose_node(n: Node):
 
 
 def _is_conv_transpose_fn(conv_fn: Callable):
-    return conv_fn in [F.conv_transpose1d, F.conv_transpose2d]
+    return conv_fn in [F.conv_transpose1d, F.conv_transpose2d, F.conv_transpose3d]
 
 
 def _is_bn_node(n: Node):

From 5e5db7176cb6a966b1f2a56eac86c2b83c8b189f Mon Sep 17 00:00:00 2001
From: Scott Roy <161522778+metascroy@users.noreply.github.com>
Date: Mon, 19 May 2025 16:46:48 -0700
Subject: [PATCH 034/165] Make torchao pt2e prepare/convert functions
 compatible with quantizers in torch.ao (#2221)

* lint

* up

* up

* up

* lint
---
 torchao/quantization/pt2e/quantize_pt2e.py | 64 ++++++++++++++++++++++
 1 file changed, 64 insertions(+)

diff --git a/torchao/quantization/pt2e/quantize_pt2e.py b/torchao/quantization/pt2e/quantize_pt2e.py
index d352d91f9b..94a675d809 100644
--- a/torchao/quantization/pt2e/quantize_pt2e.py
+++ b/torchao/quantization/pt2e/quantize_pt2e.py
@@ -95,6 +95,15 @@ def calibrate(model, data_loader):
         # run calibration
         # calibrate(m, sample_inference_data)
     """
+    # We will temporarily make prepare_pt2e backward compatible with quantizers that configs, observers,
+    # and fake quantizers from torch.ao instead of torchao
+    if isinstance(quantizer, torch.ao.quantization.quantizer.quantizer.Quantizer):
+        from torch.ao.quantization.quantize_pt2e import (
+            prepare_pt2e as torch_prepare_pt2e,
+        )
+
+        return torch_prepare_pt2e(model, quantizer)
+
     torch._C._log_api_usage_once("quantization_api.quantize_pt2e.prepare_pt2e")
     original_graph_meta = model.meta
     node_name_to_scope = _get_node_name_to_scope(model)
@@ -172,6 +181,15 @@ def train_loop(model, train_data):
         train_loop(prepared_model, train_loop)
 
     """
+    # We will temporarily make prepare_qat_pt2e backward compatible with quantizers that configs, observers,
+    # and fake quantizers from torch.ao instead of torchao
+    if isinstance(quantizer, torch.ao.quantization.quantizer.quantizer.Quantizer):
+        from torch.ao.quantization.quantize_pt2e import (
+            prepare_qat_pt2e as torch_prepare_qat_pt2e,
+        )
+
+        return torch_prepare_qat_pt2e(model, quantizer)
+
     torch._C._log_api_usage_once("quantization_api.quantize_pt2e.prepare_qat_pt2e")
     original_graph_meta = model.meta
     node_name_to_scope = _get_node_name_to_scope(model)
@@ -217,6 +235,43 @@ def _quant_node_constraint(n: Node) -> bool:
     return n.op == "call_function" and n.target in _QUANT_OPS
 
 
+def _is_torchao_prepared_do_not_use_outside_this_file(model):
+    from torchao.quantization.pt2e.fake_quantize import (
+        FakeQuantize as torchao_FakeQuantize,
+    )
+    from torchao.quantization.pt2e.observer import (
+        AffineQuantizedObserverBase as torchao_AffineQuantizedObserverBase,
+    )
+    from torchao.quantization.pt2e.observer import ObserverBase as torchao_ObserverBase
+
+    is_torch_ao_prepared = False
+    is_torchao_prepared = False
+    for _, m in model.named_modules():
+        if (
+            isinstance(m, torch.ao.quantization.fake_quantize.FakeQuantize)
+            or isinstance(m, torch.ao.quantization.observer.ObserverBase)
+            or isinstance(m, torch.ao.quantization.observer.AffineQuantizedObserverBase)
+        ):
+            is_torch_ao_prepared = True
+        if (
+            isinstance(m, torchao_FakeQuantize)
+            or isinstance(m, torchao_ObserverBase)
+            or isinstance(m, torchao_AffineQuantizedObserverBase)
+        ):
+            is_torchao_prepared = True
+
+    if is_torch_ao_prepared:
+        assert not is_torchao_prepared, (
+            "Cannot be prepared using both torch.ao and torchao"
+        )
+    if is_torchao_prepared:
+        assert not is_torch_ao_prepared, (
+            "Cannot be prepared using both torch.ao and torchao"
+        )
+
+    return is_torchao_prepared
+
+
 def convert_pt2e(
     model: GraphModule,
     use_reference_representation: bool = False,
@@ -243,6 +298,15 @@ def convert_pt2e(
         quantized_model = convert_pt2e(prepared_model)
 
     """
+    # We will temporarily make convert_pt2e backward compatible with quantizers that configs, observers,
+    # and fake quantizers from torch.ao instead of torchao
+    if not _is_torchao_prepared_do_not_use_outside_this_file(model):
+        from torch.ao.quantization.quantize_pt2e import (
+            convert_pt2e as torch_convert_pt2e,
+        )
+
+        return torch_convert_pt2e(model, use_reference_representation, fold_quantize)
+
     torch._C._log_api_usage_once("quantization_api.quantize_pt2e.convert_pt2e")
     if not isinstance(use_reference_representation, bool):
         raise ValueError(

From 96aec6a3e713687c1728a20a08d5c54db0344377 Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Mon, 19 May 2025 18:25:35 -0700
Subject: [PATCH 035/165] Update config.py (#2224)

Needed for layout:

ValueError: Failed to find class QDQLayout in any of the allowed modules: torchao.prototype.quantization, torchao.sparsity.sparse_api, torchao.prototype.mx_formats, torchao.quantization
---
 torchao/core/config.py | 1 +
 1 file changed, 1 insertion(+)

diff --git a/torchao/core/config.py b/torchao/core/config.py
index 519dfe8dfd..d2d49981c9 100644
--- a/torchao/core/config.py
+++ b/torchao/core/config.py
@@ -176,6 +176,7 @@ def config_to_dict(config: AOBaseConfig) -> Dict[str, Any]:
     "torchao.sparsity.sparse_api",
     "torchao.prototype.quantization",
     "torchao.prototype.mx_formats",
+    "torchao.dtypes",
 }
 
 
From 1bbeed1a748044de3e45ce1e9486fc675cdfc330 Mon Sep 17 00:00:00 2001
From: Xuan Liao <xuan.liao@intel.com>
Date: Wed, 21 May 2025 09:11:08 +0800
Subject: [PATCH 036/165] Re-land the PR of "Add INT8 SDPA path for CPU"
 (#2215)

* enable int8 sdpa cpu
---
 setup.py                                      |   25 +
 .../inductor/test_int8_sdpa_fusion.py         |  223 ++
 test/test_ops.py                              |  141 +-
 torchao/csrc/cpu/int8_sdpa.cpp                | 1910 +++++++++++++++++
 torchao/ops.py                                |   89 +
 torchao/prototype/inductor/__init__.py        |    0
 .../prototype/inductor/fx_passes/README.md    |   35 +
 .../prototype/inductor/fx_passes/__init__.py  |    5 +
 .../inductor/fx_passes/int8_sdpa_fusion.py    |  392 ++++
 9 files changed, 2819 insertions(+), 1 deletion(-)
 create mode 100644 test/prototype/inductor/test_int8_sdpa_fusion.py
 create mode 100644 torchao/csrc/cpu/int8_sdpa.cpp
 create mode 100644 torchao/prototype/inductor/__init__.py
 create mode 100644 torchao/prototype/inductor/fx_passes/README.md
 create mode 100644 torchao/prototype/inductor/fx_passes/__init__.py
 create mode 100644 torchao/prototype/inductor/fx_passes/int8_sdpa_fusion.py

diff --git a/setup.py b/setup.py
index f59917162f..cabaad01cf 100644
--- a/setup.py
+++ b/setup.py
@@ -55,6 +55,10 @@ def read_version(file_path="version.txt"):
     and platform.system() == "Darwin"
 )
 
+use_cpp_kernels = os.getenv("USE_CPP_KERNELS", "0") == "1"
+
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_7
+
 version_prefix = read_version()
 # Version is version.dev year month date if using nightlies and version if not
 version = (
@@ -307,6 +311,21 @@ def get_extensions():
             ["-O3" if not debug_mode else "-O0", "-fdiagnostics-color=always"]
         )
 
+        if (
+            use_cpp_kernels
+            and platform.system() == "Linux"
+            and TORCH_VERSION_AT_LEAST_2_7
+        ):
+            if torch._C._cpu._is_avx512_supported():
+                extra_compile_args["cxx"].extend(
+                    [
+                        "-DCPU_CAPABILITY_AVX512",
+                        "-march=native",
+                        "-mfma",
+                        "-fopenmp",
+                    ]
+                )
+
         if debug_mode:
             extra_compile_args["cxx"].append("-g")
             if "nvcc" in extra_compile_args:
@@ -328,6 +347,12 @@ def get_extensions():
 
     # Collect C++ source files
     sources = list(glob.glob(os.path.join(extensions_dir, "**/*.cpp"), recursive=True))
+    if not use_cpp_kernels or platform.system() != "Linux":
+        # Remove csrc/cpu/*.cpp
+        excluded_sources = list(
+            glob.glob(os.path.join(extensions_dir, "cpu/*.cpp"), recursive=True)
+        )
+        sources = [s for s in sources if s not in excluded_sources]
 
     extensions_cuda_dir = os.path.join(extensions_dir, "cuda")
     cuda_sources = list(
diff --git a/test/prototype/inductor/test_int8_sdpa_fusion.py b/test/prototype/inductor/test_int8_sdpa_fusion.py
new file mode 100644
index 0000000000..c3456fb421
--- /dev/null
+++ b/test/prototype/inductor/test_int8_sdpa_fusion.py
@@ -0,0 +1,223 @@
+import itertools
+import unittest
+
+import torch
+import torch.utils.checkpoint
+from torch._dynamo.utils import counters
+from torch._inductor import config
+from torch._inductor.test_case import TestCase, run_tests
+from torch._inductor.utils import run_and_get_code
+from torch.testing._internal.common_utils import IS_LINUX, skipIfRocm
+from torch.testing._internal.inductor_utils import HAS_CPU
+
+import torchao
+from torchao.prototype.inductor.fx_passes.int8_sdpa_fusion import (
+    _int8_sdpa_init,
+    custom_pass,
+)
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_7
+
+
+class SelfAttnLikeModule(torch.nn.Module):
+    def __init__(
+        self,
+        input_dim,
+        has_mask,
+        num_attention_heads=None,
+        attention_head_size=None,
+    ) -> None:
+        super().__init__()
+        self.input_dim = input_dim
+        self.q_proj = torch.nn.Linear(input_dim, input_dim, bias=False)
+        self.k_proj = torch.nn.Linear(input_dim, input_dim, bias=False)
+        self.v_proj = torch.nn.Linear(input_dim, input_dim, bias=False)
+        self.softmax = torch.nn.Softmax(dim=-1)
+        assert num_attention_heads is not None
+        assert attention_head_size is not None
+        self.num_attention_heads = num_attention_heads
+        self.attention_head_size = attention_head_size
+        self.all_head_size = self.num_attention_heads * self.attention_head_size
+        self.dense = torch.nn.Linear(self.all_head_size, self.all_head_size)
+        self.dropout = torch.nn.Dropout(0)
+        self.has_mask = has_mask
+
+    def transpose_for_scores(self, x: torch.Tensor) -> torch.Tensor:
+        new_x_shape = x.size()[:-1] + (
+            self.num_attention_heads,
+            self.attention_head_size,
+        )
+        x = x.view(new_x_shape)
+        return x.permute([0, 2, 1, 3])
+
+    def forward(self, x, mask):
+        q = self.q_proj(x)
+        k = self.k_proj(x)
+        v = self.v_proj(x)
+        q = self.transpose_for_scores(q)
+        k = self.transpose_for_scores(k)
+        v = self.transpose_for_scores(v)
+        scores = torch.matmul(q, k.transpose(-1, -2)) / (self.input_dim**0.5)
+        if self.has_mask and mask.dtype != scores.dtype:
+            scores = scores + mask
+        attention = self.softmax(scores)
+        attention = self.dropout(attention)
+        context_layer = torch.matmul(attention, v)
+        context_layer = context_layer.permute(0, 2, 1, 3).contiguous()
+        context_layer = context_layer.view(
+            context_layer.size()[:-2] + (self.all_head_size,)
+        )
+        return self.dense(context_layer)
+
+
+class TestSDPAPatternRewriterTemplate(TestCase):
+    def _clone_inputs(self, inputs):
+        def clone(x):
+            if not isinstance(x, torch.Tensor):
+                return x
+            return x.clone()
+
+        return [clone(x) for x in inputs]
+
+    def _check_common(
+        self,
+        dot_prod_attention,
+        args1=None,
+        contains=True,
+        atol=1e-5,
+        has_fuse_pattern=True,
+        has_dropout=False,
+        check_train=True,
+        override_check_equal=False,
+        dtype=torch.float,
+        rtol=1.3e-6,
+    ):
+        if args1 is None:
+            tensor_shape = (4, 2, 16, 32)
+            args1 = [
+                torch.randn(tensor_shape, device=self.device, dtype=dtype),
+                torch.randn(tensor_shape, device=self.device, dtype=dtype),
+                torch.randn(tensor_shape, device=self.device, dtype=dtype),
+            ]
+        else:
+            args1 = list(args1)
+        args2 = self._clone_inputs(args1)
+
+        for training in [False, True] if check_train else [False]:
+            for x in itertools.chain(args1[:], args2[:]):
+                if isinstance(x, torch.Tensor) and x.is_floating_point():
+                    x.requires_grad = training
+
+            dropout_arg = [training] if has_dropout else []
+            torch.manual_seed(1234)
+            result1 = dot_prod_attention(*(args1 + dropout_arg))
+
+            counters.clear()
+            torch.manual_seed(1234)
+            compiled_model = torch.compile(dot_prod_attention, fullgraph=True)
+            result2, source_code = run_and_get_code(
+                compiled_model,
+                *(args2 + dropout_arg),
+            )
+            source_code = "\n".join(source_code)
+            if has_fuse_pattern:
+                self.assertGreaterEqual(counters["inductor"]["int8_fuse_attention"], 1)
+            if contains:
+                # many of the patterns get re-expanded in dispatcher
+                self.assertIn(
+                    "torchao.qscaled_dot_product",
+                    source_code,
+                )
+
+            # some tests configured with very low dropout where we still want to check equality
+            if not has_dropout or override_check_equal:
+                self.assertEqual(result1, result2, atol=atol, rtol=1.3e-6)
+
+            if training:
+                result1.sum().backward()
+                result2.sum().backward()
+                for arg1, arg2 in zip(args1, args2):
+                    if (
+                        isinstance(arg1, torch.Tensor)
+                        and arg1.is_floating_point()
+                        and (not has_dropout or override_check_equal)
+                    ):
+                        self.assertEqual(arg1.grad, arg2.grad, atol=atol, rtol=rtol)
+
+    @skipIfRocm
+    @unittest.skipIf(
+        not TORCH_VERSION_AT_LEAST_2_7, reason="int8 sdpa requires torch 2.7 or later"
+    )
+    @unittest.skipIf(
+        "CPU" not in torch._C._dispatch_dump("torchao::qscaled_dot_product"),
+        reason="cpp kernels not built",
+    )
+    @config.patch({"freezing": True})
+    def _test_sdpa_int8_rewriter(self):
+        from torch.export import export_for_training
+
+        import torchao.quantization.pt2e.quantizer.x86_inductor_quantizer as xiq
+        from torchao.quantization.pt2e.quantize_pt2e import convert_pt2e, prepare_pt2e
+        from torchao.quantization.pt2e.quantizer.x86_inductor_quantizer import (
+            X86InductorQuantizer,
+        )
+
+        # pattern is different for bs=1
+        torch.manual_seed(1234)
+        for dtype, has_mask, bs in itertools.product(
+            [torch.float32, torch.bfloat16], [True, False], [56, 1]
+        ):
+            seqlen, numhead, headsize = 197, 16, 64
+            mod = SelfAttnLikeModule(
+                input_dim=headsize * numhead,
+                has_mask=has_mask,
+                num_attention_heads=numhead,
+                attention_head_size=headsize,
+            ).eval()
+            inputs = (
+                torch.randn(
+                    (bs, seqlen, headsize * numhead), device=self.device, dtype=dtype
+                ),
+                torch.randn((bs, 1, 1, seqlen), device=self.device)
+                if has_mask
+                else None,
+            )
+            enable_autocast = dtype == torch.bfloat16
+            with (
+                torch.no_grad(),
+                torch.amp.autocast(
+                    self.device, enabled=enable_autocast, dtype=torch.bfloat16
+                ),
+                config.patch(post_grad_custom_pre_pass=custom_pass),
+            ):
+                _int8_sdpa_init()
+                quantizer = X86InductorQuantizer()
+                quantizer.set_global(xiq.get_default_x86_inductor_quantization_config())
+                quantizer.set_function_type_qconfig(
+                    torch.matmul, quantizer.get_global_quantization_config()
+                )
+                export_model = export_for_training(
+                    mod,
+                    inputs,
+                    strict=True,
+                ).module()
+                prepare_model = prepare_pt2e(export_model, quantizer)
+                prepare_model(*inputs)
+                convert_model = convert_pt2e(prepare_model)
+                torchao.quantization.pt2e.move_exported_model_to_eval(convert_model)
+                self._check_common(
+                    convert_model, args1=inputs, check_train=False, atol=1.0
+                )
+
+
+if HAS_CPU:
+
+    class SDPAPatternRewriterCpuTests(TestSDPAPatternRewriterTemplate):
+        device = "cpu"
+        test_sdpa_int8_rewriter_cpu = (
+            TestSDPAPatternRewriterTemplate._test_sdpa_int8_rewriter
+        )
+
+
+if __name__ == "__main__":
+    if IS_LINUX:
+        run_tests()
diff --git a/test/test_ops.py b/test/test_ops.py
index 1cdce2cd81..132c4f0c18 100644
--- a/test/test_ops.py
+++ b/test/test_ops.py
@@ -4,11 +4,13 @@
 # This source code is licensed under the BSD 3-Clause license found in the
 # LICENSE file in the root directory of this source tree.
 import itertools
+import math
 import sys
 
 import pytest
 import torch
 from torch.testing._internal.common_utils import (
+    IS_LINUX,
     TestCase,
     instantiate_parametrized_tests,
     parametrize,
@@ -23,7 +25,11 @@
 )
 from torchao.quantization.quant_primitives import choose_qparams_and_quantize_affine_qqq
 from torchao.sparsity.marlin import inject_24, marlin_24_workspace, pack_to_marlin_24
-from torchao.utils import TORCH_VERSION_AT_LEAST_2_5, compute_max_diff
+from torchao.utils import (
+    TORCH_VERSION_AT_LEAST_2_5,
+    TORCH_VERSION_AT_LEAST_2_7,
+    compute_max_diff,
+)
 
 if torch.version.hip is not None:
     pytest.skip("Skipping the test in ROCm", allow_module_level=True)
@@ -109,6 +115,139 @@ def test_quant_llm_linear_correctness(
         rtol = 1e-2 if dtype == torch.bfloat16 else 1e-3
         assert relative_error < rtol
 
+    def _scaled_dot_product_int8_op_ref(
+        self,
+        q,
+        k,
+        v,
+        attn_mask=None,
+        dropout_p=0,
+        is_causal=False,
+        q_scale=1.0,
+        q_zp=0,
+        k_scale=1.0,
+        k_zp=0,
+        v_scale=1.0,
+        v_zp=0,
+        a_scale=1.0,
+        a_zp=0,
+        o_scale=1.0,
+        o_zp=0,
+    ):
+        q = (q.to(torch.float) - q_zp) * q_scale
+        k = (k.to(torch.float) - k_zp) * k_scale
+        v = (v.to(torch.float) - v_zp) * v_scale
+        scale_factor = 1 / math.sqrt(q.size(-1))
+        attn = q @ k.transpose(-2, -1)
+        attn = attn * scale_factor
+        if attn_mask is not None:
+            attn = attn + attn_mask.to(torch.float)
+        attn_max = attn.max(dim=-1, keepdim=True).values
+        attn = attn - attn_max
+        attn = torch.exp(attn)
+        attn_sum = torch.sum(attn, dim=-1, keepdim=True)
+        attn = attn / attn_sum
+        attn = torch.clamp(torch.round(attn / a_scale) + a_zp, min=0, max=255)
+        attn = (attn - a_zp) * a_scale
+        out = attn @ v
+        out = torch.clamp(torch.round(out / o_scale) + o_zp, min=0, max=255)
+        return out.to(torch.uint8)
+
+    @pytest.mark.skipif(
+        not TORCH_VERSION_AT_LEAST_2_7, reason="int8 sdpa requires torch 2.7 or later"
+    )
+    @pytest.mark.skipif(not IS_LINUX, reason="only support on linux")
+    @pytest.mark.skipif(
+        "CPU" not in torch._C._dispatch_dump("torchao::qscaled_dot_product"),
+        reason="cpp kernels not built",
+    )
+    @parametrize("batch_size", [56, 120])
+    @parametrize("n_head", [2, 16])
+    @parametrize("q_seq_len", [18, 89])
+    @parametrize("kv_seq_len", [100, 253])
+    @parametrize("head_dim", [32, 64])
+    @parametrize("mask_dtype", [None, torch.float32, torch.bfloat16])
+    def test_scaled_dot_product_int8_op(
+        self, batch_size, n_head, q_seq_len, kv_seq_len, head_dim, mask_dtype
+    ):
+        torch.manual_seed(1234)
+        device = "cpu"
+        q_scale = float(1.7907238006591797)
+        q_zp = int(127)
+        k_scale = float(1.8039721250534058)
+        k_zp = int(125)
+        v_scale = float(1.839004635810852)
+        v_zp = int(127)
+        a_scale = float(0.003919653594493866)
+        a_zp = int(120)
+        o_scale = float(1.8191684484481812)
+        o_zp = int(128)
+        q_shape = [batch_size, q_seq_len, n_head, head_dim]
+        kv_shape = [batch_size, kv_seq_len, n_head, head_dim]
+        mask_shape = [batch_size, 1, 1, kv_seq_len]
+        q = torch.randn(q_shape, dtype=torch.float, device=device).transpose(1, 2) * 100
+        k = (
+            torch.randn(kv_shape, dtype=torch.float, device=device).transpose(1, 2)
+            * 100
+        )
+        v = (
+            torch.randn(kv_shape, dtype=torch.float, device=device).transpose(1, 2)
+            * 100
+        )
+        q = q.to(torch.uint8)
+        k = k.to(torch.uint8)
+        v = v.to(torch.uint8)
+        attn_mask = (
+            torch.randn(mask_shape, dtype=mask_dtype, device=device)
+            if mask_dtype is not None
+            else None
+        )
+        q2, k2, v2, attn_mask_2 = (
+            q.clone(),
+            k.clone(),
+            v.clone(),
+            attn_mask.clone() if mask_dtype is not None else None,
+        )
+
+        math_ref = self._scaled_dot_product_int8_op_ref(
+            q2,
+            k2,
+            v2,
+            attn_mask=attn_mask,
+            dropout_p=0.0,
+            is_causal=False,
+            q_scale=q_scale,
+            q_zp=q_zp,
+            k_scale=k_scale,
+            k_zp=k_zp,
+            v_scale=v_scale,
+            v_zp=v_zp,
+            a_scale=a_scale,
+            a_zp=a_zp,
+            o_scale=o_scale,
+            o_zp=o_zp,
+        )
+        actual = torch.ops.torchao.qscaled_dot_product(
+            q,
+            k,
+            v,
+            attn_mask=attn_mask_2,
+            dropout_p=0.0,
+            is_causal=False,
+            q_scale=q_scale,
+            q_zp=q_zp,
+            k_scale=k_scale,
+            k_zp=k_zp,
+            v_scale=v_scale,
+            v_zp=v_zp,
+            a_scale=a_scale,
+            a_zp=a_zp,
+            o_scale=o_scale,
+            o_zp=o_zp,
+        )
+
+        self.assertEqual(actual, math_ref, atol=1.0, rtol=5e-6)
+
 
 instantiate_parametrized_tests(TestOps)
 
diff --git a/torchao/csrc/cpu/int8_sdpa.cpp b/torchao/csrc/cpu/int8_sdpa.cpp
new file mode 100644
index 0000000000..a5928f6d9a
--- /dev/null
+++ b/torchao/csrc/cpu/int8_sdpa.cpp
@@ -0,0 +1,1910 @@
+#include <ATen/ATen.h>
+#include <ATen/AccumulateType.h>
+#include <ATen/Dispatch.h>
+#include <ATen/core/Tensor.h>
+#include <ATen/cpu/vec/functional.h>
+#include <ATen/cpu/vec/vec.h>
+#include <ATen/cpu/Utils.h>
+#include <ATen/native/cpu/utils.h>
+#include <ATen/native/CPUBlas.h>
+#include <ATen/Parallel.h>
+#include <ATen/Tensor.h>
+#include <c10/util/irange.h>
+
+#ifndef AT_PER_OPERATOR_HEADERS
+#include <ATen/Functions.h>
+#else
+#include <ATen/ops/empty.h>
+#endif
+
+#include <limits>
+#include <omp.h>
+#include <torch/all.h>
+#include <torch/csrc/autograd/function.h>
+
+namespace torchao {
+
+namespace {
+
+inline c10::SymFloat calculate_scale(
+    const at::Tensor& query,
+    std::optional<double> scale) {
+  const auto softmax_scale = scale.has_value()
+      ? scale.value()
+      : (c10::SymFloat(1.0) / (c10::SymFloat(query.sym_size(-1)).sqrt()));
+  return c10::SymFloat(softmax_scale);
+}
+
+#ifdef CPU_CAPABILITY_AVX512
+
+template <typename scalar_t>
+inline void fill_stub(scalar_t* data, scalar_t val, int64_t size) {
+  const int32_t vec_size = at::vec::Vectorized<scalar_t>::size();
+  auto data_vec = at::vec::Vectorized<scalar_t>(val);
+  int64_t d = 0;
+  for (; d < size - (size % vec_size); d += vec_size) {
+    data_vec.store(data + d);
+  }
+  if (d < size) {
+    data_vec.store(data + d, size - d);
+  }
+}
+
+void reshape_attn_mask_to_4d(
+    at::Tensor& attn_mask,
+    int64_t batchSize,
+    int64_t num_head,
+    int64_t qSize,
+    int64_t kvSize) {
+  // Support mask shapes:
+  // 2d: ({Q_seq_len, 1}  x {KV_seq_len, 1})
+  // 4d: ({Batch, 1} x {Num_heads, 1} x {Q_seq_len, 1}  x {KV_seq_len, 1})
+  // Guaranteed in check_attn_mask_shape
+  int64_t attn_mask_size_0 = 1;
+  int64_t attn_mask_size_1 = 1;
+  if (attn_mask.dim() == 4) {
+    if (attn_mask.size(0) == batchSize) {
+      attn_mask_size_0 = batchSize;
+    }
+    if (attn_mask.size(1) == num_head) {
+      attn_mask_size_1 = num_head;
+    }
+  }
+  attn_mask = attn_mask
+                .view({attn_mask_size_0, attn_mask_size_1, attn_mask.size(-2), attn_mask.size(-1)})
+                .expand({attn_mask_size_0, attn_mask_size_1, qSize, kvSize});
+}
+
+// TODO: Use at::native::_store instead when it supports Half.
+template <typename scalar_t>
+inline void _store(scalar_t* dst, at::vec::Vectorized<scalar_t> src, int size=at::vec::Vectorized<scalar_t>::size()) {
+  src.store(dst, size);
+}
+
+template <typename scalar_t>
+inline typename std::enable_if_t<std::is_same_v<scalar_t, unsigned char> || std::is_same_v<scalar_t, signed char>, void>
+_store(scalar_t* dst, at::vec::Vectorized<float> src, int size=at::vec::Vectorized<float>::size()) {
+  auto res = at::vec::convert<scalar_t>(src);
+  res.store(dst, size);
+}
+
+/*
+1. dequant
+2. add mask
+3. max reduce for softmax
+*/
+template <typename mask_t>
+inline void _dequant_mask_max_fusion_kernel(
+    const int32_t* in,
+    const mask_t* mask_ptr,
+    const int32_t* sum_a_ptr,
+    const int32_t* sum_b_ptr,
+    const int& M,
+    const int& N,
+    const int& ldi,
+    const int& ldm, // leading dimension mask
+    const int& ldo,
+    const int32_t& beta, // zp_a*zp_b*k
+    const float& alpha, // scale_a*scale_b*scale_sdpa
+    float* out,
+    float* sfm_max_ptr) {
+  const int32_t vec_size = at::vec::Vectorized<float>::size();
+  auto vec_beta = at::vec::Vectorized<int32_t>(beta);
+  auto vec_alpha = at::vec::Vectorized<float>(alpha);
+  for (long row = 0; row < M; row += 1) {
+    auto sum_a = sum_a_ptr[row];
+    auto vec_sum_a = at::vec::Vectorized<int32_t>(sum_a);
+    const int32_t* tmp_in = in + row * ldi;
+    float* tmp_out = out + row * ldo;
+    const mask_t* mask_data_ptr = mask_ptr + row * ldm;
+    float tmp_max = -std::numeric_limits<float>::infinity();
+    auto vec_tmp_max = at::vec::Vectorized<float>(tmp_max);
+    long col = 0;
+    for (; col < vec_size * (N / vec_size); col += vec_size) {
+      auto vec_sum_b = at::vec::Vectorized<int32_t>::loadu(sum_b_ptr + col);
+      auto tmp0 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col);
+      auto tmp1 = tmp0 - vec_sum_b;
+      auto tmp2 = tmp1 - vec_sum_a;
+      auto tmp3 = tmp2 + vec_beta;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      auto tmp6 = at::vec::Vectorized<mask_t>::loadu(mask_data_ptr + col);
+      auto tmp7 = at::vec::convert<float>(tmp6);
+      auto tmp8 = tmp5 + tmp7;
+      vec_tmp_max = at::vec::clamp_min(vec_tmp_max, tmp8);
+      _store(tmp_out + col, tmp8);
+    }
+    if (col < N) {
+      auto vec_sum_b = at::vec::Vectorized<int32_t>::loadu(sum_b_ptr + col, N - col);
+      auto tmp0 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col, N - col);
+      auto tmp1 = tmp0 - vec_sum_b;
+      auto tmp2 = tmp1 - vec_sum_a;
+      auto tmp3 = tmp2 + vec_beta;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      auto tmp6 = at::vec::Vectorized<mask_t>::loadu(mask_data_ptr + col, N - col);
+      auto tmp7 = at::vec::convert<float>(tmp6);
+      auto tmp8 = tmp5 + tmp7;
+      _store(tmp_out + col, tmp8, N - col);
+      vec_tmp_max = at::vec::Vectorized<float>::set(vec_tmp_max, at::vec::clamp_min(vec_tmp_max, tmp8), N - col);
+    }
+    sfm_max_ptr[row] = std::max(sfm_max_ptr[row], vec_tmp_max.reduce_max());
+  }
+}
+
+/*
+1. dequant
+2. max reduce for softmax
+*/
+inline void _dequant_max_fusion_kernel(
+    const int32_t* in,
+    const int32_t* sum_a_ptr,
+    const int32_t* sum_b_ptr,
+    const int& M,
+    const int& N,
+    const int& ldi,
+    const int& ldo,
+    const int32_t& beta, // zp_a*zp_b*k
+    const float& alpha, // scale_a*scale_b*scale_sdpa
+    float* out,
+    float* sfm_max_ptr) {
+  const int32_t vec_size = at::vec::Vectorized<float>::size();
+  auto vec_beta = at::vec::Vectorized<int32_t>(beta);
+  auto vec_alpha = at::vec::Vectorized<float>(alpha);
+  for (long row = 0; row < M; row += 1) {
+    auto sum_a = sum_a_ptr[row];
+    auto vec_sum_a = at::vec::Vectorized<int32_t>(sum_a);
+    const int32_t* tmp_in = in + row * ldi;
+    float* tmp_out = out + row * ldo;
+    float tmp_max = -std::numeric_limits<float>::infinity();
+    auto vec_tmp_max = at::vec::Vectorized<float>(tmp_max);
+    long col = 0;
+    for (; col < vec_size * (N / vec_size); col += vec_size) {
+      auto vec_sum_b = at::vec::Vectorized<int32_t>::loadu(sum_b_ptr + col);
+      auto tmp0 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col);
+      auto tmp1 = tmp0 - vec_sum_b;
+      auto tmp2 = tmp1 - vec_sum_a;
+      auto tmp3 = tmp2 + vec_beta;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      vec_tmp_max = at::vec::clamp_min(vec_tmp_max, tmp5);
+      _store(tmp_out + col, tmp5);
+    }
+    if (col < N) {
+      auto vec_sum_b = at::vec::Vectorized<int32_t>::loadu(sum_b_ptr + col, N - col);
+      auto tmp0 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col, N - col);
+      auto tmp1 = tmp0 - vec_sum_b;
+      auto tmp2 = tmp1 - vec_sum_a;
+      auto tmp3 = tmp2 + vec_beta;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      _store(tmp_out + col, tmp5, N - col);
+      vec_tmp_max = at::vec::Vectorized<float>::set(vec_tmp_max, at::vec::clamp_min(vec_tmp_max, tmp5), N - col);
+    }
+    sfm_max_ptr[row] = std::max(sfm_max_ptr[row], vec_tmp_max.reduce_max());
+  }
+}
+
+/*
+1. Softmax: sub max, exp, sum reduce, div sum
+2. quant
+3. sum for attention
+*/
+template <typename scalar_t>
+inline void _sub_exp_sum_div_quant_sum_fusion_kernel(
+    const float* in,
+    const int64_t& M,
+    const int64_t& N_step,
+    const int64_t& NSlice,
+    const int& ldi,
+    const int& ldo,
+    const int& kvSize,
+    const int& rndkvSplitSize,
+    const int& av_gemm_K,
+    const int32_t& beta1, // zp_a
+    const int32_t& beta2, // zp_b
+    const float& alpha, // scale_a
+    float* local,
+    scalar_t* out,
+    float* sfm_max_ptr,
+    float* sfm_sum_ptr,
+    int32_t* sum_a_ptr) {
+  const int32_t vec_size = at::vec::Vectorized<float>::size();
+  float min_val = 0;
+  float max_val = 255;
+  auto vec_min_val = at::vec::Vectorized<float>(min_val);
+  auto vec_max_val = at::vec::Vectorized<float>(max_val);
+  scalar_t zero = 0;
+  auto vec_zero = at::vec::Vectorized<scalar_t>(zero);
+  float beta1_float = (float) beta1;
+  auto vec_beta1 = at::vec::Vectorized<float>(beta1_float);
+  for (int64_t row = 0; row < M; ++row) {
+    auto sfm_max = sfm_max_ptr[row];
+    auto vec_max = at::vec::Vectorized<float>(sfm_max);
+    // sub max, exp, sum reduce
+    const float* qk_block_data = in + row * rndkvSplitSize;
+    for (int64_t l = 0; l < NSlice; l ++) {
+      int64_t n = l * N_step;
+      int64_t kvBlockSize = std::min(N_step, kvSize - n);
+      const float* tmp_in = qk_block_data + l * ldi;
+      float tmp_sum = 0;
+      auto vec_tmp_sum = at::vec::Vectorized<float>(tmp_sum);
+      float* tmp_out = local + n;
+      long col = 0;
+      for (; col < vec_size * (kvBlockSize / vec_size); col += vec_size) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col);
+        auto tmp1 = tmp0 - vec_max;
+        auto tmp2 = tmp1.exp_u20();
+        vec_tmp_sum += tmp2;
+        _store(tmp_out + col, tmp2);
+      }
+      if (col < kvBlockSize) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col, kvBlockSize - col);
+        auto tmp1 = tmp0 - vec_max;
+        auto tmp2 = tmp1.exp_u20();
+        _store(tmp_out + col, tmp2, kvBlockSize - col);
+        vec_tmp_sum = at::vec::Vectorized<float>::set(vec_tmp_sum, vec_tmp_sum + tmp2, kvBlockSize - col);
+      }
+      sfm_sum_ptr[row] += vec_tmp_sum.reduce_add();
+    }
+    // div sum, sum for attention
+    auto sum_scale = 1 / sfm_sum_ptr[row] / alpha;
+    auto vec_sum_scale = at::vec::Vectorized<float>(sum_scale);
+    scalar_t* qk_reduced_block_data = out + row * av_gemm_K;
+    for (int64_t l = 0; l < NSlice; l ++) {
+      int64_t n = l * N_step;
+      int64_t kvBlockSize = std::min(N_step, kvSize - n);
+      int32_t tmp_sum = 0;
+      auto vec_tmp_sum = at::vec::Vectorized<int32_t>(tmp_sum);
+      float* tmp_in = local + n;
+      scalar_t* tmp_out = qk_reduced_block_data + l * ldo;
+      long col = 0;
+      for (; col < vec_size * (kvBlockSize / vec_size); col += vec_size) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col);
+        auto tmp1 = tmp0 * vec_sum_scale;
+        auto tmp2 = tmp1.round();
+        auto tmp3 = tmp2 + vec_beta1;
+        auto tmp4 = at::vec::clamp(tmp3, vec_min_val, vec_max_val);
+        _store(tmp_out + col, tmp4);
+        auto tmp6 = at::vec::convert<int32_t>(tmp4);
+        vec_tmp_sum += tmp6;
+      }
+      if (col < kvBlockSize) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col, kvBlockSize - col);
+        auto tmp1 = tmp0 * vec_sum_scale;
+        auto tmp2 = tmp1.round();
+        auto tmp3 = tmp2 + vec_beta1;
+        auto tmp4 = at::vec::clamp(tmp3, vec_min_val, vec_max_val);
+        _store(tmp_out + col, tmp4, kvBlockSize - col);
+        auto tmp6 = at::vec::convert<int32_t>(tmp4);
+        vec_tmp_sum = at::vec::Vectorized<int32_t>::set(vec_tmp_sum, vec_tmp_sum + tmp6, kvBlockSize - col);
+      }
+      sum_a_ptr[row] += vec_tmp_sum.reduce_add() * beta2;
+      // set zero
+      col = kvBlockSize;
+      for (; col <  vec_size * (av_gemm_K / vec_size); col += vec_size) {
+        _store(tmp_out + col, vec_zero);
+      }
+      if (col < av_gemm_K) {
+        _store(tmp_out + col, vec_zero, av_gemm_K - col);
+      }
+    }
+  }
+}
+
+/*
+1. Softmax: sub max, exp, sum reduce, div sum
+2. quant
+*/
+template <typename scalar_t>
+inline void _sub_exp_sum_div_quant_fusion_kernel(
+    const float* in,
+    const int64_t& M,
+    const int64_t& N_step,
+    const int64_t& NSlice,
+    const int& ldi,
+    const int& ldo,
+    const int& kvSize,
+    const int& rndkvSplitSize,
+    const int& av_gemm_K,
+    const int32_t& beta1, // zp_a
+    const float& alpha, // scale_a
+    float* local,
+    scalar_t* out,
+    float* sfm_max_ptr,
+    float* sfm_sum_ptr) {
+  const int32_t vec_size = at::vec::Vectorized<float>::size();
+  float min_val = 0;
+  float max_val = 255;
+  auto vec_min_val = at::vec::Vectorized<float>(min_val);
+  auto vec_max_val = at::vec::Vectorized<float>(max_val);
+  scalar_t zero = 0;
+  auto vec_zero = at::vec::Vectorized<scalar_t>(zero);
+  float beta1_float = (float) beta1;
+  auto vec_beta1 = at::vec::Vectorized<float>(beta1_float);
+  for (int64_t row = 0; row < M; ++row) {
+    auto sfm_max = sfm_max_ptr[row];
+    auto vec_max = at::vec::Vectorized<float>(sfm_max);
+    // sub max, exp, sum reduce
+    const float* qk_block_data = in + row * rndkvSplitSize;
+    for (int64_t l = 0; l < NSlice; l ++) {
+      int64_t n = l * N_step;
+      int64_t kvBlockSize = std::min(N_step, kvSize - n);
+      const float* tmp_in = qk_block_data + l * ldi;
+      float tmp_sum = 0;
+      auto vec_tmp_sum = at::vec::Vectorized<float>(tmp_sum);
+      float* tmp_out = local + n;
+      long col = 0;
+      for (; col < vec_size * (kvBlockSize / vec_size); col += vec_size) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col);
+        auto tmp1 = tmp0 - vec_max;
+        auto tmp2 = tmp1.exp_u20();
+        vec_tmp_sum += tmp2;
+        _store(tmp_out + col, tmp2);
+      }
+      if (col < kvBlockSize) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col, kvBlockSize - col);
+        auto tmp1 = tmp0 - vec_max;
+        auto tmp2 = tmp1.exp_u20();
+        vec_tmp_sum = at::vec::Vectorized<float>::set(vec_tmp_sum, vec_tmp_sum + tmp2, kvBlockSize - col);
+        _store(tmp_out + col, tmp2, kvBlockSize - col);
+      }
+      sfm_sum_ptr[row] += vec_tmp_sum.reduce_add();
+    }
+    // div sum, sum for attention
+    auto sum_scale = 1 / sfm_sum_ptr[row] / alpha;
+    auto vec_sum_scale = at::vec::Vectorized<float>(sum_scale);
+    scalar_t* qk_reduced_block_data = out + row * av_gemm_K;
+    for (int64_t l = 0; l < NSlice; l ++) {
+      int64_t n = l * N_step;
+      int64_t kvBlockSize = std::min(N_step, kvSize - n);
+      float* tmp_in = local + n;
+      scalar_t* tmp_out = qk_reduced_block_data + l * ldo;
+      long col = 0;
+      for (; col < vec_size * (kvBlockSize / vec_size); col += vec_size) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col);
+        auto tmp1 = tmp0 * vec_sum_scale;
+        auto tmp2 = tmp1.round();
+        auto tmp3 = tmp2 + vec_beta1;
+        auto tmp4 = at::vec::clamp(tmp3, vec_min_val, vec_max_val);
+        _store(tmp_out + col, tmp4);
+      }
+      if (col < kvBlockSize) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col, kvBlockSize - col);
+        auto tmp1 = tmp0 * vec_sum_scale;
+        auto tmp2 = tmp1.round();
+        auto tmp3 = tmp2 + vec_beta1;
+        auto tmp4 = at::vec::clamp(tmp3, vec_min_val, vec_max_val);
+        _store(tmp_out + col, tmp4, kvBlockSize - col);
+      }
+      // set zero
+      col = kvBlockSize;
+      for (; col < vec_size * (av_gemm_K / vec_size); col += vec_size) {
+        _store(tmp_out + col, vec_zero);
+      }
+      if (col < av_gemm_K) {
+        _store(tmp_out + col, vec_zero, av_gemm_K - col);
+      }
+    }
+  }
+}
+
+/*
+1. dequant
+2. quant
+*/
+template <typename scalar_t>
+inline void _dequant_quant_fusion_kernel(
+    const int32_t* in,
+    const int32_t* sum_a_ptr,
+    const int32_t* sum_b_ptr,
+    const int& M,
+    const int& N,
+    const int& ldi,
+    const int& ldo,
+    const int32_t& beta1, // zp_a*zp_b*k
+    const int32_t& beta2, // zp_c
+    const float& alpha, // scale_a*scale_b/scale_c
+    scalar_t* out) {
+  const int32_t vec_size = at::vec::Vectorized<float>::size();
+  float min_val = 0;
+  float max_val = 255;
+  auto vec_min_val = at::vec::Vectorized<float>(min_val);
+  auto vec_max_val = at::vec::Vectorized<float>(max_val);
+  auto vec_beta1 = at::vec::Vectorized<int32_t>(beta1);
+  auto vec_alpha = at::vec::Vectorized<float>(alpha);
+  float beta2_float = (float) beta2;
+  auto vec_beta2 = at::vec::Vectorized<float>(beta2_float);
+  for (long row = 0; row < M; row += 1) {
+    auto sum_a = sum_a_ptr[row];
+    auto vec_sum_a = at::vec::Vectorized<int32_t>(sum_a);
+    const int32_t* tmp_in = in + row * ldi;
+    scalar_t* tmp_out = out + row * ldo;
+    long col = 0;
+    for (; col < vec_size * (N / vec_size); col += vec_size) {
+      auto vec_sum_b = at::vec::Vectorized<int32_t>::loadu(sum_b_ptr + col);
+      auto tmp0 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col);
+      auto tmp1 = tmp0 - vec_sum_b;
+      auto tmp2 = tmp1 - vec_sum_a;
+      auto tmp3 = tmp2 + vec_beta1;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      auto tmp6 = tmp5.round();
+      auto tmp7 = tmp6 + vec_beta2;
+      auto tmp8 = at::vec::clamp(tmp7, vec_min_val, vec_max_val);
+      _store(tmp_out + col, tmp8);
+    }
+    if (col < N) {
+      auto vec_sum_b = at::vec::Vectorized<int32_t>::loadu(sum_b_ptr + col, N - col);
+      auto tmp0 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col, N - col);
+      auto tmp1 = tmp0 - vec_sum_b;
+      auto tmp2 = tmp1 - vec_sum_a;
+      auto tmp3 = tmp2 + vec_beta1;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      auto tmp6 = tmp5.round();
+      auto tmp7 = tmp6 + vec_beta2;
+      auto tmp8 = at::vec::clamp(tmp7, vec_min_val, vec_max_val);
+      _store(tmp_out + col, tmp8, N - col);
+    }
+  }
+}
+
+/*
+1. dequant
+2. quant
+*/
+template <typename scalar_t>
+inline void _dequant_quant_fusion_kernel(
+    const int32_t* in,
+    const int32_t* sum_a_ptr,
+    const int& M,
+    const int& N,
+    const int& ldi,
+    const int& ldo,
+    const int32_t& beta2, // zp_c
+    const float& alpha, // scale_a*scale_b/scale_c
+    scalar_t* out) {
+  const int32_t vec_size = at::vec::Vectorized<float>::size();
+  float min_val = 0;
+  float max_val = 255;
+  auto vec_min_val = at::vec::Vectorized<float>(min_val);
+  auto vec_max_val = at::vec::Vectorized<float>(max_val);
+  // auto vec_beta1 = at::vec::Vectorized<int32_t>(beta1);
+  auto vec_alpha = at::vec::Vectorized<float>(alpha);
+  float beta2_float = (float) beta2;
+  auto vec_beta2 = at::vec::Vectorized<float>(beta2_float);
+  for (long row = 0; row < M; row += 1) {
+    auto sum_a = sum_a_ptr[row];
+    auto vec_sum_a = at::vec::Vectorized<int32_t>(sum_a);
+    const int32_t* tmp_in = in + row * ldi;
+    scalar_t* tmp_out = out + row * ldo;
+    long col = 0;
+    for (; col < vec_size * (N / vec_size); col += vec_size) {
+      auto tmp1 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col);
+      auto tmp3 = tmp1 - vec_sum_a;
+      // auto tmp3 = tmp2 + vec_beta1;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      auto tmp6 = tmp5.round();
+      auto tmp7 = tmp6 + vec_beta2;
+      auto tmp8 = at::vec::clamp(tmp7, vec_min_val, vec_max_val);
+      _store(tmp_out + col, tmp8);
+    }
+    if (col < N) {
+      auto tmp1 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col, N - col);
+      auto tmp3 = tmp1 - vec_sum_a;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      auto tmp6 = tmp5.round();
+      auto tmp7 = tmp6 + vec_beta2;
+      auto tmp8 = at::vec::clamp(tmp7, vec_min_val, vec_max_val);
+      _store(tmp_out + col, tmp8, N - col);
+    }
+  }
+}
+
+template <typename scalar_t>
+inline void _int_sum_b_contiguous_kernel_helper(
+    const scalar_t* in,
+    int32_t* out,
+    const int& N,
+    const int32_t& scale) {
+  const int32_t vec_size = at::vec::Vectorized<int32_t>::size();
+  int32_t tmp_sum = 0;
+  auto vec_tmp_sum = at::vec::Vectorized<int32_t>(tmp_sum);
+  long i = 0;
+  for (; i < vec_size * (N / vec_size); i += vec_size) {
+    auto tmp0 = at::vec::Vectorized<scalar_t>::loadu(in + i);
+    auto tmp1 = at::vec::convert<int32_t>(tmp0);
+    vec_tmp_sum = vec_tmp_sum + tmp1;
+  }
+  if (i < N) {
+    auto tmp0 = at::vec::Vectorized<scalar_t>::loadu(in + i, N - i);
+    auto tmp1 = at::vec::convert<int32_t>(tmp0);
+    vec_tmp_sum = at::vec::Vectorized<int32_t>::set(vec_tmp_sum, vec_tmp_sum + tmp1, N - i);
+  }
+  out[0] = vec_tmp_sum.reduce_add() * scale;
+}
+
+// reduce along dim b for shape [a, b], with sum shape [a]
+template <typename scalar_t>
+inline void _int_sum_b_contiguous_kernel(
+    const scalar_t* in,
+    int32_t* out,
+    const int& M,
+    const int& N,
+    const int& ld,
+    const int32_t& scale) {
+  for (long r = 0; r < M; r += 1) {
+    _int_sum_b_contiguous_kernel_helper(in + r * ld, out + r, N, scale);
+  }
+}
+
+// reduce along dim a for shape [a, b], with sum shape [b]
+template <typename scalar_t>
+inline void _int_sum_a_contiguous_kernel(
+    const scalar_t* in,
+    int32_t* out,
+    const int& M,
+    const int& N,
+    const int& ld,
+    const int32_t& scale) {
+  const int32_t vec_size = at::vec::Vectorized<int32_t>::size();
+  auto vec_scale = at::vec::Vectorized<int32_t>(scale);
+  // initialization with 0
+  int32_t zero = 0;
+  auto vec_zero = at::vec::Vectorized<int32_t>(zero);
+  long i = 0;
+  for (; i < vec_size * (M / vec_size); i += vec_size) {
+    _store(out + i, vec_zero);
+  }
+  if (i < M) {
+    _store(out + i, vec_zero, M - i);
+  }
+  // sum
+  for (long j = 0; j < N; j++) {
+    const scalar_t* tmp_in = in + j * ld;
+    long k = 0;
+    for (; k < vec_size * (M / vec_size); k += vec_size) {
+      auto tmp0 = at::vec::Vectorized<scalar_t>::loadu(tmp_in + k);
+      auto tmp1 = at::vec::Vectorized<int32_t>::loadu(out + k);
+      auto tmp2 = at::vec::convert<int32_t>(tmp0);
+      auto tmp3 = tmp1 + tmp2;
+      _store(out + k, tmp3);
+    }
+    if (k < M) {
+      auto tmp0 = at::vec::Vectorized<scalar_t>::loadu(tmp_in + k, M - k);
+      auto tmp1 = at::vec::Vectorized<int32_t>::loadu(out + k, M - k);
+      auto tmp2 = at::vec::convert<int32_t>(tmp0);
+      auto tmp3 = tmp1 + tmp2;
+      _store(out + k, tmp3, M - k);
+    }
+  }
+  // scale
+  i = 0;
+  for (; i < vec_size * (M / vec_size); i += vec_size) {
+    auto tmp0 = at::vec::Vectorized<int32_t>::loadu(out + i);
+    auto tmp1 = tmp0 * vec_scale;
+    _store(out + i, tmp1);
+  }
+  if (i < M) {
+    auto tmp0 = at::vec::Vectorized<int32_t>::loadu(out + i, M - i);
+    auto tmp1 = tmp0 * vec_scale;
+    _store(out + i, tmp1, M - i);
+  }
+}
+
+// do the transpose: [in_rows, in_cols] -> [in_cols, in_rows]
+template <typename scalar_t>
+inline void do_transpose(
+    scalar_t* src,
+    scalar_t* dst,
+    int64_t in_rows,
+    int64_t in_cols,
+    int64_t ldi,
+    int64_t ldo) {
+  for (int64_t r=0; r<in_rows; r++) {
+    for (int64_t c=0; c<in_cols; c++) {
+      *(dst + c * ldo + r) = *(src + r * ldi + c);
+    }
+  }
+}
+
+// padding with pad_val: [rows, cols] -> [prows, pcols]
+template <typename scalar_t>
+inline void pad_remain_row_col(
+    scalar_t* value_ptr,
+    int rows,
+    int cols,
+    int prows,
+    int pcols,
+    int ldi,
+    scalar_t pad_val=0) {
+  auto psize = pcols - cols;
+  if (psize == 0 && prows == rows) {
+    return;
+  }
+  const int32_t vec_size = at::vec::Vectorized<scalar_t>::size();
+  auto pad = at::vec::Vectorized<scalar_t>(pad_val);
+  if (psize > 0) {
+    for (int i = 0; i < rows; i++) {
+      int j = 0;
+      for (; j < psize - (psize % vec_size); j += vec_size) {
+        pad.store(value_ptr + i * ldi + cols + j);
+      }
+      if (j < psize) {
+        pad.store(value_ptr + i * ldi + cols + j, psize - j);
+      }
+    }
+  }
+
+  for (int i = rows; i < prows; i++) {
+    int j = 0;
+    for (; j < pcols - (pcols % vec_size); j += vec_size) {
+      pad.store(value_ptr + i * ldi + j);
+    }
+    if (j < pcols) {
+      pad.store(value_ptr + i * ldi + j, pcols - j);
+    }
+  }
+}
+
+// copy value_ptr to dst_ptr with padding: [rows, cols] -> [prows, pcols]
+template <typename scalar_t>
+inline void copy_value_with_pad(
+    scalar_t* value_ptr,
+    scalar_t* dst_ptr,
+    int rows,
+    int cols,
+    int prows,
+    int pcols,
+    int ldi,
+    scalar_t pad_val=0) {
+  const int32_t vec_size = at::vec::Vectorized<scalar_t>::size();
+  auto pad = at::vec::Vectorized<scalar_t>(pad_val);
+  int i = 0;
+  for (; i < rows; i++) {
+    int j = 0;
+    for (; j < cols - (cols % vec_size); j += vec_size) {
+      auto vec_v =
+          at::vec::Vectorized<scalar_t>::loadu(value_ptr + i * ldi + j);
+      vec_v.store(dst_ptr + i * pcols + j);
+    }
+
+    if (j < cols) {
+      auto vec_v = at::vec::Vectorized<scalar_t>::loadu(
+          value_ptr + i * ldi + j, cols - j);
+      vec_v.store(dst_ptr + i * pcols + j, cols - j);
+    }
+
+    // col padding
+    auto psize = pcols - cols;
+    if (psize > 0) {
+      int pj = 0;
+      for (; pj < psize - (psize % vec_size); pj += vec_size) {
+        pad.store(dst_ptr + i * pcols + cols + pj);
+      }
+      if (pj < psize) {
+        pad.store(dst_ptr + i * pcols + cols + pj, psize - pj);
+      }
+    }
+  }
+
+  // row padding
+  for (; i < prows; i++) {
+    int j = 0;
+    for (; j < pcols - (pcols % vec_size); j += vec_size) {
+      pad.store(dst_ptr + i * pcols + j);
+    }
+    if (j < pcols) {
+      pad.store(dst_ptr + i * pcols + j, pcols - j);
+    }
+
+  }
+
+}
+
+// UINT8 - one parallel loop with u8u8s32 GEMM 
+template <typename scalar_t, typename mask_t,
+          int64_t q_split_size, int64_t kv_split_size,
+          bool use_one_parallel_loop,
+          typename std::enable_if_t<use_one_parallel_loop, int> = 0>
+inline typename std::enable_if_t<std::is_same_v<scalar_t, unsigned char>, void>
+sdpa_int8_fused_kernel_impl(
+    const at::Tensor& output,
+    const at::Tensor& q,
+    const at::Tensor& k,
+    const at::Tensor& v,
+    double dropout_p,
+    bool is_causal,
+    std::optional<at::Tensor> attention_mask,
+    std::optional<double> scale,
+    float q_scale,
+    int32_t q_zp,
+    float k_scale,
+    int32_t k_zp,
+    float v_scale,
+    int32_t v_zp,
+    float a_scale,
+    int32_t a_zp,
+    float o_scale,
+    int32_t o_zp) {
+  // Query (Batch x Num_heads  x Q_seq_len  x Dim_per_head)
+  //    -> (Batch x Q_seq_len  x Num_heads  x Dim_per_head)
+  // Key   (Batch x Num_heads  x KV_seq_len x Dim_per_head)
+  //    -> (Batch x KV_seq_len x Num_heads  x Dim_per_head)
+  // Value (Batch x Num_heads  x KV_seq_len x Dim_per_head)
+  //    -> (Batch x KV_seq_len x Num_heads  x Dim_per_head)
+  at::Tensor query = q.transpose(1, 2);
+  at::Tensor key = k.transpose(1, 2);
+  at::Tensor value = v.transpose(1, 2);
+
+  using accum_t = float;
+  accum_t scaling_factor = calculate_scale(query, scale).expect_float();
+  int block_64 = 64;
+  auto u8_dt = at::ScalarType::Byte;
+
+  // Sizes
+  TORCH_CHECK(
+      (query.size(3) == value.size(3)) && (key.size(3) == value.size(3)),
+      "scaled_dot_product_attention_sdpa: Q/K/V should have the same head size");
+  TORCH_CHECK(
+      kv_split_size % block_64 == 0, "kv_split_size is not divisble by ", block_64);
+
+  int64_t batchSize = query.size(0);
+  int64_t qSize = query.size(1);
+  int64_t kvSize = value.size(1);
+  int64_t num_head = query.size(2);
+  int64_t headSize = query.size(3);
+
+  bool has_attn_mask = attention_mask.has_value() && attention_mask.value().numel();
+  if (has_attn_mask) {
+    reshape_attn_mask_to_4d(attention_mask.value(), batchSize, num_head, qSize, kvSize);
+  }
+
+  // Strides
+  int64_t qStrideB = query.stride(0);
+  int64_t qStrideM = query.stride(1);
+  int64_t qStrideH = query.stride(2);
+  int64_t kStrideB = key.stride(0);
+  int64_t kStrideN = key.stride(1);
+  int64_t kStrideH = key.stride(2);
+  int64_t vStrideB = value.stride(0);
+  int64_t vStrideN = value.stride(1);
+  int64_t vStrideH = value.stride(2);
+  int64_t oStrideB = output.stride(0);
+  int64_t oStrideM = output.stride(1);
+  int64_t oStrideH = output.stride(2);
+  int64_t mStrideB =
+      (has_attn_mask && attention_mask.value().size(0) > 1)
+      ? attention_mask.value().stride(0)
+      : 0;
+  int64_t mStrideH =
+      (has_attn_mask && attention_mask.value().size(1) > 1)
+      ? attention_mask.value().stride(1)
+      : 0;
+  int64_t mStrideM =
+      (has_attn_mask && attention_mask.value().size(2) > 1)
+      ? attention_mask.value().stride(2)
+      : 0;
+  int64_t mStrideN =
+      (has_attn_mask && attention_mask.value().size(3) > 1)
+      ? attention_mask.value().stride(3)
+      : 0;
+
+  int64_t qSplitSize = q_split_size > qSize ? qSize : q_split_size;
+  int64_t kvSplitSize = kv_split_size > kvSize ? kvSize : kv_split_size;
+  int64_t qSlice = (qSize - 1) / qSplitSize + 1;
+  int64_t kvSlice = (kvSize - 1) / kvSplitSize + 1;
+  int64_t kvTail = (kvSize - 1) % kvSplitSize + 1;
+  int64_t num_thread = at::get_num_threads();
+
+  int64_t rndHeadSize = (headSize + block_64 - 1L) / block_64 * block_64;
+  int64_t rndkvSplitSize = (kvSplitSize + block_64 - 1L) / block_64 * block_64;
+  int64_t rndkvTail = (kvTail + block_64 - 1L) / block_64 * block_64;
+  int64_t rndkvSize = kv_split_size > kvSize ? rndkvTail : rndkvSplitSize * kvSlice + rndkvTail;
+
+  bool av_gemm_K_mul4 = kvSplitSize % 4 == 0;
+  int av_gemm_K_padding = av_gemm_K_mul4 ? 0 : 4 - kvSplitSize % 4;
+  int av_gemm_K = kvSplitSize + av_gemm_K_padding;
+
+  // Data ptrs
+  scalar_t* q_data = query.data_ptr<scalar_t>();
+  scalar_t* k_data = key.data_ptr<scalar_t>();
+  scalar_t* v_data = value.data_ptr<scalar_t>();
+  mask_t* mask_data = attention_mask.has_value()
+      ? attention_mask.value().data_ptr<mask_t>()
+      : nullptr;
+  scalar_t* out_data = output.data_ptr<scalar_t>();
+
+  bool headSize_mul64 = headSize % 64 == 0;
+  int qk_gemm_K_padding = headSize_mul64 ? 0 : 64 - headSize % 64;
+  int qk_gemm_K = headSize + qk_gemm_K_padding;
+
+  int64_t qk_reduce_strideL = qSplitSize * av_gemm_K;
+  int64_t v_reorder_strideL = av_gemm_K * rndHeadSize;
+
+  int64_t total_size_uint8_per_thread =
+    /* qk */ kvSlice * qSplitSize * rndkvSplitSize * 4 +
+    /* qk_local  */ kvSlice * av_gemm_K * 4 +
+    /* qk_reduce  */ kvSlice * qk_reduce_strideL +
+    /* qk_s32   */ qSplitSize * rndkvSplitSize * 4 +
+    /* dst_s32  */ qSplitSize * rndHeadSize * 4 +
+    /* softmax_sum   */ qSplitSize * 4 +
+    /* query_sum     */ qSplitSize * 4 +
+    /* attention_sum */ qSplitSize * 4 +
+    /* softmax max */ qSplitSize * 4 +
+    /* query_padding_data */ qSplitSize * qk_gemm_K +
+    /* key_sum */ kvSize * 4 +
+    /* value_sum */ headSize * 4 +
+    /* key_t_reorder */ qk_gemm_K * rndkvSize +
+    /* value_t_reorder */ kvSlice * v_reorder_strideL;
+
+  at::Tensor total_buf = at::empty(
+      {num_thread, total_size_uint8_per_thread},
+      query.options());
+  scalar_t* total_buf_data = total_buf.data_ptr<scalar_t>();
+
+  at::parallel_for(
+      0, batchSize * num_head, 1, [&](int64_t begin, int64_t end) {
+        int64_t i = 0, j = 0;
+        at::native::data_index_init(
+            begin, i, batchSize, j, num_head);
+        int ompIdx = at::get_thread_num();
+        scalar_t* total_buf_ptr = total_buf_data + ompIdx * total_size_uint8_per_thread;
+        int32_t offset = 0;
+        accum_t* qk_data = reinterpret_cast<accum_t*>(total_buf_ptr);
+        offset += kvSlice * qSplitSize * rndkvSplitSize * 4;
+        accum_t* qk_local_data = reinterpret_cast<accum_t*>(total_buf_ptr + offset);
+        offset += kvSlice * av_gemm_K * 4;
+        scalar_t* qk_reduced_data = reinterpret_cast<scalar_t*>(total_buf_ptr + offset);
+        offset += kvSlice * qk_reduce_strideL;
+        int32_t* qk_s32_data = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * rndkvSplitSize * 4;
+        int32_t* dst_s32_data = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * rndHeadSize * 4;
+        accum_t* sfm_sum_ptr = reinterpret_cast<accum_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        int32_t* q_sum_ptr = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        int32_t* a_sum_ptr = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        accum_t* sfm_max_ptr = reinterpret_cast<accum_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        scalar_t* query_t_padding_ptr = reinterpret_cast<scalar_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * qk_gemm_K;
+
+        int32_t* k_sum_ptr = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += kvSize * 4;
+        int32_t* v_sum_ptr = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += headSize * 4;
+        scalar_t* key_reorder_ptr = reinterpret_cast<scalar_t*>(total_buf_ptr + offset);
+        offset += qk_gemm_K * rndkvSize;
+        scalar_t* value_reorder_ptr = reinterpret_cast<scalar_t*>(total_buf_ptr + offset);
+
+        uint8_t* B_blocked_xform_u8 = new uint8_t[qk_gemm_K * block_64];
+
+        for (const auto z : c10::irange(begin, end)) {
+          (void)z; // Suppress unused variable
+
+          // sum k and v
+          if (q_zp == 0) {
+            fill_stub(k_sum_ptr, static_cast<int32_t>(0), kvSize);
+          } else {
+            _int_sum_b_contiguous_kernel(k_data + i * kStrideB + j * kStrideH,
+              k_sum_ptr,
+              kvSize, headSize, kStrideN, q_zp);
+          }
+          if (a_zp == 0) {
+            fill_stub(v_sum_ptr, static_cast<int32_t>(0), headSize);
+          } else {
+            _int_sum_a_contiguous_kernel(v_data + i * vStrideB + j * vStrideH,
+              v_sum_ptr,
+              headSize, kvSize, vStrideN, a_zp);
+          }
+
+          // transpose and packing
+          for (int64_t n = 0; n < kvSize; n += kvSplitSize) {
+            int64_t kvBlockSize = std::min(kvSplitSize, kvSize - n);
+            for (int64_t b = 0; b < kvBlockSize; b += block_64) {
+              bool istail = kvBlockSize - b < block_64;
+              int64_t trans_rows = istail ? kvBlockSize - b : block_64;
+              do_transpose(
+                  k_data + i * kStrideB + j * kStrideH + n * kStrideN + b * kStrideN,
+                  B_blocked_xform_u8,
+                  trans_rows,
+                  headSize,
+                  kStrideN,
+                  block_64);
+              if (!headSize_mul64 || istail) {
+                pad_remain_row_col(
+                    B_blocked_xform_u8,
+                    headSize,
+                    trans_rows,
+                    qk_gemm_K,
+                    block_64,
+                    block_64
+                  );
+              }
+              at::native::cpublas::pack(
+                      qk_gemm_K, // K
+                      block_64, // N
+                      block_64, // ld_in
+                      block_64, // ld_out
+                      u8_dt, // dt_in
+                      u8_dt, // dt_out
+                      B_blocked_xform_u8,
+                      key_reorder_ptr + n * qk_gemm_K +
+                          b * qk_gemm_K);
+            }
+            // split headSize to block_64, block_64, block_64 ...
+            // [av_gemm_K, headSize] -> [av_gemm_K,  block_64 ...]
+            for (int64_t b = 0; b < rndHeadSize; b += block_64) {
+              at::native::cpublas::pack(
+                      av_gemm_K,
+                      block_64,
+                      vStrideN,
+                      block_64,
+                      u8_dt,
+                      u8_dt,
+                      v_data + i * vStrideB + j * vStrideH + n * vStrideN + b,
+                      value_reorder_ptr + n * rndHeadSize +
+                          av_gemm_K * b);
+            }
+          }
+
+          // sdpa core
+          for (int64_t k = 0; k < qSlice; k++) {
+            int64_t m = k * qSplitSize;
+            int64_t qBlockSize = std::min(qSplitSize, qSize - m);
+            // Initialize sum and max
+            fill_stub(
+                sfm_sum_ptr, static_cast<accum_t>(0), qSplitSize);
+            fill_stub(
+                a_sum_ptr, static_cast<int32_t>(0), qSplitSize);
+            fill_stub(
+                sfm_max_ptr, static_cast<accum_t>(-std::numeric_limits<accum_t>::infinity()), qSplitSize);
+            int64_t num_keys =
+                is_causal ? std::min(m + qBlockSize, kvSize) : kvSize;
+            copy_value_with_pad(
+                q_data + i * qStrideB + j * qStrideH + m * qStrideM,
+                query_t_padding_ptr,
+                qBlockSize,
+                headSize,
+                qBlockSize,
+                qk_gemm_K,
+                qStrideM);
+            // sum q
+            if (k_zp != 0) {
+              _int_sum_b_contiguous_kernel(q_data + i * qStrideB + j * qStrideH + m * qStrideM,
+                    q_sum_ptr, qBlockSize, headSize, qStrideM, k_zp);
+            } else {
+              fill_stub(
+                q_sum_ptr, static_cast<int32_t>(0), qSplitSize);
+            }
+            const int64_t rkvSlice = (num_keys - 1) / kvSplitSize + 1;
+            for (int64_t l = 0; l < rkvSlice; l++) {
+              int64_t n = l * kvSplitSize;
+              int64_t kvBlockSize = std::min(kvSplitSize, kvSize - n);
+              // Calculate q @ k.T
+              for (int64_t b = 0; b < kvBlockSize; b += block_64) {
+                at::native::cpublas::brgemm(
+                      qSplitSize, block_64, qk_gemm_K,
+                      qk_gemm_K, // lda
+                      block_64, //ldb
+                      rndkvSplitSize, //ldc,
+                      false,
+                      query_t_padding_ptr,
+                      key_reorder_ptr + n * qk_gemm_K +
+                          b * qk_gemm_K,
+                      qk_s32_data + b);
+              }
+
+              // do dequant compensation, add mask, max reduce for softmax, and convert qk from s32 to fp32
+              accum_t* qk_block_data = qk_data + l * qSplitSize * rndkvSplitSize;
+              if (has_attn_mask) {
+                mask_t* mask_data_offset = mask_data + i * mStrideB + j * mStrideH + m * mStrideM + (mStrideN == 0 ? 0 : n);
+                _dequant_mask_max_fusion_kernel(
+                  qk_s32_data, //in
+                  mask_data_offset, //mask_ptr
+                  q_sum_ptr, //sum_a_ptr
+                  k_sum_ptr + n, //sum_b_ptr
+                  qBlockSize, //M
+                  kvBlockSize, //N
+                  rndkvSplitSize, //ldi
+                  mStrideM, //ldm
+                  rndkvSplitSize, //ldo
+                  q_zp * k_zp * headSize, //zp_a*zp_b*k=beta
+                  q_scale * k_scale * scaling_factor, //scale_a*scale_b*scale_sdpa=alpha
+                  qk_block_data, //out
+                  sfm_max_ptr // sfm_max_ptr
+                );
+              } else {
+                _dequant_max_fusion_kernel(
+                  qk_s32_data, //in
+                  q_sum_ptr, //sum_a_ptr
+                  k_sum_ptr + n, //sum_b_ptr
+                  qBlockSize, //M
+                  kvBlockSize, //N
+                  rndkvSplitSize, //ldi
+                  rndkvSplitSize, //ldo
+                  q_zp * k_zp * headSize, //zp_a*zp_b*k=beta
+                  q_scale * k_scale * scaling_factor, //scale_a*scale_b*scale_sdpa=alpha
+                  qk_block_data, //out
+                  sfm_max_ptr // sfm_max_ptr
+                );
+              }
+            }
+            // sub max, exp, sum reduce, div sum for softmax
+            // and quant
+            // and sum for attention
+            if (v_zp == 0) {
+              _sub_exp_sum_div_quant_fusion_kernel(
+                qk_data, //in
+                qBlockSize, //M
+                kvSplitSize, //N_step
+                rkvSlice, //NSlices
+                qSplitSize * rndkvSplitSize, //ldi
+                qk_reduce_strideL, //ldo
+                kvSize, //kvSize
+                rndkvSplitSize, //rndkvSplitSize
+                av_gemm_K, //av_gemm_K
+                a_zp, // zp_a=beta1
+                a_scale, // scale_a=alpha
+                qk_local_data, //local
+                qk_reduced_data, //out
+                sfm_max_ptr, //sfm_max_ptr
+                sfm_sum_ptr //sfm_sum_ptr
+              );
+            } else {
+              _sub_exp_sum_div_quant_sum_fusion_kernel(
+                qk_data, //in
+                qBlockSize, //M
+                kvSplitSize, //N_step
+                rkvSlice, //NSlice
+                qSplitSize * rndkvSplitSize, //ldi
+                qk_reduce_strideL, //ldo
+                kvSize, //kvSize
+                rndkvSplitSize, //rndkvSplitSize
+                av_gemm_K, //av_gemm_K
+                a_zp, // zp_a=beta1
+                v_zp, // zp_b=beta2
+                a_scale, // scale_a=alpha
+                qk_local_data, //local
+                qk_reduced_data, //out
+                sfm_max_ptr, //sfm_max_ptr
+                sfm_sum_ptr, //sfm_sum_ptr
+                a_sum_ptr //a_sum_ptr
+              );
+            }
+            // Calculate Softmax(q @ k.T) @ v
+            for (int64_t b = 0; b < headSize; b += block_64) {
+              auto value_reorder_b = value_reorder_ptr + b * av_gemm_K;
+              auto dst_s32_b = dst_s32_data + b;
+              for (int64_t s = 0; s < kvSlice; s++) {
+                at::native::cpublas::brgemm(
+                    qSplitSize, block_64, av_gemm_K,
+                    av_gemm_K, // lda
+                    rndHeadSize, //ldb
+                    rndHeadSize, //ldc
+                    s != 0,
+                    qk_reduced_data + s * qk_reduce_strideL,
+                    value_reorder_b + s * v_reorder_strideL,
+                    dst_s32_b);
+              }
+            }
+
+            // After the last gemm,
+            // do dequant compensation, quant and convert from s32 to int8
+            if (a_zp == 0) {
+              _dequant_quant_fusion_kernel(
+                dst_s32_data, //in
+                a_sum_ptr, //sum_a_ptr
+                qBlockSize, //M
+                headSize, //N
+                rndHeadSize, //ldi
+                oStrideM, //ldo
+                o_zp, //zp_c=beta2
+                a_scale * v_scale / o_scale, //scale_a*scale_b/scale_c=alpha
+                out_data + i * oStrideB + j * oStrideH + m * oStrideM //out
+              );
+            } else {
+              _dequant_quant_fusion_kernel(
+                dst_s32_data, //in
+                a_sum_ptr, //sum_a_ptr
+                v_sum_ptr, //sum_b_ptr
+                qBlockSize, //M
+                headSize, //N
+                rndHeadSize, //ldi
+                oStrideM, //ldo
+                a_zp * v_zp * kvSize, //zp_a*zp_b*k=beta1
+                o_zp, //zp_c=beta2
+                a_scale * v_scale / o_scale, //scale_a*scale_b/scale_c=alpha
+                out_data + i * oStrideB + j * oStrideH + m * oStrideM //out
+              );
+            }
+          }
+          // Move to the next query
+          at::native::data_index_step(i, batchSize, j, num_head);
+        }
+      });
+  // Once all computations are done, need to release HW context.
+  at::native::cpublas::brgemm_release();
+}
+
+// UINT8 - several parallel loops with u8u8s32 GEMM
+template <typename scalar_t, typename mask_t,
+          int64_t q_split_size, int64_t kv_split_size,
+          bool use_one_parallel_loop,
+          typename std::enable_if_t<!use_one_parallel_loop, int> = 0>
+inline typename std::enable_if_t<std::is_same_v<scalar_t, unsigned char>, void>
+sdpa_int8_fused_kernel_impl(
+    const at::Tensor& output,
+    const at::Tensor& q,
+    const at::Tensor& k,
+    const at::Tensor& v,
+    double dropout_p,
+    bool is_causal,
+    std::optional<at::Tensor> attention_mask,
+    std::optional<double> scale,
+    float q_scale,
+    int32_t q_zp,
+    float k_scale,
+    int32_t k_zp,
+    float v_scale,
+    int32_t v_zp,
+    float a_scale,
+    int32_t a_zp,
+    float o_scale,
+    int32_t o_zp) {
+  // Query (Batch x Num_heads  x Q_seq_len  x Dim_per_head)
+  //    -> (Batch x Q_seq_len  x Num_heads  x Dim_per_head)
+  // Key   (Batch x Num_heads  x KV_seq_len x Dim_per_head)
+  //    -> (Batch x KV_seq_len x Num_heads  x Dim_per_head)
+  // Value (Batch x Num_heads  x KV_seq_len x Dim_per_head)
+  //    -> (Batch x KV_seq_len x Num_heads  x Dim_per_head)
+  at::Tensor query = q.transpose(1, 2);
+  at::Tensor key = k.transpose(1, 2);
+  at::Tensor value = v.transpose(1, 2);
+
+  using accum_t = float;
+  accum_t scaling_factor = calculate_scale(query, scale).expect_float();
+  int block_64 = 64;
+  auto u8_dt = at::ScalarType::Byte;
+
+  // Sizes
+  TORCH_CHECK(
+      (query.size(3) == value.size(3)) && (key.size(3) == value.size(3)),
+      "scaled_dot_product_attention_sdpa: Q/K/V should have the same head size");
+  TORCH_CHECK(
+      kv_split_size % block_64 == 0, "kv_split_size is not divisble by ", block_64);
+
+  int64_t batchSize = query.size(0);
+  int64_t qSize = query.size(1);
+  int64_t kvSize = value.size(1);
+  int64_t num_head = query.size(2);
+  int64_t headSize = query.size(3);
+
+  bool has_attn_mask = attention_mask.has_value() && attention_mask.value().numel();
+  if (has_attn_mask) {
+    reshape_attn_mask_to_4d(attention_mask.value(), batchSize, num_head, qSize, kvSize);
+  }
+
+  // Strides
+  int64_t qStrideB = query.stride(0);
+  int64_t qStrideM = query.stride(1);
+  int64_t qStrideH = query.stride(2);
+  int64_t kStrideB = key.stride(0);
+  int64_t kStrideN = key.stride(1);
+  int64_t kStrideH = key.stride(2);
+  int64_t vStrideB = value.stride(0);
+  int64_t vStrideN = value.stride(1);
+  int64_t vStrideH = value.stride(2);
+  int64_t oStrideB = output.stride(0);
+  int64_t oStrideM = output.stride(1);
+  int64_t oStrideH = output.stride(2);
+  int64_t mStrideB =
+      (has_attn_mask && attention_mask.value().size(0) > 1)
+      ? attention_mask.value().stride(0)
+      : 0;
+  int64_t mStrideH =
+      (has_attn_mask && attention_mask.value().size(1) > 1)
+      ? attention_mask.value().stride(1)
+      : 0;
+  int64_t mStrideM =
+      (has_attn_mask && attention_mask.value().size(2) > 1)
+      ? attention_mask.value().stride(2)
+      : 0;
+  int64_t mStrideN =
+      (has_attn_mask && attention_mask.value().size(3) > 1)
+      ? attention_mask.value().stride(3)
+      : 0;
+
+  int64_t qSplitSize = q_split_size > qSize ? qSize : q_split_size;
+  int64_t kvSplitSize = kv_split_size > kvSize ? kvSize : kv_split_size;
+  int64_t qSlice = (qSize - 1) / qSplitSize + 1;
+  int64_t kvSlice = (kvSize - 1) / kvSplitSize + 1;
+  int64_t kvTail = (kvSize - 1) % kvSplitSize + 1;
+  int64_t num_thread = at::get_num_threads();
+
+  int64_t rndHeadSize = (headSize + block_64 - 1L) / block_64 * block_64;
+  int64_t rndkvSplitSize = (kvSplitSize + block_64 - 1L) / block_64 * block_64;
+  int64_t rndkvTail = (kvTail + block_64 - 1L) / block_64 * block_64;
+  int64_t rndkvSize = kv_split_size > kvSize ? rndkvTail : rndkvSplitSize * kvSlice + rndkvTail;
+
+  bool av_gemm_K_mul4 = kvSplitSize % 4 == 0;
+  int av_gemm_K_padding = av_gemm_K_mul4 ? 0 : 4 - kvSplitSize % 4;
+  int av_gemm_K = kvSplitSize + av_gemm_K_padding;
+
+  // Data ptrs
+  scalar_t* q_data = query.data_ptr<scalar_t>();
+  scalar_t* k_data = key.data_ptr<scalar_t>();
+  scalar_t* v_data = value.data_ptr<scalar_t>();
+  mask_t* mask_data = attention_mask.has_value()
+      ? attention_mask.value().data_ptr<mask_t>()
+      : nullptr;
+  scalar_t* out_data = output.data_ptr<scalar_t>();
+
+  bool headSize_mul64 = headSize % 64 == 0;
+  int qk_gemm_K_padding = headSize_mul64 ? 0 : 64 - headSize % 64;
+  int qk_gemm_K = headSize + qk_gemm_K_padding;
+
+  int64_t qk_reduce_strideL = qSplitSize * av_gemm_K;
+  int64_t v_reorder_strideL = av_gemm_K * rndHeadSize;
+
+  int64_t total_size_uint8_per_thread =
+    /* qk */ kvSlice * qSplitSize * rndkvSplitSize * 4 +
+    /* qk_local  */ kvSlice * av_gemm_K * 4 +
+    /* qk_reduce  */ kvSlice * qk_reduce_strideL +
+    /* qk_s32   */ qSplitSize * rndkvSplitSize * 4 +
+    /* dst_s32  */ qSplitSize * rndHeadSize * 4 +
+    /* softmax_sum   */ qSplitSize * 4 +
+    /* query_sum     */ qSplitSize * 4 +
+    /* attention_sum */ qSplitSize * 4 +
+    /* softmax max */ qSplitSize * 4 +
+    /* query_padding_data */ qSplitSize * qk_gemm_K;
+
+  at::Tensor total_buf = at::empty(
+      {num_thread, total_size_uint8_per_thread},
+      query.options());
+  scalar_t* total_buf_data = total_buf.data_ptr<scalar_t>();
+
+  int64_t kv_sum_size_per_BH =
+    /* key_sum */ kvSize +
+    /* value_sum */ headSize;
+
+  at::Tensor kv_sum_buf = at::empty(
+      {batchSize, num_head, kv_sum_size_per_BH},
+      query.options().dtype(at::kInt));
+  int32_t* kv_sum_buf_data = kv_sum_buf.data_ptr<int32_t>();
+
+  int64_t kv_reorder_size_per_BH =
+    /* key_t_reorder */ qk_gemm_K * rndkvSize +
+    /* value_t_reorder */ kvSlice * v_reorder_strideL;
+
+  at::Tensor kv_reorder_buf = at::empty(
+      {batchSize, num_head, kv_reorder_size_per_BH},
+      query.options());
+  scalar_t* kv_reorder_buf_data = kv_reorder_buf.data_ptr<scalar_t>();
+  scalar_t* key_reorder_ptr = kv_reorder_buf_data;
+  scalar_t* value_reorder_ptr = kv_reorder_buf_data + batchSize * num_head * qk_gemm_K * rndkvSize;
+
+  // sum k and v
+  at::parallel_for(
+      0, batchSize * num_head, 1, [&](int64_t begin, int64_t end) {
+        int64_t i = 0, j = 0;
+        at::native::data_index_init(
+            begin, i, batchSize, j, num_head);
+        for (const auto z : c10::irange(begin, end)) {
+          (void)z; // Suppress unused variable
+          int32_t* kv_sum_ptr = kv_sum_buf_data
+              + i * num_head * kv_sum_size_per_BH
+              + j * kv_sum_size_per_BH;
+          int32_t* k_sum_ptr = kv_sum_ptr;
+          int32_t* v_sum_ptr = kv_sum_ptr + kvSize;
+          if (q_zp == 0) {
+            fill_stub(k_sum_ptr, static_cast<int32_t>(0), kvSize);
+          } else {
+            _int_sum_b_contiguous_kernel(k_data + i * kStrideB + j * kStrideH,
+              k_sum_ptr,
+              kvSize, headSize, kStrideN, q_zp);
+          }
+          if (a_zp == 0) {
+            fill_stub(v_sum_ptr, static_cast<int32_t>(0), headSize);
+          } else {
+            _int_sum_a_contiguous_kernel(v_data + i * vStrideB + j * vStrideH,
+              v_sum_ptr,
+              headSize, kvSize, vStrideN, a_zp);
+          }
+        // Move to the next query
+        at::native::data_index_step(i, batchSize, j, num_head);
+      }
+    });
+
+  // transpose and packing
+  at::parallel_for(
+    0, batchSize * num_head * kvSlice, 1, [&](int64_t begin, int64_t end) {
+      int64_t i = 0, j = 0, l = 0, n = 0;
+      at::native::data_index_init(
+          begin, i, batchSize, j, num_head, l, kvSlice);
+      uint8_t* B_blocked_xform_u8 = new uint8_t[qk_gemm_K * block_64];
+      for (const auto z : c10::irange(begin, end)) {
+        (void)z; // Suppress unused variable
+        n = l * kvSplitSize;
+        auto k_reorder = key_reorder_ptr + i * num_head * qk_gemm_K * rndkvSize +
+                      j * qk_gemm_K * rndkvSize + n * qk_gemm_K;
+        auto v_reorder = value_reorder_ptr +
+                      i * num_head * kvSlice * v_reorder_strideL +
+                      j * kvSlice * v_reorder_strideL + n * rndHeadSize;
+        int64_t kvBlockSize = std::min(kvSplitSize, kvSize - n);
+        for (int64_t b = 0; b < kvBlockSize; b += block_64) {
+          bool istail = kvBlockSize - b < block_64;
+          int64_t trans_rows = istail ? kvBlockSize - b : block_64;
+          do_transpose(
+              k_data + i * kStrideB + j * kStrideH + n * kStrideN + b * kStrideN,
+              B_blocked_xform_u8,
+              trans_rows,
+              headSize,
+              kStrideN,
+              block_64);
+          if (!headSize_mul64 || istail) {
+            pad_remain_row_col(
+                B_blocked_xform_u8,
+                headSize,
+                trans_rows,
+                qk_gemm_K,
+                block_64,
+                block_64
+              );
+          }
+          at::native::cpublas::pack(
+                  qk_gemm_K, // K
+                  block_64, // N
+                  block_64, // ld_in
+                  block_64, // ld_out
+                  u8_dt, // dt_in
+                  u8_dt, // dt_out
+                  B_blocked_xform_u8,
+                  k_reorder + b * qk_gemm_K);
+        }
+        // split headSize to block_64, block_64, block_64 ...
+        // [av_gemm_K, headSize] -> [av_gemm_K,  block_64 ...]
+        for (int64_t b = 0; b < rndHeadSize; b += block_64) {
+          at::native::cpublas::pack(
+                  av_gemm_K,
+                  block_64,
+                  vStrideN,
+                  block_64,
+                  u8_dt,
+                  u8_dt,
+                  v_data + i * vStrideB + j * vStrideH + n * vStrideN + b,
+                  v_reorder + av_gemm_K * b);
+        }
+        // Move to the next query
+        at::native::data_index_step(i, batchSize, j, num_head, l, kvSlice);
+      }
+    });
+
+  at::parallel_for(
+      0, batchSize * num_head * qSlice, 1, [&](int64_t begin, int64_t end) {
+        int64_t i = 0, j = 0, k = 0;
+        at::native::data_index_init(
+            begin, i, batchSize, j, num_head, k, qSlice);
+        int ompIdx = at::get_thread_num();
+        scalar_t* total_buf_ptr = total_buf_data + ompIdx * total_size_uint8_per_thread;
+        int32_t offset = 0;
+        accum_t* qk_data = reinterpret_cast<accum_t*>(total_buf_ptr);
+        offset += kvSlice * qSplitSize * rndkvSplitSize * 4;
+        accum_t* qk_local_data = reinterpret_cast<accum_t*>(total_buf_ptr + offset);
+        offset += kvSlice * av_gemm_K * 4;
+        scalar_t* qk_reduced_data = reinterpret_cast<scalar_t*>(total_buf_ptr + offset);
+        offset += kvSlice * qk_reduce_strideL;
+        int32_t* qk_s32_data = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * rndkvSplitSize * 4;
+        int32_t* dst_s32_data = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * rndHeadSize * 4;
+        accum_t* sfm_sum_ptr = reinterpret_cast<accum_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        int32_t* q_sum_ptr = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        int32_t* a_sum_ptr = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        accum_t* sfm_max_ptr = reinterpret_cast<accum_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        scalar_t* query_t_padding_ptr = reinterpret_cast<scalar_t*>(total_buf_ptr + offset);
+
+        for (const auto z : c10::irange(begin, end)) {
+          (void)z; // Suppress unused variable
+
+          int32_t* kv_sum_ptr = kv_sum_buf_data
+              + i * num_head * kv_sum_size_per_BH
+              + j * kv_sum_size_per_BH;
+          int32_t* k_sum_ptr = kv_sum_ptr;
+          int32_t* v_sum_ptr = kv_sum_ptr + kvSize;
+
+          // sdpa core
+          int64_t m = k * qSplitSize;
+          int64_t qBlockSize = std::min(qSplitSize, qSize - m);
+          // Initialize sum and max
+          fill_stub(
+              sfm_sum_ptr, static_cast<accum_t>(0), qSplitSize);
+          fill_stub(
+              a_sum_ptr, static_cast<int32_t>(0), qSplitSize);
+          fill_stub(
+              sfm_max_ptr, static_cast<accum_t>(-std::numeric_limits<accum_t>::infinity()), qSplitSize);
+          copy_value_with_pad(
+              q_data + i * qStrideB + j * qStrideH + m * qStrideM,
+              query_t_padding_ptr,
+              qBlockSize,
+              headSize,
+              qSplitSize,
+              qk_gemm_K,
+              qStrideM);
+          // sum q
+          if (k_zp != 0) {
+            _int_sum_b_contiguous_kernel(query_t_padding_ptr,
+                  q_sum_ptr, qBlockSize, headSize, qk_gemm_K, k_zp);
+          } else {
+            fill_stub(
+              q_sum_ptr, static_cast<int32_t>(0), qSplitSize);
+          }
+          const int64_t rkvSlice = (kvSize - 1) / kvSplitSize + 1;
+          for (int64_t l = 0; l < rkvSlice; l++) {
+            int64_t n = l * kvSplitSize;
+            int64_t kvBlockSize = std::min(kvSplitSize, kvSize - n);
+            auto k_reorder = key_reorder_ptr + i * num_head * qk_gemm_K * rndkvSize +
+                      j * qk_gemm_K * rndkvSize + n * qk_gemm_K;
+            // Calculate q @ k.T
+            for (int64_t b = 0; b < kvBlockSize; b += block_64) {
+              at::native::cpublas::brgemm(
+                    qSplitSize, block_64, qk_gemm_K,
+                    qk_gemm_K, // lda
+                    block_64, //ldb
+                    rndkvSplitSize, //ldc,
+                    false,
+                    query_t_padding_ptr,
+                    k_reorder + b * qk_gemm_K,
+                    qk_s32_data + b);
+            }
+
+            // do dequant compensation, add mask, max reduce for softmax, and convert qk from s32 to fp32
+            accum_t* qk_block_data = qk_data + l * qSplitSize * rndkvSplitSize;
+            if (has_attn_mask) {
+              mask_t* mask_data_offset = mask_data + i * mStrideB + j * mStrideH + m * mStrideM + (mStrideN == 0 ? 0 : n);
+              _dequant_mask_max_fusion_kernel(
+                qk_s32_data, //in
+                mask_data_offset, //mask_ptr
+                q_sum_ptr, //sum_a_ptr
+                k_sum_ptr + n, //sum_b_ptr
+                qBlockSize, //M
+                kvBlockSize, //N
+                rndkvSplitSize, //ldi
+                mStrideM, //ldm
+                rndkvSplitSize, //ldo
+                q_zp * k_zp * headSize, //zp_a*zp_b*k=beta
+                q_scale * k_scale * scaling_factor, //scale_a*scale_b*scale_sdpa=alpha
+                qk_block_data, //out
+                sfm_max_ptr // sfm_max_ptr
+              );
+            } else {
+              _dequant_max_fusion_kernel(
+                qk_s32_data, //in
+                q_sum_ptr, //sum_a_ptr
+                k_sum_ptr + n, //sum_b_ptr
+                qBlockSize, //M
+                kvBlockSize, //N
+                rndkvSplitSize, //ldi
+                rndkvSplitSize, //ldo
+                q_zp * k_zp * headSize, //zp_a*zp_b*k=beta
+                q_scale * k_scale * scaling_factor, //scale_a*scale_b*scale_sdpa=alpha
+                qk_block_data, //out
+                sfm_max_ptr // sfm_max_ptr
+              );
+            }
+          }
+          // sub max, exp, sum reduce, div sum for softmax
+          // and quant
+          // and sum for attention
+          if (v_zp == 0) {
+            _sub_exp_sum_div_quant_fusion_kernel(
+              qk_data, //in
+              qBlockSize, //M
+              kvSplitSize, //N_step
+              rkvSlice, //NSlices
+              qSplitSize * rndkvSplitSize, //ldi
+              qk_reduce_strideL, //ldo
+              kvSize, //kvSize
+              rndkvSplitSize, //rndkvSplitSize
+              av_gemm_K, //av_gemm_K
+              a_zp, // zp_a=beta1
+              a_scale, // scale_a=alpha
+              qk_local_data, //local
+              qk_reduced_data, //out
+              sfm_max_ptr, //sfm_max_ptr
+              sfm_sum_ptr //sfm_sum_ptr
+            );
+          } else {
+            _sub_exp_sum_div_quant_sum_fusion_kernel(
+              qk_data, //in
+              qBlockSize, //M
+              kvSplitSize, //N_step
+              rkvSlice, //NSlice
+              qSplitSize * rndkvSplitSize, //ldi
+              qk_reduce_strideL, //ldo
+              kvSize, //kvSize
+              rndkvSplitSize, //rndkvSplitSize
+              av_gemm_K, //av_gemm_K
+              a_zp, // zp_a=beta1
+              v_zp, // zp_b=beta2
+              a_scale, // scale_a=alpha
+              qk_local_data, //local
+              qk_reduced_data, //out
+              sfm_max_ptr, //sfm_max_ptr
+              sfm_sum_ptr, //sfm_sum_ptr
+              a_sum_ptr //a_sum_ptr
+            );
+          }
+          // Calculate Softmax(q @ k.T) @ v
+          auto v_reorder = value_reorder_ptr +
+                  i * num_head * kvSlice * v_reorder_strideL +
+                  j * kvSlice * v_reorder_strideL;
+          for (int64_t b = 0; b < headSize; b += block_64) {
+            auto value_reorder_b = v_reorder + b * av_gemm_K;
+            auto dst_s32_b = dst_s32_data + b;
+            for (int64_t s = 0; s < kvSlice; s++) {
+              at::native::cpublas::brgemm(
+                  qSplitSize, block_64, av_gemm_K,
+                  av_gemm_K, // lda
+                  rndHeadSize, //ldb
+                  rndHeadSize, //ldc
+                  s != 0,
+                  qk_reduced_data + s * qk_reduce_strideL,
+                  value_reorder_b + s * v_reorder_strideL,
+                  dst_s32_b);
+            }
+          }
+
+          // After the last gemm,
+          // do dequant compensation, quant and convert from s32 to int8
+          if (a_zp == 0) {
+            _dequant_quant_fusion_kernel(
+              dst_s32_data, //in
+              a_sum_ptr, //sum_a_ptr
+              qBlockSize, //M
+              headSize, //N
+              rndHeadSize, //ldi
+              oStrideM, //ldo
+              o_zp, //zp_c=beta2
+              a_scale * v_scale / o_scale, //scale_a*scale_b/scale_c=alpha
+              out_data + i * oStrideB + j * oStrideH + m * oStrideM //out
+            );
+          } else {
+            _dequant_quant_fusion_kernel(
+              dst_s32_data, //in
+              a_sum_ptr, //sum_a_ptr
+              v_sum_ptr, //sum_b_ptr
+              qBlockSize, //M
+              headSize, //N
+              rndHeadSize, //ldi
+              oStrideM, //ldo
+              a_zp * v_zp * kvSize, //zp_a*zp_b*k=beta1
+              o_zp, //zp_c=beta2
+              a_scale * v_scale / o_scale, //scale_a*scale_b/scale_c=alpha
+              out_data + i * oStrideB + j * oStrideH + m * oStrideM //out
+            );
+          }
+          // Move to the next query
+          at::native::data_index_step(i, batchSize, j, num_head, k, qSlice);
+        }
+      });
+  // Once all computations are done, need to release HW context.
+  at::native::cpublas::brgemm_release();
+}
+
+
+template <typename scalar_t, typename mask_t, int64_t q_split_size, int64_t kv_split_size>
+inline typename std::enable_if_t<std::is_same_v<scalar_t, unsigned char>, void>
+sdpa_int8_fused_kernel_impl(
+    bool use_one_parallel_loop,
+    const at::Tensor& output,
+    const at::Tensor& query,
+    const at::Tensor& key,
+    const at::Tensor& value,
+    double dropout_p,
+    bool is_causal,
+    std::optional<at::Tensor> attn_mask,
+    std::optional<double> scale,
+    float q_scale,
+    int32_t q_zp,
+    float k_scale,
+    int32_t k_zp,
+    float v_scale,
+    int32_t v_zp,
+    float a_scale,
+    int32_t a_zp,
+    float o_scale,
+    int32_t o_zp) {
+  if (use_one_parallel_loop) {
+    sdpa_int8_fused_kernel_impl<scalar_t, mask_t, q_split_size, kv_split_size,
+          /* use_one_parallel_loop */ true>(
+      output, query, key, value,
+      dropout_p, is_causal, attn_mask, scale,
+      q_scale, q_zp,
+      k_scale, k_zp,
+      v_scale, v_zp,
+      a_scale, a_zp,
+      o_scale, o_zp);
+  } else {
+    sdpa_int8_fused_kernel_impl<scalar_t, mask_t, q_split_size, kv_split_size,
+          /* use_one_parallel_loop */ false>(
+      output, query, key, value,
+      dropout_p, is_causal, attn_mask, scale,
+      q_scale, q_zp,
+      k_scale, k_zp,
+      v_scale, v_zp,
+      a_scale, a_zp,
+      o_scale, o_zp);
+  }
+}
+
+
+#define AT_DISPATCH_MASK_TYPES(TYPE, NAME, ...)            \
+  AT_DISPATCH_SWITCH(                                      \
+      TYPE,                                                \
+      NAME,                                                \
+      AT_PRIVATE_CASE_TYPE_USING_HINT(                     \
+          at::ScalarType::Bool, mask_t, __VA_ARGS__)       \
+      AT_PRIVATE_CASE_TYPE_USING_HINT(                     \
+          at::ScalarType::Float, mask_t, __VA_ARGS__)      \
+      AT_PRIVATE_CASE_TYPE_USING_HINT(                     \
+          at::ScalarType::Double, mask_t, __VA_ARGS__)     \
+      AT_PRIVATE_CASE_TYPE_USING_HINT(                     \
+          at::ScalarType::BFloat16, mask_t, __VA_ARGS__)   \
+      AT_PRIVATE_CASE_TYPE_USING_HINT(                     \
+          at::ScalarType::Half, mask_t, __VA_ARGS__))
+
+void sdpa_int8_fused_kernel(
+    const at::Tensor& output,
+    const at::Tensor& query,
+    const at::Tensor& key,
+    const at::Tensor& value,
+    double dropout_p,
+    bool is_causal,
+    std::optional<at::Tensor> attn_mask,
+    std::optional<double> scale,
+    float q_scale,
+    int32_t q_zp,
+    float k_scale,
+    int32_t k_zp,
+    float v_scale,
+    int32_t v_zp,
+    float a_scale,
+    int32_t a_zp,
+    float o_scale,
+    int32_t o_zp) {
+  TORCH_CHECK(query.scalar_type() == c10::kByte);
+  int64_t batchSize = query.size(0);
+  int64_t num_head = query.size(1);
+  int64_t q_seq_len = query.size(2);
+  int64_t kv_seq_len = key.size(2);
+  int64_t q_split_size = 32;
+  if (q_seq_len >= 768) {
+    q_split_size = 256;
+  } else if (q_seq_len >= 192) {
+    q_split_size = 64;
+  }
+  // Heuristic to decide whether to use one parallel loop or not
+  //    true: one parallel loop for sum+packing+core
+  //    false: three parallel loops for sum, packing, core
+  uint32_t l2_cache_size = at::cpu::L2_cache_size();
+  int64_t num_thread = at::get_num_threads();
+  int64_t attn_size = q_split_size * kv_seq_len * sizeof(int32_t) * num_thread;
+  bool use_one_parallel_loop = (batchSize * num_head > num_thread) &&
+      (attn_size > 1.5 * l2_cache_size);
+  if (!attn_mask.has_value()) {
+    if (q_split_size == 256) {
+      sdpa_int8_fused_kernel_impl<unsigned char, float, 256, 64>(
+        use_one_parallel_loop,
+        output, query, key, value,
+        dropout_p, is_causal, attn_mask, scale,
+        q_scale, q_zp,
+        k_scale, k_zp,
+        v_scale, v_zp,
+        a_scale, a_zp,
+        o_scale, o_zp);
+    } else if (q_split_size == 64) {
+      sdpa_int8_fused_kernel_impl<unsigned char, float, 64, 64>(
+        use_one_parallel_loop,
+        output, query, key, value,
+        dropout_p, is_causal, attn_mask, scale,
+        q_scale, q_zp,
+        k_scale, k_zp,
+        v_scale, v_zp,
+        a_scale, a_zp,
+        o_scale, o_zp);
+    } else {
+      sdpa_int8_fused_kernel_impl<unsigned char, float, 32, 64>(
+        use_one_parallel_loop,
+        output, query, key, value,
+        dropout_p, is_causal, attn_mask, scale,
+        q_scale, q_zp,
+        k_scale, k_zp,
+        v_scale, v_zp,
+        a_scale, a_zp,
+        o_scale, o_zp);
+    }
+  } else {
+    AT_DISPATCH_MASK_TYPES(attn_mask.value().scalar_type(), "sdpa_mask", [&]() {
+      if (q_split_size == 256) {
+        sdpa_int8_fused_kernel_impl<unsigned char, mask_t, 256, 64>(
+          use_one_parallel_loop,
+          output, query, key, value,
+          dropout_p, is_causal, attn_mask, scale,
+          q_scale, q_zp,
+          k_scale, k_zp,
+          v_scale, v_zp,
+          a_scale, a_zp,
+          o_scale, o_zp);
+      } else if (q_split_size == 64) {
+        sdpa_int8_fused_kernel_impl<unsigned char, mask_t, 64, 64>(
+          use_one_parallel_loop,
+          output, query, key, value,
+          dropout_p, is_causal, attn_mask, scale,
+          q_scale, q_zp,
+          k_scale, k_zp,
+          v_scale, v_zp,
+          a_scale, a_zp,
+          o_scale, o_zp);
+      } else {
+        sdpa_int8_fused_kernel_impl<unsigned char, mask_t, 32, 64>(
+          use_one_parallel_loop,
+          output, query, key, value,
+          dropout_p, is_causal, attn_mask, scale,
+          q_scale, q_zp,
+          k_scale, k_zp,
+          v_scale, v_zp,
+          a_scale, a_zp,
+          o_scale, o_zp);
+      }
+    });
+  }
+}
+#endif // CPU_CAPABILITY_AVX512
+
+at::Tensor sdpa_int8_math_kernel(
+    const at::Tensor& query,
+    const at::Tensor& key,
+    const at::Tensor& value,
+    double dropout_p,
+    bool is_causal,
+    std::optional<at::Tensor> attn_mask,
+    std::optional<double> scale,
+    float q_scale,
+    int32_t q_zp,
+    float k_scale,
+    int32_t k_zp,
+    float v_scale,
+    int32_t v_zp,
+    float a_scale,
+    int32_t a_zp,
+    float o_scale,
+    int32_t o_zp) {
+  // dequant q/k/v
+  auto q = (query.to(at::kFloat) - q_zp) * q_scale;
+  auto k = (key.to(at::kFloat) - k_zp) * k_scale;
+  auto v = (value.to(at::kFloat) - v_zp) * v_scale;
+  const auto scaling_factor = calculate_scale(q, scale);
+  auto attn = at::matmul(q, k.transpose(-2, -1)) * scaling_factor;
+  if (attn_mask.has_value() && attn_mask.value().numel()) {
+    attn = attn.add(attn_mask.value().to(at::kFloat));
+  }
+  attn = at::softmax(attn, -1);
+  // quant attn
+  attn = at::clamp_max(
+      at::clamp_min(at::round(attn / a_scale) + a_zp, 0), 255
+  );
+  // dequant attn
+  attn = (attn - a_zp) * a_scale;
+  auto output = at::matmul(attn, v);
+  // quant output
+  output = at::clamp_max(
+      at::clamp_min(at::round(output / o_scale) + o_zp, 0), 255
+  ).to(at::kByte);
+  return output;
+}
+
+
+at::Tensor _qscaled_dot_product_cpu(
+    const at::Tensor& query,
+    const at::Tensor& key,
+    const at::Tensor& value,
+    std::optional<at::Tensor> attn_mask,
+    double dropout_p,
+    bool is_causal,
+    std::optional<double> scale,
+    double q_scale,
+    int64_t q_zp,
+    double k_scale,
+    int64_t k_zp,
+    double v_scale,
+    int64_t v_zp,
+    double a_scale,
+    int64_t a_zp,
+    double o_scale,
+    int64_t o_zp) {
+  const auto dtype = query.scalar_type();
+  TORCH_CHECK(!query.is_nested() && !key.is_nested() && !value.is_nested(),
+    "_qscaled_dot_product_cpu: Only accept plain inputs");
+  TORCH_CHECK(!is_causal,
+    "_qscaled_dot_product_cpu: is_causal not supported.");
+  TORCH_CHECK(dtype == at::ScalarType::Byte,
+    "_qscaled_dot_product_cpu: Expected data type be U8, but got ", dtype, " instead.");
+  TORCH_CHECK(query.dim() == 4 && key.dim() == 4 && value.dim() == 4,
+    "_qscaled_dot_product_cpu: Accept only 4 dims inputs shape of {B, H, T, K}");
+  TORCH_CHECK(dropout_p == 0.0,
+    "_qscaled_dot_product_cpu: Currently do not support dropout > 0");
+  TORCH_CHECK((query.size(3) == value.size(3)) && (key.size(3) == value.size(3)),
+    "_qscaled_dot_product_cpu: Q/K/V should have the same head size");
+  TORCH_CHECK(!attn_mask.has_value() ||
+          attn_mask.value().scalar_type() == at::kFloat ||
+          attn_mask.value().scalar_type() == at::kBFloat16,
+    "_qscaled_dot_product_cpu: Expected attention mask be float or bf16");
+  TORCH_CHECK(!attn_mask.has_value() ||
+          (attn_mask.value().dim() == 2 || attn_mask.value().dim() == 4),
+    "_qscaled_dot_product_cpu: Attention mask dim in {2, 4}");
+
+  #ifdef CPU_CAPABILITY_AVX512
+    if (at::native::cpublas::could_pack(dtype)) {
+        at::Tensor output = at::empty_like(query, query.options()).transpose(1, 2);
+        sdpa_int8_fused_kernel(output, query, key, value,
+            dropout_p, is_causal, attn_mask, scale,
+            q_scale, q_zp,
+            k_scale, k_zp,
+            v_scale, v_zp,
+            a_scale, a_zp,
+            o_scale, o_zp);
+        return output.transpose(1, 2);
+    } else {
+  #endif // CPU_CAPABILITY_AVX512
+        return sdpa_int8_math_kernel(query, key, value,
+              dropout_p, is_causal, attn_mask, scale,
+              q_scale, q_zp,
+              k_scale, k_zp,
+              v_scale, v_zp,
+              a_scale, a_zp,
+              o_scale, o_zp).transpose(1, 2).contiguous().transpose(1, 2);
+  #ifdef CPU_CAPABILITY_AVX512
+    }
+  #endif // CPU_CAPABILITY_AVX512
+}
+
+
+} // anonymous namespace
+
+TORCH_LIBRARY_IMPL(torchao, CPU, m) {
+  m.impl("torchao::qscaled_dot_product", &_qscaled_dot_product_cpu);
+}
+
+// } // at::native
+} // namespace torchao
diff --git a/torchao/ops.py b/torchao/ops.py
index 0a507a69d7..faebdbd5d1 100644
--- a/torchao/ops.py
+++ b/torchao/ops.py
@@ -58,6 +58,9 @@
     "mx_fp4_bf16(Tensor a, Tensor b, Tensor a_scale, Tensor b_scale) -> Tensor",
     tags=[torch._C.Tag.needs_fixed_stride_order],
 )
+lib.define(
+    "qscaled_dot_product(Tensor query, Tensor key, Tensor value, Tensor? attn_mask=None, float dropout_p=0.0, bool is_causal=False, float? scale=None, float q_scale=1.0, int q_zp=0, float k_scale=1.0, int k_zp=0, float v_scale=1.0, int v_zp=0, float a_scale=1.0, int a_zp=0, float o_scale=1.0, int o_zp=0) -> Tensor"
+)
 
 
 def register_custom_op(name):
@@ -162,6 +165,92 @@ def _(
     return _in_feats.new_empty((BS, OC))
 
 
+def qscaled_dot_product(
+    query: Tensor,
+    key: Tensor,
+    value: Tensor,
+    attn_mask: Optional[Tensor] = None,
+    dropout_p: float = 0.0,
+    is_causal: bool = False,
+    scale: Optional[float] = None,
+    q_scale: float = 1.0,
+    q_zp: int = 0,
+    k_scale: float = 1.0,
+    k_zp: int = 0,
+    v_scale: float = 1.0,
+    v_zp: int = 0,
+    a_scale: float = 1.0,
+    a_zp: int = 0,
+    o_scale: float = 1.0,
+    o_zp: int = 0,
+) -> Tensor:
+    """
+    Quantized SDPA with quantized inputs and outputs.
+    Arguments
+        query: input query tensor,
+        key: input key tensor,
+        value: input value tensor,
+        attn_mask: attention mask tensor,
+        dropout_p: dropout probability,
+        is_causal: causal flag,
+        scale: scaling factor applied prior to softmax,
+        q_scale: scale for query from linear quantization,
+        q_zp: zero point for query from linear quantization,
+        k_scale: scale for key from linear quantization,
+        k_zp: zero point of key from linear quantization,
+        v_scale: zero point for value from linear quantization,
+        v_zp: zero point of value from linear quantization,
+        a_scale: scale for attention from softmax quantization,
+        a_zp: zero point for attention from softmax quantization,
+        o_scale: scale for output from linear quantization,
+        o_zp: zero point for output from linear quantization,
+    Returns
+        output of quantized SDPA
+    """
+    return torch.ops.torchao.qscaled_dot_product.default(
+        query,
+        key,
+        value,
+        attn_mask,
+        dropout_p,
+        is_causal,
+        scale,
+        q_scale,
+        q_zp,
+        k_scale,
+        k_zp,
+        v_scale,
+        v_zp,
+        a_scale,
+        a_zp,
+        o_scale,
+        o_zp,
+    )
+
+
+@register_custom_op("torchao::qscaled_dot_product")
+def _(
+    query: Tensor,
+    key: Tensor,
+    value: Tensor,
+    attn_mask: Optional[Tensor] = None,
+    dropout_p: float = 0.0,
+    is_causal: bool = False,
+    scale: Optional[float] = None,
+    q_scale: float = 1.0,
+    q_zp: int = 0,
+    k_scale: float = 1.0,
+    k_zp: int = 0,
+    v_scale: float = 1.0,
+    v_zp: int = 0,
+    a_scale: float = 1.0,
+    a_zp: int = 0,
+    o_scale: float = 1.0,
+    o_zp: int = 0,
+) -> Tensor:
+    return query
+
+
 def unpack_tensor_core_tiled_layout(packed_w: Tensor, inner_k_tiles: int) -> Tensor:
     """
     Unpacks weights that were packed with `torch.ops.aten._convert_weight_to_int4pack` to original tensor of shape `N x K`.
diff --git a/torchao/prototype/inductor/__init__.py b/torchao/prototype/inductor/__init__.py
new file mode 100644
index 0000000000..e69de29bb2
diff --git a/torchao/prototype/inductor/fx_passes/README.md b/torchao/prototype/inductor/fx_passes/README.md
new file mode 100644
index 0000000000..7007aba993
--- /dev/null
+++ b/torchao/prototype/inductor/fx_passes/README.md
@@ -0,0 +1,35 @@
+# Inductor FX Passes
+
+This directory contains the FX passes of Inductor. FX passes are transformations applied to the FX graph to optimize and modify it for better performance and functionality.
+
+In TorchAO, you can replace the following customized graph passes of Inductor:
+- `pre_grad_custom_pass`
+- `joint_custom_pre_pass`
+- `joint_custom_post_pass`
+- `post_grad_custom_post_pass`
+- `post_grad_custom_pre_pass`
+
+## Directory Structure
+
+- `int8_sdpa_fusion`: Pattern match for int8 sdpa fusion.
+
+## Getting Started
+
+To get started with using the FX passes in TorchAO, you can register and apply them to your FX graph as follows:
+
+```python
+from torch._inductor import config
+from torch._inductor.pattern_matcher import PatternMatcherPass
+
+# Example usage
+class _CustomPass(...): # create a custom pass class
+custom_pass = _CustomPass() # create an instance of custom pass
+with config.patch(config.custom_pass=custom_pass):
+    _register_patterns(config.custom_pass) # register your own passes
+
+```
+
+## Limitations
+
+For now, we can only register one pass as the custom pass.
+In the future, it is better to extend it to a list.
diff --git a/torchao/prototype/inductor/fx_passes/__init__.py b/torchao/prototype/inductor/fx_passes/__init__.py
new file mode 100644
index 0000000000..aae6d5348a
--- /dev/null
+++ b/torchao/prototype/inductor/fx_passes/__init__.py
@@ -0,0 +1,5 @@
+from .int8_sdpa_fusion import _int8_sdpa_init
+
+__all__ = [
+    "_int8_sdpa_init",
+]
diff --git a/torchao/prototype/inductor/fx_passes/int8_sdpa_fusion.py b/torchao/prototype/inductor/fx_passes/int8_sdpa_fusion.py
new file mode 100644
index 0000000000..cfe0d309b1
--- /dev/null
+++ b/torchao/prototype/inductor/fx_passes/int8_sdpa_fusion.py
@@ -0,0 +1,392 @@
+import functools
+import itertools
+
+import torch
+from torch._dynamo.utils import counters
+from torch._inductor import config
+from torch._inductor.lowering import lowerings as L
+from torch._inductor.lowering import make_fallback
+from torch._inductor.pattern_matcher import (
+    Arg,
+    CallFunction,
+    KeywordArg,
+    Match,
+    PatternMatcherPass,
+    register_lowering_pattern,
+)
+
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_7
+
+__all__ = [
+    "_int8_sdpa_init",
+]
+
+make_fallback(torch.ops.torchao.qscaled_dot_product.default)
+
+aten = torch.ops.aten
+
+
+def _is_valid_int8_sdpa_pattern():
+    def fn(match):
+        assert all(k in match.kwargs for k in ("query", "key", "value"))
+        query = match.kwargs["query"].meta["val"]
+        key = match.kwargs["key"].meta["val"]
+        value = match.kwargs["value"].meta["val"]
+        return (
+            query.dtype == torch.uint8
+            and key.dtype == torch.uint8
+            and value.dtype == torch.uint8
+            and query.device.type == "cpu"
+            and key.device == query.device
+            and value.device == query.device
+        )
+
+    return fn
+
+
+def _register_int8_sdpa_pattern(pattern, custom_pass_dict):
+    @register_lowering_pattern(
+        pattern, extra_check=_is_valid_int8_sdpa_pattern(), pass_dict=custom_pass_dict
+    )
+    def int8_sdpa(match: Match, *args, **kwargs):
+        query = kwargs["query"]
+        key = kwargs["key"]
+        value = kwargs["value"]
+        inv_scale = kwargs["inv_scale"]
+        attn_mask = kwargs["attn_mask"] if "attn_mask" in kwargs else None
+        q_scale = kwargs["q_scale"]
+        q_zp = kwargs["q_zp"]
+        k_scale = kwargs["k_scale"]
+        k_zp = kwargs["k_zp"]
+        v_scale = kwargs["v_scale"]
+        v_zp = kwargs["v_zp"]
+        a_scale = kwargs["a_scale"]
+        a_zp = kwargs["a_zp"]
+        o_scale = kwargs["o_scale"]
+        o_zp = kwargs["o_zp"]
+        counters["inductor"]["int8_fuse_attention"] += 1
+        counters["inductor"]["int8_sdpa_nodes"] += len(match.nodes)
+
+        trans_query = L[aten.permute.default](query, [0, 2, 1, 3])
+        trans_key = L[aten.permute.default](key, [0, 2, 1, 3])
+        trans_value = L[aten.permute.default](value, [0, 2, 1, 3])
+        output = L[torch.ops.torchao.qscaled_dot_product.default](
+            trans_query,
+            trans_key,
+            trans_value,
+            attn_mask,
+            0.0,  # dropout
+            False,  # is_causal
+            1.0 / inv_scale,  # scale
+            q_scale,
+            q_zp,
+            k_scale,
+            k_zp,
+            v_scale,
+            v_zp,
+            a_scale,
+            a_zp,
+            o_scale,
+            o_zp,
+        )
+        trans_output = L[aten.permute.default](output, [0, 2, 1, 3])
+        return L[aten.clone.default](
+            trans_output, memory_format=torch.contiguous_format
+        )
+
+    return int8_sdpa
+
+
+def _get_int8_sdpa_qkv_pattern(
+    is_batch_size_1: bool, has_convert: bool, input_name: str
+):
+    assert input_name in ["query", "key", "value"]
+    int8_sdpa_qkv_pattern_before_dequant = CallFunction(
+        aten.permute.default,
+        KeywordArg(input_name),
+        Arg(),
+    )
+    if input_name == "key":
+        # do transpose
+        int8_sdpa_qkv_pattern_before_dequant = CallFunction(
+            aten.permute.default,
+            int8_sdpa_qkv_pattern_before_dequant,
+            Arg(),
+        )
+    int8_sdpa_qkv_basic_pattern = CallFunction(
+        torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+        int8_sdpa_qkv_pattern_before_dequant,
+        KeywordArg(input_name[0] + "_scale"),
+        KeywordArg(input_name[0] + "_zp"),
+        Arg(),
+        Arg(),
+        Arg(),
+    )
+    if has_convert:
+        int8_sdpa_qkv_basic_pattern = CallFunction(
+            torch.ops.prims.convert_element_type.default,
+            int8_sdpa_qkv_basic_pattern,
+            Arg(),
+        )
+    int8_sdpa_qkv_basic_pattern = CallFunction(
+        aten.expand.default,
+        int8_sdpa_qkv_basic_pattern,
+        Arg(),
+    )
+    if is_batch_size_1:
+        # pattern is different for bs=1
+        return CallFunction(
+            aten.reshape.default,
+            int8_sdpa_qkv_basic_pattern,
+            Arg(),
+        )
+    else:
+        return CallFunction(
+            aten.reshape.default,
+            CallFunction(
+                aten.clone.default,
+                int8_sdpa_qkv_basic_pattern,
+                memory_format=Arg(),
+            ),
+            Arg(),
+        )
+
+
+def _get_int8_sdpa_score_pattern(
+    has_mask: bool, is_batch_size_1: bool, is_reduced_type: bool, has_convert: bool
+):
+    int8_sdpa_q_pattern = _get_int8_sdpa_qkv_pattern(
+        is_batch_size_1, has_convert, "query"
+    )
+    int8_sdpa_k_pattern = _get_int8_sdpa_qkv_pattern(
+        is_batch_size_1, has_convert, "key"
+    )
+    int8_sdpa_score_basic_pattern = CallFunction(
+        aten.reshape.default,
+        CallFunction(
+            aten.bmm.default,
+            int8_sdpa_q_pattern,
+            int8_sdpa_k_pattern,
+        ),
+        Arg(),
+    )
+    if is_reduced_type and not has_mask:
+        int8_sdpa_score_basic_pattern = CallFunction(
+            torch.ops.prims.convert_element_type.default,
+            int8_sdpa_score_basic_pattern,
+            Arg(),
+        )
+    if has_mask:
+        return CallFunction(
+            aten.add.Tensor,
+            CallFunction(
+                aten.div.Tensor,
+                int8_sdpa_score_basic_pattern,
+                KeywordArg("inv_scale"),
+            ),
+            KeywordArg("attn_mask"),
+            _users=2,
+        )
+    else:
+        return CallFunction(
+            aten.mul.Tensor,
+            int8_sdpa_score_basic_pattern,
+            Arg(),
+            _users=2,
+        )
+
+
+def _get_int8_sdpa_exp_pattern(
+    has_mask: bool, is_batch_size_1: bool, is_reduced_type: bool, has_convert: bool
+):
+    int8_sdpa_score_pattern = _get_int8_sdpa_score_pattern(
+        has_mask, is_batch_size_1, is_reduced_type, has_convert
+    )
+    int8_sdpa_exp_basic_pattern = CallFunction(
+        aten.sub.Tensor,
+        int8_sdpa_score_pattern,
+        CallFunction(
+            aten.amax.default,
+            int8_sdpa_score_pattern,
+            Arg(),
+            Arg(),
+        ),
+    )
+    if has_mask:
+        return CallFunction(
+            aten.exp.default,
+            int8_sdpa_exp_basic_pattern,
+            _users=2,
+        )
+    else:
+        return CallFunction(
+            aten.exp.default,
+            CallFunction(
+                aten.div.Tensor,
+                int8_sdpa_exp_basic_pattern,
+                KeywordArg("inv_scale"),
+            ),
+            _users=2,
+        )
+
+
+def _get_int8_sdpa_attn_pattern(
+    has_mask: bool, is_batch_size_1: bool, is_reduced_type: bool, has_convert: bool
+):
+    int8_sdpa_exp_pattern = _get_int8_sdpa_exp_pattern(
+        has_mask, is_batch_size_1, is_reduced_type, has_convert
+    )
+    int8_sdpa_div_pattern = CallFunction(
+        aten.div.Tensor,
+        int8_sdpa_exp_pattern,
+        CallFunction(
+            aten.sum.dim_IntList,
+            int8_sdpa_exp_pattern,
+            Arg(),
+            Arg(),
+        ),
+    )
+    int8_sdpa_softmax_pattern = CallFunction(
+        torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+        CallFunction(
+            torch.ops.quantized_decomposed.quantize_per_tensor.default,
+            int8_sdpa_div_pattern,
+            KeywordArg("a_scale"),
+            KeywordArg("a_zp"),
+            Arg(),
+            Arg(),
+            Arg(),
+        ),
+        KeywordArg("a_scale"),
+        KeywordArg("a_zp"),
+        Arg(),
+        Arg(),
+        Arg(),
+    )
+    if is_reduced_type:
+        if has_mask:
+            int8_sdpa_softmax_pattern = CallFunction(
+                torch.ops.prims.convert_element_type.default,
+                int8_sdpa_softmax_pattern,
+                Arg(),
+            )
+        else:
+            int8_sdpa_softmax_pattern = CallFunction(
+                torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+                CallFunction(
+                    torch.ops.quantized_decomposed.quantize_per_tensor.default,
+                    CallFunction(
+                        torch.ops.prims.convert_element_type.default,
+                        int8_sdpa_div_pattern,
+                        Arg(),
+                    ),
+                    KeywordArg("a_scale"),
+                    KeywordArg("a_zp"),
+                    Arg(),
+                    Arg(),
+                    Arg(),
+                ),
+                KeywordArg("a_scale"),
+                KeywordArg("a_zp"),
+                Arg(),
+                Arg(),
+                Arg(),
+            )
+            if has_convert:
+                int8_sdpa_softmax_pattern = CallFunction(
+                    torch.ops.prims.convert_element_type.default,
+                    int8_sdpa_softmax_pattern,
+                    Arg(),
+                )
+    return CallFunction(
+        aten.reshape.default,
+        CallFunction(
+            aten.expand.default,
+            int8_sdpa_softmax_pattern,
+            Arg(),
+        ),
+        Arg(),
+    )
+
+
+# Parameters to generate various patterns:
+#   has_mask: if SDPA has attention mask
+#   is_batch_size_1: if the batch size is 1
+#   is_reduced_type: if autocast is enabled
+#   has_convert: convert type if dequant out dtype is assigned
+def _get_int8_sdpa_final_pattern(
+    has_mask: bool, is_batch_size_1: bool, is_reduced_type: bool, has_convert: bool
+):
+    int8_sdpa_v_pattern = _get_int8_sdpa_qkv_pattern(
+        is_batch_size_1, has_convert, "value"
+    )
+    int8_sdpa_attn_pattern = _get_int8_sdpa_attn_pattern(
+        has_mask, is_batch_size_1, is_reduced_type, has_convert
+    )
+    return CallFunction(
+        torch.ops.quantized_decomposed.quantize_per_tensor.default,
+        CallFunction(
+            aten.clone.default,
+            CallFunction(
+                aten.permute.default,
+                CallFunction(
+                    aten.reshape.default,
+                    CallFunction(
+                        aten.bmm.default,
+                        int8_sdpa_attn_pattern,
+                        int8_sdpa_v_pattern,
+                    ),
+                    Arg(),
+                ),
+                Arg(),
+            ),
+            memory_format=Arg(),
+        ),
+        KeywordArg("o_scale"),
+        KeywordArg("o_zp"),
+        Arg(),
+        Arg(),
+        Arg(),
+    )
+
+
+def _register_int8_sdpa_lowerings(custom_pass_dict):
+    for has_mask, is_batch_size_1, is_reduced_type, has_convert in itertools.product(
+        [True, False], [True, False], [True, False], [True, False]
+    ):
+        _register_int8_sdpa_pattern(
+            _get_int8_sdpa_final_pattern(
+                has_mask=has_mask,
+                is_batch_size_1=is_batch_size_1,
+                is_reduced_type=is_reduced_type,
+                has_convert=has_convert,
+            ),
+            custom_pass_dict,
+        )
+
+
+custom_pass = None
+if TORCH_VERSION_AT_LEAST_2_7:
+    # TORCH_VERSION_AT_LEAST_2_7 is needed for custom graph pass
+    from torch._inductor.custom_graph_pass import CustomGraphPass, get_hash_for_files
+
+    # define the custom pass
+    class _CustomPass(PatternMatcherPass, CustomGraphPass):
+        def __init__(self) -> None:
+            super().__init__()
+
+        def __call__(self, g: torch.fx.graph.Graph):
+            self.apply(g)
+
+        def uuid(self) -> bytes:
+            return get_hash_for_files((__file__,))
+
+    custom_pass = _CustomPass()
+
+
+@functools.lru_cache(None)
+def _int8_sdpa_init():
+    if TORCH_VERSION_AT_LEAST_2_7:
+        _register_int8_sdpa_lowerings(config.post_grad_custom_pre_pass)
+    else:
+        pass

From 212d912dcbfb43b13cc4bee533d3d1844d76b7c1 Mon Sep 17 00:00:00 2001
From: Yu Guo <82124926+yuguo68@users.noreply.github.com>
Date: Tue, 20 May 2025 19:11:18 -0700
Subject: [PATCH 037/165] use correct fp8 quantization dtype for AMD GPU

Differential Revision: D75021458

Pull Request resolved: https://github.com/pytorch/ao/pull/2225
---
 test/float8/test_base.py          | 10 ++++++++++
 torchao/quantization/quant_api.py | 15 ++++++++-------
 2 files changed, 18 insertions(+), 7 deletions(-)

diff --git a/test/float8/test_base.py b/test/float8/test_base.py
index c91782fb74..8e3efeab60 100644
--- a/test/float8/test_base.py
+++ b/test/float8/test_base.py
@@ -56,6 +56,7 @@
     tensor_to_scale,
 )
 from torchao.testing.float8.test_utils import get_test_float8_linear_config
+from torchao.utils import is_MI300, is_ROCM
 
 random.seed(0)
 torch.manual_seed(0)
@@ -271,6 +272,15 @@ def test_axiswise_gemm(self, a_shape, a_granularity, b_granularity):
         sqnr = compute_error(c_ref, c_fp8_compute)
         assert sqnr >= 25.0
 
+    @unittest.skipIf(not torch.cuda.is_available(), "CUDA not available")
+    def test_fp8_dtype(
+        self,
+    ):
+        if is_ROCM() and is_MI300():
+            assert e4m3_dtype == torch.float8_e4m3fnuz
+        else:
+            assert e4m3_dtype == torch.float8_e4m3fn
+
 
 class TestFloat8Linear:
     def _test_linear_impl(
diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index 982b8cdd5c..15e3b20fc8 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -52,6 +52,7 @@
     make_packed_linear_int8_dynamic_activation_intx_weight_tensor,
 )
 from torchao.dtypes.utils import Layout
+from torchao.float8.config import e4m3_dtype, e5m2_dtype
 from torchao.float8.float8_linear import Float8Linear
 from torchao.float8.inference import Float8MMConfig
 from torchao.quantization.linear_activation_weight_observed_tensor import (
@@ -1396,7 +1397,7 @@ class Float8WeightOnlyConfig(AOBaseConfig):
         The actual matmul will be computed in original precision of the weight tensor.
     """
 
-    weight_dtype: torch.dtype = torch.float8_e4m3fn
+    weight_dtype: torch.dtype = e4m3_dtype
     set_inductor_config: bool = True
 
 
@@ -1569,8 +1570,8 @@ class Float8DynamicActivationFloat8WeightConfig(AOBaseConfig):
 
     """
 
-    activation_dtype: torch.dtype = torch.float8_e4m3fn
-    weight_dtype: torch.dtype = torch.float8_e4m3fn
+    activation_dtype: torch.dtype = e4m3_dtype
+    weight_dtype: torch.dtype = e4m3_dtype
     granularity: Optional[
         Union[_fp8_granularities, Tuple[_fp8_granularities, _fp8_granularities]]
     ] = None
@@ -1660,8 +1661,8 @@ class Float8DynamicActivationFloat8SemiSparseWeightConfig(AOBaseConfig):
     """
 
     layout: Layout = CutlassSemiSparseLayout()
-    activation_dtype: torch.dtype = torch.float8_e5m2
-    weight_dtype: torch.dtype = torch.float8_e4m3fn
+    activation_dtype: torch.dtype = e5m2_dtype
+    weight_dtype: torch.dtype = e4m3_dtype
 
 
 @register_quantize_module_handler(Float8DynamicActivationFloat8SemiSparseWeightConfig)
@@ -1706,8 +1707,8 @@ class Float8StaticActivationFloat8WeightConfig(AOBaseConfig):
     """
 
     scale: torch.Tensor
-    activation_dtype: torch.dtype = torch.float8_e4m3fn
-    weight_dtype: torch.dtype = torch.float8_e4m3fn
+    activation_dtype: torch.dtype = e4m3_dtype
+    weight_dtype: torch.dtype = e4m3_dtype
     granularity: Optional[
         Union[_fp8_granularities, Tuple[_fp8_granularities, _fp8_granularities]]
     ] = None

From 04fb450912a3af7c08b45330936132c2d562e462 Mon Sep 17 00:00:00 2001
From: Apurva Jain <apurvajain.kota@gmail.com>
Date: Wed, 21 May 2025 13:56:38 -0700
Subject: [PATCH 038/165] Remove preserve_zero and zero_point_domain from
 choose_qparams_affine (#2149)

---
 test/dtypes/test_uintx.py                     |   9 +-
 test/quantization/test_quant_primitives.py    | 190 +---
 test/sparsity/test_marlin.py                  |   6 -
 torchao/dtypes/affine_quantized_tensor.py     | 258 ++++--
 torchao/dtypes/affine_quantized_tensor_ops.py |  17 +-
 torchao/dtypes/uintx/int4_cpu_layout.py       |  14 +-
 .../dtypes/uintx/tensor_core_tiled_layout.py  |  14 +-
 torchao/experimental/quant_passes.py          |   3 +-
 .../prototype/parq/quant/uniform_torchao.py   |  37 +-
 torchao/quantization/__init__.py              |   4 +
 torchao/quantization/pt2e/observer.py         |   4 -
 .../qat/affine_fake_quantized_tensor.py       |  51 +-
 torchao/quantization/quant_primitives.py      | 851 +++++++++++++-----
 torchao/quantization/utils.py                 |  76 +-
 14 files changed, 1014 insertions(+), 520 deletions(-)

diff --git a/test/dtypes/test_uintx.py b/test/dtypes/test_uintx.py
index 1e2b635f19..35c722365d 100644
--- a/test/dtypes/test_uintx.py
+++ b/test/dtypes/test_uintx.py
@@ -10,7 +10,6 @@
 from torchao.quantization.quant_api import quantize_, uintx_weight_only
 from torchao.quantization.quant_primitives import (
     MappingType,
-    ZeroPointDomain,
     choose_qparams_affine,
     dequantize_affine,
     quantize_affine,
@@ -112,7 +111,6 @@ def test_uintx_weight_only_quant(dtype, group_size, device):
     mapping_type = MappingType.SYMMETRIC
     eps = torch.finfo(torch.float32).eps
     zero_point_dtype = torch.int32
-    zero_point_domain = ZeroPointDomain.INT
     block_size = (1, group_size)
 
     scale, zero_point = choose_qparams_affine(
@@ -123,8 +121,6 @@ def test_uintx_weight_only_quant(dtype, group_size, device):
         eps=eps,
         scale_dtype=torch.float32,
         zero_point_dtype=zero_point_dtype,
-        preserve_zero=True,
-        zero_point_domain=zero_point_domain,
     )
 
     aqt = quantize_affine(
@@ -133,15 +129,12 @@ def test_uintx_weight_only_quant(dtype, group_size, device):
         scale,
         zero_point,
         dtype,
-        zero_point_domain=zero_point_domain,
     )
     # Note: output will be uint8 tensor for sub byte tensors for now
 
     q = to_uintx(aqt, dtype, -1)
     assert q is not None, "quantization failed"
-    deqaunt = dequantize_affine(
-        q, block_size, scale, zero_point, dtype, zero_point_domain=zero_point_domain
-    )
+    deqaunt = dequantize_affine(q, block_size, scale, zero_point, dtype)
     assert deqaunt is not None, "deqauntization failed"
 
 
diff --git a/test/quantization/test_quant_primitives.py b/test/quantization/test_quant_primitives.py
index 861ebe5e94..046fb6ab42 100644
--- a/test/quantization/test_quant_primitives.py
+++ b/test/quantization/test_quant_primitives.py
@@ -9,20 +9,16 @@
 import unittest
 
 import torch
-from parameterized import parameterized
 
-from torchao.float8.float8_utils import EPS as float8_eps
 from torchao.quantization.quant_primitives import (
     MappingType,
     ZeroPointDomain,
     choose_qparams_affine,
-    choose_qparams_affine_float8,
+    choose_qparams_affine_tinygemm,
     dequantize_affine,
-    dequantize_affine_float8,
     fake_quantize_affine,
     fake_quantize_affine_cachemask,
     quantize_affine,
-    quantize_affine_float8,
 )
 
 # TODO: remove test for utils?
@@ -650,35 +646,6 @@ def test_raises(self):
         with self.assertRaisesRegex(RuntimeError, "is invalid for input of size 1"):
             _ = quantize_affine(input, block_size, scale, zero_point, dtype)
 
-    def test_not_preserve_zero_not_supported(self):
-        """Making sure preserve_zero == False is not supported for symmetric quant"""
-        input = torch.randn(10, 256)
-        n_bit = 4
-        mapping_type = MappingType.SYMMETRIC
-        dtype = torch.int8
-        block_size = (1, 128)
-        quant_min = 0
-        quant_max = 2**n_bit - 1
-        eps = 1e-6
-        scale_dtype = torch.bfloat16
-        zero_point_dtype = torch.bfloat16
-        with self.assertRaisesRegex(
-            ValueError,
-            "preserve_zero == False is not supported for symmetric quantization",
-        ):
-            choose_qparams_affine(
-                input,
-                mapping_type,
-                block_size,
-                dtype,
-                quant_min,
-                quant_max,
-                eps,
-                scale_dtype=scale_dtype,
-                zero_point_dtype=zero_point_dtype,
-                preserve_zero=False,
-            )
-
     def test_get_groupwise_affine_qparams(self):
         input = torch.randn(10, 256)
         n_bit = 4
@@ -702,22 +669,33 @@ def test_get_groupwise_affine_qparams(self):
                 dtype=torch.bfloat16,
                 zero_point_domain=zero_point_domain,
             )
-            scale, zero_point = choose_qparams_affine(
-                input,
-                mapping_type,
-                block_size,
-                dtype,
-                quant_min,
-                quant_max,
-                eps,
-                scale_dtype=scale_dtype,
-                zero_point_dtype=zero_point_dtype,
-                preserve_zero=zero_point_domain == ZeroPointDomain.INT,
-                zero_point_domain=zero_point_domain,
-            )
+            if zero_point_domain == ZeroPointDomain.FLOAT:
+                scale, zero_point = choose_qparams_affine_tinygemm(
+                    input,
+                    mapping_type,
+                    block_size,
+                    dtype,
+                    quant_min,
+                    quant_max,
+                    eps,
+                    scale_dtype=scale_dtype,
+                    zero_point_dtype=zero_point_dtype,
+                )
+            else:
+                scale, zero_point = choose_qparams_affine(
+                    input,
+                    mapping_type,
+                    block_size,
+                    dtype,
+                    quant_min,
+                    quant_max,
+                    eps,
+                    scale_dtype=scale_dtype,
+                    zero_point_dtype=zero_point_dtype,
+                )
 
-        self.assertTrue(torch.equal(scale, scale_ref))
-        self.assertTrue(torch.equal(zero_point, zero_point_ref))
+            self.assertTrue(torch.equal(scale, scale_ref))
+            self.assertTrue(torch.equal(zero_point, zero_point_ref))
 
     def test_groupwise_affine_quantize_tensor_from_qparams(self):
         input = torch.randn(10, 256)
@@ -847,120 +825,6 @@ def test_fake_quantize_affine_cachemask(self):
         torch.testing.assert_close(dequantized, fake_quantized)
         torch.testing.assert_close(expected_mask, mask)
 
-    def test_none_zero_point_domain(self):
-        """A None value for a ZeroPointDomain should not work, but ZeroPointDomain.NONE should"""
-        input = torch.randn(10, 256)
-        mapping_type = MappingType.SYMMETRIC
-        dtype = torch.int8
-        block_size = (1, 128)
-        quant_min = None
-        quant_max = None
-        eps = 1e-6
-        scale_dtype = torch.float32
-        zero_point_dtype = torch.int64
-        try:
-            _, zero_point = choose_qparams_affine(
-                input,
-                mapping_type,
-                block_size,
-                dtype,
-                quant_min,
-                quant_max,
-                eps,
-                scale_dtype=scale_dtype,
-                zero_point_dtype=zero_point_dtype,
-                preserve_zero=True,
-                zero_point_domain=None,
-            )
-        except ValueError:
-            # This exception was expected
-            # Now test for ZeroPointDomain.NONE
-            _, zero_point = choose_qparams_affine(
-                input,
-                mapping_type,
-                block_size,
-                dtype,
-                quant_min,
-                quant_max,
-                eps,
-                scale_dtype=scale_dtype,
-                zero_point_dtype=zero_point_dtype,
-                preserve_zero=True,
-                zero_point_domain=ZeroPointDomain.NONE,
-            )
-            self.assertTrue(zero_point is None)
-        else:
-            # An exception should have been thrown for zero_point_domain None
-            self.assertTrue(
-                False,
-                msg="A runtime exception should have been thrown for zero_point_domain None",
-            )
-
-    @parameterized.expand(
-        [
-            (
-                torch.float32,
-                torch.float8_e4m3fn,
-            ),
-            (
-                torch.float32,
-                torch.float8_e5m2,
-            ),
-            (
-                torch.bfloat16,
-                torch.float8_e4m3fn,
-            ),
-            (
-                torch.bfloat16,
-                torch.float8_e5m2,
-            ),
-        ]
-    )
-    def test_float8_quant_primitives(self, hp_dtype, float8_dtype):
-        input = torch.randn(10, 10)
-
-        # float8 quantization primitives
-        scale = choose_qparams_affine_float8(input, float8_dtype=float8_dtype)
-        quantized = quantize_affine_float8(input, scale, float8_dtype=float8_dtype)
-        dequantized = dequantize_affine_float8(quantized, scale, output_dtype=hp_dtype)
-
-        # reference implementation using generic primitives
-        expected_scale, _ = choose_qparams_affine(
-            input,
-            MappingType.SYMMETRIC,
-            input.shape,
-            float8_dtype,
-            eps=float8_eps,  # use same EPS as float8 training
-            scale_dtype=torch.float32,
-            quant_min=torch.finfo(float8_dtype).min,
-            quant_max=torch.finfo(float8_dtype).max,
-        )
-        expected_quantized = quantize_affine(
-            input,
-            input.shape,
-            scale,
-            output_dtype=float8_dtype,
-            quant_min=torch.finfo(float8_dtype).min,
-            quant_max=torch.finfo(float8_dtype).max,
-            zero_point=None,
-            zero_point_domain=ZeroPointDomain.NONE,
-        )
-        expected_dequantized = dequantize_affine(
-            expected_quantized,
-            input.shape,
-            scale,
-            input_dtype=float8_dtype,
-            output_dtype=hp_dtype,
-            quant_min=torch.finfo(float8_dtype).min,
-            quant_max=torch.finfo(float8_dtype).max,
-            zero_point=None,
-            zero_point_domain=ZeroPointDomain.NONE,
-        )
-
-        self.assertTrue(torch.equal(expected_scale, scale))
-        torch.testing.assert_close(expected_quantized, quantized)
-        torch.testing.assert_close(expected_dequantized, dequantized)
-
 
 if __name__ == "__main__":
     unittest.main()
diff --git a/test/sparsity/test_marlin.py b/test/sparsity/test_marlin.py
index 15a6823961..783de6c6ae 100644
--- a/test/sparsity/test_marlin.py
+++ b/test/sparsity/test_marlin.py
@@ -14,7 +14,6 @@
 from torchao.quantization.quant_api import int4_weight_only, quantize_
 from torchao.quantization.quant_primitives import (
     MappingType,
-    ZeroPointDomain,
     choose_qparams_affine,
     quantize_affine,
 )
@@ -92,8 +91,6 @@ def test_pack_unpack_equivalence(self):
         eps = 1e-6
         zero_point_dtype = torch.bfloat16
         mapping_type = MappingType.SYMMETRIC
-        preserve_zero = True
-        zero_point_domain = ZeroPointDomain.INT
         scale_dtype = None
 
         w = torch.rand(shape, dtype=torch.float16, device="cuda")
@@ -112,8 +109,6 @@ def test_pack_unpack_equivalence(self):
             eps,
             scale_dtype,
             zero_point_dtype,
-            preserve_zero,
-            zero_point_domain,
         )
         w_q_24 = quantize_affine(
             w_24,
@@ -123,7 +118,6 @@ def test_pack_unpack_equivalence(self):
             target_dtype,
             quant_min,
             quant_max,
-            zero_point_domain,
         )
         scales = scales.reshape(-1, w_q_24.shape[1])
 
diff --git a/torchao/dtypes/affine_quantized_tensor.py b/torchao/dtypes/affine_quantized_tensor.py
index beaac8b0e1..65649593a3 100644
--- a/torchao/dtypes/affine_quantized_tensor.py
+++ b/torchao/dtypes/affine_quantized_tensor.py
@@ -19,12 +19,21 @@
     MappingType,
     ZeroPointDomain,
     choose_qparams_affine,
+    choose_qparams_affine_dont_preserve_zero,
+    choose_qparams_affine_float8,
     choose_qparams_affine_floatx,
+    choose_qparams_affine_tinygemm,
     choose_qparams_and_quantize_affine_hqq,
     dequantize_affine,
+    dequantize_affine_float8,
+    dequantize_affine_float_zero_point,
     dequantize_affine_floatx,
+    dequantize_affine_no_zero_point,
     quantize_affine,
+    quantize_affine_float8,
+    quantize_affine_float_zero_point,
     quantize_affine_floatx,
+    quantize_affine_no_zero_point,
 )
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
@@ -129,7 +138,7 @@ def dequantize(self, output_dtype: Optional[torch.dtype] = None) -> torch.Tensor
         if output_dtype is None:
             output_dtype = self.dtype
 
-        from torchao.dtypes.floatx import FloatxTensorCoreLayout
+        from torchao.dtypes.floatx import Float8Layout, FloatxTensorCoreLayout
 
         if isinstance(self._layout, FloatxTensorCoreLayout):
             int_data, scale = self.tensor_impl.get_plain()
@@ -140,19 +149,44 @@ def dequantize(self, output_dtype: Optional[torch.dtype] = None) -> torch.Tensor
                 self._layout.mbits,
                 output_dtype=output_dtype,
             )
+        elif isinstance(self._layout, Float8Layout):
+            data, scale, _ = self.tensor_impl.get_plain()
+            return dequantize_affine_float8(data, scale, output_dtype)
         else:
             data, scale, zero_point = self.tensor_impl.get_plain()
-            dq = dequantize_affine(
-                data,
-                self.block_size,
-                scale,
-                zero_point,
-                data.dtype,
-                self.quant_min,
-                self.quant_max,
-                self.zero_point_domain,
-                output_dtype=output_dtype,
-            )
+            if self.zero_point_domain == ZeroPointDomain.FLOAT:
+                dq = dequantize_affine_float_zero_point(
+                    data,
+                    self.block_size,
+                    scale,
+                    zero_point,
+                    data.dtype,
+                    self.quant_min,
+                    self.quant_max,
+                    output_dtype=output_dtype,
+                )
+            elif self.zero_point_domain == ZeroPointDomain.NONE:
+                dq = dequantize_affine_no_zero_point(
+                    data,
+                    self.block_size,
+                    scale,
+                    zero_point,
+                    data.dtype,
+                    self.quant_min,
+                    self.quant_max,
+                    output_dtype=output_dtype,
+                )
+            else:
+                dq = dequantize_affine(
+                    data,
+                    self.block_size,
+                    scale,
+                    zero_point,
+                    data.dtype,
+                    self.quant_min,
+                    self.quant_max,
+                    output_dtype=output_dtype,
+                )
             from torchao.dtypes.uintx import TensorCoreTiledLayout
 
             if isinstance(self._layout, TensorCoreTiledLayout):
@@ -256,32 +290,74 @@ def from_hp_to_intx(
             )
             data = data.to(target_dtype)
         else:
-            scale, zero_point = choose_qparams_affine(
-                input_float,
-                mapping_type,
-                block_size,
-                target_dtype,
-                quant_min,
-                quant_max,
-                eps,
-                scale_dtype,
-                zero_point_dtype,
-                preserve_zero,
-                zero_point_domain,
-            )
+            if zero_point_domain == ZeroPointDomain.FLOAT and not preserve_zero:
+                scale, zero_point = choose_qparams_affine_tinygemm(
+                    input_float,
+                    mapping_type,
+                    block_size,
+                    target_dtype,
+                    quant_min,
+                    quant_max,
+                    eps,
+                    scale_dtype,
+                    zero_point_dtype,
+                )
+            elif zero_point_domain == ZeroPointDomain.INT and not preserve_zero:
+                scale, zero_point = choose_qparams_affine_dont_preserve_zero(
+                    input_float,
+                    mapping_type,
+                    block_size,
+                    target_dtype,
+                    quant_min,
+                    quant_max,
+                    eps,
+                    scale_dtype,
+                    zero_point_dtype,
+                )
+            else:  # Default case: zero_point_domain == ZeroPointDomain.INT/NONE and preserve_zero
+                scale, zero_point = choose_qparams_affine(
+                    input_float,
+                    mapping_type,
+                    block_size,
+                    target_dtype,
+                    quant_min,
+                    quant_max,
+                    eps,
+                    scale_dtype,
+                    zero_point_dtype,
+                )
             # choose_qparams_affine is a custom op that does support returning optional Tensors. We thus set the zero_point to None if its domain is None
             if zero_point_domain == ZeroPointDomain.NONE:
                 zero_point = None
-            data = quantize_affine(
-                input_float,
-                block_size,
-                scale,
-                zero_point,
-                target_dtype,
-                quant_min,
-                quant_max,
-                zero_point_domain,
-            )
+                data = quantize_affine_no_zero_point(
+                    input_float,
+                    block_size,
+                    scale,
+                    zero_point,
+                    target_dtype,
+                    quant_min,
+                    quant_max,
+                )
+            elif zero_point_domain == ZeroPointDomain.FLOAT:
+                data = quantize_affine_float_zero_point(
+                    input_float,
+                    block_size,
+                    scale,
+                    zero_point,
+                    target_dtype,
+                    quant_min,
+                    quant_max,
+                )
+            else:
+                data = quantize_affine(
+                    input_float,
+                    block_size,
+                    scale,
+                    zero_point,
+                    target_dtype,
+                    quant_min,
+                    quant_max,
+                )
             # Note: output will be uint8 tensor for sub byte tensors for now
 
         data, scale, zero_point = _layout.post_process(
@@ -317,25 +393,42 @@ def from_hp_to_intx_static(
             raise ValueError("please use ZeroPointDomain.NONE instead of None")
         elif zero_point_domain is ZeroPointDomain.NONE and zero_point is not None:
             raise ValueError("zero_point should be None when zero_point_domain is NONE")
-        if target_dtype not in FP8_TYPES:
-            assert zero_point is not None, (
-                "zero_point must be specified for non-fp8 types"
-            )
         original_shape = input_float.shape
         input_float, scale, zero_point = _layout.pre_process_static(
             input_float, scale, zero_point, block_size
         )
 
-        int_data = quantize_affine(
-            input_float,
-            block_size,
-            scale,
-            zero_point,
-            target_dtype,
-            quant_min,
-            quant_max,
-            zero_point_domain,
-        )
+        if zero_point_domain == ZeroPointDomain.NONE:
+            zero_point = None
+            int_data = quantize_affine_no_zero_point(
+                input_float,
+                block_size,
+                scale,
+                zero_point,
+                target_dtype,
+                quant_min,
+                quant_max,
+            )
+        elif zero_point_domain == ZeroPointDomain.FLOAT:
+            int_data = quantize_affine_float_zero_point(
+                input_float,
+                block_size,
+                scale,
+                zero_point,
+                target_dtype,
+                quant_min,
+                quant_max,
+            )
+        else:
+            int_data = quantize_affine(
+                input_float,
+                block_size,
+                scale,
+                zero_point,
+                target_dtype,
+                quant_min,
+                quant_max,
+            )
 
         int_data, scale, zero_point = _layout.post_process(
             int_data,
@@ -367,20 +460,22 @@ def from_hp_to_floatx(
     ):
         """Convert a high precision tensor to a float8 quantized tensor."""
         if target_dtype in FP8_TYPES:
-            return cls.from_hp_to_intx(
-                input_float=input_float,
-                mapping_type=MappingType.SYMMETRIC,
-                block_size=block_size,
-                target_dtype=target_dtype,
-                quant_min=math.ceil(torch.finfo(target_dtype).min),
-                quant_max=math.ceil(torch.finfo(target_dtype).max),
-                eps=torch.finfo(torch.float32).eps,
-                scale_dtype=scale_dtype,
-                zero_point_dtype=None,
-                preserve_zero=True,
-                zero_point_domain=ZeroPointDomain.NONE,
-                _layout=_layout,
-                use_hqq=False,
+            original_shape = input_float.shape
+            input_float = _layout.pre_process(input_float)
+
+            scale = choose_qparams_affine_float8(input_float, float8_dtype=target_dtype)
+            data = quantize_affine_float8(input_float, scale, target_dtype)
+
+            data, scale, zero_point = _layout.post_process(
+                data, scale, None, block_size
+            )
+            tensor_impl_ctr = get_tensor_impl_constructor(type(_layout))
+            tensor_impl = tensor_impl_ctr(data, scale, zero_point, _layout)
+            return cls(
+                tensor_impl,
+                block_size,
+                original_shape,
+                dtype=input_float.dtype,
             )
         else:
             raise NotImplementedError(
@@ -395,19 +490,36 @@ def from_hp_to_floatx_static(
         block_size: Tuple[int, ...],
         target_dtype: torch.dtype,
         _layout: Layout,
+        scale_dtype: torch.dtype = torch.float32,
     ):
         """Create a float8 AffineQuantizedTensor from a high precision tensor using static parameters."""
         if target_dtype in FP8_TYPES:
-            return cls.from_hp_to_intx_static(
-                input_float=input_float,
-                scale=scale,
-                zero_point=None,
-                block_size=block_size,
-                target_dtype=target_dtype,
-                quant_min=math.ceil(torch.finfo(target_dtype).min),
-                quant_max=math.ceil(torch.finfo(target_dtype).max),
-                zero_point_domain=ZeroPointDomain.NONE,
-                _layout=_layout,
+            original_shape = input_float.shape
+            input_float, scale, zero_point = _layout.pre_process_static(
+                input_float, scale, ZeroPointDomain.NONE, block_size
+            )
+
+            data = quantize_affine_float8(
+                input_float,
+                scale,
+                target_dtype,
+                scale_dtype,
+            )
+
+            data, scale, zero_point = _layout.post_process(
+                data,
+                scale,
+                zero_point,
+                block_size,
+            )
+
+            tensor_impl_ctr = get_tensor_impl_constructor(type(_layout))
+            tensor_impl = tensor_impl_ctr(data, scale, zero_point, _layout)
+            return cls(
+                tensor_impl,
+                block_size,
+                original_shape,
+                dtype=input_float.dtype,
             )
         else:
             raise NotImplementedError(
diff --git a/torchao/dtypes/affine_quantized_tensor_ops.py b/torchao/dtypes/affine_quantized_tensor_ops.py
index 1d70f5c7f3..e9702a33ac 100644
--- a/torchao/dtypes/affine_quantized_tensor_ops.py
+++ b/torchao/dtypes/affine_quantized_tensor_ops.py
@@ -90,7 +90,12 @@
     _linear_bf16_act_uint4_weight_check,
     _linear_bf16_act_uint4_weight_impl,
 )
-from torchao.quantization.quant_primitives import dequantize_affine
+from torchao.quantization.quant_primitives import (
+    ZeroPointDomain,
+    dequantize_affine,
+    dequantize_affine_float_zero_point,
+    dequantize_affine_no_zero_point,
+)
 from torchao.utils import (
     fill_defaults,
 )
@@ -313,7 +318,14 @@ def _(func, types, args, kwargs):
     # batchsize or other dims gets added to sliced_data, sliced_scale and sliced_zero_point so
     # we need to increase block size to correct dim
     new_blocks = idx.dim() - 1
-    return dequantize_affine(
+    if args[1].zero_point_domain == ZeroPointDomain.FLOAT:
+        _dequantize_affine = dequantize_affine_float_zero_point
+    elif args[1].zero_point_domain == ZeroPointDomain.NONE:
+        _dequantize_affine = dequantize_affine_no_zero_point
+    else:
+        _dequantize_affine = dequantize_affine
+
+    return _dequantize_affine(
         sliced_data,
         new_blocks * [1] + list(args[1].block_size),
         sliced_scale,
@@ -321,7 +333,6 @@ def _(func, types, args, kwargs):
         sliced_data.dtype,
         args[1].quant_min,
         args[1].quant_max,
-        args[1].zero_point_domain,
         output_dtype=sliced_scale.dtype,
     )
 
diff --git a/torchao/dtypes/uintx/int4_cpu_layout.py b/torchao/dtypes/uintx/int4_cpu_layout.py
index 9c368fd17a..56812ee4e1 100644
--- a/torchao/dtypes/uintx/int4_cpu_layout.py
+++ b/torchao/dtypes/uintx/int4_cpu_layout.py
@@ -17,7 +17,10 @@
     register_layout,
 )
 from torchao.dtypes.utils import AQTTensorImpl, Layout, is_device
-from torchao.quantization.quant_primitives import ZeroPointDomain
+from torchao.quantization.quant_primitives import (
+    ZeroPointDomain,
+    quantize_affine_float_zero_point,
+)
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
     TORCH_VERSION_AT_LEAST_2_6,
@@ -236,10 +239,6 @@ def block_size(self):
         return (1, groupsize)
 
     def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
-        from torchao.quantization.quant_primitives import (
-            ZeroPointDomain,
-            quantize_affine,
-        )
         from torchao.quantization.utils import unpack_tinygemm_scales_and_zeros
 
         scale, zero = unpack_tinygemm_scales_and_zeros(self.scale_and_zero)
@@ -255,7 +254,7 @@ def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
         target_dtype = torch.int32
         quant_min = 0
         quant_max = 15
-        zero_point_domain = ZeroPointDomain.FLOAT
+        # zero_point_domain is ZeroPointDomain.FLOAT  # TODO: clean up later
         assert len(block_size) == 2 and block_size[0] == 1
         dequantized = torch.ops.aten._weight_int4pack_mm_for_cpu(
             torch.eye(eye_shape, device=device, dtype=original_dtype),
@@ -267,7 +266,7 @@ def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
         # TODO: move this to `unpack_tinygemm_scales_and_zeros`?
         scale = scale.reshape(scale.shape[:-1]).contiguous()
         zero = zero.reshape(zero.shape[:-1]).contiguous()
-        int_data = quantize_affine(
+        int_data = quantize_affine_float_zero_point(
             dequantized,
             block_size,
             scale,
@@ -275,7 +274,6 @@ def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
             target_dtype,
             quant_min,
             quant_max,
-            zero_point_domain,
         )
         return int_data, scale, zero
 
diff --git a/torchao/dtypes/uintx/tensor_core_tiled_layout.py b/torchao/dtypes/uintx/tensor_core_tiled_layout.py
index 3bf9ef6b72..48910038cf 100644
--- a/torchao/dtypes/uintx/tensor_core_tiled_layout.py
+++ b/torchao/dtypes/uintx/tensor_core_tiled_layout.py
@@ -17,7 +17,11 @@
     register_layout,
 )
 from torchao.dtypes.utils import AQTTensorImpl, Layout, is_device
-from torchao.quantization.quant_primitives import ZeroPointDomain, _get_reduction_params
+from torchao.quantization.quant_primitives import (
+    ZeroPointDomain,
+    _get_reduction_params,
+    quantize_affine_float_zero_point,
+)
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
     fill_defaults,
@@ -464,10 +468,6 @@ def block_size(self):
         return tuple([*ones, groupsize])
 
     def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
-        from torchao.quantization.quant_primitives import (
-            ZeroPointDomain,
-            quantize_affine,
-        )
         from torchao.quantization.utils import unpack_tinygemm_scales_and_zeros
 
         def dequant_4d(self):
@@ -510,8 +510,7 @@ def dequant_4d(self):
         target_dtype = torch.int32
         quant_min = 0
         quant_max = 15
-        zero_point_domain = ZeroPointDomain.FLOAT
-        int_data = quantize_affine(
+        int_data = quantize_affine_float_zero_point(
             dequantized,
             self.block_size,
             scale,
@@ -519,7 +518,6 @@ def dequant_4d(self):
             target_dtype,
             quant_min,
             quant_max,
-            zero_point_domain,
         )
         return int_data, scale, zero
 
diff --git a/torchao/experimental/quant_passes.py b/torchao/experimental/quant_passes.py
index 6c1fad5bbf..a7189d792b 100644
--- a/torchao/experimental/quant_passes.py
+++ b/torchao/experimental/quant_passes.py
@@ -91,7 +91,7 @@ def _get_q_dq_linear_patterns_replacements_and_filters(
 
     lcls = {}
 
-    pattern_str = f"""
+    pattern_str = """
 def pattern(
     a, a_block_size, a_zero_point_dtype,
     w_int_data, w_block_size, w_scale, w_zero_point, w_target_dtype,
@@ -121,7 +121,6 @@ def pattern(
         w_target_dtype,
         w_quant_min,
         w_quant_max,
-        {"'INT'" if has_weight_zeros else "'NONE'"}
     )
     return torch.ops.aten.linear.default(dq_a, dq_w, bias)
 """
diff --git a/torchao/prototype/parq/quant/uniform_torchao.py b/torchao/prototype/parq/quant/uniform_torchao.py
index 0579a23b02..f742778ed0 100644
--- a/torchao/prototype/parq/quant/uniform_torchao.py
+++ b/torchao/prototype/parq/quant/uniform_torchao.py
@@ -15,8 +15,14 @@
     MappingType,
     ZeroPointDomain,
     choose_qparams_affine,
+    choose_qparams_affine_dont_preserve_zero,
+    choose_qparams_affine_tinygemm,
     dequantize_affine,
+    dequantize_affine_float_zero_point,
+    dequantize_affine_no_zero_point,
     quantize_affine,
+    quantize_affine_float_zero_point,
+    quantize_affine_no_zero_point,
 )
 
 from .quantizer import Quantizer
@@ -67,32 +73,46 @@ def quantize(
 
         # assume that p has already been grouped in QuantOptimizer.step
         block_size = (1, p.size(-1)) if dim is not None else p.size()
-        s, zero_point = choose_qparams_affine(
+
+        if self.zero_point_domain == ZeroPointDomain.FLOAT and not self.preserve_zero:
+            _choose_qparams_affine = choose_qparams_affine_tinygemm
+            _quantize_affine = quantize_affine_float_zero_point
+            _dequantize_affine = dequantize_affine_float_zero_point
+        elif self.zero_point_domain == ZeroPointDomain.INT and not self.preserve_zero:
+            _choose_qparams_affine = choose_qparams_affine_dont_preserve_zero
+            _quantize_affine = quantize_affine
+            _dequantize_affine = dequantize_affine
+        else:  # Default case: zero_point_domain == ZeroPointDomain.INT/NONE and preserve_zero
+            _choose_qparams_affine = choose_qparams_affine
+            if self.zero_point_domain == ZeroPointDomain.INT:
+                _quantize_affine = quantize_affine
+                _dequantize_affine = dequantize_affine
+            else:
+                _quantize_affine = quantize_affine_no_zero_point
+                _dequantize_affine = dequantize_affine_no_zero_point
+
+        s, zero_point = _choose_qparams_affine(
             p,
             self.mapping_type,
             block_size,
             self.target_dtype,
             eps=self.eps,
-            preserve_zero=self.preserve_zero,
             quant_min=self.quant_min,
             quant_max=self.quant_max,
-            zero_point_domain=self.zero_point_domain,
         )
         q_args = (block_size, s, zero_point, self.target_dtype)
-        q = quantize_affine(
+        q = _quantize_affine(
             p,
             *q_args,
             quant_min=self.quant_min,
             quant_max=self.quant_max,
-            zero_point_domain=self.zero_point_domain,
         )
-        q = dequantize_affine(
+        q = _dequantize_affine(
             q,
             *q_args,
             output_dtype=p.dtype,
             quant_min=self.quant_min,
             quant_max=self.quant_max,
-            zero_point_domain=self.zero_point_domain,
         )
 
         Q = torch.arange(
@@ -104,14 +124,13 @@ def quantize(
         else:
             block_size = Q.shape
 
-        Q = dequantize_affine(
+        Q = _dequantize_affine(
             Q,
             block_size,
             *q_args[1:],
             output_dtype=p.dtype,
             quant_min=self.quant_min,
             quant_max=self.quant_max,
-            zero_point_domain=self.zero_point_domain,
         )
         return q, Q
 
diff --git a/torchao/quantization/__init__.py b/torchao/quantization/__init__.py
index dc6431b2cf..109de5c0c5 100644
--- a/torchao/quantization/__init__.py
+++ b/torchao/quantization/__init__.py
@@ -79,7 +79,9 @@
     TorchAODType,
     ZeroPointDomain,
     choose_qparams_affine,
+    choose_qparams_affine_dont_preserve_zero,
     choose_qparams_affine_floatx,
+    choose_qparams_affine_tinygemm,
     choose_qparams_affine_with_min_max,
     choose_qparams_and_quantize_affine_hqq,
     dequantize_affine,
@@ -161,6 +163,8 @@
     "AffineQuantizedObserverBase",
     # quant primitive ops
     "choose_qparams_affine",
+    "choose_qparams_affine_tinygemm",
+    "choose_qparams_affine_dont_preserve_zero",
     "choose_qparams_affine_with_min_max",
     "choose_qparams_affine_floatx",
     "quantize_affine",
diff --git a/torchao/quantization/pt2e/observer.py b/torchao/quantization/pt2e/observer.py
index f6534308d8..b781f5a07e 100644
--- a/torchao/quantization/pt2e/observer.py
+++ b/torchao/quantization/pt2e/observer.py
@@ -1904,8 +1904,6 @@ def convert(self, model: torch.fx.GraphModule, observer_node: Node):
                         self.eps,
                         self.scale_dtype,
                         self.zero_point_dtype,
-                        self.preserve_zero,
-                        self.zero_point_domain.name,
                     ),
                 )
                 scale_node = model.graph.call_function(
@@ -1933,7 +1931,6 @@ def convert(self, model: torch.fx.GraphModule, observer_node: Node):
                     self.target_dtype,
                     self.quant_min,
                     self.quant_max,
-                    self.zero_point_domain.name,
                 ),
                 {},
             )
@@ -1947,7 +1944,6 @@ def convert(self, model: torch.fx.GraphModule, observer_node: Node):
                     self.target_dtype,
                     self.quant_min,
                     self.quant_max,
-                    self.zero_point_domain.name,
                 ),
                 {"output_dtype": self.original_dtype},
             )
diff --git a/torchao/quantization/qat/affine_fake_quantized_tensor.py b/torchao/quantization/qat/affine_fake_quantized_tensor.py
index 6829441f51..fe26369c31 100644
--- a/torchao/quantization/qat/affine_fake_quantized_tensor.py
+++ b/torchao/quantization/qat/affine_fake_quantized_tensor.py
@@ -14,6 +14,8 @@
     ZeroPointDomain,
     _get_and_check_qmin_qmax,
     choose_qparams_affine,
+    choose_qparams_affine_dont_preserve_zero,
+    choose_qparams_affine_tinygemm,
 )
 from torchao.utils import TorchAOBaseTensor
 
@@ -52,19 +54,42 @@ def forward(
         def apply_fake_quant_fn(t: torch.Tensor):
             assert isinstance(t, AffineFakeQuantizedTensor)
             qmin, qmax = _get_and_check_qmin_qmax(target_dtype, quant_min, quant_max)
-            scale, zero_point = choose_qparams_affine(
-                t.original_tensor,
-                mapping_type,
-                block_size,
-                target_dtype,
-                qmin,
-                qmax,
-                eps,
-                scale_dtype,
-                zero_point_dtype,
-                preserve_zero,
-                zero_point_domain,
-            )
+            if zero_point_domain == ZeroPointDomain.FLOAT and not preserve_zero:
+                scale, zero_point = choose_qparams_affine_tinygemm(
+                    t.original_tensor,
+                    mapping_type,
+                    block_size,
+                    target_dtype,
+                    qmin,
+                    qmax,
+                    eps,
+                    scale_dtype,
+                    zero_point_dtype,
+                )
+            elif zero_point_domain == ZeroPointDomain.INT and not preserve_zero:
+                scale, zero_point = choose_qparams_affine_dont_preserve_zero(
+                    t.original_tensor,
+                    mapping_type,
+                    block_size,
+                    target_dtype,
+                    qmin,
+                    qmax,
+                    eps,
+                    scale_dtype,
+                    zero_point_dtype,
+                )
+            else:  # Default case: zero_point_domain == ZeroPointDomain.INT and preserve_zero
+                scale, zero_point = choose_qparams_affine(
+                    t.original_tensor,
+                    mapping_type,
+                    block_size,
+                    target_dtype,
+                    qmin,
+                    qmax,
+                    eps,
+                    scale_dtype,
+                    zero_point_dtype,
+                )
             fq = _GenericFakeQuantize.apply(
                 t,
                 block_size,
diff --git a/torchao/quantization/quant_primitives.py b/torchao/quantization/quant_primitives.py
index d13ac330a0..1885755608 100644
--- a/torchao/quantization/quant_primitives.py
+++ b/torchao/quantization/quant_primitives.py
@@ -19,16 +19,21 @@
     TORCH_VERSION_AT_LEAST_2_3,
     TORCH_VERSION_AT_LEAST_2_5,
     TORCH_VERSION_AT_LEAST_2_6,
-    _is_float8_type,
     _register_custom_op,
 )
 
 __all__ = [
     "choose_qparams_affine",
+    "choose_qparams_affine_tinygemm",
+    "choose_qparams_affine_dont_preserve_zero",
     "choose_qparams_affine_with_min_max",
     "choose_qparams_affine_floatx",
     "quantize_affine",
+    "quantize_affine_no_zero_point",
+    "quantize_affine_float_zero_point",
     "dequantize_affine",
+    "dequantize_affine_no_zero_point",
+    "dequantize_affine_float_zero_point",
     "quantize_affine_floatx",
     "dequantize_affine_floatx",
     "fake_quantize_affine",
@@ -289,7 +294,6 @@ def quantize_affine(
     output_dtype: torch.dtype,
     quant_min: Optional[Union[int, float]] = None,
     quant_max: Optional[Union[int, float]] = None,
-    zero_point_domain: ZeroPointDomain = ZeroPointDomain.INT,
 ) -> torch.Tensor:
     """
     Args:
@@ -301,12 +305,6 @@ def quantize_affine(
       output_dtype (torch.dtype): requested dtype (e.g. torch.uint8) for output Tensor
       quant_min (Optional[int]): minimum quantized value for output Tensor, if not specified, it will be derived from dtype
       quant_max (Optional[int]): maximum quantized value for output Tensor, if not specified, it will be derived from dtype
-      zero_point_domain (ZeroPointDomain): the domain that zero_point is in, should be either integer or float
-        if zero_point is in integer domain, zero point is added to the quantized integer value during
-        quantization
-        if zero_point is in floating point domain, zero point is subtracted from the floating point (unquantized)
-        value during quantization
-        default is ZeroPointDomain.INT
 
     Note:
       How can block_size represent different granularities?
@@ -324,10 +322,6 @@ def quantize_affine(
     Output:
       quantized tensor with requested dtype
     """
-    if zero_point_domain is None:
-        raise ValueError("Please use ZeroPointDomain.NONE instead of None")
-    elif zero_point_domain is ZeroPointDomain.NONE and zero_point is not None:
-        raise ValueError("zero_point should be None when zero_point_domain is NONE")
     return _quantize_affine(
         input,
         block_size,
@@ -336,7 +330,6 @@ def quantize_affine(
         output_dtype,
         quant_min,
         quant_max,
-        zero_point_domain.name,
     )
 
 
@@ -349,16 +342,12 @@ def _quantize_affine(
     output_dtype: torch.dtype,
     quant_min: Optional[Union[int, float, bool]] = None,
     quant_max: Optional[Union[int, float, bool]] = None,
-    zero_point_domain: str = ZeroPointDomain.INT.name,
 ) -> torch.Tensor:
     """op definition that has compatible signatures with custom op library
 
     Note:
-        zero_point_domain is optional specifies how we quantize the floating point to quantized data:
+        zero_point_domain is pre-defined specifies how we quantize the floating point to quantized data:
         INT: quantized_val = (float_val / scale) (integer) + zero_point (integer)
-        FLOAT: quantized_val = (float_val - (zero_point (float) - scale * mid_point)) / scale
-        None: quantized_val = (float_val / scale) | this is primarily used for floatx quantization
-            Where we do not want to round values to nearest integer and instead scale and cast.
     """
     quant_min, quant_max = _get_and_check_qmin_qmax(output_dtype, quant_min, quant_max)
     # workaround for uintx dtypes, since we don't have native Uintx dtype connected with
@@ -372,8 +361,6 @@ def _quantize_affine(
         zero_point,
         quant_min,
         quant_max,
-        output_dtype,
-        zero_point_domain,
     ).to(output_dtype)
 
 
@@ -384,14 +371,12 @@ def _quantize_affine_no_dtype_cast(
     zero_point: Optional[torch.Tensor],
     quant_min: Union[int, float],
     quant_max: Union[int, float],
-    quant_dtype: torch.dtype,
-    zero_point_domain: str = ZeroPointDomain.INT.name,
 ) -> torch.Tensor:
     """
     The op does the following:
     1. figure out the dimension for reduction based on block_size, also reshape the input to align with
        the shape after reduction
-    2. quantize the input based on the quantization parameters scale and zero_point and args like zero_point_domain
+    2. quantize the input based on the quantization parameters scale and zero_point and zero_point_domain = INT
     3. reshape the quantized result to origianl shape
     """
     # TODO: validations
@@ -421,27 +406,178 @@ def _quantize_affine_no_dtype_cast(
         # with numel=0 which we handle by unifying the two
         zero_point = None
 
-    if zero_point_domain == ZeroPointDomain.INT.name:
-        quant = torch.clamp(
-            torch.round(input * (1.0 / scale)) + zero_point, quant_min, quant_max
-        )
-    elif zero_point_domain == ZeroPointDomain.NONE.name:
-        assert zero_point is None, (
-            "zero_point should be None when zero_point_domain is NONE"
-        )
-        if _is_float8_type(quant_dtype):
-            quant = torch.clamp(input * scale.reciprocal(), quant_min, quant_max)
-        else:
-            quant = torch.clamp(
-                torch.round(input * (1.0 / scale)), quant_min, quant_max
-            )
+    quant = torch.clamp(
+        torch.round(input * (1.0 / scale)) + zero_point, quant_min, quant_max
+    )
+    quant = quant.view(original_shape)
+
+    return quant
+
+
+def quantize_affine_float_zero_point(
+    input: torch.Tensor,
+    block_size: List[int],
+    scale: torch.Tensor,
+    zero_point: Optional[torch.Tensor],
+    output_dtype: torch.dtype,
+    quant_min: Optional[Union[int, float, bool]] = None,
+    quant_max: Optional[Union[int, float, bool]] = None,
+) -> torch.Tensor:
+    """
+    The op does the following:
+    1. figure out the dimension for reduction based on block_size, also reshape the input to align with
+       the shape after reduction
+    2. quantize the input based on the quantization parameters scale and zero_point and zero_point_domain = FLOAT
+    3. reshape the quantized result to origianl shape
+
+    Note:
+        zero_point_domain is pre-defined specifies how we quantize the floating point to quantized data:
+        FLOAT: quantized_val = (float_val - (zero_point (float) - scale * mid_point)) / scale
+    """
+    quant_min, quant_max = _get_and_check_qmin_qmax(output_dtype, quant_min, quant_max)
+    # workaround for uintx dtypes, since we don't have native Uintx dtype connected with
+    # torch.uintx dtypes yet
+    if output_dtype in _SUB_BYTE_UINT_BOUNDS:
+        output_dtype = torch.uint8
+    return _quantize_affine_float_zero_point_no_dtype_cast(
+        input,
+        block_size,
+        scale,
+        zero_point,
+        quant_min,
+        quant_max,
+    ).to(output_dtype)
+
+
+def _quantize_affine_float_zero_point_no_dtype_cast(
+    input: torch.Tensor,
+    block_size: Tuple[int, ...],
+    scale: torch.Tensor,
+    zero_point: Optional[torch.Tensor],
+    quant_min: Optional[Union[int, float]] = None,
+    quant_max: Optional[Union[int, float]] = None,
+) -> torch.Tensor:
+    """
+    The op does the following:
+    1. figure out the dimension for reduction based on block_size, also reshape the input to align with
+       the shape after reduction
+    2. quantize the input based on the quantization parameters scale and zero_point and zero_point_domain = FLOAT
+    3. reshape the quantized result to origianl shape
+    """
+    # TODO: validations
+    # TODO: validate scale/zero_point dimensions are compatible with block_size
+    assert input.dtype in [
+        torch.float32,
+        torch.float16,
+        torch.bfloat16,
+    ], f"Unsupported input dtype: {input.dtype}"
+    assert len(block_size) == input.dim(), (
+        f"Got input dim:{input.dim()}, block_size: {block_size}"
+    )
+    shape_for_reduction, reduction_dims = _get_reduction_params(
+        block_size, input.size()
+    )
+    original_shape = input.shape
+    input = input.view(shape_for_reduction)
+    shape_after_reduction = shape_for_reduction
+    for i in reduction_dims:
+        shape_after_reduction[i] = 1
+    scale = scale.view(shape_after_reduction)
+
+    if zero_point is not None and zero_point.numel() > 0:
+        zero_point = zero_point.view(shape_after_reduction)
     else:
-        assert zero_point_domain == ZeroPointDomain.FLOAT.name
-        mid_point = (quant_max + quant_min + 1) / 2
-        min_val = zero_point - scale * mid_point
-        quant = torch.clamp(
-            torch.round((input - min_val) / scale), quant_min, quant_max
-        )
+        # in some cases zero_point being a non-value shows as a tensor
+        # with numel=0 which we handle by unifying the two
+        zero_point = None
+
+    mid_point = (quant_max + quant_min + 1) / 2
+    min_val = zero_point - scale * mid_point
+    quant = torch.clamp(torch.round((input - min_val) / scale), quant_min, quant_max)
+    quant = quant.view(original_shape)
+
+    return quant
+
+
+def quantize_affine_no_zero_point(
+    input: torch.Tensor,
+    block_size: List[int],
+    scale: torch.Tensor,
+    zero_point: Optional[torch.Tensor],
+    output_dtype: torch.dtype,
+    quant_min: Optional[Union[int, float, bool]] = None,
+    quant_max: Optional[Union[int, float, bool]] = None,
+) -> torch.Tensor:
+    """
+    The op does the following:
+    1. figure out the dimension for reduction based on block_size, also reshape the input to align with
+       the shape after reduction
+    2. quantize the input based on the quantization parameters scale and zero_point and zero_point_domain = NONE
+    3. reshape the quantized result to origianl shape
+
+    Note:
+        zero_point_domain is pre-defined specifies how we quantize the floating point to quantized data:
+        None: quantized_val = (float_val / scale) | this is primarily used for floatx quantization
+            Where we do not want to round values to nearest integer and instead scale and cast.
+    """
+    quant_min, quant_max = _get_and_check_qmin_qmax(output_dtype, quant_min, quant_max)
+    # workaround for uintx dtypes, since we don't have native Uintx dtype connected with
+    # torch.uintx dtypes yet
+    if output_dtype in _SUB_BYTE_UINT_BOUNDS:
+        output_dtype = torch.uint8
+    return _quantize_affine_no_zero_point_no_dtype_cast(
+        input,
+        block_size,
+        scale,
+        zero_point,
+        quant_min,
+        quant_max,
+    ).to(output_dtype)
+
+
+def _quantize_affine_no_zero_point_no_dtype_cast(
+    input: torch.Tensor,
+    block_size: Tuple[int, ...],
+    scale: torch.Tensor,
+    zero_point: Optional[torch.Tensor],
+    quant_min: Optional[Union[int, float]] = None,
+    quant_max: Optional[Union[int, float]] = None,
+) -> torch.Tensor:
+    """
+    The op does the following:
+    1. figure out the dimension for reduction based on block_size, also reshape the input to align with
+       the shape after reduction
+    2. quantize the input based on the quantization parameters scale and zero_point and zero_point_domain = NONE
+    3. reshape the quantized result to origianl shape
+    """
+    # TODO: validations
+    # TODO: validate scale/zero_point dimensions are compatible with block_size
+    assert input.dtype in [
+        torch.float32,
+        torch.float16,
+        torch.bfloat16,
+    ], f"Unsupported input dtype: {input.dtype}"
+    assert len(block_size) == input.dim(), (
+        f"Got input dim:{input.dim()}, block_size: {block_size}"
+    )
+    shape_for_reduction, reduction_dims = _get_reduction_params(
+        block_size, input.size()
+    )
+    original_shape = input.shape
+    input = input.view(shape_for_reduction)
+    shape_after_reduction = shape_for_reduction
+    for i in reduction_dims:
+        shape_after_reduction[i] = 1
+    scale = scale.view(shape_after_reduction)
+
+    if zero_point is not None and zero_point.numel() > 0:
+        zero_point = zero_point.view(shape_after_reduction)
+    else:
+        # in some cases zero_point being a non-value shows as a tensor
+        # with numel=0 which we handle by unifying the two
+        zero_point = None
+
+    quant = torch.clamp(torch.round(input * (1.0 / scale)), quant_min, quant_max)
     quant = quant.view(original_shape)
 
     return quant
@@ -455,7 +591,6 @@ def dequantize_affine(
     input_dtype: torch.dtype,
     quant_min: Optional[Union[int, float]] = None,
     quant_max: Optional[Union[int, float]] = None,
-    zero_point_domain: ZeroPointDomain = ZeroPointDomain.INT,
     *,
     output_dtype: torch.dtype = torch.float32,
 ) -> torch.Tensor:
@@ -470,20 +605,12 @@ def dequantize_affine(
       quant_min (Optional[int]): minimum quantized value for input Tensor
       quant_max (Optional[int]): maximum quantized value for input Tensor
       output_dtype (torch.dtype): dtype for output Tensor, default is fp32
-      zero_point_domain (ZeroPointDomain): the domain that zero_point is in, should be either integer or float
-        if zero_point is in integer domain, zero point is added to the quantized integer value during
-        quantization
-        if zero_point is in floating point domain, zero point is subtracted from the floating point (unquantized)
-        value during quantization
-        default is ZeroPointDomain.INT
+
+      Default value for zero_point is in integer domain, zero point is added to the quantized integer value during quantization
 
     Output:
       dequantized Tensor, with requested dtype or fp32
     """
-    if zero_point_domain is None:
-        raise ValueError("Please use ZeroPointDomain.NONE instead of None")
-    elif zero_point_domain is ZeroPointDomain.NONE and zero_point is not None:
-        raise ValueError("zero_point should be None when zero_point_domain is NONE")
     return _dequantize_affine(
         input,
         block_size,
@@ -492,7 +619,6 @@ def dequantize_affine(
         input_dtype,
         quant_min,
         quant_max,
-        zero_point_domain.name,
         output_dtype=output_dtype,
     )
 
@@ -506,7 +632,6 @@ def _dequantize_affine(
     input_dtype: torch.dtype,
     quant_min: Optional[Union[int, float, bool]] = None,
     quant_max: Optional[Union[int, float, bool]] = None,
-    zero_point_domain: Optional[str] = ZeroPointDomain.INT.name,
     output_dtype: torch.dtype = torch.float32,
 ) -> torch.Tensor:
     """op definition that has compatible signatures with custom op library"""
@@ -528,7 +653,6 @@ def _dequantize_affine(
         zero_point,
         quant_min,
         quant_max,
-        zero_point_domain,
         output_dtype,
     )
 
@@ -540,7 +664,6 @@ def _dequantize_affine_no_dtype_check(
     zero_point: Optional[torch.Tensor],
     quant_min: Union[int, float],
     quant_max: Union[int, float],
-    zero_point_domain: Optional[str] = ZeroPointDomain.INT.name,
     output_dtype: torch.dtype = torch.float32,
 ) -> torch.Tensor:
     """This function converts AQT tensors to their high precision floating point representation
@@ -564,37 +687,202 @@ def _dequantize_affine_no_dtype_check(
         shape_after_reduction[i] = 1
     scale = scale.view(shape_after_reduction)
 
-    if zero_point is not None:
-        zero_point = zero_point.view(shape_after_reduction)
+    if zero_point is not None:
+        zero_point = zero_point.view(shape_after_reduction)
+
+    # Force a copy to avoid input modification due
+    # to upcoming in-place operations.
+    dequant = input.to(torch.int32, copy=True)
+    if zero_point is not None:
+        dequant = dequant - zero_point.to(torch.int32)
+    dequant = dequant.to(output_dtype)
+    dequant = dequant * scale
+
+    return dequant.view(original_shape).to(output_dtype)
+
+
+def _dequantize_affine_no_zero_point_no_dtype_check(
+    input: torch.Tensor,
+    block_size: List[int],
+    scale: torch.Tensor,
+    zero_point: Optional[torch.Tensor],
+    quant_min: Union[int, float],
+    quant_max: Union[int, float],
+    output_dtype: torch.dtype = torch.float32,
+) -> torch.Tensor:
+    """This function converts AQT tensors to their high precision floating point representation
+
+    The op does the following:
+    1. figure out the dimension for reduction based on block_size, also reshape the input to align with
+       the shape after reduction
+    2. dequantize the input based on the quantization parameters scale and zero_point and args like zero_point_domain
+    3. reshape the quantized result to origianl shape and change dtype to the output_dtype
+    """
+    assert len(block_size) == input.dim(), (
+        f"Got input dim:{input.dim()}, block_size: {block_size}"
+    )
+    shape_for_reduction, reduction_dims = _get_reduction_params(
+        block_size, input.size()
+    )
+    original_shape = input.shape
+    input = input.view(shape_for_reduction)
+    shape_after_reduction = shape_for_reduction
+    for i in reduction_dims:
+        shape_after_reduction[i] = 1
+    scale = scale.view(shape_after_reduction)
+
+    assert zero_point is None, (
+        "zero_point should be None for dequantize_affine_no_zero_point"
+    )
+    dequant = input.to(output_dtype)
+    dequant = dequant * scale
+
+    return dequant.view(original_shape).to(output_dtype)
+
+
+def dequantize_affine_no_zero_point(
+    input: torch.Tensor,
+    block_size: Tuple[int, ...],
+    scale: torch.Tensor,
+    zero_point: Optional[torch.Tensor],
+    input_dtype: torch.dtype,
+    quant_min: Optional[Union[int, float]] = None,
+    quant_max: Optional[Union[int, float]] = None,
+    *,
+    output_dtype: torch.dtype = torch.float32,
+) -> torch.Tensor:
+    """
+    Args:
+      input (torch.Tensor): quantized tensor, should match the dtype `dtype` argument
+      block_size: (List[int]): granularity of quantization, this means the size of the tensor elements that's sharing the same qparam
+                               e.g. when size is the same as the input tensor dimension, we are using per tensor quantization
+      scale (Tensor): quantization parameter for affine quantization
+      zero_point (Tensor): quantization parameter for affine quantization, no zero point is used for this op
+      input_dtype (torch.dtype): requested dtype (e.g. torch.uint8) for output Tensor
+      quant_min (Optional[int]): minimum quantized value for input Tensor
+      quant_max (Optional[int]): maximum quantized value for input Tensor
+      output_dtype (torch.dtype): dtype for output Tensor, default is fp32
+
+      Default value for zero_point is in integer domain, zero point is added to the quantized integer value during quantization
+
+    Output:
+      dequantized Tensor, with requested dtype or fp32
+    """
+    # TODO: validate scale/zero_point dimensions are compatible with block_size
+    if input_dtype not in _SUB_BYTE_UINT_BOUNDS:
+        assert input.dtype == input_dtype, (
+            f"Expected: {input_dtype}, got: {input.dtype}"
+        )
+    assert output_dtype in [
+        torch.float32,
+        torch.float16,
+        torch.bfloat16,
+    ], f"Unsupported output dtype: {output_dtype}"
+    quant_min, quant_max = _get_and_check_qmin_qmax(input_dtype, quant_min, quant_max)
+    return _dequantize_affine_no_zero_point_no_dtype_check(
+        input,
+        block_size,
+        scale,
+        zero_point,
+        quant_min,
+        quant_max,
+        output_dtype,
+    )
+
+
+def _dequantize_affine_float_zero_point_no_dtype_check(
+    input: torch.Tensor,
+    block_size: List[int],
+    scale: torch.Tensor,
+    zero_point: Optional[torch.Tensor],
+    quant_min: Union[int, float],
+    quant_max: Union[int, float],
+    output_dtype: torch.dtype = torch.float32,
+) -> torch.Tensor:
+    """This function converts AQT tensors to their high precision floating point representation
+
+    The op does the following:
+    1. figure out the dimension for reduction based on block_size, also reshape the input to align with
+       the shape after reduction
+    2. dequantize the input based on the quantization parameters scale and zero_point and args like zero_point_domain
+    3. reshape the quantized result to origianl shape and change dtype to the output_dtype
+    """
+    assert len(block_size) == input.dim(), (
+        f"Got input dim:{input.dim()}, block_size: {block_size}"
+    )
+    shape_for_reduction, reduction_dims = _get_reduction_params(
+        block_size, input.size()
+    )
+    original_shape = input.shape
+    input = input.view(shape_for_reduction)
+    shape_after_reduction = shape_for_reduction
+    for i in reduction_dims:
+        shape_after_reduction[i] = 1
+    scale = scale.view(shape_after_reduction)
+
+    if zero_point is not None:
+        zero_point = zero_point.view(shape_after_reduction)
+
+    # TODO: this seems to be a detail for tinygemm (converting from uint to int, probably need to refactor this)
+    mid_point = (quant_max + quant_min + 1) / 2
+    # This should allocate new memory and avoid input modification
+    dequant = input - mid_point
+    dequant = dequant.to(output_dtype)
+    dequant *= scale
+    if zero_point is not None:
+        dequant += zero_point
+
+    return dequant.view(original_shape).to(output_dtype)
+
+
+def dequantize_affine_float_zero_point(
+    input: torch.Tensor,
+    block_size: Tuple[int, ...],
+    scale: torch.Tensor,
+    zero_point: Optional[torch.Tensor],
+    input_dtype: torch.dtype,
+    quant_min: Optional[Union[int, float]] = None,
+    quant_max: Optional[Union[int, float]] = None,
+    *,
+    output_dtype: torch.dtype = torch.float32,
+) -> torch.Tensor:
+    """
+    Args:
+      input (torch.Tensor): quantized tensor, should match the dtype `dtype` argument
+      block_size: (List[int]): granularity of quantization, this means the size of the tensor elements that's sharing the same qparam
+                               e.g. when size is the same as the input tensor dimension, we are using per tensor quantization
+      scale (Tensor): quantization parameter for affine quantization
+      zero_point (Tensor): quantization parameter for affine quantization
+      input_dtype (torch.dtype): requested dtype (e.g. torch.uint8) for output Tensor
+      quant_min (Optional[int]): minimum quantized value for input Tensor
+      quant_max (Optional[int]): maximum quantized value for input Tensor
+      output_dtype (torch.dtype): dtype for output Tensor, default is fp32
+
+      Default value for zero_point is in floating point domain, zero point is subtracted from the floating point (unquantized)
 
-    if zero_point_domain == ZeroPointDomain.INT.name:
-        # Force a copy to avoid input modification due
-        # to upcoming in-place operations.
-        dequant = input.to(torch.int32, copy=True)
-        if zero_point is not None:
-            dequant = dequant - zero_point.to(torch.int32)
-        dequant = dequant.to(output_dtype)
-        dequant = dequant * scale
-    elif zero_point_domain == ZeroPointDomain.NONE.name:
-        assert zero_point is None, (
-            "zero_point should be None when zero_point_domain is NONE"
-        )
-        dequant = input.to(output_dtype)
-        dequant = dequant * scale
-    else:
-        assert zero_point_domain == ZeroPointDomain.FLOAT.name, (
-            f"Unexpected zero point domain: {zero_point_domain}"
+    Output:
+      dequantized Tensor, with requested dtype or fp32
+    """
+    # TODO: validate scale/zero_point dimensions are compatible with block_size
+    if input_dtype not in _SUB_BYTE_UINT_BOUNDS:
+        assert input.dtype == input_dtype, (
+            f"Expected: {input_dtype}, got: {input.dtype}"
         )
-        # TODO: this seems to be a detail for tinygemm (converting from uint to int, probably need to refactor this)
-        mid_point = (quant_max + quant_min + 1) / 2
-        # This should allocate new memory and avoid input modification
-        dequant = input - mid_point
-        dequant = dequant.to(output_dtype)
-        dequant *= scale
-        if zero_point is not None:
-            dequant += zero_point
-
-    return dequant.view(original_shape).to(output_dtype)
+    assert output_dtype in [
+        torch.float32,
+        torch.float16,
+        torch.bfloat16,
+    ], f"Unsupported output dtype: {output_dtype}"
+    quant_min, quant_max = _get_and_check_qmin_qmax(input_dtype, quant_min, quant_max)
+    return _dequantize_affine_float_zero_point_no_dtype_check(
+        input,
+        block_size,
+        scale,
+        zero_point,
+        quant_min,
+        quant_max,
+        output_dtype,
+    )
 
 
 def fake_quantize_affine(
@@ -708,24 +996,32 @@ def _do_fake_quantize_affine(
     """
     input_dtype = input.dtype
     quant_min, quant_max = _get_and_check_qmin_qmax(quant_dtype, quant_min, quant_max)
-    q = _quantize_affine_no_dtype_cast(
+    if zero_point_domain == ZeroPointDomain.INT:
+        _quantize_affine = _quantize_affine_no_dtype_cast
+        _dequantize_affine = _dequantize_affine_no_dtype_check
+    elif zero_point_domain == ZeroPointDomain.FLOAT:
+        _quantize_affine = _quantize_affine_float_zero_point_no_dtype_cast
+        _dequantize_affine = _dequantize_affine_float_zero_point_no_dtype_check
+    elif ZeroPointDomain == ZeroPointDomain.NONE:
+        _quantize_affine = _quantize_affine_no_zero_point_no_dtype_cast
+        _dequantize_affine = _dequantize_affine_no_zero_point_no_dtype_check
+    else:
+        raise ValueError(f"Unrecognized zero point domain: {zero_point_domain}")
+    q = _quantize_affine(
         input,
         block_size,
         scale,
         zero_point,
         quant_min,
         quant_max,
-        quant_dtype,
-        zero_point_domain.name,
     )
-    dq = _dequantize_affine_no_dtype_check(
+    dq = _dequantize_affine(
         q,
         block_size,
         scale,
         zero_point,
         quant_min,
         quant_max,
-        zero_point_domain.name,
         output_dtype=input_dtype,
     )
     return (q, dq)
@@ -735,51 +1031,33 @@ def _do_fake_quantize_affine(
 def choose_qparams_affine(
     input: torch.Tensor,
     mapping_type: MappingType,
-    block_size: Tuple[int, ...],
+    block_size: Tuple[int],
     target_dtype: torch.dtype,
     quant_min: Optional[Union[int, float]] = None,
     quant_max: Optional[Union[int, float]] = None,
     eps: Optional[float] = None,
     scale_dtype: Optional[torch.dtype] = None,
-    zero_point_dtype: Optional[torch.dtype] = None,
-    preserve_zero: bool = True,
-    zero_point_domain: ZeroPointDomain = ZeroPointDomain.INT,
+    zero_point_dtype: Optional[torch.dtype] = torch.int32,
 ) -> Tuple[torch.Tensor, torch.Tensor]:
     """
     Args:
         input (torch.Tensor): fp32, bf16, fp16 input Tensor
         mapping_type (MappingType): determines how the qparams are calculated, symmetric or asymmetric
-        block_size: (Tuple[int, ...]): granularity of quantization, this means the size of the tensor elements that's sharing the same qparam
+        block_size: (Tuple[int]): granularity of quantization, this means the size of the tensor elements that's sharing the same qparam
           e.g. when size is the same as the input tensor dimension, we are using per tensor quantization
         target_dtype (torch.dtype): dtype for target quantized Tensor
         quant_min (Optional[int]): minimum quantized value for target quantized Tensor
         quant_max (Optioanl[int]): maximum quantized value for target quantized Tensor
         eps (Optional[float]): minimum scale, if not provided, default to eps of input.dtype
         scale_dtype (torch.dtype): dtype for scale Tensor
-        zero_point_dtype (torch.dtype): dtype for zero_point Tensor
-        preserve_zero (bool): a flag to indicate whether we need zero to be exactly
-          representable or not, this is typically required for ops that needs zero padding, like convolution
-          it's less important for ops that doesn't have zero padding in the op itself, like linear.
-
-          For example, given a floating point Tensor [1.2, 0.1, 3.0, 4.0, 0.4, 0], if `preserve_zero` is True,
-          we'll make sure there is a integer value corresponding to the floating point 0, e.g. [-3, -8, 3, 7, -7, -8], 0 will be mapped to `-8` without loss. But if `preserve_zero` is not True, there won't be such
-          gurantee.
-
-          If we don't need zero to be exactly representable, we won't do rounding and clamping for zero_point
-
-        zero_point_domain (ZeroPointDomain): the domain that zero_point is in, should be either integer or float
-            if zero_point is in integer domain, zero point is added to the quantized integer value during
-            quantization
-            if zero_point is in floating point domain, zero point is subtracted from the floating point (unquantized)
-            value during quantization
-            default is ZeroPointDomain.INT
+        zero_point_dtype (torch.dtype): dtype for zero_point Tensor, defaults to torch.int32
+        Now removed params:
+            zero_point_domain (ZeroPointDomain): the domain that zero_point is in, defaults to Integer or None
+            preserve_zero (bool): whether to preserve zero in the quantized Tensor, defaults to True
 
     Output:
         Tuple of scales and zero_points Tensor with requested dtype
     """
-    if zero_point_domain is None:
-        raise ValueError("Please use ZeroPointDomain.NONE instead of None")
-
     return _choose_qparams_affine(
         input,
         mapping_type.name,
@@ -790,11 +1068,150 @@ def choose_qparams_affine(
         eps,
         scale_dtype,
         zero_point_dtype,
-        preserve_zero,
-        zero_point_domain.name,
     )
 
 
+# TODO: lower this op to custom op library
+@torch.no_grad()
+def choose_qparams_affine_tinygemm(
+    input: torch.Tensor,
+    mapping_type: MappingType,
+    block_size: Tuple[int],
+    target_dtype: torch.dtype,
+    quant_min: Optional[Union[int, float]] = None,
+    quant_max: Optional[Union[int, float]] = None,
+    eps: Optional[float] = None,
+    scale_dtype: Optional[torch.dtype] = None,
+    zero_point_dtype: Optional[torch.dtype] = None,
+) -> Tuple[torch.Tensor, torch.Tensor]:
+    """
+    Specialized version of choose_qparams_affine
+
+    This is used for tinygemm int4mm kernel where zero point is in floating point domain
+    and zero does not have to be exactly representable.
+
+    Args:
+        input (torch.Tensor): fp32, bf16, fp16 input Tensor
+        mapping_type (MappingType): determines how the qparams are calculated, symmetric or asymmetric
+        block_size: (Tuple[int]): granularity of quantization, this means the size of the tensor elements that's sharing the same qparam
+        target_dtype (torch.dtype): dtype for target quantized Tensor
+        quant_min (Optional[int]): minimum quantized value for target quantized Tensor
+        quant_max (Optioanl[int]): maximum quantized value for target quantized Tensor
+        eps (Optional[float]): minimum scale, if not provided, default to eps of input.dtype
+        scale_dtype (torch.dtype): dtype for scale Tensor
+        zero_point_dtype (torch.dtype): dtype for zero_point Tensor
+
+    Output:
+        Tuple of scales and zero_points Tensor with requested dtype
+    """
+    quant_min, quant_max = _get_and_check_qmin_qmax(target_dtype, quant_min, quant_max)
+    assert mapping_type is MappingType.ASYMMETRIC, (
+        f"Unsupported mapping type: {mapping_type}"
+    )
+    if scale_dtype is None:
+        scale_dtype = input.dtype
+    if eps is None:
+        eps = torch.finfo(input.dtype).eps
+
+    assert len(block_size) == input.dim(), (
+        f"Got input dim:{input.dim()}, block_size: {block_size}"
+    )
+    shape_for_reduction, reduction_dims = _get_reduction_params(
+        block_size, input.size()
+    )
+    input = input.view(shape_for_reduction)
+
+    min_val = torch.amin(input, dim=reduction_dims, keepdim=False)
+    max_val = torch.amax(input, dim=reduction_dims, keepdim=False)
+
+    # For preserve_zero=False, we don't ensure zero is exactly representable
+    min_val_neg = min_val
+    max_val_pos = max_val
+
+    scale = (max_val_pos - min_val_neg) / float(quant_max - quant_min)
+    scale = torch.clamp(scale, min=eps)
+
+    # For zero_point_domain=FLOAT in asymmetric quantization
+    mid_point = (quant_max + quant_min + 1) / 2
+    # this is not preserving zero_point, this is converting to TensorCoreTiledFormat
+    zero_point = min_val_neg + scale * mid_point
+
+    if zero_point_dtype is None:
+        zero_point_dtype = input.dtype
+
+    zero_point = zero_point.to(dtype=zero_point_dtype)
+    return scale.to(dtype=scale_dtype, device=input.device), zero_point
+
+
+# TODO: lower this op to custom op library
+def choose_qparams_affine_dont_preserve_zero(
+    input: torch.Tensor,
+    mapping_type: MappingType,
+    block_size: Tuple[int],
+    target_dtype: torch.dtype,
+    quant_min: Optional[Union[int, float, bool]] = None,
+    quant_max: Optional[Union[int, float, bool]] = None,
+    eps: Optional[float] = None,
+    scale_dtype: Optional[torch.dtype] = None,
+    zero_point_dtype: Optional[torch.dtype] = None,
+) -> Tuple[torch.Tensor, torch.Tensor]:
+    """Specialized version of choose_qparams_affine with zero_point_domain=ZeroPointDomain.INT and preserve_zero=False.
+
+    Args:
+        input (torch.Tensor): fp32, bf16, fp16 input Tensor
+        mapping_type (MappingType): determines how the qparams are calculated, asymmetric only
+        block_size: (Tuple[int]): granularity of quantization, this means the size of the tensor elements that's sharing the same qparam
+        target_dtype (torch.dtype): dtype for target quantized Tensor
+        quant_min (Optional[int]): minimum quantized value for target quantized Tensor
+        quant_max (Optioanl[int]): maximum quantized value for target quantized Tensor
+        eps (Optional[float]): minimum scale, if not provided, default to eps of input.dtype
+        scale_dtype (torch.dtype): dtype for scale Tensor
+        zero_point_dtype (torch.dtype): dtype for zero_point Tensor
+        Now removed params default values:
+            zero_point_domain (ZeroPointDomain): the domain that zero_point is in, defaults to Integer
+            preserve_zero (bool): whether to preserve zero in the quantized Tensor, defaults to False
+
+    Output:
+        Tuple of scales and zero_points Tensor with requested dtype
+    """
+    quant_min, quant_max = _get_and_check_qmin_qmax(target_dtype, quant_min, quant_max)
+    assert mapping_type == MappingType.ASYMMETRIC, (
+        f"Unsupported mapping type: {mapping_type}"
+    )
+
+    if scale_dtype is None:
+        scale_dtype = input.dtype
+    if eps is None:
+        eps = torch.finfo(input.dtype).eps
+
+    assert len(block_size) == input.dim(), (
+        f"Got input dim:{input.dim()}, block_size: {block_size}"
+    )
+    shape_for_reduction, reduction_dims = _get_reduction_params(
+        block_size, input.size()
+    )
+    input = input.view(shape_for_reduction)
+
+    min_val = torch.amin(input, dim=reduction_dims, keepdim=False)
+    max_val = torch.amax(input, dim=reduction_dims, keepdim=False)
+
+    # For no preserve zero, we don't ensure zero is exactly representable
+    min_val_neg = min_val
+    max_val_pos = max_val
+
+    scale = (max_val_pos - min_val_neg) / float(quant_max - quant_min)
+    scale = torch.clamp(scale, min=eps)
+    # Zero point is int
+    zero_point = quant_min - torch.round(min_val_neg / scale)
+    zero_point = torch.clamp(zero_point, quant_min, quant_max)
+    if zero_point_dtype is None:
+        zero_point_dtype = torch.int32
+    return scale.to(dtype=scale_dtype, device=input.device), zero_point.to(
+        dtype=zero_point_dtype
+    )
+
+
+# TODO: lower this op to custom op library
 def choose_qparams_affine_with_min_max(
     min_val: torch.Tensor,
     max_val: torch.Tensor,
@@ -821,86 +1238,24 @@ def choose_qparams_affine_with_min_max(
     """
     if zero_point_domain is None:
         raise ValueError("Please use ZeroPointDomain.NONE instead of None")
-    return _choose_qparams_affine(
-        None,
-        mapping_type.name,
-        block_size,
-        target_dtype,
-        quant_min,
-        quant_max,
-        eps,
-        scale_dtype,
-        zero_point_dtype,
-        preserve_zero,
-        zero_point_domain.name,
-        min_val,
-        max_val,
-    )
-
-
-@register_custom_op
-def _choose_qparams_affine(
-    input: Optional[torch.Tensor],
-    mapping_type: str,
-    block_size: List[int],
-    target_dtype: torch.dtype,
-    quant_min: Optional[Union[int, float, bool]] = None,
-    quant_max: Optional[Union[int, float, bool]] = None,
-    eps: Optional[float] = None,
-    scale_dtype: Optional[torch.dtype] = None,
-    zero_point_dtype: Optional[torch.dtype] = None,
-    preserve_zero: bool = True,
-    zero_point_domain: Optional[str] = "INT",
-    min_val: Optional[torch.Tensor] = None,
-    max_val: Optional[torch.Tensor] = None,
-) -> Tuple[torch.Tensor, torch.Tensor]:
-    """op definition that has compatible signatures with custom op library
-
-    The op does the following:
-    1. figure out the dimension for reduction based on block_size
-    2. find min_val/max_val based on the dimension for reduction
-    3. calculate quantization parameters based on min_val/max_val based on args like `preserve_zero`
-       and `zero_point_domain`
-    """
     quant_min, quant_max = _get_and_check_qmin_qmax(target_dtype, quant_min, quant_max)
     assert mapping_type in [
-        MappingType.SYMMETRIC.name,
-        MappingType.SYMMETRIC_NO_CLIPPING_ERR.name,
-        MappingType.ASYMMETRIC.name,
+        MappingType.SYMMETRIC,
+        MappingType.SYMMETRIC_NO_CLIPPING_ERR,
+        MappingType.ASYMMETRIC,
     ], f"Unsupported mapping type: {mapping_type}"
-    if target_dtype in FP8_TYPES:
-        assert mapping_type == MappingType.SYMMETRIC.name, (
-            f"Only symmetric quantization is supported for FP8 types, got {mapping_type}"
-        )
-
-    if input is not None:
-        if scale_dtype is None:
-            scale_dtype = input.dtype
-        if eps is None:
-            eps = torch.finfo(input.dtype).eps
-
-        assert len(block_size) == input.dim(), (
-            f"Got input dim:{input.dim()}, block_size: {block_size}"
-        )
-        shape_for_reduction, reduction_dims = _get_reduction_params(
-            block_size, input.size()
-        )
-        input = input.view(shape_for_reduction)
 
-        min_val = torch.amin(input, dim=reduction_dims, keepdim=False)
-        max_val = torch.amax(input, dim=reduction_dims, keepdim=False)
-    else:
-        assert min_val is not None and max_val is not None, (
-            "Need to provide `min_val` and `max_val` when `input` is None, got: {min_val, max_val}"
-        )
-        assert min_val.dtype == max_val.dtype, (
-            "Expecting `min_val` and `max_val` to have the same dtype, got: {min_val.dtype, max_val.dtype}"
-        )
+    assert min_val is not None and max_val is not None, (
+        "Need to provide `min_val` and `max_val`, got: {min_val, max_val}"
+    )
+    assert min_val.dtype == max_val.dtype, (
+        "Expecting `min_val` and `max_val` to have the same dtype, got: {min_val.dtype, max_val.dtype}"
+    )
 
-        if scale_dtype is None:
-            scale_dtype = min_val.dtype
-        if eps is None:
-            eps = torch.finfo(min_val.dtype).eps
+    if scale_dtype is None:
+        scale_dtype = min_val.dtype
+    if eps is None:
+        eps = torch.finfo(min_val.dtype).eps
 
     if preserve_zero:
         min_val_neg = torch.min(min_val, torch.zeros_like(min_val))
@@ -910,15 +1265,15 @@ def _choose_qparams_affine(
         max_val_pos = max_val
 
     if (
-        mapping_type == MappingType.SYMMETRIC.name
-        or mapping_type == MappingType.SYMMETRIC_NO_CLIPPING_ERR.name
+        mapping_type == MappingType.SYMMETRIC
+        or mapping_type == MappingType.SYMMETRIC_NO_CLIPPING_ERR
     ):
         # scales
-        if mapping_type == MappingType.SYMMETRIC.name:
+        if mapping_type == MappingType.SYMMETRIC:
             max_val_pos = torch.max(-min_val_neg, max_val_pos)
             scale = max_val_pos / (float(quant_max - quant_min) / 2)
         else:
-            assert mapping_type == MappingType.SYMMETRIC_NO_CLIPPING_ERR.name
+            assert mapping_type == MappingType.SYMMETRIC_NO_CLIPPING_ERR
             # calculate smin and smax individually and choose the larger one. For example, if quant_min = -8 and
             # quant_max = 7.
             # - If smin is bigger: There would be coverage on negative values down to -8, and less rounding
@@ -935,30 +1290,30 @@ def _choose_qparams_affine(
             raise ValueError(
                 "preserve_zero == False is not supported for symmetric quantization"
             )
-        if zero_point_domain == ZeroPointDomain.FLOAT.name:
+        if zero_point_domain == ZeroPointDomain.FLOAT:
             # TODO INT should not be a valid ZeroPointDomain for symmetric quantization since
             # symmetric quant doesn't have a zero_point
             raise ValueError(
                 "zero_point_domain should be ZeroPointDomain.INT or ZeroPointDomain.NONE for symmetric quantization"
             )
-        if zero_point_domain == ZeroPointDomain.NONE.name:
+        if zero_point_domain == ZeroPointDomain.NONE:
             zero_point = None
         else:
             zero_point = torch.full_like(scale, int((quant_max + quant_min + 1) / 2))
         scale = torch.clamp(scale, min=eps)
     else:
-        assert mapping_type == MappingType.ASYMMETRIC.name
+        assert mapping_type == MappingType.ASYMMETRIC
         scale = (max_val_pos - min_val_neg) / float(quant_max - quant_min)
         scale = torch.clamp(scale, min=eps)
-        if zero_point_domain == ZeroPointDomain.NONE.name:
+        if zero_point_domain == ZeroPointDomain.NONE:
             zero_point = None
-        elif zero_point_domain == ZeroPointDomain.INT.name:
+        elif zero_point_domain == ZeroPointDomain.INT:
             zero_point = quant_min - torch.round(min_val_neg / scale)
             zero_point = torch.clamp(zero_point, quant_min, quant_max)
             if zero_point_dtype is None:
                 zero_point_dtype = torch.int32
         else:
-            assert zero_point_domain == ZeroPointDomain.FLOAT.name, (
+            assert zero_point_domain == ZeroPointDomain.FLOAT, (
                 "zero_point must be in FLOAT/INT/None domain for asymmetric quantization"
             )
             mid_point = (quant_max + quant_min + 1) / 2
@@ -969,7 +1324,90 @@ def _choose_qparams_affine(
 
     if zero_point is not None:
         zero_point = zero_point.to(dtype=zero_point_dtype)
-    return scale.to(dtype=scale_dtype), zero_point
+    return scale.to(dtype=scale_dtype, device=min_val.device), zero_point
+
+
+@register_custom_op
+def _choose_qparams_affine(
+    input: Optional[torch.Tensor],
+    mapping_type: str,
+    block_size: List[int],
+    target_dtype: torch.dtype,
+    quant_min: Optional[Union[int, float, bool]] = None,
+    quant_max: Optional[Union[int, float, bool]] = None,
+    eps: Optional[float] = None,
+    scale_dtype: Optional[torch.dtype] = None,
+    zero_point_dtype: Optional[torch.dtype] = None,
+) -> Tuple[torch.Tensor, torch.Tensor]:
+    """op definition that has compatible signatures with custom op library
+
+    The op does the following:
+    1. figure out the dimension for reduction based on block_size
+    2. find min_val/max_val based on the dimension for reduction
+    3. calculate quantization parameters based on min_val/max_val based on args like `preserve_zero`
+       and `zero_point_domain`
+    """
+    quant_min, quant_max = _get_and_check_qmin_qmax(target_dtype, quant_min, quant_max)
+    assert mapping_type in [
+        MappingType.SYMMETRIC.name,
+        MappingType.SYMMETRIC_NO_CLIPPING_ERR.name,
+        MappingType.ASYMMETRIC.name,
+    ], f"Unsupported mapping type: {mapping_type}"
+
+    if scale_dtype is None:
+        scale_dtype = input.dtype
+    if eps is None:
+        eps = torch.finfo(input.dtype).eps
+
+    assert len(block_size) == input.dim(), (
+        f"Got input dim:{input.dim()}, block_size: {block_size}"
+    )
+    shape_for_reduction, reduction_dims = _get_reduction_params(
+        block_size, input.size()
+    )
+    input = input.view(shape_for_reduction)
+
+    min_val = torch.amin(input, dim=reduction_dims, keepdim=False)
+    max_val = torch.amax(input, dim=reduction_dims, keepdim=False)
+
+    min_val_neg = torch.min(min_val, torch.zeros_like(min_val))
+    max_val_pos = torch.max(max_val, torch.zeros_like(max_val))
+
+    if (
+        mapping_type == MappingType.SYMMETRIC.name
+        or mapping_type == MappingType.SYMMETRIC_NO_CLIPPING_ERR.name
+    ):
+        # scales
+        if mapping_type == MappingType.SYMMETRIC.name:
+            max_val_pos = torch.max(-min_val_neg, max_val_pos)
+            scale = max_val_pos / (float(quant_max - quant_min) / 2)
+        else:
+            assert mapping_type == MappingType.SYMMETRIC_NO_CLIPPING_ERR.name
+            # calculate smin and smax individually and choose the larger one. For example, if quant_min = -8 and
+            # quant_max = 7.
+            # - If smin is bigger: There would be coverage on negative values down to -8, and less rounding
+            # error than the existing SYMMETRIC case.
+            # - If smax is bigger: it covers the positive values up to 7. The round
+            # error may be bigger than the existing SYMMETRIC case. Either way, there's no out-of-range fp values after
+            # quantization.
+            smin = min_val_neg / float(quant_min)
+            smax = max_val_pos / float(quant_max)
+            mask = smin > smax
+            scale = torch.where(mask, smin, smax)
+        zero_point = torch.full_like(scale, int((quant_max + quant_min + 1) / 2))
+        scale = torch.clamp(scale, min=eps)
+    else:
+        assert mapping_type == MappingType.ASYMMETRIC.name
+        scale = (max_val_pos - min_val_neg) / float(quant_max - quant_min)
+        scale = torch.clamp(scale, min=eps)
+        zero_point = quant_min - torch.round(min_val_neg / scale)
+        zero_point = torch.clamp(zero_point, quant_min, quant_max)
+        if zero_point_dtype is None:
+            zero_point_dtype = torch.int32
+
+    return scale.to(dtype=scale_dtype, device=input.device), zero_point.to(
+        dtype=zero_point_dtype
+    )
 
 
 def choose_qparams_and_quantize_affine_qqq(
@@ -1531,6 +1969,7 @@ def dequantize_affine_floatx(
 def choose_qparams_affine_float8(
     tensor: torch.Tensor,
     float8_dtype: torch.dtype = torch.float8_e4m3fn,
+    scale_dtype: torch.dtype = torch.float32,
 ) -> torch.Tensor:
     """
     Calculates float8 scaling factor for the given high precision tensor, using tensorwise granularity.
@@ -1545,7 +1984,7 @@ def choose_qparams_affine_float8(
     max_val_pos = torch.max(tensor)
     max_val_pos = torch.max(-min_val_neg, max_val_pos)
     scale = max_val_pos / (float(quant_max - quant_min) / 2)
-    return scale.to(dtype=torch.float32)
+    return scale.to(dtype=scale_dtype)
 
 
 def quantize_affine_float8(
diff --git a/torchao/quantization/utils.py b/torchao/quantization/utils.py
index 22e14378f5..30b9980878 100644
--- a/torchao/quantization/utils.py
+++ b/torchao/quantization/utils.py
@@ -16,8 +16,14 @@
     MappingType,
     ZeroPointDomain,
     choose_qparams_affine,
+    choose_qparams_affine_dont_preserve_zero,
+    choose_qparams_affine_tinygemm,
     dequantize_affine,
+    dequantize_affine_float_zero_point,
+    dequantize_affine_no_zero_point,
     quantize_affine,
+    quantize_affine_float_zero_point,
+    quantize_affine_no_zero_point,
 )
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
@@ -345,19 +351,42 @@ def get_groupwise_affine_qparams(
         dtype if zero_point_domain != ZeroPointDomain.INT else torch.int32
     )
 
-    scale, zero_point = choose_qparams_affine(
-        w,
-        mapping_type,
-        block_size,
-        target_dtype,
-        quant_min,
-        quant_max,
-        eps,
-        scale_dtype=scale_dtype,
-        zero_point_dtype=zero_point_dtype,
-        preserve_zero=preserve_zero,
-        zero_point_domain=zero_point_domain,
-    )
+    if zero_point_domain == ZeroPointDomain.FLOAT and not preserve_zero:
+        scale, zero_point = choose_qparams_affine_tinygemm(
+            w,
+            mapping_type,
+            block_size,
+            target_dtype,
+            quant_min,
+            quant_max,
+            eps,
+            scale_dtype=scale_dtype,
+            zero_point_dtype=zero_point_dtype,
+        )
+    elif zero_point_domain == ZeroPointDomain.INT and not preserve_zero:
+        scale, zero_point = choose_qparams_affine_dont_preserve_zero(
+            w,
+            mapping_type,
+            block_size,
+            target_dtype,
+            quant_min,
+            quant_max,
+            eps,
+            scale_dtype=scale_dtype,
+            zero_point_dtype=zero_point_dtype,
+        )
+    else:  # Default case: zero_point_domain == ZeroPointDomain.INT and preserve_zero
+        scale, zero_point = choose_qparams_affine(
+            w,
+            mapping_type,
+            block_size,
+            target_dtype,
+            quant_min,
+            quant_max,
+            eps,
+            scale_dtype=scale_dtype,
+            zero_point_dtype=zero_point_dtype,
+        )
 
     return scale.to(dtype=dtype).reshape(w.shape[0], -1), zero_point.to(
         dtype=zero_point_dtype
@@ -421,7 +450,16 @@ def groupwise_affine_quantize_tensor_from_qparams(
     quant_min = 0
     quant_max = 2**n_bit - 1
 
-    int_data = quantize_affine(
+    if zero_point_domain == ZeroPointDomain.INT:
+        _quantize_affine = quantize_affine
+    elif zero_point_domain == ZeroPointDomain.FLOAT:
+        _quantize_affine = quantize_affine_float_zero_point
+    elif ZeroPointDomain == ZeroPointDomain.NONE:
+        _quantize_affine = quantize_affine_no_zero_point
+    else:
+        raise ValueError(f"Unrecognized zero point domain: {zero_point_domain}")
+
+    int_data = _quantize_affine(
         w,
         block_size,
         scales,
@@ -429,7 +467,6 @@ def groupwise_affine_quantize_tensor_from_qparams(
         output_dtype,
         quant_min,
         quant_max,
-        zero_point_domain=zero_point_domain,
     )
     if TORCH_VERSION_AT_LEAST_2_5 and w.shape[-1] > 1:
         if (not (check_cpu_version(int_data.device))) and (
@@ -477,7 +514,13 @@ def groupwise_affine_dequantize_tensor_from_qparams(
     input_dtype = torch.int32
     quant_min = 0
     quant_max = 2**n_bit - 1
-    return dequantize_affine(
+    if zero_point_domain == ZeroPointDomain.INT:
+        _dequantize_affine = dequantize_affine
+    elif zero_point_domain == ZeroPointDomain.FLOAT:
+        _dequantize_affine = dequantize_affine_float_zero_point
+    else:
+        _dequantize_affine = dequantize_affine_no_zero_point
+    return _dequantize_affine(
         w_int32,
         block_size,
         scales,
@@ -485,7 +528,6 @@ def groupwise_affine_dequantize_tensor_from_qparams(
         input_dtype,
         quant_min,
         quant_max,
-        zero_point_domain=zero_point_domain,
         output_dtype=scales.dtype,
     )
 

From 8e33b709780d956c69c86e301f51ad4719124dcf Mon Sep 17 00:00:00 2001
From: mobicham <37179323+mobicham@users.noreply.github.com>
Date: Wed, 21 May 2025 23:39:44 +0200
Subject: [PATCH 039/165] Update GemLite to support vLLM V1 (#2199)

* update to forward_functional()

* add 8-bit symmetric case

* ruff

* fix test
---
 .../quantization/test_config_serialization.py |  2 -
 torchao/dtypes/uintx/gemlite_layout.py        | 71 ++++---------------
 torchao/quantization/quant_api.py             |  8 +--
 3 files changed, 15 insertions(+), 66 deletions(-)

diff --git a/test/quantization/test_config_serialization.py b/test/quantization/test_config_serialization.py
index ba52b446b1..62edc6aad8 100644
--- a/test/quantization/test_config_serialization.py
+++ b/test/quantization/test_config_serialization.py
@@ -63,8 +63,6 @@
     GemliteUIntXWeightOnlyConfig(
         group_size=128,  # Optional, has default of 64
         bit_width=8,  # Optional, has default of 4
-        packing_bitwidth=8,  # Optional, has default of 32
-        contiguous=True,  # Optional, has default of None
     ),
     FPXWeightOnlyConfig(ebits=4, mbits=8),
     # Sparsity configs
diff --git a/torchao/dtypes/uintx/gemlite_layout.py b/torchao/dtypes/uintx/gemlite_layout.py
index 0c124eb343..1c840f7ec4 100644
--- a/torchao/dtypes/uintx/gemlite_layout.py
+++ b/torchao/dtypes/uintx/gemlite_layout.py
@@ -22,7 +22,6 @@
 
 try:
     import gemlite
-    from gemlite.core import GemLiteLinearTriton
 except:
     gemlite = None
 
@@ -51,18 +50,6 @@ def _same_metadata(
     )
 
 
-def scale_activations_no_scaling(x):
-    return x, None
-
-
-def scale_activations_int8(x):
-    x_shape = x.shape
-    out_x = x.view(-1, x.shape[-1])
-    scaled_x = torch.abs(out_x).amax(axis=1, keepdim=True) / 127
-    out_x = torch.round(out_x / scaled_x).to(dtype=torch.int8)
-    return out_x.view(x_shape), scaled_x
-
-
 def get_gemlite_quant_kwargs(bit_width, group_size, dtype):
     from torchao.quantization.quant_primitives import MappingType, ZeroPointDomain
 
@@ -93,8 +80,6 @@ def get_gemlite_aqt_kwargs(
     weight,
     group_size=64,
     bit_width=4,
-    packing_bitwidth=32,
-    contiguous=None,
     use_hqq=True,
 ):
     if gemlite is None:
@@ -106,12 +91,7 @@ def get_gemlite_aqt_kwargs(
         4,
         8,
     ], f"gemlite only works with bit_width 4,8 but got {bit_width}"
-    assert packing_bitwidth in [
-        8,
-        16,
-        32,
-        None,
-    ], f"gemlite needs packing_bitwidth in [8, 16, 32] but got {packing_bitwidth}"
+
     assert weight.dtype in [torch.float16, torch.bfloat16], (
         f"gemlite only works with dtype torch.float16 or torch.bfloat16 but got {weight.dtype}"
     )
@@ -127,8 +107,6 @@ def get_gemlite_aqt_kwargs(
     aqt_kwargs["_layout"] = GemlitePackedLayout(
         group_size=group_size,
         bit_width=bit_width,
-        packing_bitwidth=packing_bitwidth,
-        contiguous=contiguous,
     )
     aqt_kwargs["use_hqq"] = use_hqq
     return aqt_kwargs
@@ -138,8 +116,6 @@ def get_gemlite_aqt_kwargs(
 class GemlitePackedLayout(Layout):
     group_size: Optional[int] = 64
     bit_width: int = 4
-    packing_bitwidth: int = None
-    contiguous: bool = None
 
 
 @register_layout(GemlitePackedLayout)
@@ -216,13 +192,18 @@ def from_plain(
         group_size, bit_width = _layout.group_size, _layout.bit_width
         out_features, in_features = int_data.shape
 
-        gemlite_linear = gemlite.helper.A16Wn(device=int_data.device).from_weights(
-            int_data, scale, zero_point, bit_width, group_size, bias=None
-        )
+        if bit_width == 8 and group_size == in_features:
+            gemlite_linear = gemlite.helper.A16W8(device=int_data.device).from_weights(
+                int_data, scales=scale, bias=None
+            )
+        else:
+            gemlite_linear = gemlite.helper.A16Wn(device=int_data.device).from_weights(
+                int_data, scale, zero_point, bit_width, group_size, bias=None
+            )
 
         gemlite_kwargs = {
+            "in_features": in_features,
             "out_features": out_features,
-            "scaled_activations": gemlite_linear.scaled_activations,
             "meta_args": gemlite_linear.get_meta_args(),
         }
 
@@ -253,20 +234,17 @@ def _apply_fn_to_data(self, fn):
 
     def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
         device = self.packed_weight.device
-        elements_per_sample = self._layout.packing_bitwidth // self._layout.bit_width
-        in_features = (
-            self.packed_weight.numel() * elements_per_sample
-        ) // self.gemlite_kwargs["out_features"]
         int_data = (
             gemlite.bitpack.unpack_over_rows(
                 self.packed_weight.cuda(),
                 W_nbits=self._layout.bit_width,
-                num_output_rows=in_features,
+                num_output_rows=self.gemlite_kwargs["out_features"],
                 dtype=torch.uint8,
             )
             .t()
             .contiguous()
         ).to(device)
+
         scale = self.scale.t().contiguous()
         zero_point = self.zero_point.t().contiguous()
 
@@ -353,42 +331,21 @@ def block_size(self):
         return (1, self._layout.group_size)
 
 
-# logic taken from gemlite's core.py
-def _matmul_type_fn(batch_size: int, bit_width: int) -> str:
-    if batch_size > 64:
-        return "GEMM"
-    elif batch_size > 1:
-        return "GEMM_SPLITK"
-    else:
-        return gemlite.core.get_default_gemv(bit_width)
-
-
 def _linear_fp_act_int4_weight_gemlite_impl(input_tensor, weight_tensor, bias=None):
     if hasattr(weight_tensor, "tensor_impl"):
         weight_impl = weight_tensor.tensor_impl
     else:
         weight_impl = weight_tensor
 
-    batch_size = input_tensor.view(-1, input_tensor.shape[-1]).shape[0]
-    matmul_type = _matmul_type_fn(batch_size, weight_impl._layout.bit_width)
-
-    if weight_impl.gemlite_kwargs["scaled_activations"]:
-        scale_activations = scale_activations_int8
-    else:
-        scale_activations = scale_activations_no_scaling
-
-    return GemLiteLinearTriton.forward_functional(
+    return gemlite.core.forward_functional(
         x=input_tensor,
         bias=bias,
-        matmul_type=matmul_type,
-        out_features=weight_impl.gemlite_kwargs["out_features"],
-        scale_activations=scale_activations,
-        meta_args=weight_impl.gemlite_kwargs["meta_args"],
         tensor_args=(
             weight_impl.packed_weight,
             weight_impl.scale,
             weight_impl.zero_point,
         ),
+        meta_args=weight_impl.gemlite_kwargs["meta_args"],
     )
 
 
diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index 15e3b20fc8..4229577b95 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -979,8 +979,6 @@ class GemliteUIntXWeightOnlyConfig(AOBaseConfig):
 
     group_size: Optional[int] = 64
     bit_width: int = 4
-    packing_bitwidth: int = 32
-    contiguous: Optional[bool] = None
     set_inductor_config: bool = True
 
 
@@ -994,8 +992,6 @@ def _gemlite_uintx_weight_only_transform(
 ):
     group_size = config.group_size
     bit_width = config.bit_width
-    packing_bitwidth = config.packing_bitwidth
-    contiguous = config.contiguous
     if config.set_inductor_config:
         torchao.quantization.utils.recommended_inductor_config_setter()
 
@@ -1006,9 +1002,7 @@ def _gemlite_uintx_weight_only_transform(
     use_hqq = True if bit_width == 4 else False
     new_weight = to_affine_quantized_intx(
         weight,
-        **get_gemlite_aqt_kwargs(
-            weight, group_size, bit_width, packing_bitwidth, contiguous, use_hqq
-        ),
+        **get_gemlite_aqt_kwargs(weight, group_size, bit_width, use_hqq),
     )
     module.weight = torch.nn.Parameter(new_weight, requires_grad=False)
     module.extra_repr = types.MethodType(_linear_extra_repr, module)

From 7854249acadf43b7d304d7c27eee5f405990ae3c Mon Sep 17 00:00:00 2001
From: Jesse Cai <jessecai@meta.com>
Date: Wed, 21 May 2025 17:54:43 -0400
Subject: [PATCH 040/165] remove benchmarks from top level repo (#2233)

Remove some .csv files I added accidentally in an earlier PR.
---
 e2e_fp8_sparse.csv                                    | 8 --------
 rowwise_scaled_linear_sparse_cutlass_time_results.csv | 4 ----
 2 files changed, 12 deletions(-)
 delete mode 100644 e2e_fp8_sparse.csv
 delete mode 100644 rowwise_scaled_linear_sparse_cutlass_time_results.csv

diff --git a/e2e_fp8_sparse.csv b/e2e_fp8_sparse.csv
deleted file mode 100644
index 05a80e13b7..0000000000
--- a/e2e_fp8_sparse.csv
+++ /dev/null
@@ -1,8 +0,0 @@
-num_tokens,bf16_latency (us),bf16_c_latency (us),fp8_c_time (us),fp8_c_sparse_time (us),fp8_c_activation_sparse_time (us),speedup
-64,166.81599617004395,163.03999722003937,103.00800204277039,74.30399954319,102.81600058078766,1.0018674278409796
-128,156.25600516796112,151.5199989080429,99.93600100278854,75.45600086450577,102.04800218343735,0.9793038458817415
-256,172.28800058364868,159.58400070667267,114.07999694347382,82.43200182914734,111.07199639081955,1.0270815385551393
-512,218.87999773025513,204.6079933643341,144.0960019826889,114.56000059843063,139.48799669742584,1.0330351384661336
-1024,394.4000005722046,392.5440013408661,251.10399723052979,196.4160054922104,227.90400683879852,1.1017972027501084
-2048,764.6080255508423,734.8160147666931,480.70400953292847,381.1520040035248,426.68798565864563,1.1265937305239622
-4096,1658.8159799575806,1623.5840320587158,901.3440012931824,779.0079712867737,843.392014503479,1.0687129896811043
diff --git a/rowwise_scaled_linear_sparse_cutlass_time_results.csv b/rowwise_scaled_linear_sparse_cutlass_time_results.csv
deleted file mode 100644
index 09bea2f9bd..0000000000
--- a/rowwise_scaled_linear_sparse_cutlass_time_results.csv
+++ /dev/null
@@ -1,4 +0,0 @@
-m,k,n,fp16_latency (ms),fp8_latency (ms),rowwise_scaled_linear_sparse_cutlass_f8f8 latency (ms),cusparselt latency (ms),f8f8 speedup (d/s)
-2048,8192,8192,345.7919955253601,243.13600361347198,159.7760021686554,634.2080235481262,1.5217304245528933
-4096,8192,8192,756.3199996948242,500.2880096435547,363.647997379303,628.7999749183655,1.3757480124982768
-8192,8192,8192,1433.568000793457,982.5279712677002,895.3920006752014,859.935998916626,1.0973160029649482

From 5153bd3ce9fc4e873a00d7a24000114ce93a2899 Mon Sep 17 00:00:00 2001
From: Jesse Cai <jessecai@meta.com>
Date: Wed, 21 May 2025 19:55:52 -0400
Subject: [PATCH 041/165] clean up prototype folder (#2232)

---
 torchao/sparsity/prototype/__init__.py        | 33 -------------------
 .../sparsity/prototype/pruner/FPGM_pruner.py  |  8 -----
 torchao/sparsity/prototype/pruner/__init__.py | 17 ----------
 .../pruner/base_structured_sparsifier.py      | 10 ------
 .../prototype/pruner/lstm_saliency_pruner.py  |  8 -----
 .../prototype/pruner/parametrization.py       | 14 --------
 .../prototype/pruner/saliency_pruner.py       |  8 -----
 .../sparsity/prototype/scheduler/__init__.py  |  0
 .../prototype/scheduler/base_scheduler.py     |  8 -----
 .../prototype/scheduler/cubic_scheduler.py    |  8 -----
 .../prototype/scheduler/lambda_scheduler.py   |  8 -----
 .../sparsity/prototype/sparsifier/__init__.py |  0
 .../prototype/sparsifier/base_sparsifier.py   |  8 -----
 .../sparsifier/nearly_diagonal_sparsifier.py  | 10 ------
 .../sparsity/prototype/sparsifier/utils.py    |  8 -----
 .../sparsifier/weight_norm_sparsifier.py      | 10 ------
 16 files changed, 158 deletions(-)
 delete mode 100644 torchao/sparsity/prototype/__init__.py
 delete mode 100644 torchao/sparsity/prototype/pruner/FPGM_pruner.py
 delete mode 100644 torchao/sparsity/prototype/pruner/__init__.py
 delete mode 100644 torchao/sparsity/prototype/pruner/base_structured_sparsifier.py
 delete mode 100644 torchao/sparsity/prototype/pruner/lstm_saliency_pruner.py
 delete mode 100644 torchao/sparsity/prototype/pruner/parametrization.py
 delete mode 100644 torchao/sparsity/prototype/pruner/saliency_pruner.py
 delete mode 100644 torchao/sparsity/prototype/scheduler/__init__.py
 delete mode 100644 torchao/sparsity/prototype/scheduler/base_scheduler.py
 delete mode 100644 torchao/sparsity/prototype/scheduler/cubic_scheduler.py
 delete mode 100644 torchao/sparsity/prototype/scheduler/lambda_scheduler.py
 delete mode 100644 torchao/sparsity/prototype/sparsifier/__init__.py
 delete mode 100644 torchao/sparsity/prototype/sparsifier/base_sparsifier.py
 delete mode 100644 torchao/sparsity/prototype/sparsifier/nearly_diagonal_sparsifier.py
 delete mode 100644 torchao/sparsity/prototype/sparsifier/utils.py
 delete mode 100644 torchao/sparsity/prototype/sparsifier/weight_norm_sparsifier.py

diff --git a/torchao/sparsity/prototype/__init__.py b/torchao/sparsity/prototype/__init__.py
deleted file mode 100644
index 821e5049e0..0000000000
--- a/torchao/sparsity/prototype/__init__.py
+++ /dev/null
@@ -1,33 +0,0 @@
-# Sparsifier
-# Scheduler
-from torchao.prototype.sparsity.scheduler.base_scheduler import BaseScheduler
-from torchao.prototype.sparsity.scheduler.cubic_scheduler import CubicSL
-from torchao.prototype.sparsity.scheduler.lambda_scheduler import LambdaSL
-from torchao.prototype.sparsity.sparsifier.base_sparsifier import BaseSparsifier
-from torchao.prototype.sparsity.sparsifier.nearly_diagonal_sparsifier import (
-    NearlyDiagonalSparsifier,
-)
-
-# Parametrizations
-from torchao.prototype.sparsity.sparsifier.utils import (
-    FakeSparsity,
-    fqn_to_module,
-    get_arg_info_from_tensor_fqn,
-    module_to_fqn,
-)
-from torchao.prototype.sparsity.sparsifier.weight_norm_sparsifier import (
-    WeightNormSparsifier,
-)
-
-__all__ = [
-    "BaseScheduler",
-    "CubicSL",
-    "LambdaSL",
-    "BaseSparsifier",
-    "NearlyDiagonalSparsifier",
-    "FakeSparsity",
-    "fqn_to_module",
-    "get_arg_info_from_tensor_fqn",
-    "module_to_fqn",
-    "WeightNormSparsifier",
-]
diff --git a/torchao/sparsity/prototype/pruner/FPGM_pruner.py b/torchao/sparsity/prototype/pruner/FPGM_pruner.py
deleted file mode 100644
index e11dedf9ab..0000000000
--- a/torchao/sparsity/prototype/pruner/FPGM_pruner.py
+++ /dev/null
@@ -1,8 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from torchao.prototype.sparsity.pruner.FPGM_pruner import FPGMPruner
-
-__all__ = ["FPGMPruner"]
diff --git a/torchao/sparsity/prototype/pruner/__init__.py b/torchao/sparsity/prototype/pruner/__init__.py
deleted file mode 100644
index 9d7f775389..0000000000
--- a/torchao/sparsity/prototype/pruner/__init__.py
+++ /dev/null
@@ -1,17 +0,0 @@
-from .base_structured_sparsifier import BaseStructuredSparsifier
-from .FPGM_pruner import FPGMPruner
-from .lstm_saliency_pruner import LSTMSaliencyPruner
-from .parametrization import (
-    BiasHook,
-    FakeStructuredSparsity,
-)
-from .saliency_pruner import SaliencyPruner
-
-__all__ = [
-    "BaseStructuredSparsifier",
-    "FPGMPruner",
-    "LSTMSaliencyPruner",
-    "BiasHook",
-    "FakeStructuredSparsity",
-    "SaliencyPruner",
-]
diff --git a/torchao/sparsity/prototype/pruner/base_structured_sparsifier.py b/torchao/sparsity/prototype/pruner/base_structured_sparsifier.py
deleted file mode 100644
index 15471a4df8..0000000000
--- a/torchao/sparsity/prototype/pruner/base_structured_sparsifier.py
+++ /dev/null
@@ -1,10 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from torchao.prototype.sparsity.pruner.base_structured_sparsifier import (
-    BaseStructuredSparsifier,
-)
-
-__all__ = ["BaseStructuredSparsifier"]
diff --git a/torchao/sparsity/prototype/pruner/lstm_saliency_pruner.py b/torchao/sparsity/prototype/pruner/lstm_saliency_pruner.py
deleted file mode 100644
index c22ca6bb59..0000000000
--- a/torchao/sparsity/prototype/pruner/lstm_saliency_pruner.py
+++ /dev/null
@@ -1,8 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from torchao.prototype.sparsity.pruner.lstm_saliency_pruner import LSTMSaliencyPruner
-
-__all__ = ["LSTMSaliencyPruner"]
diff --git a/torchao/sparsity/prototype/pruner/parametrization.py b/torchao/sparsity/prototype/pruner/parametrization.py
deleted file mode 100644
index 03fab85f43..0000000000
--- a/torchao/sparsity/prototype/pruner/parametrization.py
+++ /dev/null
@@ -1,14 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from torchao.prototype.sparsity.pruner.parametrization import (
-    BiasHook,
-    FakeStructuredSparsity,
-)
-
-__all__ = [
-    "BiasHook",
-    "FakeStructuredSparsity",
-]
diff --git a/torchao/sparsity/prototype/pruner/saliency_pruner.py b/torchao/sparsity/prototype/pruner/saliency_pruner.py
deleted file mode 100644
index 421cac2a6f..0000000000
--- a/torchao/sparsity/prototype/pruner/saliency_pruner.py
+++ /dev/null
@@ -1,8 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from torchao.prototype.sparsity.pruner.saliency_pruner import SaliencyPruner
-
-__all__ = ["SaliencyPruner"]
diff --git a/torchao/sparsity/prototype/scheduler/__init__.py b/torchao/sparsity/prototype/scheduler/__init__.py
deleted file mode 100644
index e69de29bb2..0000000000
diff --git a/torchao/sparsity/prototype/scheduler/base_scheduler.py b/torchao/sparsity/prototype/scheduler/base_scheduler.py
deleted file mode 100644
index 30a29c4775..0000000000
--- a/torchao/sparsity/prototype/scheduler/base_scheduler.py
+++ /dev/null
@@ -1,8 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from torchao.prototype.sparsity.scheduler.base_scheduler import BaseScheduler
-
-__all__ = ["BaseScheduler"]
diff --git a/torchao/sparsity/prototype/scheduler/cubic_scheduler.py b/torchao/sparsity/prototype/scheduler/cubic_scheduler.py
deleted file mode 100644
index 6ea7e95c36..0000000000
--- a/torchao/sparsity/prototype/scheduler/cubic_scheduler.py
+++ /dev/null
@@ -1,8 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from torchao.prototype.sparsity.scheduler.cubic_scheduler import CubicSL
-
-__all__ = ["CubicSL"]
diff --git a/torchao/sparsity/prototype/scheduler/lambda_scheduler.py b/torchao/sparsity/prototype/scheduler/lambda_scheduler.py
deleted file mode 100644
index 97d0abf174..0000000000
--- a/torchao/sparsity/prototype/scheduler/lambda_scheduler.py
+++ /dev/null
@@ -1,8 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from torchao.prototype.sparsity.scheduler.lambda_scheduler import LambdaSL
-
-__all__ = ["LambdaSL"]
diff --git a/torchao/sparsity/prototype/sparsifier/__init__.py b/torchao/sparsity/prototype/sparsifier/__init__.py
deleted file mode 100644
index e69de29bb2..0000000000
diff --git a/torchao/sparsity/prototype/sparsifier/base_sparsifier.py b/torchao/sparsity/prototype/sparsifier/base_sparsifier.py
deleted file mode 100644
index 3c9f0947d8..0000000000
--- a/torchao/sparsity/prototype/sparsifier/base_sparsifier.py
+++ /dev/null
@@ -1,8 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from torchao.prototype.sparsity.sparsifier.base_sparsifier import BaseSparsifier
-
-__all__ = ["BaseSparsifier"]
diff --git a/torchao/sparsity/prototype/sparsifier/nearly_diagonal_sparsifier.py b/torchao/sparsity/prototype/sparsifier/nearly_diagonal_sparsifier.py
deleted file mode 100644
index e6caa9087d..0000000000
--- a/torchao/sparsity/prototype/sparsifier/nearly_diagonal_sparsifier.py
+++ /dev/null
@@ -1,10 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from torchao.prototype.sparsity.sparsifier.nearly_diagonal_sparsifier import (
-    NearlyDiagonalSparsifier,
-)
-
-__all__ = ["NearlyDiagonalSparsifier"]
diff --git a/torchao/sparsity/prototype/sparsifier/utils.py b/torchao/sparsity/prototype/sparsifier/utils.py
deleted file mode 100644
index 8cb822513e..0000000000
--- a/torchao/sparsity/prototype/sparsifier/utils.py
+++ /dev/null
@@ -1,8 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from torchao.prototype.sparsity.sparsifier.utils import FakeSparsity
-
-__all__ = ["FakeSparsity"]
diff --git a/torchao/sparsity/prototype/sparsifier/weight_norm_sparsifier.py b/torchao/sparsity/prototype/sparsifier/weight_norm_sparsifier.py
deleted file mode 100644
index 93d2799316..0000000000
--- a/torchao/sparsity/prototype/sparsifier/weight_norm_sparsifier.py
+++ /dev/null
@@ -1,10 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from torchao.prototype.sparsity.sparsifier.weight_norm_sparsifier import (
-    WeightNormSparsifier,
-)
-
-__all__ = ["WeightNormSparsifier"]

From c4a7ad46f821fa286bbbfe30ad60ecea348dc967 Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Wed, 21 May 2025 19:09:24 -0700
Subject: [PATCH 042/165] Relax MOE constraints and add test for torch.mm
 computation (#2227)

* Relax some constraints to allow quantizing aten.mm

Summary:
Currently both float8 dynamic quant and int4 weight only quant only works with F.linear, not aten.mm
this PR allows fallback to dequantizing tensors and run the fallback path before the real support is
in place.

Test Plan:
python test/dtypes/test_affine_quantized.py -k test_mm_int4wo
python test/dtypes/test_affine_quantized_float.py -k test_mm_float8dq

Reviewers:

Subscribers:

Tasks:

Tags:

* add skip if no cuda

* update tests

* update
---
 test/dtypes/test_affine_quantized.py       | 18 ++++++++++++++++++
 test/dtypes/test_affine_quantized_float.py | 21 +++++++++++++++++++++
 torchao/prototype/moe_quant/utils.py       |  7 ++++++-
 3 files changed, 45 insertions(+), 1 deletion(-)

diff --git a/test/dtypes/test_affine_quantized.py b/test/dtypes/test_affine_quantized.py
index 4ed39a0eff..b74c5d2ecf 100644
--- a/test/dtypes/test_affine_quantized.py
+++ b/test/dtypes/test_affine_quantized.py
@@ -421,6 +421,24 @@ def test_slice_and_copy_int4wo(self, device, dtype):
         # making sure param.data is updated
         assert param.data.dequantize()[0][0] != 0
 
+    @common_utils.parametrize("device", ["cuda"])
+    @common_utils.parametrize("dtype", [torch.bfloat16])
+    @skip_if_no_cuda()
+    @skip_if_rocm("ROCm enablement in progress")
+    def test_mm_int4wo(self, device, dtype):
+        weight = torch.randn(512, 1024).to(device).to(dtype)
+        weight = weight.t()
+
+        l = torch.nn.Linear(512, 1024).to(device).to(dtype)
+        l.weight = torch.nn.Parameter(weight)
+        quantize_(l, Int4WeightOnlyConfig())
+        # weight shape: 1024 x 512
+        weight = l.weight
+
+        input = torch.randn(1, 512, device=device, dtype=dtype)
+        # make sure it runs
+        torch.nn.functional.linear(input, weight)
+
 
 common_utils.instantiate_parametrized_tests(TestAffineQuantized)
 common_utils.instantiate_parametrized_tests(TestAffineQuantizedBasic)
diff --git a/test/dtypes/test_affine_quantized_float.py b/test/dtypes/test_affine_quantized_float.py
index e0ac28872b..8c36f5ac7a 100644
--- a/test/dtypes/test_affine_quantized_float.py
+++ b/test/dtypes/test_affine_quantized_float.py
@@ -27,6 +27,7 @@
 
 from torchao.float8.float8_utils import compute_error
 from torchao.quantization import (
+    Float8DynamicActivationFloat8WeightConfig,
     float8_dynamic_activation_float8_weight,
     float8_weight_only,
     quantize_,
@@ -292,6 +293,26 @@ def test_fp8_weight_dimension_warning(self):
                 f"Expected warning message containing: {expected}",
             )
 
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    @unittest.skipIf(
+        not is_sm_at_least_89(), "Requires GPU with compute capability >= 8.9"
+    )
+    def test_mm_float8dq(self):
+        device = "cuda"
+        dtype = torch.bfloat16
+        weight = torch.randn(512, 1024).to(device).to(dtype)
+        weight = weight.t()
+
+        l = torch.nn.Linear(512, 1024).to(device).to(dtype)
+        l.weight = torch.nn.Parameter(weight)
+        quantize_(l, Float8DynamicActivationFloat8WeightConfig(granularity=PerRow()))
+        # weight shape: 1024 x 512
+        weight = l.weight
+
+        input = torch.randn(1, 512, device=device, dtype=dtype)
+        # make sure it runs
+        torch.nn.functional.linear(input, weight)
+
 
 common_utils.instantiate_parametrized_tests(TestAffineQuantizedFloat8Compile)
 
diff --git a/torchao/prototype/moe_quant/utils.py b/torchao/prototype/moe_quant/utils.py
index 16fa8c8d33..0e75de2ee4 100644
--- a/torchao/prototype/moe_quant/utils.py
+++ b/torchao/prototype/moe_quant/utils.py
@@ -1,3 +1,9 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
 import torch
 from torch.utils._python_dispatch import (
     return_and_correct_aliasing,
@@ -282,7 +288,6 @@ def moe_quant_fn(module, config: MoEQuantConfig):
 
     warnings.simplefilter("ignore", lineno=84)
     warnings.simplefilter("ignore", lineno=105)
-    assert "ConditionalFeedForwardAOQuantizable" in str(type(module))
 
     for weight_attr in ["w1", "w2", "w3"]:
         param = getattr(module, weight_attr)

From f0f976cede3ed51edf1b690d82bfc0d72d81b79b Mon Sep 17 00:00:00 2001
From: Andrey Talman <atalman@fb.com>
Date: Thu, 22 May 2025 07:35:27 -0400
Subject: [PATCH 043/165] Try fixing CI by pinning pytest (#2238)

* Try fixing CI by pinning pytest

* Update regression_test.yml
---
 .github/workflows/regression_test.yml | 4 ++--
 dev-requirements.txt                  | 2 +-
 2 files changed, 3 insertions(+), 3 deletions(-)

diff --git a/.github/workflows/regression_test.yml b/.github/workflows/regression_test.yml
index f1188fd7d5..f4f054b307 100644
--- a/.github/workflows/regression_test.yml
+++ b/.github/workflows/regression_test.yml
@@ -64,7 +64,7 @@ jobs:
             torch-spec: 'torch==2.5.1 --index-url https://download.pytorch.org/whl/cu121'
             gpu-arch-type: "cuda"
             gpu-arch-version: "12.6"
-            dev-requirements-overrides: "s/^pytest$/pytest==7.4.0/"
+            dev-requirements-overrides: "s/^pytest.*$/pytest==7.4.0/"
           - name: CUDA 2.6
             runs-on: linux.g5.12xlarge.nvidia.gpu
             torch-spec: 'torch==2.6.0'
@@ -83,7 +83,7 @@ jobs:
             torch-spec: 'torch==2.5.1 --index-url https://download.pytorch.org/whl/cpu'
             gpu-arch-type: "cpu"
             gpu-arch-version: ""
-            dev-requirements-overrides: "s/^pytest$/pytest==7.4.0/"
+            dev-requirements-overrides: "s/^pytest.*$/pytest==7.4.0/"
           - name: CPU 2.6
             runs-on: linux.4xlarge
             torch-spec: 'torch==2.6.0 --index-url https://download.pytorch.org/whl/cpu'
diff --git a/dev-requirements.txt b/dev-requirements.txt
index 600d5001cf..f9e4381e4e 100644
--- a/dev-requirements.txt
+++ b/dev-requirements.txt
@@ -1,5 +1,5 @@
 # Test utilities
-pytest
+pytest==8.3.4
 unittest-xml-reporting
 parameterized
 packaging

From 4c6188f3f20724c8bbab545e74a6a65356c4e08e Mon Sep 17 00:00:00 2001
From: Jesse Cai <jessecai@meta.com>
Date: Thu, 22 May 2025 11:44:38 -0400
Subject: [PATCH 044/165] [sparse] Add fp8 sparse gemm with rowwise scaling for
 activation sparsity (#2242)

* [sparse] Add fp8 sparse gemm with rowwise scaling for activation sparsity

Summary:

We have this gemm already in torchao, but for weight sparsity.

For activation sparsity, we need the weights to be stored in
column-major format to allow for us to use the selective weight loading
kernel for decode.

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* remove cutlass compression

* ruff fix

* one more ruff fix

* don't build for CUDA 11.8

* fix formatting

* ifdef to avoid issues
---
 setup.py                                      |   1 +
 test/sparsity/test_activation24.py            |  66 ++++
 torchao/csrc/cuda/activation24/sparse_gemm.cu | 351 ++++++++++++++++++
 torchao/ops.py                                |  25 ++
 4 files changed, 443 insertions(+)
 create mode 100644 torchao/csrc/cuda/activation24/sparse_gemm.cu

diff --git a/setup.py b/setup.py
index cabaad01cf..0915f6ae1e 100644
--- a/setup.py
+++ b/setup.py
@@ -433,6 +433,7 @@ def get_extensions():
                     "to_sparse_semi_structured_cutlass_sm9x_f8.cu",
                 ),
                 os.path.join(extensions_cuda_dir, "activation24", "sparsify24.cu"),
+                os.path.join(extensions_cuda_dir, "activation24", "sparse_gemm.cu"),
             ]
             for dtypes in ["e4m3e4m3", "e4m3e5m2", "e5m2e4m3", "e5m2e5m2"]:
                 cutlass_90a_sources.append(
diff --git a/test/sparsity/test_activation24.py b/test/sparsity/test_activation24.py
index 65b7cfd8d2..420bf4328a 100644
--- a/test/sparsity/test_activation24.py
+++ b/test/sparsity/test_activation24.py
@@ -8,6 +8,7 @@
     PerRow,
     quantize_,
 )
+from torchao.quantization.quant_api import _float8_cutlass_quant
 
 torch.sparse.SparseSemiStructuredTensor._FORCE_CUTLASS = True
 
@@ -141,3 +142,68 @@ def srelu_linear(x):
         custom_output = reference_linear_copy(input_tensor)
 
         torch.testing.assert_close(reference_output, custom_output, rtol=0.1, atol=0.01)
+
+
+@unittest.skipIf(not is_sm_at_least_90(), "Need cuda arch greater than SM90")
+def test_sparse24_fp8_sm90_cutlass_gemm_eye(
+    M=512, K=256, dtype=torch.float8_e4m3fn
+) -> None:
+    torch.manual_seed(0)
+
+    A_dense = create_semi_structured_tensor(M, K, dtype=torch.bfloat16).cuda()
+    A_aqt = _float8_cutlass_quant(A_dense, dtype)
+    A = A_aqt.tensor_impl.float8_data
+
+    # NOTE: CUTLASS compression kernel expects the input to be *exactly*
+    # 2:4 sparse already (eg it does not select the largest values)
+    A_packed, A_mdata = to_sparse_semi_structured_cutlass_sm9x_f8(A)
+    assert torch.allclose(
+        A_packed.float().sum(), A.float().sum()
+    )  # Check all values are there
+
+    # Check MM without scale
+    eye = torch.eye(A.shape[1], device=A.device, dtype=A.dtype).T
+    A_reconstructed = torch.ops.torchao.sparse24_fp8_sm90_cutlass_gemm(
+        A_packed, A_mdata, eye
+    )
+    assert torch.allclose(A.float(), A_reconstructed.float())
+
+    # Check MM with scale
+    b_scale = torch.randn([1, A.shape[1]], device=eye.device, dtype=torch.float32)
+    a_scale = torch.randn([A.shape[0], 1], device=eye.device, dtype=torch.float32)
+    A_reconstructed = torch.ops.torchao._sparse24_fp8_sm90_cutlass_gemm(
+        A_packed, A_mdata, eye, a_scale=a_scale, b_scale=b_scale
+    )
+    assert torch.allclose(
+        A.float() * b_scale * a_scale, A_reconstructed.float(), rtol=0.01
+    )
+
+
+@unittest.skipIf(not is_sm_at_least_90(), "Need cuda arch greater than SM90")
+def test_sparse24_fp8_sm90_cutlass_gemm_random_tensor(
+    M=512, N=1024, K=256, dtype=torch.float8_e4m3fn
+) -> None:
+    def _to_fp8_rowwise(x: torch.Tensor, dtype):
+        max_v = torch.finfo(dtype).max
+        x_scale = (x.abs().max(1, keepdim=True)[0] / max_v).float()
+        x = (x / x_scale).to(dtype)
+        return x, x_scale
+
+    torch.manual_seed(0)
+    A_dense = create_semi_structured_tensor(M, K, dtype=torch.bfloat16).cuda()
+    A, a_scale = _to_fp8_rowwise(A_dense, dtype)
+
+    B_dense = torch.randn([N, K], device="cuda", dtype=torch.bfloat16)
+    B, b_scale = _to_fp8_rowwise(B_dense, dtype)
+
+    B = B.T
+    b_scale = b_scale.T
+
+    A_packed, A_mdata = to_sparse_semi_structured_cutlass_sm9x_f8(A)
+    out_sparse = torch.ops.torchao.sparse24_fp8_sm90_cutlass_gemm(
+        A_packed, A_mdata, B, a_scale=a_scale, b_scale=b_scale
+    )
+    out_ref = torch._scaled_mm(
+        A, B, scale_a=a_scale, scale_b=b_scale, out_dtype=out_sparse.dtype
+    )
+    assert torch.allclose(out_sparse, out_ref, rtol=0.01, atol=0.01)
diff --git a/torchao/csrc/cuda/activation24/sparse_gemm.cu b/torchao/csrc/cuda/activation24/sparse_gemm.cu
new file mode 100644
index 0000000000..776766794e
--- /dev/null
+++ b/torchao/csrc/cuda/activation24/sparse_gemm.cu
@@ -0,0 +1,351 @@
+#include <ATen/Dispatch.h>
+#include <ATen/core/Tensor.h>
+#include <ATen/cuda/CUDAUtils.h>
+#include <c10/cuda/CUDAGuard.h>
+#include <torch/library.h>
+
+#if defined(TORCHAO_USE_CUTLASS) && !defined(_WIN32) &&                   \
+    defined(CUDA_VERSION) && (CUDA_VERSION >= 12020)
+#define BUILD_SM90_24_FP8_CUTLASS_GEMM
+#endif
+
+#if defined(BUILD_SM90_24_FP8_CUTLASS_GEMM)
+#include <cute/algorithm/functional.hpp>
+#include <cutlass/gemm/device/gemm_universal_adapter.h>
+#include <cutlass/util/packed_stride.hpp>
+#include "cutlass/arch/wmma.h"
+#include "cutlass/bfloat16.h"
+#include "cutlass/cuda_host_adapter.hpp"
+#include "cutlass/cutlass.h"
+#include "cutlass/epilogue/collective/collective_builder.hpp"
+#include "cutlass/gemm/collective/collective_builder.hpp"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/kernel/gemm_universal.hpp"
+#include "cutlass/numeric_types.h"
+#include "cutlass/transform/device/transform_universal_adapter.hpp"
+
+#include <tuple>
+#include <type_traits>
+
+using namespace at;
+
+namespace {
+#define CUTLASS_STATUS_CHECK(status)              \
+  {                                               \
+    TORCH_CHECK(                                  \
+        status == cutlass::Status::kSuccess,      \
+        "Got CUTLASS error: ",                    \
+        cutlass::cutlassGetStatusString(status)); \
+  }
+
+template <typename T>
+struct identity {
+  CUTLASS_HOST_DEVICE
+  T operator()(T lhs) const {
+    return lhs;
+  }
+};
+
+template <typename ElementA>
+struct SparseRowwiseKernel;
+
+template <>
+struct SparseRowwiseKernel<cutlass::float_e4m3_t> {
+  static constexpr auto kElementOutAt = at::ScalarType::BFloat16;
+  static constexpr auto kElementAAt = at::ScalarType::Float8_e4m3fn;
+
+  using ElementA = cutlass::float_e4m3_t;
+  using ElementB = cutlass::float_e4m3_t;
+  using ElementOut = cutlass::bfloat16_t;
+  using ElementAccumulator = float;
+
+  using TileShape = cute::Shape<cute::_128, cute::_256, cute::_128>;
+
+  // Epilogue visitor tree
+  using Accum = cutlass::epilogue::fusion::Sm90AccFetch;
+  using AScale =
+      cutlass::epilogue::fusion::Sm90ColBroadcast<0, TileShape, float>;
+  using BScale =
+      cutlass::epilogue::fusion::Sm90RowBroadcast<0, TileShape, float>;
+  using Multiply = cutlass::epilogue::fusion::Sm90Compute<
+      cutlass::multiplies,
+      float,
+      float,
+      cutlass::FloatRoundStyle::round_to_nearest>;
+  using Cast = cutlass::epilogue::fusion::Sm90Compute<
+      identity,
+      ElementOut,
+      float,
+      cutlass::FloatRoundStyle::round_to_nearest>;
+  using EpilogueEVT = cutlass::epilogue::fusion::Sm90EVT<
+      Cast,
+      cutlass::epilogue::fusion::Sm90EVT<
+          Multiply,
+          BScale,
+          cutlass::epilogue::fusion::Sm90EVT<Multiply, AScale, Accum>>>;
+
+  using CollectiveEpilogue =
+      typename cutlass::epilogue::collective::CollectiveBuilder<
+          cutlass::arch::Sm90,
+          cutlass::arch::OpClassSparseTensorOp,
+          TileShape,
+          cute::Shape<cute::_2, cute::_1, cute::_1>,
+          cutlass::epilogue::collective::EpilogueTileAuto,
+          ElementAccumulator,
+          float,
+          ElementOut,
+          cutlass::layout::RowMajor,
+          1,
+          ElementOut,
+          cutlass::layout::RowMajor,
+          1,
+          cutlass::epilogue::TmaWarpSpecializedCooperative,
+          EpilogueEVT>::CollectiveOp;
+
+  using CollectiveMainloop =
+      typename cutlass::gemm::collective::CollectiveBuilder<
+          cutlass::arch::Sm90,
+          cutlass::arch::OpClassSparseTensorOp,
+          ElementA,
+          cutlass::layout::RowMajor,
+          32,
+          ElementB,
+          cutlass::layout::ColumnMajor,
+          16,
+          ElementAccumulator,
+          cute::Shape<cute::_128, cute::_256, cute::_128>,
+          cute::Shape<cute::_2, cute::_1, cute::_1>,
+          cutlass::gemm::collective::StageCountAutoCarveout<static_cast<int>(
+              sizeof(typename CollectiveEpilogue::SharedStorage))>,
+          cutlass::gemm::KernelTmaWarpSpecializedCooperativeFP8FastAccum>::
+          CollectiveOp;
+
+  // Gemm operator
+  // cutlass3x_sm90_sptensorop_s64x256x64spgemm_e4m3_e4m3_f32_bf16_bf16_128x256x128_2x1x1_0_tnt_align32_warpspecialized_cooperative_fp8_fastaccum_epi_tma
+  using GemmKernel = cutlass::gemm::kernel::GemmUniversal<
+      cute::Shape<int, int, int, int>,
+      CollectiveMainloop,
+      CollectiveEpilogue,
+      cutlass::gemm::PersistentScheduler>;
+  using ElementE = CollectiveMainloop::ElementE;
+};
+
+template <>
+struct SparseRowwiseKernel<cutlass::bfloat16_t> {
+  static constexpr auto kElementOutAt = at::ScalarType::BFloat16;
+  static constexpr auto kElementAAt = at::ScalarType::BFloat16;
+
+  using ElementA = cutlass::bfloat16_t;
+  using ElementB = cutlass::bfloat16_t;
+  using ElementOut = cutlass::bfloat16_t;
+
+  using TileShape = cute::Shape<cute::_128, cute::_128, cute::_64>;
+
+  // Epilogue visitor tree
+  using Accum = cutlass::epilogue::fusion::Sm90AccFetch;
+  using AScale =
+      cutlass::epilogue::fusion::Sm90ColBroadcast<0, TileShape, float>;
+  using BScale =
+      cutlass::epilogue::fusion::Sm90RowBroadcast<0, TileShape, float>;
+  using Multiply = cutlass::epilogue::fusion::Sm90Compute<
+      cutlass::multiplies,
+      float,
+      float,
+      cutlass::FloatRoundStyle::round_to_nearest>;
+  using Cast = cutlass::epilogue::fusion::Sm90Compute<
+      identity,
+      ElementOut,
+      float,
+      cutlass::FloatRoundStyle::round_to_nearest>;
+  using EpilogueEVT = cutlass::epilogue::fusion::Sm90EVT<
+      Cast,
+      cutlass::epilogue::fusion::Sm90EVT<
+          Multiply,
+          BScale,
+          cutlass::epilogue::fusion::Sm90EVT<Multiply, AScale, Accum>>>;
+
+  using CollectiveEpilogue =
+      typename cutlass::epilogue::collective::CollectiveBuilder<
+          cutlass::arch::Sm90,
+          cutlass::arch::OpClassSparseTensorOp,
+          TileShape,
+          cute::Shape<cute::_2, cute::_1, cute::_1>,
+          cutlass::epilogue::collective::EpilogueTileAuto,
+          float,
+          float,
+          ElementOut,
+          cutlass::layout::RowMajor,
+          1,
+          ElementOut,
+          cutlass::layout::RowMajor,
+          1,
+          cutlass::epilogue::TmaWarpSpecializedCooperative,
+          EpilogueEVT>::CollectiveOp;
+
+  using CollectiveMainloop =
+      typename cutlass::gemm::collective::CollectiveBuilder<
+          cutlass::arch::Sm90,
+          cutlass::arch::OpClassSparseTensorOp,
+          ElementA,
+          cutlass::layout::RowMajor,
+          16,
+          ElementB,
+          cutlass::layout::ColumnMajor,
+          16,
+          float,
+          cute::Shape<cute::_128, cute::_128, cute::_64>,
+          cute::Shape<cute::_2, cute::_1, cute::_1>,
+          cutlass::gemm::collective::StageCountAutoCarveout<static_cast<int>(
+              sizeof(typename CollectiveEpilogue::SharedStorage))>,
+          cutlass::gemm::KernelTmaWarpSpecializedCooperative>::CollectiveOp;
+
+  // Gemm operator
+  // cutlass3x_sm90_sptensorop_s64x128x32spgemm_bf16_bf16_f32_void_f32_128x128x64_2x1x1_0_ttn_align16_warpspecialized_cooperative_epi_tma
+  using GemmKernel = cutlass::gemm::kernel::GemmUniversal<
+      cute::Shape<int, int, int, int>,
+      CollectiveMainloop,
+      CollectiveEpilogue,
+      cutlass::gemm::PersistentScheduler>;
+  using ElementE = CollectiveMainloop::ElementE;
+};
+
+template <bool kIsMeta>
+Tensor _sparse24_fp8_sm90_cutlass_gemm(
+    const Tensor& tensor_a,
+    const Tensor& tensor_e, // metadata for `A`
+    const Tensor& tensor_b,
+    // *,
+    std::optional<at::Tensor> a_scale,
+    std::optional<at::Tensor> b_scale,
+    int64_t swizzle_size,
+    std::string swizzle_axis,
+    int64_t sm_count) {
+  std::optional<at::cuda::CUDAGuard> device_guard;
+  if (!kIsMeta) {
+    device_guard.emplace(tensor_a.device());
+  }
+
+  using K = SparseRowwiseKernel<cutlass::float_e4m3_t>;
+
+  // For now, only CC 9.x devices are supported.
+  if (!kIsMeta) {
+    const auto dprops = at::cuda::getCurrentDeviceProperties();
+    TORCH_CHECK(
+        dprops && dprops->major == 9,
+        "_sparse24_gemm_fp8_sm90: Supported only on GPUs with "
+        "compute capability 9.x");
+  }
+
+  // Validate layouts of input tensors.
+  TORCH_CHECK(tensor_a.device() == tensor_b.device());
+  TORCH_CHECK(tensor_a.device() == tensor_e.device());
+  TORCH_CHECK(tensor_a.dim() == 2);
+  TORCH_CHECK(tensor_b.dim() == 2);
+  TORCH_CHECK(tensor_a.scalar_type() == tensor_b.scalar_type());
+  TORCH_CHECK(tensor_a.scalar_type() == K::kElementAAt);
+  TORCH_CHECK(tensor_b.stride(0) == 1, "B must be Row-Major");
+  TORCH_CHECK(tensor_a.is_contiguous());
+  TORCH_CHECK(tensor_b.t().is_contiguous());
+  int64_t a_rows = tensor_a.size(0);
+  if (a_scale.has_value()) {
+    TORCH_CHECK(a_scale->is_contiguous());
+    TORCH_CHECK(a_scale->scalar_type() == at::ScalarType::Float);
+    TORCH_CHECK(a_scale->device() == tensor_a.device());
+    TORCH_CHECK(a_scale->dim() == 2);
+    TORCH_CHECK(a_scale->size(0) == a_rows);
+    TORCH_CHECK(a_scale->size(1) == 1);
+  }
+  if (b_scale.has_value()) {
+    TORCH_CHECK(b_scale->is_contiguous());
+    TORCH_CHECK(b_scale->scalar_type() == at::ScalarType::Float);
+    TORCH_CHECK(b_scale->device() == tensor_b.device());
+    TORCH_CHECK(b_scale->dim() == 2);
+    TORCH_CHECK(b_scale->size(0) == 1);
+    TORCH_CHECK(b_scale->size(1) == tensor_b.size(1));
+  }
+
+  typename K::GemmKernel::Arguments args;
+  args.mode = cutlass::gemm::GemmUniversalMode::kGemm;
+  args.problem_shape = cute::make_shape(
+      int(a_rows), int(tensor_b.size(1)), int(tensor_b.size(0)), 1);
+  Tensor out = tensor_a.new_empty(
+      {cute::get<0>(args.problem_shape), cute::get<1>(args.problem_shape)},
+      at::TensorOptions().dtype(K::kElementOutAt));
+
+  args.mainloop.ptr_A =
+      reinterpret_cast<K::ElementA const*>(tensor_a.data_ptr());
+  args.mainloop.ptr_B = static_cast<K::ElementB const*>(tensor_b.data_ptr());
+  args.mainloop.ptr_E =
+      reinterpret_cast<K::ElementE const*>(tensor_e.data_ptr());
+  args.epilogue.ptr_C = nullptr;
+  args.epilogue.ptr_D = static_cast<K::ElementOut*>(out.data_ptr());
+
+  float const* a_scale_ptr =
+      (float const*)(a_scale.has_value() ? a_scale->data_ptr() : nullptr);
+  float const* b_scale_ptr =
+      (float const*)(b_scale.has_value() ? b_scale->data_ptr() : nullptr);
+  float default_scale = 1.0f; // used if ptr is nullptr
+  auto& cast_op = args.epilogue.thread;
+  auto& mulB_op = cast_op.op_0;
+  mulB_op.op_0 = {b_scale_ptr, default_scale};
+  auto& mulA_op = mulB_op.op_1;
+  mulA_op.op_0 = {a_scale_ptr, default_scale};
+
+  args.mainloop.layout_a =
+      K::CollectiveMainloop::SparseConfig::fill_layoutA(args.problem_shape);
+  args.mainloop.layout_e =
+      K::CollectiveMainloop::SparseConfig::fill_layoutE(args.problem_shape);
+  args.mainloop.dB = cute::make_int_tuple_from<typename K::GemmKernel::StrideB>(
+      tensor_b.stride(1), 0);
+  args.epilogue.dC = cute::make_int_tuple_from<typename K::GemmKernel::StrideC>(
+      out.stride(0), 0);
+  args.epilogue.dD = cute::make_int_tuple_from<typename K::GemmKernel::StrideD>(
+      out.stride(0), 0);
+
+  /* Query device SM count to pass onto the kernel as an argument, where needed
+   */
+  args.hw_info.device_id = tensor_a.device().index();
+  args.hw_info.sm_count = sm_count;
+  args.scheduler.max_swizzle_size = swizzle_size;
+  using Enum_t = decltype(args.scheduler.raster_order);
+  if (swizzle_axis == "n") {
+    args.scheduler.raster_order = Enum_t::AlongN;
+  } else {
+    TORCH_CHECK(
+        swizzle_axis == "m",
+        "Invalid value for swizzle_axis ('",
+        swizzle_axis,
+        "')");
+    args.scheduler.raster_order = Enum_t::AlongM;
+  }
+
+  using Gemm = cutlass::gemm::device::GemmUniversalAdapter<K::GemmKernel>;
+  int64_t device_op_workspace_size = Gemm::get_workspace_size(args);
+  Tensor workspace = tensor_a.new_empty(
+      {device_op_workspace_size},
+      at::TensorOptions().dtype(at::ScalarType::Byte));
+
+  Gemm gemm;
+  // Check the problem size is supported or not
+  CUTLASS_STATUS_CHECK(gemm.can_implement(args));
+
+  auto status = gemm.run(
+      args, (void*)workspace.data_ptr(), at::cuda::getCurrentCUDAStream());
+  CUTLASS_STATUS_CHECK(status);
+  C10_CUDA_KERNEL_LAUNCH_CHECK();
+  return out;
+}
+} // namespace
+
+TORCH_LIBRARY_IMPL(torchao, CUDA, m) {
+  m.impl(
+      TORCH_SELECTIVE_NAME("torchao::sparse24_fp8_sm90_cutlass_gemm"),
+      TORCH_FN(_sparse24_fp8_sm90_cutlass_gemm<false>));
+}
+
+TORCH_LIBRARY_IMPL(torchao, Meta, m) {
+  m.impl(
+      TORCH_SELECTIVE_NAME("torchao::sparse24_fp8_sm90_cutlass_gemm"),
+      TORCH_FN(_sparse24_fp8_sm90_cutlass_gemm<true>));
+}
+#endif
diff --git a/torchao/ops.py b/torchao/ops.py
index faebdbd5d1..b91bb8ae18 100644
--- a/torchao/ops.py
+++ b/torchao/ops.py
@@ -42,6 +42,9 @@
 lib.define(
     "sparse24_sm90_sparsify(Tensor input, str metadata_fmt, str activation, str sp_selection_algo, *, ScalarType? dtype = None, Tensor? scale=None) -> (Tensor, Tensor)"
 )
+lib.define(
+    "sparse24_fp8_sm90_cutlass_gemm(Tensor a, Tensor a_mdata, Tensor b, *, Tensor? a_scale = None, Tensor? b_scale = None, int swizzle_size=8, str swizzle_axis='n', int sm_count=128) -> Tensor"
+)
 lib.define(
     "swizzle_mm(Tensor mat1, Tensor mat2, bool mat1_is_swizzled, bool mat2_is_swizzled) -> Tensor"
 )
@@ -840,6 +843,28 @@ def sparse24_sm90_sparsify(
     )
 
 
+def sparse24_fp8_sm90_cutlass_gemm(
+    a: Tensor,
+    meta: Tensor,
+    b: Tensor,
+    a_scale: Optional[Tensor],
+    b_scale: Optional[Tensor],
+    swizzle_size: int,
+    swizzle_axis: str,
+    sm_count: int,
+) -> Tensor:
+    return torch.ops.torchao.sparse24_fp8_sm90_cutlass_gemm(
+        a,
+        meta,
+        b,
+        a_scale=a_scale,
+        b_scale=b_scale,
+        swizzle_size=swizzle_size,
+        swizzle_axis=swizzle_axis,
+        sm_count=sm_count,
+    )
+
+
 def swizzle_mm(
     mat1: Tensor, mat2: Tensor, mat1_is_swizzled: bool, mat2_is_swizzled: bool
 ) -> Tensor:

From adc78b72cf6f8b1bb47b21d8fa525048e24f3497 Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Thu, 22 May 2025 10:26:13 -0700
Subject: [PATCH 045/165] Update Readme (#1526)

---
 README.md                      | 195 +++++++++++++++++----------------
 torchao/quantization/README.md | 126 ++++-----------------
 2 files changed, 120 insertions(+), 201 deletions(-)

diff --git a/README.md b/README.md
index 6d2e0ca031..8d524c5e7b 100644
--- a/README.md
+++ b/README.md
@@ -1,93 +1,82 @@
 # torchao: PyTorch Architecture Optimization
 
-[![](https://dcbadge.vercel.app/api/server/gpumode?style=flat)](https://discord.gg/gpumode)
+[![](https://dcbadge.vercel.app/api/server/gpumode?style=flat&label=TorchAO%20in%20GPU%20Mode)](https://discord.com/channels/1189498204333543425/1205223658021458100)
 
-[Introduction](#introduction) | [Inference](#inference) | [Training](#training)  | [Composability](#composability) | [Custom Kernels](#custom-kernels) | [Alpha Features](#alpha-features) | [Installation](#installation) | [Integrations](#integrations) | [Videos](#videos) | [License](#license) | [Citation](#citation)
+
+[Introduction](#introduction) | [Inference](#inference) | [Training](#training)  | [Installation](#installation) |[Composability](#composability) | [Prototype Features](#prototype-features)  | [Integrations](#integrations) | [Videos](#videos) | [For Developers](#for-developers) | [License](#license) | [Citation](#citation)
 
 ## Introduction
 
-torchao: PyTorch library for custom data types & optimizations. Quantize and sparsify weights, gradients, optimizers & activations for inference and training.
+`torchao` accelerates PyTorch models with minimal code changes through advanced quantization and sparsification techniques. Optimize weights, gradients, activations, and more for both inference and training.
 
 From the team that brought you the fast series
 * 9.5x inference speedups for Image segmentation models with [sam-fast](https://pytorch.org/blog/accelerating-generative-ai)
 * 10x inference speedups for Language models with [gpt-fast](https://pytorch.org/blog/accelerating-generative-ai-2)
 * 3x inference speedup for Diffusion models with [sd-fast](https://pytorch.org/blog/accelerating-generative-ai-3)
 
-torchao works for training too, with [up to 1.5x e2e speedups](https://pytorch.org/blog/training-using-float8-fsdp2/) on large scale (512 GPU / 405B parameter count) pretraining jobs with `torchao.float8`!
-
-torchao just works with `torch.compile()` and `FSDP2` over most PyTorch models on Huggingface out of the box.
-
-## Inference
+`torchao` isn't just for inference - it delivers substantial speedups at scale, from [up to 1.5x speedups](https://pytorch.org/blog/training-using-float8-fsdp2/) on 512 GPU clusters, to [1.34-1.43x speedups](https://pytorch.org/blog/accelerating-large-scale-training-and-convergence-with-pytorch-float8-rowwise-on-crusoe-2k-h200s/) on 2K H200 clusters with the latest `torchao.float8` rowwise
 
-### Post Training Quantization
+`torchao` works out-of-the-box with `torch.compile()` and `FSDP2` across most Hugging Face PyTorch models
 
-Quantizing and Sparsifying your models is a 1 liner that should work on any model with an `nn.Linear` including your favorite HuggingFace model.
 
-There are 2 methods of post-training quantization, shown in the code snippets below:
-1. Using torchao APIs directly.
-2. Loading a huggingface model with a quantization config.
-
-#### Quantizing for inference with torchao APIs
-```python
-from torchao.quantization.quant_api import (
-    quantize_,
-    Int8DynamicActivationInt8WeightConfig,
-    Int4WeightOnlyConfig,
-    Int8WeightOnlyConfig
-)
-quantize_(m, Int4WeightOnlyConfig())
-```
+## Inference
 
-You can find a more comprehensive usage instructions for quantization [here](torchao/quantization/) and for sparsity [here](/torchao/_models/sam/README.md).
+`torchao` delivers substantial performance gains with minimal code changes:
 
-#### Quantizing for inference with huggingface configs
+### Performance Highlights
 
-See [docs](https://huggingface.co/docs/transformers/main/en/quantization/torchao) for more details.
+- **INT4 Weight-Only Quantization**: 2x throughput (180 vs 107 tokens/sec) with 60% less memory (6.88 GB vs 16.43 GB) on LLaMA-3-7B
+- **Float8 Dynamic Quantization**: 53.88% speedup on Flux.1-Dev* and 27.33% speedup on CogVideoX-5b on H100 GPU with preserved quality
+- **INT4 + 2:4 Sparsity**: 2.4x throughput (226 vs 95 tokens/sec) with 80% memory reduction (5.3GB vs 16.4GB) on LLaMA-3-8B
 
-For inference, we have the option of
-1. Quantize only the weights: works best for memory bound models
-2. Quantize the weights and activations: works best for compute bound models
-2. Quantize the activations and weights and sparsify the weight
+[View detailed benchmarks](torchao/quantization/README.md) |  [Learn about sparsity](torchao/sparsity/README.md)
 
-For gpt-fast `Int4WeightOnlyConfig()` is the best option at bs=1 as it **2x the tok/s and reduces the VRAM requirements by about 65%** over a torch.compiled baseline.
+### Getting Started with Quantization
 
-If you don't have enough VRAM to quantize your entire model on GPU and you find CPU quantization to be too slow then you can use the device argument like so `quantize_(model, Int8WeightOnlyConfig(), device="cuda")` which will send and quantize each layer individually to your GPU.
+Quantize any model with `nn.Linear` layers (including HuggingFace models) in just one line:
 
-If you see slowdowns with any of these techniques or you're unsure which option to use, consider using [autoquant](./torchao/quantization/README.md#autoquantization) which will automatically profile layers and pick the best way to quantize each layer.
+#### Option 1: Direct TorchAO API
 
 ```python
-model = torchao.autoquant(torch.compile(model, mode='max-autotune'))
+from torchao.quantization.quant_api import quantize_, Int4WeightOnlyConfig
+quantize_(model, Int4WeightOnlyConfig(group_size=128, use_hqq=True))
 ```
 
-We also provide a developer facing API so you can implement your own quantization algorithms so please use the excellent [HQQ](https://github.com/pytorch/ao/tree/main/torchao/prototype/hqq) algorithm as a motivating example.
+#### Option 2: HuggingFace Integration
 
-### Evaluation
+```python
+from transformers import TorchAoConfig, AutoModelForCausalLM
+from torchao.quantization.quant_api import Int4WeightOnlyConfig
+
+# Create quantization configuration
+quantization_config = TorchAoConfig(quant_type=Int4WeightOnlyConfig(group_size=128, use_hqq=True))
+
+# Load and automatically quantize
+quantized_model = AutoModelForCausalLM.from_pretrained(
+    "microsoft/Phi-4-mini-instruct",
+    torch_dtype="auto",
+    device_map="auto",
+    quantization_config=quantization_config
+)
+```
 
-You can also use the EleutherAI [LM evaluation harness](https://github.com/EleutherAI/lm-evaluation-harness) to directly evaluate models
-quantized with post training quantization, by following these steps:
+### Deployment with vLLM
 
-1. Quantize your model with a [post training quantization strategy](#post-training-quantization).
-2. Save your model to disk or upload to huggingface hub ([instructions]( https://huggingface.co/docs/transformers/main/en/quantization/torchao?torchao=manual#serialization)).
-3. [Install](https://github.com/EleutherAI/lm-evaluation-harness?tab=readme-ov-file#install) lm-eval.
-4. Run an evaluation. Example:
+Deploy quantized models with one command:
 
-```bash
-lm_eval --model hf --model_args pretrained=${HF_USER}/${MODEL_ID} --tasks hellaswag --device cuda:0 --batch_size 8
+```shell
+vllm serve pytorch/Phi-4-mini-instruct-int4wo-hqq --tokenizer microsoft/Phi-4-mini-instruct -O3
 ```
 
-Check out the lm-eval [usage docs](https://github.com/EleutherAI/lm-evaluation-harness?tab=readme-ov-file#basic-usage) for more details.
-
-### KV Cache Quantization
-
-We've added kv cache quantization and other features in order to enable long context length (and necessarily memory efficient) inference.
+**Benefits**: 67% VRAM reduction and 12-20% speedup on A100 GPUs while maintaining quality.
 
-In practice these features alongside int4 weight only quantization allow us to **reduce peak memory by ~55%**, meaning we can Llama3.1-8B inference with a **130k context length with only 18.9 GB of peak memory.** More details can be found [here](torchao/_models/llama/README.md)
+[Step-by-step quantization guide](https://huggingface.co/pytorch/Phi-4-mini-instruct-int4wo-hqq#quantization-recipe) | [Pre-quantized models](https://huggingface.co/pytorch)
 
 ## Training
 
 ### Quantization Aware Training
 
-Post-training quantization can result in a fast and compact model, but may also lead to accuracy degradation. We recommend exploring Quantization Aware Training (QAT) to overcome this limitation. In collaboration with Torchtune, we've developed a QAT recipe that demonstrates significant accuracy improvements over traditional PTQ, recovering **96% of the accuracy degradation on hellaswag and 68% of the perplexity degradation on wikitext** for Llama3 compared to post-training quantization (PTQ). And we've provided a full recipe [here](https://pytorch.org/blog/quantization-aware-training/). For more details, please see the [QAT README](./torchao/quantization/qat/README.md).
+Post-training quantization can result in a fast and compact model, but may also lead to accuracy degradation. We recommend exploring Quantization Aware Training (QAT) to overcome this limitation. In collaboration with [Torchtune](https://github.com/pytorch/torchtune/blob/main/recipes/quantization.md#quantization-aware-training-qat), we've developed a QAT recipe that demonstrates significant accuracy improvements over traditional PTQ, recovering **96% of the accuracy degradation on hellaswag and 68% of the perplexity degradation on wikitext** for Llama3 compared to post-training quantization (PTQ). And we've provided a full recipe [here](https://pytorch.org/blog/quantization-aware-training/). For more details, please see the [QAT README](./torchao/quantization/qat/README.md).
 
 ```python
 from torchao.quantization import (
@@ -117,7 +106,7 @@ quantize_(my_model, Int8DynamicActivationInt4WeightConfig(group_size=32))
 
 ### Float8
 
-[torchao.float8](torchao/float8) implements training recipes with the scaled float8 dtypes, as laid out in https://arxiv.org/abs/2209.05433.
+[torchao.float8](torchao/float8) implements training recipes with the scaled float8 dtypes, as laid out in https://arxiv.org/abs/2209.05433
 
 With ``torch.compile`` on, current results show throughput speedups of up to **1.5x on up to 512 GPU / 405B parameter count scale** ([details](https://pytorch.org/blog/training-using-float8-fsdp2/))
 
@@ -142,89 +131,88 @@ We've added support for semi-structured 2:4 sparsity with **6% end-to-end speedu
 The code change is a 1 liner with the full example available [here](torchao/sparsity/training/)
 
 ```python
+from torchao.sparsity.training import SemiSparseLinear, swap_linear_with_semi_sparse_linear
+
 swap_linear_with_semi_sparse_linear(model, {"seq.0": SemiSparseLinear})
 ```
 
 ### Memory-efficient optimizers
 
-ADAM takes 2x as much memory as the model params so we can quantize the optimizer state to either 8 or 4 bit effectively reducing the optimizer VRAM requirements by 2x or 4x respectively over an fp16 baseline
+Optimizers like ADAM can consume substantial GPU memory - 2x as much as the model parameters themselves. TorchAO provides two approaches to reduce this overhead:
+
+1. **Quantized optimizers**: Reduce optimizer state memory by 2-4x by quantizing to lower precision
+
 
 ```python
 from torchao.optim import AdamW8bit, AdamW4bit, AdamWFp8
 optim = AdamW8bit(model.parameters()) # replace with Adam4bit and AdamFp8 for the 4 / fp8 versions
 ```
+Our quantized optimizers are implemented in just a few hundred lines of PyTorch code and compiled for efficiency. While slightly slower than specialized kernels, they offer an excellent balance of memory savings and performance. See detailed [benchmarks here](https://github.com/pytorch/ao/tree/main/torchao/optim).
 
-In practice, we are a tiny bit slower than expertly written kernels but the implementations for these optimizers were written in a **few hundred lines of PyTorch code** and compiled so please use them or copy-paste them for your quantized optimizers. Benchmarks [here](https://github.com/pytorch/ao/tree/main/torchao/optim)
+2. **CPU offloading**: Move optimizer state and gradients to CPU memory
 
-We also have support for [single GPU CPU offloading](https://github.com/pytorch/ao/tree/main/torchao/optim#optimizer-cpu-offload) where both the gradients (same size as weights) and the optimizers will be efficiently sent to the CPU. This alone can **reduce your VRAM requirements by 60%**
+For maximum memory savings, we support [single GPU CPU offloading](https://github.com/pytorch/ao/tree/main/torchao/optim#optimizer-cpu-offload) that efficiently moves both gradients and optimizer state to CPU memory. This approach can **reduce your VRAM requirements by 60%** with minimal impact on training speed:
 
 ```python
 optim = CPUOffloadOptimizer(model.parameters(), torch.optim.AdamW, fused=True)
 optim.load_state_dict(ckpt["optim"])
 ```
 
-## Composability
-
-1. `torch.compile`: A key design principle for us is composability as in any new dtype or layout we provide needs to work with our compiler. It shouldn't matter if the kernels are written in pure PyTorch, CUDA, C++, or Triton - things should just work! So we write the dtype, layout, or bit packing logic in pure PyTorch and code-generate efficient kernels.
-3. [FSDP2](https://github.com/pytorch/torchtitan/blob/main/docs/fsdp.md): Historically most quantization has been done for inference, there is now a thriving area of research combining distributed algorithms and quantization.
-
-The best example we have combining the composability of lower bit dtype with compile and fsdp is [NF4](torchao/dtypes/nf4tensor.py) which we used to implement the [QLoRA](https://www.youtube.com/watch?v=UvRl4ansfCg) algorithm. So if you're doing research at the intersection of this area we'd love to hear from you.
-
-## Custom Kernels
+## Installation
 
-We've added support for authoring and releasing [custom ops](./torchao/csrc/) that do not graph break with `torch.compile()` so if you love writing kernels but hate packaging them so they work all operating systems and cuda versions, we'd love to accept contributions for your custom ops. We have a few examples you can follow
+`torchao` makes liberal use of several new features in PyTorch, it's recommended to use it with the current nightly or latest stable version of PyTorch, see [getting started](https://pytorch.org/get-started/locally/) for more details.
 
-1. [fp6](torchao/dtypes/floatx) for 2x faster inference over fp16 with an easy to use API `quantize_(model, FPXWeightOnlyConfig(3, 2))`
-2. [2:4 Sparse Marlin GEMM](https://github.com/pytorch/ao/pull/733) 2x speedups for FP16xINT4 kernels even at batch sizes up to 256
-3. [int4 tinygemm unpacker](https://github.com/pytorch/ao/pull/415) which makes it easier to switch quantized backends for inference
+Install the stable release (recommended):
+```bash
+pip install torchao
+```
 
-If you believe there's other CUDA kernels we should be taking a closer look at please leave a comment on [this issue](https://github.com/pytorch/ao/issues/697)
+Other options:
+```bash
+# Nightly build
+pip install --pre torchao --index-url https://download.pytorch.org/whl/nightly/cu124
 
+# Different CUDA versions
+pip install torchao --index-url https://download.pytorch.org/whl/cu118  # CUDA 11.8
+pip install torchao --index-url https://download.pytorch.org/whl/cpu    # CPU only
 
-## Alpha features
+```
 
-Things we're excited about but need more time to cook in the oven
+### Development Install
+```
+USE_CPP=0 python setup.py develop  # Skip C++/CUDA extensions
+```
 
-1. [MX](torchao/prototype/mx_formats) training and inference support with tensors using the [OCP MX spec](https://www.opencompute.org/documents/ocp-microscaling-formats-mx-v1-0-spec-final-pdf) data types, which can be described as groupwise scaled float8/float6/float4/int8, with the scales being constrained to powers of two. This work is prototype as the hardware support is not available yet.
-2. [Int8 Quantized Training](https://github.com/pytorch/ao/tree/main/torchao/prototype/quantized_training): We're trying out full int8 training. This is easy to use with `quantize_(model, int8_weight_only_quantized_training())`. This work is prototype as the memory benchmarks are not compelling yet.
-3. [IntX](https://github.com/pytorch/ao/tree/main/torchao/dtypes/uintx): We've managed to support all the ints by doing some clever bitpacking in pure PyTorch and then compiling it. This work is prototype as unfortunately without some more investment in either the compiler or low-bit kernels, int4 is more compelling than any smaller dtype
-4. [Bitnet](https://github.com/pytorch/ao/blob/main/torchao/prototype/dtypes/bitnet.py): Mostly this is very cool to people on the team. This is prototype because how useful these kernels are is highly dependent on better hardware and kernel support.
+## Composability
+`torch.compile`: A key design principle for us is composability - any custom dtype or memory layout should work with our compiler. We enable kernel implementations in PyTorch, CUDA, C++, or Triton. This allows researchers and engineers to start with high-level dtype and layout logic in pure PyTorch, then progressively optimize performance by implementing lower-level kernels as needed, while maintaining compatibility with the compile infrastructure.
 
-## Installation
+[FSDP2](https://github.com/pytorch/torchtitan/blob/main/docs/fsdp.md): Historically most quantization has been done for inference, there is now a thriving area of research combining distributed algorithms and quantization.
 
-`torchao` makes liberal use of several new features in Pytorch, it's recommended to use it with the current nightly or latest stable version of PyTorch.
+The best example we have combining the composability of lower bit dtype with compile and fsdp is [NF4](torchao/dtypes/nf4tensor.py) which we used to implement the [QLoRA](https://www.youtube.com/watch?v=UvRl4ansfCg) algorithm. So if you're doing research at the intersection of this area we'd love to hear from you.
 
-Stable release from Pypi which will default to CUDA 12.4
+Our framework makes it straightforward to add tensor parallel support to your custom quantized tensor subclass. Check out our [tensor parallel tutorial](tutorials/developer_api_guide/tensor_parallel.py) to see how a quantized tensor subclass can be extended to support column and row-wise tensor sharding while maintaining compatibility with `torch.compile`.
 
-```Shell
-pip install torchao
-```
+## Prototype Features
 
-Stable Release from the PyTorch index
-```Shell
-pip install torchao --extra-index-url https://download.pytorch.org/whl/cu124 # full options are cpu/cu118/cu124/cu126
-```
+The [prototype](torchao/prototype/README.md) directory contains experimental and upcoming features including:
 
-Nightly Release
-```Shell
-pip install --pre torchao --index-url https://download.pytorch.org/whl/nightly/cu126 # full options are cpu/cu118/cu126/cu128
-```
+- [MX Training & Inference](torchao/prototype/mx_formats/README.md): MX formats with a native PyTorch POC
+- [Int8 Quantized Training](torchao/prototype/quantized_training/README.md): Low-precision training methods
+- And more experimental features in development
 
-For *most* developers you probably want to skip building custom C++/CUDA extensions for faster iteration
+These features are under active development and may change. We welcome contributions from researchers and developers!
 
-```Shell
-USE_CPP=0 pip install -e .
-```
+> ⚠️ Note: Features in the prototype directory do not have BC guarantees and are subject to change.
 
 ## OSS Integrations
 
 We're also fortunate to be integrated into some of the leading open-source libraries including
 1. Hugging Face transformers with a [builtin inference backend](https://huggingface.co/docs/transformers/main/quantization/torchao) and [low bit optimizers](https://github.com/huggingface/transformers/pull/31865)
-2. Hugging Face diffusers best practices with torch.compile and torchao in a standalone repo [diffusers-torchao](https://github.com/sayakpaul/diffusers-torchao)
+2. Hugging Face diffusers best practices with torch.compile and torchao in a standalone repo [diffusers-torchao](https://github.com/huggingface/diffusers/blob/main/docs/source/en/quantization/torchao.md)
 3. Mobius HQQ backend leveraged our int4 kernels to get [195 tok/s on a 4090](https://github.com/mobiusml/hqq#faster-inference)
-4. [TorchTune](https://github.com/pytorch/torchtune) for our QLoRA and QAT recipes
-5. [torchchat](https://github.com/pytorch/torchchat) for post training quantization
-6. SGLang for LLM serving: [usage](https://github.com/sgl-project/sglang/blob/4f2ee48ed1c66ee0e189daa4120581de324ee814/docs/backend/backend.md?plain=1#L83) and the major [PR](https://github.com/sgl-project/sglang/pull/1341).
+4. [TorchTune](https://pytorch.org/torchtune/main/tutorials/qlora_finetune.html?highlight=qlora) for our QLoRA and QAT recipes
+5. VLLM for LLM serving: [usage](https://docs.vllm.ai/en/latest/features/quantization/torchao.html)
+6. SGLang for LLM serving: [usage](https://docs.sglang.ai/backend/server_arguments.html#server-arguments) and the major [PR](https://github.com/sgl-project/sglang/pull/1341).
 
 ## Videos
 * [Keynote talk at GPU MODE IRL](https://youtu.be/FH5wiwOyPX4?si=VZK22hHz25GRzBG1&t=1009)
@@ -235,6 +223,19 @@ We're also fortunate to be integrated into some of the leading open-source libra
 * [Cohere for AI community talk](https://www.youtube.com/watch?v=lVgrE36ZUw0)
 
 
+## For Developers
+
+### Custom Kernels
+
+We've added support for authoring and releasing [custom ops](./torchao/csrc/) that do not graph break with `torch.compile()`. We have a few examples you can follow
+
+1. [fp6](torchao/dtypes/floatx/README.md) for 2x faster inference over fp16 with an easy to use API `quantize_(model, fpx_weight_only(3, 2))`
+2. [2:4 Sparse Marlin GEMM](https://github.com/pytorch/ao/pull/733) 2x speedups for FP16xINT4 kernels even at batch sizes up to 256
+3. [int4 tinygemm unpacker](https://github.com/pytorch/ao/pull/415) which makes it easier to switch quantized backends for inference
+
+If you believe there's other CUDA kernels we should be taking a closer look at please leave a comment on [this issue](https://github.com/pytorch/ao/issues/697) or feel free to contribute directly to the repo.
+
+
 ## License
 
 `torchao` is released under the [BSD 3](https://github.com/pytorch-labs/ao/blob/main/LICENSE) license.
diff --git a/torchao/quantization/README.md b/torchao/quantization/README.md
index d2b6e0c016..80737eb4bb 100644
--- a/torchao/quantization/README.md
+++ b/torchao/quantization/README.md
@@ -2,8 +2,8 @@
 Typically quantization algorithms will have different schemes for how the activation and weights are quantized so A16W8 for instance means the activations are quantized to 16 bits wheras the weights are quantized to 8 bits. Trying out different quantization schemes in `torchao` is generally a 1 line change. Note: exact APIs are not stable, we may change them in the future.
 
 ## Benchmarks
-Benchmarks and evaluation are run on a machine with a single NVIDIA-A100-80GB GPU using the scripts for [generation](../_models/llama/generate.py) and [eval](../_models/llama/eval.py). Evaluation was done using the lm_eval library for tasks/data. The models used were meta-llama/Llama-2-7b-chat-hf and meta-llama/Meta-Llama-3-8B.
-### CUDA backend
+Benchmarks and evaluation are gathered using the scripts for [generation](../_models/llama/generate.py) and [eval](../_models/llama/eval.py). Evaluation was done using the lm_eval library for tasks/data. The models used were meta-llama/Llama-2-7b-chat-hf and meta-llama/Meta-Llama-3-8B.
+### CUDA backend |  NVIDIA-A100-80GB GPU
 | Model       | Technique               | wikitext-perplexity | Tokens/Second | Memory Bandwidth (GB/s) | Peak Memory (GB) | Model Size (GB) |
 | ----------- | ----------------------- | ------------------- | ------------- | ----------------------- | ---------------- | --------------- |
 | Llama-2-7B  | Base (bfloat16)         | 12.212              |  107.38       | 1418.93                 | 13.88            | 13.21           |
@@ -29,7 +29,7 @@ Benchmarks and evaluation are run on a machine with a single NVIDIA-A100-80GB GP
 
 
-### CUDA backend
+### CUDA backend | NVIDIA-H100 GPU
 | Model         | Technique               | wikitext-perplexity | Tokens/Second | Memory Bandwidth (GB/s) | Peak Memory (GB) | Model Size (GB) |
 | -----------   | ----------------------- | ------------------- | ------------- | ----------------------- | ---------------- | --------------- |
 | Llama-3.1-8B  | Base (bfloat16)         |  7.54               |  126.90       | 1904.75                 | 16.75            | 15.01           |
@@ -38,7 +38,8 @@ Benchmarks and evaluation are run on a machine with a single NVIDIA-A100-80GB GP
 |               | float8wo                |  7.60               |  178.46       | 1339.93                 | 12.09            |  7.51           |
 |               | float8dq (PerTensor)    |  7.62               |  116.40       |  873.58                 | 11.14            |  7.51           |
 |               | float8dq (Per Row)      |  7.61               |  154.63       | 1161.47                 | 11.14            |  7.51           |
-### XPU backend
+
+### XPU backend | Intel-Max1100
 | Model         | Technique               | wikitext-perplexity | Tokens/Second | Memory Bandwidth (GB/s) | Peak Memory (GB) | Model Size (GB) |
 | -----------   | ----------------------- | ------------------- | ------------- | ----------------------- | ---------------- | --------------- |
 | Llama-3-8.1B  | Base (bfloat16)         |  7.441              |   40.36       | 605.77                 | 16.35            | 15.01           |
@@ -46,7 +47,7 @@ Benchmarks and evaluation are run on a machine with a single NVIDIA-A100-80GB GP
 |             | int8wo                  |  7.447              |  59.49       | 447.27                 | 18.60            |  7.52
 
 
-Benchmarks and evaluation for model meta-llama/Meta-Llama-3.1-8B are run on a machine with a single NVIDIA-H100 GPU or Intel-Max1100 using the scripts for [generation](../_models/llama/generate.py) and [eval](../_models/llama/eval.py). Evaluation was done using the lm_eval library for tasks/data.
+Benchmarks and evaluation for model meta-llama/Meta-Llama-3.1-8B are gathered using [generation](../_models/llama/generate.py) and [eval](../_models/llama/eval.py). Evaluation was done using the lm_eval library for tasks/data.
 
 note: Int8 dynamic quantization works best on compute bound models like [SAM](https://github.com/pytorch-labs/segment-anything-fast) whereas Llama with batchsize=1 tends to be memory bound, thus the rather low performance.
 
@@ -54,6 +55,22 @@ For int4 we make heavy use of [tinygemm](https://github.com/pytorch/ao/blob/cb3b
 
 And a quick crash course on inference quantization to help parse the above table. Int4 quantization is an ambiguous term because there's the dtype in which a layer is represented and then the dtype in which the computation is done. For example, if you're using Weight-Only (wo) int4 quantization that means that the layer will be upcasted to a larger dtype like fp16 so an int4 matrix multiplication is defined as `F.linear(input, weight.to(input.dtype))`. Dynamic quantization (DQ) primarily targets activations, enabling on-the-fly quantization from higher precision formats like bf16 to lower precision formats such as int8. This process, when supported by hardware, allows for direct computation, such as performing `F.linear(input, weight)`. Naive quantization algorithms are also notoriously sensitive to outliers so we also typically set a group size that applies a scale factor per group of 64 elements in the case of `int4wo-64`.
 
+## Evaluation
+
+You can also use the EleutherAI [LM evaluation harness](https://github.com/EleutherAI/lm-evaluation-harness) to directly evaluate models
+quantized with post training quantization, by following these steps:
+
+1. Quantize your model with a [post training quantization strategy](#post-training-quantization).
+2. Save your model to disk or upload to huggingface hub ([instructions]( https://huggingface.co/docs/transformers/main/en/quantization/torchao?torchao=manual#serialization)).
+3. [Install](https://github.com/EleutherAI/lm-evaluation-harness?tab=readme-ov-file#install) lm-eval.
+4. Run an evaluation. Example:
+
+```bash
+lm_eval --model hf --model_args pretrained=${HF_USER}/${MODEL_ID} --tasks hellaswag --device cuda:0 --batch_size 8
+```
+
+Check out the lm-eval [usage docs](https://github.com/EleutherAI/lm-evaluation-harness?tab=readme-ov-file#basic-usage) for more details.
+
 ## Autoquantization
 
 Autoquantization is a tool to automatically determine the best way to apply quantization to your model by comparing the performance of each quantization technique to each layer for the input types and shapes you care about.
@@ -393,105 +410,6 @@ You try can out these apis with the `quantize_` api as above alongside the const
 
 The `quantize_` and `autoquant` apis now automatically use our recommended inductor configuration setings. You can mimic the same configuration settings for your own experiments by using the `torchao.quantization.utils.recommended_inductor_config_setter` to replicate our recommended configuration settings. Alternatively if you wish to disable these recommended settings, you can use the key word argument `set_inductor_config` and set it to false in the `quantize_` or `autoquant` apis to prevent assignment of those configuration settings. You can also overwrite these configuration settings after they are assigned if you so desire, as long as they are overwritten before passing any inputs to the torch.compiled model. This means that previous flows which referenced a variety of inductor configurations that needed to be set are now outdated, though continuing to manually set those same inductor configurations is unlikely to cause any issues.
 
-## (To be moved to prototype) A16W4 WeightOnly Quantization with GPTQ
-
-```python
-from torchao._models._eval import InputRecorder, TransformerEvalWrapper
-from torchao.quantization.GPTQ import Int4WeightOnlyGPTQQuantizer
-precision = torch.bfloat16
-device = "cuda"
-checkpoint_file_name = "../gpt-fast/checkpoints/meta-llama/Llama-2-7b-chat-hf/model.pth"
-checkpoint_path = Path(checkpoint_file_name)
-model = Transformer.from_name(checkpoint_path.parent.name)
-checkpoint = torch.load(str(checkpoint_path), mmap=True, weights_only=True)
-model.load_state_dict(checkpoint, assign=True)
-model = model.to(dtype=precision, device="cpu")
-model.eval()
-tokenizer_path = checkpoint_path.parent / "tokenizer.model"
-assert tokenizer_path.is_file(), tokenizer_path
-tokenizer = SentencePieceProcessor(  # pyre-ignore[28]
-    model_file=str(tokenizer_path)
-)
-blocksize = 128
-percdamp = 0.01
-groupsize = 128
-calibration_tasks = ["wikitext"]
-calibration_limit = 1
-calibration_seq_length = 100
-input_prep_func = prepare_inputs_for_model
-pad_calibration_inputs = False
-
-inputs = InputRecorder(
-    tokenizer,
-    calibration_seq_length,
-    input_prep_func,
-    pad_calibration_inputs,
-    model.config.vocab_size,
-    device="cpu",
-).record_inputs(
-    calibration_tasks,
-    calibration_limit,
-).get_inputs()
-
-quantizer = Int4WeightOnlyGPTQQuantizer(
-    blocksize,
-    percdamp,
-    groupsize,
-)
-model.setup_caches(max_batch_size=1, max_seq_length=calibration_seq_length)
-model = quantizer.quantize(model, inputs).cuda()
-
-```
-
-## (To be deprecated) A8W8 Dynamic Quantization
-
-```Python
-from torchao.quantization.quant_api import Int8DynActInt4WeightQuantizer
-quantizer = Int8DynActInt4WeightQuantizer(groupsize=128)
-model = quantizer.quantize(model)
-```
-
-This is used in [ExecuTorch](https://github.com/pytorch/executorch) to quantize llama model right now.
-
-## (To be moved to prototype) A8W8 Dynamic Quantization with Smoothquant
-
-We've also implemented a version of [smoothquant](https://arxiv.org/abs/2211.10438) with the same GEMM format as above. Due to requiring calibration, the API is more complicated.
-
-Example
-
-```Python
-import torch
-from torchao.quantization.smoothquant import swap_linear_with_smooth_fq_linear, smooth_fq_linear_to_inference
-
-# Fuse the int8*int8 -> int32 matmul and subsequent mul op avoiding materialization of the int32 intermediary tensor
-torch._inductor.config.force_fuse_int_mm_with_mul = True
-
-# plug in your model
-model = get_model()
-
-# convert linear modules to smoothquant
-# linear module in calibration mode
-swap_linear_with_smooth_fq_linear(model)
-
-# Create a data loader for calibration
-calibration_data = get_calibration_data()
-calibration_dataset = MyDataset(calibration_data)
-calibration_loader = DataLoader(calibration_dataset, batch_size=32, shuffle=True)
-
-# Calibrate the model
-model.train()
-for batch in calibration_loader:
-    inputs = batch
-    model(inputs)
-
-# set it to inference mode
-smooth_fq_linear_to_inference(model)
-
-# compile the model to improve performance
-model = torch.compile(model, mode='max-autotune')
-model(input)
-```
-
 ## Notes
 
 1. APIs have been hardware tested on A100 and T4(colab)

From 3884e29cc78de7688f44b317c457728fab1bf9f1 Mon Sep 17 00:00:00 2001
From: cccclai <chenlai907@gmail.com>
Date: Thu, 22 May 2025 15:10:19 -0700
Subject: [PATCH 046/165] Patch the _is_conv_node function

Differential Revision: D74898941

Pull Request resolved: https://github.com/pytorch/ao/pull/2223
---
 test/quantization/pt2e/test_quantize_pt2e.py | 20 ++++++++++++++++++++
 torchao/quantization/pt2e/utils.py           |  3 +++
 2 files changed, 23 insertions(+)

diff --git a/test/quantization/pt2e/test_quantize_pt2e.py b/test/quantization/pt2e/test_quantize_pt2e.py
index 75701c55ca..a96f397925 100644
--- a/test/quantization/pt2e/test_quantize_pt2e.py
+++ b/test/quantization/pt2e/test_quantize_pt2e.py
@@ -2478,6 +2478,26 @@ def forward(self, x):
             node_list,
         )
 
+        example_inputs = (torch.randn(1, 3, 5, 5),)
+        node_occurrence = {
+            # two for input of the first conv, one for output for the first conv
+            torch.ops.quantized_decomposed.quantize_per_tensor.default: 2,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default: 3,
+        }
+        node_list = [
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+            torch.ops.aten.conv2d.padding,
+            torch.ops.aten.relu.default,
+            torch.ops.quantized_decomposed.quantize_per_tensor.default,
+        ]
+        self._test_quantizer(
+            TestHelperModules.ConvWithBNRelu(dim=2, relu=True, bn=True, padding="same"),
+            example_inputs,
+            BackendAQuantizer(),
+            node_occurrence,
+            node_list,
+        )
     def test_conv_transpose3d_bn_relu(self):
         class BackendAQuantizer(Quantizer):
             def annotate(self, model: torch.fx.GraphModule) -> torch.fx.GraphModule:
diff --git a/torchao/quantization/pt2e/utils.py b/torchao/quantization/pt2e/utils.py
index ad5c0ae179..dc5f802fb8 100644
--- a/torchao/quantization/pt2e/utils.py
+++ b/torchao/quantization/pt2e/utils.py
@@ -625,8 +625,11 @@ def _is_conv_node(n: Node):
     """
     return n.op == "call_function" and n.target in [
         torch.ops.aten.conv1d.default,
+        torch.ops.aten.conv1d.padding,
         torch.ops.aten.conv2d.default,
+        torch.ops.aten.conv2d.padding,
         torch.ops.aten.conv3d.default,
+        torch.ops.aten.conv3d.padding,
     ]
 
 
From 446f07d5a20f997d8ddcb418b9dfd63fb9b4643e Mon Sep 17 00:00:00 2001
From: HDCharles <39544797+HDCharles@users.noreply.github.com>
Date: Thu, 22 May 2025 23:11:45 -0400
Subject: [PATCH 047/165] Revert "Patch the _is_conv_node function" (#2247)

This reverts commit 3884e29cc78de7688f44b317c457728fab1bf9f1.
---
 test/quantization/pt2e/test_quantize_pt2e.py | 20 --------------------
 torchao/quantization/pt2e/utils.py           |  3 ---
 2 files changed, 23 deletions(-)

diff --git a/test/quantization/pt2e/test_quantize_pt2e.py b/test/quantization/pt2e/test_quantize_pt2e.py
index a96f397925..75701c55ca 100644
--- a/test/quantization/pt2e/test_quantize_pt2e.py
+++ b/test/quantization/pt2e/test_quantize_pt2e.py
@@ -2478,26 +2478,6 @@ def forward(self, x):
             node_list,
         )
 
-        example_inputs = (torch.randn(1, 3, 5, 5),)
-        node_occurrence = {
-            # two for input of the first conv, one for output for the first conv
-            torch.ops.quantized_decomposed.quantize_per_tensor.default: 2,
-            torch.ops.quantized_decomposed.dequantize_per_tensor.default: 3,
-        }
-        node_list = [
-            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
-            torch.ops.quantized_decomposed.dequantize_per_tensor.default,
-            torch.ops.aten.conv2d.padding,
-            torch.ops.aten.relu.default,
-            torch.ops.quantized_decomposed.quantize_per_tensor.default,
-        ]
-        self._test_quantizer(
-            TestHelperModules.ConvWithBNRelu(dim=2, relu=True, bn=True, padding="same"),
-            example_inputs,
-            BackendAQuantizer(),
-            node_occurrence,
-            node_list,
-        )
     def test_conv_transpose3d_bn_relu(self):
         class BackendAQuantizer(Quantizer):
             def annotate(self, model: torch.fx.GraphModule) -> torch.fx.GraphModule:
diff --git a/torchao/quantization/pt2e/utils.py b/torchao/quantization/pt2e/utils.py
index dc5f802fb8..ad5c0ae179 100644
--- a/torchao/quantization/pt2e/utils.py
+++ b/torchao/quantization/pt2e/utils.py
@@ -625,11 +625,8 @@ def _is_conv_node(n: Node):
     """
     return n.op == "call_function" and n.target in [
         torch.ops.aten.conv1d.default,
-        torch.ops.aten.conv1d.padding,
         torch.ops.aten.conv2d.default,
-        torch.ops.aten.conv2d.padding,
         torch.ops.aten.conv3d.default,
-        torch.ops.aten.conv3d.padding,
     ]
 
 
From a776b1ff7e01bb2c8c6f7d3c0cdf2e49435faa51 Mon Sep 17 00:00:00 2001
From: andrewor14 <andrewor14@gmail.com>
Date: Fri, 23 May 2025 17:32:31 -0400
Subject: [PATCH 048/165] Relax int4wo device mismatch error (#2254)

**Summary:** We have an guard preventing users from using a
cuda quantized on cpu and vice versa. However, this also
prevents users who load their checkpoints on cpu first and
then move them to cuda later, which is what torchtune does:

```
quantize_(model.cuda(), Int4WeightOnlyConfig())
# save checkpoint in cuda
torch.save(model.state_dict(), "my_checkpoint.pt")
# load checkpoint on cpu
# This is what torchtune does: https://github.com/pytorch/torchtune/blob/v0.6.1/torchtune/training/checkpointing/_utils.py#L253
sd = torch.load("my_checkpoint.pt", weights_only=False, map_location="cpu")
# move checkpoint to cuda
for k, v in sd.items():
    sd[k] = v.to("cuda")
# load state_dict in cuda
model.load_state_dict(sd, assign=True)
```

This use case is safe in that the model was quantized in
cuda and ultimately used on cuda. This commit relaxes the
error to allow the above use case. More details here:
https://github.com/pytorch/ao/issues/1117.

**Test Plan:**
python test/quantization/test_quant_api.py -k test_int4wo_cuda_serialization
---
 test/quantization/test_quant_api.py           | 19 +++++++++++++++++++
 .../dtypes/uintx/tensor_core_tiled_layout.py  |  3 ++-
 2 files changed, 21 insertions(+), 1 deletion(-)

diff --git a/test/quantization/test_quant_api.py b/test/quantization/test_quant_api.py
index fa8029f862..5f2a663705 100644
--- a/test/quantization/test_quant_api.py
+++ b/test/quantization/test_quant_api.py
@@ -1017,6 +1017,25 @@ def test_ao_per_module_config_skip(self):
         assert isinstance(model.linear1.weight._layout, TensorCoreTiledLayout)
         assert not isinstance(model.linear2.weight, AffineQuantizedTensor)
 
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    def test_int4wo_cuda_serialization(self):
+        config = Int4WeightOnlyConfig(group_size=32)
+        model = ToyLinearModel().cuda().to(dtype=torch.bfloat16)
+        # quantize in cuda
+        quantize_(model, config)
+        example_inputs = model.example_inputs(device="cuda", dtype=torch.bfloat16)
+        model(*example_inputs)
+        with tempfile.NamedTemporaryFile() as ckpt:
+            # save checkpoint in cuda
+            torch.save(model.state_dict(), ckpt)
+            # load checkpoint on cpu then move checkpoint to cuda
+            # This is what torchtune does: https://github.com/pytorch/torchtune/blob/v0.6.1/torchtune/training/checkpointing/_utils.py#L253
+            sd = torch.load(ckpt.name, weights_only=False, map_location="cpu")
+            for k, v in sd.items():
+                sd[k] = v.to("cuda")
+            # load state_dict in cuda
+            model.load_state_dict(sd, assign=True)
+
 
 class TestMultiTensorFlow(TestCase):
     @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_4, "Test only enabled for 2.4+")
diff --git a/torchao/dtypes/uintx/tensor_core_tiled_layout.py b/torchao/dtypes/uintx/tensor_core_tiled_layout.py
index 48910038cf..2baf45ded0 100644
--- a/torchao/dtypes/uintx/tensor_core_tiled_layout.py
+++ b/torchao/dtypes/uintx/tensor_core_tiled_layout.py
@@ -3,6 +3,7 @@
 #
 # This source code is licensed under the BSD 3-Clause license found in the
 # LICENSE file in the root directory of this source tree.
+import logging
 from dataclasses import dataclass
 from typing import Optional, Tuple
 
@@ -318,7 +319,7 @@ def to(self, *args, **kwargs):
         # between these two devices, in the future we should not use the same layout for
         # cpu and cuda device: https://github.com/pytorch/ao/issues/1117
         if not is_device(torch.device(self.device).type, device):
-            raise ValueError(
+            logging.warning(
                 f"TensorCoreTiledAQTTensorImpl does not support conversion from {self.device} to {device}"
             )
         return self.__class__(

From efac465f1a6da4b60c8fc3788a5c53b790fc3a4e Mon Sep 17 00:00:00 2001
From: Scott Roy <161522778+metascroy@users.noreply.github.com>
Date: Fri, 23 May 2025 14:48:27 -0700
Subject: [PATCH 049/165] Add backward compatible types to pt2e prepare

Differential Revision: D75248288

Pull Request resolved: https://github.com/pytorch/ao/pull/2244
---
 torchao/quantization/pt2e/quantize_pt2e.py | 6 ++++--
 1 file changed, 4 insertions(+), 2 deletions(-)

diff --git a/torchao/quantization/pt2e/quantize_pt2e.py b/torchao/quantization/pt2e/quantize_pt2e.py
index 94a675d809..5eb385b7de 100644
--- a/torchao/quantization/pt2e/quantize_pt2e.py
+++ b/torchao/quantization/pt2e/quantize_pt2e.py
@@ -11,6 +11,8 @@
 if TORCH_VERSION_AT_LEAST_2_7:
     from .constant_fold import constant_fold
 
+from typing import Union
+
 from torch.fx import GraphModule, Node
 from torch.fx.passes.infra.pass_manager import PassManager
 
@@ -39,7 +41,7 @@
 
 def prepare_pt2e(
     model: GraphModule,
-    quantizer: Quantizer,
+    quantizer: Union[Quantizer, torch.ao.quantization.quantizer.quantizer.Quantizer],
 ) -> GraphModule:
     """Prepare a model for post training quantization
 
@@ -127,7 +129,7 @@ def calibrate(model, data_loader):
 
 def prepare_qat_pt2e(
     model: GraphModule,
-    quantizer: Quantizer,
+    quantizer: Union[Quantizer, torch.ao.quantization.quantizer.quantizer.Quantizer],
 ) -> GraphModule:
     """Prepare a model for quantization aware training
 

From 60d63a637f5091d7c6917b3c28bca98540136600 Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Fri, 23 May 2025 18:41:50 -0700
Subject: [PATCH 050/165] Rename AOPerModuleConfig to ModuleFqnToConfig (#2243)

* Rename AOPerModuleConfig to ModuleFqnToConfig

Summary:
to be more explicit on what this config means

Test Plan:
CI

Reviewers:

Subscribers:

Tasks:

Tags:

* renaming rest
---
 test/quantization/test_config_serialization.py |  8 ++++----
 test/quantization/test_quant_api.py            | 18 +++++++++---------
 torchao/quantization/__init__.py               |  4 ++--
 torchao/quantization/quant_api.py              | 11 ++++++-----
 4 files changed, 21 insertions(+), 20 deletions(-)

diff --git a/test/quantization/test_config_serialization.py b/test/quantization/test_config_serialization.py
index 62edc6aad8..3b0a10e915 100644
--- a/test/quantization/test_config_serialization.py
+++ b/test/quantization/test_config_serialization.py
@@ -20,7 +20,6 @@
     config_to_dict,
 )
 from torchao.quantization.quant_api import (
-    AOPerModuleConfig,
     Float8DynamicActivationFloat8WeightConfig,
     Float8WeightOnlyConfig,
     FPXWeightOnlyConfig,
@@ -30,6 +29,7 @@
     Int8DynamicActivationInt4WeightConfig,
     Int8DynamicActivationInt8WeightConfig,
     Int8WeightOnlyConfig,
+    ModuleFqnToConfig,
     PerRow,
     UIntXWeightOnlyConfig,
 )
@@ -68,9 +68,9 @@
     # Sparsity configs
     SemiSparseWeightConfig(),
     BlockSparseWeightConfig(blocksize=128),
-    AOPerModuleConfig({}),
-    AOPerModuleConfig({"_default": Int4WeightOnlyConfig(), "linear1": None}),
-    AOPerModuleConfig(
+    ModuleFqnToConfig({}),
+    ModuleFqnToConfig({"_default": Int4WeightOnlyConfig(), "linear1": None}),
+    ModuleFqnToConfig(
         {
             "linear1": Int4WeightOnlyConfig(),
             "linear2": Int8DynamicActivationInt4WeightConfig(),
diff --git a/test/quantization/test_quant_api.py b/test/quantization/test_quant_api.py
index 5f2a663705..b4ec9f4785 100644
--- a/test/quantization/test_quant_api.py
+++ b/test/quantization/test_quant_api.py
@@ -38,11 +38,11 @@
     PerGroup,
 )
 from torchao.quantization.quant_api import (
-    AOPerModuleConfig,
     Int4WeightOnlyConfig,
     Int8DynamicActivationInt4WeightConfig,
     Int8WeightOnlyConfig,
     IntxWeightOnlyConfig,
+    ModuleFqnToConfig,
     Quantizer,
     TwoStepQuantizer,
     _replace_with_custom_fn_if_matches_filter,
@@ -946,10 +946,10 @@ def test_workflow_e2e_numerics(self, config):
         assert sqnr >= 16.5, f"SQNR {sqnr} is too low"
 
     @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
-    def test_ao_per_module_config_default(self):
+    def test_module_fqn_to_config_default(self):
         config1 = Int4WeightOnlyConfig(group_size=32)
         config2 = Int8WeightOnlyConfig()
-        config = AOPerModuleConfig({"_default": config1, "linear2": config2})
+        config = ModuleFqnToConfig({"_default": config1, "linear2": config2})
         model = ToyLinearModel().cuda().to(dtype=torch.bfloat16)
         example_inputs = model.example_inputs(device="cuda", dtype=torch.bfloat16)
         quantize_(model, config)
@@ -960,10 +960,10 @@ def test_ao_per_module_config_default(self):
         assert isinstance(model.linear2.weight._layout, PlainLayout)
 
     @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
-    def test_ao_per_module_config_module_name(self):
+    def test_module_fqn_to_config_module_name(self):
         config1 = Int4WeightOnlyConfig(group_size=32)
         config2 = Int8WeightOnlyConfig()
-        config = AOPerModuleConfig({"linear1": config1, "linear2": config2})
+        config = ModuleFqnToConfig({"linear1": config1, "linear2": config2})
         model = ToyLinearModel().cuda().to(dtype=torch.bfloat16)
         example_inputs = model.example_inputs(device="cuda", dtype=torch.bfloat16)
         quantize_(model, config)
@@ -974,7 +974,7 @@ def test_ao_per_module_config_module_name(self):
         assert isinstance(model.linear2.weight._layout, PlainLayout)
 
     @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_6, "Need torch 2.6+")
-    def test_ao_per_module_config_embedding_linear(self):
+    def test_module_fqn_to_config_embedding_linear(self):
         weight_dtype = torch.int8
         granularity = PerGroup(8)
         mapping_type = MappingType.SYMMETRIC
@@ -987,7 +987,7 @@ def test_ao_per_module_config_embedding_linear(self):
         # example model linear is Linear(16, 8)
         linear_config = Int8DynamicActivationInt4WeightConfig(group_size=16)
 
-        config = AOPerModuleConfig({"emb": embedding_config, "linear": linear_config})
+        config = ModuleFqnToConfig({"emb": embedding_config, "linear": linear_config})
         indices = torch.randint(0, 10, (32,))
         indices = indices.unsqueeze(0)
         example_inputs = (indices,)
@@ -1006,9 +1006,9 @@ def test_ao_per_module_config_embedding_linear(self):
         assert isinstance(model.linear.weight, LinearActivationQuantizedTensor)
 
     @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
-    def test_ao_per_module_config_skip(self):
+    def test_module_fqn_to_config_skip(self):
         config1 = Int4WeightOnlyConfig(group_size=32)
-        config = AOPerModuleConfig({"_default": config1, "linear2": None})
+        config = ModuleFqnToConfig({"_default": config1, "linear2": None})
         model = ToyLinearModel().cuda().to(dtype=torch.bfloat16)
         example_inputs = model.example_inputs(device="cuda", dtype=torch.bfloat16)
         quantize_(model, config)
diff --git a/torchao/quantization/__init__.py b/torchao/quantization/__init__.py
index 109de5c0c5..b4d46d8263 100644
--- a/torchao/quantization/__init__.py
+++ b/torchao/quantization/__init__.py
@@ -39,7 +39,6 @@
     AffineQuantizedObserverBase,
 )
 from .quant_api import (
-    AOPerModuleConfig,
     CutlassInt4PackedLayout,
     Float8DynamicActivationFloat8SemiSparseWeightConfig,
     Float8DynamicActivationFloat8WeightConfig,
@@ -55,6 +54,7 @@
     Int8DynamicActivationIntxWeightConfig,
     Int8WeightOnlyConfig,
     IntxWeightOnlyConfig,
+    ModuleFqnToConfig,
     PlainLayout,
     TensorCoreTiledLayout,
     UIntXWeightOnlyConfig,
@@ -147,7 +147,7 @@
     "IntxWeightOnlyConfig",
     "FPXWeightOnlyConfig",
     "GemliteUIntXWeightOnlyConfig",
-    "AOPerModuleConfig",
+    "ModuleFqnToConfig",
     # smooth quant - subject to change
     "get_scale",
     "SmoothFakeDynQuantMixin",
diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index 4229577b95..7020a1322a 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -136,6 +136,7 @@
     "Int8DynActInt4WeightQuantizer",
     "Int8DynActInt4WeightGPTQQuantizer",
     "Float8DynamicActivationFloat8SemiSparseWeightConfig",
+    "ModuleFqnToConfig",
 ]
 
 LAYOUT_TO_ZERO_POINT_DOMAIN = {
@@ -596,10 +597,10 @@ def quantize_(
     """
     filter_fn = _is_linear if filter_fn is None else filter_fn
 
-    if isinstance(config, AOPerModuleConfig):
+    if isinstance(config, ModuleFqnToConfig):
         _replace_with_custom_fn_if_matches_filter_with_name(
             model,
-            _ao_per_module_config_handler,
+            _module_fqn_to_config_handler,
             filter_fn,
             device=device,
             extra_args=(config,),
@@ -2002,7 +2003,7 @@ def _fpx_weight_only_transform(
 
 
 @dataclass
-class AOPerModuleConfig(AOBaseConfig):
+class ModuleFqnToConfig(AOBaseConfig):
     """Per module configurations for torchao quantize_ API
 
     Args:
@@ -2018,8 +2019,8 @@ class AOPerModuleConfig(AOBaseConfig):
     )
 
 
-def _ao_per_module_config_handler(
-    module: torch.nn.Module, module_fqn: str, config: AOPerModuleConfig
+def _module_fqn_to_config_handler(
+    module: torch.nn.Module, module_fqn: str, config: ModuleFqnToConfig
 ):
     c = None
     if module_fqn in config.module_fqn_to_config:

From e0e8b399e110ea80344a12b13118d94d3a3a27cb Mon Sep 17 00:00:00 2001
From: Andrey Talman <atalman@fb.com>
Date: Tue, 27 May 2025 13:22:22 -0400
Subject: [PATCH 051/165] Revert "Try fixing CI by pinning pytest (#2238)"
 (#2263)

This reverts commit f0f976cede3ed51edf1b690d82bfc0d72d81b79b.
---
 .github/workflows/regression_test.yml | 4 ++--
 dev-requirements.txt                  | 2 +-
 2 files changed, 3 insertions(+), 3 deletions(-)

diff --git a/.github/workflows/regression_test.yml b/.github/workflows/regression_test.yml
index f4f054b307..f1188fd7d5 100644
--- a/.github/workflows/regression_test.yml
+++ b/.github/workflows/regression_test.yml
@@ -64,7 +64,7 @@ jobs:
             torch-spec: 'torch==2.5.1 --index-url https://download.pytorch.org/whl/cu121'
             gpu-arch-type: "cuda"
             gpu-arch-version: "12.6"
-            dev-requirements-overrides: "s/^pytest.*$/pytest==7.4.0/"
+            dev-requirements-overrides: "s/^pytest$/pytest==7.4.0/"
           - name: CUDA 2.6
             runs-on: linux.g5.12xlarge.nvidia.gpu
             torch-spec: 'torch==2.6.0'
@@ -83,7 +83,7 @@ jobs:
             torch-spec: 'torch==2.5.1 --index-url https://download.pytorch.org/whl/cpu'
             gpu-arch-type: "cpu"
             gpu-arch-version: ""
-            dev-requirements-overrides: "s/^pytest.*$/pytest==7.4.0/"
+            dev-requirements-overrides: "s/^pytest$/pytest==7.4.0/"
           - name: CPU 2.6
             runs-on: linux.4xlarge
             torch-spec: 'torch==2.6.0 --index-url https://download.pytorch.org/whl/cpu'
diff --git a/dev-requirements.txt b/dev-requirements.txt
index f9e4381e4e..600d5001cf 100644
--- a/dev-requirements.txt
+++ b/dev-requirements.txt
@@ -1,5 +1,5 @@
 # Test utilities
-pytest==8.3.4
+pytest
 unittest-xml-reporting
 parameterized
 packaging

From 1017c7e3bfe7300a14ed81fa36038684b168b633 Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Tue, 27 May 2025 10:34:05 -0700
Subject: [PATCH 052/165] Fix Per Row scaling for inference (#2253)

---
 test/dtypes/test_affine_quantized_float.py | 308 ++++++++++++++++++++-
 torchao/dtypes/affine_quantized_tensor.py  |   7 +-
 torchao/dtypes/floatx/float8_layout.py     | 237 ++++++++++------
 torchao/float8/inference.py                |  74 ++++-
 torchao/quantization/quant_api.py          |  69 ++---
 torchao/quantization/quant_primitives.py   | 112 ++++++--
 6 files changed, 628 insertions(+), 179 deletions(-)

diff --git a/test/dtypes/test_affine_quantized_float.py b/test/dtypes/test_affine_quantized_float.py
index 8c36f5ac7a..408e6e6ce0 100644
--- a/test/dtypes/test_affine_quantized_float.py
+++ b/test/dtypes/test_affine_quantized_float.py
@@ -25,6 +25,7 @@
 from torch._inductor.test_case import TestCase as InductorTestCase
 from torch.testing._internal import common_utils
 
+from torchao.dtypes.floatx.float8_layout import Float8AQTTensorImpl
 from torchao.float8.float8_utils import compute_error
 from torchao.quantization import (
     Float8DynamicActivationFloat8WeightConfig,
@@ -42,6 +43,9 @@
 from torchao.quantization.quant_primitives import (
     MappingType,
     choose_qparams_affine,
+    choose_qparams_affine_float8,
+    dequantize_affine_float8,
+    quantize_affine_float8,
 )
 from torchao.utils import (
     is_sm_at_least_89,
@@ -297,21 +301,299 @@ def test_fp8_weight_dimension_warning(self):
     @unittest.skipIf(
         not is_sm_at_least_89(), "Requires GPU with compute capability >= 8.9"
     )
-    def test_mm_float8dq(self):
+    @common_utils.parametrize(
+        "in_features,out_features", [(512, 1024), (256, 768), (1024, 512)]
+    )
+    @common_utils.parametrize(
+        "leading_shape", [(1,), (8,), (16,), (2, 8,), (2, 2, 16,)]
+    )  # fmt: skip
+    @common_utils.parametrize("bias", [True, False])
+    def test_mm_float8dq_per_row(
+        self, in_features, out_features, leading_shape, bias: bool
+    ):
+        device = "cuda"
+        dtype = torch.bfloat16
+        input_shape = leading_shape + (in_features,)
+
+        ref_linear = (
+            torch.nn.Linear(in_features, out_features, bias=bias).to(device).to(dtype)
+        )
+        test_linear = copy.deepcopy(ref_linear)
+        quantize_(
+            test_linear, Float8DynamicActivationFloat8WeightConfig(granularity=PerRow())
+        )
+
+        quant_weight = test_linear.weight
+
+        self.assertTrue(hasattr(quant_weight, "original_weight_tensor"))
+        weight_impl = quant_weight.original_weight_tensor.tensor_impl
+
+        self.assertTrue(hasattr(weight_impl, "float8_data"))
+        self.assertTrue(hasattr(weight_impl, "scale"))
+        self.assertFalse(weight_impl.transposed)
+
+        # Verify scale shape for row-wise quantization
+        expected_scale_shape = (out_features, 1)
+        actual_scale_shape = weight_impl.scale.shape
+        self.assertEqual(actual_scale_shape, expected_scale_shape)
+
+        self.assertEqual(weight_impl.float8_data.shape, (out_features, in_features))
+
+        input_tensor = torch.randn(*input_shape, device=device, dtype=dtype)
+
+        with torch.no_grad():
+            ref_output = ref_linear(input_tensor)
+            quant_output = torch.nn.functional.linear(input_tensor, quant_weight)
+
+        expected_output_shape = input_tensor.shape[:-1] + (out_features,)
+        self.assertEqual(quant_output.shape, expected_output_shape)
+
+        error = compute_error(ref_output, quant_output)
+        assert error > 20, f"Quantization error is too high got a SQNR of {error}"
+
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    @unittest.skipIf(
+        not is_sm_at_least_89(), "Requires GPU with compute capability >= 8.9"
+    )
+    @common_utils.parametrize("float8_dtype", [torch.float8_e4m3fn, torch.float8_e5m2])
+    @common_utils.parametrize("output_dtype", [torch.float32, torch.bfloat16])
+    @common_utils.parametrize("block_size", [None, (1, 32), (2, 16), (4, 8)])
+    def test_dequantize_affine_float8(self, float8_dtype, output_dtype, block_size):
+        """Test dequantize_affine_float8 with various configurations"""
+
+        device = "cuda"
+        input_tensor = torch.randn(8, 64, device=device, dtype=torch.float32)
+
+        # Choose quantization parameters
+        scale = choose_qparams_affine_float8(
+            input_tensor, float8_dtype=float8_dtype, block_size=block_size
+        )
+
+        # Quantize
+        quantized = quantize_affine_float8(input_tensor, scale, float8_dtype)
+
+        # Dequantize
+        dequantized = dequantize_affine_float8(quantized, scale, output_dtype)
+
+        # Verify output properties
+        self.assertEqual(dequantized.dtype, output_dtype)
+        self.assertEqual(dequantized.shape, input_tensor.shape)
+        self.assertEqual(dequantized.device, input_tensor.device)
+
+        # Verify quantization/dequantization roundtrip is reasonable
+        error = torch.abs(input_tensor.to(output_dtype) - dequantized).mean()
+        self.assertLess(error, 0.1, "Quantization error too high")
+
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    @unittest.skipIf(
+        not is_sm_at_least_89(), "Requires GPU with compute capability >= 8.9"
+    )
+    def test_dequantize_affine_float8_scale_broadcasting(self):
+        """Test that scale broadcasting works correctly for block-wise quantization"""
+        device = "cuda"
+        # Create input tensor with known block structure
+        input_tensor = torch.randn(4, 32, device=device, dtype=torch.float32)
+        block_size = (2, 16)  # 2x2 blocks in first dim, 2x16 blocks in second dim
+
+        # Choose quantization parameters
+        scale = choose_qparams_affine_float8(
+            input_tensor, float8_dtype=torch.float8_e4m3fn, block_size=block_size
+        )
+
+        # Verify scale shape
+        expected_scale_shape = (
+            input_tensor.shape[0] // block_size[0],
+            input_tensor.shape[1] // block_size[1],
+        )
+        self.assertEqual(scale.shape, expected_scale_shape)
+
+        # Quantize
+        quantized = quantize_affine_float8(input_tensor, scale, torch.float8_e4m3fn)
+
+        # Dequantize
+        dequantized = dequantize_affine_float8(quantized, scale, torch.float32)
+
+        # Verify shapes match
+        self.assertEqual(dequantized.shape, input_tensor.shape)
+
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    @unittest.skipIf(
+        not is_sm_at_least_89(), "Requires GPU with compute capability >= 8.9"
+    )
+    @common_utils.parametrize(
+        "granularity", [PerTensor(), PerRow()] if is_sm_at_least_90() else [PerTensor()]
+    )
+    def test_float8_tensor_slicing_basic(self, granularity):
+        """Test basic slicing operations on Float8 tensors"""
         device = "cuda"
         dtype = torch.bfloat16
-        weight = torch.randn(512, 1024).to(device).to(dtype)
-        weight = weight.t()
-
-        l = torch.nn.Linear(512, 1024).to(device).to(dtype)
-        l.weight = torch.nn.Parameter(weight)
-        quantize_(l, Float8DynamicActivationFloat8WeightConfig(granularity=PerRow()))
-        # weight shape: 1024 x 512
-        weight = l.weight
-
-        input = torch.randn(1, 512, device=device, dtype=dtype)
-        # make sure it runs
-        torch.nn.functional.linear(input, weight)
+
+        # Create and quantize a model
+        model = torch.nn.Linear(64, 32, bias=False).to(device).to(dtype)
+        quantize_(
+            model, Float8DynamicActivationFloat8WeightConfig(granularity=granularity)
+        )
+
+        weight_impl = model.weight.original_weight_tensor.tensor_impl
+
+        # Test dimension 0 slicing (rows)
+        sliced_0 = weight_impl[10:20]
+        self.assertEqual(sliced_0.shape, (10, 64))
+
+        # Test dimension 1 slicing (columns)
+        sliced_1 = weight_impl[:, 20:40]
+        self.assertEqual(sliced_1.shape, (32, 20))
+
+        # Test combined slicing
+        sliced_both = weight_impl[5:15, 10:30]
+        self.assertEqual(sliced_both.shape, (10, 20))
+
+        # Verify the sliced tensors are still Float8 tensors
+        self.assertTrue(isinstance(sliced_0, Float8AQTTensorImpl))
+        self.assertTrue(isinstance(sliced_1, Float8AQTTensorImpl))
+        self.assertTrue(isinstance(sliced_both, Float8AQTTensorImpl))
+
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    @unittest.skipIf(
+        not is_sm_at_least_89(), "Requires GPU with compute capability >= 8.9"
+    )
+    def test_float8_tensor_slicing_per_tensor(self):
+        """Test slicing with per-tensor quantization (scale should not change)"""
+        device = "cuda"
+        dtype = torch.bfloat16
+
+        # Create and quantize with per-tensor granularity
+        model = torch.nn.Linear(64, 32, bias=False).to(device).to(dtype)
+        quantize_(
+            model, Float8DynamicActivationFloat8WeightConfig(granularity=PerTensor())
+        )
+
+        original_weight = model.weight
+        original_impl = original_weight.original_weight_tensor.tensor_impl
+        original_scale = original_impl.scale
+
+        # Test slicing
+        sliced_weight = original_weight[10:20, 20:40]
+        sliced_impl = sliced_weight.original_weight_tensor.tensor_impl
+
+        # For per-tensor quantization, scale should be identical
+        self.assertTrue(torch.equal(original_scale, sliced_impl.scale))
+        self.assertEqual(sliced_impl.scale.numel(), 1)
+
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    @unittest.skipIf(
+        not is_sm_at_least_89(), "Requires GPU with compute capability >= 8.9"
+    )
+    @unittest.skipIf(
+        not is_sm_at_least_90(),
+        "Per-row quantization requires compute capability >= 9.0",
+    )
+    def test_float8_tensor_slicing_per_row(self):
+        """Test slicing with per-row quantization (scale should be sliced appropriately)"""
+        device = "cuda"
+        dtype = torch.bfloat16
+
+        # Create and quantize with per-row granularity
+        model = torch.nn.Linear(64, 32, bias=False).to(device).to(dtype)
+        quantize_(
+            model, Float8DynamicActivationFloat8WeightConfig(granularity=PerRow())
+        )
+
+        original_weight = model.weight  # Shape: (32, 64)
+        original_impl = original_weight.original_weight_tensor.tensor_impl
+        original_scale = original_impl.scale  # Shape: (32, 1)
+
+        # Test row slicing (dimension 0)
+        sliced_rows = original_weight[10:20]  # Shape: (10, 64)
+        sliced_impl = sliced_rows.original_weight_tensor.tensor_impl
+
+        # Scale should be sliced to match the rows
+        expected_scale_shape = (10, 1)
+        self.assertEqual(sliced_impl.scale.shape, expected_scale_shape)
+
+        # Verify the scale values are correct (should be subset of original)
+        self.assertTrue(torch.equal(sliced_impl.scale, original_scale[10:20]))
+
+        # Test column slicing (dimension 1) - scale should not change for per-row
+        sliced_cols = original_weight[:, 20:40]  # Shape: (32, 20)
+        sliced_cols_impl = sliced_cols.original_weight_tensor.tensor_impl
+
+        # Scale shape should remain the same since we're not changing rows
+        self.assertEqual(sliced_cols_impl.scale.shape, (32, 1))
+        self.assertTrue(torch.equal(sliced_cols_impl.scale, original_scale))
+
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    @unittest.skipIf(
+        not is_sm_at_least_89(), "Requires GPU with compute capability >= 8.9"
+    )
+    def test_float8_tensor_slicing_edge_cases(self):
+        """Test edge cases in slicing"""
+        device = "cuda"
+        dtype = torch.bfloat16
+
+        # Create and quantize a model
+        model = torch.nn.Linear(64, 32, bias=False).to(device).to(dtype)
+        quantize_(
+            model, Float8DynamicActivationFloat8WeightConfig(granularity=PerTensor())
+        )
+
+        original_weight = model.weight
+
+        # Test empty slice
+        empty_slice = original_weight[0:0]
+        self.assertEqual(empty_slice.shape, (0, 64))
+
+        # Test single element slice
+        single_row = original_weight[0:1]
+        self.assertEqual(single_row.shape, (1, 64))
+
+        # Test out of bounds (should be handled by PyTorch)
+        large_slice = original_weight[:100]  # More than available rows
+        self.assertEqual(large_slice.shape, (32, 64))  # Should clamp to available
+
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    @unittest.skipIf(
+        not is_sm_at_least_89(), "Requires GPU with compute capability >= 8.9"
+    )
+    @common_utils.parametrize(
+        "granularity", [PerTensor(), PerRow()] if is_sm_at_least_90() else [PerTensor()]
+    )
+    def test_float8_tensor_slicing_functional_correctness(self, granularity):
+        """Test that sliced tensors produce correct results in computations"""
+        device = "cuda"
+        dtype = torch.bfloat16
+
+        # Create reference and quantized models with dimensions that are multiples of 16
+        ref_model = (
+            torch.nn.Linear(64, 48, bias=False).to(device).to(dtype)
+        )  # 48 is divisible by 16
+        quant_model = copy.deepcopy(ref_model)
+        quantize_(
+            quant_model,
+            Float8DynamicActivationFloat8WeightConfig(granularity=granularity),
+        )
+
+        # Create input with batch size that works well with slicing
+        input_tensor = torch.randn(8, 64, device=device, dtype=dtype)
+
+        ref_weight_slice = ref_model.weight[0:16, 0:32]
+        quant_weight_slice = quant_model.weight[0:16, 0:32]
+
+        input_slice = input_tensor[:, 0:32]  # (8, 32) to match sliced weight
+
+        # Compute with sliced weights
+        with torch.no_grad():
+            ref_output = torch.nn.functional.linear(input_slice, ref_weight_slice)
+            quant_output = torch.nn.functional.linear(input_slice, quant_weight_slice)
+
+        # Verify shapes
+        expected_shape = (8, 16)  # batch_size x out_features_sliced
+        self.assertEqual(ref_output.shape, expected_shape)
+        self.assertEqual(quant_output.shape, expected_shape)
+
+        # Verify reasonable quantization error
+        error = compute_error(ref_output, quant_output)
+        self.assertGreater(error, 15, f"Quantization SQNR too low: {error}")
 
 
 common_utils.instantiate_parametrized_tests(TestAffineQuantizedFloat8Compile)
diff --git a/torchao/dtypes/affine_quantized_tensor.py b/torchao/dtypes/affine_quantized_tensor.py
index 65649593a3..6cb2e8997e 100644
--- a/torchao/dtypes/affine_quantized_tensor.py
+++ b/torchao/dtypes/affine_quantized_tensor.py
@@ -462,10 +462,10 @@ def from_hp_to_floatx(
         if target_dtype in FP8_TYPES:
             original_shape = input_float.shape
             input_float = _layout.pre_process(input_float)
-
-            scale = choose_qparams_affine_float8(input_float, float8_dtype=target_dtype)
+            scale = choose_qparams_affine_float8(
+                input_float, float8_dtype=target_dtype, block_size=block_size
+            )
             data = quantize_affine_float8(input_float, scale, target_dtype)
-
             data, scale, zero_point = _layout.post_process(
                 data, scale, None, block_size
             )
@@ -503,7 +503,6 @@ def from_hp_to_floatx_static(
                 input_float,
                 scale,
                 target_dtype,
-                scale_dtype,
             )
 
             data, scale, zero_point = _layout.post_process(
diff --git a/torchao/dtypes/floatx/float8_layout.py b/torchao/dtypes/floatx/float8_layout.py
index 5914f00102..799832a5ea 100644
--- a/torchao/dtypes/floatx/float8_layout.py
+++ b/torchao/dtypes/floatx/float8_layout.py
@@ -4,7 +4,7 @@
 # This source code is licensed under the BSD 3-Clause license found in the
 # LICENSE file in the root directory of this source tree.
 from dataclasses import dataclass
-from typing import Optional, Tuple, Union
+from typing import Any, Dict, List, Optional, Tuple, Union
 
 import torch
 from torch.utils._python_dispatch import (
@@ -26,6 +26,18 @@
 from torchao.utils import _is_float8_type, fill_defaults
 
 aten = torch.ops.aten
+FLOAT8_IMPL_OPS_TABLE: Dict[Any, Any] = {}
+
+
+def implements(aten_ops: List[Any]):
+    """Register aten ops to the float8 op table"""
+
+    def decorator(func):
+        for op in aten_ops:
+            FLOAT8_IMPL_OPS_TABLE[op] = func
+        return func
+
+    return decorator
 
 
 def _same_metadata(self: "Float8AQTTensorImpl", src: "Float8AQTTensorImpl") -> bool:
@@ -33,7 +45,6 @@ def _same_metadata(self: "Float8AQTTensorImpl", src: "Float8AQTTensorImpl") -> b
     transposed_match = (self.transposed == src.transposed) or (
         self.transposed is False and src.transposed is None
     )
-
     return (
         isinstance(self, Float8AQTTensorImpl)
         and isinstance(src, Float8AQTTensorImpl)
@@ -160,90 +171,23 @@ def __tensor_unflatten__(
     def __torch_dispatch__(cls, func, types, args, kwargs):
         kwargs = {} if kwargs is None else kwargs
 
-        if func is aten.detach.default:
-            return return_and_correct_aliasing(
-                func, args, kwargs, args[0]._apply_fn_to_data(torch.detach)
-            )
-        elif func is aten.clone.default:
-            return return_and_correct_aliasing(
-                func, args, kwargs, args[0]._apply_fn_to_data(torch.clone)
-            )
-        elif func is aten.t.default:
-            """we don't need to repack the weight and just rely on external
-            shape being changed and record the status of transpose/no-transpose
-            """
-            args[0].transposed = not args[0].transposed
-            return return_and_correct_aliasing(func, args, kwargs, args[0])
-        elif func is aten.copy_.default:
-            self = args[0]
-            src = args[1]
-            if _same_metadata(self, src):
-                self_tensors = self.__tensor_flatten__()[0]
-                for tensor_name in self_tensors:
-                    getattr(self, tensor_name).copy_(getattr(src, tensor_name))
-                return
-            raise ValueError(
-                f"Not supported args for copy_ due to metadata mistach: {args[0], args[1]}"
-            )
-        elif func in [aten.select.int, aten.index.Tensor]:
-            return return_and_correct_aliasing(
-                func,
-                args,
-                kwargs,
-                args[0]._apply_fn_to_data(lambda x: func(x, *args[1:], **kwargs)),
-            )
-        elif func is aten.slice.Tensor:
-            self, dim, start, end, step = fill_defaults(args, 5, [0, None, None, 1])
-            if dim == 0:
-                # TODO: scale replecation should be dependent on block size
-                if self.scale.ndim == 1:
-                    return return_and_correct_aliasing(
-                        func,
-                        args,
-                        kwargs,
-                        args[0]._apply_fn_to_data(
-                            lambda x: aten.slice.Tensor(x, dim, start, end, step)
-                        ),
-                    )
-                elif self.scale.ndim == 0:
-                    return return_and_correct_aliasing(
-                        func,
-                        args,
-                        kwargs,
-                        Float8AQTTensorImpl(
-                            aten.slice.Tensor(self.float8_data, dim, start, end, step),
-                            self.scale,
-                            None,
-                            self._layout,
-                        ),
-                    )
-                else:
-                    raise NotImplementedError(
-                        f"Float8AQTTensorImpl dispatch: attempting to run {func}, with scale ndim={dim}, that is not supported"
-                    )
-            elif dim == 1:
-                return return_and_correct_aliasing(
-                    func,
-                    args,
-                    kwargs,
-                    Float8AQTTensorImpl(
-                        aten.slice.Tensor(
-                            self.float8_data, dim, start, end, step
-                        ).contiguous(),
-                        self.scale,
-                        None,
-                        self._layout,
-                    ),
-                )
-            else:
-                raise NotImplementedError(
-                    f"Float8AQTTensorImpl dispatch: attempting to run {func}, with dim={dim}, that is not supported"
+        def allowed_subclasses(type):
+            return (
+                issubclass(cls, type)
+                or issubclass(torch._subclasses.fake_tensor.FakeTensor, type)
+                or issubclass(
+                    torch._subclasses.functional_tensor.FunctionalTensor, type
                 )
-        else:
-            raise NotImplementedError(
-                f"Float8AQTTensorImpl dispatch: attempting to run {func}, this is not supported"
             )
 
+        if not all(allowed_subclasses(t) for t in types):
+            return NotImplemented
+
+        if func in FLOAT8_IMPL_OPS_TABLE:
+            return FLOAT8_IMPL_OPS_TABLE[func](func, types, args, kwargs)
+
+        raise NotImplementedError(f"attempting to run {func}, this is not supported")
+
     __torch_function__ = torch._C._disabled_torch_function_impl
 
     def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, Optional[torch.Tensor]]:
@@ -281,6 +225,130 @@ def __repr__(self):
         )
 
 
+##########################
+# Regsiter FP8 Ops
+##########################
+
+
+@implements([aten.detach.default, aten.alias.default, aten.clone.default])
+def _(func, types, args, kwargs):
+    return return_and_correct_aliasing(
+        func, args, kwargs, args[0]._apply_fn_to_data(func)
+    )
+
+
+@implements([aten.t.default])
+def _(func, types, args, kwargs):
+    """we don't need to repack the weight and just rely on external
+    shape being changed and record the status of transpose/no-transpose
+    """
+    args[0].transposed = not args[0].transposed
+    return return_and_correct_aliasing(func, args, kwargs, args[0])
+
+
+@implements([aten.copy_.default])
+def _(func, types, args, kwargs):
+    self = args[0]
+    src = args[1]
+    if _same_metadata(self, src):
+        self_tensors = self.__tensor_flatten__()[0]
+        for tensor_name in self_tensors:
+            getattr(self, tensor_name).copy_(getattr(src, tensor_name))
+        return
+    raise ValueError(
+        f"Not supported args for copy_ due to metadata mismatch: {args[0], args[1]}"
+    )
+
+
+@implements([aten.select.int, aten.index.Tensor])
+def _(func, types, args, kwargs):
+    return return_and_correct_aliasing(
+        func,
+        args,
+        kwargs,
+        args[0]._apply_fn_to_data(lambda x: func(x, *args[1:], **kwargs)),
+    )
+
+
+@implements([aten.slice.Tensor])
+def _(func, types, args, kwargs):
+    self, dim, start, end, step = fill_defaults(args, 5, [0, None, None, 1])
+
+    # Always slice the float8_data
+    sliced_data = aten.slice.Tensor(self.float8_data, dim, start, end, step)
+
+    if self.scale.numel() == 1:
+        # Per-tensor quantization - scale doesn't change
+        sliced_scale = self.scale
+    else:
+        # Block-wise quantization - need to slice the scale appropriately
+        sliced_scale = _slice_scale_for_dimension(
+            self.scale, self.float8_data.shape, dim, start, end, step
+        )
+
+    return return_and_correct_aliasing(
+        func,
+        args,
+        kwargs,
+        Float8AQTTensorImpl(
+            sliced_data,
+            sliced_scale,
+            self.transposed,
+            self._layout,
+        ),
+    )
+
+
+def _slice_scale_for_dimension(
+    scale: torch.Tensor,
+    data_shape: List[int],
+    dim: int,
+    start: int,
+    end: int,
+    step: int,
+) -> torch.Tensor:
+    """
+    Slice the scale tensor appropriately based on the data tensor slicing.
+
+    This function calculates how the scale should be sliced when the data tensor
+    is sliced along a given dimension, taking into account the block structure.
+    """
+    # Unsupported case for now, this would be 1 scale per data element
+    if scale.shape == data_shape:
+        return aten.slice.Tensor(scale, dim, start, end, step)
+
+    # Reconstruct block sizes based on data shape and scale shape
+    block_sizes = tuple(data_shape[i] // scale.shape[i] for i in range(len(data_shape)))
+
+    if dim >= len(block_sizes):
+        # Slicing beyond the dimensions we care about
+        return scale
+
+    block_size_for_dim = block_sizes[dim]
+
+    if block_size_for_dim == 1:
+        # Scale is per-element along this dimension
+        # Slice away as normal
+        return aten.slice.Tensor(scale, dim, start, end, step)
+    else:
+        # There is blocking in this dimension
+        # Calculate which scale elements correspond to the sliced data
+        scale_start = start // block_size_for_dim if start is not None else None
+        scale_end = (
+            (end + block_size_for_dim - 1) // block_size_for_dim
+            if end is not None
+            else None
+        )
+
+        # Error on Step > 1
+        if step > 1:
+            raise NotImplementedError(
+                "Slicing with step > 1 is not implemented for scale tensors."
+            )
+
+        return aten.slice.Tensor(scale, dim, scale_start, scale_end, 1)
+
+
 ##########################
 # Float8 Dispatch Kernels
 ##########################
@@ -333,13 +401,12 @@ def _linear_fp8_act_fp8_weight_impl(
     input_scale = input_tensor.tensor_impl.scale
     # Handle case where input tensor is more than 2D
     inpt_data = inpt_data.reshape(-1, inpt_data.shape[-1])
-
     # Handle rowwise case
     if _is_rowwise_scaled(weight_tensor):
         assert _is_rowwise_scaled(input_tensor), (
             "Input tensor must be rowwise block size"
         )
-        w_scale = w_scale.unsqueeze(-1).T
+        w_scale = w_scale.T
         input_scale = preprocess_scale(input_scale, input_tensor.shape)
 
     # Preprocess data
diff --git a/torchao/float8/inference.py b/torchao/float8/inference.py
index 7f73a604d7..00c905f3d8 100644
--- a/torchao/float8/inference.py
+++ b/torchao/float8/inference.py
@@ -7,11 +7,20 @@
 Defines an nn module designed to be used during inference
 """
 
-from typing import NamedTuple, Optional, Tuple
+from typing import NamedTuple, Optional, Tuple, Union
 
 import torch
 
 from torchao.float8.float8_utils import is_row_major, pad_tensor_for_matmul
+from torchao.quantization.granularity import (
+    PerRow,
+    PerTensor,
+)
+from torchao.utils import (
+    is_MI300,
+    is_sm_at_least_89,
+    is_sm_at_least_90,
+)
 
 Tensor = torch.Tensor
 
@@ -106,3 +115,66 @@ def _is_rowwise_scaled(x) -> bool:
         x: AffineQuantizedTensor tensor
     """
     return x.block_size == (1,) * (x.dim() - 1) + (x.shape[-1],)
+
+
+FP8Granularity = Union[PerTensor, PerRow]
+
+
+def _normalize_granularity(
+    granularity: Optional[
+        Union[
+            FP8Granularity,
+            Tuple[FP8Granularity, FP8Granularity],
+            list[FP8Granularity],
+        ]
+    ],
+) -> Tuple[FP8Granularity, FP8Granularity]:
+    processed_granularity = None
+    if granularity is None:
+        processed_granularity = (PerTensor(), PerTensor())
+    elif isinstance(granularity, (PerTensor, PerRow)):
+        processed_granularity = (granularity, granularity)
+    elif isinstance(granularity, (tuple, list)) and len(granularity) == 2:
+        if not (
+            isinstance(granularity[0], (PerTensor, PerRow))
+            and isinstance(granularity[1], (PerTensor, PerRow))
+        ):
+            raise ValueError(
+                f"Invalid granularity types: {granularity}, only PerTensor or PerRow are supported."
+            )
+        if not isinstance(granularity[0], type(granularity[1])):
+            raise ValueError(
+                f"Different granularities for activation and weight are not supported: {granularity}, only PerTensor or PerRow are supported."
+            )
+        processed_granularity = tuple(granularity)
+    else:
+        raise ValueError(
+            f"Invalid granularity specification: {granularity}, only PerTensor or PerRow are supported."
+        )
+    return processed_granularity
+
+
+def _check_hardware_support(
+    granularities: Tuple[FP8Granularity, FP8Granularity],
+) -> None:
+    """
+    Validate that the hardware supports the requested granularities.
+
+    Args:
+        granularities: Tuple of (activation_granularity, weight_granularity)
+
+    Raises:
+        AssertionError: If hardware doesn't support the requested granularity
+        ValueError: If invalid granularity type is provided
+    """
+    for _granularity in granularities:
+        if isinstance(_granularity, PerTensor):
+            assert is_sm_at_least_89() or is_MI300(), (
+                "PerTensor quantization only works for CUDA>=8.9 and MI300+"
+            )
+        elif isinstance(_granularity, PerRow):
+            assert is_sm_at_least_90() or is_MI300(), (
+                "PerRow quantization only works for CUDA>=9.0 and MI300+"
+            )
+        else:
+            raise ValueError(f"Invalid granularity type: {_granularity}")
diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index 7020a1322a..f2aca97782 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -54,7 +54,12 @@
 from torchao.dtypes.utils import Layout
 from torchao.float8.config import e4m3_dtype, e5m2_dtype
 from torchao.float8.float8_linear import Float8Linear
-from torchao.float8.inference import Float8MMConfig
+from torchao.float8.inference import (
+    Float8MMConfig,
+    FP8Granularity,
+    _check_hardware_support,
+    _normalize_granularity,
+)
 from torchao.quantization.linear_activation_weight_observed_tensor import (
     LinearActivationWeightObservedTensor,
 )
@@ -1432,56 +1437,9 @@ def _float8_weight_only_transform(
     return module
 
 
-_fp8_granularities = Union[PerTensor, PerRow]
-
-
-# Validate and process granularity input
-def _normalize_granularity(
-    granularity: Optional[
-        Union[_fp8_granularities, Tuple[_fp8_granularities, _fp8_granularities]]
-    ],
-) -> Tuple[_fp8_granularities, _fp8_granularities]:
-    processed_granularity = None
-    if granularity is None:
-        processed_granularity = (PerTensor(), PerTensor())
-    elif isinstance(granularity, (PerTensor, PerRow)):
-        processed_granularity = (granularity, granularity)
-    elif isinstance(granularity, tuple) and len(granularity) == 2:
-        if not (
-            isinstance(granularity[0], (PerTensor, PerRow))
-            and isinstance(granularity[1], (PerTensor, PerRow))
-        ):
-            raise ValueError(
-                f"Invalid granularity types: {granularity}, only PerTensor or PerRow are supported."
-            )
-        if not isinstance(granularity[0], type(granularity[1])):
-            raise ValueError(
-                f"Different granularities for activation and weight are not supported: {granularity}, only PerTensor or PerRow are supported."
-            )
-        processed_granularity = granularity
-    else:
-        raise ValueError(
-            f"Invalid granularity specification: {granularity}, only PerTensor or PerRow are supported."
-        )
-    # Validate granularity with supported Hardware
-    for _granularity in processed_granularity:
-        if isinstance(_granularity, PerTensor):
-            assert is_sm_at_least_89() or is_MI300(), (
-                "PerTensor quantization only works for CUDA>=8.9 and MI300+"
-            )
-        elif isinstance(_granularity, PerRow):
-            assert is_sm_at_least_90() or is_MI300(), (
-                "PerRow quantization only works for CUDA>=9.0 and MI300+"
-            )
-        else:
-            raise ValueError(f"Invalid granularity type: {_granularity}")
-
-    return processed_granularity
-
-
 def _input_activation_quant_func_fp8(
     x: torch.Tensor,
-    activation_granularity: _fp8_granularities,
+    activation_granularity: FP8Granularity,
     activation_dtype: torch.dtype,
     scale: Optional[torch.Tensor] = None,
     zero_point: Optional[torch.Tensor] = None,
@@ -1568,7 +1526,7 @@ class Float8DynamicActivationFloat8WeightConfig(AOBaseConfig):
     activation_dtype: torch.dtype = e4m3_dtype
     weight_dtype: torch.dtype = e4m3_dtype
     granularity: Optional[
-        Union[_fp8_granularities, Tuple[_fp8_granularities, _fp8_granularities]]
+        Union[FP8Granularity, Tuple[FP8Granularity, FP8Granularity]]
     ] = None
     mm_config: Optional[Float8MMConfig] = None
     set_inductor_config: bool = True
@@ -1577,6 +1535,11 @@ def __post_init__(self):
         if self.mm_config is None:
             self.mm_config = Float8MMConfig(use_fast_accum=True)
 
+        activation_granularity, weight_granularity = _normalize_granularity(
+            self.granularity
+        )
+        self.granularity = (activation_granularity, weight_granularity)
+
 
 # for bc
 float8_dynamic_activation_float8_weight = Float8DynamicActivationFloat8WeightConfig
@@ -1588,7 +1551,9 @@ def _float8_dynamic_activation_float8_weight_quantize_tensor(weight, config):
     granularity = config.granularity
     mm_config = config.mm_config
 
-    activation_granularity, weight_granularity = _normalize_granularity(granularity)
+    # Ensure works on device
+    _check_hardware_support(granularity)
+    activation_granularity, weight_granularity = granularity
 
     if not _fp8_mm_compat(weight):
         # TODO(future PR): this should really throw an exception instead of silently
@@ -1705,7 +1670,7 @@ class Float8StaticActivationFloat8WeightConfig(AOBaseConfig):
     activation_dtype: torch.dtype = e4m3_dtype
     weight_dtype: torch.dtype = e4m3_dtype
     granularity: Optional[
-        Union[_fp8_granularities, Tuple[_fp8_granularities, _fp8_granularities]]
+        Union[FP8Granularity, Tuple[FP8Granularity, FP8Granularity]]
     ] = None
     mm_config: Optional[Float8MMConfig] = None
     set_inductor_config: bool = True
diff --git a/torchao/quantization/quant_primitives.py b/torchao/quantization/quant_primitives.py
index 1885755608..cee8df21a2 100644
--- a/torchao/quantization/quant_primitives.py
+++ b/torchao/quantization/quant_primitives.py
@@ -1970,6 +1970,7 @@ def choose_qparams_affine_float8(
     tensor: torch.Tensor,
     float8_dtype: torch.dtype = torch.float8_e4m3fn,
     scale_dtype: torch.dtype = torch.float32,
+    block_size: Optional[Tuple[int, ...]] = None,
 ) -> torch.Tensor:
     """
     Calculates float8 scaling factor for the given high precision tensor, using tensorwise granularity.
@@ -1977,14 +1978,84 @@ def choose_qparams_affine_float8(
     Args:
         tensor (torch.Tensor): Input tensor to be quantized.
         float8_dtype (torch.dtype): Data type of the quantized tensor (e.g., torch.float8_e4m3fn, torch.float8_e5m2).
+        scale_dtype (torch.dtype): Data type of the scaling factor (e.g., torch.float32).
+        block_size (Optional[Tuple[int, ...]]): Block size for block-wise quantization. If None, tensorwise quantization is used.
     """
+    quant_max = torch.finfo(float8_dtype).max
     # only tensorwise scaling is supported for now:
-    quant_min, quant_max = torch.finfo(float8_dtype).min, torch.finfo(float8_dtype).max
-    min_val_neg = torch.min(tensor)
-    max_val_pos = torch.max(tensor)
-    max_val_pos = torch.max(-min_val_neg, max_val_pos)
-    scale = max_val_pos / (float(quant_max - quant_min) / 2)
-    return scale.to(dtype=scale_dtype)
+    if block_size is None:
+        max_abs = tensor.abs().max()
+        scale = max_abs / quant_max
+    else:
+        shape_for_reduction, reduction_dims = _get_reduction_params(
+            block_size, tensor.shape
+        )
+        tensor_reshaped = tensor.view(shape_for_reduction)
+        max_abs = tensor_reshaped.abs().amax(dim=reduction_dims, keepdim=True)
+
+        scale = max_abs / quant_max
+        # Reshape scale back to match the expected output shape
+        # The scale tensor should have the same shape as the input divided by block_size
+        output_shape = [
+            input_size // block_size[i] for i, input_size in enumerate(tensor.shape)
+        ]
+        scale = scale.reshape(output_shape)
+
+    if scale_dtype is not torch.float32:
+        # Shielding for Version > 2.8
+        assert scale_dtype is torch.float8_e8m0fnu, "Only float8_e8m0fnuz is supported"
+        scale = torch.exp2(torch.round(torch.log2(scale)))
+    return scale.to(dtype=torch.float32)
+
+
+def _expand_scale_to_tensor_shape(
+    scale: torch.Tensor, target_shape: torch.Size
+) -> torch.Tensor:
+    """
+    Expand a scale tensor to match the target tensor shape for block-wise quantization.
+
+    Args:
+        scale (torch.Tensor): Scale tensor with shape corresponding to block structure
+        target_shape (torch.Size): Target tensor shape to expand to
+
+    Returns:
+        torch.Tensor: Scale tensor expanded to match target_shape
+    """
+    if scale.shape == target_shape:
+        # Scale already matches target shape
+        return scale
+
+    if scale.numel() == 1:
+        # Scalar scale - can broadcast naturally
+        return scale
+
+    # Calculate block sizes from shape difference
+    if len(scale.shape) != len(target_shape):
+        raise ValueError(
+            f"Scale tensor has {len(scale.shape)} dimensions but target has {len(target_shape)}"
+        )
+
+    block_sizes = tuple(
+        target_shape[i] // scale.shape[i] for i in range(len(target_shape))
+    )
+
+    # Verify that target_shape is evenly divisible by scale.shape
+    for i, (target_dim, scale_dim, block_size) in enumerate(
+        zip(target_shape, scale.shape, block_sizes)
+    ):
+        if target_dim != scale_dim * block_size:
+            raise ValueError(
+                f"Dimension {i}: target size {target_dim} is not evenly divisible "
+                f"by scale size {scale_dim} (block size would be {target_dim / scale_dim})"
+            )
+
+    # Expand scale using repeat_interleave
+    expanded_scale = scale
+    for i, block_size in enumerate(block_sizes):
+        if block_size > 1:
+            expanded_scale = expanded_scale.repeat_interleave(block_size, dim=i)
+
+    return expanded_scale
 
 
 def quantize_affine_float8(
@@ -1994,16 +2065,13 @@ def quantize_affine_float8(
 ) -> torch.Tensor:
     """
     Quantizes the high precision floating point tensor to a float8 tensor, using the given scaling factor.
-
-    Args:
-        tensor (torch.Tensor): Input tensor to be quantized.
-        scale (torch.Tensor): Scaling factor for the quantization.
-        float8_dtype (torch.dtype): Data type of the quantized tensor (e.g., torch.float8_e4m3fn, torch.float8_e5m2).
     """
-    # Note: when the line below is compiled with `torch.compile`, `tensor` is automatically
-    # upcasted to `float32` to multiply with the scale, since scale is a fp32 tensor in float8 quantization.
-    # In order to match numerics between eager and compile, we upcast manually here.
-    tensor_scaled = tensor.to(torch.float32) / scale
+    tensor_fp32 = tensor.to(torch.float32)
+
+    # Expand scale to match tensor dimensions for block-wise quantization
+    scale_expanded = _expand_scale_to_tensor_shape(scale, tensor.shape)
+
+    tensor_scaled = tensor_fp32 / scale_expanded
     max_value = torch.finfo(float8_dtype).max
     tensor_clamped = tensor_scaled.clamp(min=-max_value, max=max_value)
     fp8_tensor = tensor_clamped.to(float8_dtype)
@@ -2017,15 +2085,11 @@ def dequantize_affine_float8(
 ) -> torch.Tensor:
     """
     Dequantizes the float8 tensor to high precision tensor.
-
-    Args:
-        tensor (torch.Tensor): Input float8 tensor to be dequantized.
-        scale (torch.Tensor): Scaling factor for the dequantization.
-        output_dtype (torch.dtype): Data type of the output tensor (e.g., torch.float32).
     """
-    # Note: when the line below is compiled with `torch.compile`, `tensor` is automatically
-    # upcasted to `float32` to divide by the scale, since scale is a fp32 for float8 quantization.
-    # In order to match numerics between eager and compile, we upcast manually here.
     fp8_tensor = tensor.to(torch.float32)
-    hp_tensor = fp8_tensor * scale
+
+    # Expand scale to match tensor dimensions for block-wise quantization
+    scale_expanded = _expand_scale_to_tensor_shape(scale, tensor.shape)
+
+    hp_tensor = fp8_tensor * scale_expanded
     return hp_tensor.to(output_dtype)

From b0cfeec9df5ce6008be8f8b0bf1c83e4a0e248fe Mon Sep 17 00:00:00 2001
From: Xuan Liao <xuan.liao@intel.com>
Date: Wed, 28 May 2025 09:37:28 +0800
Subject: [PATCH 053/165] Support INT8 SDPA template for CPU (#2148)

* support int8 sdpa template
---
 .../inductor/test_int8_sdpa_fusion.py         |   12 +-
 .../prototype/inductor/codegen/__init__.py    |    5 +
 .../codegen/cpp_int8_sdpa_template.py         | 1824 +++++++++++++++++
 torchao/prototype/inductor/codegen/utils.py   |   13 +
 .../inductor/fx_passes/int8_sdpa_fusion.py    |   12 +-
 .../prototype/inductor/int8_sdpa_lowering.py  |  140 ++
 6 files changed, 1998 insertions(+), 8 deletions(-)
 create mode 100644 torchao/prototype/inductor/codegen/__init__.py
 create mode 100644 torchao/prototype/inductor/codegen/cpp_int8_sdpa_template.py
 create mode 100644 torchao/prototype/inductor/codegen/utils.py
 create mode 100644 torchao/prototype/inductor/int8_sdpa_lowering.py

diff --git a/test/prototype/inductor/test_int8_sdpa_fusion.py b/test/prototype/inductor/test_int8_sdpa_fusion.py
index c3456fb421..ec4f928df2 100644
--- a/test/prototype/inductor/test_int8_sdpa_fusion.py
+++ b/test/prototype/inductor/test_int8_sdpa_fusion.py
@@ -122,10 +122,14 @@ def _check_common(
             if has_fuse_pattern:
                 self.assertGreaterEqual(counters["inductor"]["int8_fuse_attention"], 1)
             if contains:
-                # many of the patterns get re-expanded in dispatcher
-                self.assertIn(
-                    "torchao.qscaled_dot_product",
-                    source_code,
+                self.assertTrue(
+                    any(
+                        op_name in source_code
+                        for op_name in [
+                            "qscaled_dot_product",
+                            "cpp_fused_quantize_per_tensor",
+                        ]
+                    )
                 )
 
             # some tests configured with very low dropout where we still want to check equality
diff --git a/torchao/prototype/inductor/codegen/__init__.py b/torchao/prototype/inductor/codegen/__init__.py
new file mode 100644
index 0000000000..6971ef74e2
--- /dev/null
+++ b/torchao/prototype/inductor/codegen/__init__.py
@@ -0,0 +1,5 @@
+from .cpp_int8_sdpa_template import CppInt8SdpaTemplate
+
+__all__ = [
+    "CppInt8SdpaTemplate",
+]
diff --git a/torchao/prototype/inductor/codegen/cpp_int8_sdpa_template.py b/torchao/prototype/inductor/codegen/cpp_int8_sdpa_template.py
new file mode 100644
index 0000000000..1f8865356a
--- /dev/null
+++ b/torchao/prototype/inductor/codegen/cpp_int8_sdpa_template.py
@@ -0,0 +1,1824 @@
+from typing import List, Optional
+
+import torch
+import torch.utils
+from sympy import sympify
+from torch._inductor import ir
+from torch._inductor.codegen.cpp_flex_attention_template import CppFlexAttentionTemplate
+from torch._inductor.codegen.cpp_template import CppTemplate
+from torch._inductor.ir import TensorBox
+from torch._inductor.select_algorithm import DataProcessorTemplateWrapper
+from torch._inductor.utils import parallel_num_threads
+
+from .utils import expand
+
+USEFUL_FUNCTIONS = r"""
+inline float {{kernel_name}}_calculate_scale(
+    int64_t headSize,
+    std::optional<double> scale) {
+  return scale.has_value()
+      ? scale.value()
+      : (1.0 / std::sqrt(headSize));
+}
+
+template <typename scalar_t>
+inline void {{kernel_name}}_fill_stub(scalar_t* data, scalar_t val, int64_t size) {
+  const int32_t vec_size = at::vec::Vectorized<scalar_t>::size();
+  auto data_vec = at::vec::Vectorized<scalar_t>(val);
+  int64_t d = 0;
+  for (; d < size - (size % vec_size); d += vec_size) {
+    data_vec.store(data + d);
+  }
+  if (d < size) {
+    data_vec.store(data + d, size - d);
+  }
+}
+
+template <typename scalar_t>
+inline void {{kernel_name}}_store(scalar_t* dst, at::vec::Vectorized<scalar_t> src, int size=at::vec::Vectorized<scalar_t>::size()) {
+  src.store(dst, size);
+}
+
+template <typename scalar_t>
+inline typename std::enable_if_t<std::is_same_v<scalar_t, unsigned char> || std::is_same_v<scalar_t, signed char>, void>
+{{kernel_name}}_store(scalar_t* dst, at::vec::Vectorized<float> src, int size=at::vec::Vectorized<float>::size()) {
+  auto res = at::vec::convert<scalar_t>(src);
+  res.store(dst, size);
+}
+
+/*
+1. dequant
+2. add mask
+3. max reduce for softmax
+*/
+template <typename mask_t>
+inline void {{kernel_name}}_dequant_mask_max_fusion_kernel(
+    const int32_t* in,
+    const mask_t* mask_ptr,
+    const int32_t* sum_a_ptr,
+    const int32_t* sum_b_ptr,
+    const int& M,
+    const int& N,
+    const int& ldi,
+    const int& ldm, // leading dimension mask
+    const int& ldo,
+    const int32_t& beta, // zp_a*zp_b*k
+    const float& alpha, // scale_a*scale_b*scale_sdpa
+    float* out,
+    float* sfm_max_ptr) {
+  const int32_t vec_size = at::vec::Vectorized<float>::size();
+  auto vec_beta = at::vec::Vectorized<int32_t>(beta);
+  auto vec_alpha = at::vec::Vectorized<float>(alpha);
+  for (long row = 0; row < M; row += 1) {
+    auto sum_a = sum_a_ptr[row];
+    auto vec_sum_a = at::vec::Vectorized<int32_t>(sum_a);
+    const int32_t* tmp_in = in + row * ldi;
+    float* tmp_out = out + row * ldo;
+    const mask_t* mask_data_ptr = mask_ptr + row * ldm;
+    float tmp_max = -std::numeric_limits<float>::infinity();
+    auto vec_tmp_max = at::vec::Vectorized<float>(tmp_max);
+    long col = 0;
+    for (; col < vec_size * (N / vec_size); col += vec_size) {
+      auto vec_sum_b = at::vec::Vectorized<int32_t>::loadu(sum_b_ptr + col);
+      auto tmp0 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col);
+      auto tmp1 = tmp0 - vec_sum_b;
+      auto tmp2 = tmp1 - vec_sum_a;
+      auto tmp3 = tmp2 + vec_beta;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      auto tmp6 = at::vec::Vectorized<mask_t>::loadu(mask_data_ptr + col);
+      auto tmp7 = at::vec::convert<float>(tmp6);
+      auto tmp8 = tmp5 + tmp7;
+      vec_tmp_max = at::vec::clamp_min(vec_tmp_max, tmp8);
+      {{kernel_name}}_store(tmp_out + col, tmp8);
+    }
+    if (col < N) {
+      auto vec_sum_b = at::vec::Vectorized<int32_t>::loadu(sum_b_ptr + col, N - col);
+      auto tmp0 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col, N - col);
+      auto tmp1 = tmp0 - vec_sum_b;
+      auto tmp2 = tmp1 - vec_sum_a;
+      auto tmp3 = tmp2 + vec_beta;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      auto tmp6 = at::vec::Vectorized<mask_t>::loadu(mask_data_ptr + col, N - col);
+      auto tmp7 = at::vec::convert<float>(tmp6);
+      auto tmp8 = tmp5 + tmp7;
+      {{kernel_name}}_store(tmp_out + col, tmp8, N - col);
+      vec_tmp_max = at::vec::Vectorized<float>::set(vec_tmp_max, at::vec::clamp_min(vec_tmp_max, tmp8), N - col);
+    }
+    sfm_max_ptr[row] = std::max(sfm_max_ptr[row], vec_tmp_max.reduce_max());
+  }
+}
+
+/*
+1. dequant
+2. max reduce for softmax
+*/
+inline void {{kernel_name}}_dequant_max_fusion_kernel(
+    const int32_t* in,
+    const int32_t* sum_a_ptr,
+    const int32_t* sum_b_ptr,
+    const int& M,
+    const int& N,
+    const int& ldi,
+    const int& ldo,
+    const int32_t& beta, // zp_a*zp_b*k
+    const float& alpha, // scale_a*scale_b*scale_sdpa
+    float* out,
+    float* sfm_max_ptr) {
+  const int32_t vec_size = at::vec::Vectorized<float>::size();
+  auto vec_beta = at::vec::Vectorized<int32_t>(beta);
+  auto vec_alpha = at::vec::Vectorized<float>(alpha);
+  for (long row = 0; row < M; row += 1) {
+    auto sum_a = sum_a_ptr[row];
+    auto vec_sum_a = at::vec::Vectorized<int32_t>(sum_a);
+    const int32_t* tmp_in = in + row * ldi;
+    float* tmp_out = out + row * ldo;
+    float tmp_max = -std::numeric_limits<float>::infinity();
+    auto vec_tmp_max = at::vec::Vectorized<float>(tmp_max);
+    long col = 0;
+    for (; col < vec_size * (N / vec_size); col += vec_size) {
+      auto vec_sum_b = at::vec::Vectorized<int32_t>::loadu(sum_b_ptr + col);
+      auto tmp0 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col);
+      auto tmp1 = tmp0 - vec_sum_b;
+      auto tmp2 = tmp1 - vec_sum_a;
+      auto tmp3 = tmp2 + vec_beta;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      vec_tmp_max = at::vec::clamp_min(vec_tmp_max, tmp5);
+      {{kernel_name}}_store(tmp_out + col, tmp5);
+    }
+    if (col < N) {
+      auto vec_sum_b = at::vec::Vectorized<int32_t>::loadu(sum_b_ptr + col, N - col);
+      auto tmp0 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col, N - col);
+      auto tmp1 = tmp0 - vec_sum_b;
+      auto tmp2 = tmp1 - vec_sum_a;
+      auto tmp3 = tmp2 + vec_beta;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      {{kernel_name}}_store(tmp_out + col, tmp5, N - col);
+      vec_tmp_max = at::vec::Vectorized<float>::set(vec_tmp_max, at::vec::clamp_min(vec_tmp_max, tmp5), N - col);
+    }
+    sfm_max_ptr[row] = std::max(sfm_max_ptr[row], vec_tmp_max.reduce_max());
+  }
+}
+
+/*
+1. Softmax: sub max, exp, sum reduce, div sum
+2. quant
+3. sum for attention
+*/
+template <typename scalar_t>
+inline void {{kernel_name}}_sub_exp_sum_div_quant_sum_fusion_kernel(
+    const float* in,
+    const int64_t& M,
+    const int64_t& N_step,
+    const int64_t& NSlice,
+    const int& ldi,
+    const int& ldo,
+    const int& kvSize,
+    const int& rndkvSplitSize,
+    const int& av_gemm_K,
+    const int32_t& beta1, // zp_a
+    const int32_t& beta2, // zp_b
+    const float& alpha, // scale_a
+    float* local,
+    scalar_t* out,
+    float* sfm_max_ptr,
+    float* sfm_sum_ptr,
+    int32_t* sum_a_ptr) {
+  const int32_t vec_size = at::vec::Vectorized<float>::size();
+  float min_val = 0;
+  float max_val = 255;
+  auto vec_min_val = at::vec::Vectorized<float>(min_val);
+  auto vec_max_val = at::vec::Vectorized<float>(max_val);
+  scalar_t zero = 0;
+  auto vec_zero = at::vec::Vectorized<scalar_t>(zero);
+  float beta1_float = (float) beta1;
+  auto vec_beta1 = at::vec::Vectorized<float>(beta1_float);
+  for (int64_t row = 0; row < M; ++row) {
+    auto sfm_max = sfm_max_ptr[row];
+    auto vec_max = at::vec::Vectorized<float>(sfm_max);
+    // sub max, exp, sum reduce
+    const float* qk_block_data = in + row * rndkvSplitSize;
+    for (int64_t l = 0; l < NSlice; l ++) {
+      int64_t n = l * N_step;
+      int64_t kvBlockSize = std::min(N_step, kvSize - n);
+      const float* tmp_in = qk_block_data + l * ldi;
+      float tmp_sum = 0;
+      auto vec_tmp_sum = at::vec::Vectorized<float>(tmp_sum);
+      float* tmp_out = local + n;
+      long col = 0;
+      for (; col < vec_size * (kvBlockSize / vec_size); col += vec_size) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col);
+        auto tmp1 = tmp0 - vec_max;
+        auto tmp2 = tmp1.exp_u20();
+        vec_tmp_sum += tmp2;
+        {{kernel_name}}_store(tmp_out + col, tmp2);
+      }
+      if (col < kvBlockSize) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col, kvBlockSize - col);
+        auto tmp1 = tmp0 - vec_max;
+        auto tmp2 = tmp1.exp_u20();
+        {{kernel_name}}_store(tmp_out + col, tmp2, kvBlockSize - col);
+        vec_tmp_sum = at::vec::Vectorized<float>::set(vec_tmp_sum, vec_tmp_sum + tmp2, kvBlockSize - col);
+      }
+      sfm_sum_ptr[row] += vec_tmp_sum.reduce_add();
+    }
+    // div sum, sum for attention
+    auto sum_scale = 1 / sfm_sum_ptr[row] / alpha;
+    auto vec_sum_scale = at::vec::Vectorized<float>(sum_scale);
+    scalar_t* qk_reduced_block_data = out + row * av_gemm_K;
+    for (int64_t l = 0; l < NSlice; l ++) {
+      int64_t n = l * N_step;
+      int64_t kvBlockSize = std::min(N_step, kvSize - n);
+      int32_t tmp_sum = 0;
+      auto vec_tmp_sum = at::vec::Vectorized<int32_t>(tmp_sum);
+      float* tmp_in = local + n;
+      scalar_t* tmp_out = qk_reduced_block_data + l * ldo;
+      long col = 0;
+      for (; col < vec_size * (kvBlockSize / vec_size); col += vec_size) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col);
+        auto tmp1 = tmp0 * vec_sum_scale;
+        auto tmp2 = tmp1.round();
+        auto tmp3 = tmp2 + vec_beta1;
+        auto tmp4 = at::vec::clamp(tmp3, vec_min_val, vec_max_val);
+        {{kernel_name}}_store(tmp_out + col, tmp4);
+        auto tmp6 = at::vec::convert<int32_t>(tmp4);
+        vec_tmp_sum += tmp6;
+      }
+      if (col < kvBlockSize) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col, kvBlockSize - col);
+        auto tmp1 = tmp0 * vec_sum_scale;
+        auto tmp2 = tmp1.round();
+        auto tmp3 = tmp2 + vec_beta1;
+        auto tmp4 = at::vec::clamp(tmp3, vec_min_val, vec_max_val);
+        {{kernel_name}}_store(tmp_out + col, tmp4, kvBlockSize - col);
+        auto tmp6 = at::vec::convert<int32_t>(tmp4);
+        vec_tmp_sum = at::vec::Vectorized<int32_t>::set(vec_tmp_sum, vec_tmp_sum + tmp6, kvBlockSize - col);
+      }
+      sum_a_ptr[row] += vec_tmp_sum.reduce_add() * beta2;
+      // set zero
+      col = kvBlockSize;
+      for (; col <  vec_size * (av_gemm_K / vec_size); col += vec_size) {
+        {{kernel_name}}_store(tmp_out + col, vec_zero);
+      }
+      if (col < av_gemm_K) {
+        {{kernel_name}}_store(tmp_out + col, vec_zero, av_gemm_K - col);
+      }
+    }
+  }
+}
+
+/*
+1. Softmax: sub max, exp, sum reduce, div sum
+2. quant
+*/
+template <typename scalar_t>
+inline void {{kernel_name}}_sub_exp_sum_div_quant_fusion_kernel(
+    const float* in,
+    const int64_t& M,
+    const int64_t& N_step,
+    const int64_t& NSlice,
+    const int& ldi,
+    const int& ldo,
+    const int& kvSize,
+    const int& rndkvSplitSize,
+    const int& av_gemm_K,
+    const int32_t& beta1, // zp_a
+    const float& alpha, // scale_a
+    float* local,
+    scalar_t* out,
+    float* sfm_max_ptr,
+    float* sfm_sum_ptr) {
+  const int32_t vec_size = at::vec::Vectorized<float>::size();
+  float min_val = 0;
+  float max_val = 255;
+  auto vec_min_val = at::vec::Vectorized<float>(min_val);
+  auto vec_max_val = at::vec::Vectorized<float>(max_val);
+  scalar_t zero = 0;
+  auto vec_zero = at::vec::Vectorized<scalar_t>(zero);
+  float beta1_float = (float) beta1;
+  auto vec_beta1 = at::vec::Vectorized<float>(beta1_float);
+  for (int64_t row = 0; row < M; ++row) {
+    auto sfm_max = sfm_max_ptr[row];
+    auto vec_max = at::vec::Vectorized<float>(sfm_max);
+    // sub max, exp, sum reduce
+    const float* qk_block_data = in + row * rndkvSplitSize;
+    for (int64_t l = 0; l < NSlice; l ++) {
+      int64_t n = l * N_step;
+      int64_t kvBlockSize = std::min(N_step, kvSize - n);
+      const float* tmp_in = qk_block_data + l * ldi;
+      float tmp_sum = 0;
+      auto vec_tmp_sum = at::vec::Vectorized<float>(tmp_sum);
+      float* tmp_out = local + n;
+      long col = 0;
+      for (; col < vec_size * (kvBlockSize / vec_size); col += vec_size) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col);
+        auto tmp1 = tmp0 - vec_max;
+        auto tmp2 = tmp1.exp_u20();
+        vec_tmp_sum += tmp2;
+        {{kernel_name}}_store(tmp_out + col, tmp2);
+      }
+      if (col < kvBlockSize) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col, kvBlockSize - col);
+        auto tmp1 = tmp0 - vec_max;
+        auto tmp2 = tmp1.exp_u20();
+        vec_tmp_sum = at::vec::Vectorized<float>::set(vec_tmp_sum, vec_tmp_sum + tmp2, kvBlockSize - col);
+        {{kernel_name}}_store(tmp_out + col, tmp2, kvBlockSize - col);
+      }
+      sfm_sum_ptr[row] += vec_tmp_sum.reduce_add();
+    }
+    // div sum, sum for attention
+    auto sum_scale = 1 / sfm_sum_ptr[row] / alpha;
+    auto vec_sum_scale = at::vec::Vectorized<float>(sum_scale);
+    scalar_t* qk_reduced_block_data = out + row * av_gemm_K;
+    for (int64_t l = 0; l < NSlice; l ++) {
+      int64_t n = l * N_step;
+      int64_t kvBlockSize = std::min(N_step, kvSize - n);
+      float* tmp_in = local + n;
+      scalar_t* tmp_out = qk_reduced_block_data + l * ldo;
+      long col = 0;
+      for (; col < vec_size * (kvBlockSize / vec_size); col += vec_size) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col);
+        auto tmp1 = tmp0 * vec_sum_scale;
+        auto tmp2 = tmp1.round();
+        auto tmp3 = tmp2 + vec_beta1;
+        auto tmp4 = at::vec::clamp(tmp3, vec_min_val, vec_max_val);
+        {{kernel_name}}_store(tmp_out + col, tmp4);
+      }
+      if (col < kvBlockSize) {
+        auto tmp0 = at::vec::Vectorized<float>::loadu(tmp_in + col, kvBlockSize - col);
+        auto tmp1 = tmp0 * vec_sum_scale;
+        auto tmp2 = tmp1.round();
+        auto tmp3 = tmp2 + vec_beta1;
+        auto tmp4 = at::vec::clamp(tmp3, vec_min_val, vec_max_val);
+        {{kernel_name}}_store(tmp_out + col, tmp4, kvBlockSize - col);
+      }
+      // set zero
+      col = kvBlockSize;
+      for (; col < vec_size * (av_gemm_K / vec_size); col += vec_size) {
+        {{kernel_name}}_store(tmp_out + col, vec_zero);
+      }
+      if (col < av_gemm_K) {
+        {{kernel_name}}_store(tmp_out + col, vec_zero, av_gemm_K - col);
+      }
+    }
+  }
+}
+
+/*
+1. dequant
+2. quant
+*/
+template <typename scalar_t>
+inline void {{kernel_name}}_dequant_quant_fusion_kernel(
+    const int32_t* in,
+    const int32_t* sum_a_ptr,
+    const int32_t* sum_b_ptr,
+    const int& M,
+    const int& N,
+    const int& ldi,
+    const int& ldo,
+    const int32_t& beta1, // zp_a*zp_b*k
+    const int32_t& beta2, // zp_c
+    const float& alpha, // scale_a*scale_b/scale_c
+    scalar_t* out) {
+  const int32_t vec_size = at::vec::Vectorized<float>::size();
+  float min_val = 0;
+  float max_val = 255;
+  auto vec_min_val = at::vec::Vectorized<float>(min_val);
+  auto vec_max_val = at::vec::Vectorized<float>(max_val);
+  auto vec_beta1 = at::vec::Vectorized<int32_t>(beta1);
+  auto vec_alpha = at::vec::Vectorized<float>(alpha);
+  float beta2_float = (float) beta2;
+  auto vec_beta2 = at::vec::Vectorized<float>(beta2_float);
+  for (long row = 0; row < M; row += 1) {
+    auto sum_a = sum_a_ptr[row];
+    auto vec_sum_a = at::vec::Vectorized<int32_t>(sum_a);
+    const int32_t* tmp_in = in + row * ldi;
+    scalar_t* tmp_out = out + row * ldo;
+    long col = 0;
+    for (; col < vec_size * (N / vec_size); col += vec_size) {
+      auto vec_sum_b = at::vec::Vectorized<int32_t>::loadu(sum_b_ptr + col);
+      auto tmp0 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col);
+      auto tmp1 = tmp0 - vec_sum_b;
+      auto tmp2 = tmp1 - vec_sum_a;
+      auto tmp3 = tmp2 + vec_beta1;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      auto tmp6 = tmp5.round();
+      auto tmp7 = tmp6 + vec_beta2;
+      auto tmp8 = at::vec::clamp(tmp7, vec_min_val, vec_max_val);
+      {{kernel_name}}_store(tmp_out + col, tmp8);
+    }
+    if (col < N) {
+      auto vec_sum_b = at::vec::Vectorized<int32_t>::loadu(sum_b_ptr + col, N - col);
+      auto tmp0 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col, N - col);
+      auto tmp1 = tmp0 - vec_sum_b;
+      auto tmp2 = tmp1 - vec_sum_a;
+      auto tmp3 = tmp2 + vec_beta1;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      auto tmp6 = tmp5.round();
+      auto tmp7 = tmp6 + vec_beta2;
+      auto tmp8 = at::vec::clamp(tmp7, vec_min_val, vec_max_val);
+      {{kernel_name}}_store(tmp_out + col, tmp8, N - col);
+    }
+  }
+}
+
+/*
+1. dequant
+2. quant
+*/
+template <typename scalar_t>
+inline void {{kernel_name}}_dequant_quant_fusion_kernel(
+    const int32_t* in,
+    const int32_t* sum_a_ptr,
+    const int& M,
+    const int& N,
+    const int& ldi,
+    const int& ldo,
+    const int32_t& beta2, // zp_c
+    const float& alpha, // scale_a*scale_b/scale_c
+    scalar_t* out) {
+  const int32_t vec_size = at::vec::Vectorized<float>::size();
+  float min_val = 0;
+  float max_val = 255;
+  auto vec_min_val = at::vec::Vectorized<float>(min_val);
+  auto vec_max_val = at::vec::Vectorized<float>(max_val);
+  // auto vec_beta1 = at::vec::Vectorized<int32_t>(beta1);
+  auto vec_alpha = at::vec::Vectorized<float>(alpha);
+  float beta2_float = (float) beta2;
+  auto vec_beta2 = at::vec::Vectorized<float>(beta2_float);
+  for (long row = 0; row < M; row += 1) {
+    auto sum_a = sum_a_ptr[row];
+    auto vec_sum_a = at::vec::Vectorized<int32_t>(sum_a);
+    const int32_t* tmp_in = in + row * ldi;
+    scalar_t* tmp_out = out + row * ldo;
+    long col = 0;
+    for (; col < vec_size * (N / vec_size); col += vec_size) {
+      auto tmp1 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col);
+      auto tmp3 = tmp1 - vec_sum_a;
+      // auto tmp3 = tmp2 + vec_beta1;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      auto tmp6 = tmp5.round();
+      auto tmp7 = tmp6 + vec_beta2;
+      auto tmp8 = at::vec::clamp(tmp7, vec_min_val, vec_max_val);
+      {{kernel_name}}_store(tmp_out + col, tmp8);
+    }
+    if (col < N) {
+      auto tmp1 = at::vec::Vectorized<int32_t>::loadu(tmp_in + col, N - col);
+      auto tmp3 = tmp1 - vec_sum_a;
+      auto tmp4 = at::vec::convert<float>(tmp3);
+      auto tmp5 = tmp4 * vec_alpha;
+      auto tmp6 = tmp5.round();
+      auto tmp7 = tmp6 + vec_beta2;
+      auto tmp8 = at::vec::clamp(tmp7, vec_min_val, vec_max_val);
+      {{kernel_name}}_store(tmp_out + col, tmp8, N - col);
+    }
+  }
+}
+
+template <typename scalar_t>
+inline void {{kernel_name}}_int_sum_b_contiguous_kernel_helper(
+    const scalar_t* in,
+    int32_t* out,
+    const int& N,
+    const int32_t& scale) {
+  const int32_t vec_size = at::vec::Vectorized<int32_t>::size();
+  int32_t tmp_sum = 0;
+  auto vec_tmp_sum = at::vec::Vectorized<int32_t>(tmp_sum);
+  long i = 0;
+  for (; i < vec_size * (N / vec_size); i += vec_size) {
+    auto tmp0 = at::vec::Vectorized<scalar_t>::loadu(in + i);
+    auto tmp1 = at::vec::convert<int32_t>(tmp0);
+    vec_tmp_sum = vec_tmp_sum + tmp1;
+  }
+  if (i < N) {
+    auto tmp0 = at::vec::Vectorized<scalar_t>::loadu(in + i, N - i);
+    auto tmp1 = at::vec::convert<int32_t>(tmp0);
+    vec_tmp_sum = at::vec::Vectorized<int32_t>::set(vec_tmp_sum, vec_tmp_sum + tmp1, N - i);
+  }
+  out[0] = vec_tmp_sum.reduce_add() * scale;
+}
+
+// reduce along dim b for shape [a, b], with sum shape [a]
+template <typename scalar_t>
+inline void {{kernel_name}}_int_sum_b_contiguous_kernel(
+    const scalar_t* in,
+    int32_t* out,
+    const int& M,
+    const int& N,
+    const int& ld,
+    const int32_t& scale) {
+  for (long r = 0; r < M; r += 1) {
+    {{kernel_name}}_int_sum_b_contiguous_kernel_helper(in + r * ld, out + r, N, scale);
+  }
+}
+
+// reduce along dim a for shape [a, b], with sum shape [b]
+template <typename scalar_t>
+inline void {{kernel_name}}_int_sum_a_contiguous_kernel(
+    const scalar_t* in,
+    int32_t* out,
+    const int& M,
+    const int& N,
+    const int& ld,
+    const int32_t& scale) {
+  const int32_t vec_size = at::vec::Vectorized<int32_t>::size();
+  auto vec_scale = at::vec::Vectorized<int32_t>(scale);
+  // initialization with 0
+  int32_t zero = 0;
+  auto vec_zero = at::vec::Vectorized<int32_t>(zero);
+  long i = 0;
+  for (; i < vec_size * (M / vec_size); i += vec_size) {
+    {{kernel_name}}_store(out + i, vec_zero);
+  }
+  if (i < M) {
+    {{kernel_name}}_store(out + i, vec_zero, M - i);
+  }
+  // sum
+  for (long j = 0; j < N; j++) {
+    const scalar_t* tmp_in = in + j * ld;
+    long k = 0;
+    for (; k < vec_size * (M / vec_size); k += vec_size) {
+      auto tmp0 = at::vec::Vectorized<scalar_t>::loadu(tmp_in + k);
+      auto tmp1 = at::vec::Vectorized<int32_t>::loadu(out + k);
+      auto tmp2 = at::vec::convert<int32_t>(tmp0);
+      auto tmp3 = tmp1 + tmp2;
+      {{kernel_name}}_store(out + k, tmp3);
+    }
+    if (k < M) {
+      auto tmp0 = at::vec::Vectorized<scalar_t>::loadu(tmp_in + k, M - k);
+      auto tmp1 = at::vec::Vectorized<int32_t>::loadu(out + k, M - k);
+      auto tmp2 = at::vec::convert<int32_t>(tmp0);
+      auto tmp3 = tmp1 + tmp2;
+      {{kernel_name}}_store(out + k, tmp3, M - k);
+    }
+  }
+  // scale
+  i = 0;
+  for (; i < vec_size * (M / vec_size); i += vec_size) {
+    auto tmp0 = at::vec::Vectorized<int32_t>::loadu(out + i);
+    auto tmp1 = tmp0 * vec_scale;
+    {{kernel_name}}_store(out + i, tmp1);
+  }
+  if (i < M) {
+    auto tmp0 = at::vec::Vectorized<int32_t>::loadu(out + i, M - i);
+    auto tmp1 = tmp0 * vec_scale;
+    {{kernel_name}}_store(out + i, tmp1, M - i);
+  }
+}
+
+// do the transpose: [in_rows, in_cols] -> [in_cols, in_rows]
+template <typename scalar_t>
+inline void {{kernel_name}}_do_transpose(
+    const scalar_t* src,
+    scalar_t* dst,
+    int64_t in_rows,
+    int64_t in_cols,
+    int64_t ldi,
+    int64_t ldo) {
+  for (int64_t r=0; r<in_rows; r++) {
+    for (int64_t c=0; c<in_cols; c++) {
+      *(dst + c * ldo + r) = *(src + r * ldi + c);
+    }
+  }
+}
+
+// padding with pad_val: [rows, cols] -> [prows, pcols]
+template <typename scalar_t>
+inline void {{kernel_name}}_pad_remain_row_col(
+    scalar_t* value_ptr,
+    int rows,
+    int cols,
+    int prows,
+    int pcols,
+    int ldi,
+    scalar_t pad_val=0) {
+  auto psize = pcols - cols;
+  if (psize == 0 && prows == rows) {
+    return;
+  }
+  const int32_t vec_size = at::vec::Vectorized<scalar_t>::size();
+  auto pad = at::vec::Vectorized<scalar_t>(pad_val);
+  if (psize > 0) {
+    for (int i = 0; i < rows; i++) {
+      int j = 0;
+      for (; j < psize - (psize % vec_size); j += vec_size) {
+        pad.store(value_ptr + i * ldi + cols + j);
+      }
+      if (j < psize) {
+        pad.store(value_ptr + i * ldi + cols + j, psize - j);
+      }
+    }
+  }
+
+  for (int i = rows; i < prows; i++) {
+    int j = 0;
+    for (; j < pcols - (pcols % vec_size); j += vec_size) {
+      pad.store(value_ptr + i * ldi + j);
+    }
+    if (j < pcols) {
+      pad.store(value_ptr + i * ldi + j, pcols - j);
+    }
+  }
+}
+
+// copy value_ptr to dst_ptr with padding: [rows, cols] -> [prows, pcols]
+template <typename scalar_t>
+inline void {{kernel_name}}_copy_value_with_pad(
+    const scalar_t* value_ptr,
+    scalar_t* dst_ptr,
+    int rows,
+    int cols,
+    int prows,
+    int pcols,
+    int ldi,
+    scalar_t pad_val=0) {
+  const int32_t vec_size = at::vec::Vectorized<scalar_t>::size();
+  auto pad = at::vec::Vectorized<scalar_t>(pad_val);
+  int i = 0;
+  for (; i < rows; i++) {
+    int j = 0;
+    for (; j < cols - (cols % vec_size); j += vec_size) {
+      auto vec_v =
+          at::vec::Vectorized<scalar_t>::loadu(value_ptr + i * ldi + j);
+      vec_v.store(dst_ptr + i * pcols + j);
+    }
+
+    if (j < cols) {
+      auto vec_v = at::vec::Vectorized<scalar_t>::loadu(
+          value_ptr + i * ldi + j, cols - j);
+      vec_v.store(dst_ptr + i * pcols + j, cols - j);
+    }
+
+    // col padding
+    auto psize = pcols - cols;
+    if (psize > 0) {
+      int pj = 0;
+      for (; pj < psize - (psize % vec_size); pj += vec_size) {
+        pad.store(dst_ptr + i * pcols + cols + pj);
+      }
+      if (pj < psize) {
+        pad.store(dst_ptr + i * pcols + cols + pj, psize - pj);
+      }
+    }
+  }
+
+  // row padding
+  for (; i < prows; i++) {
+    int j = 0;
+    for (; j < pcols - (pcols % vec_size); j += vec_size) {
+      pad.store(dst_ptr + i * pcols + j);
+    }
+    if (j < pcols) {
+      pad.store(dst_ptr + i * pcols + j, pcols - j);
+    }
+
+  }
+
+}
+"""
+
+
+ALLOCATE_BUFFER = r"""
+  auto& {{buffer_name}}_allocator = *at::getCPUAllocator();
+  auto {{buffer_name}}_work_data = {{buffer_name}}_allocator.allocate({{buffer_size}} * sizeof({{buffer_dtype}}));
+  void* {{buffer_name}}_data_ptr = {{buffer_name}}_work_data.get();
+  {{buffer_dtype}}* {{buffer_name}} = ({{buffer_dtype}}*){{buffer_name}}_data_ptr;
+"""
+
+
+INT8_SDPA_ONE_LOOP_TEMPLATE = r"""
+{{template.header().getvalue()}}
+#include <ATen/ATen.h>
+#include <ATen/AccumulateType.h>
+#include <ATen/Dispatch.h>
+#include <ATen/core/Tensor.h>
+#include <ATen/cpu/vec/functional.h>
+#include <ATen/cpu/vec/vec.h>
+#include <ATen/cpu/Utils.h>
+#include <ATen/native/cpu/utils.h>
+#include <ATen/native/CPUBlas.h>
+#include <ATen/Parallel.h>
+#include <ATen/Tensor.h>
+#include <c10/util/irange.h>
+
+#ifndef AT_PER_OPERATOR_HEADERS
+#include <ATen/Functions.h>
+#else
+#include <ATen/ops/empty.h>
+#endif
+
+#include <ATen/Tensor.h>
+#include <limits>
+#include <torch/all.h>
+#include <torch/csrc/autograd/function.h>
+
+{{template.codegen_useful_function(kernel.kernel_name)}}
+
+{%- if has_attention_mask %}
+{%- set kernel_args = {"query": query, "key": key, "value": value,
+                       "attention_mask": attention_mask} %}
+{%- else %}
+{%- set kernel_args = {"query": query, "key": key, "value": value} %}
+{%- endif %}
+
+// UINT8 - u8u8s32
+extern "C"
+{{kernel.def_kernel(inputs=kernel_args, outputs={"output": output})}}
+{
+  {{ kernel.maybe_codegen_profile() }}
+  int64_t num_thread = {{num_thread}};
+  using accum_t = float;
+  using scalar_t = {{kernel.dtype(query)}};
+  int block_64 = 64;
+  auto u8_dt = at::ScalarType::Byte;
+
+  // Sizes
+  int64_t batchSize = {{kernel.size(query, 0)}};
+  int64_t qSize = {{kernel.size(query, 1)}};
+  int64_t kvSize = {{kernel.size(value, 1)}};
+  int64_t num_head = {{kernel.size(query, 2)}};
+  int64_t headSize = {{kernel.size(query, 3)}};
+  float scaling_factor =
+      {{kernel.kernel_name}}_calculate_scale(headSize, {{scale}});
+
+  // Strides
+  int64_t qStrideB = {{kernel.stride(query, 0)}};
+  int64_t qStrideM = {{kernel.stride(query, 1)}};
+  int64_t qStrideH = {{kernel.stride(query, 2)}};
+  int64_t kStrideB = {{kernel.stride(key, 0)}};
+  int64_t kStrideN = {{kernel.stride(key, 1)}};
+  int64_t kStrideH = {{kernel.stride(key, 2)}};
+  int64_t vStrideB = {{kernel.stride(value, 0)}};
+  int64_t vStrideN = {{kernel.stride(value, 1)}};
+  int64_t vStrideH = {{kernel.stride(value, 2)}};
+  int64_t oStrideB = {{kernel.stride(output, 0)}};
+  int64_t oStrideM = {{kernel.stride(output, 2)}};
+  int64_t oStrideH = {{kernel.stride(output, 1)}};
+
+  int64_t qSplitSize = {{q_split_size}} > qSize ? qSize : {{q_split_size}};
+  int64_t kvSplitSize = {{kv_split_size}} > kvSize ? kvSize : {{kv_split_size}};
+  int64_t qSlice = (qSize - 1) / qSplitSize + 1;
+  int64_t kvSlice = (kvSize - 1) / kvSplitSize + 1;
+  int64_t kvTail = (kvSize - 1) % kvSplitSize + 1;
+
+  int64_t rndHeadSize = (headSize + block_64 - 1L) / block_64 * block_64;
+  int64_t rndkvSplitSize = (kvSplitSize + block_64 - 1L) / block_64 * block_64;
+  int64_t rndkvTail = (kvTail + block_64 - 1L) / block_64 * block_64;
+  int64_t rndkvSize = {{kv_split_size}} > kvSize ? rndkvTail : rndkvSplitSize * kvSlice + rndkvTail;
+
+  bool av_gemm_K_mul4 = kvSplitSize % 4 == 0;
+  int av_gemm_K_padding = av_gemm_K_mul4 ? 0 : 4 - kvSplitSize % 4;
+  int av_gemm_K = kvSplitSize + av_gemm_K_padding;
+
+{%- if has_attention_mask %}
+  // attention mask
+  using mask_t = {{kernel.dtype(attention_mask)}};
+  const mask_t* mask_data = attention_mask;
+  int64_t mStrideB =
+      {{kernel.size(attention_mask, 0)}} > 1
+      ? {{kernel.stride(attention_mask, 0)}}
+      : 0;
+  int64_t mStrideH =
+      {{kernel.size(attention_mask, 1)}} > 1
+      ? {{kernel.stride(attention_mask, 1)}}
+      : 0;
+  int64_t mStrideM =
+      {{kernel.size(attention_mask, 2)}}> 1
+      ? {{kernel.stride(attention_mask, 2)}}
+      : 0;
+  int64_t mStrideN =
+      {{kernel.size(attention_mask, 3)}} > 1
+      ? {{kernel.stride(attention_mask, 3)}}
+      : 0;
+{%- endif %}
+
+  // Data ptrs
+  const scalar_t* q_data = query;
+  const scalar_t* k_data = key;
+  const scalar_t* v_data = value;
+  scalar_t* out_data = output;
+
+  bool headSize_mul64 = headSize % 64 == 0;
+  int qk_gemm_K_padding = headSize_mul64 ? 0 : 64 - headSize % 64;
+  int qk_gemm_K = headSize + qk_gemm_K_padding;
+
+  int64_t qk_reduce_strideL = qSplitSize * av_gemm_K;
+  int64_t v_reorder_strideL = av_gemm_K * rndHeadSize;
+
+  int64_t total_size_uint8_per_thread =
+    /* qk */ kvSlice * qSplitSize * rndkvSplitSize * 4 +
+    /* qk_local  */ kvSlice * av_gemm_K * 4 +
+    /* qk_reduce  */ kvSlice * qk_reduce_strideL +
+    /* qk_s32   */ qSplitSize * rndkvSplitSize * 4 +
+    /* dst_s32  */ qSplitSize * rndHeadSize * 4 +
+    /* softmax_sum   */ qSplitSize * 4 +
+    /* query_sum     */ qSplitSize * 4 +
+    /* attention_sum */ qSplitSize * 4 +
+    /* softmax max */ qSplitSize * 4 +
+    /* query_padding_data */ qSplitSize * qk_gemm_K +
+    /* key_sum */ kvSize * 4 +
+    /* value_sum */ headSize * 4 +
+    /* key_t_reorder */ qk_gemm_K * rndkvSize +
+    /* value_t_reorder */ kvSlice * v_reorder_strideL;
+  {{template.codegen_allocate_buffer("total_buf_data", "scalar_t", "num_thread * total_size_uint8_per_thread")}}
+
+  at::parallel_for(
+      0, batchSize * num_head, 1, [&](int64_t begin, int64_t end) {
+        int64_t i = 0, j = 0;
+        at::native::data_index_init(
+            begin, i, batchSize, j, num_head);
+        int ompIdx = at::get_thread_num();
+        scalar_t* total_buf_ptr = total_buf_data + ompIdx * total_size_uint8_per_thread;
+        int32_t offset = 0;
+        accum_t* qk_data = reinterpret_cast<accum_t*>(total_buf_ptr);
+        offset += kvSlice * qSplitSize * rndkvSplitSize * 4;
+        accum_t* qk_local_data = reinterpret_cast<accum_t*>(total_buf_ptr + offset);
+        offset += kvSlice * av_gemm_K * 4;
+        scalar_t* qk_reduced_data = reinterpret_cast<scalar_t*>(total_buf_ptr + offset);
+        offset += kvSlice * qk_reduce_strideL;
+        int32_t* qk_s32_data = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * rndkvSplitSize * 4;
+        int32_t* dst_s32_data = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * rndHeadSize * 4;
+        accum_t* sfm_sum_ptr = reinterpret_cast<accum_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        int32_t* q_sum_ptr = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        int32_t* a_sum_ptr = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        accum_t* sfm_max_ptr = reinterpret_cast<accum_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        scalar_t* query_t_padding_ptr = reinterpret_cast<scalar_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * qk_gemm_K;
+
+        int32_t* k_sum_ptr = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += kvSize * 4;
+        int32_t* v_sum_ptr = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += headSize * 4;
+        scalar_t* key_reorder_ptr = reinterpret_cast<scalar_t*>(total_buf_ptr + offset);
+        offset += qk_gemm_K * rndkvSize;
+        scalar_t* value_reorder_ptr = reinterpret_cast<scalar_t*>(total_buf_ptr + offset);
+
+        uint8_t* B_blocked_xform_u8 = new uint8_t[qk_gemm_K * block_64];
+
+        for (const auto z : c10::irange(begin, end)) {
+          (void)z; // Suppress unused variable
+
+          // sum k and v
+{%- if q_zp == 0 %}
+          {{kernel.kernel_name}}_fill_stub(k_sum_ptr, static_cast<int32_t>(0), kvSize);
+{%- else %}
+          {{kernel.kernel_name}}_int_sum_b_contiguous_kernel(k_data + i * kStrideB + j * kStrideH,
+            k_sum_ptr,
+            kvSize, headSize, kStrideN, {{q_zp}});
+{%- endif %}
+{%- if a_zp == 0 %}
+          {{kernel.kernel_name}}_fill_stub(v_sum_ptr, static_cast<int32_t>(0), headSize);
+{%- else %}
+          {{kernel.kernel_name}}_int_sum_a_contiguous_kernel(v_data + i * vStrideB + j * vStrideH,
+            v_sum_ptr,
+            headSize, kvSize, vStrideN, {{a_zp}});
+{%- endif %}
+
+          // transpose and packing
+          for (int64_t n = 0; n < kvSize; n += kvSplitSize) {
+            int64_t kvBlockSize = std::min(kvSplitSize, kvSize - n);
+            for (int64_t b = 0; b < kvBlockSize; b += block_64) {
+              bool istail = kvBlockSize - b < block_64;
+              int64_t trans_rows = istail ? kvBlockSize - b : block_64;
+              {{kernel.kernel_name}}_do_transpose(
+                  k_data + i * kStrideB + j * kStrideH + n * kStrideN + b * kStrideN,
+                  B_blocked_xform_u8,
+                  trans_rows,
+                  headSize,
+                  kStrideN,
+                  block_64);
+              if (!headSize_mul64 || istail) {
+                {{kernel.kernel_name}}_pad_remain_row_col(
+                    B_blocked_xform_u8,
+                    headSize,
+                    trans_rows,
+                    qk_gemm_K,
+                    block_64,
+                    block_64
+                  );
+              }
+              at::native::cpublas::pack(
+                      qk_gemm_K, // K
+                      block_64, // N
+                      block_64, // ld_in
+                      block_64, // ld_out
+                      u8_dt, // dt_in
+                      u8_dt, // dt_out
+                      B_blocked_xform_u8,
+                      key_reorder_ptr + n * qk_gemm_K +
+                          b * qk_gemm_K);
+            }
+            // split headSize to block_64, block_64, block_64 ...
+            // [av_gemm_K, headSize] -> [av_gemm_K,  block_64 ...]
+            for (int64_t b = 0; b < rndHeadSize; b += block_64) {
+              at::native::cpublas::pack(
+                      av_gemm_K,
+                      block_64,
+                      vStrideN, // block_64,
+                      block_64,
+                      u8_dt,
+                      u8_dt,
+                      v_data + i * vStrideB + j * vStrideH + n * vStrideN + b,
+                      value_reorder_ptr + n * rndHeadSize +
+                          av_gemm_K * b);
+            }
+          }
+
+          // sdpa core
+          for (int64_t k = 0; k < qSlice; k++) {
+            int64_t m = k * qSplitSize;
+            int64_t qBlockSize = std::min(qSplitSize, qSize - m);
+            // Initialize sum and max
+            {{kernel.kernel_name}}_fill_stub(
+                sfm_sum_ptr, static_cast<accum_t>(0), qSplitSize);
+            {{kernel.kernel_name}}_fill_stub(
+                a_sum_ptr, static_cast<int32_t>(0), qSplitSize);
+            {{kernel.kernel_name}}_fill_stub(
+                sfm_max_ptr, static_cast<accum_t>(-std::numeric_limits<accum_t>::infinity()), qSplitSize);
+            int64_t num_keys = kvSize;
+            {{kernel.kernel_name}}_copy_value_with_pad(
+                q_data + i * qStrideB + j * qStrideH + m * qStrideM,
+                query_t_padding_ptr,
+                qBlockSize,
+                headSize,
+                qBlockSize,
+                qk_gemm_K,
+                qStrideM);
+            // sum q
+{%- if k_zp != 0 %}
+            {{kernel.kernel_name}}_int_sum_b_contiguous_kernel(q_data + i * qStrideB + j * qStrideH + m * qStrideM,
+                  q_sum_ptr, qBlockSize, headSize, qStrideM, {{k_zp}});
+{%- else %}
+            {{kernel.kernel_name}}_fill_stub(
+              q_sum_ptr, static_cast<int32_t>(0), qSplitSize);
+{%- endif %}
+            const int64_t rkvSlice = (num_keys - 1) / kvSplitSize + 1;
+            for (int64_t l = 0; l < rkvSlice; l++) {
+              int64_t n = l * kvSplitSize;
+              int64_t kvBlockSize = std::min(kvSplitSize, kvSize - n);
+              for (int64_t b = 0; b < kvBlockSize; b += block_64) {
+                at::native::cpublas::brgemm(
+                      qSplitSize, block_64, qk_gemm_K,
+                      qk_gemm_K, // lda
+                      block_64, //ldb
+                      rndkvSplitSize, //ldc,
+                      false,
+                      query_t_padding_ptr,
+                      key_reorder_ptr + n * qk_gemm_K +
+                          b * qk_gemm_K,
+                      qk_s32_data + b);
+              }
+
+              // do dequant compensation, add mask, max reduce for softmax, and convert qk from s32 to fp32
+              accum_t* qk_block_data = qk_data + l * qSplitSize * rndkvSplitSize;
+{%- if has_attention_mask %}
+              const mask_t* mask_data_offset = mask_data + i * mStrideB + j * mStrideH + m * mStrideM + (mStrideN == 0 ? 0 : n);
+              {{kernel.kernel_name}}_dequant_mask_max_fusion_kernel(
+                qk_s32_data, //in
+                mask_data_offset, //mask_ptr
+                q_sum_ptr, //sum_a_ptr
+                k_sum_ptr + n, //sum_b_ptr
+                qBlockSize, //M
+                kvBlockSize, //N
+                rndkvSplitSize, //ldi
+                mStrideM, //ldm
+                rndkvSplitSize, //ldo
+                {{q_zp}} * {{k_zp}} * headSize, //zp_a*zp_b*k=beta
+                {{q_scale}} * {{k_scale}} * scaling_factor, //scale_a*scale_b*scale_sdpa=alpha
+                qk_block_data, //out
+                sfm_max_ptr //sfm_max_ptr
+              );
+{%- else %}
+              {{kernel.kernel_name}}_dequant_max_fusion_kernel(
+                qk_s32_data, //in
+                q_sum_ptr, //sum_a_ptr
+                k_sum_ptr + n, //sum_b_ptr
+                qBlockSize, //M
+                kvBlockSize, //N
+                rndkvSplitSize, //ldi
+                rndkvSplitSize, //ldo
+                {{q_zp}} * {{k_zp}} * headSize, //zp_a*zp_b*k=beta
+                {{q_scale}} * {{k_scale}} * scaling_factor, //scale_a*scale_b*scale_sdpa=alpha
+                qk_block_data, //out
+                sfm_max_ptr //sfm_max_ptr
+              );
+{%- endif %}
+            }
+            // sub max, exp, sum reduce, div sum for softmax
+            // and quant
+            // and sum for attention
+{%- if v_zp == 0 %}
+            {{kernel.kernel_name}}_sub_exp_sum_div_quant_fusion_kernel(
+              qk_data, //in
+              qBlockSize, //M
+              kvSplitSize, //N_step
+              rkvSlice, //NSlices
+              qSplitSize * rndkvSplitSize, //ldi
+              qk_reduce_strideL, //ldo
+              kvSize, //kvSize
+              rndkvSplitSize, //rndkvSplitSize
+              av_gemm_K, //av_gemm_K
+              {{a_zp}}, // zp_a=beta1
+              {{a_scale}}, // scale_a=alpha
+              qk_local_data, //local
+              qk_reduced_data, //out
+              sfm_max_ptr, //sfm_max_ptr
+              sfm_sum_ptr //sfm_sum_ptr
+            );
+{%- else %}
+            {{kernel.kernel_name}}_sub_exp_sum_div_quant_sum_fusion_kernel(
+              qk_data, //in
+              qBlockSize, //M
+              kvSplitSize, //N_step
+              rkvSlice, //NSlice
+              qSplitSize * rndkvSplitSize, //ldi
+              qk_reduce_strideL, //ldo
+              kvSize, //kvSize
+              rndkvSplitSize, //rndkvSplitSize
+              av_gemm_K, //av_gemm_K
+              {{a_zp}}, // zp_a=beta1
+              {{v_zp}}, // zp_b=beta2
+              {{a_scale}}, // scale_a=alpha
+              qk_local_data, //local
+              qk_reduced_data, //out
+              sfm_max_ptr, //sfm_max_ptr
+              sfm_sum_ptr, //sfm_sum_ptr
+              a_sum_ptr //a_sum_ptr
+            );
+{%- endif %}
+            // Calculate Softmax(q @ k.T) @ v
+            for (int64_t b = 0; b < headSize; b += block_64) {
+              auto value_reorder_b = value_reorder_ptr + b * av_gemm_K;
+              auto dst_s32_b = dst_s32_data + b;
+              for (int64_t s = 0; s < kvSlice; s++) {
+                at::native::cpublas::brgemm(
+                    qSplitSize, block_64, av_gemm_K,
+                    av_gemm_K, // lda
+                    rndHeadSize, //ldb
+                    rndHeadSize, //ldc
+                    s != 0,
+                    qk_reduced_data + s * qk_reduce_strideL,
+                    value_reorder_b + s * v_reorder_strideL,
+                    dst_s32_b);
+              }
+            }
+
+            // After the last gemm,
+            // do dequant compensation, quant and convert from s32 to int8
+{%- if a_zp == 0 %}
+          {{kernel.kernel_name}}_dequant_quant_fusion_kernel(
+            dst_s32_data, //in
+            a_sum_ptr, //sum_a_ptr
+            qBlockSize, //M
+            headSize, //N
+            rndHeadSize, //ldi
+            oStrideM, //ldo
+            {{o_zp}}, //zp_c=beta2
+            {{a_scale}} * {{v_scale}} / {{o_scale}}, //scale_a*scale_b/scale_c=alpha
+            out_data + i * oStrideB + j * oStrideH + m * oStrideM //out
+          );
+{%- else %}
+          {{kernel.kernel_name}}_dequant_quant_fusion_kernel(
+            dst_s32_data, //in
+            a_sum_ptr, //sum_a_ptr
+            v_sum_ptr, //sum_b_ptr
+            qBlockSize, //M
+            headSize, //N
+            rndHeadSize, //ldi
+            oStrideM, //ldo
+            {{a_zp}} * {{v_zp}} * kvSize, //zp_a*zp_b*k=beta1
+            {{o_zp}}, //zp_c=beta2
+            {{a_scale}} * {{v_scale}} / {{o_scale}}, //scale_a*scale_b/scale_c=alpha
+            out_data + i * oStrideB + j * oStrideH + m * oStrideM //out
+          );
+{%- endif %}
+          }
+          // Move to the next query
+          at::native::data_index_step(i, batchSize, j, num_head);
+        }
+      });
+  // Once all computations are done, need to release HW context.
+  at::native::cpublas::brgemm_release();
+}
+
+"""
+
+
+INT8_SDPA_SEVERAL_LOOPS_TEMPLATE = r"""
+{{template.header().getvalue()}}
+#include <ATen/ATen.h>
+#include <ATen/AccumulateType.h>
+#include <ATen/Dispatch.h>
+#include <ATen/core/Tensor.h>
+#include <ATen/cpu/vec/functional.h>
+#include <ATen/cpu/vec/vec.h>
+#include <ATen/cpu/Utils.h>
+#include <ATen/native/cpu/utils.h>
+#include <ATen/native/CPUBlas.h>
+#include <ATen/Parallel.h>
+#include <ATen/Tensor.h>
+#include <c10/util/irange.h>
+
+#ifndef AT_PER_OPERATOR_HEADERS
+#include <ATen/Functions.h>
+#else
+#include <ATen/ops/empty.h>
+#endif
+
+#include <ATen/Tensor.h>
+#include <limits>
+#include <torch/all.h>
+#include <torch/csrc/autograd/function.h>
+
+{{template.codegen_useful_function(kernel.kernel_name)}}
+
+{%- if has_attention_mask %}
+{%- set kernel_args = {"query": query, "key": key, "value": value,
+                       "attention_mask": attention_mask} %}
+{%- else %}
+{%- set kernel_args = {"query": query, "key": key, "value": value} %}
+{%- endif %}
+
+// UINT8 - u8u8s32
+extern "C"
+{{kernel.def_kernel(inputs=kernel_args, outputs={"output": output})}}
+{
+  {{ kernel.maybe_codegen_profile() }}
+  int64_t num_thread = {{num_thread}};
+  using accum_t = float;
+  using scalar_t = {{kernel.dtype(query)}};
+  int block_64 = 64;
+  auto u8_dt = at::ScalarType::Byte;
+
+  // Sizes
+  int64_t batchSize = {{kernel.size(query, 0)}};
+  int64_t qSize = {{kernel.size(query, 1)}};
+  int64_t kvSize = {{kernel.size(value, 1)}};
+  int64_t num_head = {{kernel.size(query, 2)}};
+  int64_t headSize = {{kernel.size(query, 3)}};
+  float scaling_factor =
+      {{kernel.kernel_name}}_calculate_scale(headSize, {{scale}});
+
+  // Strides
+  int64_t qStrideB = {{kernel.stride(query, 0)}};
+  int64_t qStrideM = {{kernel.stride(query, 1)}};
+  int64_t qStrideH = {{kernel.stride(query, 2)}};
+  int64_t kStrideB = {{kernel.stride(key, 0)}};
+  int64_t kStrideN = {{kernel.stride(key, 1)}};
+  int64_t kStrideH = {{kernel.stride(key, 2)}};
+  int64_t vStrideB = {{kernel.stride(value, 0)}};
+  int64_t vStrideN = {{kernel.stride(value, 1)}};
+  int64_t vStrideH = {{kernel.stride(value, 2)}};
+  int64_t oStrideB = {{kernel.stride(output, 0)}};
+  int64_t oStrideM = {{kernel.stride(output, 2)}};
+  int64_t oStrideH = {{kernel.stride(output, 1)}};
+
+  int64_t qSplitSize = {{q_split_size}} > qSize ? qSize : {{q_split_size}};
+  int64_t kvSplitSize = {{kv_split_size}} > kvSize ? kvSize : {{kv_split_size}};
+  int64_t qSlice = (qSize - 1) / qSplitSize + 1;
+  int64_t kvSlice = (kvSize - 1) / kvSplitSize + 1;
+  int64_t kvTail = (kvSize - 1) % kvSplitSize + 1;
+
+  int64_t rndHeadSize = (headSize + block_64 - 1L) / block_64 * block_64;
+  int64_t rndkvSplitSize = (kvSplitSize + block_64 - 1L) / block_64 * block_64;
+  int64_t rndkvTail = (kvTail + block_64 - 1L) / block_64 * block_64;
+  int64_t rndkvSize = {{kv_split_size}} > kvSize ? rndkvTail : rndkvSplitSize * kvSlice + rndkvTail;
+
+  bool av_gemm_K_mul4 = kvSplitSize % 4 == 0;
+  int av_gemm_K_padding = av_gemm_K_mul4 ? 0 : 4 - kvSplitSize % 4;
+  int av_gemm_K = kvSplitSize + av_gemm_K_padding;
+
+{%- if has_attention_mask %}
+  // attention mask
+  using mask_t = {{kernel.dtype(attention_mask)}};
+  const mask_t* mask_data = attention_mask;
+  int64_t mStrideB =
+      {{kernel.size(attention_mask, 0)}} > 1
+      ? {{kernel.stride(attention_mask, 0)}}
+      : 0;
+  int64_t mStrideH =
+      {{kernel.size(attention_mask, 1)}} > 1
+      ? {{kernel.stride(attention_mask, 1)}}
+      : 0;
+  int64_t mStrideM =
+      {{kernel.size(attention_mask, 2)}}> 1
+      ? {{kernel.stride(attention_mask, 2)}}
+      : 0;
+  int64_t mStrideN =
+      {{kernel.size(attention_mask, 3)}} > 1
+      ? {{kernel.stride(attention_mask, 3)}}
+      : 0;
+{%- endif %}
+
+  // Data ptrs
+  const scalar_t* q_data = query;
+  const scalar_t* k_data = key;
+  const scalar_t* v_data = value;
+  scalar_t* out_data = output;
+
+  bool headSize_mul64 = headSize % 64 == 0;
+  int qk_gemm_K_padding = headSize_mul64 ? 0 : 64 - headSize % 64;
+  int qk_gemm_K = headSize + qk_gemm_K_padding;
+
+  int64_t qk_reduce_strideL = qSplitSize * av_gemm_K;
+  int64_t v_reorder_strideL = av_gemm_K * rndHeadSize;
+
+  int64_t total_size_uint8_per_thread =
+    /* qk */ kvSlice * qSplitSize * rndkvSplitSize * 4 +
+    /* qk_local  */ kvSlice * av_gemm_K * 4 +
+    /* qk_reduce  */ kvSlice * qk_reduce_strideL +
+    /* qk_s32   */ qSplitSize * rndkvSplitSize * 4 +
+    /* dst_s32  */ qSplitSize * rndHeadSize * 4 +
+    /* softmax_sum   */ qSplitSize * 4 +
+    /* query_sum     */ qSplitSize * 4 +
+    /* attention_sum */ qSplitSize * 4 +
+    /* softmax max */ qSplitSize * 4 +
+    /* query_padding_data */ qSplitSize * qk_gemm_K;
+  {{template.codegen_allocate_buffer("total_buf_data", "scalar_t", "num_thread * total_size_uint8_per_thread")}}
+
+  int64_t kv_sum_size_per_BH =
+    /* key_sum */ kvSize +
+    /* value_sum */ headSize;
+  {{template.codegen_allocate_buffer("kv_sum_buf_data", "int32_t", "batchSize * num_head * kv_sum_size_per_BH")}}
+
+  int64_t kv_reorder_size_per_BH =
+    /* key_t_reorder */ qk_gemm_K * rndkvSize +
+    /* value_t_reorder */ kvSlice * v_reorder_strideL;
+  {{template.codegen_allocate_buffer("kv_reorder_buf_data", "scalar_t", "batchSize * num_head * kv_reorder_size_per_BH")}}
+  scalar_t* key_reorder_ptr = kv_reorder_buf_data;
+  scalar_t* value_reorder_ptr = kv_reorder_buf_data + batchSize * num_head * qk_gemm_K * rndkvSize;
+
+  // sum k and v
+  at::parallel_for(
+      0, batchSize * num_head, 1, [&](int64_t begin, int64_t end) {
+        int64_t i = 0, j = 0;
+        at::native::data_index_init(
+            begin, i, batchSize, j, num_head);
+        for (const auto z : c10::irange(begin, end)) {
+          (void)z; // Suppress unused variable
+          int32_t* kv_sum_ptr = kv_sum_buf_data
+              + i * num_head * kv_sum_size_per_BH
+              + j * kv_sum_size_per_BH;
+          int32_t* k_sum_ptr = kv_sum_ptr;
+          int32_t* v_sum_ptr = kv_sum_ptr + kvSize;
+{%- if q_zp == 0 %}
+          {{kernel.kernel_name}}_fill_stub(k_sum_ptr, static_cast<int32_t>(0), kvSize);
+{%- else %}
+          {{kernel.kernel_name}}_int_sum_b_contiguous_kernel(k_data + i * kStrideB + j * kStrideH,
+            k_sum_ptr,
+            kvSize, headSize, kStrideN, {{q_zp}});
+{%- endif %}
+{%- if a_zp == 0 %}
+          {{kernel.kernel_name}}_fill_stub(v_sum_ptr, static_cast<int32_t>(0), headSize);
+{%- else %}
+          {{kernel.kernel_name}}_int_sum_a_contiguous_kernel(v_data + i * vStrideB + j * vStrideH,
+            v_sum_ptr,
+            headSize, kvSize, vStrideN, {{a_zp}});
+{%- endif %}
+        // Move to the next query
+        at::native::data_index_step(i, batchSize, j, num_head);
+      }
+    });
+
+  // packing
+  at::parallel_for(
+    0, batchSize * num_head * kvSlice, 1, [&](int64_t begin, int64_t end) {
+      int64_t i = 0, j = 0, l = 0, n = 0;
+      at::native::data_index_init(
+          begin, i, batchSize, j, num_head, l, kvSlice);
+      uint8_t* B_blocked_xform_u8 = new uint8_t[qk_gemm_K * block_64];
+      for (const auto z : c10::irange(begin, end)) {
+        (void)z; // Suppress unused variable
+        n = l * kvSplitSize;
+        auto k_reorder = key_reorder_ptr + i * num_head * qk_gemm_K * rndkvSize +
+                      j * qk_gemm_K * rndkvSize + n * qk_gemm_K;
+        auto v_reorder = value_reorder_ptr +
+                      i * num_head * kvSlice * v_reorder_strideL +
+                      j * kvSlice * v_reorder_strideL + n * rndHeadSize;
+        int64_t kvBlockSize = std::min(kvSplitSize, kvSize - n);
+        for (int64_t b = 0; b < kvBlockSize; b += block_64) {
+          bool istail = kvBlockSize - b < block_64;
+          int64_t trans_rows = istail ? kvBlockSize - b : block_64;
+          {{kernel.kernel_name}}_do_transpose(
+              k_data + i * kStrideB + j * kStrideH + n * kStrideN + b * kStrideN,
+              B_blocked_xform_u8,
+              trans_rows,
+              headSize,
+              kStrideN,
+              block_64);
+          if (!headSize_mul64 || istail) {
+            {{kernel.kernel_name}}_pad_remain_row_col(
+                B_blocked_xform_u8,
+                headSize,
+                trans_rows,
+                qk_gemm_K,
+                block_64,
+                block_64
+              );
+          }
+          at::native::cpublas::pack(
+                  qk_gemm_K, // K
+                  block_64, // N
+                  block_64, // ld_in
+                  block_64, // ld_out
+                  u8_dt, // dt_in
+                  u8_dt, // dt_out
+                  B_blocked_xform_u8,
+                  k_reorder + b * qk_gemm_K);
+        }
+        // split headSize to block_64, block_64, block_64 ...
+        // [av_gemm_K, headSize] -> [av_gemm_K,  block_64 ...]
+        for (int64_t b = 0; b < rndHeadSize; b += block_64) {
+          at::native::cpublas::pack(
+                  av_gemm_K,
+                  block_64,
+                  vStrideN, // block_64,
+                  block_64,
+                  u8_dt,
+                  u8_dt,
+                  v_data + i * vStrideB + j * vStrideH + n * vStrideN + b,
+                  v_reorder + av_gemm_K * b);
+        }
+        // Move to the next query
+        at::native::data_index_step(i, batchSize, j, num_head, l, kvSlice);
+      }
+    });
+
+  at::parallel_for(
+      0, batchSize * num_head * qSlice, 1, [&](int64_t begin, int64_t end) {
+        int64_t i = 0, j = 0, k = 0;
+        at::native::data_index_init(
+            begin, i, batchSize, j, num_head, k, qSlice);
+        int ompIdx = at::get_thread_num();
+        scalar_t* total_buf_ptr = total_buf_data + ompIdx * total_size_uint8_per_thread;
+        int32_t offset = 0;
+        accum_t* qk_data = reinterpret_cast<accum_t*>(total_buf_ptr);
+        offset += kvSlice * qSplitSize * rndkvSplitSize * 4;
+        accum_t* qk_local_data = reinterpret_cast<accum_t*>(total_buf_ptr + offset);
+        offset += kvSlice * av_gemm_K * 4;
+        scalar_t* qk_reduced_data = reinterpret_cast<scalar_t*>(total_buf_ptr + offset);
+        offset += kvSlice * qk_reduce_strideL;
+        int32_t* qk_s32_data = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * rndkvSplitSize * 4;
+        int32_t* dst_s32_data = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * rndHeadSize * 4;
+        accum_t* sfm_sum_ptr = reinterpret_cast<accum_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        int32_t* q_sum_ptr = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        int32_t* a_sum_ptr = reinterpret_cast<int32_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        accum_t* sfm_max_ptr = reinterpret_cast<accum_t*>(total_buf_ptr + offset);
+        offset += qSplitSize * 4;
+        scalar_t* query_t_padding_ptr = reinterpret_cast<scalar_t*>(total_buf_ptr + offset);
+
+        for (const auto z : c10::irange(begin, end)) {
+          (void)z; // Suppress unused variable
+
+          int32_t* kv_sum_ptr = kv_sum_buf_data
+              + i * num_head * kv_sum_size_per_BH
+              + j * kv_sum_size_per_BH;
+          int32_t* k_sum_ptr = kv_sum_ptr;
+          int32_t* v_sum_ptr = kv_sum_ptr + kvSize;
+
+          // sdpa core
+          int64_t m = k * qSplitSize;
+          int64_t qBlockSize = std::min(qSplitSize, qSize - m);
+          // Initialize sum and max
+          {{kernel.kernel_name}}_fill_stub(
+              sfm_sum_ptr, static_cast<accum_t>(0), qSplitSize);
+          {{kernel.kernel_name}}_fill_stub(
+              a_sum_ptr, static_cast<int32_t>(0), qSplitSize);
+          {{kernel.kernel_name}}_fill_stub(
+              sfm_max_ptr, static_cast<accum_t>(-std::numeric_limits<accum_t>::infinity()), qSplitSize);
+          int64_t num_keys = kvSize;
+          {{kernel.kernel_name}}_copy_value_with_pad(
+              q_data + i * qStrideB + j * qStrideH + m * qStrideM,
+              query_t_padding_ptr,
+              qBlockSize,
+              headSize,
+              qBlockSize,
+              qk_gemm_K,
+              qStrideM);
+          // sum q
+{%- if k_zp != 0 %}
+          {{kernel.kernel_name}}_int_sum_b_contiguous_kernel(q_data + i * qStrideB + j * qStrideH + m * qStrideM,
+                q_sum_ptr, qBlockSize, headSize, qStrideM, {{k_zp}});
+{%- else %}
+          {{kernel.kernel_name}}_fill_stub(
+            q_sum_ptr, static_cast<int32_t>(0), qSplitSize);
+{%- endif %}
+          const int64_t rkvSlice = (num_keys - 1) / kvSplitSize + 1;
+          for (int64_t l = 0; l < rkvSlice; l++) {
+            int64_t n = l * kvSplitSize;
+            int64_t kvBlockSize = std::min(kvSplitSize, kvSize - n);
+            auto k_reorder = key_reorder_ptr + i * num_head * qk_gemm_K * rndkvSize +
+                      j * qk_gemm_K * rndkvSize + n * qk_gemm_K;
+            // Calculate q @ k.T
+            for (int64_t b = 0; b < kvBlockSize; b += block_64) {
+              at::native::cpublas::brgemm(
+                    qSplitSize, block_64, qk_gemm_K,
+                    qk_gemm_K, // lda
+                    block_64, //ldb
+                    rndkvSplitSize, //ldc,
+                    false,
+                    query_t_padding_ptr,
+                    k_reorder + b * qk_gemm_K,
+                    qk_s32_data + b);
+            }
+
+            // do dequant compensation, add mask, max reduce for softmax, and convert qk from s32 to fp32
+            accum_t* qk_block_data = qk_data + l * qSplitSize * rndkvSplitSize;
+{%- if has_attention_mask %}
+            const mask_t* mask_data_offset = mask_data + i * mStrideB + j * mStrideH + m * mStrideM + (mStrideN == 0 ? 0 : n);
+            {{kernel.kernel_name}}_dequant_mask_max_fusion_kernel(
+              qk_s32_data, //in
+              mask_data_offset, //mask_ptr
+              q_sum_ptr, //sum_a_ptr
+              k_sum_ptr + n, //sum_b_ptr
+              qBlockSize, //M
+              kvBlockSize, //N
+              rndkvSplitSize, //ldi
+              mStrideM, //ldm
+              rndkvSplitSize, //ldo
+              {{q_zp}} * {{k_zp}} * headSize, //zp_a*zp_b*k=beta
+              {{q_scale}} * {{k_scale}} * scaling_factor, //scale_a*scale_b*scale_sdpa=alpha
+              qk_block_data, //out
+              sfm_max_ptr //sfm_max_ptr
+            );
+{%- else %}
+            {{kernel.kernel_name}}_dequant_max_fusion_kernel(
+              qk_s32_data, //in
+              q_sum_ptr, //sum_a_ptr
+              k_sum_ptr + n, //sum_b_ptr
+              qBlockSize, //M
+              kvBlockSize, //N
+              rndkvSplitSize, //ldi
+              rndkvSplitSize,//kvBlockSize, //ldo
+              {{q_zp}} * {{k_zp}} * headSize, //zp_a*zp_b*k=beta
+              {{q_scale}} * {{k_scale}} * scaling_factor, //scale_a*scale_b*scale_sdpa=alpha
+              qk_block_data, //out
+              sfm_max_ptr //sfm_max_ptr
+            );
+{%- endif %}
+          }
+          // sub max, exp, sum reduce, div sum for softmax
+          // and quant
+          // and sum for attention
+{%- if v_zp == 0 %}
+          {{kernel.kernel_name}}_sub_exp_sum_div_quant_fusion_kernel(
+            qk_data, //in
+            qBlockSize, //M
+            kvSplitSize, //N_step
+            rkvSlice, //NSlices
+            qSplitSize * rndkvSplitSize, //ldi
+            qk_reduce_strideL, //ldo
+            kvSize, //kvSize
+            rndkvSplitSize, //rndkvSplitSize
+            av_gemm_K, //av_gemm_K
+            {{a_zp}}, // zp_a=beta1
+            {{a_scale}}, // scale_a=alpha
+            qk_local_data, //local
+            qk_reduced_data, //out
+            sfm_max_ptr, //sfm_max_ptr
+            sfm_sum_ptr //sfm_sum_ptr
+          );
+{%- else %}
+          {{kernel.kernel_name}}_sub_exp_sum_div_quant_sum_fusion_kernel(
+            qk_data, //in
+            qBlockSize, //M
+            kvSplitSize, //N_step
+            rkvSlice, //NSlice
+            qSplitSize * rndkvSplitSize, //ldi
+            qk_reduce_strideL, //ldo
+            kvSize, //kvSize
+            rndkvSplitSize, //rndkvSplitSize
+            av_gemm_K, //av_gemm_K
+            {{a_zp}}, // zp_a=beta1
+            {{v_zp}}, // zp_b=beta2
+            {{a_scale}}, // scale_a=alpha
+            qk_local_data, //local
+            qk_reduced_data, //out
+            sfm_max_ptr, //sfm_max_ptr
+            sfm_sum_ptr, //sfm_sum_ptr
+            a_sum_ptr //a_sum_ptr
+          );
+{%- endif %}
+          // Calculate Softmax(q @ k.T) @ v
+          auto v_reorder = value_reorder_ptr +
+                  i * num_head * kvSlice * v_reorder_strideL +
+                  j * kvSlice * v_reorder_strideL;
+          for (int64_t b = 0; b < headSize; b += block_64) {
+            auto value_reorder_b = v_reorder + b * av_gemm_K;
+            auto dst_s32_b = dst_s32_data + b;
+            for (int64_t s = 0; s < kvSlice; s++) {
+              at::native::cpublas::brgemm(
+                  qSplitSize, block_64, av_gemm_K,
+                  av_gemm_K, // lda
+                  rndHeadSize, //ldb
+                  rndHeadSize, //ldc
+                  s != 0,
+                  qk_reduced_data + s * qk_reduce_strideL,
+                  value_reorder_b + s * v_reorder_strideL,
+                  dst_s32_b);
+            }
+          }
+
+          // After the last gemm,
+          // do dequant compensation, quant and convert from s32 to int8
+{%- if a_zp == 0 %}
+          {{kernel.kernel_name}}_dequant_quant_fusion_kernel(
+            dst_s32_data, //in
+            a_sum_ptr, //sum_a_ptr
+            qBlockSize, //M
+            headSize, //N
+            rndHeadSize, //ldi
+            oStrideM, //ldo
+            {{o_zp}}, //zp_c=beta2
+            {{a_scale}} * {{v_scale}} / {{o_scale}}, //scale_a*scale_b/scale_c=alpha
+            out_data + i * oStrideB + j * oStrideH + m * oStrideM //out
+          );
+{%- else %}
+          {{kernel.kernel_name}}_dequant_quant_fusion_kernel(
+            dst_s32_data, //in
+            a_sum_ptr, //sum_a_ptr
+            v_sum_ptr, //sum_b_ptr
+            qBlockSize, //M
+            headSize, //N
+            rndHeadSize, //ldi
+            oStrideM, //ldo
+            {{a_zp}} * {{v_zp}} * kvSize, //zp_a*zp_b*k=beta1
+            {{o_zp}}, //zp_c=beta2
+            {{a_scale}} * {{v_scale}} / {{o_scale}}, //scale_a*scale_b/scale_c=alpha
+            out_data + i * oStrideB + j * oStrideH + m * oStrideM //out
+          );
+{%- endif %}
+          // Move to the next query
+          at::native::data_index_step(i, batchSize, j, num_head, k, qSlice);
+        }
+      });
+  // Once all computations are done, need to release HW context.
+  at::native::cpublas::brgemm_release();
+}
+"""
+
+
+class CppInt8SdpaTemplate(CppFlexAttentionTemplate):
+    def __init__(
+        self,
+        input_nodes,
+        layout: ir.Layout,
+        scale,
+        q_scale,
+        q_zp,
+        k_scale,
+        k_zp,
+        v_scale,
+        v_zp,
+        a_scale,
+        a_zp,
+        o_scale,
+        o_zp,
+    ) -> None:
+        assert layout.dtype in [torch.uint8]
+        CppTemplate.__init__(
+            self, "int8_sdpa", input_nodes, layout, parallel_num_threads()
+        )
+        self.scale = scale
+        self.q_scale = q_scale
+        self.q_zp = q_zp
+        self.k_scale = k_scale
+        self.k_zp = k_zp
+        self.v_scale = v_scale
+        self.v_zp = v_zp
+        self.a_scale = a_scale
+        self.a_zp = a_zp
+        self.o_scale = o_scale
+        self.o_zp = o_zp
+
+    @staticmethod
+    def add_choices(
+        choices,
+        input_nodes,
+        layout,
+        scale,
+        q_scale,
+        q_zp,
+        k_scale,
+        k_zp,
+        v_scale,
+        v_zp,
+        a_scale,
+        a_zp,
+        o_scale,
+        o_zp,
+    ):
+        def preprocessor(input_nodes, layout):
+            return input_nodes, layout
+
+        def postprocessor(output):
+            return output
+
+        template = DataProcessorTemplateWrapper(
+            CppInt8SdpaTemplate,
+            preprocessor,
+            postprocessor,
+            input_nodes=input_nodes,
+            layout=layout,
+            scale=scale,
+            q_scale=q_scale,
+            q_zp=q_zp,
+            k_scale=k_scale,
+            k_zp=k_zp,
+            v_scale=v_scale,
+            v_zp=v_zp,
+            a_scale=a_scale,
+            a_zp=a_zp,
+            o_scale=o_scale,
+            o_zp=o_zp,
+        )
+        template.maybe_append_choice(choices)
+        return template
+
+    def reshape_attn_mask_to_4d(
+        self,
+        kernel,
+        attn_mask: ir.Buffer,
+        batchSize,
+        num_head,
+        qSize,
+        kvSize,
+    ):
+        # Support mask shapes:
+        # 2d: ({Q_seq_len, 1}  x {KV_seq_len, 1})
+        # 4d: ({Batch, 1} x {Num_heads, 1} x {Q_seq_len, 1}  x {KV_seq_len, 1})
+        # Guaranteed in check_attn_mask_shape
+        attn_mask_size_0 = 1
+        attn_mask_size_1 = 1
+        layout = attn_mask.get_layout()
+        if len(layout.size) == 4:
+            if layout.size[0] == batchSize:
+                attn_mask_size_0 = batchSize
+            if layout.size[1] == num_head:
+                attn_mask_size_1 = num_head
+        attn_mask = kernel.view(
+            attn_mask,
+            [
+                attn_mask_size_0,
+                attn_mask_size_1,
+                layout.size[-2],
+                layout.size[-1],
+            ],
+        )
+        attn_mask = expand(
+            attn_mask, [attn_mask_size_0, attn_mask_size_1, qSize, kvSize]
+        )
+        return attn_mask
+
+    def get_options(
+        self,
+        query: ir.Buffer,
+        key: ir.Buffer,
+        value: ir.Buffer,
+        qSize,
+        kvSize,
+        headSize,
+        batchSize,
+        num_head,
+        num_threads,
+    ):
+        q_split_size = 32
+        if qSize >= 768:
+            q_split_size = 256
+        elif qSize >= 192:
+            q_split_size = 64
+        kv_split_size = 64
+
+        qSplitSize = min(qSize, q_split_size)
+        l2_cache_size = torch._C._cpu._L2_cache_size()
+        attn_size = qSplitSize * kvSize * 4 * num_threads
+        use_one_parallel_loop = True
+        if all(
+            sympify(val).is_number
+            for val in [batchSize, num_head, num_threads, attn_size, l2_cache_size]
+        ):
+            # if not symbolic shape
+            use_one_parallel_loop = (batchSize * num_head > num_threads) and (
+                attn_size > 1.5 * l2_cache_size
+            )
+
+        options = dict(
+            q_split_size=q_split_size,
+            kv_split_size=kv_split_size,
+            use_one_parallel_loop=use_one_parallel_loop,
+        )
+        return options
+
+    def render(  # type: ignore[override,return]
+        self,
+        kernel,
+        template_buffer_node: Optional[ir.CppTemplateBuffer] = None,
+        epilogue_nodes: Optional[List[ir.IRNode]] = None,
+        **kwargs,
+    ) -> str:
+        if epilogue_nodes is not None and epilogue_nodes != []:
+            raise NotImplementedError(
+                "Unsupported for `epilogue_nodes` in CppInt8SdpaTemplate."
+            )
+        # Query (Batch x Num_heads  x Q_seq_len  x Dim_per_head)
+        #     -> (Batch x Q_seq_len  x Num_heads  x Dim_per_head)
+        #  Key   (Batch x Num_heads  x KV_seq_len x Dim_per_head)
+        #     -> (Batch x KV_seq_len x Num_heads  x Dim_per_head)
+        #  Value (Batch x Num_heads  x KV_seq_len x Dim_per_head)
+        #     -> (Batch x KV_seq_len x Num_heads  x Dim_per_head)
+
+        query = kernel.permute(self.input_nodes[0], [0, 2, 1, 3])
+        key = kernel.permute(self.input_nodes[1], [0, 2, 1, 3])
+        value = kernel.permute(self.input_nodes[2], [0, 2, 1, 3])
+
+        batchSize = query.layout.size[0]
+        qSize = query.layout.size[1]
+        kvSize = value.layout.size[1]
+        num_head = query.layout.size[2]
+        headSize = query.layout.size[3]
+
+        has_attention_mask = len(self.input_nodes) == 4
+        attention_mask = (
+            self.reshape_attn_mask_to_4d(
+                kernel, self.input_nodes[3], batchSize, num_head, qSize, kvSize
+            )
+            if has_attention_mask
+            else None
+        )
+
+        num_threads = parallel_num_threads()
+        buf_out = TensorBox.create(self.output_node)
+        if template_buffer_node is not None:
+            buf_out = template_buffer_node
+        options = dict(
+            query=query,
+            key=key,
+            value=value,
+            has_attention_mask=has_attention_mask,
+            attention_mask=attention_mask,
+            scale=self.scale,
+            q_scale=self.q_scale,
+            q_zp=self.q_zp,
+            k_scale=self.k_scale,
+            k_zp=self.k_zp,
+            v_scale=self.v_scale,
+            v_zp=self.v_zp,
+            a_scale=self.a_scale,
+            a_zp=self.a_zp,
+            o_scale=self.o_scale,
+            o_zp=self.o_zp,
+            template=self,
+            output=buf_out,
+            kernel=kernel,
+            num_thread=num_threads,
+        )
+        new_options = self.get_options(
+            query=query,
+            key=key,
+            value=value,
+            qSize=qSize,
+            kvSize=kvSize,
+            headSize=headSize,
+            batchSize=batchSize,
+            num_head=num_head,
+            num_threads=num_threads,
+        )
+        options.update(new_options)
+        INT8_SDPA_TEMPLATE = (
+            INT8_SDPA_ONE_LOOP_TEMPLATE
+            if options["use_one_parallel_loop"]
+            else INT8_SDPA_SEVERAL_LOOPS_TEMPLATE
+        )
+        return self._template_from_string(INT8_SDPA_TEMPLATE).render(**options)
+
+    def codegen_useful_function(self, kernel_name: str):
+        return self._template_from_string(USEFUL_FUNCTIONS).render(
+            dict(kernel_name=kernel_name)
+        )
+
+    def codegen_allocate_buffer(self, buffer_name: str, buffer_dtype, buffer_size):
+        return self._template_from_string(ALLOCATE_BUFFER).render(
+            dict(
+                buffer_name=buffer_name,
+                buffer_dtype=buffer_dtype,
+                buffer_size=buffer_size,
+            )
+        )
diff --git a/torchao/prototype/inductor/codegen/utils.py b/torchao/prototype/inductor/codegen/utils.py
new file mode 100644
index 0000000000..bfbf455257
--- /dev/null
+++ b/torchao/prototype/inductor/codegen/utils.py
@@ -0,0 +1,13 @@
+from typing import Any, List
+
+from torch._inductor import lowering as L
+from torch._inductor.codegen.cpp_template_kernel import (
+    parse_expr_with_index_symbols,
+    wrap_with_tensorbox,
+)
+
+
+def expand(node, sizes: List[Any]):
+    node = wrap_with_tensorbox(node)
+    sizes = parse_expr_with_index_symbols(sizes)
+    return L.expand(node, sizes).data
diff --git a/torchao/prototype/inductor/fx_passes/int8_sdpa_fusion.py b/torchao/prototype/inductor/fx_passes/int8_sdpa_fusion.py
index cfe0d309b1..5e032f01c2 100644
--- a/torchao/prototype/inductor/fx_passes/int8_sdpa_fusion.py
+++ b/torchao/prototype/inductor/fx_passes/int8_sdpa_fusion.py
@@ -17,12 +17,16 @@
 
 from torchao.utils import TORCH_VERSION_AT_LEAST_2_7
 
+if TORCH_VERSION_AT_LEAST_2_7:
+    # TORCH_VERSION_AT_LEAST_2_7 is needed for functions in int8 sdpa lowering
+    from ..int8_sdpa_lowering import register_int8_sdpa  # noqa: F401
+else:
+    make_fallback(torch.ops.torchao.qscaled_dot_product.default)
+
 __all__ = [
     "_int8_sdpa_init",
 ]
 
-make_fallback(torch.ops.torchao.qscaled_dot_product.default)
-
 aten = torch.ops.aten
 
 
@@ -52,7 +56,7 @@ def int8_sdpa(match: Match, *args, **kwargs):
         query = kwargs["query"]
         key = kwargs["key"]
         value = kwargs["value"]
-        inv_scale = kwargs["inv_scale"]
+        scale = 1.0 / kwargs["inv_scale"] if "inv_scale" in kwargs else None
         attn_mask = kwargs["attn_mask"] if "attn_mask" in kwargs else None
         q_scale = kwargs["q_scale"]
         q_zp = kwargs["q_zp"]
@@ -77,7 +81,7 @@ def int8_sdpa(match: Match, *args, **kwargs):
             attn_mask,
             0.0,  # dropout
             False,  # is_causal
-            1.0 / inv_scale,  # scale
+            scale,  # scale
             q_scale,
             q_zp,
             k_scale,
diff --git a/torchao/prototype/inductor/int8_sdpa_lowering.py b/torchao/prototype/inductor/int8_sdpa_lowering.py
new file mode 100644
index 0000000000..4fbff51c32
--- /dev/null
+++ b/torchao/prototype/inductor/int8_sdpa_lowering.py
@@ -0,0 +1,140 @@
+from typing import Optional
+
+import sympy
+import torch
+from torch._inductor.ir import ChoiceCaller, FixedLayout, TensorBox, get_fill_order
+from torch._inductor.kernel.flex_attention import construct_strides, maybe_realize
+from torch._inductor.lowering import register_lowering
+from torch._inductor.select_algorithm import (
+    ExternKernelChoice,
+    autotune_select_algorithm,
+)
+
+from .codegen.cpp_int8_sdpa_template import CppInt8SdpaTemplate
+
+op_int8_sdpa = ExternKernelChoice(
+    torch.ops.torchao.qscaled_dot_product.default,
+    "torchao::qscaled_dot_product",
+    has_out_variant=False,
+    use_fallback_kernel=True,
+    op_overload=torch.ops.torchao.qscaled_dot_product.default,
+)
+
+
+def register_int8_sdpa():
+    @register_lowering(
+        torch.ops.torchao.qscaled_dot_product.default, type_promotion_kind=None
+    )
+    def int8_sdpa(
+        query: TensorBox,
+        key: TensorBox,
+        value: TensorBox,
+        attn_mask: Optional[TensorBox],
+        dropout: float,
+        is_causal: bool,
+        scale: Optional[float] = None,
+        q_scale: Optional[float] = 1.0,
+        q_zp: Optional[int] = 0,
+        k_scale: Optional[float] = 1.0,
+        k_zp: Optional[int] = 0,
+        v_scale: Optional[float] = 1.0,
+        v_zp: Optional[int] = 0,
+        a_scale: Optional[float] = 1.0,
+        a_zp: Optional[int] = 0,
+        o_scale: Optional[float] = 1.0,
+        o_zp: Optional[int] = 0,
+    ) -> TensorBox:
+        choices: list[ChoiceCaller] = []
+
+        (
+            query,
+            key,
+            value,
+            attn_mask,
+        ) = maybe_realize(
+            [
+                query,
+                key,
+                value,
+                attn_mask,
+            ]
+        )
+
+        if (
+            query.get_dtype() is not torch.uint8
+            or key.get_dtype() is not torch.uint8
+            or value.get_dtype() is not torch.uint8
+        ):
+            raise NotImplementedError(
+                "Only `torch.uint8` is supported in Int8 SDPA template for CPU device. "
+                f"Found input tensors are `{query.get_dtype()}`,`{key.get_dtype()}`,`{value.get_dtype()}`."
+            )
+
+        # Construct output layout with strides matching the query.
+        out_size = query.get_size()
+        fill_order = get_fill_order(query.get_stride())
+        out_strides = construct_strides(out_size, fill_order)
+
+        layout = FixedLayout(
+            query.get_device(),
+            query.get_dtype(),
+            out_size,
+            stride=[sympy.sympify(s) for s in out_strides],
+        )
+        input_nodes = [query, key, value]
+        if attn_mask is not None:
+            input_nodes.append(attn_mask)
+
+        # use template if machine has amx
+        if torch._C._cpu._is_amx_tile_supported():
+            CppInt8SdpaTemplate.add_choices(
+                choices=choices,
+                input_nodes=input_nodes,
+                layout=layout,
+                scale=scale,
+                q_scale=q_scale,
+                q_zp=q_zp,
+                k_scale=k_scale,
+                k_zp=k_zp,
+                v_scale=v_scale,
+                v_zp=v_zp,
+                a_scale=a_scale,
+                a_zp=a_zp,
+                o_scale=o_scale,
+                o_zp=o_zp,
+            )
+
+        if len(choices) == 0:
+            choices.append(
+                op_int8_sdpa.bind(
+                    input_nodes=input_nodes,
+                    layout=layout,
+                    scale=scale,
+                    q_scale=q_scale,
+                    q_zp=q_zp,
+                    k_scale=k_scale,
+                    k_zp=k_zp,
+                    v_scale=v_scale,
+                    v_zp=v_zp,
+                    a_scale=a_scale,
+                    a_zp=a_zp,
+                    o_scale=o_scale,
+                    o_zp=o_zp,
+                )
+            )
+
+        inputs_for_autotuning = [
+            query,
+            key,
+            value,
+        ]
+
+        return autotune_select_algorithm(
+            "int8_sdpa",
+            choices,
+            inputs_for_autotuning,
+            layout,
+        )
+
+
+register_int8_sdpa()

From 63f2e51bf034786a84259fe39e2e743285f51dda Mon Sep 17 00:00:00 2001
From: Jeff Daily <jeff.daily@amd.com>
Date: Tue, 27 May 2025 20:20:15 -0700
Subject: [PATCH 054/165] [reland2][ROCm] preshuffled weight mm (#2207)

* [reland2][ROCm] preshuffled weight mm

* remove debug print statements

* remove duplicate registrations caused by patch fuzzing

* lint

* ruff
---
 setup.py                              | 115 ++--
 test/test_ops.py                      |  44 +-
 torchao/__init__.py                   |   3 +-
 torchao/csrc/rocm/swizzle/swizzle.cpp | 911 ++++++++++++++++++++++++++
 torchao/swizzle/__init__.py           |   9 +
 torchao/swizzle/swizzle_tensor.py     | 143 ++++
 6 files changed, 1173 insertions(+), 52 deletions(-)
 create mode 100644 torchao/csrc/rocm/swizzle/swizzle.cpp
 create mode 100644 torchao/swizzle/__init__.py
 create mode 100644 torchao/swizzle/swizzle_tensor.py

diff --git a/setup.py b/setup.py
index 0915f6ae1e..ff4d7fffb5 100644
--- a/setup.py
+++ b/setup.py
@@ -83,8 +83,6 @@ def use_debug_mode():
     _get_cuda_arch_flags,
 )
 
-IS_ROCM = (torch.version.hip is not None) and (ROCM_HOME is not None)
-
 
 class BuildOptions:
     def __init__(self):
@@ -280,30 +278,35 @@ def get_extensions():
     if debug_mode:
         print("Compiling in debug mode")
 
-    if not torch.version.cuda:
-        print(
-            "PyTorch GPU support is not available. Skipping compilation of CUDA extensions"
-        )
-    if (CUDA_HOME is None and ROCM_HOME is None) and torch.version.cuda:
-        print(
-            "CUDA toolkit or ROCm is not available. Skipping compilation of CUDA extensions"
-        )
+    if CUDA_HOME is None and torch.version.cuda:
+        print("CUDA toolkit is not available. Skipping compilation of CUDA extensions")
         print(
             "If you'd like to compile CUDA extensions locally please install the cudatoolkit from https://anaconda.org/nvidia/cuda-toolkit"
         )
-
-    use_cuda = torch.version.cuda and (CUDA_HOME is not None or ROCM_HOME is not None)
-    extension = CUDAExtension if use_cuda else CppExtension
+    if ROCM_HOME is None and torch.version.hip:
+        print("ROCm is not available. Skipping compilation of ROCm extensions")
+        print("If you'd like to compile ROCm extensions locally please install ROCm")
+
+    use_cuda = torch.version.cuda and CUDA_HOME is not None
+    use_rocm = torch.version.hip and ROCM_HOME is not None
+    extension = CUDAExtension if (use_cuda or use_rocm) else CppExtension
+
+    nvcc_args = [
+        "-DNDEBUG" if not debug_mode else "-DDEBUG",
+        "-O3" if not debug_mode else "-O0",
+        "-t=0",
+        "-std=c++17",
+    ]
+    rocm_args = [
+        "-DNDEBUG" if not debug_mode else "-DDEBUG",
+        "-O3" if not debug_mode else "-O0",
+        "-std=c++17",
+    ]
 
     extra_link_args = []
     extra_compile_args = {
         "cxx": [f"-DPy_LIMITED_API={PY3_9_HEXCODE}"],
-        "nvcc": [
-            "-DNDEBUG" if not debug_mode else "-DDEBUG",
-            "-O3" if not debug_mode else "-O0",
-            "-t=0",
-            "-std=c++17",
-        ],
+        "nvcc": nvcc_args if use_cuda else rocm_args,
     }
 
     if not IS_WINDOWS:
@@ -341,6 +344,34 @@ def get_extensions():
             extra_compile_args["nvcc"].append("-g")
             extra_link_args.append("/DEBUG")
 
+    rocm_sparse_marlin_supported = False
+    if use_rocm:
+        # naive search for hipblalst.h, if any found contain HIPBLASLT_ORDER_COL16 and VEC_EXT
+        found_col16 = False
+        found_vec_ext = False
+        print("ROCM_HOME", ROCM_HOME)
+        hipblaslt_headers = list(
+            glob.glob(os.path.join(ROCM_HOME, "include", "hipblaslt", "hipblaslt.h"))
+        )
+        print("hipblaslt_headers", hipblaslt_headers)
+        for header in hipblaslt_headers:
+            with open(header) as f:
+                text = f.read()
+                if "HIPBLASLT_ORDER_COL16" in text:
+                    found_col16 = True
+                if "HIPBLASLT_MATMUL_DESC_A_SCALE_POINTER_VEC_EXT" in text:
+                    found_vec_ext = True
+        if found_col16:
+            extra_compile_args["cxx"].append("-DHIPBLASLT_HAS_ORDER_COL16")
+            print("hipblaslt found extended col order enums")
+        else:
+            print("hipblaslt does not have extended col order enums")
+        if found_vec_ext:
+            extra_compile_args["cxx"].append("-DHIPBLASLT_VEC_EXT")
+            print("hipblaslt found vec ext")
+        else:
+            print("hipblaslt does not have vec ext")
+
     # Get base directory and source paths
     curdir = os.path.dirname(os.path.curdir)
     extensions_dir = os.path.join(curdir, "torchao", "csrc")
@@ -354,42 +385,46 @@ def get_extensions():
         )
         sources = [s for s in sources if s not in excluded_sources]
 
+    # Collect CUDA source files
     extensions_cuda_dir = os.path.join(extensions_dir, "cuda")
     cuda_sources = list(
         glob.glob(os.path.join(extensions_cuda_dir, "**/*.cu"), recursive=True)
     )
 
-    # Define HIP source directories
-    hip_source_dirs = [
+    # Define ROCm source directories
+    rocm_source_dirs = [
+        os.path.join(extensions_dir, "rocm", "swizzle"),
         os.path.join(extensions_dir, "cuda", "tensor_core_tiled_layout"),
-        # TODO: Add sparse_marlin back in once we have a ROCm build for it
-        # os.path.join(extensions_dir, "cuda", "sparse_marlin")
     ]
-
-    # Collect all HIP sources from the defined directories
-    hip_sources = []
-    for hip_dir in hip_source_dirs:
-        hip_sources.extend(glob.glob(os.path.join(hip_dir, "*.cu"), recursive=True))
-
-    # Collect CUDA source files if needed
-    if not IS_ROCM and use_cuda:
+    if rocm_sparse_marlin_supported:
+        rocm_source_dirs.extend([os.path.join(extensions_dir, "cuda", "sparse_marlin")])
+
+    # Collect all ROCm sources from the defined directories
+    rocm_sources = []
+    for rocm_dir in rocm_source_dirs:
+        rocm_sources.extend(glob.glob(os.path.join(rocm_dir, "*.cu"), recursive=True))
+        rocm_sources.extend(glob.glob(os.path.join(rocm_dir, "*.hip"), recursive=True))
+        rocm_sources.extend(glob.glob(os.path.join(rocm_dir, "*.cpp"), recursive=True))
+
+    # Add CUDA source files if needed
+    if use_cuda:
         sources += cuda_sources
 
     # TOOD: Remove this and use what CUDA has once we fix all the builds.
-    if IS_ROCM and use_cuda:
+    if use_rocm:
         # Add ROCm GPU architecture check
-        gpu_arch = torch.cuda.get_device_properties(0).name
-        if gpu_arch != "gfx942":
+        gpu_arch = None
+        if torch.cuda.is_available():
+            gpu_arch = torch.cuda.get_device_properties(0).name
+        if gpu_arch and gpu_arch != "gfx942":
             print(f"Warning: Unsupported ROCm GPU architecture: {gpu_arch}")
-            print(
-                "Currently only gfx942 is supported. Skipping compilation of ROCm extensions"
-            )
-        else:
-            sources += hip_sources
+            print("Currently only gfx942 is supported. Compiling only for gfx942.")
+        extra_compile_args["nvcc"].append("--offload-arch=gfx942")
+        sources += rocm_sources
 
     use_cutlass = False
     cutlass_90a_sources = None
-    if use_cuda and not IS_ROCM and not IS_WINDOWS:
+    if use_cuda and not IS_WINDOWS:
         use_cutlass = True
         cutlass_dir = os.path.join(third_party_path, "cutlass")
         cutlass_include_dir = os.path.join(cutlass_dir, "include")
diff --git a/test/test_ops.py b/test/test_ops.py
index 132c4f0c18..012a4d562d 100644
--- a/test/test_ops.py
+++ b/test/test_ops.py
@@ -31,8 +31,8 @@
     compute_max_diff,
 )
 
-if torch.version.hip is not None:
-    pytest.skip("Skipping the test in ROCm", allow_module_level=True)
+IS_CUDA = torch.cuda.is_available() and torch.version.cuda
+IS_ROCM = torch.cuda.is_available() and torch.version.hip
 
 try:
     import torchao.ops
@@ -58,7 +58,7 @@ def _create_floatx_inputs(
         fp16_act = torch.rand(BS, IC).to(dtype) + 0.5
         return floatx_weight.to(device), scale.to(device), fp16_act.to(device)
 
-    @pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+    @pytest.mark.skipif(not IS_CUDA, reason="CUDA not available")
     @parametrize("ebits,mbits", [(3, 2), (2, 2)])
     @parametrize("dtype", [torch.half, torch.bfloat16])
     def test_quant_llm_linear(self, ebits, mbits, dtype):
@@ -88,7 +88,7 @@ def test_quant_llm_linear(self, ebits, mbits, dtype):
             test_utils=test_utils,
         )
 
-    @pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+    @pytest.mark.skipif(not IS_CUDA, reason="CUDA not available")
     @parametrize("BS,OC,IC,splitK", [(1, 2048, 4096, 5), (2, 8192, 8192, 6)])
     @parametrize("ebits,mbits", [(3, 2), (2, 2)])
     @parametrize("dtype", [torch.half, torch.bfloat16])
@@ -278,7 +278,7 @@ def make_test_id(param):
         return f"tiles_{param}"
 
 
-@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(not IS_CUDA, reason="CUDA not available")
 # @pytest.mark.skipif(TORCH_VERSION_AT_LEAST_2_5, reason="weight packing is updated in 2.5+")
 @pytest.mark.parametrize("shape, inner_k_tiles", TEST_CONFIGS_UNPACK, ids=make_test_id)
 def test_unpack_tensor_core_tiled_layout_correctness(shape, inner_k_tiles):
@@ -296,7 +296,7 @@ def test_unpack_tensor_core_tiled_layout_correctness(shape, inner_k_tiles):
 
 
 # TODO: Fix "test_aot_dispatch_dynamic" test failure
-@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(not IS_CUDA, reason="CUDA not available")
 # @pytest.mark.skipif(TORCH_VERSION_AT_LEAST_2_5, reason="weight packing is updated in 2.5+")
 @pytest.mark.parametrize("shape, inner_k_tiles", TEST_CONFIGS_UNPACK, ids=make_test_id)
 def test_unpack_tensor_core_tiled_layout_op(shape, inner_k_tiles):
@@ -342,7 +342,7 @@ def dequant_ref(q, scales, zeros, group_size, nbits=4, dtype=torch.bfloat16):
     return dq.reshape(n, k)
 
 
-@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(not IS_CUDA, reason="CUDA not available")
 # @pytest.mark.skipif(TORCH_VERSION_AT_LEAST_2_5, reason="weight packing is updated in 2.5+")
 @pytest.mark.parametrize(
     "shape, inner_k_tiles, group_size", TEST_CONFIGS_DEQUANT, ids=str
@@ -410,7 +410,7 @@ def test_dequantize_tensor_core_tiled_layout_correctness_quant_dequant(
 
 
 # This test differs from one above in that it uses `unpack_tensor_core_tiled_layout` to unpack then dequantize
-@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(not IS_CUDA, reason="CUDA not available")
 # @pytest.mark.skipif(TORCH_VERSION_AT_LEAST_2_5, reason="weight packing is updated in 2.5+")
 @pytest.mark.parametrize(
     "shape, inner_k_tiles, group_size", TEST_CONFIGS_DEQUANT, ids=str
@@ -476,7 +476,7 @@ def test_dequantize_tensor_core_tiled_layout_correctness_unpack_and_dequant(
     assert diff_op_ao < 1e-1
 
 
-@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(not IS_CUDA, reason="CUDA not available")
 # @pytest.mark.skipif(TORCH_VERSION_AT_LEAST_2_5, reason="weight packing is updated in 2.5+")
 @pytest.mark.parametrize(
     "shape, inner_k_tiles, group_size", TEST_CONFIGS_DEQUANT, ids=str
@@ -587,7 +587,7 @@ def reshape_w(w):
     )
 
 
-@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(not IS_CUDA, reason="CUDA not available")
 @pytest.mark.parametrize(
     "batch_size, k_chunk, n_chunk, num_bits, group_size, mnk_factors",
     MARLIN_TEST_PARAMS,
@@ -677,7 +677,7 @@ def test_marlin_24(batch_size, k_chunk, n_chunk, num_bits, group_size, mnk_facto
 )
 
 
-@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(not IS_CUDA, reason="CUDA not available")
 @pytest.mark.parametrize(
     "batch_size, k_chunk, n_chunk, num_bits, group_size, mnk_factors",
     MARLIN_TEST_PARAMS,
@@ -756,5 +756,27 @@ def test_marlin_qqq(batch_size, k_chunk, n_chunk, num_bits, group_size, mnk_fact
     )
 
 
+@pytest.mark.skipif(not IS_ROCM, reason="ROCm not available")
+def test_swizzle_mm():
+    test_utils = [
+        "test_schema",
+        "test_autograd_registration",
+        "test_faketensor",
+    ]
+
+    # TODO: Figure out why test fails unless torch >= 2.5
+    if TORCH_VERSION_AT_LEAST_2_5:
+        test_utils.append("test_aot_dispatch_dynamic")
+
+    mat1 = torch.randint(0, 16, dtype=torch.float, size=(16, 32), device="cuda")
+    mat2 = torch.randint(0, 16, dtype=torch.float, size=(32, 16), device="cuda")
+
+    opcheck(
+        torch.ops.torchao.swizzle_mm,
+        (mat1, mat2, False, False),
+        test_utils=test_utils,
+    )
+
+
 if __name__ == "__main__":
     pytest.main(sys.argv)
diff --git a/torchao/__init__.py b/torchao/__init__.py
index 7cc447d5a7..730cd326fe 100644
--- a/torchao/__init__.py
+++ b/torchao/__init__.py
@@ -43,13 +43,14 @@
     quantize_,
 )
 
-from . import dtypes, optim, quantization, testing
+from . import dtypes, optim, quantization, swizzle, testing
 
 __all__ = [
     "dtypes",
     "autoquant",
     "optim",
     "quantize_",
+    "swizzle",
     "testing",
     "ops",
     "quantization",
diff --git a/torchao/csrc/rocm/swizzle/swizzle.cpp b/torchao/csrc/rocm/swizzle/swizzle.cpp
new file mode 100644
index 0000000000..bfaf6bf466
--- /dev/null
+++ b/torchao/csrc/rocm/swizzle/swizzle.cpp
@@ -0,0 +1,911 @@
+// setup.py glob includes all *.cpp files
+// but only build this for ROCm
+#ifdef USE_ROCM
+#include <hip/hip_runtime.h>
+#include <hipblaslt/hipblaslt-ext.hpp>
+
+#include <ATen/ATen.h>
+#include <ATen/OpMathType.h>
+#include <ATen/TensorUtils.h>
+#include <ATen/core/Tensor.h>
+#include <ATen/hip/HIPDataType.h>
+#include <ATen/hip/HIPBlas.h>
+#include <ATen/native/Resize.h>
+#include <c10/core/ScalarType.h>
+#include <ATen/hip/impl/HIPCachingAllocatorMasqueradingAsCUDA.h>
+#include <c10/util/ArrayRef.h>
+#include <torch/library.h>
+
+using at::Scalar;
+using at::Tensor;
+using at::TensorArg;
+using c10::kFloat;
+using c10::ScalarType;
+using c10::IntArrayRef;
+using at::cuda::ScalarTypeToCudaDataType;
+
+//
+// copied from aten/src/ATen/cuda/CUDABlas.cpp
+//
+namespace {
+
+static hipblasOperation_t _cublasOpFromChar(char op) {
+  // NOLINTNEXTLINE(bugprone-switch-missing-default-case)
+  switch (op) {
+    case 'n':
+    case 'N':
+      return HIPBLAS_OP_N;
+    case 't':
+    case 'T':
+      return HIPBLAS_OP_T;
+    case 'c':
+    case 'C':
+      return HIPBLAS_OP_C;
+  }
+  TORCH_CHECK(false,
+      "_cublasOpFromChar input should be 't', 'n' or 'c' but got `", op, "`");
+}
+
+static void _cublasAdjustLdLevel3(
+    char transa,
+    char transb,
+    int64_t m,
+    int64_t n,
+    int64_t k,
+    int64_t* lda,
+    int64_t* ldb,
+    int64_t* ldc) {
+  bool transa_ = ((transa != 'n') && (transa != 'N'));
+  bool transb_ = ((transb != 'n') && (transb != 'N'));
+
+  // Note: leading dimensions generally are checked that they are > 0
+  // and at least as big the result requires (even if the value won't
+  // be used).
+  if (n <= 1)
+    *ldc = std::max<int64_t>(m, 1);
+
+  if (transa_) {
+    if (m <= 1)
+      *lda = std::max<int64_t>(k, 1);
+  } else {
+    if (k <= 1)
+      *lda = std::max<int64_t>(m, 1);
+  }
+
+  if (transb_) {
+    if (k <= 1)
+      *ldb = std::max<int64_t>(n, 1);
+  } else {
+    if (n <= 1)
+      *ldb = std::max<int64_t>(k, 1);
+  }
+}
+
+// Following the pattern of CuSparseDescriptor
+// Defined here for now because this is the only place cublas_lt interface is
+// used but can be moved to a header once cublas_lt interface is used in
+// multiple places.
+template <typename T, hipblasStatus_t (*destructor)(T*)>
+struct HipBlasLtDeleter {
+  void operator()(T* x) {
+    if (x != nullptr) {
+      TORCH_CUDABLAS_CHECK(destructor(x));
+    }
+  }
+};
+
+template <typename T, hipblasStatus_t (*destructor)(T*)>
+class HipBlasLtDescriptor {
+ public:
+  T* descriptor() const {
+    return descriptor_.get();
+  }
+  T* descriptor() {
+    return descriptor_.get();
+  }
+
+ protected:
+  std::unique_ptr<T, HipBlasLtDeleter<T, destructor>> descriptor_;
+};
+
+class HipBlasLtMatmulDescriptor : public HipBlasLtDescriptor<
+                                     hipblasLtMatmulDescOpaque_t,
+                                     &hipblasLtMatmulDescDestroy> {
+ public:
+  HipBlasLtMatmulDescriptor(
+      hipblasComputeType_t compute_type,
+      hipDataType scale_type) {
+    hipblasLtMatmulDesc_t raw_descriptor = nullptr;
+    TORCH_CUDABLAS_CHECK(
+        hipblasLtMatmulDescCreate(&raw_descriptor, compute_type, scale_type));
+    descriptor_.reset(raw_descriptor);
+  }
+  template <typename T>
+  inline void setAttribute(hipblasLtMatmulDescAttributes_t attr, const T value) {
+    // NOLINTNEXTLINE(bugprone-sizeof-expression)
+    TORCH_CUDABLAS_CHECK(::hipblasLtMatmulDescSetAttribute(descriptor(), attr, &value, sizeof(value)));
+  }
+};
+
+class HipBlasLtMatrixLayout : public HipBlasLtDescriptor<
+                                 hipblasLtMatrixLayoutOpaque_t,
+                                 &hipblasLtMatrixLayoutDestroy> {
+ public:
+  HipBlasLtMatrixLayout(
+      hipDataType type,
+      uint64_t rows,
+      uint64_t cols,
+      int64_t ld,
+      bool t = false) {
+    hipblasLtMatrixLayout_t raw_descriptor = nullptr;
+    TORCH_CUDABLAS_CHECK(
+        hipblasLtMatrixLayoutCreate(&raw_descriptor, type, t ? cols : rows, t ? rows : cols, ld));
+    descriptor_.reset(raw_descriptor);
+  }
+  template <typename T>
+  inline void setAttribute(hipblasLtMatrixLayoutAttribute_t attr, const T value) {
+    TORCH_CUDABLAS_CHECK(::hipblasLtMatrixLayoutSetAttribute(descriptor(), attr, &value, sizeof(T)));
+  }
+};
+
+class HipBlasLtMatmulPreference : public HipBlasLtDescriptor<
+                                     hipblasLtMatmulPreferenceOpaque_t,
+                                     &hipblasLtMatmulPreferenceDestroy> {
+ public:
+  HipBlasLtMatmulPreference() {
+    hipblasLtMatmulPreference_t raw_descriptor = nullptr;
+    TORCH_CUDABLAS_CHECK(hipblasLtMatmulPreferenceCreate(&raw_descriptor));
+    descriptor_.reset(raw_descriptor);
+  }
+  template <typename T>
+  inline void setAttribute(hipblasLtMatmulPreferenceAttributes_t attr, const T value) {
+    TORCH_CUDABLAS_CHECK(::hipblasLtMatmulPreferenceSetAttribute(descriptor(), attr, &value, sizeof(T)));
+  }
+};
+
+static size_t _parseChosenWorkspaceSize() {
+  auto val = c10::utils::get_env("CUBLASLT_WORKSPACE_SIZE");
+  if (!val.has_value()) {
+    // accept either env var
+    val = c10::utils::get_env("HIPBLASLT_WORKSPACE_SIZE");
+  }
+  size_t workspace_size = 76*1024; /* Use 76 MB for hipBLASLt */
+
+  if (val.has_value()) {
+    try {
+      workspace_size = std::stoi(val.value());
+    } catch(std::invalid_argument const& e) {
+      TORCH_WARN("invalid CUBLASLT_WORKSPACE_SIZE,",
+                 " using default workspace size of ", workspace_size, " KiB.");
+    } catch(std::out_of_range const& e) {
+      TORCH_WARN("CUBLASLT_WORKSPACE_SIZE out of range,",
+                 " using default workspace size of ", workspace_size, " KiB.");
+    }
+  }
+  return workspace_size * 1024;
+}
+
+static size_t _getWorkspaceSize() {
+  static size_t workspace_size = _parseChosenWorkspaceSize();
+  return workspace_size;
+}
+
+static bool _scaled_mm_is_fnuz() {
+    auto dprops = at::cuda::getCurrentDeviceProperties();
+    std::string device_arch = dprops->gcnArchName;
+    static const std::vector<std::string> archs = {"gfx940", "gfx941", "gfx942"};
+    for (std::string arch : archs) {
+        size_t substring = device_arch.find(arch);
+        if (substring != std::string::npos) {
+            return true;
+        }
+    }
+    return false;
+}
+
+} // namespace
+
+//
+// copied from aten/src/ATen/native/cuda/Blas.cpp
+//
+namespace {
+
+// TODO: https://github.com/pytorch/pytorch/pull/59380#pullrequestreview-725310492
+c10::MaybeOwned<Tensor> inline resolve_conj_if_indicated(const Tensor& tensor, bool resolve_conj) {
+  if (resolve_conj && tensor.is_conj()) {
+    return c10::MaybeOwned<Tensor>::owned(tensor.resolve_conj());
+  } else {
+    return c10::MaybeOwned<Tensor>::borrowed(tensor);
+  }
+}
+
+c10::MaybeOwned<Tensor> inline prepare_matrix_for_cublas(const Tensor& tensor, bool& transpose_tensor, bool transpose_result) {
+  if (tensor.is_non_overlapping_and_dense()) { // common case
+      transpose_tensor = tensor.is_contiguous();
+      return resolve_conj_if_indicated(tensor, transpose_result ? transpose_tensor : !transpose_tensor);
+  }
+  IntArrayRef tensor_strides = tensor.strides();
+  IntArrayRef tensor_sizes = tensor.sizes();
+  if ((tensor_strides[0] == 1) && (tensor_strides[1] >= std::max<int64_t>(1, tensor_sizes[0]))) {
+    transpose_tensor = false;
+    return resolve_conj_if_indicated(tensor, !transpose_result);
+  } else if ((tensor_strides[1] == 1) && (tensor_strides[0] >= std::max<int64_t>(1, tensor_sizes[1]))) {
+    transpose_tensor = true;
+    return resolve_conj_if_indicated(tensor, transpose_result);
+  } else {
+    transpose_tensor = true;
+    return c10::MaybeOwned<Tensor>::owned(tensor.clone(at::MemoryFormat::Contiguous));
+  }
+}
+
+c10::MaybeOwned<Tensor> inline prepare_matrix_for_cublas(const Tensor& tensor, bool& transpose_tensor) {
+  if (tensor.is_non_overlapping_and_dense()) { // common case
+      transpose_tensor = tensor.is_contiguous();
+      return resolve_conj_if_indicated(tensor, true);
+  }
+
+  IntArrayRef tensor_strides = tensor.strides();
+  IntArrayRef tensor_sizes = tensor.sizes();
+  if ((tensor_strides[0] == 1) && (tensor_strides[1] >= std::max<int64_t>(1, tensor_sizes[0]))) {
+    transpose_tensor = false;
+    return resolve_conj_if_indicated(tensor, true);
+  } else if ((tensor_strides[1] == 1) && (tensor_strides[0] >= std::max<int64_t>(1, tensor_sizes[1]))) {
+    transpose_tensor = true;
+    return resolve_conj_if_indicated(tensor, true);
+  } else {
+    transpose_tensor = true;
+    return c10::MaybeOwned<Tensor>::owned(tensor.clone(at::MemoryFormat::Contiguous));
+  }
+}
+
+struct cublasCommonArgs {
+  cublasCommonArgs(
+      const Tensor& mat1,
+      const Tensor& mat2,
+      bool swizzle1,
+      bool swizzle2,
+      Tensor& c,
+      const std::optional<Tensor>& scale_a = std::nullopt,
+      const std::optional<Tensor>& scale_b = std::nullopt,
+      const std::optional<Tensor>& scale_result = std::nullopt) {
+    bool transpose_result = false, transpose_a = false, transpose_b = false;
+    result = prepare_matrix_for_cublas(c, transpose_result);
+    mata = prepare_matrix_for_cublas(transpose_result ? mat2 : mat1, transpose_a, transpose_result);
+    matb = prepare_matrix_for_cublas(transpose_result ? mat1 : mat2, transpose_b, transpose_result);
+
+    // Handle scale tensors if provided
+    if (scale_a && scale_b) {
+      // By default since we return in row-major we run the gemm
+      // as B.T @ A.T, check transpose_result to determine if we flip the scales
+      scale_mata_ptr = transpose_result ? scale_b->data_ptr() : scale_a->data_ptr();
+      scale_mata_dtype = transpose_result ? scale_b->scalar_type() : scale_a->scalar_type();
+      scale_matb_ptr = transpose_result ? scale_a->data_ptr() : scale_b->data_ptr();
+      scale_matb_dtype = transpose_result ? scale_a->scalar_type() : scale_b->scalar_type();
+    }
+
+    if (scale_result) {
+      scale_result_ptr = scale_result->data_ptr();
+      scale_result_dtype = scale_result->scalar_type();
+    }
+
+    // Update transpose flags
+    if (transpose_result) {
+      transpose_a = !transpose_a;
+      transpose_b = !transpose_b;
+    }
+
+    auto sizes_a = mata->sizes();
+    auto sizes_b = matb->sizes();
+
+    m = sizes_a[transpose_result ? 1 : 0];
+    k = sizes_a[transpose_result ? 0 : 1];
+    n = sizes_b[transpose_result ? 0 : 1];
+    lda = mata->stride((transpose_a == transpose_result) ? 1 : 0);
+    ldb = matb->stride((transpose_b == transpose_result) ? 1 : 0);
+    result_ld = result->stride(transpose_result ? 0 : 1);
+    transa = transpose_a ? mata->is_conj() ? 'c' : 't' : 'n';
+    transb = transpose_b ? matb->is_conj() ? 'c' : 't' : 'n';
+
+    mata_is_swizzled = transpose_result ? swizzle2 : swizzle1;
+    matb_is_swizzled = transpose_result ? swizzle1 : swizzle2;
+  }
+
+  // Matrix members
+  char transa, transb;
+  int64_t m, n, k;
+  int64_t lda, ldb, result_ld;
+  c10::MaybeOwned<Tensor> mata, matb, result;
+
+  // Scale members
+  void* scale_mata_ptr = nullptr;
+  void* scale_matb_ptr = nullptr;
+  void* scale_result_ptr = nullptr;
+  std::optional<c10::ScalarType> scale_mata_dtype;
+  std::optional<c10::ScalarType> scale_matb_dtype;
+  std::optional<c10::ScalarType> scale_result_dtype;
+
+  // swizzle members
+  bool mata_is_swizzled;
+  bool matb_is_swizzled;
+};
+
+enum class ScalingType {
+  TensorWise,
+  RowWise,
+  Error
+};
+
+ScalingType get_scaling_type(
+    const at::Tensor& scale_a,
+    const at::Tensor& scale_b,
+    int64_t dim_m,
+    int64_t dim_n) {
+  // Both Per-Tensor and Row-wise scaling expect fp32 tensors
+  TORCH_CHECK(
+      scale_a.scalar_type() == kFloat && scale_b.scalar_type() == kFloat,
+      "Both scale_a and scale_b must be float (fp32) tensors.");
+
+  // Check the singluar scale case for per-tensor scaling
+  if (scale_a.numel() == 1 && scale_b.numel() == 1) {
+    return ScalingType::TensorWise;
+  }
+
+  // For non-TensorWise scaling, enforce 2D input tensors
+  TORCH_CHECK(
+      scale_a.dim() == 2 && scale_b.dim() == 2,
+      "For non-TensorWise scaling, scale tensors must be 2-dimensional, "
+      "but got scale_a.dim()=",
+      scale_a.dim(),
+      " and scale_b.dim()=",
+      scale_b.dim());
+
+  // Check for RowWise scaling
+  if (scale_a.size(0) == dim_m && scale_a.size(1) == 1 &&
+      scale_b.size(0) == 1 && scale_b.size(1) == dim_n) {
+#if defined(HIPBLASLT_VEC_EXT)
+    TORCH_CHECK(
+        scale_a.is_contiguous() && scale_b.is_contiguous(),
+        "Both scale_a and scale_b must be contiguous for RowWise scaling.");
+    return ScalingType::RowWise;
+#else
+    TORCH_CHECK(false, "Per-row scaling is not supported for this platform!");
+    return ScalingType::Error;
+#endif
+  }
+
+  // If we reach here, the input doesn't match any valid scaling type
+  TORCH_CHECK(
+      false,
+      "Invalid scaling configuration. For TensorWise scaling, both scales should be scalar. "
+      "For RowWise scaling, scale_a should be (",
+      dim_m,
+      ", 1) and scale_b should be (1, ",
+      dim_n,
+      "). "
+      "Got scale_a.size()=(",
+      scale_a.size(0),
+      ", ",
+      scale_a.size(1),
+      ") and ",
+      "scale_b.size()=(",
+      scale_b.size(0),
+      ", ",
+      scale_b.size(1),
+      ")");
+
+  return ScalingType::Error;
+}
+
+} // namespace
+
+template <typename Dtype>
+inline void bgemm_hipblaslt(CUDABLAS_BGEMM_ARGTYPES(Dtype), bool mat1_is_swizzled, bool mat2_is_swizzled) {
+  hipDataType abcType = HIP_R_32F;
+  hipblasComputeType_t computeType = HIPBLAS_COMPUTE_32F;
+  hipDataType scaleType = HIP_R_32F;
+  if constexpr (std::is_same_v<Dtype, double>) {
+    abcType = HIP_R_64F;
+    computeType = HIPBLAS_COMPUTE_64F;
+    scaleType = HIP_R_64F;
+  } else if constexpr (std::is_same_v<Dtype, float>) {
+  } else if constexpr (std::is_same_v<Dtype, c10::complex<double>>) {
+    abcType = HIP_C_64F;
+    computeType = HIPBLAS_COMPUTE_64F;
+    scaleType = HIP_C_64F;
+  } else if constexpr (std::is_same_v<Dtype, c10::complex<float>>) {
+    abcType = HIP_C_32F;
+    scaleType = HIP_C_32F;
+  } else if constexpr (std::is_same_v<Dtype, at::Half>) {
+    abcType = HIP_R_16F;
+  } else if constexpr (std::is_same_v<Dtype, at::BFloat16>) {
+    abcType = HIP_R_16BF;
+  } else {
+    static_assert(false && sizeof(Dtype), "at::cuda::blas::bgemm_internal_cublaslt: not implemented");
+  }
+
+  hipblasLtHandle_t ltHandle = at::cuda::getCurrentCUDABlasLtHandle();
+  hipblasOperation_t opa = _cublasOpFromChar(transa);
+  hipblasOperation_t opb = _cublasOpFromChar(transb);
+  _cublasAdjustLdLevel3(transa, transb, m, n, k, &lda, &ldb, &ldc);
+
+  HipBlasLtMatmulDescriptor computeDesc(computeType, scaleType);
+  computeDesc.setAttribute(HIPBLASLT_MATMUL_DESC_TRANSA, opa);
+  computeDesc.setAttribute(HIPBLASLT_MATMUL_DESC_TRANSB, opb);
+  HipBlasLtMatrixLayout Adesc(abcType, m, k, lda, opa == HIPBLAS_OP_T);
+  HipBlasLtMatrixLayout Bdesc(abcType, k, n, ldb, opb == HIPBLAS_OP_T);
+  HipBlasLtMatrixLayout Cdesc(abcType, m, n, ldc);
+#ifdef HIPBLASLT_HAS_ORDER_COL16
+  if (mat1_is_swizzled) {
+    Adesc.setAttribute(HIPBLASLT_MATRIX_LAYOUT_ORDER, HIPBLASLT_ORDER_COL16_4R8);
+  }
+  if (mat2_is_swizzled) {
+    Bdesc.setAttribute(HIPBLASLT_MATRIX_LAYOUT_ORDER, HIPBLASLT_ORDER_COL16_4R8);
+  }
+#endif
+
+  if (num_batches > 1) {
+    int num_batches_as_int = static_cast<int>(num_batches);
+    Adesc.setAttribute(HIPBLASLT_MATRIX_LAYOUT_BATCH_COUNT, num_batches_as_int);
+    Bdesc.setAttribute(HIPBLASLT_MATRIX_LAYOUT_BATCH_COUNT, num_batches_as_int);
+    Cdesc.setAttribute(HIPBLASLT_MATRIX_LAYOUT_BATCH_COUNT, num_batches_as_int);
+    Adesc.setAttribute(HIPBLASLT_MATRIX_LAYOUT_STRIDED_BATCH_OFFSET, stridea);
+    Bdesc.setAttribute(HIPBLASLT_MATRIX_LAYOUT_STRIDED_BATCH_OFFSET, strideb);
+    Cdesc.setAttribute(HIPBLASLT_MATRIX_LAYOUT_STRIDED_BATCH_OFFSET, stridec);
+  }
+
+  hipblasLtEpilogue_t epilogue = HIPBLASLT_EPILOGUE_DEFAULT;
+  computeDesc.setAttribute(HIPBLASLT_MATMUL_DESC_EPILOGUE, epilogue);
+
+  HipBlasLtMatmulPreference preference;
+  // See https://github.com/pytorch/pytorch/issues/73328 for reasoning behind
+  // setting this to 1M.
+  size_t workspaceSize = _getWorkspaceSize();
+  preference.setAttribute(HIPBLASLT_MATMUL_PREF_MAX_WORKSPACE_BYTES, workspaceSize);
+
+  auto workspace = at::empty(static_cast<int64_t>(workspaceSize), at::TensorOptions().dtype(at::kByte).device(at::kCUDA));
+
+  hipblasLtMatmulHeuristicResult_t heuristicResult = {};
+  int returnedResult = 0;
+  TORCH_CUDABLAS_CHECK(hipblasLtMatmulAlgoGetHeuristic(
+      ltHandle,
+      computeDesc.descriptor(),
+      Adesc.descriptor(),
+      Bdesc.descriptor(),
+      Cdesc.descriptor(),
+      Cdesc.descriptor(),
+      preference.descriptor(),
+      1,
+      &heuristicResult,
+      &returnedResult));
+  if (returnedResult == 0) {
+    TORCH_CUDABLAS_CHECK(HIPBLAS_STATUS_NOT_SUPPORTED);
+  }
+
+  hipblasStatus_t cublasStatus = hipblasLtMatmul(
+      ltHandle,
+      computeDesc.descriptor(),
+      &alpha,
+      a,
+      Adesc.descriptor(),
+      b,
+      Bdesc.descriptor(),
+      &beta,
+      c,
+      Cdesc.descriptor(),
+      c,
+      Cdesc.descriptor(),
+      &heuristicResult.algo,
+      workspace.mutable_data_ptr(),
+      workspaceSize,
+      at::hip::getCurrentHIPStreamMasqueradingAsCUDA());
+  TORCH_CHECK(
+      cublasStatus == HIPBLAS_STATUS_SUCCESS,
+      "CUDA error: ",
+      at::cuda::blas::_cublasGetErrorEnum(cublasStatus),
+      " when calling hipblasLtMatmul with transpose_mat1 ",
+      (opa == HIPBLAS_OP_T),
+      " transpose_mat2 ",
+      (opb == HIPBLAS_OP_T),
+      " m ",
+      m,
+      " n ",
+      n,
+      " k ",
+      k,
+      " lda ",
+      lda,
+      " ldb ",
+      ldb,
+      " ldc ",
+      ldc,
+      " abcType ",
+      abcType,
+      " computeType ",
+      computeType,
+      " scaleType ",
+      scaleType);
+}
+
+
+template <typename Dtype>
+inline void gemm_hipblaslt(CUDABLAS_GEMM_ARGTYPES(Dtype), bool mat1_is_swizzled, bool mat2_is_swizzled) {
+  // forward to bgemm implementation but set strides and batches to 0
+  bgemm_hipblaslt(transa, transb, m, n, k, alpha, a, lda, 0, b, ldb, 0, beta, c, ldc, 0, 0, mat1_is_swizzled, mat2_is_swizzled);
+}
+
+
+Tensor swizzle_mm(const Tensor& mat1, const Tensor& mat2, bool mat1_is_swizzled, bool mat2_is_swizzled) {
+  TORCH_CHECK(
+    mat1.dtype() == mat2.dtype(),
+    "expected mat1 and mat2 to have the same dtype, but got: ", mat1.dtype(), " != ", mat2.dtype()
+  );
+
+  // NOLINTNEXTLINE(*c-array*)
+  TensorArg targs[]{{mat1, "mat1", 0}, {mat2, "mat2", 1}};
+  checkAllSameGPU(__func__, targs);
+
+  Tensor meta_mat1 = mat1.to("meta");
+  Tensor meta_mat2 = mat2.to("meta");
+  Tensor meta_result = at::mm(meta_mat1, meta_mat2);
+  Tensor result = at::empty_like(meta_result, mat1.device());
+  at::ScalarType scalar_type = result.scalar_type();
+
+  cublasCommonArgs args(mat1, mat2, mat1_is_swizzled, mat2_is_swizzled, result);
+
+  AT_DISPATCH_FLOATING_TYPES_AND2(
+      at::ScalarType::Half,
+      at::ScalarType::BFloat16,
+      scalar_type,
+      "addmm_cuda",
+      [&] {
+        using opmath_t = at::opmath_type<scalar_t>;
+        opmath_t alpha_val = opmath_t(1.0);
+        opmath_t beta_val = opmath_t(0.0);
+        const scalar_t* mat1_ptr = args.mata->const_data_ptr<scalar_t>();
+        const scalar_t* mat2_ptr = args.matb->const_data_ptr<scalar_t>();
+        scalar_t* result_ptr = args.result->mutable_data_ptr<scalar_t>();
+        gemm_hipblaslt<scalar_t>(
+            args.transa,
+            args.transb,
+            args.m,
+            args.n,
+            args.k,
+            alpha_val,
+            mat1_ptr,
+            args.lda,
+            mat2_ptr,
+            args.ldb,
+            beta_val,
+            result_ptr,
+            args.result_ld,
+            args.mata_is_swizzled,
+            args.matb_is_swizzled);
+      });
+
+    return result;
+}
+
+void _scaled_gemm(
+    char transa,
+    char transb,
+    int64_t m,
+    int64_t n,
+    int64_t k,
+    const void* mat1_ptr,
+    const void* mat1_scale_ptr,
+    int64_t mat1_ld,
+    ScalarType mat1_dtype,
+    ScalarType mat1_scale_dtype,
+    bool mat1_is_swizzled,
+    const void* mat2_ptr,
+    const void* mat2_scale_ptr,
+    int64_t mat2_ld,
+    ScalarType mat2_dtype,
+    ScalarType mat2_scale_dtype,
+    bool mat2_is_swizzled,
+    const void* bias_ptr,
+    ScalarType bias_dtype,
+    void* result_ptr,
+    const void *result_scale_ptr,
+    int64_t result_ld,
+    ScalarType result_dtype,
+    bool use_rowwise) {
+  const auto computeType = HIPBLAS_COMPUTE_32F;
+  const auto scaleType = HIP_R_32F;
+  const float alpha_val = 1.0;
+  const float beta_val = 0.0;
+  HipBlasLtMatmulDescriptor computeDesc(computeType, scaleType);
+  computeDesc.setAttribute(HIPBLASLT_MATMUL_DESC_TRANSA, _cublasOpFromChar(transa));
+  computeDesc.setAttribute(HIPBLASLT_MATMUL_DESC_TRANSB, _cublasOpFromChar(transb));
+  hipblasLtMatmulDescAttributes_t matmulDescA = HIPBLASLT_MATMUL_DESC_A_SCALE_POINTER;
+  hipblasLtMatmulDescAttributes_t matmulDescB = HIPBLASLT_MATMUL_DESC_B_SCALE_POINTER;
+#if defined(HIPBLASLT_VEC_EXT)
+  if (use_rowwise) {
+    matmulDescA = HIPBLASLT_MATMUL_DESC_A_SCALE_POINTER_VEC_EXT;
+    matmulDescB = HIPBLASLT_MATMUL_DESC_B_SCALE_POINTER_VEC_EXT;
+  }
+#else
+  // rowwise isn't supported using cublaslt or older hipblaslt
+  TORCH_INTERNAL_ASSERT(use_rowwise == false, "rowwise scaled_gemm not supported with blaslt");
+#endif
+  computeDesc.setAttribute(matmulDescA, mat1_scale_ptr);
+  computeDesc.setAttribute(matmulDescB, mat2_scale_ptr);
+  if (result_scale_ptr != nullptr) {
+    computeDesc.setAttribute(HIPBLASLT_MATMUL_DESC_D_SCALE_POINTER, result_scale_ptr);
+  }
+  HipBlasLtMatrixLayout Adesc(ScalarTypeToCudaDataType(mat1_dtype), m, k, mat1_ld, transa == 't');
+  HipBlasLtMatrixLayout Bdesc(ScalarTypeToCudaDataType(mat2_dtype), k, n, mat2_ld, transb == 't');
+  // Cdesc is unused, beta is 0. But hipblaslt needs this set to something reasonable.
+  HipBlasLtMatrixLayout Cdesc(ScalarTypeToCudaDataType(result_dtype), m, n, result_ld);
+  HipBlasLtMatrixLayout Ddesc(ScalarTypeToCudaDataType(result_dtype), m, n, result_ld);
+  if (bias_ptr) {
+    computeDesc.setAttribute(HIPBLASLT_MATMUL_DESC_BIAS_POINTER, bias_ptr);
+    computeDesc.setAttribute(HIPBLASLT_MATMUL_DESC_EPILOGUE, HIPBLASLT_EPILOGUE_BIAS);
+    computeDesc.setAttribute(HIPBLASLT_MATMUL_DESC_BIAS_DATA_TYPE, ScalarTypeToCudaDataType(bias_dtype));
+  }
+
+#ifdef HIPBLASLT_HAS_ORDER_COL16
+  if (mat1_is_swizzled) {
+    Adesc.setAttribute(HIPBLASLT_MATRIX_LAYOUT_ORDER, HIPBLASLT_ORDER_COL16_4R16);
+  }
+  if (mat2_is_swizzled) {
+    Bdesc.setAttribute(HIPBLASLT_MATRIX_LAYOUT_ORDER, HIPBLASLT_ORDER_COL16_4R16);
+  }
+#endif
+
+  auto stream = c10::hip::getCurrentHIPStreamMasqueradingAsCUDA();
+  size_t workspaceSize = _getWorkspaceSize();
+  auto& allocator = *::c10::hip::HIPCachingAllocatorMasqueradingAsCUDA::get();
+  auto workspace = allocator.allocate(workspaceSize);
+  auto workspace_ptr = workspace.mutable_get();
+  TORCH_CHECK(workspace_ptr != nullptr, "OOM trying to allocate workspace for cublaslt");
+
+  HipBlasLtMatmulPreference preference;
+  preference.setAttribute(HIPBLASLT_MATMUL_PREF_MAX_WORKSPACE_BYTES, workspaceSize);
+  hipblasLtMatmulHeuristicResult_t heuristicResult = {};
+  int returnedResult = 0;
+  hipblasLtHandle_t ltHandle = at::cuda::getCurrentCUDABlasLtHandle();
+  TORCH_CUDABLAS_CHECK(hipblasLtMatmulAlgoGetHeuristic(
+      ltHandle,
+      computeDesc.descriptor(),
+      Adesc.descriptor(),
+      Bdesc.descriptor(),
+      Cdesc.descriptor(),
+      Ddesc.descriptor(),
+      preference.descriptor(),
+      1,
+      &heuristicResult,
+      &returnedResult));
+  if (returnedResult == 0) {
+    // hipblaslt might be able to recover by returning all algos
+    std::vector<hipblasLtMatmulHeuristicResult_t> all_algos;
+    TORCH_CUDABLAS_CHECK(hipblaslt_ext::getAllAlgos(
+        ltHandle,
+        hipblaslt_ext::GemmType::HIPBLASLT_GEMM,
+        _cublasOpFromChar(transa),
+        _cublasOpFromChar(transb),
+        ScalarTypeToCudaDataType(mat1_dtype),
+        ScalarTypeToCudaDataType(mat2_dtype),
+        // C is nullptr and beta=0, so set to something reasonable. See above.
+        //ScalarTypeToCudaDataType(bias_dtype),
+        ScalarTypeToCudaDataType(result_dtype),
+        ScalarTypeToCudaDataType(result_dtype),
+        HIPBLAS_COMPUTE_32F,
+        all_algos));
+    if (all_algos.size() == 0) {
+      TORCH_CUDABLAS_CHECK(HIPBLAS_STATUS_NOT_SUPPORTED);
+    }
+    // pick first valid solution
+    bool found = false;
+    for (size_t i = 0; i < all_algos.size(); i++) {
+        size_t ret_workspace_size = 0;
+        auto is_valid_status = hipblaslt_ext::matmulIsAlgoSupported(
+                ltHandle,
+                computeDesc.descriptor(),
+                &alpha_val,
+                Adesc.descriptor(),
+                Bdesc.descriptor(),
+                &beta_val,
+                Cdesc.descriptor(),
+                Ddesc.descriptor(),
+                all_algos[i].algo,
+                ret_workspace_size);
+        if (is_valid_status == HIPBLAS_STATUS_SUCCESS) {
+            if (ret_workspace_size <= workspaceSize) {
+                heuristicResult = all_algos[i];
+                found = true;
+                break;
+            }
+        }
+    }
+    TORCH_CHECK(found, "could not find valid hipblaslt solution");
+  }
+  hipblasStatus_t cublasStatus = hipblasLtMatmul(
+      ltHandle,
+      computeDesc.descriptor(),
+      &alpha_val,
+      mat1_ptr,
+      Adesc.descriptor(),
+      mat2_ptr,
+      Bdesc.descriptor(),
+      &beta_val,
+      result_ptr, // unused, since beta_val is 0, but hipblaslt can't handle nullptr
+      Cdesc.descriptor(),
+      result_ptr,
+      Ddesc.descriptor(),
+      &heuristicResult.algo,
+      workspace_ptr,
+      workspaceSize,
+      stream);
+  TORCH_CHECK(
+      cublasStatus == HIPBLAS_STATUS_SUCCESS,
+      "CUDA error: ",
+      at::cuda::blas::_cublasGetErrorEnum(cublasStatus),
+      " when calling hipblasLtMatmul with transpose_mat1 ",
+      transa,
+      " transpose_mat2 ",
+      transb,
+      " m ",
+      m,
+      " n ",
+      n,
+      " k ",
+      k,
+      " mat1_ld ",
+      mat1_ld,
+      " mat2_ld ",
+      mat2_ld,
+      " result_ld ",
+      result_ld,
+      " computeType ",
+      computeType,
+      " scaleType ",
+      scaleType);
+  return;
+}
+
+Tensor&
+_scaled_mm_out(const Tensor& mat1, const Tensor& mat2,
+          bool mat1_is_swizzled,
+          bool mat2_is_swizzled,
+          const Tensor& scale_a,
+          const Tensor& scale_b,
+          const std::optional<at::Tensor>& bias,
+          const std::optional<at::Tensor>& scale_result,
+          std::optional<c10::ScalarType> out_dtype,
+          Tensor& out) {
+  // Check sizes
+  TORCH_CHECK(mat1.dim() == 2, "mat1 must be a matrix");
+  TORCH_CHECK(mat2.dim() == 2, "mat2 must be a matrix");
+  TORCH_CHECK(
+      mat1.sizes()[1] == mat2.sizes()[0], "mat1 and mat2 shapes cannot be multiplied (",
+      mat1.sizes()[0], "x", mat1.sizes()[1], " and ", mat2.sizes()[0], "x", mat2.sizes()[1], ")");
+
+  // Check what type of scaling we are doing based on inputs
+  ScalingType scaling_choice = get_scaling_type(scale_a, scale_b, mat1.size(0), mat2.size(1));
+  TORCH_INTERNAL_ASSERT(scaling_choice != ScalingType::Error, "Scaling type not supported");
+
+  TORCH_CHECK(!scale_result || (scale_result->numel() == 1 && scale_result->scalar_type() == kFloat),
+       "scale_result must be a float scalar");
+  TORCH_CHECK(!bias || bias->numel() == mat2.sizes()[1], "Bias must be size ", mat2.sizes()[1],
+       " but got ", bias->numel());
+  TORCH_CHECK(
+      mat1.sizes()[1] % 16 == 0,
+      "Expected trailing dimension of mat1 to be divisible by 16 ",
+      "but got mat1 shape: (",
+      mat1.sizes()[0],
+      "x",
+      mat1.sizes()[1],
+      ").");
+  TORCH_CHECK(mat2.sizes()[0] % 16 == 0 && mat2.sizes()[1] % 16 == 0, "mat2 shape (", mat2.sizes()[0], "x",
+       mat2.sizes()[1], ") must be divisible by 16");
+  // Check types
+  TORCH_CHECK(!out_dtype || *out_dtype == out.scalar_type(), "out_dtype must match output matrix type");
+  TORCH_CHECK(isFloat8Type(mat1.scalar_type()), "Expected mat1 to be Float8 matrix got ", mat1.scalar_type());
+  TORCH_CHECK(isFloat8Type(mat2.scalar_type()), "Expected mat2 to be Float8 matrix got ", mat2.scalar_type());
+  if (bias) {
+    TORCH_CHECK(out.scalar_type() != kFloat, "Bias is not supported when out_dtype is set to Float32");
+    TORCH_CHECK(bias->scalar_type() == ScalarType::BFloat16 || bias->scalar_type() == ScalarType::Half,
+         "Bias must be either Half or BFloat16, but got ", bias->scalar_type());
+    TORCH_CHECK((out.scalar_type() != kFloat && out.scalar_type() != ScalarType::BFloat16) ||
+          bias->scalar_type() == ScalarType::BFloat16,
+          "Bias must be BFloat16 to compute ", out.scalar_type(), " output, but got ", bias->scalar_type());
+    TORCH_CHECK(out.scalar_type() != ScalarType::Half || bias->scalar_type() == ScalarType::Half,
+          "Bias must be Float16 to compute ", out.scalar_type(), " output, but got ", bias->scalar_type());
+  }
+  {
+    auto bias_ = bias.value_or(Tensor());
+    auto scale_result_ = scale_result.value_or(Tensor());
+
+    // NOLINTNEXTLINE(*c-array*)
+    TensorArg targs[]{{out, "out", 0}, {mat1, "mat1", 1}, {mat2, "mat2", 2},
+                      {bias_, "bias", 3}, {scale_a, "scale_a", 4}, {scale_b, "scale_b", 5},
+                      {scale_result_, "scale_result", 6}};
+    checkAllSameGPU(__func__, targs);
+  }
+  // Validation checks have passed lets resize the output to actual size
+  IntArrayRef mat1_sizes = mat1.sizes();
+  IntArrayRef mat2_sizes = mat2.sizes();
+  at::native::resize_output(out, {mat1_sizes[0], mat2_sizes[1]});
+
+  // If any of M, K, N is 0 - return early (the tensorwise/rowwise float8 gemm kernels
+  // do not support this case).
+  if (mat1_sizes[0] == 0 || mat1_sizes[1] == 0 || mat2_sizes[1] == 0) {
+    // `out` was created with `at::empty`. In the case where we are multiplying
+    // MxK by KxN and K is the zero dim, we need to initialize here to properly
+    // return a tensor of zeros.
+    if (mat1_sizes[1] == 0) {
+      out.zero_();
+    }
+
+    return out;
+  }
+
+  if (scaling_choice == ScalingType::RowWise) {
+    // For ROCm, match behavior of f8f8bf16_rowwise type checking, for unit test purposes.
+    Tensor b = mat2;
+    if (_scaled_mm_is_fnuz()) {
+      TORCH_CHECK(b.dtype() == at::kFloat8_e4m3fnuz);
+    }
+    else {
+      TORCH_CHECK(b.dtype() == at::kFloat8_e4m3fn);
+    }
+    // Until more than bf16 is supported.
+    TORCH_CHECK(out.scalar_type() == ScalarType::BFloat16,
+         "hipblaslt rowwise _scaled_mm only supports BFloat16 output but got ", out.scalar_type());
+  }
+
+  cublasCommonArgs args(mat1, mat2, mat1_is_swizzled, mat2_is_swizzled, out, scale_a, scale_b, scale_result);
+  const auto out_dtype_ = args.result->scalar_type();
+  TORCH_CHECK(args.transa == 't' && args.transb == 'n', "Only multiplication of row-major and column-major matrices is supported by cuBLASLt");
+
+  {
+    _scaled_gemm(
+        args.transa,
+        args.transb,
+        args.m,
+        args.n,
+        args.k,
+        args.mata->data_ptr(),
+        args.scale_mata_ptr,
+        args.lda,
+        args.mata->scalar_type(),
+        args.scale_mata_dtype.value(),
+        args.mata_is_swizzled,
+        args.matb->data_ptr(),
+        args.scale_matb_ptr,
+        args.ldb,
+        args.matb->scalar_type(),
+        args.scale_matb_dtype.value(),
+        args.matb_is_swizzled,
+        bias ? bias->data_ptr(): nullptr,
+        bias ? bias->scalar_type() : isFloat8Type(out_dtype_) ? at::ScalarType::Half : out_dtype_,
+        args.result->data_ptr(),
+        args.scale_result_ptr,
+        args.result_ld,
+        out_dtype_,
+        scaling_choice == ScalingType::RowWise);
+  }
+
+  return out;
+}
+
+Tensor
+swizzle_scaled_mm(const Tensor& mat_a, const Tensor& mat_b,
+          bool mat1_is_swizzled,
+          bool mat2_is_swizzled,
+          const Tensor& scale_a,
+          const Tensor& scale_b,
+          const std::optional<at::Tensor>& bias,
+          const std::optional<at::Tensor>& scale_result,
+          std::optional<c10::ScalarType> out_dtype) {
+  const auto out_dtype_ = out_dtype.value_or(mat_a.scalar_type());
+  Tensor out = at::empty({0}, mat_a.options().dtype(out_dtype_));
+  return _scaled_mm_out(mat_a, mat_b, mat1_is_swizzled, mat2_is_swizzled, scale_a, scale_b, bias, scale_result, out_dtype, out);
+}
+
+TORCH_LIBRARY_IMPL(torchao, CUDA, m) {
+  m.impl("torchao::swizzle_mm", &swizzle_mm);
+  m.impl("torchao::swizzle_scaled_mm", &swizzle_scaled_mm);
+}
+#endif // USE_ROCM
diff --git a/torchao/swizzle/__init__.py b/torchao/swizzle/__init__.py
new file mode 100644
index 0000000000..7aa001267c
--- /dev/null
+++ b/torchao/swizzle/__init__.py
@@ -0,0 +1,9 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+
+# This source code is licensed under the license found in the
+# LICENSE file in the root directory of this source tree.
+
+from .swizzle_tensor import SwizzleTensor
+
+__all__ = ["SwizzleTensor"]
diff --git a/torchao/swizzle/swizzle_tensor.py b/torchao/swizzle/swizzle_tensor.py
new file mode 100644
index 0000000000..8ddfd9308a
--- /dev/null
+++ b/torchao/swizzle/swizzle_tensor.py
@@ -0,0 +1,143 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+import torch
+from torch.utils._pytree import tree_map
+
+
+# copied from float8_utils.py
+def _get_min_alignment(size: int, alignment_value: int) -> int:
+    return (1 + ((size - 1) // alignment_value)) * alignment_value
+
+
+class SwizzleTensor(torch.Tensor):
+    """
+    A Python-only swizzled tensor subclass.
+
+    Intended usage of this abstraction:
+    Swizzle weight Tensor to avoid LDS use during GEMMs on ROCm hardware.
+    """
+
+    def __new__(
+        cls,
+        original: torch.Tensor,
+        shallow: bool = False,
+    ):
+        wrapper = torch.empty_like(original, device="meta")
+        return torch.Tensor._make_subclass(cls, wrapper)
+
+    def __init__(self, original, shallow=False):
+        if shallow:
+            return
+        # assert original.ndim == 2 or original.ndim == 3  # (M, K) or (B, M, K)
+        assert original.ndim == 2, "SwizzleTensor only supports ndim 2"
+        assert original.itemsize == 1 or original.itemsize == 2
+        kdiv = 32 if original.itemsize == 2 else 64
+        lastdim = 8 if original.itemsize == 2 else 16
+        if original.ndim == 2:
+            M, K = original.shape
+            B = 0
+        if original.ndim == 3:
+            B, M, K = original.shape
+        alignedM = _get_min_alignment(M, 16)
+        alignedK = _get_min_alignment(K, kdiv)
+        paddedM = alignedM - M
+        paddedK = alignedK - K
+        x = torch.nn.functional.pad(original, (0, paddedK, 0, paddedM), "constant", 0)
+        if original.ndim == 2:
+            x = x.view(alignedM // 16, 16, alignedK // kdiv, 4, lastdim)
+            x = x.permute(0, 2, 3, 1, 4)
+        if original.ndim == 3:
+            x = x.view(B, alignedM // 16, 16, alignedK // kdiv, 4, lastdim)
+            x = x.permute(0, 1, 3, 4, 2, 5)
+        self.x = x.contiguous()
+        self.B = B
+        self.M = M
+        self.K = K
+        self.alignedM = alignedM
+        self.alignedK = alignedK
+        self.paddedM = paddedM
+        self.paddedK = paddedK
+        self.original_ndim = original.ndim
+        self.is_transposed = False
+
+    def __repr__(self):
+        return f"{self.__class__.__name__}(original={self.unswizzle()})"
+
+    def unswizzle(self):
+        undone = None
+        if self.original_ndim == 2:
+            undone = self.x.permute(0, 3, 1, 2, 4).contiguous()
+            undone = undone.reshape(self.alignedM, self.alignedK)
+            undone = undone[0 : self.M, 0 : self.K]
+            undone = undone.reshape(self.M, self.K)
+            if self.is_transposed:
+                undone = undone.T
+        if self.original_ndim == 3:
+            undone = self.x.permute(0, 1, 4, 2, 3, 5).contiguous()
+            undone = undone.reshape(self.B, self.alignedM, self.alignedK)
+            undone = undone[0 : self.B, 0 : self.M, 0 : self.K]
+            undone = undone.reshape(self.B, self.M, self.K)
+        return undone
+
+    def as_tensor(self):
+        # note the transpose because this causes col major hipblaslt op to be TN
+        if self.original_ndim == 2:
+            tmp = self.x.reshape(self.alignedM, self.alignedK)
+            if self.is_transposed:
+                tmp = tmp.T
+            return tmp
+        if self.original_ndim == 3:
+            tmp = self.x.reshape(self.B, self.alignedM, self.alignedK)
+            if self.is_transposed:
+                tmp = tmp.T
+            return tmp
+
+    def shallow_transpose(self):
+        shape = (
+            (self.M, self.K) if self.original_ndim == 2 else (self.B, self.M, self.K),
+        )
+        new_obj = SwizzleTensor(
+            torch.empty(*shape, dtype=self.dtype, layout=self.layout, device="meta"),
+            True,
+        )
+        new_obj.x = self.x
+        new_obj.B = self.B
+        new_obj.M = self.M
+        new_obj.K = self.K
+        new_obj.alignedM = self.alignedM
+        new_obj.alignedK = self.alignedK
+        new_obj.paddedM = self.paddedM
+        new_obj.paddedK = self.paddedK
+        new_obj.original_ndim = self.original_ndim
+        new_obj.is_transposed = not self.is_transposed
+        return new_obj
+
+    @property
+    def shape(self):
+        return torch.Size((self.K, self.M) if self.is_transposed else (self.M, self.K))
+
+    def stride(self):
+        return (1, self.K) if self.is_transposed else (self.K, 1)
+
+    @classmethod
+    def __torch_dispatch__(cls, func, types, args, kwargs=None):
+        # Lazy import to avoid circular dependency
+        from torchao.swizzle.swizzle_ops import SWIZZLE_OPS_TABLE
+
+        if func in SWIZZLE_OPS_TABLE:
+            return SWIZZLE_OPS_TABLE[func](func, args, kwargs)
+
+        def unwrap(e):
+            return e.unswizzle() if isinstance(e, SwizzleTensor) else e
+
+        def wrap(e):
+            return SwizzleTensor(e) if isinstance(e, torch.Tensor) else e
+
+        return tree_map(wrap, func(*tree_map(unwrap, args), **tree_map(unwrap, kwargs)))
+
+    # Do not force the SwizzleTensor type on the returned tensor
+    __torch_function__ = torch._C._disabled_torch_function_impl

From 0b33f1218157d40e1f3b8ba1d345e4d85c184f9e Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Wed, 28 May 2025 10:26:26 -0700
Subject: [PATCH 055/165] Add support for fbgemm int4 mm kernel (#2255)

* Add support for fbgemm int4 mm kernel

Summary:
we also plan to expose some other kernels like fp8xint4
and bf16xfp8, fp8xfp8 to compare with existing torchao kernels

Test Plan:
test/dtypes/test_fbgemm_int4_tensor.py

Reviewers:

Subscribers:

Tasks:

Tags:

* fix and test

* fix dtype

* use importlib

* add links to fbgemm code

* update io_dtype type

* renaming

* remove enum

* serializability update

* format

* fix tests

* skip fbgemm config tests for 2.5 and below
---
 test/dtypes/test_fbgemm_quantized.py          |  44 +++++
 test/dtypes/test_fbgemm_quantized_tensor.py   |  48 ++++++
 .../quantization/test_config_serialization.py |   6 +
 torchao/_models/llama/generate.py             |  13 +-
 torchao/core/config.py                        |  13 +-
 torchao/dtypes/__init__.py                    |   2 +
 torchao/dtypes/fbgemm_quantized_tensor.py     | 161 ++++++++++++++++++
 torchao/quantization/__init__.py              |   2 +
 torchao/quantization/quant_api.py             |  63 ++++++-
 torchao/utils.py                              |  10 ++
 10 files changed, 355 insertions(+), 7 deletions(-)
 create mode 100644 test/dtypes/test_fbgemm_quantized.py
 create mode 100644 test/dtypes/test_fbgemm_quantized_tensor.py
 create mode 100644 torchao/dtypes/fbgemm_quantized_tensor.py

diff --git a/test/dtypes/test_fbgemm_quantized.py b/test/dtypes/test_fbgemm_quantized.py
new file mode 100644
index 0000000000..fe2573530c
--- /dev/null
+++ b/test/dtypes/test_fbgemm_quantized.py
@@ -0,0 +1,44 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+import unittest
+
+import torch
+from torch.testing._internal.common_utils import (
+    TestCase,
+    run_tests,
+)
+
+from torchao.quantization import (
+    FbgemmConfig,
+    quantize_,
+)
+from torchao.quantization.utils import compute_error
+from torchao.utils import is_sm_at_least_90
+
+
+class TestFbgemmInt4Tensor(TestCase):
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    @unittest.skipIf(not is_sm_at_least_90(), "Nedd sm90+")
+    def test_linear(self):
+        dtype = torch.bfloat16
+        device = "cuda"
+        input = torch.randn(1, 128, dtype=dtype, device=device)
+        linear = torch.nn.Linear(128, 256, dtype=dtype, device=device)
+        original = linear(input)
+        config = FbgemmConfig(
+            input_dtype=torch.bfloat16,
+            weight_dtype=torch.int4,
+            output_dtype=torch.bfloat16,
+            block_size=(1, 128),
+        )
+        quantize_(linear, config)
+        quantized = linear(input)
+        self.assertTrue(compute_error(original, quantized) > 20)
+
+
+if __name__ == "__main__":
+    run_tests()
diff --git a/test/dtypes/test_fbgemm_quantized_tensor.py b/test/dtypes/test_fbgemm_quantized_tensor.py
new file mode 100644
index 0000000000..51b68dd977
--- /dev/null
+++ b/test/dtypes/test_fbgemm_quantized_tensor.py
@@ -0,0 +1,48 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+import unittest
+
+import torch
+from torch.testing._internal.common_utils import (
+    TestCase,
+    run_tests,
+)
+
+from torchao.quantization import (
+    FbgemmConfig,
+    quantize_,
+)
+from torchao.quantization.utils import compute_error
+from torchao.utils import (
+    TORCH_VERSION_AT_LEAST_2_6,
+    is_sm_at_least_90,
+)
+
+
+class TestFbgemmInt4Tensor(TestCase):
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    @unittest.skipIf(not is_sm_at_least_90(), "Nedd sm90+")
+    @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_6, "Need torch >= 2.6")
+    def test_linear(self):
+        dtype = torch.bfloat16
+        device = "cuda"
+        input = torch.randn(1, 128, dtype=dtype, device=device)
+        linear = torch.nn.Linear(128, 256, dtype=dtype, device=device)
+        original = linear(input)
+        config = FbgemmConfig(
+            input_dtype=torch.bfloat16,
+            weight_dtype=torch.int4,
+            output_dtype=torch.bfloat16,
+            block_size=[1, 128],
+        )
+        quantize_(linear, config)
+        quantized = linear(input)
+        self.assertTrue(compute_error(original, quantized) > 20)
+
+
+if __name__ == "__main__":
+    run_tests()
diff --git a/test/quantization/test_config_serialization.py b/test/quantization/test_config_serialization.py
index 3b0a10e915..71cf8e144d 100644
--- a/test/quantization/test_config_serialization.py
+++ b/test/quantization/test_config_serialization.py
@@ -20,6 +20,7 @@
     config_to_dict,
 )
 from torchao.quantization.quant_api import (
+    FbgemmConfig,
     Float8DynamicActivationFloat8WeightConfig,
     Float8WeightOnlyConfig,
     FPXWeightOnlyConfig,
@@ -34,11 +35,13 @@
     UIntXWeightOnlyConfig,
 )
 from torchao.sparsity.sparse_api import BlockSparseWeightConfig, SemiSparseWeightConfig
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_6
 
 # Define test configurations as fixtures
 configs = [
     Float8DynamicActivationFloat8WeightConfig(),
     Float8DynamicActivationFloat8WeightConfig(granularity=PerRow()),
+    Float8DynamicActivationFloat8WeightConfig(granularity=[PerRow(), PerRow()]),
     Float8WeightOnlyConfig(
         weight_dtype=torch.float8_e4m3fn,
     ),
@@ -78,6 +81,9 @@
     ),
 ]
 
+if TORCH_VERSION_AT_LEAST_2_6:
+    configs += [FbgemmConfig(torch.bfloat16, torch.int4, torch.bfloat16, [1, 1, 256])]
+
 
 # Create ids for better test naming
 def get_config_ids(configs):
diff --git a/torchao/_models/llama/generate.py b/torchao/_models/llama/generate.py
index dc03204b46..c17de52028 100644
--- a/torchao/_models/llama/generate.py
+++ b/torchao/_models/llama/generate.py
@@ -439,6 +439,17 @@ def ffn_or_attn_only(mod, fqn):
                 f"int4wo group_size needs to be one of [32,64,128,256] but got {group_size}"
             )
             quantize_(model, int4_weight_only(group_size=group_size, use_hqq=use_hqq))
+        elif "fbgemm" in quantization:
+            from torchao.quantization import FbgemmConfig
+
+            _, precision, group_size = quantization.split("-")
+            group_size = int(group_size)
+            if precision == "int4":
+                quantize_(model, FbgemmConfig("bf16i4bf16", group_size))
+            else:
+                raise NotImplementedError(
+                    f"FbegemmConfig({precision=}) not supported yet"
+                )
         elif "int4dq-" in quantization:
             from torchao.dtypes import CutlassInt4PackedLayout
 
@@ -1163,7 +1174,7 @@ def callback(x):
         help=(
             "Which quantization techniques to apply: int8dq, int8wo, fp6, int4wo-<groupsize>, int4wo-<groupsize>-hqq, autoquant, "
             + "autoquant-int4, autoquant-gemlite-int4, autoquant-float8, autoquant-sparse, autoquant-all, uintx-<nbits>-<groupsize>, uintx-<nbits>-<groupsize>-hqq, sparse-marlin, spinquant, "
-            + "embed-int8wo, marlin_qqq, gemlite-<pack_bitwidth>-<nbits>-<groupsize>, float8dq, int4dq-<nbits>"
+            + "embed-int8wo, marlin_qqq, gemlite-<pack_bitwidth>-<nbits>-<groupsize>, float8dq, int4dq-<nbits>, fbgemm-int4-<group_size>"
         ),
     )
     parser.add_argument(
diff --git a/torchao/core/config.py b/torchao/core/config.py
index d2d49981c9..3451b90c59 100644
--- a/torchao/core/config.py
+++ b/torchao/core/config.py
@@ -132,6 +132,12 @@ def default(self, o):
         if isinstance(o, list):
             return [self.encode_value(item) for item in o]
 
+        elif isinstance(o, tuple):
+            raise NotImplementedError(
+                "Tuples will be serialized as List in JSON, so we recommend to use "
+                f"Lists instead to avoid surprises. got: {o}"
+            )
+
         if isinstance(o, dict):
             return {k: self.encode_value(v) for k, v in o.items()}
 
@@ -250,13 +256,18 @@ def config_from_dict(data: Dict[str, Any]) -> AOBaseConfig:
             # Recursively handle nested configs
             processed_data[key] = config_from_dict(value)
         elif isinstance(value, list):
-            # Handle lists of possible configs
+            # Handle lists or tuples of possible configs
             processed_data[key] = [
                 config_from_dict(item)
                 if isinstance(item, dict) and "_type" in item and "_data" in item
                 else item
                 for item in value
             ]
+        elif isinstance(value, tuple):
+            raise NotImplementedError(
+                "Tuples will be serialized as List in JSON, so we recommend to use "
+                f"Lists instead to avoid surprises. got: {value}"
+            )
         elif isinstance(value, dict):
             # Handle dicts of possible configs
             processed_data[key] = {
diff --git a/torchao/dtypes/__init__.py b/torchao/dtypes/__init__.py
index eb253c11bc..1003491828 100644
--- a/torchao/dtypes/__init__.py
+++ b/torchao/dtypes/__init__.py
@@ -8,6 +8,7 @@
     to_affine_quantized_intx,
     to_affine_quantized_intx_static,
 )
+from .fbgemm_quantized_tensor import to_fbgemm_quantized
 from .floatx import (
     CutlassSemiSparseLayout,
     Float8Layout,
@@ -61,4 +62,5 @@
     "PackedLinearInt8DynamicActivationIntxWeightLayout",
     "to_affine_quantized_packed_linear_int8_dynamic_activation_intx_weight",
     "Int4XPULayout",
+    "to_fbgemm_quantized",
 ]
diff --git a/torchao/dtypes/fbgemm_quantized_tensor.py b/torchao/dtypes/fbgemm_quantized_tensor.py
new file mode 100644
index 0000000000..fd788a73a3
--- /dev/null
+++ b/torchao/dtypes/fbgemm_quantized_tensor.py
@@ -0,0 +1,161 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+
+import importlib.util
+from typing import List
+
+import torch
+from torch.utils._python_dispatch import return_and_correct_aliasing
+
+from torchao.utils import TorchAOBaseTensor
+
+__all__ = [
+    "to_fbgemm_quantized",
+]
+
+aten = torch.ops.aten
+
+
+if importlib.util.find_spec("fbgemm_gpu") is None:
+    int4_row_quantize_zp = None
+    pack_int4 = None
+else:
+    from fbgemm_gpu.experimental.gen_ai.quantize import int4_row_quantize_zp, pack_int4
+
+
+class FbgemmInt4Tensor(TorchAOBaseTensor):
+    tensor_data_attrs = ["packed_weight", "scale", "zero_point"]
+    tensor_attributes = ["group_size"]
+
+    def __new__(cls, packed_weight, scale, zero_point, group_size):
+        shape = packed_weight.shape
+        kwargs = {}
+        kwargs["device"] = packed_weight.device
+        kwargs["dtype"] = scale.dtype
+        kwargs["requires_grad"] = False
+        return torch.Tensor._make_wrapper_subclass(cls, shape, **kwargs)  # type: ignore[attr-defined]
+
+    def __init__(self, packed_weight, scale, zero_point, group_size):
+        self.packed_weight = packed_weight
+        self.scale = scale
+        self.zero_point = zero_point
+        self.group_size = group_size
+
+    def __tensor_flatten__(self):
+        return self.tensor_data_attrs, [
+            getattr(self, attr) for attr in self.tensor_attributes
+        ]
+
+    @classmethod
+    def __tensor_unflatten__(
+        cls, tensor_data_dict, tensor_attributes, outer_size, outer_stride
+    ):
+        return cls(
+            *[tensor_data_dict[name] for name in cls.tensor_data_attrs],
+            *tensor_attributes,
+        )
+
+    def _apply_fn_to_data(self, fn):
+        return self.__class__(
+            *[fn(getattr(self, attr)) for attr in self.tensor_data_attrs],
+            *[getattr(self, attr) for attr in self.tensor_attributes],
+        )
+
+    def __repr__(self):
+        return (
+            f"{self.__class__.__name__}(weight={self.packed_weight}, group_size={self.group_size}, "
+            f"shape={self.shape}, device={self.device}, dtype={self.dtype}, requires_grad={self.requires_grad})"
+        )
+
+    @classmethod
+    def from_float(
+        cls,
+        w: torch.Tensor,
+        input_dtype: torch.dtype,
+        weight_dtype: torch.dtype,
+        output_dtype: torch.dtype,
+        block_size: List[int],
+    ):
+        assert len(block_size) == w.ndim, (
+            f"Expecting the length of block_size to be equal to the dimension of the weight, got {block_size=} and {w.ndim=}"
+        )
+        group_size = block_size[-1]
+
+        assert (input_dtype, weight_dtype, output_dtype) == (
+            torch.bfloat16,
+            torch.int4,
+            torch.bfloat16,
+        )
+
+        if w.ndim >= 3:
+            wq, scale, zero_point = zip(
+                *[int4_row_quantize_zp(i, group_size) for i in w], strict=False
+            )
+            wq = torch.stack([pack_int4(i) for i in wq], dim=0)
+            scale = torch.stack(scale, dim=0)
+            zero_point = torch.stack(zero_point, dim=0)
+        else:
+            wq, scale, zero_point = int4_row_quantize_zp(w, group_size)
+            wq = pack_int4(wq)
+
+        scale = scale.to(w.dtype)
+        zero_point = zero_point.to(w.dtype)
+
+        del w
+        return FbgemmInt4Tensor(
+            packed_weight=wq,
+            scale=scale,
+            zero_point=zero_point,
+            group_size=group_size,
+        )
+
+
+implements = FbgemmInt4Tensor.implements
+
+
+@implements([torch.nn.functional.linear, aten.linear.default])
+def _(func, types, args, kwargs):
+    input_tensor, weight_tensor, bias = (
+        args[0],
+        args[1],
+        args[2] if len(args) > 2 else None,
+    )
+    if not input_tensor.is_floating_point():
+        raise NotImplementedError(
+            f"{func} is not implemented for non floating point input"
+        )
+
+    orig_act_size = input_tensor.size()
+    orig_out_features = weight_tensor.shape[-2]
+
+    res = torch.ops.fbgemm.bf16i4bf16_rowwise(
+        input_tensor,
+        weight_tensor.packed_weight,
+        weight_tensor.scale,
+        weight_tensor.zero_point,
+    )
+    if bias is not None:
+        res = res + bias
+    return res.reshape(*orig_act_size[:-1], orig_out_features)
+
+
+@implements([aten.detach.default, aten.alias.default])
+def _(func, types, args, kwargs):
+    return return_and_correct_aliasing(
+        func, args, kwargs, args[0]._apply_fn_to_data(torch.detach)
+    )
+
+
+@implements([aten.clone.default, aten.copy_.default])
+def _(func, types, args, kwargs):
+    return return_and_correct_aliasing(
+        func, args, kwargs, args[0]._apply_fn_to_data(torch.clone)
+    )
+
+
+# We can have `to_fbgemm_tensor` to dispatch to different Fbgemm tensors later
+to_fbgemm_quantized = FbgemmInt4Tensor.from_float
diff --git a/torchao/quantization/__init__.py b/torchao/quantization/__init__.py
index b4d46d8263..73ccd2e0ff 100644
--- a/torchao/quantization/__init__.py
+++ b/torchao/quantization/__init__.py
@@ -40,6 +40,7 @@
 )
 from .quant_api import (
     CutlassInt4PackedLayout,
+    FbgemmConfig,
     Float8DynamicActivationFloat8SemiSparseWeightConfig,
     Float8DynamicActivationFloat8WeightConfig,
     Float8MMConfig,
@@ -148,6 +149,7 @@
     "FPXWeightOnlyConfig",
     "GemliteUIntXWeightOnlyConfig",
     "ModuleFqnToConfig",
+    "FbgemmConfig",
     # smooth quant - subject to change
     "get_scale",
     "SmoothFakeDynQuantMixin",
diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index f2aca97782..ada19859bc 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -15,11 +15,12 @@
 and mixed GEMM kernels
 """
 
+import importlib.util
 import logging
 import types
 import warnings
 from dataclasses import dataclass, field
-from typing import Any, Callable, Dict, Optional, Tuple, Union
+from typing import Any, Callable, Dict, List, Optional, Tuple, Union
 
 import torch
 import torch.nn as nn
@@ -45,6 +46,7 @@
     to_affine_quantized_floatx,
     to_affine_quantized_floatx_static,
     to_affine_quantized_intx,
+    to_fbgemm_quantized,
     to_marlinqqq_quantized_intx,
 )
 from torchao.dtypes.uintx.packed_linear_int8_dynamic_activation_intx_weight_layout import (
@@ -142,6 +144,7 @@
     "Int8DynActInt4WeightGPTQQuantizer",
     "Float8DynamicActivationFloat8SemiSparseWeightConfig",
     "ModuleFqnToConfig",
+    "FbgemmConfig",
 ]
 
 LAYOUT_TO_ZERO_POINT_DOMAIN = {
@@ -1525,9 +1528,7 @@ class Float8DynamicActivationFloat8WeightConfig(AOBaseConfig):
 
     activation_dtype: torch.dtype = e4m3_dtype
     weight_dtype: torch.dtype = e4m3_dtype
-    granularity: Optional[
-        Union[FP8Granularity, Tuple[FP8Granularity, FP8Granularity]]
-    ] = None
+    granularity: Optional[Union[FP8Granularity, List[FP8Granularity]]] = None
     mm_config: Optional[Float8MMConfig] = None
     set_inductor_config: bool = True
 
@@ -1538,7 +1539,7 @@ def __post_init__(self):
         activation_granularity, weight_granularity = _normalize_granularity(
             self.granularity
         )
-        self.granularity = (activation_granularity, weight_granularity)
+        self.granularity = [activation_granularity, weight_granularity]
 
 
 # for bc
@@ -1967,6 +1968,58 @@ def _fpx_weight_only_transform(
     return module
 
 
+@dataclass
+class FbgemmConfig(AOBaseConfig):
+    """Quantization Config for fbgemm-genai kernels
+    Args:
+       input_dtype (torch.dtype): input dtype of the kernel
+       weight_dtype (torch.dtype): weight dtype of the kernel
+       output_dtype (torch.dtype): output dtype of the kernel
+       group_size (int): The group size for weight
+    """
+
+    input_dtype: torch.dtype
+    weight_dtype: torch.dtype
+    output_dtype: torch.dtype
+    block_size: List[int]
+
+
+@register_quantize_module_handler(FbgemmConfig)
+def _(module: torch.nn.Module, config: FbgemmConfig) -> torch.nn.Module:
+    # TODO: use is_package_at_least("fbgemm_gpu", "1.2.0") when
+    # https://github.com/pytorch/FBGEMM/issues/4198 is fixed
+    if importlib.util.find_spec("fbgemm_gpu") is None:
+        raise ImportError("Requires fbgemm-gpu-genai >= 1.2.0")
+
+    import fbgemm_gpu.experimental.gen_ai  # noqa: F401
+
+    if fbgemm_gpu.__version__ < "1.2.0":
+        raise ImportError("Requires fbgemm-gpu-genai >= 1.2.0")
+
+    _SUPPORTED_DTYPES = {
+        (torch.bfloat16, torch.int4, torch.bfloat16),
+    }
+
+    if (
+        config.input_dtype,
+        config.weight_dtype,
+        config.output_dtype,
+    ) in _SUPPORTED_DTYPES:
+        weight = to_fbgemm_quantized(
+            module.weight,
+            config.input_dtype,
+            config.weight_dtype,
+            config.output_dtype,
+            config.block_size,
+        )
+        module.weight = torch.nn.Parameter(weight, requires_grad=False)
+        module.extra_repr = types.MethodType(_linear_extra_repr, module)
+    else:
+        raise NotImplementedError(
+            f"{config} is not supported. supported input, weight, output kernel dtypes are: {_SUPPORTED_DTYPES}"
+        )
+
+
 @dataclass
 class ModuleFqnToConfig(AOBaseConfig):
     """Per module configurations for torchao quantize_ API
diff --git a/torchao/utils.py b/torchao/utils.py
index 280da4e632..1fa395cb8a 100644
--- a/torchao/utils.py
+++ b/torchao/utils.py
@@ -4,6 +4,7 @@
 # This source code is licensed under the BSD 3-Clause license found in the
 # LICENSE file in the root directory of this source tree.
 import functools
+import importlib
 import itertools
 import re
 import time
@@ -40,6 +41,7 @@
     "is_MI300",
     "is_sm_at_least_89",
     "is_sm_at_least_90",
+    "is_package_at_least",
 ]
 
 
@@ -694,3 +696,11 @@ def check_xpu_version(device, version="2.8.0"):
 TORCH_VERSION_AFTER_2_4 = _torch_version_at_least("2.4.0.dev")
 TORCH_VERSION_AFTER_2_3 = _torch_version_at_least("2.3.0.dev")
 TORCH_VERSION_AFTER_2_2 = _torch_version_at_least("2.2.0.dev")
+
+
+def is_package_at_least(package_name: str, min_version: str):
+    package_exists = importlib.util.find_spec(package_name) is not None
+    if not package_exists:
+        return False
+
+    return version(package_name) >= min_version

From 4d5f65711f7c53985d09e3a8c6aa8d8549f7d5a4 Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Wed, 28 May 2025 10:52:59 -0700
Subject: [PATCH 056/165] integration-vllm-test (#2258)

stack-info: PR: https://github.com/pytorch/ao/pull/2258, branch: drisspg/stack/58
---
 test/integration/test_vllm.py | 252 ++++++++++++++++++++++++++++++++++
 1 file changed, 252 insertions(+)
 create mode 100644 test/integration/test_vllm.py

diff --git a/test/integration/test_vllm.py b/test/integration/test_vllm.py
new file mode 100644
index 0000000000..c750a7b562
--- /dev/null
+++ b/test/integration/test_vllm.py
@@ -0,0 +1,252 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+import importlib.util
+import os
+import random
+import shutil
+from pathlib import Path
+from typing import List
+
+import numpy as np
+import pytest
+import torch
+
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_7
+
+if not TORCH_VERSION_AT_LEAST_2_7:
+    pytest.skip("Requires PyTorch 2.7 or higher", allow_module_level=True)
+
+
+VLLM_AVAILABLE = importlib.util.find_spec("vllm") is not None
+TRANSFORMERS_AVAILABLE = importlib.util.find_spec("transformers") is not None
+
+if not VLLM_AVAILABLE:
+    pytest.skip("vLLM not installed", allow_module_level=True)
+
+if not TRANSFORMERS_AVAILABLE:
+    pytest.skip("transformers not installed", allow_module_level=True)
+
+from transformers import AutoModelForCausalLM, AutoTokenizer, TorchAoConfig
+from vllm import LLM, SamplingParams
+
+from torchao.quantization.granularity import PerRow, PerTensor
+from torchao.quantization.quant_api import (
+    CutlassInt4PackedLayout,
+    Float8DynamicActivationFloat8WeightConfig,
+    Int8DynamicActivationInt4WeightConfig,
+    Int8WeightOnlyConfig,
+)
+
+
+def get_tests() -> List[TorchAoConfig]:
+    """Get all the tests based off of device info"""
+
+    # Helper objects for granularity
+    per_tensor = PerTensor()
+    per_row = PerRow()
+
+    BASE_TESTS = [TorchAoConfig(Int8WeightOnlyConfig())]
+    SM89_TESTS = [
+        TorchAoConfig(
+            Float8DynamicActivationFloat8WeightConfig(granularity=per_tensor)
+        ),
+        TorchAoConfig(Float8DynamicActivationFloat8WeightConfig(granularity=per_row)),
+    ]
+    SM90_ONLY_TESTS = [
+        TorchAoConfig(
+            Int8DynamicActivationInt4WeightConfig(layout=CutlassInt4PackedLayout())
+        )
+    ]
+    SM100_TESTS = [
+        # TorchAoConfig(MXFPInferenceConfig())
+    ]  # Failing for : https://github.com/pytorch/ao/issues/2239
+
+    # Check CUDA availability first
+    if not torch.cuda.is_available():
+        return []  # No CUDA, no tests
+
+    major, minor = torch.cuda.get_device_capability()
+
+    # Build test list based on compute capability
+    all_tests = []
+
+    # Always include base tests if we have CUDA
+    all_tests.extend(BASE_TESTS)
+
+    # Add SM89+ tests
+    if major > 8 or (major == 8 and minor >= 9):
+        all_tests.extend(SM89_TESTS)
+
+    # Add SM100+ tests
+    if major >= 10:
+        all_tests.extend(SM100_TESTS)
+
+    # Only work for sm 90
+    if major == 9:
+        all_tests.extend(SM90_ONLY_TESTS)
+
+    return all_tests
+
+
+class TestVLLMIntegration:
+    """Integration tests for vLLM with quantized models."""
+
+    @classmethod
+    def setup_class(cls):
+        """Set up test environment."""
+        # Set seeds for reproducibility
+        cls.set_seed(42)
+
+        # See https://github.com/pytorch/ao/issues/2239 for details
+        os.environ["VLLM_TEST_STANDALONE_COMPILE"] = "1"
+        # For Small testing this makes it faster
+        os.environ["VLLM_ENABLE_V1_MULTIPROCESSING"] = "0"
+
+    @classmethod
+    def teardown_class(cls):
+        """Clean up after all tests."""
+        torch.cuda.empty_cache()
+        import gc
+
+        gc.collect()
+
+    def setup_method(self, method):
+        """Clean up before each test method."""
+        torch.cuda.empty_cache()
+        import gc
+
+        gc.collect()
+
+    def teardown_method(self, method):
+        """Clean up after each test method."""
+        torch.cuda.empty_cache()
+        import gc
+
+        gc.collect()
+
+    @staticmethod
+    def set_seed(seed):
+        """Set random seeds for reproducibility."""
+        random.seed(seed)
+        np.random.seed(seed)
+        torch.manual_seed(seed)
+        torch.cuda.manual_seed_all(seed)
+
+    def quantize_and_save_model(
+        self,
+        model_name: str,
+        quantization_config: TorchAoConfig,
+        output_dir: Path,
+    ):
+        """Quantize a model and save it to disk."""
+        # Load and quantize model
+        quantized_model = AutoModelForCausalLM.from_pretrained(
+            model_name,
+            torch_dtype="bfloat16",
+            device_map="cuda",
+            quantization_config=quantization_config,
+        )
+        tokenizer = AutoTokenizer.from_pretrained(model_name)
+        # Save quantized model
+        quantized_model.save_pretrained(output_dir, safe_serialization=False)
+        tokenizer.save_pretrained(output_dir)
+
+        # Clean up to free memory
+        del quantized_model
+        torch.cuda.empty_cache()
+
+        return output_dir
+
+    def cleanup_model_directory(self, model_path: Path):
+        """Clean up the model directory safely."""
+        try:
+            if model_path.exists() and model_path.is_dir():
+                shutil.rmtree(model_path)
+        except (OSError, PermissionError) as e:
+            # Log the error but don't fail the test
+            print(f"Warning: Failed to clean up {model_path}: {e}")
+
+    @pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+    @pytest.mark.skipif(not VLLM_AVAILABLE, reason="vLLM not installed")
+    @pytest.mark.parametrize(
+        "quantization_config", get_tests(), ids=lambda config: f"{config.quant_type}"
+    )
+    @pytest.mark.parametrize("compile", [True, False])
+    @pytest.mark.parametrize(
+        "tp_size", [1, 2] if torch.cuda.device_count() > 1 else [1]
+    )
+    def test_vllm_smoke_test(self, tmp_path, quantization_config, compile, tp_size):
+        """Test vLLM generation with quantized models."""
+        # Skip per_row tests if not supported
+        torch._dynamo.reset()
+
+        # Use a small model for testing
+        base_model = "facebook/opt-125m"
+
+        # Create a descriptive name for the output directory
+        config_name = str(quantization_config).replace("/", "_").replace(" ", "_")[:50]
+        output_dir = tmp_path / f"{config_name}-opt-125m"
+
+        llm = None
+        quantized_model_path = None
+
+        try:
+            # Quantize the model
+            quantized_model_path = self.quantize_and_save_model(
+                base_model, quantization_config, output_dir
+            )
+
+            # Test generation with vLLM
+            sampling_params = SamplingParams(
+                temperature=0.8,
+                top_p=0.95,
+                seed=42,
+                max_tokens=16,  # Small for testing
+            )
+
+            # Create LLM instance
+            llm = LLM(
+                model=str(quantized_model_path),
+                tensor_parallel_size=tp_size,
+                enforce_eager=not compile,
+                dtype="bfloat16",
+                num_gpu_blocks_override=128,
+            )
+
+            # Test prompts
+            prompts = [
+                "Hello, my name is",
+                "The capital of France is",
+            ]
+
+            # Generate outputs
+            outputs = llm.generate(prompts, sampling_params)
+
+            # Verify outputs
+            assert len(outputs) == len(prompts)
+            for output in outputs:
+                assert output.prompt in prompts
+                assert len(output.outputs) > 0
+                generated_text = output.outputs[0].text
+                assert isinstance(generated_text, str)
+                assert len(generated_text) > 0
+
+        finally:
+            # Clean up resources
+            if llm is not None:
+                del llm
+
+            # Clean up CUDA memory
+            torch.cuda.empty_cache()
+
+            # Clean up the saved model directory
+            if quantized_model_path is not None:
+                self.cleanup_model_directory(quantized_model_path)
+
+
+if __name__ == "__main__":
+    pytest.main([__file__, "-v"])

From 0aa8dbd8b8e9547195bc670ddb2a8f3ce8416746 Mon Sep 17 00:00:00 2001
From: "Zhang, Liangang" <liangang.zhang@intel.com>
Date: Thu, 29 May 2025 17:06:57 +0800
Subject: [PATCH 057/165] Enable fp16+int4 mixed precission path for int4 xpu
 path with int zero point (#2240)

* Enable fp16 path for int4 xpu path with int zero point

* Update int4_xpu_layout.py

* Fix typo
---
 torchao/dtypes/affine_quantized_tensor_ops.py |  9 ++++-----
 torchao/dtypes/uintx/int4_xpu_layout.py       | 10 +++-------
 2 files changed, 7 insertions(+), 12 deletions(-)

diff --git a/torchao/dtypes/affine_quantized_tensor_ops.py b/torchao/dtypes/affine_quantized_tensor_ops.py
index e9702a33ac..20d87de8cf 100644
--- a/torchao/dtypes/affine_quantized_tensor_ops.py
+++ b/torchao/dtypes/affine_quantized_tensor_ops.py
@@ -46,8 +46,8 @@
 from torchao.dtypes.uintx.int4_xpu_layout import (
     _linear_bf16_act_uint4_weight_float_zero_check,
     _linear_bf16_act_uint4_weight_float_zero_impl,
-    _linear_bf16_act_uint4_weight_int8_zero_check,
-    _linear_bf16_act_uint4_weight_int8_zero_impl,
+    _linear_fp_act_uint4_weight_int8_zero_check,
+    _linear_fp_act_uint4_weight_int8_zero_impl,
 )
 from torchao.dtypes.uintx.marlin_qqq_tensor import (
     _linear_int8_act_int4_weight_marlin_qqq_check,
@@ -240,8 +240,8 @@ def _register_aqt_quantized_linear_dispatches():
             _linear_q_dq_impl,
         ),
         (
-            _linear_bf16_act_uint4_weight_int8_zero_check,
-            _linear_bf16_act_uint4_weight_int8_zero_impl,
+            _linear_fp_act_uint4_weight_int8_zero_check,
+            _linear_fp_act_uint4_weight_int8_zero_impl,
         ),
         (
             _linear_bf16_act_uint4_weight_float_zero_check,
@@ -267,7 +267,6 @@ def _(func, types, args, kwargs):
         raise NotImplementedError(
             f"{func} is not implemented for non floating point input"
         )
-
     # using try/except here so that we can have a general fallback when input_tensor/weight_tensor
     # is not picked up by any of the dispatch paths in `_quantized_linear_op`, this allows us to
     # make the branches easier to understand in `_quantized_linear_op`
diff --git a/torchao/dtypes/uintx/int4_xpu_layout.py b/torchao/dtypes/uintx/int4_xpu_layout.py
index 99370b0848..76f5ecb121 100644
--- a/torchao/dtypes/uintx/int4_xpu_layout.py
+++ b/torchao/dtypes/uintx/int4_xpu_layout.py
@@ -89,26 +89,22 @@ def _linear_bf16_act_uint4_weight_float_zero_impl(input_tensor, weight_tensor, b
     return y.to(orig_dtype)
 
 
-def _linear_bf16_act_uint4_weight_int8_zero_check(input_tensor, weight_tensor, bias):
+def _linear_fp_act_uint4_weight_int8_zero_check(input_tensor, weight_tensor, bias):
     return (
-        # input is native bfloat16 tensor
         not is_traceable_wrapper_subclass(input_tensor)
-        and input_tensor.dtype == torch.bfloat16
         and
         # weight is uint4, group quantized tensor_core_tiled tensor impl affine quantized tensor
         isinstance(weight_tensor, AffineQuantizedTensor)
         and _aqt_is_xpu_layout_uint4(weight_tensor)
-        and weight_tensor.dtype == torch.bfloat16
         and len(weight_tensor.shape) == 2
         and weight_tensor.zero_point_domain == ZeroPointDomain.INT
         and weight_tensor.tensor_impl.scale_and_zero is None
-        and weight_tensor.tensor_impl.scale.dtype == torch.bfloat16
         and weight_tensor.tensor_impl.zero.dtype == torch.int8
         and isinstance(weight_tensor._layout, Int4XPULayout)
     )
 
 
-def _linear_bf16_act_uint4_weight_int8_zero_impl(input_tensor, weight_tensor, bias):
+def _linear_fp_act_uint4_weight_int8_zero_impl(input_tensor, weight_tensor, bias):
     assert weight_tensor.block_size[0] == 1, (
         f"Requires groupwise quantization, got block_size: {weight_tensor.block_size}"
     )
@@ -129,7 +125,7 @@ def _linear_bf16_act_uint4_weight_int8_zero_impl(input_tensor, weight_tensor, bi
     orig_act_size = act_mat.size()
     orig_dtype = act_mat.dtype
 
-    act_mat = act_mat.reshape(-1, act_mat.shape[-1]).to(torch.bfloat16)
+    act_mat = act_mat.reshape(-1, act_mat.shape[-1])
 
     # groupwise int4 quantization
     groupsize = weight_tensor.block_size[1]

From 756d07405dc44cdc1fdaba40873c06e34ab4057b Mon Sep 17 00:00:00 2001
From: Scott Roy <161522778+metascroy@users.noreply.github.com>
Date: Thu, 29 May 2025 10:10:59 -0700
Subject: [PATCH 058/165] Fix torchao generate script for cpu device (#2267)

* up

* up
---
 torchao/_models/llama/generate.py | 9 ++++++---
 1 file changed, 6 insertions(+), 3 deletions(-)

diff --git a/torchao/_models/llama/generate.py b/torchao/_models/llama/generate.py
index c17de52028..1f56e71f07 100644
--- a/torchao/_models/llama/generate.py
+++ b/torchao/_models/llama/generate.py
@@ -180,6 +180,7 @@ def generate(
     max_seq_length = (
         min(T + max_new_tokens, model.config.block_size) if not interactive else 350
     )
+    print(f"max_seq_length={max_seq_length}, prompt_length={T}")
     new_tokens = max_seq_length - T
 
     # format model input
@@ -242,11 +243,13 @@ def encode_tokens(tokenizer, string, bos=True, device=default_device):
 
 
 def _load_model(checkpoint_path, device, precision):
-    checkpoint = torch.load(str(checkpoint_path), mmap=True, weights_only=True)
+    checkpoint = torch.load(
+        str(checkpoint_path), mmap=True, weights_only=True, map_location=device
+    )
     if "model" in checkpoint and "stories" in str(checkpoint_path):
         checkpoint = checkpoint["model"]
     with torch.device("meta"):
-        model = Transformer.from_name(checkpoint_path.parent.name)
+        model = Transformer.from_name(checkpoint_path)
     model.load_state_dict(checkpoint, assign=True)
     model = model.to(device=device, dtype=precision)
 
@@ -585,7 +588,7 @@ def ffn_or_attn_only(mod, fqn):
             weight_dtype = getattr(torch, f"int{_quant_args[1]}")
             group_size = int(_quant_args[2])
             granularity = PerGroup(group_size) if group_size > 0 else PerAxis(0)
-            is_asymmetric = bool(_quant_args[3])
+            is_asymmetric = bool(_quant_args[3].lower() == "true")
             quantize_(
                 model,
                 Int8DynamicActivationIntxWeightConfig(

From 1b61c82323823fe83456f82c92df142173804350 Mon Sep 17 00:00:00 2001
From: andrewor14 <andrewor14@gmail.com>
Date: Thu, 29 May 2025 15:18:31 -0400
Subject: [PATCH 059/165] Enable range learning for QAT

Differential Revision: D72754131

Pull Request resolved: https://github.com/pytorch/ao/pull/2033
---
 test/quantization/test_qat.py              | 117 +++++++++++++++++++++
 third_party/cutlass                        |   2 +-
 torchao/quantization/qat/__init__.py       |   8 +-
 torchao/quantization/qat/api.py            |  29 ++++-
 torchao/quantization/qat/embedding.py      |   2 +
 torchao/quantization/qat/fake_quantizer.py |  48 +++++++--
 torchao/quantization/qat/linear.py         |  16 +--
 torchao/quantization/qat/utils.py          |  14 +++
 8 files changed, 217 insertions(+), 19 deletions(-)

diff --git a/test/quantization/test_qat.py b/test/quantization/test_qat.py
index d655abaf62..7444c3dbb5 100644
--- a/test/quantization/test_qat.py
+++ b/test/quantization/test_qat.py
@@ -9,6 +9,7 @@
 
 import copy
 import unittest
+from typing import List
 
 import torch
 import torch.nn.functional as F
@@ -26,7 +27,9 @@
 from torchao.quantization.qat.api import (
     ComposableQATQuantizer,
     FakeQuantizeConfig,
+    IntXQuantizationAwareTrainingConfig,
     from_intx_quantization_aware_training,
+    initialize_fake_quantizers,
     intx_quantization_aware_training,
 )
 from torchao.quantization.qat.embedding import (
@@ -99,6 +102,16 @@ def __init__(self):
     def example_inputs(self):
         return (torch.randn(1, 512).to(torch.float),)
 
+    def _get_all_weight_qparams(self) -> List[torch.Tensor]:
+        return [
+            self.linear1.weight_fake_quantizer.scale,
+            self.linear1.weight_fake_quantizer.zero_point,
+            self.sub.linear.weight_fake_quantizer.scale,
+            self.sub.linear.weight_fake_quantizer.zero_point,
+            self.linear2.weight_fake_quantizer.scale,
+            self.linear2.weight_fake_quantizer.zero_point,
+        ]
+
     def forward(self, x):
         x = self.linear1(x)
         x = self.sub(x)
@@ -996,6 +1009,21 @@ def test_fake_quantize_config_dtype(self):
         FakeQuantizeConfig(TorchAODType.INT7, "per_token")
         FakeQuantizeConfig(torch.int8, "per_token")
 
+    def test_fake_quantize_config_dynamic_and_range_learning(self):
+        """
+        Test that `is_dynamic` and `range_learning` cannot both be set.
+        """
+        FakeQuantizeConfig(
+            torch.int8, "per_channel", is_dynamic=True, range_learning=False
+        )
+        FakeQuantizeConfig(
+            torch.int8, "per_channel", is_dynamic=False, range_learning=True
+        )
+        with self.assertRaisesRegex(ValueError, "not compatible"):
+            FakeQuantizeConfig(
+                torch.int8, "per_channel", is_dynamic=True, range_learning=True
+            )
+
     @unittest.skipIf(
         not TORCH_VERSION_AT_LEAST_2_4, "skipping when torch version is 2.4 or lower"
     )
@@ -1591,6 +1619,95 @@ def test_qat_8da4w_eps(self):
         actual_out = converted_model.linear1(x)
         torch.testing.assert_close(expected_out, actual_out, atol=0, rtol=0)
 
+    @unittest.skipIf(
+        not TORCH_VERSION_AT_LEAST_2_4, "skipping when torch version is 2.4 or lower"
+    )
+    def test_fake_quantizer_range_learning(self):
+        """
+        Test that range learning requires `FakeQuantizer`s to be initialized correctly.
+        """
+        config = FakeQuantizeConfig(
+            torch.int8,
+            "per_channel",
+            is_dynamic=False,
+            range_learning=True,
+            scale_precision=torch.float32,
+            zero_point_precision=torch.float32,
+        )
+        fake_quantizer = FakeQuantizer(config)
+        example_inputs = (torch.randn(2, 3),)
+
+        # Not initialized, should fail
+        self.assertFalse(fake_quantizer._initialized)
+        self.assertIsNone(fake_quantizer.scale)
+        self.assertIsNone(fake_quantizer.zero_point)
+        with self.assertRaisesRegex(
+            ValueError,
+            "Please call `torchao.quantization.qat.initialize_fake_quantizers` "
+            "before initializing the optimizer and beginning training.",
+        ):
+            fake_quantizer(*example_inputs)
+
+        # Should pass after initializing
+        initialize_fake_quantizers(fake_quantizer, example_inputs)
+        self.assertTrue(fake_quantizer._initialized)
+        self.assertIsInstance(fake_quantizer.scale, torch.nn.Parameter)
+        self.assertIsInstance(fake_quantizer.zero_point, torch.nn.Parameter)
+        self.assertTrue(fake_quantizer.scale.requires_grad)
+        self.assertTrue(fake_quantizer.zero_point.requires_grad)
+        fake_quantizer(*example_inputs)
+
+    @unittest.skipIf(
+        not TORCH_VERSION_AT_LEAST_2_4, "skipping when torch version is 2.4 or lower"
+    )
+    def test_qat_range_learning(self):
+        """
+        Test end-to-end QAT flow with range learning.
+        """
+        config = FakeQuantizeConfig(
+            torch.int8,
+            "per_channel",
+            is_dynamic=False,
+            range_learning=True,
+            scale_precision=torch.float32,
+            zero_point_precision=torch.float32,
+        )
+        m = M()
+        example_inputs = m.example_inputs()
+        quantize_(m, IntXQuantizationAwareTrainingConfig(weight_config=config))
+
+        # Not initialized, should fail
+        for t in m._get_all_weight_qparams():
+            self.assertIsNone(t)
+        with self.assertRaisesRegex(
+            ValueError,
+            "Please call `torchao.quantization.qat.initialize_fake_quantizers` "
+            "before initializing the optimizer and beginning training.",
+        ):
+            m(*example_inputs)
+
+        # Should pass after initializing
+        # All scales and zero points should be in `m.parameters()`
+        initialize_fake_quantizers(m, example_inputs)
+        params = set(m.parameters())
+        for t in m._get_all_weight_qparams():
+            self.assertIsInstance(t, torch.nn.Parameter)
+            self.assertTrue(t.requires_grad)
+            self.assertTrue(t in params)
+        m(*example_inputs)
+
+        # Simulate training
+        optimizer = torch.optim.SGD(
+            m.parameters(), lr=0.001, momentum=0.9, weight_decay=1e-5
+        )
+        loss_fn = torch.nn.CrossEntropyLoss()
+        target = torch.randn(1, 512).float()
+        out = m(*example_inputs)
+        loss = loss_fn(out, target)
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+
 
 if __name__ == "__main__":
     unittest.main()
diff --git a/third_party/cutlass b/third_party/cutlass
index e94e888df3..afa1772203 160000
--- a/third_party/cutlass
+++ b/third_party/cutlass
@@ -1 +1 @@
-Subproject commit e94e888df3551224738bfa505787b515eae8352f
+Subproject commit afa1772203677c5118fcd82537a9c8fefbcc7008
diff --git a/torchao/quantization/qat/__init__.py b/torchao/quantization/qat/__init__.py
index 5dc3d8e008..010ccfc8cc 100644
--- a/torchao/quantization/qat/__init__.py
+++ b/torchao/quantization/qat/__init__.py
@@ -4,6 +4,7 @@
     FromIntXQuantizationAwareTrainingConfig,
     IntXQuantizationAwareTrainingConfig,
     from_intx_quantization_aware_training,
+    initialize_fake_quantizers,
     intx_quantization_aware_training,
 )
 from .embedding import (
@@ -17,11 +18,12 @@
 __all__ = [
     "ComposableQATQuantizer",
     "FakeQuantizeConfig",
-    "Int4WeightOnlyQATQuantizer",
+    "FromIntXQuantizationAwareTrainingConfig",
     "Int4WeightOnlyEmbeddingQATQuantizer",
+    "Int4WeightOnlyQATQuantizer",
     "Int8DynActInt4WeightQATQuantizer",
+    "IntXQuantizationAwareTrainingConfig",
+    "initialize_fake_quantizers",
     "intx_quantization_aware_training",
     "from_intx_quantization_aware_training",
-    "FromIntXQuantizationAwareTrainingConfig",
-    "IntXQuantizationAwareTrainingConfig",
 ]
diff --git a/torchao/quantization/qat/api.py b/torchao/quantization/qat/api.py
index e025a43d94..8fba195363 100644
--- a/torchao/quantization/qat/api.py
+++ b/torchao/quantization/qat/api.py
@@ -5,7 +5,7 @@
 # LICENSE file in the root directory of this source tree.
 
 from dataclasses import dataclass
-from typing import Any, List, Optional, Union
+from typing import Any, List, Optional, Tuple, Union
 
 import torch
 
@@ -51,7 +51,8 @@ class FakeQuantizeConfig:
         zero_point_precision: zero point dtype (default torch.int32)
         zero_point_domain: whether zero point is in integer (default) or float domain
         is_dynamic: whether to use dynamic (default) or static scale and zero points
-        range_learning: whether to learn scale and zero points during training (coming soon)
+        range_learning: whether to learn scale and zero points during training
+            (default false), not compatible with `is_dynamic`.
 
     kwargs (optional):
         group_size: size of each group in per group fake quantization,
@@ -123,6 +124,10 @@ def __init__(
                 "Unsupported dtype '%s', choose from %s" % (dtype, all_dtypes)
             )
 
+        # Dynamic is not compatible with range learning
+        if is_dynamic and range_learning:
+            raise ValueError("`is_dynamic` is not compatible with `range_learning`")
+
     def _get_granularity(
         self,
         granularity: Union[Granularity, str, None],
@@ -394,3 +399,23 @@ def convert(
         for quantizer in self.quantizers:
             model = quantizer.convert(model)
         return model
+
+
+def initialize_fake_quantizers(
+    model: torch.nn.Module,
+    example_inputs: Tuple[Any, ...],
+) -> None:
+    """
+    Initialize the scales and zero points on all
+    :class:`~`torchao.quantization.qat.fake_quantizer.FakeQuantizer`
+    in the model based on the provided example inputs.
+    """
+    # avoid circular dependencies
+    from torchao.quantization.qat.fake_quantizer import FakeQuantizer
+
+    def _set_initialized(m: torch.nn.Module):
+        if isinstance(m, FakeQuantizer):
+            m._initialized = True
+
+    model.apply(_set_initialized)
+    model(*example_inputs)
diff --git a/torchao/quantization/qat/embedding.py b/torchao/quantization/qat/embedding.py
index 2770956a2c..aec23712ed 100644
--- a/torchao/quantization/qat/embedding.py
+++ b/torchao/quantization/qat/embedding.py
@@ -92,6 +92,7 @@ def to_embedding(self) -> torch.nn.Embedding:
             self.scale_grad_by_freq,
             self.sparse,
             device=self.weight.device,
+            dtype=self.weight.dtype,
         )
         # In distributed training, the model may be instantiated
         # on the meta device, in which case there is no need to
@@ -116,6 +117,7 @@ def from_embedding(
             mod.sparse,
             weight_config=weight_config,
             device=mod.weight.device,
+            dtype=mod.weight.dtype,
         )
         # In distributed training, the model may be instantiated
         # on the meta device, in which case there is no need to
diff --git a/torchao/quantization/qat/fake_quantizer.py b/torchao/quantization/qat/fake_quantizer.py
index 0d2521cac0..90206b5d6e 100644
--- a/torchao/quantization/qat/fake_quantizer.py
+++ b/torchao/quantization/qat/fake_quantizer.py
@@ -31,6 +31,7 @@
 from .utils import (
     _fake_quantize_per_channel_group,
     _fake_quantize_per_token,
+    _Round,
 )
 
 
@@ -46,11 +47,12 @@ def __init__(self, config: FakeQuantizeConfig):
         self.scale: Optional[torch.Tensor] = None
         self.zero_point: Optional[torch.Tensor] = None
 
-        # TODO: support range learinng
-        if self.config.range_learning:
-            raise NotImplementedError("Range learning is not supported yet")
+        # For range learning only
+        # TODO: make this configurable?
+        self._scale_eps = 1e-9
+        self._initialized = False
 
-    def forward(self, x: torch.Tensor):
+    def forward(self, x: torch.Tensor) -> torch.Tensor:
         """
         Apply fake quantization to the tensor based on the bit-width,
         granularity, symmetry, and other properties specified in the config.
@@ -58,6 +60,17 @@ def forward(self, x: torch.Tensor):
         if not self.enabled:
             return x
 
+        if (
+            self.config.range_learning
+            and not self._initialized
+            and (self.scale is None or self.zero_point is None)
+        ):
+            raise ValueError(
+                "Scales and zero points must be initialized for range learning. "
+                "Please call `torchao.quantization.qat.initialize_fake_quantizers` "
+                "before initializing the optimizer and beginning training."
+            )
+
         if isinstance(self.config.granularity, PerToken):
             return self._per_token_forward(x)
         elif isinstance(self.config.granularity, (PerAxis, PerGroup)):
@@ -65,13 +78,12 @@ def forward(self, x: torch.Tensor):
         else:
             raise ValueError("Unknown granularity '%s'" % self.config.granularity)
 
-    def _per_token_forward(self, x: torch.Tensor):
+    def _per_token_forward(self, x: torch.Tensor) -> torch.Tensor:
         """
         Perform per token fake quantization on the tensor.
         """
         if self.config.is_symmetric:
             raise NotImplementedError("Symmetric per token is not supported yet")
-
         qmin, qmax = _DTYPE_TO_QVALUE_BOUNDS[self.config.dtype]
         if self._should_compute_qparams():
             self.scale, self.zero_point = choose_qparams_affine(
@@ -85,9 +97,10 @@ def _per_token_forward(self, x: torch.Tensor):
                 scale_dtype=self.config.scale_precision,
                 zero_point_dtype=self.config.zero_point_precision,
             )
+            self._maybe_update_qparams_for_range_learning()
         return _fake_quantize_per_token(x, self.scale, self.zero_point, qmin, qmax)
 
-    def _per_channel_or_group_forward(self, x: torch.Tensor):
+    def _per_channel_or_group_forward(self, x: torch.Tensor) -> torch.Tensor:
         """
         Perform per channel or per group fake quantization on the tensor.
         We express per channel using per group where the group size is the size
@@ -129,6 +142,7 @@ def _per_channel_or_group_forward(self, x: torch.Tensor):
                     eps=self.config.eps,
                 )
             self.zero_point = self.zero_point.to(zero_point_precision)
+            self._maybe_update_qparams_for_range_learning()
 
         qmin, qmax = _DTYPE_TO_QVALUE_BOUNDS[self.config.dtype]
         return _fake_quantize_per_channel_group(
@@ -147,6 +161,26 @@ def _should_compute_qparams(self) -> bool:
         """
         return self.config.is_dynamic or self.scale is None or self.zero_point is None
 
+    def _maybe_update_qparams_for_range_learning(self) -> None:
+        """
+        If range learning is enabled, turn scales and zero points into trainable parameters.
+        This function is idempotent and should only be called once.
+        """
+        if (
+            not self.config.range_learning
+            or isinstance(self.scale, torch.nn.Parameter)
+            or isinstance(self.zero_point, torch.nn.Parameter)
+        ):
+            return
+        scale, zero_point = self.scale, self.zero_point
+        qmin, qmax = _DTYPE_TO_QVALUE_BOUNDS[self.config.dtype]
+        # Stabilize range learning
+        scale = torch.clamp(scale, min=self._scale_eps)
+        zero_point = _Round.apply(zero_point)
+        zero_point = torch.clamp(zero_point, qmin, qmax)
+        self.scale = torch.nn.Parameter(scale, requires_grad=True)
+        self.zero_point = torch.nn.Parameter(zero_point, requires_grad=True)
+
     def __repr__(self) -> str:
         """
         Return a human readable representation of this `FakeQuantizer` with config details.
diff --git a/torchao/quantization/qat/linear.py b/torchao/quantization/qat/linear.py
index a912f04b83..7c32bc4b19 100644
--- a/torchao/quantization/qat/linear.py
+++ b/torchao/quantization/qat/linear.py
@@ -18,6 +18,7 @@
     _replace_linear_int4,
     groupwise_affine_quantize_tensor,
 )
+from torchao.quantization.granularity import PerGroup
 from torchao.quantization.quant_primitives import (
     TorchAODType,
     ZeroPointDomain,
@@ -83,12 +84,13 @@ def __init__(
 
         # initialize weight fake quantizer
         if weight_config is not None:
-            group_size = weight_config.group_size
-            if group_size is not None and in_features % group_size != 0:
-                raise ValueError(
-                    "in_features (%s) %% group_size (%s) must be == 0"
-                    % (in_features, group_size)
-                )
+            if isinstance(weight_config.granularity, PerGroup):
+                group_size = weight_config.group_size
+                if group_size is not None and in_features % group_size != 0:
+                    raise ValueError(
+                        "in_features (%s) %% group_size (%s) must be == 0"
+                        % (in_features, group_size)
+                    )
             self.weight_fake_quantizer = FakeQuantizer(weight_config)
         else:
             self.weight_fake_quantizer = None
@@ -108,6 +110,7 @@ def to_linear(self) -> torch.nn.Linear:
             self.out_features,
             self.bias is not None,
             device=self.weight.device,
+            dtype=self.weight.dtype,
         )
         # In distributed training, the model may be instantiated
         # on the meta device, in which case there is no need to
@@ -131,6 +134,7 @@ def from_linear(
             activation_config=activation_config,
             weight_config=weight_config,
             device=mod.weight.device,
+            dtype=mod.weight.dtype,
         )
         # In distributed training, the model may be instantiated
         # on the meta device, in which case there is no need to
diff --git a/torchao/quantization/qat/utils.py b/torchao/quantization/qat/utils.py
index 12e9097ada..71e9a96ec5 100644
--- a/torchao/quantization/qat/utils.py
+++ b/torchao/quantization/qat/utils.py
@@ -91,6 +91,20 @@ def backward(ctx, gy):
         return (gy,)
 
 
+class _Round(torch.autograd.Function):
+    """
+    Implementation of generic round operation with backward STE.
+    """
+
+    @staticmethod
+    def forward(ctx, x: torch.Tensor) -> torch.Tensor:
+        return torch.round(x)
+
+    @staticmethod
+    def backward(ctx, gy: torch.Tensor) -> torch.Tensor:
+        return gy
+
+
 def _fake_quantize_per_channel_group(
     input: torch.Tensor,
     scales: torch.Tensor,

From dacd3aa91787fc8845c399f08823616e18c5e31d Mon Sep 17 00:00:00 2001
From: andrewor14 <andrewor14@gmail.com>
Date: Thu, 29 May 2025 18:28:38 -0400
Subject: [PATCH 060/165] Mark QAT range learning as prototype for now (#2272)

API may be subject to change. See this tracker for future tasks
for more detail: https://github.com/pytorch/ao/issues/2271
---
 torchao/quantization/qat/api.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/torchao/quantization/qat/api.py b/torchao/quantization/qat/api.py
index 8fba195363..60370ee52b 100644
--- a/torchao/quantization/qat/api.py
+++ b/torchao/quantization/qat/api.py
@@ -51,7 +51,7 @@ class FakeQuantizeConfig:
         zero_point_precision: zero point dtype (default torch.int32)
         zero_point_domain: whether zero point is in integer (default) or float domain
         is_dynamic: whether to use dynamic (default) or static scale and zero points
-        range_learning: whether to learn scale and zero points during training
+        range_learning (prototype): whether to learn scale and zero points during training
             (default false), not compatible with `is_dynamic`.
 
     kwargs (optional):
@@ -406,7 +406,7 @@ def initialize_fake_quantizers(
     example_inputs: Tuple[Any, ...],
 ) -> None:
     """
-    Initialize the scales and zero points on all
+    (Prototype) Initialize the scales and zero points on all
     :class:`~`torchao.quantization.qat.fake_quantizer.FakeQuantizer`
     in the model based on the provided example inputs.
     """

From d963a8840e3c228e303fe14aff5d9be7017c92b6 Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Thu, 29 May 2025 16:06:22 -0700
Subject: [PATCH 061/165] Fix generate.py for fbgemm int4 integration (#2273)

Summary:

Updated table:

|                 | overall tokens/sec | TTFT | Peak Memory | Model Size |
| ---------| -------------------| ------| --------------| -----------|
| baseline - 1 | 131.65 | 0.0220 | 16.24 GB | 15.01 GB |
| baseline - 128| 76.38 | 0.0544 | 26.92 GB | 15.01 GB|
| int4wo - 1 | 207.69 | 0.0288 | 6.41 GB | 3.99 GB |
| int4wo - 128 | 12.85 | 0.4223 |  16.01 GB | 3.99 GB |
| fbgemm-int4 - 1  (w/ compile) | 61.12 | 0.0212 | 7.59 GB | 3.00 GB |
| fbgemm-int4 - 128 (w/ compile) | 71.23 | 0.0576 | 16.13 GB | 3.99 GB |

Verified that compile works:

python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --quantization fbgemm-int4-128 --batch_size 1 --compile

==========
Average overall tokens/sec: 61.12
Average decode tokens/sec: 61.5512 s
Average TTFT: 0.0212 s
Average tokens/sec: 61.12
Average Bandwidth: 243.70 GB/s
Peak Memory Usage: 7.59 GB
Model Size: 3.99 GB

python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --quantization fbgemm-int4-128 --batch_size 128 --compile

==========
Average overall tokens/sec: 71.23
Average decode tokens/sec: 72.8871 s
Average TTFT: 0.0576 s
Average tokens/sec: 71.23
Average tokens/sec including batches 9116.81
Average Bandwidth: 284.00 GB/s
Peak Memory Usage: 16.13 GB
Model Size: 3.99 GB

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:
---
 torchao/_models/llama/generate.py | 8 +++++++-
 1 file changed, 7 insertions(+), 1 deletion(-)

diff --git a/torchao/_models/llama/generate.py b/torchao/_models/llama/generate.py
index 1f56e71f07..40f70fe93e 100644
--- a/torchao/_models/llama/generate.py
+++ b/torchao/_models/llama/generate.py
@@ -447,8 +447,14 @@ def ffn_or_attn_only(mod, fqn):
 
             _, precision, group_size = quantization.split("-")
             group_size = int(group_size)
+            block_size = [1, group_size]
             if precision == "int4":
-                quantize_(model, FbgemmConfig("bf16i4bf16", group_size))
+                quantize_(
+                    model,
+                    FbgemmConfig(
+                        torch.bfloat16, torch.int4, torch.bfloat16, block_size
+                    ),
+                )
             else:
                 raise NotImplementedError(
                     f"FbegemmConfig({precision=}) not supported yet"

From 01bd0be346fb68880804ecb5cf2bcc2c966da476 Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Thu, 29 May 2025 22:15:13 -0700
Subject: [PATCH 062/165] Make optim lazily intialize global state (#2277)

stack-info: PR: https://github.com/pytorch/ao/pull/2277, branch: drisspg/stack/60
---
 torchao/optim/subclass_4bit.py | 19 ++++++++++++++++---
 torchao/optim/subclass_8bit.py | 18 +++++++++++++++---
 2 files changed, 31 insertions(+), 6 deletions(-)

diff --git a/torchao/optim/subclass_4bit.py b/torchao/optim/subclass_4bit.py
index 55d9bf356f..209d0b8cad 100644
--- a/torchao/optim/subclass_4bit.py
+++ b/torchao/optim/subclass_4bit.py
@@ -29,8 +29,19 @@
 # https://github.com/thu-ml/low-bit-optimizers/blob/e3e2854728e498c2a606e3fdb88daa27ae94f9a6/lpmm/configs/2nd_moment_group_128.yml
 # NOTE: power-1 is linear
 # TODO: since QMAP_UNSIGNED is linear, perhaps doing affine quantize is faster?
-QMAP_SIGNED = create_dynamic_map(True, 3, 4)
-QMAP_UNSIGNED = torch.linspace(0, 1, 17)[1:].tolist()  # no zero
+
+# Lazy initialization to avoid meta device issues during import
+from functools import lru_cache
+
+
+@lru_cache(maxsize=1)
+def get_qmap_signed():
+    return create_dynamic_map(True, 3, 4)
+
+
+@lru_cache(maxsize=1)
+def get_qmap_unsigned():
+    return torch.linspace(0, 1, 17, device="cpu")[1:].tolist()  # no zero
 
 
 class OptimState4bit(TorchAOBaseTensor):
@@ -90,7 +101,9 @@ def zeros(cls, shape, signed: bool = True, block_size: int = 128, device=None):
 
         codes = torch.zeros(n_elems // 2, dtype=torch.uint8, device=device)
         scale = torch.zeros(n_elems // block_size, device=device)
-        qmap = torch.tensor(QMAP_SIGNED if signed else QMAP_UNSIGNED, device=device)
+        qmap = torch.tensor(
+            get_qmap_signed() if signed else get_qmap_unsigned(), device=device
+        )
         return cls(codes, scale, qmap, signed, shape)
 
     def __repr__(self):
diff --git a/torchao/optim/subclass_8bit.py b/torchao/optim/subclass_8bit.py
index 66d31432b8..58a51734d7 100644
--- a/torchao/optim/subclass_8bit.py
+++ b/torchao/optim/subclass_8bit.py
@@ -26,8 +26,18 @@
 c10d_functional = torch.ops.c10d_functional
 _c10d_functional = torch.ops._c10d_functional
 
-QMAP_SIGNED = create_dynamic_map(signed=True)
-QMAP_UNSIGNED = create_dynamic_map(signed=False)
+# Lazy initialization to avoid meta device issues during import
+from functools import lru_cache
+
+
+@lru_cache(maxsize=1)
+def get_qmap_signed():
+    return create_dynamic_map(signed=True)
+
+
+@lru_cache(maxsize=1)
+def get_qmap_unsigned():
+    return create_dynamic_map(signed=False)
 
 
 class OptimState8bit(TorchAOBaseTensor):
@@ -79,7 +89,9 @@ def dequantize(self, output_dtype=None):
     def zeros(cls, shape, signed: bool = True, block_size: int = 256, device=None):
         codes = torch.zeros(shape, dtype=torch.uint8, device=device)
         scale = torch.zeros(codes.numel() // block_size, device=device)
-        qmap = torch.tensor(QMAP_SIGNED if signed else QMAP_UNSIGNED, device=device)
+        qmap = torch.tensor(
+            get_qmap_signed() if signed else get_qmap_unsigned(), device=device
+        )
         return cls(codes, scale, qmap, signed)
 
     def __repr__(self):

From 14965e4fac4b5f7725d0a12335b660cee35bc87a Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Thu, 29 May 2025 22:16:47 -0700
Subject: [PATCH 063/165] Add Integration Tests to H100 CI (#2268)

stack-info: PR: https://github.com/pytorch/ao/pull/2268, branch: drisspg/stack/59
---
 .github/workflows/float8_test.yml    |  5 ++++-
 test/integration/test_integration.py | 28 ++++++++++++++++++++-------
 test/integration/test_vllm.py        |  8 ++++++++
 torchao/quantization/autoquant.py    | 29 ++++++++--------------------
 4 files changed, 41 insertions(+), 29 deletions(-)

diff --git a/.github/workflows/float8_test.yml b/.github/workflows/float8_test.yml
index a32d6ecb74..0b17a23bf7 100644
--- a/.github/workflows/float8_test.yml
+++ b/.github/workflows/float8_test.yml
@@ -48,7 +48,10 @@ jobs:
         conda activate venv
         export PATH=/opt/rh/devtoolset-10/root/usr/bin/:$PATH
         python -m pip install --upgrade pip
+        pip install uv
         pip install ${{ matrix.torch-spec }}
-        pip install -r dev-requirements.txt
+        uv pip install -r dev-requirements.txt
+        uv pip install vllm
         pip install .
         pytest test/float8 --verbose -s
+        pytest test/integration --verbose -s
diff --git a/test/integration/test_integration.py b/test/integration/test_integration.py
index 2f498ea5c1..8388a8bcff 100644
--- a/test/integration/test_integration.py
+++ b/test/integration/test_integration.py
@@ -883,12 +883,20 @@ def test_autoquantizable_flatten_unflatten(self):
             tensor_data_dict, tensor_attributes, outer_size, outer_stride
         )
 
-    @parameterized.expand(COMMON_DEVICE_DTYPE)
+    @parameterized.expand(
+        [
+            (device, dtype, f"device_{device}_dtype_{str(dtype).split('.')[-1]}")
+            for device, dtype in COMMON_DEVICE_DTYPE
+        ]
+    )
     @unittest.skipIf(
         not TORCH_VERSION_AT_LEAST_2_5, "autoquant+aqt needs newer pytorch"
     )
     @unittest.skipIf(not is_sm_at_least_90(), "Need H100 to run")
-    def test_aq_float8_dynamic_quant_rowwise_scaling_subclass(self, device, dtype):
+    @unittest.skip("TODO this is not working correctly")
+    def test_aq_float8_dynamic_quant_rowwise_scaling_subclass(
+        self, device, dtype, name
+    ):
         if dtype != torch.bfloat16:
             with self.assertRaisesRegex(
                 AssertionError, "PerRow quantization only works for bfloat16 precision"
@@ -912,6 +920,7 @@ def test_aq_float8_dynamic_quant_rowwise_scaling_subclass(self, device, dtype):
         not TORCH_VERSION_AT_LEAST_2_5, "autoquant+aqt needs newer pytorch"
     )
     @unittest.skipIf(not is_sm_at_least_90(), "Need H100 to run")
+    @unittest.skip("TODO this is not working correctly")
     def test_aq_float8_dynamic_quant_tensorwise_scaling_subclass(self, device, dtype):
         self._test_lin_weight_subclass_impl(
             AQFloat8PerTensorScalingDynamicallyQuantizedLinearWeight.from_float,
@@ -1880,9 +1889,12 @@ def test_autoquant_int4wo(self, device, dtype):
     @unittest.skipIf(
         not TORCH_VERSION_AT_LEAST_2_5, "autoquant int4 option requires 2.5+."
     )
+    @unittest.skipIf(
+        True, "Skipping for now, do to lowering bug in inductor"
+    )  # TODO unblock when fixed
     def test_autoquant_float8(self, device, dtype):
         if device == "cpu":
-            self.skipTest(f"int4wo is for cuda, not {device}")
+            self.skipTest(f"float8 is for cuda, not {device}")
 
         # note: marlin sparse layout failed when scale_t has a dimension of 1d
         m, k, n = 128, 128, 128
@@ -1893,6 +1905,11 @@ def test_autoquant_float8(self, device, dtype):
             AQFloat8PerTensorScalingDynamicallyQuantizedLinearWeight,
             AQFloat8WeightOnlyQuantizedLinearWeight,
         ]:
+            if (
+                dtype in (torch.float32, torch.float16)
+                and qclass is AQFloat8PerRowScalingDynamicallyQuantizedLinearWeight
+            ):
+                continue
             model = (
                 torch.nn.Sequential(
                     torch.nn.ReLU(),
@@ -1904,10 +1921,7 @@ def test_autoquant_float8(self, device, dtype):
             )
             ref = model(example_input)
             qtensor_class_list = [qclass]
-            torchao.autoquant(
-                model,
-                qtensor_class_list=qtensor_class_list,
-            )
+            torchao.autoquant(model, qtensor_class_list=qtensor_class_list)
             out = model(example_input)
 
             self.assertIn(type(model[1].weight), qtensor_class_list)
diff --git a/test/integration/test_vllm.py b/test/integration/test_vllm.py
index c750a7b562..b82f4f9794 100644
--- a/test/integration/test_vllm.py
+++ b/test/integration/test_vllm.py
@@ -4,6 +4,7 @@
 # This source code is licensed under the BSD 3-Clause license found in the
 # LICENSE file in the root directory of this source tree.
 
+import importlib.metadata
 import importlib.util
 import os
 import random
@@ -15,6 +16,7 @@
 import pytest
 import torch
 
+from packaging import version
 from torchao.utils import TORCH_VERSION_AT_LEAST_2_7
 
 if not TORCH_VERSION_AT_LEAST_2_7:
@@ -30,6 +32,12 @@
 if not TRANSFORMERS_AVAILABLE:
     pytest.skip("transformers not installed", allow_module_level=True)
 
+if VLLM_AVAILABLE:
+    vllm_version = importlib.metadata.version("vllm")
+    # Bad vLLM version due to adding AOPerModuleConfig
+    if version.parse(vllm_version) == version.parse("0.9.0"):
+        pytest.skip("vLLM version must be greater than 0.9.0", allow_module_level=True)
+
 from transformers import AutoModelForCausalLM, AutoTokenizer, TorchAoConfig
 from vllm import LLM, SamplingParams
 
diff --git a/torchao/quantization/autoquant.py b/torchao/quantization/autoquant.py
index f018d5dffe..41ea588231 100644
--- a/torchao/quantization/autoquant.py
+++ b/torchao/quantization/autoquant.py
@@ -21,7 +21,6 @@
 from torchao.kernel import safe_int_mm
 from torchao.quantization.linear_activation_quantized_tensor import (
     LinearActivationQuantizedTensor,
-    to_linear_activation_quantized,
 )
 from torchao.quantization.quant_primitives import (
     MappingType,
@@ -964,7 +963,9 @@ def from_float(cls, weight):
         )
 
 
-class AQFloat8PerRowScalingDynamicallyQuantizedLinearWeight(AQMixin, BFloat16Tensor):
+class AQFloat8PerRowScalingDynamicallyQuantizedLinearWeight(
+    AQMixin, LinearActivationQuantizedTensor
+):
     """
     AutoQuantizable version of Float8DynamicallyQuantizedLinearWeight using per row scaling
     """
@@ -982,24 +983,15 @@ def get_weight_block_size(x):
             return (1, x.shape[1])
 
         target_dtype = torch.float8_e4m3fn
-
-        # input settings
-        def get_per_token_block_size(x):
-            block_size = list(x.shape)
-            for i in range(len(block_size) - 1):
-                block_size[i] = 1
-            return block_size
-
         input_target_dtype = torch.float8_e4m3fn
         _layout = Float8Layout(mm_config=Float8MMConfig(use_fast_accum=True))
-        # TODO: make this serializable
+        # TODO: test serializable
         input_quant_func = _input_activation_quant_func_fp8
-        input_quant_kwargs = {
+        input_quant_args = {
             "activation_granularity": cls.activation_granularity,
             "activation_dtype": input_target_dtype,
         }
         block_size = get_weight_block_size(weight)
-
         weight = to_affine_quantized_floatx(
             input_float=weight,
             block_size=block_size,
@@ -1007,15 +999,10 @@ def get_per_token_block_size(x):
             _layout=_layout,
             scale_dtype=torch.float32,
         )
-        weight = to_linear_activation_quantized(
-            weight, input_quant_func, quant_kwargs=input_quant_kwargs
-        )
-        # at inference time,
-        # we first convert the input, weight and bias to bfloat16, and then quantize activation
-        # and then dispatch to the quantized ops
-        return super(
+        weight = super(
             AQFloat8PerRowScalingDynamicallyQuantizedLinearWeight, cls
-        ).from_float(weight, skip_weight_conversion=True)
+        ).from_float(weight, input_quant_func, input_quant_args)
+        return weight
 
 
 class AQFloat8PerTensorScalingDynamicallyQuantizedLinearWeight(

From c3c316327cb227e89fe0f4a57ab42a97fc755dab Mon Sep 17 00:00:00 2001
From: Emmanuel Ferdman <emmanuelferdman@gmail.com>
Date: Fri, 30 May 2025 08:18:21 +0300
Subject: [PATCH 064/165] Resolve logger warnings (#2250)

Signed-off-by: Emmanuel Ferdman <emmanuelferdman@gmail.com>
---
 torchao/dtypes/affine_quantized_tensor_ops.py | 10 +++++-----
 torchao/quantization/quant_api.py             |  2 +-
 2 files changed, 6 insertions(+), 6 deletions(-)

diff --git a/torchao/dtypes/affine_quantized_tensor_ops.py b/torchao/dtypes/affine_quantized_tensor_ops.py
index 20d87de8cf..63650ce687 100644
--- a/torchao/dtypes/affine_quantized_tensor_ops.py
+++ b/torchao/dtypes/affine_quantized_tensor_ops.py
@@ -130,8 +130,8 @@ def deregister_aqt_quantized_linear_dispatch(dispatch_condition):
     if dispatch_condition in _AQT_QLINEAR_DISPATCH_TABLE:
         del _AQT_QLINEAR_DISPATCH_TABLE[dispatch_condition]
     else:
-        logger.warn(
-            f"Attempting to remove non-existant dispatch condition {dispatch_condition}"
+        logger.warning(
+            f"Attempting to remove non-existent dispatch condition {dispatch_condition}"
         )
 
 
@@ -273,7 +273,7 @@ def _(func, types, args, kwargs):
     try:
         return weight_tensor._quantized_linear_op(input_tensor, weight_tensor, bias)
     except QuantizedLinearNotImplementedError as e:
-        # fallback path is only called when user did not specify a specfic quantized linear implementation with `_layout.quantized_linear_impl`
+        # fallback path is only called when user did not specify a specific quantized linear implementation with `_layout.quantized_linear_impl`
         if (
             isinstance(weight_tensor, AffineQuantizedTensor)
             and hasattr(weight_tensor._layout, "quantized_linear_impl")
@@ -362,7 +362,7 @@ def _(func, types, args, kwargs):
             input_tensor, transposed_weight_tensor, bias
         )
     except QuantizedLinearNotImplementedError as e:
-        # fallback path is only called when user did not specify a specfic quantized linear implementation with `_layout.quantized_linear_impl`
+        # fallback path is only called when user did not specify a specific quantized linear implementation with `_layout.quantized_linear_impl`
         if (
             isinstance(weight_tensor, AffineQuantizedTensor)
             and hasattr(weight_tensor._layout, "quantized_linear_impl")
@@ -396,7 +396,7 @@ def _(func, types, args, kwargs):
             input_tensor, transposed_weight_tensor, bias
         )
     except QuantizedLinearNotImplementedError as e:
-        # fallback path is only called when user did not specify a specfic quantized linear implementation with `_layout.quantized_linear_impl`
+        # fallback path is only called when user did not specify a specific quantized linear implementation with `_layout.quantized_linear_impl`
         if (
             isinstance(weight_tensor, AffineQuantizedTensor)
             and hasattr(weight_tensor._layout, "quantized_linear_impl")
diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index ada19859bc..37f0cf5bfe 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -1797,7 +1797,7 @@ def _uintx_weight_only_transform(
 
     if use_hqq:
         if dtype == torch.uint4:
-            logger.warn(
+            logger.warning(
                 "Recommended to use `int4_weight_only(group_size, use_hqq=True)` for the best performance"
             )
         quant_min, quant_max = _DTYPE_TO_QVALUE_BOUNDS[dtype]

From abb309a83d53df21b5d4c90d2eac92abcf14bcc0 Mon Sep 17 00:00:00 2001
From: XiaoWang <wang.xiao@intel.com>
Date: Fri, 30 May 2025 07:02:37 +0000
Subject: [PATCH 065/165] Enable AWQ on Intel GPU. (#2248)

Following https://github.com/pytorch/pytorch/issues/153019 requests, we enable awq-uint4 for Intel GPU in pytorch/ao after RTN ready.

How to run awq quantization model:
```markdown
cd torchao/prototype/awq

python example.py --device xpu  huggingface-model(such as meta-llama/Llama-3.1-8B-Instruct) awq-uint4-128
```
#Results of meta-llama/Llama-3.1-8B-Instruct on Intel GPU:
{'perplexity': {'perplexity': 10.099576950073242, 'prediction_time': 0.20489671968780787}}

#Results of meta-llama/Llama-3.1-8B-Instruct on NVIDIA-A100 GPU:
Results: {'perplexity': {'perplexity': 10.160041809082031, 'prediction_time': 0.4466673863672577}}
Pull Request resolved: https://github.com/pytorch/ao/pull/2248
Approved by: https://github.com/liangan1, https://github.com/jerryzh168
---
 test/quantization/test_quant_primitives.py |  4 +++
 torchao/dtypes/uintx/int4_xpu_layout.py    | 17 +++++------
 torchao/prototype/awq/api.py               | 15 ++++++++--
 torchao/prototype/awq/example.py           | 17 +++++++++--
 torchao/quantization/subclass.py           |  7 -----
 torchao/quantization/utils.py              | 35 ++++++++--------------
 6 files changed, 51 insertions(+), 44 deletions(-)

diff --git a/test/quantization/test_quant_primitives.py b/test/quantization/test_quant_primitives.py
index 046fb6ab42..e69d68b27f 100644
--- a/test/quantization/test_quant_primitives.py
+++ b/test/quantization/test_quant_primitives.py
@@ -135,6 +135,8 @@ def _groupwise_affine_quantize_tensor_from_qparams(
     if TORCH_VERSION_AT_LEAST_2_5:
         if (not (check_cpu_version(w.device))) and (not (check_xpu_version(w.device))):
             w_int4x8 = (w_int4x8[::, ::2] << 4 | w_int4x8[::, 1::2]).to(torch.uint8)
+        if check_xpu_version(w.device):
+            w_int4x8 = (w_int4x8[::, 1::2] << 4 | w_int4x8[::, ::2]).to(torch.uint8)
 
     return w_int4x8
 
@@ -730,6 +732,8 @@ def test_groupwise_affine_dequantize_tensor_from_qparams(self):
                     not (check_xpu_version(input.device))
                 ):
                     input_tmp = (input[::, ::2] << 4 | input[::, 1::2]).to(torch.uint8)
+                if check_xpu_version(input.device):
+                    input_tmp = (input[::, 1::2] << 4 | input[::, ::2]).to(torch.uint8)
                 w_bf16 = groupwise_affine_dequantize_tensor_from_qparams(
                     input_tmp, scales, zeros, n_bit, groupsize, zero_point_domain
                 )
diff --git a/torchao/dtypes/uintx/int4_xpu_layout.py b/torchao/dtypes/uintx/int4_xpu_layout.py
index 76f5ecb121..722a37bc32 100644
--- a/torchao/dtypes/uintx/int4_xpu_layout.py
+++ b/torchao/dtypes/uintx/int4_xpu_layout.py
@@ -242,14 +242,15 @@ def from_plain(
     ):
         assert isinstance(_layout, Int4XPULayout)
 
-        from torchao.quantization.utils import convert_weight_to_int4pack_xpu
-
         if TORCH_VERSION_AT_LEAST_2_8:
             assert int_data.dtype == torch.int32, (
                 "torch.ops.aten._convert_weight_to_int4pack_for_cpu expects `int32` dtype"
             )
-            packed_weight = convert_weight_to_int4pack_xpu(
-                int_data, zero_point.dtype != scale.dtype
+            packed_weight = (int_data[::, 1::2] << 4 | int_data[::, ::2]).to(
+                torch.uint8
+            )
+            packed_weight = torch.ops.aten._convert_weight_to_int4pack(
+                packed_weight.contiguous(), 8
             )
         else:
             assert False, "INT4 not supported on XPU until 2.8"
@@ -370,8 +371,8 @@ def __torch_dispatch__(cls, func, types, args, kwargs):
 
     def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
         from torchao.quantization.quant_primitives import (
-            ZeroPointDomain,
             quantize_affine,
+            quantize_affine_float_zero_point,
         )
         from torchao.quantization.utils import unpack_tinygemm_scales_and_zeros
 
@@ -394,7 +395,6 @@ def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
         quant_max = 15
         assert len(block_size) == 2 and block_size[0] == 1
         if self.scale_and_zero is None:
-            zero_point_domain = ZeroPointDomain.INT
             dequantized = torch.ops.aten._weight_int4pack_mm_with_scales_and_zeros(
                 torch.eye(eye_shape, device=device, dtype=original_dtype),
                 self.packed_weight,
@@ -411,10 +411,8 @@ def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
                 target_dtype,
                 quant_min,
                 quant_max,
-                zero_point_domain,
             )
         else:
-            zero_point_domain = ZeroPointDomain.FLOAT
             dequantized = torch.ops.aten._weight_int4pack_mm(
                 torch.eye(eye_shape, device=device, dtype=original_dtype),
                 self.packed_weight,
@@ -425,7 +423,7 @@ def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
             # TODO: move this to `unpack_tinygemm_scales_and_zeros`?
             scale = scale.reshape(scale.shape[:-1]).contiguous()
             zero = zero.reshape(zero.shape[:-1]).contiguous()
-            int_data = quantize_affine(
+            int_data = quantize_affine_float_zero_point(
                 dequantized,
                 block_size,
                 scale,
@@ -433,7 +431,6 @@ def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
                 target_dtype,
                 quant_min,
                 quant_max,
-                zero_point_domain,
             )
         return int_data, scale, zero
 
diff --git a/torchao/prototype/awq/api.py b/torchao/prototype/awq/api.py
index 2d6059c057..5806c29ce6 100644
--- a/torchao/prototype/awq/api.py
+++ b/torchao/prototype/awq/api.py
@@ -5,12 +5,15 @@
 # LICENSE file in the root directory of this source tree.
 import types
 from dataclasses import dataclass
+from typing import Optional
 
 import torch
 
 import torchao
 from torchao.core.config import AOBaseConfig
 from torchao.dtypes import (
+    Int4XPULayout,
+    Layout,
     TensorCoreTiledLayout,
     to_affine_quantized_intx,
 )
@@ -105,12 +108,14 @@ class AWQUIntXConfig(AOBaseConfig):
 
     Args:
         quant_dtype: The data type of the quantized weights. Currently only torch.uint4 is intended to be used but can be used with torch.uint1 -> torch.uint8
+        `layout`: layout type for quantized tensor, default is `TensorCoreTiledLayout(inner_k_tiles=8)`
         group_size: Quantization granularity. Use -1 for channel wise quantization
         weight_quant_fn: The quantization function to be used, which takes in the weight and returns the quantized weight. If None, then affine uint4 quantization is used
         set_inductor_config: if True, adjusts `torchinductor` settings to recommended values.
     """
 
     quant_dtype: torch.dtype = torch.uint4
+    layout: Optional[Layout] = TensorCoreTiledLayout(inner_k_tiles=8)
     group_size: int = 64
     use_hqq: bool = False
     set_inductor_config: bool = True
@@ -142,9 +147,13 @@ def _awq_uintx_transform(
         target_dtype = torch.int32
         eps = 1e-6
         preserve_zero = False
-        zero_point_dtype = torch.bfloat16
-        zero_point_domain = ZeroPointDomain.FLOAT
-        _layout = TensorCoreTiledLayout(inner_k_tiles=8)
+        _layout = config.layout
+        if isinstance(_layout, Int4XPULayout):
+            zero_point_dtype = torch.int8
+            zero_point_domain = ZeroPointDomain.INT
+        else:
+            zero_point_dtype = torch.bfloat16
+            zero_point_domain = ZeroPointDomain.FLOAT
     else:
         target_dtype = torch.uint8
         eps = torch.finfo(torch.float32).eps
diff --git a/torchao/prototype/awq/example.py b/torchao/prototype/awq/example.py
index ba1ba6834c..7ff6092b05 100644
--- a/torchao/prototype/awq/example.py
+++ b/torchao/prototype/awq/example.py
@@ -11,6 +11,7 @@
 from tqdm import tqdm
 from transformers import AutoModelForCausalLM, AutoTokenizer
 
+from torchao.dtypes import Int4XPULayout
 from torchao.prototype.awq import AWQObservedLinear, awq_uintx, insert_awq_observer_
 from torchao.quantization import int4_weight_only, quantize_
 
@@ -71,6 +72,8 @@ def wiki2_eval(
             log_likelihood = model(input_ids, labels=target_ids).loss * trg_len
         if device.startswith("cuda"):
             torch.cuda.synchronize()
+        if device.startswith("xpu"):
+            torch.xpu.synchronize()
         t2 = time.time()
         t.append((t2 - t1))
         lls.append(log_likelihood)
@@ -229,9 +232,14 @@ def wikitext2_ppl(
         use_hqq = "hqq" in quant
         print(f"running {quant_dtype} quantization")
         t0 = time.time()
+        awq_uintx_config = awq_uintx(
+            quant_dtype=quant_dtype, group_size=group_size, use_hqq=use_hqq
+        )
+        if "xpu" in device:
+            awq_uintx_config.layout = Int4XPULayout()
         quantize_(
             model,
-            awq_uintx(quant_dtype=quant_dtype, group_size=group_size, use_hqq=use_hqq),
+            awq_uintx_config,
             is_observed_linear,
         )
         print(f"time for quantization: {time.time() - t0:.02f} seconds")
@@ -242,7 +250,12 @@ def wikitext2_ppl(
         group_size = int(quant.split("-")[1])
         use_hqq = "hqq" in quant
         print(f"running {quant} quantization with group size {group_size}")
-        quantize_(model, int4_weight_only(group_size=group_size, use_hqq=use_hqq))
+        int4_weight_only_config = int4_weight_only(
+            group_size=group_size, use_hqq=use_hqq
+        )
+        if "xpu" in device:
+            int4_weight_only_config.layout = Int4XPULayout()
+        quantize_(model, int4_weight_only_config)
     if compile:
         model = torch.compile(model)
 
diff --git a/torchao/quantization/subclass.py b/torchao/quantization/subclass.py
index abaad317eb..be0533510f 100644
--- a/torchao/quantization/subclass.py
+++ b/torchao/quantization/subclass.py
@@ -697,13 +697,6 @@ def to_qtensor_components(
             int_data = aten._convert_weight_to_int4pack_for_cpu(
                 input_int4x8, inner_k_tiles
             )
-        if check_xpu_version(input_float.device):
-            from torchao.quantization.utils import convert_weight_to_int4pack_xpu
-
-            int_data = convert_weight_to_int4pack_xpu(
-                input_int4x8,
-                zero_point_domain_is_int=zero_point_domain == ZeroPointDomain.INT,
-            )
         else:
             int_data = aten._convert_weight_to_int4pack(input_int4x8, inner_k_tiles)
         return int_data, scales_and_zeros, False, groupsize, inner_k_tiles
diff --git a/torchao/quantization/utils.py b/torchao/quantization/utils.py
index 30b9980878..8f2554849c 100644
--- a/torchao/quantization/utils.py
+++ b/torchao/quantization/utils.py
@@ -127,6 +127,11 @@ def cuda(self):
             val.cuda() if isinstance(val, torch.Tensor) else val for val in self.values
         ]
 
+    def xpu(self):
+        self.values = [
+            val.xpu() if isinstance(val, torch.Tensor) else val for val in self.values
+        ]
+
 
 def guard_dtype_size(tensor_arg, arg_name, dtype=None, size=None):
     if dtype is not None and tensor_arg.dtype != dtype:
@@ -415,25 +420,6 @@ def unpack_tinygemm_scales_and_zeros(scales_and_zeros):
     return torch.split(scales_and_zeros.transpose(-3, -2), 1, -1)
 
 
-def convert_weight_to_int4pack_xpu(weight, zero_point_domain_is_int=False):
-    assert weight.device.type == "xpu"
-
-    if zero_point_domain_is_int:
-        # int_data = weight.to(dtype=torch.uint8)
-        int_data = (weight[::, 1::2] << 4 | weight[::, ::2]).to(torch.uint8)
-        packed_weight = torch.ops.aten._convert_weight_to_int4pack(
-            int_data,
-            8,  # TODO:remove
-        )
-    else:
-        out = weight.to(dtype=torch.uint8)
-        out = (out[::, 1::2] << 4 | out[::, ::2]).to(torch.uint8)
-        packed_weight = out.view(torch.int32)
-
-    # Second, N * K/2 uint8 -> N * K/8 int32
-    return packed_weight
-
-
 def groupwise_affine_quantize_tensor_from_qparams(
     w, scales, zeros, n_bit=4, groupsize=128, zero_point_domain=ZeroPointDomain.FLOAT
 ):
@@ -473,6 +459,8 @@ def groupwise_affine_quantize_tensor_from_qparams(
             not (check_xpu_version(int_data.device))
         ):
             int_data = (int_data[::, ::2] << 4 | int_data[::, 1::2]).to(torch.uint8)
+        if check_xpu_version(int_data.device):
+            int_data = (int_data[::, 1::2] << 4 | int_data[::, ::2]).to(torch.uint8)
     return int_data
 
 
@@ -491,7 +479,6 @@ def groupwise_affine_dequantize_tensor_from_qparams(
         TORCH_VERSION_AT_LEAST_2_5
         and (w_int4x8.dtype == torch.uint8 or w_int4x8.shape[-1] > 1)
         and not (check_cpu_version(w_int4x8.device))
-        and not (check_xpu_version(w_int4x8.device))
     ):
         data = w_int4x8.to(torch.int32)
         high_bits = data >> 4
@@ -501,8 +488,12 @@ def groupwise_affine_dequantize_tensor_from_qparams(
             dtype=torch.int32,
             device=w_int4x8.device,
         )
-        w_int32[::, ::2] = high_bits
-        w_int32[::, 1::2] = low_bits
+        if not (check_xpu_version(w_int4x8.device)):
+            w_int32[::, ::2] = high_bits
+            w_int32[::, 1::2] = low_bits
+        else:
+            w_int32[::, ::2] = low_bits
+            w_int32[::, 1::2] = high_bits
     else:
         w_int32 = w_int4x8
 

From dd43f160e6ddfb68da7073c5472ea5d0880acbae Mon Sep 17 00:00:00 2001
From: Scott Roy <161522778+metascroy@users.noreply.github.com>
Date: Fri, 30 May 2025 09:24:22 -0700
Subject: [PATCH 066/165] Update CMake to enable building ops on iOS (#2274)

init
---
 torchao/experimental/CMakeLists.txt           | 44 ++++++++++---------
 .../ops/embedding_xbit/CMakeLists.txt         | 22 +++++-----
 .../CMakeLists.txt                            | 26 ++++++-----
 3 files changed, 50 insertions(+), 42 deletions(-)

diff --git a/torchao/experimental/CMakeLists.txt b/torchao/experimental/CMakeLists.txt
index 4dd02b2dd7..2222ea60b9 100644
--- a/torchao/experimental/CMakeLists.txt
+++ b/torchao/experimental/CMakeLists.txt
@@ -16,6 +16,7 @@ if (NOT CMAKE_BUILD_TYPE)
 endif()
 
 # Platform options
+option(TORCHAO_BUILD_ATEN_OPS "Building torchao ops for ATen." ON)
 option(TORCHAO_BUILD_EXECUTORCH_OPS "Building torchao ops for ExecuTorch." OFF)
 option(TORCHAO_BUILD_MPS_OPS "Building torchao MPS ops" OFF)
 option(TORCHAO_BUILD_CPU_AARCH64 "Build torchao's CPU aarch64 kernels" OFF)
@@ -32,7 +33,7 @@ if(NOT DEFINED TORCHAO_PARALLEL_BACKEND)
 endif()
 
 # Set default compiler options
-add_compile_options("-Wall" "-Werror" "-Wno-deprecated")
+add_compile_options("-Wall" "-Werror" "-Wno-deprecated" "-Wno-shorten-64-to-32")
 
 include(CMakePrintHelpers)
 message("TORCHAO_INCLUDE_DIRS: ${TORCHAO_INCLUDE_DIRS}")
@@ -68,6 +69,7 @@ if(TORCHAO_BUILD_CPU_AARCH64)
     if(TORCHAO_ENABLE_ARM_NEON_DOT)
         message(STATUS "Building with ARM NEON dot product support")
         add_compile_definitions(TORCHAO_ENABLE_ARM_NEON_DOT)
+        add_compile_options("-march=armv8.4-a+dotprod")
     endif()
 
     if(TORCHAO_ENABLE_ARM_I8MM)
@@ -89,26 +91,28 @@ add_subdirectory(ops/linear_8bit_act_xbit_weight)
 add_subdirectory(ops/embedding_xbit)
 
 # ATen ops lib
-add_library(torchao_ops_aten SHARED)
-target_link_libraries(
-    torchao_ops_aten PRIVATE
-    torchao_ops_linear_8bit_act_xbit_weight_aten
-    torchao_ops_embedding_xbit_aten
-)
-
-# Add MPS support if enabled
-if (TORCHAO_BUILD_MPS_OPS)
-    message(STATUS "Building with MPS support")
-    add_subdirectory(ops/mps)
-    target_link_libraries(torchao_ops_aten PRIVATE torchao_ops_mps_aten)
-endif()
+if (TORCHAO_BUILD_ATEN_OPS)
+    add_library(torchao_ops_aten SHARED)
+    target_link_libraries(
+        torchao_ops_aten PRIVATE
+        torchao_ops_linear_8bit_act_xbit_weight_aten
+        torchao_ops_embedding_xbit_aten
+    )
 
-# Install ATen targets
-install(
-    TARGETS torchao_ops_aten
-    EXPORT _targets
-    DESTINATION lib
-)
+    # Add MPS support if enabled
+    if (TORCHAO_BUILD_MPS_OPS)
+        message(STATUS "Building with MPS support")
+        add_subdirectory(ops/mps)
+        target_link_libraries(torchao_ops_aten PRIVATE torchao_ops_mps_aten)
+    endif()
+
+    # Install ATen targets
+    install(
+        TARGETS torchao_ops_aten
+        EXPORT _targets
+        DESTINATION lib
+    )
+endif()
 
 # Build executorch lib if enabled
 if(TORCHAO_BUILD_EXECUTORCH_OPS)
diff --git a/torchao/experimental/ops/embedding_xbit/CMakeLists.txt b/torchao/experimental/ops/embedding_xbit/CMakeLists.txt
index d1ff1d3291..c681a44dc9 100644
--- a/torchao/experimental/ops/embedding_xbit/CMakeLists.txt
+++ b/torchao/experimental/ops/embedding_xbit/CMakeLists.txt
@@ -8,17 +8,19 @@ cmake_minimum_required(VERSION 3.19)
 
 include(${CMAKE_CURRENT_SOURCE_DIR}/../../Utils.cmake)
 
-find_package(Torch REQUIRED)
-add_library(torchao_ops_embedding_xbit_aten OBJECT
-    op_embedding_xbit_aten.cpp
-)
-target_link_torchao_parallel_backend(torchao_ops_embedding_xbit_aten "${TORCHAO_PARALLEL_BACKEND}")
-if (TORCHAO_BUILD_CPU_AARCH64)
-    target_link_libraries(torchao_ops_embedding_xbit_aten PRIVATE torchao_kernels_aarch64)
+if(TORCHAO_BUILD_ATEN_OPS)
+    find_package(Torch REQUIRED)
+    add_library(torchao_ops_embedding_xbit_aten OBJECT
+        op_embedding_xbit_aten.cpp
+    )
+    target_link_torchao_parallel_backend(torchao_ops_embedding_xbit_aten "${TORCHAO_PARALLEL_BACKEND}")
+    if (TORCHAO_BUILD_CPU_AARCH64)
+        target_link_libraries(torchao_ops_embedding_xbit_aten PRIVATE torchao_kernels_aarch64)
+    endif()
+    target_include_directories(torchao_ops_embedding_xbit_aten PRIVATE "${TORCH_INCLUDE_DIRS}")
+    target_link_libraries(torchao_ops_embedding_xbit_aten PRIVATE "${TORCH_LIBRARIES}")
+    target_compile_definitions(torchao_ops_embedding_xbit_aten PRIVATE USE_ATEN=1)
 endif()
-target_include_directories(torchao_ops_embedding_xbit_aten PRIVATE "${TORCH_INCLUDE_DIRS}")
-target_link_libraries(torchao_ops_embedding_xbit_aten PRIVATE "${TORCH_LIBRARIES}")
-target_compile_definitions(torchao_ops_embedding_xbit_aten PRIVATE USE_ATEN=1)
 
 if(TORCHAO_BUILD_EXECUTORCH_OPS)
     # ExecuTorch package is not required, but EXECUTORCH_INCLUDE_DIRS and EXECUTORCH_LIBRARIES must
diff --git a/torchao/experimental/ops/linear_8bit_act_xbit_weight/CMakeLists.txt b/torchao/experimental/ops/linear_8bit_act_xbit_weight/CMakeLists.txt
index 2e570c7622..4bc3259061 100644
--- a/torchao/experimental/ops/linear_8bit_act_xbit_weight/CMakeLists.txt
+++ b/torchao/experimental/ops/linear_8bit_act_xbit_weight/CMakeLists.txt
@@ -20,20 +20,22 @@ if (NOT TARGET cpuinfo)
         cpuinfo)
 endif()
 
-find_package(Torch REQUIRED)
-add_library(torchao_ops_linear_8bit_act_xbit_weight_aten OBJECT
-    linear_8bit_act_xbit_weight.cpp
-    op_linear_8bit_act_xbit_weight_aten.cpp
-)
-target_link_torchao_parallel_backend(torchao_ops_linear_8bit_act_xbit_weight_aten "${TORCHAO_PARALLEL_BACKEND}")
+if (TORCHAO_BUILD_ATEN_OPS)
+    find_package(Torch REQUIRED)
+    add_library(torchao_ops_linear_8bit_act_xbit_weight_aten OBJECT
+        linear_8bit_act_xbit_weight.cpp
+        op_linear_8bit_act_xbit_weight_aten.cpp
+    )
+    target_link_torchao_parallel_backend(torchao_ops_linear_8bit_act_xbit_weight_aten "${TORCHAO_PARALLEL_BACKEND}")
 
-if(TORCHAO_BUILD_CPU_AARCH64)
-    target_link_libraries(torchao_ops_linear_8bit_act_xbit_weight_aten PRIVATE torchao_kernels_aarch64)
+    if(TORCHAO_BUILD_CPU_AARCH64)
+        target_link_libraries(torchao_ops_linear_8bit_act_xbit_weight_aten PRIVATE torchao_kernels_aarch64)
+    endif()
+    target_link_libraries(torchao_ops_linear_8bit_act_xbit_weight_aten PRIVATE cpuinfo)
+    target_include_directories(torchao_ops_linear_8bit_act_xbit_weight_aten PRIVATE "${TORCH_INCLUDE_DIRS}")
+    target_link_libraries(torchao_ops_linear_8bit_act_xbit_weight_aten PRIVATE "${TORCH_LIBRARIES}")
+    target_compile_definitions(torchao_ops_linear_8bit_act_xbit_weight_aten PRIVATE USE_ATEN=1)
 endif()
-target_link_libraries(torchao_ops_linear_8bit_act_xbit_weight_aten PRIVATE cpuinfo)
-target_include_directories(torchao_ops_linear_8bit_act_xbit_weight_aten PRIVATE "${TORCH_INCLUDE_DIRS}")
-target_link_libraries(torchao_ops_linear_8bit_act_xbit_weight_aten PRIVATE "${TORCH_LIBRARIES}")
-target_compile_definitions(torchao_ops_linear_8bit_act_xbit_weight_aten PRIVATE USE_ATEN=1)
 
 if(TORCHAO_BUILD_EXECUTORCH_OPS)
     # ExecuTorch package is not required, but EXECUTORCH_INCLUDE_DIRS and EXECUTORCH_LIBRARIES must

From c4250a4bfa495a260ea009e23a9b8202bb93b52d Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Fri, 30 May 2025 11:49:30 -0700
Subject: [PATCH 067/165] Fixes MX formats build for blackwell (#2278)

* Fixes MX formats build for blackwell

* Adds missing line

* Adds missing line

---------

Co-authored-by: Syed Tousif Ahmed <syeahmed@nvidia.com>
---
 setup.py                                      | 100 +++++++++++++-----
 third_party/cutlass                           |   2 +-
 torchao/__init__.py                           |   4 +-
 .../cuda/mx_kernels/mx_fp_cutlass_kernels.cu  |   5 +
 4 files changed, 83 insertions(+), 28 deletions(-)

diff --git a/setup.py b/setup.py
index ff4d7fffb5..62739342f0 100644
--- a/setup.py
+++ b/setup.py
@@ -424,6 +424,9 @@ def get_extensions():
 
     use_cutlass = False
     cutlass_90a_sources = None
+    cutlass_100a_sources = None
+    build_for_sm90a = False
+    build_for_sm100a = False
     if use_cuda and not IS_WINDOWS:
         use_cutlass = True
         cutlass_dir = os.path.join(third_party_path, "cutlass")
@@ -453,32 +456,47 @@ def get_extensions():
         )
 
         cuda_arch_flags = _get_cuda_arch_flags()
-        build_for_sm90 = "-gencode=arch=compute_90,code=sm_90" in cuda_arch_flags
         build_for_sm90a = "-gencode=arch=compute_90a,code=sm_90a" in cuda_arch_flags
-        if build_for_sm90 and not build_for_sm90a:
-            cutlass_90a_sources = [
+        build_for_sm100a = "-gencode=arch=compute_100a,code=sm_100a" in cuda_arch_flags
+        # Define sm90a sources
+        cutlass_90a_sources = [
+            os.path.join(
+                extensions_cuda_dir,
+                "rowwise_scaled_linear_sparse_cutlass",
+                "rowwise_scaled_linear_sparse_cutlass_f8f8.cu",
+            ),
+            os.path.join(
+                extensions_cuda_dir,
+                "to_sparse_semi_structured_cutlass_sm9x",
+                "to_sparse_semi_structured_cutlass_sm9x_f8.cu",
+            ),
+            os.path.join(extensions_cuda_dir, "activation24", "sparsify24.cu"),
+            os.path.join(extensions_cuda_dir, "activation24", "sparse_gemm.cu"),
+        ]
+        for dtypes in ["e4m3e4m3", "e4m3e5m2", "e5m2e4m3", "e5m2e5m2"]:
+            cutlass_90a_sources.append(
                 os.path.join(
                     extensions_cuda_dir,
                     "rowwise_scaled_linear_sparse_cutlass",
-                    "rowwise_scaled_linear_sparse_cutlass_f8f8.cu",
-                ),
-                os.path.join(
-                    extensions_cuda_dir,
-                    "to_sparse_semi_structured_cutlass_sm9x",
-                    "to_sparse_semi_structured_cutlass_sm9x_f8.cu",
-                ),
-                os.path.join(extensions_cuda_dir, "activation24", "sparsify24.cu"),
-                os.path.join(extensions_cuda_dir, "activation24", "sparse_gemm.cu"),
-            ]
-            for dtypes in ["e4m3e4m3", "e4m3e5m2", "e5m2e4m3", "e5m2e5m2"]:
-                cutlass_90a_sources.append(
-                    os.path.join(
-                        extensions_cuda_dir,
-                        "rowwise_scaled_linear_sparse_cutlass",
-                        "rowwise_scaled_linear_sparse_cutlass_" + dtypes + ".cu",
-                    )
+                    "rowwise_scaled_linear_sparse_cutlass_" + dtypes + ".cu",
                 )
-            sources = [s for s in sources if s not in cutlass_90a_sources]
+            )
+        # Always remove sm90a sources from main sources
+        sources = [s for s in sources if s not in cutlass_90a_sources]
+
+        # Always compile mx_fp_cutlass_kernels.cu ONLY with sm100a architecture
+        cutlass_100a_sources = [
+            os.path.join(
+                extensions_cuda_dir,
+                "mx_kernels",
+                "mx_fp_cutlass_kernels.cu",
+            ),
+        ]
+        # Remove from main sources to prevent compilation with other architectures
+        sources = [
+            s for s in sources if os.path.basename(s) != "mx_fp_cutlass_kernels.cu"
+        ]
+
     else:
         # Remove CUTLASS-based kernels from the sources list.  An
         # assumption is that these files will have "cutlass" in its
@@ -492,6 +510,11 @@ def get_extensions():
 
     ext_modules = []
     if len(sources) > 0:
+        # Double-check to ensure mx_fp_cutlass_kernels.cu is not in sources
+        sources = [
+            s for s in sources if os.path.basename(s) != "mx_fp_cutlass_kernels.cu"
+        ]
+
         ext_modules.append(
             extension(
                 "torchao._C",
@@ -502,14 +525,20 @@ def get_extensions():
             )
         )
 
-    if cutlass_90a_sources is not None and len(cutlass_90a_sources) > 0:
+    # Only build the cutlass_90a extension if sm90a is in the architecture flags
+    if (
+        cutlass_90a_sources is not None
+        and len(cutlass_90a_sources) > 0
+        and build_for_sm90a
+    ):
         cutlass_90a_extra_compile_args = copy.deepcopy(extra_compile_args)
-        cutlass_90a_extra_compile_args["nvcc"].extend(
-            cuda_arch_flags + ["-gencode=arch=compute_90a,code=sm_90a"]
+        # Only use sm90a architecture for these sources, ignoring other flags
+        cutlass_90a_extra_compile_args["nvcc"].append(
+            "-gencode=arch=compute_90a,code=sm_90a"
         )
         ext_modules.append(
             extension(
-                "torchao._C",
+                "torchao._C_cutlass_90a",
                 cutlass_90a_sources,
                 py_limited_api=True,
                 extra_compile_args=cutlass_90a_extra_compile_args,
@@ -517,6 +546,27 @@ def get_extensions():
             )
         )
 
+    # Only build the cutlass_100a extension if sm100a is in the architecture flags
+    if (
+        cutlass_100a_sources is not None
+        and len(cutlass_100a_sources) > 0
+        and build_for_sm100a
+    ):
+        cutlass_100a_extra_compile_args = copy.deepcopy(extra_compile_args)
+        # Only use sm100a architecture for these sources, ignoring cuda_arch_flags
+        cutlass_100a_extra_compile_args["nvcc"].append(
+            "-gencode=arch=compute_100a,code=sm_100a"
+        )
+        ext_modules.append(
+            extension(
+                "torchao._C_cutlass_100a",
+                cutlass_100a_sources,
+                py_limited_api=True,
+                extra_compile_args=cutlass_100a_extra_compile_args,
+                extra_link_args=extra_link_args,
+            )
+        )
+
     # Build CMakeLists from /torchao/experimental - additional options become available : TORCHAO_BUILD_CPU_AARCH64, TORCHAO_BUILD_KLEIDIAI, TORCHAO_BUILD_MPS_OPS, TORCHAO_PARALLEL_BACKEND
     if build_macos_arm_auto or os.getenv("BUILD_TORCHAO_EXPERIMENTAL") == "1":
         build_options = BuildOptions()
diff --git a/third_party/cutlass b/third_party/cutlass
index afa1772203..ad7b2f5e84 160000
--- a/third_party/cutlass
+++ b/third_party/cutlass
@@ -1 +1 @@
-Subproject commit afa1772203677c5118fcd82537a9c8fefbcc7008
+Subproject commit ad7b2f5e84fcfa124cb02b91d5bd26d238c0459e
diff --git a/torchao/__init__.py b/torchao/__init__.py
index 730cd326fe..e6e291309f 100644
--- a/torchao/__init__.py
+++ b/torchao/__init__.py
@@ -25,8 +25,8 @@
 
     so_files = list(Path(__file__).parent.glob("_C*.so"))
     if len(so_files) > 0:
-        assert len(so_files) == 1, f"Expected one _C*.so file, found {len(so_files)}"
-        torch.ops.load_library(str(so_files[0]))
+        for file in so_files:
+            torch.ops.load_library(str(file))
         from . import ops
 
     # The following library contains CPU kernels from torchao/experimental
diff --git a/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels.cu b/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels.cu
index 7c34faf56a..15b657c370 100644
--- a/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels.cu
+++ b/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels.cu
@@ -3,6 +3,11 @@
 //
 // This source code is licensed under the BSD 3-Clause license found in the
 // LICENSE file in the root directory of this source tree.
+
+// Ensure this file is only compiled with sm100a architecture
+#if !defined(__CUDA_ARCH__) || (__CUDA_ARCH__ < 1000)
+#error "This file must be compiled with compute capability 10.0a or higher (Blackwell architecture)"
+#endif
 #include <torch/library.h>
 
 #include <ATen/ATen.h>

From e51ffd90d5aefb2c0ea544c7cd809606572de4f3 Mon Sep 17 00:00:00 2001
From: cccclai <chenlai@meta.com>
Date: Fri, 30 May 2025 17:24:59 -0700
Subject: [PATCH 068/165] Patch the _is_conv_node function

Differential Revision: D75323215

Pull Request resolved: https://github.com/pytorch/ao/pull/2257
---
 test/quantization/pt2e/test_quantize_pt2e.py | 118 +++++++++++++++++++
 torchao/quantization/pt2e/utils.py           |   3 +
 2 files changed, 121 insertions(+)

diff --git a/test/quantization/pt2e/test_quantize_pt2e.py b/test/quantization/pt2e/test_quantize_pt2e.py
index 75701c55ca..730969ba9c 100644
--- a/test/quantization/pt2e/test_quantize_pt2e.py
+++ b/test/quantization/pt2e/test_quantize_pt2e.py
@@ -2571,6 +2571,124 @@ def forward(self, x):
             node_list,
         )
 
+    def test_conv_padding_bn_relu(self):
+        class BackendAQuantizer(Quantizer):
+            def annotate(self, model: torch.fx.GraphModule) -> torch.fx.GraphModule:
+                act_qspec = QuantizationSpec(
+                    dtype=torch.uint8,
+                    quant_min=0,
+                    quant_max=255,
+                    qscheme=torch.per_tensor_affine,
+                    is_dynamic=False,
+                    observer_or_fake_quant_ctr=observer.default_observer,
+                )
+                weight_qspec = QuantizationSpec(
+                    dtype=torch.int8,
+                    quant_min=-128,
+                    quant_max=127,
+                    qscheme=torch.per_tensor_affine,
+                    is_dynamic=False,
+                    observer_or_fake_quant_ctr=observer.default_weight_observer,
+                )
+                bias_qspec = QuantizationSpec(
+                    dtype=torch.float32,
+                    is_dynamic=False,
+                    observer_or_fake_quant_ctr=observer.PlaceholderObserver,
+                )
+
+                for n in model.graph.nodes:
+                    if (
+                        n.op != "call_function"
+                        or n.target != torch.ops.aten.relu.default
+                    ):
+                        continue
+                    relu_node = n
+                    n = n.args[0]
+
+                    # Check for any of the conv operations
+                    conv_ops = [
+                        torch.ops.aten.conv1d.padding,
+                        torch.ops.aten.conv2d.padding,
+                        torch.ops.aten.conv3d.padding,
+                    ]
+                    if n.op != "call_function" or n.target not in conv_ops:
+                        continue
+
+                    conv_node = n
+                    input_act = conv_node.args[0]
+                    weight = conv_node.args[1]
+                    bias = conv_node.args[2]
+                    conv_node.meta["quantization_annotation"] = QuantizationAnnotation(
+                        input_qspec_map={
+                            input_act: act_qspec,
+                            weight: weight_qspec,
+                            bias: bias_qspec,
+                        },
+                        _annotated=True,
+                    )
+                    relu_node.meta["quantization_annotation"] = QuantizationAnnotation(
+                        output_qspec=act_qspec,
+                        _annotated=True,
+                    )
+
+            def validate(self, model: torch.fx.GraphModule) -> None:
+                pass
+
+        # Test cases for Conv1d, Conv2d, Conv3d
+        test_cases = [
+            {
+                "conv_type": torch.nn.Conv1d,
+                "bn_type": torch.nn.BatchNorm1d,
+                "example_input": (torch.randn(1, 3, 5),),
+                "conv_op": torch.ops.aten.conv1d.padding,
+            },
+            {
+                "conv_type": torch.nn.Conv2d,
+                "bn_type": torch.nn.BatchNorm2d,
+                "example_input": (torch.randn(1, 3, 5, 5),),
+                "conv_op": torch.ops.aten.conv2d.padding,
+            },
+            {
+                "conv_type": torch.nn.Conv3d,
+                "bn_type": torch.nn.BatchNorm3d,
+                "example_input": (torch.randn(1, 3, 5, 5, 5),),
+                "conv_op": torch.ops.aten.conv3d.padding,
+            },
+        ]
+
+        for test_case in test_cases:
+            with self.subTest(conv_type=test_case["conv_type"].__name__):
+
+                class M(torch.nn.Module):
+                    def __init__(self):
+                        super().__init__()
+                        self.conv = test_case["conv_type"](3, 3, 3, padding="same")
+                        self.bn = test_case["bn_type"](3)
+
+                    def forward(self, x):
+                        return torch.nn.functional.relu(self.bn(self.conv(x)))
+
+                node_occurrence = {
+                    torch.ops.quantized_decomposed.quantize_per_tensor.default: 2,
+                    torch.ops.quantized_decomposed.dequantize_per_tensor.default: 3,
+                }
+                node_list = [
+                    torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+                    torch.ops.quantized_decomposed.dequantize_per_tensor.default,
+                    test_case["conv_op"],
+                    torch.ops.aten.relu.default,
+                    torch.ops.quantized_decomposed.quantize_per_tensor.default,
+                ]
+
+                model = M().eval()
+                self._test_quantizer(
+                    model,
+                    test_case["example_input"],
+                    BackendAQuantizer(),
+                    node_occurrence,
+                    node_list,
+                )
+
     def test_multi_users_without_output_observer(self):
         """
         Test the case in which a node is used by multiple users,
diff --git a/torchao/quantization/pt2e/utils.py b/torchao/quantization/pt2e/utils.py
index ad5c0ae179..dc5f802fb8 100644
--- a/torchao/quantization/pt2e/utils.py
+++ b/torchao/quantization/pt2e/utils.py
@@ -625,8 +625,11 @@ def _is_conv_node(n: Node):
     """
     return n.op == "call_function" and n.target in [
         torch.ops.aten.conv1d.default,
+        torch.ops.aten.conv1d.padding,
         torch.ops.aten.conv2d.default,
+        torch.ops.aten.conv2d.padding,
         torch.ops.aten.conv3d.default,
+        torch.ops.aten.conv3d.padding,
     ]
 
 
From 9d5b9ad4780d2db974b6679004a8bcf6e15b53c0 Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Fri, 30 May 2025 17:55:54 -0700
Subject: [PATCH 069/165] Add back AOPerModuleConfig for BC (#2282)

Summary:
att, just temporary so that integrations keep working

Test Plan:
tests in other libs

Reviewers:

Subscribers:

Tasks:

Tags:
---
 test/integration/test_vllm.py    | 6 +++---
 torchao/quantization/__init__.py | 4 ++++
 2 files changed, 7 insertions(+), 3 deletions(-)

diff --git a/test/integration/test_vllm.py b/test/integration/test_vllm.py
index b82f4f9794..7bb9a6defa 100644
--- a/test/integration/test_vllm.py
+++ b/test/integration/test_vllm.py
@@ -17,10 +17,10 @@
 import torch
 
 from packaging import version
-from torchao.utils import TORCH_VERSION_AT_LEAST_2_7
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_8
 
-if not TORCH_VERSION_AT_LEAST_2_7:
-    pytest.skip("Requires PyTorch 2.7 or higher", allow_module_level=True)
+if not TORCH_VERSION_AT_LEAST_2_8:
+    pytest.skip("Requires PyTorch 2.8 or higher", allow_module_level=True)
 
 
 VLLM_AVAILABLE = importlib.util.find_spec("vllm") is not None
diff --git a/torchao/quantization/__init__.py b/torchao/quantization/__init__.py
index 73ccd2e0ff..15736acc3b 100644
--- a/torchao/quantization/__init__.py
+++ b/torchao/quantization/__init__.py
@@ -108,6 +108,9 @@
 )
 from .weight_only import WeightOnlyInt8QuantLinear
 
+# TODO: remove after migration of APIs are done
+AOPerModuleConfig = ModuleFqnToConfig
+
 __all__ = [
     # top level API - auto
     "autoquant",
@@ -148,6 +151,7 @@
     "IntxWeightOnlyConfig",
     "FPXWeightOnlyConfig",
     "GemliteUIntXWeightOnlyConfig",
+    "AOPerModuleConfig",
     "ModuleFqnToConfig",
     "FbgemmConfig",
     # smooth quant - subject to change

From ce27731a7a9de33a7b578e32326a8275e47a365a Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Fri, 30 May 2025 21:48:36 -0700
Subject: [PATCH 070/165] Fix Bug in MX Builds (#2284)

stack-info: PR: https://github.com/pytorch/ao/pull/2284, branch: drisspg/stack/62
---
 setup.py                                      | 53 +++++++++++++++++--
 .../cuda/mx_kernels/mx_fp_cutlass_kernels.cu  |  4 --
 2 files changed, 50 insertions(+), 7 deletions(-)

diff --git a/setup.py b/setup.py
index 62739342f0..51c283c858 100644
--- a/setup.py
+++ b/setup.py
@@ -223,6 +223,55 @@ def not_exists_or_empty(folder):
         )
 
 
+def get_cuda_version_from_nvcc():
+    """Get CUDA version from nvcc if available."""
+    try:
+        result = subprocess.check_output(
+            ["nvcc", "--version"], stderr=subprocess.STDOUT
+        )
+        output = result.decode("utf-8")
+        # Look for version line like "release 12.6"
+        for line in output.split("\n"):
+            if "release" in line.lower():
+                parts = line.split()
+                for i, part in enumerate(parts):
+                    if part.lower() == "release" and i + 1 < len(parts):
+                        return parts[i + 1].rstrip(",")
+
+    except:
+        return None
+
+
+def get_cutlass_build_flags():
+    """Determine which CUTLASS kernels to build based on CUDA version.
+    SM90a: CUDA 12.6+, SM100a: CUDA 12.8+
+    """
+    # Try nvcc then torch version
+    cuda_version = get_cuda_version_from_nvcc() or torch.version.cuda
+
+    try:
+        if not cuda_version:
+            raise ValueError("No CUDA version found")
+
+        major, minor = map(int, cuda_version.split(".")[:2])
+        build_sm90a = major > 12 or (major == 12 and minor >= 6)
+        build_sm100a = major > 12 or (major == 12 and minor >= 8)
+
+        if build_sm90a:
+            print(f"CUDA {cuda_version}: Enabling SM90a CUTLASS kernels")
+        if build_sm100a:
+            print(f"CUDA {cuda_version}: Enabling SM100a CUTLASS kernels")
+
+        return build_sm90a, build_sm100a
+    except:
+        # Fallback to architecture flags
+        cuda_arch_flags = _get_cuda_arch_flags()
+        return (
+            "-gencode=arch=compute_90a,code=sm_90a" in cuda_arch_flags,
+            "-gencode=arch=compute_100a,code=sm_100a" in cuda_arch_flags,
+        )
+
+
 # BuildExtension is a subclass of from setuptools.command.build_ext.build_ext
 class TorchAOBuildExt(BuildExtension):
     def __init__(self, *args, **kwargs) -> None:
@@ -455,9 +504,7 @@ def get_extensions():
             ]
         )
 
-        cuda_arch_flags = _get_cuda_arch_flags()
-        build_for_sm90a = "-gencode=arch=compute_90a,code=sm_90a" in cuda_arch_flags
-        build_for_sm100a = "-gencode=arch=compute_100a,code=sm_100a" in cuda_arch_flags
+        build_for_sm90a, build_for_sm100a = get_cutlass_build_flags()
         # Define sm90a sources
         cutlass_90a_sources = [
             os.path.join(
diff --git a/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels.cu b/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels.cu
index 15b657c370..7167cea8fb 100644
--- a/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels.cu
+++ b/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels.cu
@@ -4,10 +4,6 @@
 // This source code is licensed under the BSD 3-Clause license found in the
 // LICENSE file in the root directory of this source tree.
 
-// Ensure this file is only compiled with sm100a architecture
-#if !defined(__CUDA_ARCH__) || (__CUDA_ARCH__ < 1000)
-#error "This file must be compiled with compute capability 10.0a or higher (Blackwell architecture)"
-#endif
 #include <torch/library.h>
 
 #include <ATen/ATen.h>

From ca17609a04379fe402c1cfc89efdfde3d7170108 Mon Sep 17 00:00:00 2001
From: Emmanuel Ferdman <emmanuelferdman@gmail.com>
Date: Sun, 1 Jun 2025 08:39:06 +0300
Subject: [PATCH 071/165] Fix benchmark_low_bit_adam.py reference (#2287)

Signed-off-by: Emmanuel Ferdman <emmanuelferdman@gmail.com>
---
 torchao/optim/README.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/torchao/optim/README.md b/torchao/optim/README.md
index 4349f3d0ad..922dd428d2 100644
--- a/torchao/optim/README.md
+++ b/torchao/optim/README.md
@@ -32,7 +32,7 @@ NOTE:
 
 ## Benchmarks
 
-Fine-tune [timm](https://github.com/huggingface/pytorch-image-models)'s [ViT-H](https://huggingface.co/timm/vit_huge_patch14_224.orig_in21k) (630M params) on [resisc45](https://huggingface.co/datasets/timm/resisc45) dataset. PyTorch 2.4, BF16 AMP, compiled model, 1 epoch, batch size 8, cosine LR scheduler, 4070Ti SUPER, fixed random seed. Benchmark script is available at [benchmarks/benchmark_low_bit_adam.py](../../../benchmarks/benchmark_low_bit_adam.py).
+Fine-tune [timm](https://github.com/huggingface/pytorch-image-models)'s [ViT-H](https://huggingface.co/timm/vit_huge_patch14_224.orig_in21k) (630M params) on [resisc45](https://huggingface.co/datasets/timm/resisc45) dataset. PyTorch 2.4, BF16 AMP, compiled model, 1 epoch, batch size 8, cosine LR scheduler, 4070Ti SUPER, fixed random seed. Benchmark script is available at [benchmarks/benchmark_low_bit_adam.py](../../benchmarks/benchmark_low_bit_adam.py).
 
 AdamW impl      | Peak memory allocated (GB) | imgs/s | accuracy
 ----------------|----------------------------|--------|----------

From 8366465ebd8b017c89ae4a2fcddad744cbb9c405 Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Sun, 1 Jun 2025 20:21:46 -0700
Subject: [PATCH 072/165] Remove Constraint for sm89 hardware (#2281)

stack-info: PR: https://github.com/pytorch/ao/pull/2281, branch: drisspg/stack/61
---
 .github/workflows/float8_test.yml          |  1 +
 test/dtypes/test_affine_quantized_float.py | 51 ++++++++++++++++++----
 torchao/float8/inference.py                | 17 +++-----
 torchao/utils.py                           |  6 +++
 4 files changed, 57 insertions(+), 18 deletions(-)

diff --git a/.github/workflows/float8_test.yml b/.github/workflows/float8_test.yml
index 0b17a23bf7..91083df0bf 100644
--- a/.github/workflows/float8_test.yml
+++ b/.github/workflows/float8_test.yml
@@ -55,3 +55,4 @@ jobs:
         pip install .
         pytest test/float8 --verbose -s
         pytest test/integration --verbose -s
+        pytest test/dtypes/test_affine_quantized_float.py --verbose -s
diff --git a/test/dtypes/test_affine_quantized_float.py b/test/dtypes/test_affine_quantized_float.py
index 408e6e6ce0..1ffd62ecbf 100644
--- a/test/dtypes/test_affine_quantized_float.py
+++ b/test/dtypes/test_affine_quantized_float.py
@@ -50,6 +50,7 @@
 from torchao.utils import (
     is_sm_at_least_89,
     is_sm_at_least_90,
+    is_sm_version,
 )
 
 random.seed(0)
@@ -76,9 +77,7 @@ class TestAffineQuantizedFloat8Compile(InductorTestCase):
     @common_utils.parametrize("dtype", [torch.bfloat16, torch.float32])
     @common_utils.parametrize("mode", ["dynamic", "weight-only", "static"])
     @common_utils.parametrize("compile", [True, False])
-    @common_utils.parametrize(
-        "granularity", [PerTensor(), PerRow()] if is_sm_at_least_90() else [PerTensor()]
-    )
+    @common_utils.parametrize("granularity", [PerTensor(), PerRow()])
     # Inputs are (M,..), K, N
     @common_utils.parametrize(
         "sizes",
@@ -420,9 +419,7 @@ def test_dequantize_affine_float8_scale_broadcasting(self):
     @unittest.skipIf(
         not is_sm_at_least_89(), "Requires GPU with compute capability >= 8.9"
     )
-    @common_utils.parametrize(
-        "granularity", [PerTensor(), PerRow()] if is_sm_at_least_90() else [PerTensor()]
-    )
+    @common_utils.parametrize("granularity", [PerTensor(), PerRow()])
     def test_float8_tensor_slicing_basic(self, granularity):
         """Test basic slicing operations on Float8 tensors"""
         device = "cuda"
@@ -555,8 +552,10 @@ def test_float8_tensor_slicing_edge_cases(self):
     @unittest.skipIf(
         not is_sm_at_least_89(), "Requires GPU with compute capability >= 8.9"
     )
-    @common_utils.parametrize(
-        "granularity", [PerTensor(), PerRow()] if is_sm_at_least_90() else [PerTensor()]
+    @common_utils.parametrize("granularity", [PerTensor(), PerRow()])
+    @unittest.skipIf(
+        is_sm_version(8, 9),
+        "TODO: AssertionError: tensor(-2.1562, device='cuda:0', dtype=torch.bfloat16) not greater than 15",
     )
     def test_float8_tensor_slicing_functional_correctness(self, granularity):
         """Test that sliced tensors produce correct results in computations"""
@@ -579,6 +578,42 @@ def test_float8_tensor_slicing_functional_correctness(self, granularity):
         ref_weight_slice = ref_model.weight[0:16, 0:32]
         quant_weight_slice = quant_model.weight[0:16, 0:32]
 
+        # Verify that the sliced weights maintain Float8 properties
+        self.assertTrue(hasattr(quant_weight_slice, "original_weight_tensor"))
+        sliced_impl = quant_weight_slice.original_weight_tensor.tensor_impl
+        self.assertTrue(isinstance(sliced_impl, Float8AQTTensorImpl))
+
+        # Verify sliced weight shapes
+        self.assertEqual(sliced_impl.float8_data.shape, (16, 32))
+
+        # Get original quantized weight implementation for scale comparison
+        original_quant_impl = quant_model.weight.original_weight_tensor.tensor_impl
+
+        # Verify scale properties based on granularity
+        if isinstance(granularity, PerTensor):
+            # Per-tensor: scale should be identical to original (scalar)
+            self.assertEqual(sliced_impl.scale.numel(), 1)
+            self.assertTrue(torch.equal(sliced_impl.scale, original_quant_impl.scale))
+        else:  # PerRow
+            # Per-row: scale should be sliced to match the selected rows (0:16)
+            expected_scale_shape = (16, 1)
+            self.assertEqual(sliced_impl.scale.shape, expected_scale_shape)
+            # Verify the scale values are the correct slice from the original
+            self.assertTrue(
+                torch.equal(sliced_impl.scale, original_quant_impl.scale[0:16])
+            )
+
+        # Verify that sliced quantized data matches the correct slice from original
+        original_float8_data_slice = original_quant_impl.float8_data[0:16, 0:32]
+        self.assertTrue(
+            torch.equal(sliced_impl.float8_data, original_float8_data_slice)
+        )
+
+        # Verify that sliced weights can be converted back to float with correct values
+        sliced_float_weight = quant_weight_slice.to(dtype)
+        self.assertEqual(sliced_float_weight.shape, (16, 32))
+        self.assertEqual(sliced_float_weight.dtype, dtype)
+
         input_slice = input_tensor[:, 0:32]  # (8, 32) to match sliced weight
 
         # Compute with sliced weights
diff --git a/torchao/float8/inference.py b/torchao/float8/inference.py
index 00c905f3d8..d6e650aa6e 100644
--- a/torchao/float8/inference.py
+++ b/torchao/float8/inference.py
@@ -19,7 +19,6 @@
 from torchao.utils import (
     is_MI300,
     is_sm_at_least_89,
-    is_sm_at_least_90,
 )
 
 Tensor = torch.Tensor
@@ -168,13 +167,11 @@ def _check_hardware_support(
         ValueError: If invalid granularity type is provided
     """
     for _granularity in granularities:
-        if isinstance(_granularity, PerTensor):
-            assert is_sm_at_least_89() or is_MI300(), (
-                "PerTensor quantization only works for CUDA>=8.9 and MI300+"
-            )
-        elif isinstance(_granularity, PerRow):
-            assert is_sm_at_least_90() or is_MI300(), (
-                "PerRow quantization only works for CUDA>=9.0 and MI300+"
+        if not isinstance(_granularity, (PerTensor, PerRow)):
+            raise ValueError(
+                f"Invalid granularity type: {_granularity}, only PerTensor or PerRow are supported."
             )
-        else:
-            raise ValueError(f"Invalid granularity type: {_granularity}")
+
+        assert is_sm_at_least_89() or is_MI300(), (
+            "Float8 dynamic quantization requires CUDA compute capability ≥8.9 or MI300+."
+        )
diff --git a/torchao/utils.py b/torchao/utils.py
index 1fa395cb8a..416d23d785 100644
--- a/torchao/utils.py
+++ b/torchao/utils.py
@@ -655,6 +655,12 @@ def is_Navi4():
     return False
 
 
+def is_sm_version(major: int, minor: int) -> bool:
+    """Check if the CUDA version is exactly major.minor"""
+    is_cuda = torch.cuda.is_available() and torch.version.cuda
+    return torch.cuda.get_device_capability() == (major, minor) if is_cuda else False
+
+
 def is_sm_at_least_89():
     return (
         torch.cuda.is_available()

From 31db5a11fabb31902363ec708c19d9421f86c476 Mon Sep 17 00:00:00 2001
From: Daniel Vega-Myhre <danvm@meta.com>
Date: Mon, 2 Jun 2025 13:29:37 -0700
Subject: [PATCH 073/165] [float8 training] remove duplicate override for view
 (#2269)

* remove duplicate override for view

* raise exception if op is already implemented
---
 torchao/float8/float8_ops.py | 5 ++++-
 1 file changed, 4 insertions(+), 1 deletion(-)

diff --git a/torchao/float8/float8_ops.py b/torchao/float8/float8_ops.py
index f7ccad4a86..4071d83e4f 100644
--- a/torchao/float8/float8_ops.py
+++ b/torchao/float8/float8_ops.py
@@ -92,6 +92,10 @@ def implements(aten_ops):
 
     def decorator(func):
         for op in aten_ops:
+            if op in FLOAT8_OPS_TABLE:
+                raise RuntimeError(
+                    f"Float8 op {op} is already registered to {FLOAT8_OPS_TABLE[op].__name__}"
+                )
             FLOAT8_OPS_TABLE[op] = func
         return func
 
@@ -100,7 +104,6 @@ def decorator(func):
 
 @implements(
     [
-        aten.view.default,
         aten._unsafe_view.default,
         aten.as_strided.default,
         aten.clone.default,

From f0f1f6ce470d2854eb8fafc5dda3b4ffd80f1fe5 Mon Sep 17 00:00:00 2001
From: HDCharles <39544797+HDCharles@users.noreply.github.com>
Date: Mon, 2 Jun 2025 18:33:41 -0400
Subject: [PATCH 074/165] GPTQ updates (#2235)

* GPTQ updates

Summary:

1) reorganized GPTQ
 a) got rid of old GPTQ and renamed GPTQ_MT to GPTQ
 b) moved new GPTQ to prototype
 c) moved quantized linear modules in GPTQ.py to linear_quant_modules.py
2) removed dependence on lm_eval for input_recorder
 a) created new input recorder that doesn't depend on lm_eval
 b) made lm_eval input recorder depend on new generic input_recorder
 c) made TransformerEvalWrapper the base class and made
 d) updated apis generally to work with new input recorder
 LMEvalInputRecorder inherit from it instead of vice-versa
3) reorganized GPTQ tests
 a) moved tests from test_quant_api.py to test_gptq.py
 b) added new test that can be run in CI that doesn't depend on
 lm_eval/llama weights
 c) got rid of test_gptq_mt.py
4) added new documentation for lm_eval
5) GPTQ improvements
 a) reimplemented faster quant
 b) tested compilation of hessian calculation and parts of faster quant,
 generally they were slower.
 c) moved helper functions out of the class. They're largely generic and
 this is less cluttered.
 d) some improvements to the duplication checking and copying to be
 faster when possible
 e) fixed some bugs due to this not being in CI and things changing for
 int4wo tensor subclass.

Test Plan:

1) `python test_gptq.py`

note: the skipped test test_gptq_quantizer_int4_weight_only also ran.

2) I verified that all activation match between old GPTQ and current
   GPTQ

3)

```shell

export CHECKPOINT_PATH=../../../checkpoints # path to checkpoints folder

export MODEL_REPO=meta-llama/Llama-2-7b-chat-hf
python eval.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth
python eval.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth
--quantization int4wo-64
python eval.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth
--quantization int4wo-gptq-64 --calibration_limit 10

export MODEL_REPO=meta-llama/Meta-Llama-3-8B
python eval.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth
python eval.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth
--quantization int4wo-64
python eval.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth
--quantization int4wo-gptq-64 --calibration_limit 10

```
see README.md for results but they show GPTQ is working

Reviewers:

Subscribers:

Tasks:

Tags:

* checking if this fixes the tests

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* trying to fix the adam stuff now

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* fix wanda error

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* fix adam attempt

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* fix CI

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* figured out issue i think

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:
---
 test/quantization/test_gptq.py                |  206 +++
 test/quantization/test_gptq_mt.py             |  348 -----
 test/quantization/test_qat.py                 |    9 +-
 test/quantization/test_quant_api.py           |  225 +--
 torchao/_models/_eval.py                      |  297 +---
 torchao/_models/llama/eval.py                 |   17 +-
 torchao/_models/llama/generate.py             |   12 +-
 torchao/_models/llama/model.py                |    5 +-
 torchao/quantization/GPTQ.py                  | 1314 -----------------
 .../quantization/{GPTQ_MT.py => GPTQ/GPTQ.py} |  905 +++++++-----
 torchao/quantization/GPTQ/README.md           |   74 +
 torchao/quantization/GPTQ/__init__.py         |   21 +
 torchao/quantization/README.md                |    4 +
 torchao/quantization/__init__.py              |   17 +-
 torchao/quantization/linear_quant_modules.py  |  629 ++++++++
 torchao/quantization/qat/linear.py            |    4 +-
 torchao/quantization/quant_api.py             |    8 +-
 17 files changed, 1609 insertions(+), 2486 deletions(-)
 create mode 100644 test/quantization/test_gptq.py
 delete mode 100644 test/quantization/test_gptq_mt.py
 delete mode 100644 torchao/quantization/GPTQ.py
 rename torchao/quantization/{GPTQ_MT.py => GPTQ/GPTQ.py} (51%)
 create mode 100644 torchao/quantization/GPTQ/README.md
 create mode 100644 torchao/quantization/GPTQ/__init__.py
 create mode 100644 torchao/quantization/linear_quant_modules.py

diff --git a/test/quantization/test_gptq.py b/test/quantization/test_gptq.py
new file mode 100644
index 0000000000..98760f8cf6
--- /dev/null
+++ b/test/quantization/test_gptq.py
@@ -0,0 +1,206 @@
+import unittest
+from pathlib import Path
+
+import torch
+from torch.testing._internal.common_utils import TestCase
+
+from torchao._models.llama.model import (
+    ModelArgs,
+    Transformer,
+    prepare_inputs_for_model,
+)
+from torchao._models.llama.tokenizer import get_tokenizer
+from torchao.quantization import Int4WeightOnlyConfig, quantize_
+from torchao.quantization.utils import compute_error
+from torchao.utils import (
+    TORCH_VERSION_AT_LEAST_2_4,
+)
+
+torch.manual_seed(0)
+
+
+class TestGPTQ(TestCase):
+    @unittest.skip("skipping until we get checkpoints for gpt-fast")
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    def test_gptq_quantizer_int4_weight_only(self):
+        from torchao._models._eval import (
+            LMEvalInputRecorder,
+            TransformerEvalWrapper,
+        )
+        from torchao.quantization.GPTQ import Int4WeightOnlyGPTQQuantizer
+
+        precision = torch.bfloat16
+        device = "cuda"
+        checkpoint_path = Path(
+            "../../checkpoints/meta-llama/Llama-2-7b-chat-hf/model.pth"
+        )
+        model = Transformer.from_name(checkpoint_path.parent.name)
+        checkpoint = torch.load(str(checkpoint_path), mmap=True, weights_only=True)
+        model.load_state_dict(checkpoint, assign=True)
+        model = model.to(dtype=precision, device="cpu")
+        model.eval()
+
+        tokenizer_path = checkpoint_path.parent / "tokenizer.model"
+        assert tokenizer_path.is_file(), tokenizer_path
+        tokenizer = get_tokenizer(  # pyre-ignore[28]
+            tokenizer_path,
+            "Llama-2-7b-chat-hf",
+        )
+        groupsize = 64
+        blocksize = 128
+        percdamp = 0.01
+        calibration_tasks = ["wikitext"]
+        calibration_limit = 1
+        calibration_seq_length = 100
+        input_prep_func = prepare_inputs_for_model
+        pad_calibration_inputs = False
+        inputs = (
+            LMEvalInputRecorder(
+                tokenizer,
+                calibration_seq_length,
+                input_prep_func,
+                model.config.vocab_size,
+                pad_calibration_inputs,
+                device="cpu",
+            )
+            .record_inputs(
+                calibration_tasks,
+                calibration_limit,
+            )
+            .get_recorded_inputs()
+        )
+
+        quantizer = Int4WeightOnlyGPTQQuantizer(
+            groupsize,
+            blocksize,
+            percdamp,
+        )
+        model.setup_caches(max_batch_size=1, max_seq_length=calibration_seq_length)
+
+        model = quantizer.quantize(model, *inputs).cuda()
+
+        model.reset_caches()
+        with torch.device("cuda"):
+            model.setup_caches(max_batch_size=1, max_seq_length=model.config.block_size)
+
+        limit = 1
+        result = TransformerEvalWrapper(
+            model.cuda(),
+            tokenizer,
+            model.config.block_size,
+            prepare_inputs_for_model,
+            device,
+        ).run_eval(
+            ["wikitext"],
+            limit,
+        )
+
+        assert result["results"]["wikitext"]["word_perplexity,none"] < 7.77, (
+            f"accuracy regressed from 7.76 to {result['results']['wikitext']['word_perplexity,none']}"
+        )
+
+
+class TestMultiTensorFlow(TestCase):
+    @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_4, "Test only enabled for 2.4+")
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    def test_multitensor_add_tensors(self):
+        from torchao.quantization.GPTQ import MultiTensor
+
+        tensor1 = torch.randn(3, 3)
+        tensor2 = torch.randn(3, 3)
+        mt = MultiTensor(tensor1)
+        mt.add_tensors(tensor2)
+        self.assertEqual(mt.count, 2)
+        self.assertTrue(torch.equal(mt.values[0], tensor1))
+        self.assertTrue(torch.equal(mt.values[1], tensor2))
+
+    @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_4, "Test only enabled for 2.4+")
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    def test_multitensor_pad_unpad(self):
+        from torchao.quantization.GPTQ import MultiTensor
+
+        tensor1 = torch.randn(3, 3)
+        mt = MultiTensor(tensor1)
+        mt.pad_to_length(3)
+        self.assertEqual(mt.count, 3)
+        mt.unpad()
+        self.assertEqual(mt.count, 1)
+
+    @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_4, "Test only enabled for 2.4+")
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    def test_multitensor_inplace_operation(self):
+        from torchao.quantization.GPTQ import MultiTensor
+
+        tensor1 = torch.ones(3, 3)
+        mt = MultiTensor(tensor1)
+        mt += 1  # In-place addition
+        self.assertTrue(torch.equal(mt.values[0], torch.full((3, 3), 2)))
+
+
+class TestMultiTensorInputRecorder(TestCase):
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    def test_multitensor_input_recorder(self):
+        from torchao.quantization.GPTQ import MultiTensor, MultiTensorInputRecorder
+
+        input_recorder = MultiTensorInputRecorder()
+        in1 = ([1], torch.randn(3, 3), (1, "dog", torch.randn(3, 3)), torch.float)
+        in2 = ([1], torch.randn(3, 3), (1, "dog", torch.randn(3, 3)), torch.float)
+
+        input_recorder(*in1)
+        input_recorder(*in2)
+
+        MT_input = input_recorder.get_recorded_inputs()
+
+        self.assertEqual(MT_input[0], [1])
+        self.assertTrue(isinstance(MT_input[1], MultiTensor))
+        self.assertTrue(isinstance(MT_input[2], tuple))
+        self.assertEqual(MT_input[2][0], 1)
+        self.assertEqual(MT_input[2][1], "dog")
+        self.assertTrue(isinstance(MT_input[2][2], MultiTensor))
+        self.assertEqual(MT_input[3], torch.float)
+
+    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+    def test_gptq_with_input_recorder(self):
+        from torchao.quantization.GPTQ import (
+            Int4WeightOnlyGPTQQuantizer,
+            MultiTensorInputRecorder,
+        )
+
+        torch.set_default_dtype(torch.bfloat16)
+
+        config = ModelArgs(n_layer=2)
+
+        with torch.device("cuda"):
+            model = Transformer(config)
+            model.setup_caches(max_batch_size=2, max_seq_length=100)
+            idx = torch.randint(1, 10000, (10, 2, 50)).to(torch.int32)
+            test_input = prepare_inputs_for_model(idx[0])
+        import copy
+
+        model2 = copy.deepcopy(model)
+        out = model(*test_input)
+        quantize_(model2, Int4WeightOnlyConfig())
+
+        outq = model2(*test_input)
+        del model2
+
+        input_recorder = MultiTensorInputRecorder()
+        for i in range(10):
+            input = prepare_inputs_for_model(idx[i])
+            input_recorder(*input)
+
+        args = input_recorder.get_recorded_inputs()
+
+        quantizer = Int4WeightOnlyGPTQQuantizer()
+
+        quantizer.quantize(model, *args)
+
+        outgptq = model(*test_input)
+
+        self.assertGreater(compute_error(outgptq, out), 30)
+        self.assertGreater(compute_error(outgptq, out), compute_error(outq, out))
+        torch.set_default_dtype(torch.float32)
+
+
+if __name__ == "__main__":
+    unittest.main()
diff --git a/test/quantization/test_gptq_mt.py b/test/quantization/test_gptq_mt.py
deleted file mode 100644
index d703efbd49..0000000000
--- a/test/quantization/test_gptq_mt.py
+++ /dev/null
@@ -1,348 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from pathlib import Path
-
-import pytest
-import torch
-import torch.nn.functional as F
-from torch.testing._internal.common_utils import run_tests
-
-from torchao._models.llama.model import Transformer, prepare_inputs_for_model
-from torchao._models.llama.tokenizer import get_tokenizer
-from torchao.quantization.GPTQ_MT import Int4WeightOnlyGPTQQuantizer, MultiTensor
-from torchao.quantization.utils import _lm_eval_available
-from torchao.utils import is_fbcode
-
-if is_fbcode():
-    pytest.skip("Skipping the test in fbcode due to missing model and tokenizer files")
-
-if _lm_eval_available:
-    hqq_core = pytest.importorskip("hqq.core", reason="requires hqq")
-    import lm_eval
-
-    try:  # lm_eval version 0.4
-        from lm_eval.evaluator import evaluate
-        from lm_eval.models.huggingface import HFLM as eval_wrapper
-        from lm_eval.tasks import get_task_dict
-    except:  # lm_eval version 0.3
-        from lm_eval import base, evaluator, tasks
-
-        eval_wrapper = base.BaseLM
-        get_task_dict = tasks.get_task_dict
-        evaluate = evaluator.evaluate
-
-    class InputRecorder(eval_wrapper):
-        def __init__(
-            self,
-            tokenizer,
-            calibration_seq_length,
-            input_prep_func=None,
-            pad_calibration_inputs=False,
-            vocab_size=32000,
-            pad_token=0,
-            device="cpu",
-        ):
-            try:
-                super().__init__()
-            except TypeError:
-                # lm_eval 0.4.2 removed the default init
-                super().__init__("gpt2", device="cpu")
-
-            self.tokenizer = tokenizer
-            self._device = torch.device(device)
-            self.vocab_size = vocab_size
-            self._max_seq_length = calibration_seq_length
-            self.calibration_seq_length = calibration_seq_length
-
-            self.input_prep_func = (
-                input_prep_func if input_prep_func is not None else lambda x: (x,)
-            )
-
-            self.pad_calibration_inputs = pad_calibration_inputs
-            self.pad_token = pad_token
-
-            self.inputs = []
-
-        @property
-        def eot_token_id(self):
-            try:
-                return self.tokenizer.eos_id()
-            except:
-                return self.tokenizer.eos_id
-
-        @property
-        def max_length(self):
-            return self._max_seq_length
-
-        @property
-        def max_gen_toks(self):
-            return 50
-
-        @property
-        def batch_size(self):
-            return 1
-
-        @property
-        def device(self):
-            return self._device
-
-        def tok_encode(self, string: str, **kwargs):
-            tokens = self.tokenizer.encode(string)
-            if hasattr(self.tokenizer, "bos_id"):
-                try:
-                    tokens = [self.tokenizer.bos_id()] + tokens
-                except:
-                    tokens = [self.tokenizer.bos_id] + tokens
-            return tokens
-
-        def tok_decode(self, tokens):
-            decoded = self.tokenizer.decode(tokens)
-            return decoded
-
-        def add_input(self, args):
-            self.inputs.append(args)
-
-        def record_inputs(
-            self,
-            calibration_tasks,
-            calibration_limit,
-        ):
-            try:
-                lm_eval.tasks.initialize_tasks()
-            except:
-                pass
-
-            task_dict = get_task_dict(calibration_tasks)
-            print("Obtaining GPTQ calibration inputs on: ", calibration_tasks)
-
-            evaluate(
-                self,
-                task_dict,
-                limit=calibration_limit,
-            )
-            return self
-
-        def get_inputs(self):
-            return self.inputs
-
-        def _model_call(self, inps):
-            inps = inps.squeeze(0)
-            T = len(inps)
-            if (
-                # can't use inputs that are too short when padding disabled
-                (T < self.calibration_seq_length and not self.pad_calibration_inputs)
-                or
-                # can't use inputs that actually use token we use for padding
-                (self.pad_calibration_inputs and self.pad_token in inps)
-            ):
-                # give random output
-                return torch.randn(
-                    (1, T, self.vocab_size), dtype=torch.bfloat16, device=self._device
-                )
-
-            # pad or truncate to the right size
-            if T >= self.calibration_seq_length:
-                inps = inps[: self.calibration_seq_length]
-            else:
-                inps = F.pad(inps, (self.pad_token, self.calibration_seq_length - T))
-
-            inps = inps.unsqueeze(0)
-            model_in = self.input_prep_func(inps)
-
-            self.add_input(model_in)
-
-            # output `something` with correct shape to keep eval going
-            return torch.randn(
-                (1, T, self.vocab_size), dtype=torch.bfloat16, device=self._device
-            )
-
-        def _model_generate(self, context, max_length, eos_token_id):
-            raise Exception("unimplemented")
-
-    import logging
-    import time
-
-    logging.basicConfig(level=logging.INFO)
-    logger = logging.getLogger(__name__)
-
-    class TransformerEvalWrapper(InputRecorder):
-        """
-        A wrapper class for GPTFast, providing integration with the lm-evaluation-harness library.
-        """
-
-        def __init__(
-            self, model, tokenizer, max_seq_length, input_prep_func=None, device="cuda"
-        ):
-            super().__init__(tokenizer, None)
-            self._model = model
-            # self.tokenizer = tokenizer
-            self._device = torch.device(device)
-            self._max_seq_length = max_seq_length
-
-            # need to take inps and convert to corrent input
-            # for model
-            self.input_prep_func = (
-                input_prep_func if input_prep_func is not None else lambda x: (x,)
-            )
-
-        def _model_call(self, inps):
-            # print("Entering _model_call")
-            # print(f"Input shape: {inps.shape}")
-
-            input = self.input_prep_func(inps)
-            # print(f"Processed input shapes: {[x.shape for x in input]}")
-
-            input = [x.to(self._device) for x in input]
-            # print(f"Inputs moved to device: {self._device}")
-
-            max_seq_length = min(max(inps.size()), self.max_length)
-            # print(f"Max sequence length: {max_seq_length}")
-
-            # print("Setting up caches")
-            with torch.device(self._device):
-                # print(f"Device: {self._device}")
-                # print(f"Batch size: {self.batch_size}")
-                # print(f"Max sequence length: {max_seq_length}")
-                self._model.setup_caches(self.batch_size, max_seq_length)
-            # print("Caches set up")
-
-            # print("Running model")
-            # torch.save(input, "input.pt")
-            logits = self._model(*input)
-            # print(f"Model run complete. Logits shape: {logits.shape}")
-            return logits
-
-        def _model_generate(self, context, max_length, eos_token_id):
-            raise Exception("unimplemented")
-
-        def run_eval(self, tasks, limit):
-            logger.info(f"Starting evaluation on tasks: {tasks}")
-            logger.info(f"Evaluation limit: {limit}")
-
-            try:
-                logger.info("Initializing lm_eval tasks")
-                lm_eval.tasks.initialize_tasks()
-            except Exception as e:
-                logger.warning(f"Failed to initialize tasks: {e}")
-                logger.info("Continuing without initialization")
-
-            try:
-                logger.info("Getting task dictionary")
-                task_dict = get_task_dict(tasks)
-                logger.info(f"Task dictionary: {task_dict}")
-            except Exception as e:
-                logger.error(f"Failed to get task dictionary: {e}")
-                raise
-
-            logger.info("Starting evaluation")
-            start_time = time.time()
-
-            try:
-                with torch.no_grad():
-                    result = evaluate(self, task_dict, limit=limit, verbosity="DEBUG")
-            except Exception as e:
-                logger.error(f"Evaluation failed: {e}")
-                raise
-
-            end_time = time.time()
-            logger.info(f"Evaluation completed in {end_time - start_time:.2f} seconds")
-
-            logger.info("Evaluation results:")
-            for task, res in result["results"].items():
-                print(f"{task}: {res}")
-
-            return result
-
-
-def test_gptq_mt():
-    precision = torch.bfloat16
-    device = "cuda"
-    print("Loading model")
-    checkpoint_path = Path("checkpoints/meta-llama/Llama-2-7b-chat-hf/model.pth")
-    model = Transformer.from_name(checkpoint_path.parent.name)
-    checkpoint = torch.load(str(checkpoint_path), mmap=True, weights_only=True)
-    model.load_state_dict(checkpoint, assign=True)
-    model = model.to(dtype=precision, device="cpu")
-    model.eval()
-    print("Model loaded")
-    tokenizer_path = checkpoint_path.parent / "tokenizer.model"
-    assert tokenizer_path.is_file(), tokenizer_path
-    tokenizer = get_tokenizer(  # pyre-ignore[28]
-        tokenizer_path,
-        "Llama-2-7b-chat-hf",
-    )
-    print("Tokenizer loaded")
-
-    blocksize = 128
-    percdamp = 0.01
-    groupsize = 64
-    calibration_tasks = ["wikitext"]
-    calibration_limit = None
-    calibration_seq_length = 100
-    input_prep_func = prepare_inputs_for_model
-    pad_calibration_inputs = False
-    print("Recording inputs")
-    inputs = (
-        InputRecorder(
-            tokenizer,
-            calibration_seq_length,
-            input_prep_func,
-            pad_calibration_inputs,
-            model.config.vocab_size,
-            device="cpu",
-        )
-        .record_inputs(
-            calibration_tasks,
-            calibration_limit,
-        )
-        .get_inputs()
-    )
-    print("Inputs recorded")
-    quantizer = Int4WeightOnlyGPTQQuantizer(
-        blocksize,
-        percdamp,
-        groupsize,
-    )
-
-    model.setup_caches(max_batch_size=1, max_seq_length=calibration_seq_length)
-    multi = [
-        MultiTensor([inp for inp, _ in inputs]),
-        MultiTensor([inds for _, inds in inputs]),
-    ]
-    print("Quantizing model")
-    model = quantizer.quantize(model, multi).cuda()
-    print("Model quantized")
-    print("Saving model and fixing state dict")
-    regular_state_dict = model.state_dict()  # defaultdict(torch.tensor)
-    for key, value in model.state_dict().items():
-        if isinstance(value, MultiTensor):
-            regular_state_dict[key] = value.values[0]
-        else:
-            regular_state_dict[key] = value
-
-    model = Transformer.from_name(checkpoint_path.parent.name)
-    remove = [k for k in regular_state_dict if "kv_cache" in k]
-    for k in remove:
-        del regular_state_dict[k]
-
-    model.load_state_dict(regular_state_dict, assign=True)
-    torch.save(model.state_dict(), "model.pth")
-    print("Running evaluation")
-    TransformerEvalWrapper(
-        model.to(device),  # quantized model needs to run on cuda
-        tokenizer,
-        model.config.block_size,
-        prepare_inputs_for_model,
-    ).run_eval(
-        ["wikitext"],
-        None,
-    )
-
-
-if __name__ == "__main__":
-    run_tests()
-
-# wikitext: {'word_perplexity,none': 12.523175352665858, 'word_perplexity_stderr,none': 'N/A', 'byte_perplexity,none': 1.6042723245990418, 'byte_perplexity_stderr,none': 'N/A', 'bits_per_byte,none': 0.681919059499152, 'bits_per_byte_stderr,none': 'N/A', 'alias': 'wikitext'}
diff --git a/test/quantization/test_qat.py b/test/quantization/test_qat.py
index 7444c3dbb5..3b32f870c4 100644
--- a/test/quantization/test_qat.py
+++ b/test/quantization/test_qat.py
@@ -17,13 +17,16 @@
 from torch.ao.quantization.fx._decomposed import quantized_decomposed_lib  # noqa: F401
 
 from torchao import quantize_
-from torchao.quantization.GPTQ import _replace_linear_8da4w, _replace_linear_int4
 from torchao.quantization.granularity import (
     PerAxis,
     PerGroup,
     PerRow,
     PerToken,
 )
+from torchao.quantization.linear_quant_modules import (
+    _replace_linear_8da4w,
+    _replace_linear_int4,
+)
 from torchao.quantization.qat.api import (
     ComposableQATQuantizer,
     FakeQuantizeConfig,
@@ -1478,7 +1481,7 @@ def test_qat_linear_bias(self):
         example_inputs = m.example_inputs()
         m(*example_inputs)
 
-    @parameterized.expand([torch.float32, torch.bfloat16, torch.float16])
+    @parameterized.expand([(torch.float32,), (torch.bfloat16,), (torch.float16,)])
     @unittest.skipIf(
         not TORCH_VERSION_AT_LEAST_2_4, "skipping when torch version is 2.4 or lower"
     )
@@ -1498,7 +1501,7 @@ def test_fake_quantize_per_token_vs_convert(self, dtype: torch.dtype):
         baseline_out = per_token_dynamic_quant(x)
         torch.testing.assert_close(fake_quantizer_out, baseline_out, atol=0, rtol=0)
 
-    @parameterized.expand([torch.float32, torch.bfloat16, torch.float16])
+    @parameterized.expand([(torch.float32,), (torch.bfloat16,), (torch.float16,)])
     @unittest.skipIf(
         not TORCH_VERSION_AT_LEAST_2_4, "skipping when torch version is 2.4 or lower"
     )
diff --git a/test/quantization/test_quant_api.py b/test/quantization/test_quant_api.py
index b4ec9f4785..0435a6c59b 100644
--- a/test/quantization/test_quant_api.py
+++ b/test/quantization/test_quant_api.py
@@ -310,7 +310,7 @@ def api(model):
         not TORCH_VERSION_AT_LEAST_2_3, "skipping when torch verion is 2.3 or lower"
     )
     def test_8da4w_quantizer(self):
-        from torchao.quantization.GPTQ import Int8DynActInt4WeightLinear
+        from torchao.quantization.linear_quant_modules import Int8DynActInt4WeightLinear
         from torchao.quantization.quant_api import Int8DynActInt4WeightQuantizer
 
         quantizer = Int8DynActInt4WeightQuantizer(groupsize=32)
@@ -325,7 +325,7 @@ def test_8da4w_quantizer(self):
         not TORCH_VERSION_AT_LEAST_2_3, "skipping when torch verion is 2.3 or lower"
     )
     def test_8da4w_quantizer_linear_bias(self):
-        from torchao.quantization.GPTQ import Int8DynActInt4WeightLinear
+        from torchao.quantization.linear_quant_modules import Int8DynActInt4WeightLinear
         from torchao.quantization.quant_api import Int8DynActInt4WeightQuantizer
 
         quantizer = Int8DynActInt4WeightQuantizer(groupsize=32)
@@ -336,190 +336,10 @@ def test_8da4w_quantizer_linear_bias(self):
         assert isinstance(m.linear2, Int8DynActInt4WeightLinear)
         m(*example_inputs)
 
-    # TODO: save model weights as artifacts and re-enable in CI
-    # For now, to run this test, you will need to download the weights from HF
-    # and run this script to convert them:
-    # https://github.com/pytorch-labs/gpt-fast/blob/6253c6bb054e658d67566150f87329b87815ae63/scripts/convert_hf_checkpoint.py
-    @unittest.skip("skipping until we get checkpoints for gpt-fast")
-    def test_8da4w_gptq_quantizer(self):
-        from torchao._models._eval import InputRecorder, TransformerEvalWrapper
-        from torchao.quantization.GPTQ import Int8DynActInt4WeightGPTQQuantizer
-
-        # should be similar to TorchCompileDynamicQuantizer
-        precision = torch.bfloat16
-        device = "cpu"
-        checkpoint_path = Path("../checkpoints/meta-llama/Llama-2-7b-chat-hf/model.pth")
-        model = Transformer.from_name(checkpoint_path.parent.name)
-        checkpoint = torch.load(str(checkpoint_path), mmap=True, weights_only=True)
-        model.load_state_dict(checkpoint, assign=True)
-        model = model.to(dtype=precision, device=device)
-        model.eval()
-        tokenizer_path = checkpoint_path.parent / "tokenizer.model"
-        assert tokenizer_path.is_file(), tokenizer_path
-        tokenizer = get_tokenizer(  # pyre-ignore[28]
-            tokenizer_path,
-            "Llama-2-7b-chat-hf",
-        )
-        blocksize = 128
-        percdamp = 0.01
-        groupsize = 128
-        calibration_tasks = ["wikitext"]
-        calibration_limit = 1
-        calibration_seq_length = 100
-        input_prep_func = prepare_inputs_for_model
-        pad_calibration_inputs = False
-
-        inputs = (
-            InputRecorder(
-                tokenizer,
-                calibration_seq_length,
-                input_prep_func,
-                pad_calibration_inputs,
-                model.config.vocab_size,
-            )
-            .record_inputs(
-                calibration_tasks,
-                calibration_limit,
-            )
-            .get_inputs()
-        )
-
-        quantizer = Int8DynActInt4WeightGPTQQuantizer(
-            blocksize,
-            percdamp,
-            groupsize,
-            precision=precision,
-        )
-        model.setup_caches(max_batch_size=1, max_seq_length=calibration_seq_length)
-        model = quantizer.quantize(model, inputs)
-        result = TransformerEvalWrapper(
-            model,
-            tokenizer,
-            model.config.block_size,
-            prepare_inputs_for_model,
-            device,
-        ).run_eval(
-            ["wikitext"],
-            1,
-        )
-
-        assert result["results"]["wikitext"]["word_perplexity,none"] < 7.88, (
-            f"accuracy regressed from 7.87 to {result['results']['wikitext']['word_perplexity,none']}"
-        )
-
-    @unittest.skip("skipping until we get checkpoints for gpt-fast")
-    @unittest.skipIf(
-        not TORCH_VERSION_AT_LEAST_2_4, "skipping when torch verion is 2.4 or lower"
-    )
-    def test_8da4w_quantizer_eval(self):
-        from torchao._models._eval import TransformerEvalWrapper
-        from torchao.quantization.quant_api import Int8DynActInt4WeightQuantizer
-
-        precision = torch.bfloat16
-        device = "cpu"
-        checkpoint_path = Path("../checkpoints/meta-llama/Llama-2-7b-chat-hf/model.pth")
-        model = Transformer.from_name(checkpoint_path.parent.name)
-        checkpoint = torch.load(str(checkpoint_path), mmap=True, weights_only=True)
-        model.load_state_dict(checkpoint, assign=True)
-        model = model.to(dtype=precision, device=device)
-        model.eval()
-        tokenizer_path = checkpoint_path.parent / "tokenizer.model"
-        assert tokenizer_path.is_file(), tokenizer_path
-        tokenizer = get_tokenizer(  # pyre-ignore[28]
-            tokenizer_path,
-            "Llama-2-7b-chat-hf",
-        )
-
-        quantizer = Int8DynActInt4WeightQuantizer(groupsize=128, precision=precision)
-        q_model = quantizer.quantize(model)
-        result = TransformerEvalWrapper(
-            q_model,
-            tokenizer,
-            q_model.config.block_size,
-            prepare_inputs_for_model,
-            device,
-        ).run_eval(
-            ["wikitext"],
-            1,
-        )
-        assert result["results"]["wikitext"]["word_perplexity,none"] < 8.24, (
-            f"accuracy regressed from 8.23 to {result['results']['wikitext']['word_perplexity,none']}"
-        )
-
-    @unittest.skip("skipping until we get checkpoints for gpt-fast")
-    def test_gptq_quantizer_int4_weight_only(self):
-        from torchao._models._eval import (
-            MultiTensorInputRecorder,
-            TransformerEvalWrapper,
-        )
-        from torchao.quantization.GPTQ_MT import Int4WeightOnlyGPTQQuantizer
-
-        precision = torch.bfloat16
-        device = "cuda"
-        checkpoint_path = Path("../checkpoints/meta-llama/Llama-2-7b-chat-hf/model.pth")
-        model = Transformer.from_name(checkpoint_path.parent.name)
-        checkpoint = torch.load(str(checkpoint_path), mmap=True, weights_only=True)
-        model.load_state_dict(checkpoint, assign=True)
-        model = model.to(dtype=precision, device="cpu")
-        model.eval()
-
-        tokenizer_path = checkpoint_path.parent / "tokenizer.model"
-        assert tokenizer_path.is_file(), tokenizer_path
-        tokenizer = get_tokenizer(  # pyre-ignore[28]
-            tokenizer_path,
-            "Llama-2-7b-chat-hf",
-        )
-
-        blocksize = 128
-        percdamp = 0.01
-        groupsize = 64
-        calibration_tasks = ["wikitext"]
-        calibration_limit = 5
-        calibration_seq_length = 100
-        input_prep_func = prepare_inputs_for_model
-        pad_calibration_inputs = False
-        inputs = (
-            MultiTensorInputRecorder(
-                tokenizer,
-                calibration_seq_length,
-                input_prep_func,
-                pad_calibration_inputs,
-                model.config.vocab_size,
-                device="cpu",
-            )
-            .record_inputs(
-                calibration_tasks,
-                calibration_limit,
-            )
-            .get_inputs()
-        )
-
-        quantizer = Int4WeightOnlyGPTQQuantizer(
-            blocksize,
-            percdamp,
-            groupsize,
-        )
-        model.setup_caches(max_batch_size=1, max_seq_length=calibration_seq_length)
-        model = quantizer.quantize(model, inputs).cuda()
-
-        result = TransformerEvalWrapper(
-            model.cuda(),
-            tokenizer,
-            model.config.block_size,
-            prepare_inputs_for_model,
-            device,
-        ).run_eval(
-            ["wikitext"],
-            None,
-        )
-        assert result["results"]["wikitext"]["word_perplexity,none"] < 7.77, (
-            f"accuracy regressed from 7.76 to {result['results']['wikitext']['word_perplexity,none']}"
-        )
-
     @unittest.skip("skipping until we get checkpoints for gpt-fast")
     def test_quantizer_int4_weight_only(self):
         from torchao._models._eval import TransformerEvalWrapper
-        from torchao.quantization.GPTQ import Int4WeightOnlyQuantizer
+        from torchao.quantization.linear_quant_modules import Int4WeightOnlyQuantizer
 
         precision = torch.bfloat16
         device = "cuda"
@@ -648,7 +468,7 @@ def test_quantized_tensor_subclass_8da4w(self, mapping_type):
         )
 
         # reference
-        from torchao.quantization.GPTQ import Int8DynActInt4WeightLinear
+        from torchao.quantization.linear_quant_modules import Int8DynActInt4WeightLinear
         from torchao.quantization.quant_api import Int8DynActInt4WeightQuantizer
 
         quantizer = Int8DynActInt4WeightQuantizer(
@@ -1037,43 +857,6 @@ def test_int4wo_cuda_serialization(self):
             model.load_state_dict(sd, assign=True)
 
 
-class TestMultiTensorFlow(TestCase):
-    @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_4, "Test only enabled for 2.4+")
-    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
-    def test_multitensor_add_tensors(self):
-        from torchao.quantization.GPTQ_MT import MultiTensor
-
-        tensor1 = torch.randn(3, 3)
-        tensor2 = torch.randn(3, 3)
-        mt = MultiTensor(tensor1)
-        mt.add_tensors(tensor2)
-        self.assertEqual(mt.count, 2)
-        self.assertTrue(torch.equal(mt.values[0], tensor1))
-        self.assertTrue(torch.equal(mt.values[1], tensor2))
-
-    @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_4, "Test only enabled for 2.4+")
-    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
-    def test_multitensor_pad_unpad(self):
-        from torchao.quantization.GPTQ_MT import MultiTensor
-
-        tensor1 = torch.randn(3, 3)
-        mt = MultiTensor(tensor1)
-        mt.pad_to_length(3)
-        self.assertEqual(mt.count, 3)
-        mt.unpad()
-        self.assertEqual(mt.count, 1)
-
-    @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_4, "Test only enabled for 2.4+")
-    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
-    def test_multitensor_inplace_operation(self):
-        from torchao.quantization.GPTQ_MT import MultiTensor
-
-        tensor1 = torch.ones(3, 3)
-        mt = MultiTensor(tensor1)
-        mt += 1  # In-place addition
-        self.assertTrue(torch.equal(mt.values[0], torch.full((3, 3), 2)))
-
-
 common_utils.instantiate_parametrized_tests(TestQuantFlow)
 
 
diff --git a/torchao/_models/_eval.py b/torchao/_models/_eval.py
index 9f429278e3..0266417de5 100644
--- a/torchao/_models/_eval.py
+++ b/torchao/_models/_eval.py
@@ -12,8 +12,7 @@
 import torch
 import torch.nn.functional as F
 
-from torchao.quantization.GPTQ_MT import MultiTensor
-from torchao.quantization.utils import _MultiInput
+from torchao.quantization.GPTQ import MultiTensorInputRecorder
 
 try:  # lm_eval version 0.4
     from lm_eval.evaluator import evaluate  # pyre-ignore[21]
@@ -27,16 +26,13 @@
     evaluate = evaluator.evaluate
 
 
-class MultiTensorInputRecorder(eval_wrapper):
+class TransformerEvalWrapper(eval_wrapper):
+    """
+    A wrapper class for GPTFast, providing integration with the lm-evaluation-harness library.
+    """
+
     def __init__(
-        self,
-        tokenizer,
-        calibration_seq_length,
-        input_prep_func=None,
-        pad_calibration_inputs=False,
-        vocab_size=32000,
-        pad_token=0,
-        device="cpu",
+        self, model, tokenizer, max_seq_length, input_prep_func=None, device="cuda"
     ):
         try:
             super().__init__()
@@ -44,21 +40,44 @@ def __init__(
             # lm_eval 0.4.2 removed the default init
             super().__init__("gpt2", device="cpu")
 
+        self._model = model
         self.tokenizer = tokenizer
         self._device = torch.device(device)
-        self.vocab_size = vocab_size
-        self._max_seq_length = calibration_seq_length
-        self.calibration_seq_length = calibration_seq_length
+        self._max_seq_length = max_seq_length
 
+        # need to take inps and convert to corrent input
+        # for model
         self.input_prep_func = (
             input_prep_func if input_prep_func is not None else lambda x: (x,)
         )
 
-        self.pad_calibration_inputs = pad_calibration_inputs
-        self.pad_token = pad_token
+    def _model_call(self, inps):
+        # TODO: make batches work
+        input = self.input_prep_func(inps)
 
-        # Initialize inputs as a list of two empty lists for input tensors and indices
-        self.inputs = [[], []]
+        max_seq_length = min(max(inps.size()), self.max_length)
+        with torch.device(self._device):
+            self._model.setup_caches(self.batch_size, max_seq_length)
+        logits = self._model(*input)
+        return logits
+
+    def run_eval(self, tasks, limit):
+        try:
+            lm_eval.tasks.initialize_tasks()
+        except:
+            pass
+
+        task_dict = get_task_dict(tasks)
+        print("Evaluating Model On: ", task_dict)
+        with torch.no_grad():
+            result = evaluate(
+                self,
+                task_dict,
+                limit=limit,
+            )
+        for task, res in result["results"].items():
+            print(f"{task}: {res}")
+        return result
 
     @property
     def eot_token_id(self):
@@ -83,6 +102,10 @@ def batch_size(self):
     def device(self):
         return self._device
 
+    def tok_decode(self, tokens):
+        decoded = self.tokenizer.decode(tokens)
+        return decoded
+
     def tok_encode(self, string: str, **kwargs):
         tokens = self.tokenizer.encode(string)
         if hasattr(self.tokenizer, "bos_id"):
@@ -92,171 +115,39 @@ def tok_encode(self, string: str, **kwargs):
                 tokens = [self.tokenizer.bos_id] + tokens
         return tokens
 
-    def tok_decode(self, tokens):
-        decoded = self.tokenizer.decode(tokens)
-        return decoded
-
-    def add_input(self, args):
-        # Ensure that inputs are added correctly as pairs
-        self.inputs[0].append(args[0])
-        self.inputs[1].append(args[1])
-
-    def record_inputs(self, calibration_tasks, calibration_limit):
-        try:
-            lm_eval.tasks.initialize_tasks()
-        except:
-            pass
-
-        task_dict = get_task_dict(calibration_tasks)
-        print("Obtaining GPTQ calibration inputs on: ", calibration_tasks)
-
-        evaluate(
-            self,
-            task_dict,
-            limit=calibration_limit,
-        )
-        return self
-
-    def get_inputs(self):
-        # Return MultiTensor instances for both inputs and indices
-        return [MultiTensor(self.inputs[0]), MultiTensor(self.inputs[1])]
-
-    def _model_call(self, inps):
-        inps = inps.squeeze(0)
-        T = len(inps)
-        if (
-            # Can't use inputs that are too short when padding is disabled
-            (T < self.calibration_seq_length and not self.pad_calibration_inputs)
-            or
-            # Can't use inputs that actually use the token we use for padding
-            (self.pad_calibration_inputs and self.pad_token in inps)
-        ):
-            # Give random output
-            return torch.randn(
-                (1, T, self.vocab_size), dtype=torch.bfloat16, device=self._device
-            )
-
-        # Pad or truncate to the correct size
-        if T >= self.calibration_seq_length:
-            inps = inps[: self.calibration_seq_length]
-        else:
-            inps = F.pad(
-                inps, (0, self.calibration_seq_length - T), value=self.pad_token
-            )
-
-        inps = inps.unsqueeze(0)
-        model_in = self.input_prep_func(inps)
-
-        self.add_input(model_in)
-
-        # Output `something` with the correct shape to keep eval going
-        return torch.randn(
-            (1, T, self.vocab_size), dtype=torch.bfloat16, device=self._device
-        )
-
     def _model_generate(self, context, max_length, eos_token_id):
         raise Exception("unimplemented")
 
 
-class InputRecorder(eval_wrapper):
-    """
-    This is a fake evaluation wrapper from the lm_eval library that just records the inputs
-    so that they can be used in calibration.
-
-    If pad_calibration_inputs is enabled, the input recorder will take
-    each input and pad/truncate it down to the calibration_seq_length.
-    (if using padding you should set the embeddings for the pad_token to 0
-    in the model)
-
-    Note: after padding/truncation, input_prep_function is called to bring
-    it to the proper form to be inserted into a given model.
-
-    If not, it will only truncate inputs to the desired length.
-    """
-
+class LMEvalInputRecorder(TransformerEvalWrapper):
     def __init__(
         self,
         tokenizer,
         calibration_seq_length,
         input_prep_func=None,
-        pad_calibration_inputs=False,
         vocab_size=32000,
+        pad_calibration_inputs=False,
         pad_token=0,
         device="cpu",
+        base_input_recorder_class=MultiTensorInputRecorder,
     ):
-        try:
-            super().__init__()
-        except TypeError:
-            # lm_eval 0.4.2 removed the default init
-            super().__init__("gpt2", device="cpu")
-
-        self.tokenizer = tokenizer
-        self._device = torch.device(device)
+        super().__init__(
+            model=None,
+            tokenizer=tokenizer,
+            max_seq_length=calibration_seq_length,
+            input_prep_func=input_prep_func,
+            device=device,
+        )
         self.vocab_size = vocab_size
-        self._max_seq_length = calibration_seq_length
         self.calibration_seq_length = calibration_seq_length
 
-        # need to take inps and convert to corrent input
-        # for model
-        self.input_prep_func = (
-            input_prep_func if input_prep_func is not None else lambda x: (x,)
-        )
-
         self.pad_calibration_inputs = pad_calibration_inputs
         self.pad_token = pad_token
 
-        self.inputs = None
-
-    @property
-    def eot_token_id(self):
-        try:
-            return self.tokenizer.eos_id()
-        except:
-            return self.tokenizer.eos_id
-
-    @property
-    def max_length(self):
-        return self._max_seq_length
-
-    @property
-    def max_gen_toks(self):
-        return 50
-
-    @property
-    def batch_size(self):
-        return 1
-
-    @property
-    def device(self):
-        return self._device
-
-    def tok_encode(self, string: str, **kwargs):
-        # TODO: verify this for multi-batch as well
-        tokens = self.tokenizer.encode(string)
-        if hasattr(self.tokenizer, "bos_id"):
-            try:
-                tokens = [self.tokenizer.bos_id()] + tokens
-            except:
-                tokens = [self.tokenizer.bos_id] + tokens
-        return tokens
-
-    def tok_decode(self, tokens):
-        decoded = self.tokenizer.decode(tokens)
-        return decoded
-
-    def add_input(self, args):
-        if self.inputs is None:
-            self.inputs = [_MultiInput([arg]) for arg in args]
-        else:
-            self.inputs = [
-                multi.add_input(arg) for (multi, arg) in zip(self.inputs, args)
-            ]
+        # Initialize inputs as a list of two empty lists for input tensors and indices
+        self.base_input_recorder = base_input_recorder_class()
 
-    def record_inputs(
-        self,
-        calibration_tasks,
-        calibration_limit,
-    ):
+    def record_inputs(self, calibration_tasks, calibration_limit):
         try:
             lm_eval.tasks.initialize_tasks()
         except:
@@ -272,91 +163,47 @@ def record_inputs(
         )
         return self
 
-    def get_inputs(self):
-        return self.inputs
+    def get_inputs(self):  # for BC
+        return self.get_recorded_inputs()
+
+    def get_recorded_inputs(self):
+        return self.base_input_recorder.get_recorded_inputs()
+
+    def get_recorded_args_and_kwargs(self):
+        return self.base_input_recorder.get_recorded_args_and_kwargs()
 
     def _model_call(self, inps):
         inps = inps.squeeze(0)
         T = len(inps)
         if (
-            # can't use inputs that are too short when padding disabled
+            # Can't use inputs that are too short when padding is disabled
             (T < self.calibration_seq_length and not self.pad_calibration_inputs)
             or
-            # can't use inputs that actually use token we use for padding
+            # Can't use inputs that actually use the token we use for padding
             (self.pad_calibration_inputs and self.pad_token in inps)
         ):
-            # give random output
+            # Give random output
             return torch.randn(
                 (1, T, self.vocab_size), dtype=torch.bfloat16, device=self._device
             )
 
-        # pad or truncate to the right size
+        # Pad or truncate to the correct size
         if T >= self.calibration_seq_length:
             inps = inps[: self.calibration_seq_length]
         else:
-            inps = F.pad(inps, (self.pad_token, self.calibration_seq_length - T))
+            inps = F.pad(
+                inps, (0, self.calibration_seq_length - T), value=self.pad_token
+            )
 
         inps = inps.unsqueeze(0)
         model_in = self.input_prep_func(inps)
 
-        self.add_input(model_in)
+        self.base_input_recorder(*model_in)
 
-        # output `something` with correct shape to keep eval going
+        # Output `something` with the correct shape to keep eval going
         return torch.randn(
             (1, T, self.vocab_size), dtype=torch.bfloat16, device=self._device
         )
 
-    def _model_generate(self, context, max_length, eos_token_id):
-        raise Exception("unimplemented")
-
 
-class TransformerEvalWrapper(InputRecorder):
-    """
-    A wrapper class for GPTFast, providing integration with the lm-evaluation-harness library.
-    """
-
-    def __init__(
-        self, model, tokenizer, max_seq_length, input_prep_func=None, device="cuda"
-    ):
-        super().__init__(tokenizer, None)
-        self._model = model
-        # self.tokenizer = tokenizer
-        self._device = torch.device(device)
-        self._max_seq_length = max_seq_length
-
-        # need to take inps and convert to corrent input
-        # for model
-        self.input_prep_func = (
-            input_prep_func if input_prep_func is not None else lambda x: (x,)
-        )
-
-    def _model_call(self, inps):
-        # TODO: make batches work
-        input = self.input_prep_func(inps)
-
-        max_seq_length = min(max(inps.size()), self.max_length)
-        with torch.device(self._device):
-            self._model.setup_caches(self.batch_size, max_seq_length)
-        logits = self._model(*input)
-        return logits
-
-    def _model_generate(self, context, max_length, eos_token_id):
-        raise Exception("unimplemented")
-
-    def run_eval(self, tasks, limit):
-        try:
-            lm_eval.tasks.initialize_tasks()
-        except:
-            pass
-
-        task_dict = get_task_dict(tasks)
-        print("Evaluating Model On: ", task_dict)
-        with torch.no_grad():
-            result = evaluate(
-                self,
-                task_dict,
-                limit=limit,
-            )
-        for task, res in result["results"].items():
-            print(f"{task}: {res}")
-        return result
+InputRecorder = LMEvalInputRecorder  # for BC
diff --git a/torchao/_models/llama/eval.py b/torchao/_models/llama/eval.py
index e6569c42c5..8ee15f1fd3 100644
--- a/torchao/_models/llama/eval.py
+++ b/torchao/_models/llama/eval.py
@@ -44,7 +44,7 @@ def run_evaluation(
     calibration_tasks: Optional[List[str]] = None,
     calibration_limit: Optional[int] = None,
     calibration_seq_length: Optional[int] = None,
-    pad_calibration_inputs: Optional[bool] = False,
+    pad_calibration_inputs: bool = False,
 ):
     """Runs the evaluation of a model using LM Eval."""
     print(
@@ -120,8 +120,8 @@ def run_evaluation(
             quantize_(model, int4_weight_only(layout=MarlinSparseLayout()))
         if "int4wo" in quantization and "gptq" in quantization:
             # avoid circular imports
-            from torchao._models._eval import MultiTensorInputRecorder
-            from torchao.quantization.GPTQ_MT import Int4WeightOnlyGPTQQuantizer
+            from torchao._models._eval import LMEvalInputRecorder
+            from torchao.quantization.GPTQ import Int4WeightOnlyGPTQQuantizer
 
             groupsize = int(quantization.split("-")[-2])
             assert groupsize in [32, 64, 128, 256], (
@@ -132,24 +132,25 @@ def run_evaluation(
             )
             assert "cuda" in device, "int4 gptq quantization only works on cuda"
             inputs = (
-                MultiTensorInputRecorder(
+                LMEvalInputRecorder(
                     tokenizer,
                     calibration_seq_length,
                     prepare_inputs_for_model,
-                    pad_calibration_inputs,
                     model.config.vocab_size,
+                    pad_calibration_inputs,
                     device="cpu",
                 )
                 .record_inputs(
                     calibration_tasks,
                     calibration_limit,
                 )
-                .get_inputs()
+                .get_recorded_inputs()
             )
-
+            print("Obtained inputs, starting calibration")
             quantizer = Int4WeightOnlyGPTQQuantizer(group_size=groupsize, device=device)
             model.setup_caches(max_batch_size=1, max_seq_length=calibration_seq_length)
-            model = quantizer.quantize(model, inputs).to(device)
+            quantizer.quantize(model, *inputs)
+            model = model.to(device)
         else:
             if not TORCH_VERSION_AT_LEAST_2_5:
                 unwrap_tensor_subclass(model)
diff --git a/torchao/_models/llama/generate.py b/torchao/_models/llama/generate.py
index 40f70fe93e..aa928c83f5 100644
--- a/torchao/_models/llama/generate.py
+++ b/torchao/_models/llama/generate.py
@@ -629,13 +629,13 @@ def ffn_or_attn_only(mod, fqn):
                     float8_dynamic_activation_float8_weight(granularity=granularity),
                 )
         elif "autoquant_v2" in quantization:
-            from torchao._models._eval import InputRecorder
+            from torchao._models._eval import LMEvalInputRecorder
             from torchao._models.llama.model import prepare_inputs_for_model
             from torchao.prototype.quantization.autoquant_v2 import autoquant_v2
 
             calibration_seq_length = 256
             inputs = (
-                InputRecorder(
+                LMEvalInputRecorder(
                     tokenizer,
                     calibration_seq_length,
                     prepare_inputs_for_model,
@@ -647,7 +647,7 @@ def ffn_or_attn_only(mod, fqn):
                     ["wikitext"],
                     1,
                 )
-                .get_inputs()[0]
+                .get_recorded_inputs()[0]
                 .values[0]
             )
             inputs = prepare_inputs_for_model(inputs)
@@ -719,12 +719,12 @@ def ffn_or_attn_only(mod, fqn):
             # do autoquantization
             model.finalize_autoquant()
         elif "autoquant" in quantization:
-            from torchao._models._eval import InputRecorder
+            from torchao._models._eval import LMEvalInputRecorder
             from torchao._models.llama.model import prepare_inputs_for_model
 
             calibration_seq_length = 256
             inputs = (
-                InputRecorder(
+                LMEvalInputRecorder(
                     tokenizer,
                     calibration_seq_length,
                     prepare_inputs_for_model,
@@ -736,7 +736,7 @@ def ffn_or_attn_only(mod, fqn):
                     ["wikitext"],
                     1,
                 )
-                .get_inputs()[0]
+                .get_recorded_inputs()[0]
                 .values[0]
             )
             inputs = prepare_inputs_for_model(inputs)
diff --git a/torchao/_models/llama/model.py b/torchao/_models/llama/model.py
index 8771f70323..45dd2e9f29 100644
--- a/torchao/_models/llama/model.py
+++ b/torchao/_models/llama/model.py
@@ -21,8 +21,9 @@ def prepare_inputs_for_model(inps, max_new_tokens=1):
     if inps.dim() > 2:
         raise ValueError(f"Expected input to be of dim 1 or 2, but got {inps.dim()}")
 
-    input_pos = torch.arange(0, inps.numel(), device=inps.device)
-    return (inps.view(1, -1), input_pos)
+    # this now works with batched inputs
+    input_pos = torch.arange(0, inps.shape[-1], device=inps.device).to(torch.int32)
+    return (inps.view(-1, inps.shape[-1]), input_pos)
 
 
 @dataclass
diff --git a/torchao/quantization/GPTQ.py b/torchao/quantization/GPTQ.py
deleted file mode 100644
index a0ec97d63f..0000000000
--- a/torchao/quantization/GPTQ.py
+++ /dev/null
@@ -1,1314 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD-style license found in the
-# LICENSE file in the root directory of this source tree.
-
-
-# This source code is licensed under the license found in the
-# LICENSE file in the root directory of this source tree.
-
-import logging
-from typing import Any, Callable, Dict, List, Optional, Type
-
-import torch
-import torch.fx as fx
-import torch.nn as nn
-import torch.nn.functional as F
-from torch.utils._pytree import tree_flatten, tree_unflatten
-
-from torchao.dtypes.utils import is_device
-from torchao.utils import (
-    TORCH_VERSION_AT_LEAST_2_3,
-    TORCH_VERSION_AT_LEAST_2_6,
-    find_multiple,
-)
-
-from .quant_primitives import (
-    MappingType,
-    dequantize_affine,
-)
-from .unified import Quantizer
-from .utils import (
-    _MultiInput,
-    get_group_qparams_symmetric,
-    get_groupwise_affine_qparams,
-    group_quantize_tensor_symmetric,
-    groupwise_affine_dequantize_tensor_from_qparams,
-    groupwise_affine_quantize_tensor,
-    groupwise_affine_quantize_tensor_from_qparams,
-    pack_tinygemm_scales_and_zeros,
-    per_token_dynamic_quant,
-)
-
-aten = torch.ops.aten
-
-add_ons = []
-
-if TORCH_VERSION_AT_LEAST_2_3:
-    add_ons += ["Int8DynActInt4WeightQuantizer", "Int8DynActInt4WeightGPTQQuantizer"]
-
-
-__all__ = [
-    "Int4WeightOnlyGPTQQuantizer",
-    "Int4WeightOnlyQuantizer",
-] + add_ons
-
-
-class GenericGPTQRunner(fx.Interpreter):
-    """
-    This is a generic GPTQ runner that takes an existing model and applies GPTQ.
-    It uses torch._dynamo.export to obtain a graph of the model and then hooks
-    into function calls and when it detects a linear, it applies GPTQ to the weight
-    given the calibration of inputs passed in at initialization. It puts the results
-    into the state_dict so that the quantized model weights/qparams can be loaded
-    directly into the model.
-
-    intended to be used in concert with a GPTQQuantizer class to define the quantization mode.
-    """
-
-    def __init__(
-        self,
-        model,
-        inputs: _MultiInput,
-        blocksize=128,
-        percdamp=0.01,
-        groupsize=128,
-    ):
-        self.id_to_name = {
-            id(value): name for name, value in dict(model.named_parameters()).items()
-        }
-
-        # trace model for one input
-        one_input = [multi.values[0].cpu() for multi in inputs]  # pyre-ignore[16]
-        # needed for GPTQ on the torchao llama model
-        import torchao
-
-        torchao._models.llama.model.use_index_put_for_kv_cache = True
-        exported_model = torch._dynamo.export(
-            model.cpu(), aten_graph=True, pre_dispatch=True, tracing_mode="fake"
-        )(*one_input)
-        super().__init__(exported_model.graph_module)
-
-        self.new_state_dict = model.state_dict()
-
-        self.blocksize = blocksize
-
-        self.percdamp = percdamp
-
-        self.groupsize = groupsize
-        self.inputs = inputs
-        self.gptq_done = False
-        self.debug = False
-
-    def configure_quantization_mode(
-        self,
-        get_qparams_func,
-        quantize_func,
-        dequantize_func,
-        combine_qparams_list_func,
-        make_names_and_values_dict_func,
-        skip_layer_func,
-        act_fake_quant_func=None,
-    ):
-        # these functions need to already be curried with all inputs other than weight, qparams
-
-        self.get_qparams_func = (
-            get_qparams_func  # accepts [2d weight tensor], outputs qparams.
-        )
-
-        self.quantize_func = quantize_func  # accepts [2d weight tensor], [qparams], outputs a 2d quantized tensor of desired dtype
-
-        self.dequantize_func = dequantize_func
-        # accepts [quantized] tensor and [qparams], outputs a 2d dequantized tensor of type float,
-        # assumes this output .to(w_orig_dtype) is ~eventual desired dequant behavior
-
-        #  `combine_qparams_list_func`.
-        self.combine_qparams_list_func = combine_qparams_list_func
-        # accepts [`list` of qparams] from quantizing one group at a time,
-        # outputs a qparams object that could be passed into quant/dequantize_func
-
-        self.skip_layer_func = skip_layer_func  # accepts [weight tensor], outputs a bool on whether or not to apply gptq to this layer
-
-        #  `make_names_and_values_dict_func`.
-        self.make_names_and_values_dict_func = make_names_and_values_dict_func  # accepts [2d quantized tensor], [qparams], returns a dict of names, values to put in state_dict
-        # note any final packing for storage should happen here
-
-        # `act_fake_quant_func`
-        if act_fake_quant_func is None:
-            self.act_fake_quant_func = lambda x: x
-        else:
-            self.act_fake_quant_func = act_fake_quant_func  # accepts [activation tensor], returns a fake-quantized activation tensor
-        return self
-
-    def run(self):
-        assert self.get_qparams_func is not None, (
-            "need to configure quantization mode before running"
-        )
-        self.gptq_done = True
-        super().run(*self.inputs)
-
-    def get_quantized_state_dict(self):
-        assert self.gptq_done, (
-            "need to run GPTQRunner before you can get_quantized_state_dict"
-        )
-        quantized_state_dict = self.new_state_dict
-        # Don't want to store/load the kv_cache so remove it from the state_dict
-        del_list = []
-        for param_fqn in quantized_state_dict:
-            if "kv_cache" in param_fqn:
-                del_list.append(param_fqn)
-        for param_fqn in del_list:
-            quantized_state_dict.pop(param_fqn)
-        return quantized_state_dict
-
-    def call_function(self, target, args, kwargs, already_quantized=False):  # noqa: C901
-        def tensors_to_cuda(args):
-            new_args = []
-            for x in args:
-                new_args.append(x.cuda() if isinstance(x, torch.Tensor) else x)
-            return new_args
-
-        # flatten args and kwargs together
-        flat_args, spec = tree_flatten((args, kwargs))
-        # move all single tensors to cuda, will move _MultiInputs to cuda one at a time
-        flat_args = tensors_to_cuda(flat_args)
-
-        has_multi_input = _MultiInput in [type(x) for x in flat_args]
-        if has_multi_input:
-            # Just some trickery to convert
-            # [_MultiInput[a, a, a], _MultiInput(b, b, b)] => [a, b], [a, b], [a, b]
-            multi_input_count = max(
-                [len(x.values) if isinstance(x, _MultiInput) else 1 for x in flat_args]
-            )
-            transposed_args = list(
-                zip(
-                    *[
-                        (
-                            x.values
-                            if isinstance(x, _MultiInput)
-                            else [x] * multi_input_count
-                        )
-                        for x in flat_args
-                    ]
-                )
-            )
-        else:
-            transposed_args = [flat_args]
-        outputs = []
-
-        # check whether we apply GPTQ to this module
-        quantize_linear = (
-            (target == aten.linear.default)  # if its a linear
-            and id(args[1]) in self.id_to_name  # and if we know the layer name
-            # and we haven't already quantized this layer
-            and not already_quantized
-            # and if the skip_layer_func doesn't say we should skip
-            and not (self.skip_layer_func is not None and self.skip_layer_func(args[1]))
-        )  # then we will quantize this linear layer/weight
-
-        if quantize_linear:  # instantiate variables for GPTQ
-            H = 0
-            total_batches = 0
-
-        for inp in transposed_args:
-            inp = tensors_to_cuda(inp)
-            cur_args, cur_kwargs = tree_unflatten(inp, spec)
-
-            if quantize_linear:  # calculate H instead of output (will run the linear eventually with updated weight)
-                x = cur_args[0].float()
-                x = self.act_fake_quant_func(x)
-                shape = x.shape
-                n = 1 if len(shape) == 2 else shape[0]
-                H *= total_batches / (total_batches + n)
-                total_batches += n
-                x = ((2 / total_batches) ** (1 / 2)) * x.reshape(
-                    -1, shape[-1]
-                ).t().float()
-                H += x.matmul(x.t())
-            else:
-                # weight has already been quantized but still need to apply
-                # activation quant for final calculation
-                if already_quantized:
-                    cur_args = (self.act_fake_quant_func(cur_args[0]), *cur_args[1:])
-
-                # get output if its not a linear
-                out = super().call_function(target, cur_args, cur_kwargs)
-                if isinstance(out, torch.Tensor):
-                    outputs.append(out.cpu())
-                else:
-                    outputs.append(out)
-
-        if quantize_linear:
-            mod_fqn = ".".join(self.id_to_name[id(args[1])].split(".")[:-1])
-
-            W = args[1].to(H.device)
-
-            Q, DQ, qparams = self.faster_quant(H, W.detach())
-            print(mod_fqn)
-
-            #  `make_names_and_values_dict_func`.
-            names_and_values_dict = self.make_names_and_values_dict_func(Q, qparams)
-
-            # delete old weight
-            if mod_fqn + ".weight" in self.new_state_dict:
-                self.new_state_dict.pop(mod_fqn + ".weight")
-            if len(args) > 2:
-                self.new_state_dict[mod_fqn + ".bias"] = args[2]
-            for name, value in names_and_values_dict.items():
-                self.new_state_dict[mod_fqn + "." + name] = value
-
-            # run linear with new weight to get corrected output
-            new_out = self.call_function(
-                target, (args[0], DQ, *args[2:]), kwargs, already_quantized=True
-            )
-
-            if self.debug:
-                old_out = self.call_function(
-                    target,
-                    (args[0][:2], args[1], *args[2:]),
-                    kwargs,
-                    already_quantized=True,
-                )
-
-                def SQNR(x, y):
-                    # TODO: Use of deprecated function torch.norm
-                    return 20 * torch.log10(
-                        torch.linalg.norm(x) / torch.linalg.norm(x - y)
-                    )
-
-                #  `dequantize_func`.
-                DQ_after = self.dequantize_func(Q, qparams).to(W.dtype)
-                print(
-                    "SQNR for QDQ (this should be inf)", SQNR(DQ, DQ_after)
-                )  # matches
-                print(
-                    "SQNR for weight (can be low)", SQNR(W, DQ.cuda())
-                )  # fine to not match
-                print(
-                    "SQNR for output with GPTQ (hopefully 35+)",
-                    torch.cat(
-                        [
-                            SQNR(old.cpu(), new.cpu()).unsqueeze(0)
-                            for (old, new) in zip(old_out.values, new_out.values[:2])
-                        ]
-                    ).mean(),
-                )
-
-                #  `get_qparams_func`.
-                qparams2 = self.get_qparams_func(W)
-
-                Q2 = self.quantize_func(W, qparams2)
-                DQ2 = self.dequantize_func(Q2, qparams2).to(W.dtype)
-                old_q_out = self.call_function(
-                    target,
-                    (args[0][:2], DQ2, *args[2:]),
-                    kwargs,
-                    already_quantized=True,
-                )
-
-                print(
-                    "SQNR for output without GPTQ (should be less than above)",
-                    torch.cat(
-                        [
-                            SQNR(old.cpu(), old_q.cpu()).unsqueeze(0)
-                            for (old, old_q) in zip(old_out.values, old_q_out.values)
-                        ]
-                    ).mean(),
-                )
-            return new_out
-
-        return _MultiInput(outputs) if has_multi_input else outputs[0]
-
-    def faster_quant(self, H, W):
-        percdamp = self.percdamp
-        blocksize = self.blocksize
-        groupsize = self.groupsize
-        orig_dtype = W.dtype
-        W = W.detach().float()
-        _, columns = W.shape[0], W.shape[1]
-        device = W.device
-
-        if groupsize == -1:
-            cur_qparams = self.get_qparams_func(W)
-        dead = torch.diag(H) == 0
-        H[dead, dead] = 1
-        W[:, dead] = 0
-
-        Losses = torch.zeros_like(W)
-        DQ = torch.zeros_like(W)
-
-        damp = percdamp * torch.mean(torch.diag(H))
-        diag = torch.arange(columns, device=device)
-        H[diag, diag] += damp
-        H = torch.linalg.cholesky(H)
-        H = torch.cholesky_inverse(H)
-        H = torch.linalg.cholesky(H, upper=True)
-        Hinv = H
-
-        all_qparams = []
-        for i1 in range(0, columns, blocksize):
-            i2 = min(i1 + blocksize, columns)
-            count = i2 - i1
-            W1 = W[:, i1:i2].clone()
-            DQ1 = torch.zeros_like(W1)
-            Err1 = torch.zeros_like(W1)
-            Losses1 = torch.zeros_like(W1)
-            Hinv1 = Hinv[i1:i2, i1:i2]
-            for i in range(count):
-                w = W1[:, i]
-                d = Hinv1[i, i]
-
-                if groupsize != -1 and (i1 + i) % groupsize == 0:  # start of new group
-                    cur_qparams = self.get_qparams_func(
-                        W[:, (i1 + i) : (i1 + i + groupsize)]
-                    )
-                    all_qparams.append(cur_qparams)
-
-                q = self.quantize_func(w.unsqueeze(1), cur_qparams).flatten()
-
-                #  `dequantize_func`.
-
-                dq = self.dequantize_func(q.unsqueeze(1), cur_qparams).flatten()
-
-                DQ1[:, i] = dq
-                Losses1[:, i] = (w - dq) ** 2 / d**2
-
-                err1 = (w - dq) / d
-                W1[:, i:] -= (
-                    err1.to(Hinv1.dtype).unsqueeze(1).matmul(Hinv1[i, i:].unsqueeze(0))
-                )
-                Err1[:, i] = err1
-
-            DQ[:, i1:i2] = DQ1
-            Losses[:, i1:i2] = Losses1 / 2
-
-            W[:, i2:] -= Err1.to(Hinv.dtype).matmul(Hinv[i1:i2, i2:])
-
-        torch.cuda.synchronize()
-
-        if all_qparams == []:
-            all_qparams.append(cur_qparams)
-
-        # convert a list of qparams objects into a single one. enerally by
-        # concatenating a bunch of n,1 scale/zeros tensors into a n,num_groups tensor
-
-        #  `combine_qparams_list_func`.
-        all_qparams = self.combine_qparams_list_func(all_qparams)
-        Q = self.quantize_func(DQ, all_qparams)
-        return Q, DQ.to(orig_dtype), all_qparams
-
-
-class GPTQQuantizer(Quantizer):
-    """
-    This class implements a GPTQ Quantizer that can be used to apply GPTQ to a model in concert with the GenericGPTQRunner class.
-    Unlike the base Quantizer class, the user does not need to implement the create_quantized_state_dict, instead they have to reimplement
-    __init__ such that it defines the functions for the quantization mode. User is expected to reimplement convert_for_runtime.
-
-    The following functions (which must be defined in __init__) are used to define the quantization mode for both GPTQ and
-    create_quantized_state_dict. Here is a description of each function.
-
-    get_qparams_func:
-        A function that calculates the quantization qparams for an input tensor.
-        Args:
-            weight: A 2d weight tensor with non-integer dtype.
-        Returns:
-            qparams: it can have any format but will need to be handled by the other defined functions below.
-
-    quantize_func:
-        A function that applies quantization to an input tensor. It should be noted
-        that this function needs to be able to handle quantizing the entire weight tensor, a single group,
-        or a single column.
-        Args:
-            weight: A 2d weight tensor with non-integer dtype.
-            qparams: the output from get_qparams_func
-        Returns:
-            quantized_weight: A 2d quantized weight tensor (generally with an integer dtype)
-
-
-    dequantize_func:
-        A function that dequantizes an input quantized weight tensor. It should be noted
-        that this function needs to be able to handle dequantizing the entire weight tensor, a single group,
-        or a single column.
-        Args:
-            quantized_weight: A 2d quantized weight tensor (generally with an integer dtype)
-            qparams: the output from get_qparams_func
-        Returns:
-            weight: A 2d weight tensor with non-integer dtype.
-
-    act_fake_quant_func (optional):
-            A function that (dynamically) quantizes activation to input
-            Args:
-                input: input Tensor in f32/bf16/f16
-            Returns:
-                output: dynamically quantized and dequantized Tensor (with the same dtype as input)
-
-    combine_qparams_list_func:
-        A function that combines several qparams into one qparam.
-        Args:
-            qparams_list: a list of qparams objects, each obtained by calling get_qparams_func
-            on a single group from a weight tensor
-        Returns:
-            qparams: an object of the same format as the qparams above.
-
-    skip_layer_func:
-        A function that determines which linear layers should be skipped during GPTQ
-        Args:
-            weight: A 2d weight tensor with non-integer dtype.
-        Returns:
-            skip: boolean indicating whether layer should be skipped
-
-    make_names_and_values_dict_func:
-        A function that prepares the qparams and quantized_weight and creates a dictionary indicating how they
-        should be inserted into the state_dict. Generally any packing of the weight and qparams should be done here.
-        Args:
-            quantized_weight: A 2d quantized weight tensor (generally with an integer dtype)
-            qparams: the output from get_qparams_func
-        Returns:
-            names_and_values_dict: a dictionary mapping the name of the parameters of the quantized module to the
-            corresponding quantized weights and qparams.
-    """
-
-    def __init__(self):
-        assert self.get_qparams_func is not None
-
-        assert self.quantize_func is not None
-
-        assert self.dequantize_func is not None
-
-        assert self.combine_qparams_list_func is not None
-
-        #  `make_names_and_values_dict_func`.
-        assert self.make_names_and_values_dict_func is not None
-
-    @torch.no_grad()
-    def _create_quantized_state_dict(
-        self,
-        model,
-        inputs,
-        blocksize,
-        percdamp,
-        groupsize,
-        #  `typing.Dict[<key type>, <value type>]` to avoid runtime subscripting errors.
-    ) -> Dict:
-        print("Tracing model for GPTQ")
-        GPTQ_runner = GenericGPTQRunner(
-            model,
-            inputs,
-            blocksize,
-            percdamp,
-            groupsize,
-        ).configure_quantization_mode(
-            self.get_qparams_func,  # pyre-ignore[16]
-            self.quantize_func,  # pyre-ignore[16]
-            self.dequantize_func,  # pyre-ignore[16]
-            self.combine_qparams_list_func,  # pyre-ignore[16]
-            self.make_names_and_values_dict_func,  # pyre-ignore[16]
-            self.skip_layer_func,  # pyre-ignore[16]
-            self.act_fake_quant_func
-            if hasattr(self, "act_fake_quant_func")
-            else None,  # pyre-ignore[16]
-        )
-        print("Applying GPTQ to weights")
-        GPTQ_runner.run()
-        return GPTQ_runner.get_quantized_state_dict()
-
-    def _convert_for_runtime(self, model: torch.nn.Module) -> "nn.Module":
-        raise NotImplementedError("_convert_for_runtime not implemented")
-
-    @torch.no_grad()
-    def quantize(
-        self, model: torch.nn.Module, inputs: List[_MultiInput], **kwargs: Any
-    ) -> torch.nn.Module:
-        pass
-
-
-def _check_linear_int4_k(k, groupsize=1, inner_k_tiles=None):
-    k_divisible_by_groupsize = k % groupsize == 0
-    if inner_k_tiles is not None:
-        k_divisible_by_16_times_inner_k_tiles = k % (inner_k_tiles * 16) == 0
-        return k_divisible_by_groupsize and k_divisible_by_16_times_inner_k_tiles
-    return k_divisible_by_groupsize
-
-
-def linear_forward_int4(
-    x: torch.Tensor,
-    weight_int4pack: torch.Tensor,
-    scales_and_zeros: torch.Tensor,
-    out_features: int,
-    groupsize: int,
-    precision: torch.dtype = torch.bfloat16,
-    scales_precision: torch.dtype = torch.bfloat16,
-):
-    origin_x_size = x.size()
-    x = x.reshape(-1, origin_x_size[-1])
-    if is_device(x.device.type, "cpu") and TORCH_VERSION_AT_LEAST_2_6:
-        c = torch.ops.aten._weight_int4pack_mm_for_cpu(
-            x.to(precision),
-            weight_int4pack,
-            groupsize,
-            scales_and_zeros.to(scales_precision),
-        ).to(dtype=x.dtype)
-    else:
-        c = torch.ops.aten._weight_int4pack_mm(
-            x.to(precision),
-            weight_int4pack,
-            groupsize,
-            scales_and_zeros.to(scales_precision),
-        ).to(dtype=x.dtype)
-    new_shape = origin_x_size[:-1] + (out_features,)
-    c = c.reshape(new_shape)
-    return c
-
-
-class WeightOnlyInt4Linear(torch.nn.Module):
-    __constants__ = ["in_features", "out_features"]
-    in_features: int
-    out_features: int
-    weight: torch.Tensor
-
-    def __init__(
-        self,
-        in_features: int,
-        out_features: int,
-        # TODO: remove dtype field, not used
-        bias=False,
-        device=None,
-        dtype=None,
-        groupsize: int = 128,
-        inner_k_tiles: int = 8,
-        precision: torch.dtype = torch.bfloat16,
-        scales_precision: torch.dtype = torch.bfloat16,
-    ) -> None:
-        super().__init__()
-        self.padding = not _check_linear_int4_k(in_features, groupsize, inner_k_tiles)
-        if self.padding:
-            self.origin_in_features = in_features
-            in_features = find_multiple(in_features, 1024)
-
-        self.in_features = in_features
-        self.out_features = out_features
-        assert not bias, "require bias=False"
-        self.device = device
-        self.groupsize = groupsize
-        self.inner_k_tiles = inner_k_tiles
-        self.precision = precision
-        self.scales_precision = scales_precision
-
-        if dtype is not None:
-            raise ValueError("Please specify 'precision' instead of 'dtype'")
-
-        assert out_features % 8 == 0, "require out_features % 8 == 0"
-        assert in_features % (inner_k_tiles * 16) == 0, (
-            "require in_features % (innerKTiles * 16) == 0"
-        )
-        if is_device(device.type, "cpu"):
-            self.register_buffer(
-                "weight",
-                torch.zeros(
-                    (
-                        out_features,
-                        in_features // 2,
-                    ),
-                    dtype=torch.uint8,
-                    device=device,
-                ),
-            )
-        else:
-            self.register_buffer(
-                "weight",
-                torch.zeros(
-                    (
-                        out_features // 8,
-                        in_features // (inner_k_tiles * 16),
-                        32,
-                        inner_k_tiles // 2,
-                    ),
-                    dtype=torch.int32,
-                    device=device,
-                ),
-            )
-        self.dtype = dtype
-        self.register_buffer(
-            "scales_and_zeros",
-            torch.zeros(
-                (in_features // groupsize, out_features, 2),
-                dtype=self.scales_precision,
-                device=device,
-            ),
-        )
-
-    def forward(self, input: torch.Tensor) -> torch.Tensor:
-        if self.padding:
-            input = F.pad(input, pad=(0, self.in_features - self.origin_in_features))
-        return linear_forward_int4(
-            input,
-            self.weight,
-            self.scales_and_zeros,
-            self.out_features,
-            self.groupsize,
-            self.precision,
-            self.scales_precision,
-        )
-
-
-def _replace_linear_int4(
-    module: torch.nn.Module,
-    groupsize: int,
-    inner_k_tiles: Optional[int],
-    padding_allowed: bool,
-    skip_layer_func: Optional[Callable] = None,
-    precision: torch.dtype = torch.bfloat16,
-    scales_precision: torch.dtype = torch.bfloat16,
-    linear_class: Type[torch.nn.Module] = WeightOnlyInt4Linear,
-    copy_weights: bool = False,
-):
-    for name, child in module.named_children():
-        # TODO: support linear bias
-        if (
-            isinstance(child, nn.Linear)
-            and child.bias is None
-            and (skip_layer_func is None or not skip_layer_func(child.weight))
-        ):
-            if (
-                _check_linear_int4_k(child.in_features, groupsize, inner_k_tiles)
-                or padding_allowed
-            ):
-                new_linear = linear_class(
-                    child.in_features,
-                    child.out_features,
-                    bias=False,
-                    device=child.weight.device,
-                    groupsize=groupsize,
-                    inner_k_tiles=inner_k_tiles,
-                    precision=precision,
-                    scales_precision=scales_precision,
-                )
-                # TODO: merge with 8da4w?
-                # In distributed training, the model may be instantiated
-                # on the meta device, in which case there is no need to
-                # copy the weights, and doing so will result in an error
-                if copy_weights and child.weight.device != torch.device("meta"):
-                    new_linear.weight = child.weight
-                setattr(module, name, new_linear)
-        else:
-            _replace_linear_int4(
-                child,
-                groupsize,
-                inner_k_tiles,
-                padding_allowed,
-                skip_layer_func,
-                precision,
-                scales_precision,
-                linear_class,
-                copy_weights,
-            )
-
-
-def replace_linear_int4(
-    module, groupsize, inner_k_tiles, padding_allowed, skip_layer_func=None
-):
-    _replace_linear_int4(
-        module,
-        groupsize,
-        inner_k_tiles,
-        padding_allowed,
-        skip_layer_func,
-        linear_class=WeightOnlyInt4Linear,
-    )
-
-
-class Int4WeightOnlyQuantizer(Quantizer):
-    def __init__(
-        self,
-        groupsize: int = 256,
-        padding_allowed: bool = True,
-        inner_k_tiles: Optional[int] = 8,
-        device: torch.device = torch.device("cuda"),
-        precision: torch.dtype = torch.bfloat16,
-    ) -> None:
-        super().__init__()
-        assert inner_k_tiles in [2, 4, 8]
-        assert groupsize in [32, 64, 128, 256]
-
-        self.inner_k_tiles = inner_k_tiles
-        self.groupsize: int = groupsize
-        self.padding_allowed: bool = padding_allowed
-        self.device: torch.device = device
-        # precision and dtype are being used interchangeably here
-        self.precision: torch.dtype = precision
-
-    @torch.no_grad()
-    def _create_quantized_state_dict(
-        self, model: torch.nn.Module
-    ) -> Dict[str, torch.Tensor]:
-        cur_state_dict = model.state_dict()
-        for fqn, mod in model.named_modules():
-            if isinstance(mod, torch.nn.Linear) and mod.bias is None:
-                out_features = mod.out_features
-                in_features = mod.in_features
-                # assert out_features % 8 == 0, "require out_features % 8 == 0"
-                logging.info(f"linear: {fqn}, in={in_features}, out={out_features}")
-
-                assert in_features % self.groupsize == 0, (
-                    f"require in_features:{in_features} % self.groupsize:{self.groupsize} == 0"
-                )
-
-                weight = mod.weight.data
-                if not _check_linear_int4_k(
-                    in_features, self.groupsize, self.inner_k_tiles
-                ):
-                    if self.padding_allowed:
-                        import torch.nn.functional as F
-
-                        logging.warning(
-                            f"warning: {fqn} is padded to satisfy in_features % 1024 == 0"
-                        )
-                        padded_in_features = find_multiple(in_features, 1024)
-                        weight = F.pad(
-                            weight, pad=(0, padded_in_features - in_features)
-                        )
-                    else:
-                        logging.warning(
-                            f"warning: {fqn} is skipped, int4 requires that in_features is 32, 64, or is divisible by 1024, "
-                            + "and that groupsize and inner_k_tiles*16 evenly divide into it"
-                        )
-                        continue
-                (w_int4x8, scales_and_zeros) = groupwise_affine_quantize_tensor(
-                    weight,
-                    4,  # n_bit
-                    self.groupsize,
-                    self.precision,  # dtype for scales_and_zeros
-                )
-                # TODO: just get the device from mod.weight.device?
-                if (
-                    is_device(w_int4x8.device.type, "cpu")
-                    and TORCH_VERSION_AT_LEAST_2_6
-                ):
-                    weight_int4pack = (
-                        torch.ops.aten._convert_weight_to_int4pack_for_cpu(
-                            w_int4x8.to(self.device), self.inner_k_tiles
-                        )
-                    )
-                else:
-                    weight_int4pack = torch.ops.aten._convert_weight_to_int4pack(
-                        w_int4x8.to(self.device), self.inner_k_tiles
-                    )
-                cur_state_dict[f"{fqn}.weight"] = weight_int4pack.to(self.device)
-                cur_state_dict[f"{fqn}.scales_and_zeros"] = scales_and_zeros.to(
-                    self.device
-                )
-        return cur_state_dict
-
-    def _convert_for_runtime(self, model: torch.nn.Module) -> torch.nn.Module:
-        _replace_linear_int4(
-            model,
-            self.groupsize,
-            self.inner_k_tiles,
-            self.padding_allowed,
-            skip_layer_func=None,
-            precision=self.precision,
-            scales_precision=self.precision,
-        )
-        return model
-
-    def quantize(
-        self, model: torch.nn.Module, *args: Any, **kwargs: Any
-    ) -> torch.nn.Module:
-        state_dict = self._create_quantized_state_dict(model)
-        model = self._convert_for_runtime(model)
-        # TODO: make it strict
-        model.load_state_dict(state_dict, strict=False)
-        return model
-
-
-class Int4WeightOnlyGPTQQuantizer(GPTQQuantizer):
-    def __init__(
-        self,
-        blocksize=128,
-        percdamp=0.01,
-        groupsize=64,
-        inner_k_tiles=8,
-        padding_allowed=True,
-        device: torch.device = torch.device("cuda"),
-    ):
-        self.blocksize = blocksize
-        self.percdamp = percdamp
-        self.groupsize = groupsize
-        self.inner_k_tiles = inner_k_tiles
-        self.padding_allowed = padding_allowed
-        self.device = device
-        self.act_fake_quant_func = None
-        n_bit = 4
-        self.get_qparams_func = lambda w: get_groupwise_affine_qparams(
-            w, n_bit, groupsize
-        )
-        self.quantize_func = (
-            lambda w, qparams: groupwise_affine_quantize_tensor_from_qparams(
-                w, qparams[0], qparams[1], n_bit, groupsize
-            )
-        )
-        self.dequantize_func = (
-            lambda q, qparams: groupwise_affine_dequantize_tensor_from_qparams(
-                q,
-                qparams[0],
-                qparams[1],
-                n_bit,
-                groupsize,
-            )
-        )
-        self.combine_qparams_list_func = lambda qparams_list: [
-            torch.cat(x, dim=1) for x in zip(*qparams_list)
-        ]
-        # skip unless padding_allowed=True or its correctly sized
-        self.skip_layer_func = lambda linear_weight: not (
-            _check_linear_int4_k(linear_weight.shape[-1], groupsize) or padding_allowed
-        )
-
-        # we need to do the padding here, both for q and the qparams if necessary
-
-        # TODO: this is the gpt-fast version, merge with the main version later
-        def make_names_and_values_dict_func(q, qparams):
-            k = q.shape[1] * 2
-            if not _check_linear_int4_k(k, groupsize):
-                new_k = find_multiple(k, 1024)
-            else:
-                new_k = k
-            # how much we need to pad the weight
-            delta_k = int((new_k - k) / 2)
-            q = q.to(self.device)
-            if is_device(self.device.type, "cpu") and TORCH_VERSION_AT_LEAST_2_6:
-                final_q = torch.ops.aten._convert_weight_to_int4pack_for_cpu(
-                    F.pad(q, pad=(0, delta_k)), inner_k_tiles
-                )
-            else:
-                final_q = torch.ops.aten._convert_weight_to_int4pack(
-                    F.pad(q, pad=(0, delta_k)), inner_k_tiles
-                )
-            scales = qparams[0].to(torch.bfloat16).to(self.device)
-            zeros = qparams[1].to(torch.bfloat16).to(self.device)
-            scales_and_zeros = pack_tinygemm_scales_and_zeros(scales, zeros)
-            # how many new groups we need for padded weight
-            delta_groups = new_k // groupsize - scales_and_zeros.shape[0]
-            final_s_and_z = F.pad(
-                scales_and_zeros, pad=(0, 0, 0, 0, 0, delta_groups), value=1
-            )
-            return {"weight": final_q, "scales_and_zeros": final_s_and_z}
-
-        self.make_names_and_values_dict_func = make_names_and_values_dict_func
-        super().__init__()
-
-    def _convert_for_runtime(self, model):
-        replace_linear_int4(
-            model,
-            self.groupsize,
-            self.inner_k_tiles,
-            self.padding_allowed,
-            skip_layer_func=self.skip_layer_func,
-        )
-        return model
-
-    def quantize(
-        self, model: torch.nn.Module, inputs: List[_MultiInput], **kwargs: Any
-    ) -> torch.nn.Module:
-        state_dict = self._create_quantized_state_dict(
-            model,
-            inputs,
-            self.blocksize,
-            self.percdamp,
-            self.groupsize,
-        )
-        model = self._convert_for_runtime(model)
-        model.load_state_dict(state_dict, strict=False)
-        return model
-
-
-def linear_forward_8da4w(
-    x,
-    weight_int8,
-    bias,
-    scales,
-    zeros,
-    out_features,
-    groupsize,
-    output_precision,
-):
-    # uses fp32 to match torchao.quantization.quant_api._int8_asymm_per_token_quant
-    # and activation_scale_dtype in QAT configs
-    # TODO: in future add ability to specify activation_scale_dtype to PTQ configs
-    # and enable similar change here
-    x = per_token_dynamic_quant(
-        x,
-        scale_dtype=torch.float32,
-        zero_point_dtype=torch.float32,
-        eps=torch.finfo(torch.float32).eps,
-    )
-
-    # TODO: verify and remove following reshape code
-    # origin_x_size = x.size()
-    # x = x.reshape(-1, origin_x_size[-1])
-
-    # TODO: better API
-    # weight_int8 = torch.ops.quantized_decomposed.unpack_int4_to_int8(weight_int4packed)
-    n_bit = 4
-    quant_min = -(2 ** (n_bit - 1))
-    quant_max = 2 ** (n_bit - 1) - 1
-    block_size = (1, groupsize)
-
-    w_dq = dequantize_affine(
-        weight_int8,
-        block_size,
-        scales,
-        zeros,
-        torch.int8,
-        quant_min,
-        quant_max,
-        output_dtype=output_precision,
-    )
-
-    # x = x.to(torch.float16)
-    # w_dq = w_dq.to(torch.float16)
-    c = torch.nn.functional.linear(x, w_dq, bias)
-
-    # new_shape = origin_x_size[:-1] + (out_features,)
-    # c = c.reshape(new_shape)
-
-    return c
-
-
-class Int8DynActInt4WeightLinear(torch.nn.Module):
-    __constants__ = ["in_features", "out_features"]
-
-    in_features: int
-    out_features: int
-    weight: torch.Tensor
-    bias: torch.Tensor
-
-    """
-    This module implements a dynamic quantized linear layer with int4 weight.
-    Weights are per channel groupwise quantized. Parameters of importance
-    groupsize: the number of elements in each quantized group
-    precision: precision of input and output. e.g. torch.float32 means input
-    activation is float32 and output is float32.
-    scales_precision: precision of per group scale.
-    """
-
-    def __init__(
-        self,
-        in_features: int,
-        out_features: int,
-        bias=True,
-        device=None,
-        # TODO: remove this field, not used
-        dtype=None,
-        groupsize: int = 256,
-        precision: torch.dtype = torch.float32,
-        scales_precision: torch.dtype = torch.float32,
-    ) -> None:
-        super().__init__()
-        # always pad if needed since it becomes a noop at runtime if not needed
-        # self.origin_in_features = in_features
-        assert in_features % groupsize == 0, (
-            f"require in_features:{in_features} % groupsize:{groupsize} == 0"
-        )
-        # in_features = _calc_padded_size_linear_int4(
-        #    in_features, groupsize
-        # )
-        self.in_features = in_features
-        self.out_features = out_features
-        # TODO: align groupsize naming
-        self.groupsize = groupsize
-        # Precision of the activation which also indicates
-        # output precision of the dynamically quantized linear layer
-        # that his module represents.
-        self.precision = precision
-
-        if dtype is not None:
-            raise ValueError("Please specify 'precision' instead of 'dtype'")
-
-        # currently storing unpacked int8 weights
-        self.register_buffer(
-            "weight",
-            torch.zeros((out_features, in_features), dtype=torch.int8),
-        )
-        self.register_buffer(
-            "scales",
-            torch.zeros(
-                (out_features, in_features // groupsize),
-                dtype=scales_precision,
-            ),
-        )
-        self.register_buffer(
-            "zeros",
-            torch.zeros(
-                (out_features, in_features // groupsize),
-                dtype=scales_precision,
-            ),
-        )
-
-        if bias:
-            self.register_buffer("bias", torch.zeros(out_features, dtype=precision))
-        else:
-            self.bias = None
-
-    def forward(self, input: torch.Tensor) -> torch.Tensor:
-        input = input.to(self.precision)
-        # padding is removed for perf
-        # input = F.pad(input, pad=(0, self.in_features - self.origin_in_features))
-        return linear_forward_8da4w(
-            input,
-            self.weight,
-            self.bias,
-            self.scales,
-            self.zeros,
-            self.out_features,
-            self.groupsize,
-            self.precision,
-        )
-
-
-def _replace_linear_8da4w(
-    module: torch.nn.Module,
-    groupsize: int,
-    padding_allowed: bool,
-    precision: torch.dtype,
-    scales_precision: torch.dtype,
-    linear_class: Type[torch.nn.Module],
-    copy_weights: bool = False,
-):
-    # import the util function here to avoid circular dependency
-    from torchao.quantization.quant_api import _replace_with_custom_fn_if_matches_filter
-
-    def filter_fn(child: torch.nn.Module, cur_fqn: str) -> bool:
-        return isinstance(child, nn.Linear) and (
-            _check_linear_int4_k(child.in_features, groupsize) or padding_allowed
-        )
-
-    def replacement_fn(child: torch.nn.Module) -> torch.nn.Module:
-        new_linear = linear_class(
-            child.in_features,
-            child.out_features,
-            bias=child.bias is not None,
-            device=child.weight.device,
-            groupsize=groupsize,
-            precision=precision,
-            scales_precision=scales_precision,
-        )
-        # In distributed training, the model may be instantiated
-        # on the meta device, in which case there is no need to
-        # copy the weights, and doing so will result in an error
-        if copy_weights and child.weight.device != torch.device("meta"):
-            new_linear.weight = child.weight
-            new_linear.bias = child.bias
-        return new_linear
-
-    _replace_with_custom_fn_if_matches_filter(module, replacement_fn, filter_fn)
-
-
-def replace_linear_8da4w(
-    module: torch.nn.Module,
-    groupsize: int,
-    padding_allowed: bool,
-    precision: torch.dtype,
-    scales_precision: torch.dtype,
-):
-    _replace_linear_8da4w(
-        module,
-        groupsize,
-        padding_allowed,
-        precision,
-        scales_precision,
-        Int8DynActInt4WeightLinear,
-    )
-
-
-class Int8DynActInt4WeightQuantizer(Quantizer):
-    def __init__(
-        self,
-        groupsize: int = 256,
-        padding_allowed: bool = False,
-        precision: torch.dtype = torch.float32,
-        scales_precision: torch.dtype = torch.float32,
-        device: torch.device = torch.device("cpu"),
-        mapping_type: MappingType = MappingType.SYMMETRIC,
-    ) -> None:
-        super().__init__()
-        self.groupsize: int = groupsize
-        self.padding_allowed: bool = padding_allowed
-        self.precision: torch.dtype = precision
-        self.scales_precision: torch.dtype = scales_precision
-        self.device: torch.device = device
-        self.mapping_type: MappingType = mapping_type
-
-    @torch.no_grad()
-    def _create_quantized_state_dict(
-        self, model: torch.nn.Module
-    ) -> Dict[str, torch.Tensor]:
-        cur_state_dict = model.state_dict()
-        for fqn, mod in model.named_modules():
-            if isinstance(mod, torch.nn.Linear):
-                out_features = mod.out_features
-                in_features = mod.in_features
-                # assert out_features % 8 == 0, "require out_features % 8 == 0"
-                logging.info(f"linear: {fqn}, in={in_features}, out={out_features}")
-
-                assert in_features % self.groupsize == 0, (
-                    f"require in_features:{in_features} % self.groupsize:{self.groupsize} == 0"
-                )
-
-                weight = mod.weight.data
-                if not _check_linear_int4_k(in_features, self.groupsize):
-                    if self.padding_allowed:
-                        import torch.nn.functional as F
-
-                        logging.warning(
-                            f"warning: {fqn} is padded to satisfy in_features % 1024 == 0"
-                        )
-                        padded_in_features = find_multiple(in_features, 1024)
-                        weight = F.pad(
-                            weight, pad=(0, padded_in_features - in_features)
-                        )
-                    else:
-                        logging.warning(
-                            f"warning: {fqn} is skipped, int4 requires that in_features is 32, 64, or is divisible by 1024, "
-                            + "and that groupsize and inner_k_tiles*16 evenly divide into it"
-                        )
-                        continue
-                (
-                    weight_int8,
-                    scales,
-                    zeros,
-                ) = group_quantize_tensor_symmetric(
-                    weight.to(self.precision),
-                    4,  # n_bit
-                    self.groupsize,
-                    self.scales_precision,
-                    mapping_type=self.mapping_type,
-                )
-                cur_state_dict[f"{fqn}.weight"] = weight_int8.to(self.device)
-                cur_state_dict[f"{fqn}.scales"] = scales.to(self.device)
-                cur_state_dict[f"{fqn}.zeros"] = zeros.to(self.device)
-
-        return cur_state_dict
-
-    def _convert_for_runtime(self, model: torch.nn.Module) -> torch.nn.Module:
-        replace_linear_8da4w(
-            model,
-            self.groupsize,
-            self.padding_allowed,
-            self.precision,
-            # TODO: this should be self.scales_precision?
-            self.precision,
-        )
-        return model
-
-    def quantize(
-        self, model: torch.nn.Module, *args: Any, **kwargs: Any
-    ) -> torch.nn.Module:
-        state_dict = self._create_quantized_state_dict(model)
-        model = self._convert_for_runtime(model)
-        # TODO: make it strict
-        model.load_state_dict(state_dict, strict=False)
-        return model
-
-
-class Int8DynActInt4WeightGPTQQuantizer(GPTQQuantizer):
-    def __init__(
-        self,
-        blocksize=128,
-        percdamp=0.01,
-        groupsize=64,
-        inner_k_tiles=8,
-        padding_allowed=True,
-        precision=torch.float32,
-    ):
-        self.blocksize = blocksize
-        self.percdamp = percdamp
-        self.groupsize = groupsize
-        self.inner_k_tiles = inner_k_tiles
-        self.padding_allowed = padding_allowed
-        self.precision = precision
-
-        self.act_fake_quant_func = per_token_dynamic_quant
-        n_bit = 4
-        self.get_qparams_func = lambda w: get_group_qparams_symmetric(
-            w, n_bit, groupsize, self.precision
-        )
-        quant_min = -(2 ** (n_bit - 1))
-        quant_max = 2 ** (n_bit - 1) - 1
-
-        from torchao._executorch_ops import (
-            _quantized_decomposed_quantize_per_channel_group_wrapper,
-        )
-
-        self.quantize_func = (
-            lambda w, qparams: _quantized_decomposed_quantize_per_channel_group_wrapper(
-                w, qparams[0], qparams[1], quant_min, quant_max, torch.int8, groupsize
-            )
-        )
-
-        from torchao._executorch_ops import (
-            _quantized_decomposed_dequantize_per_channel_group_wrapper,
-        )
-
-        self.dequantize_func = (
-            lambda q,
-            qparams: _quantized_decomposed_dequantize_per_channel_group_wrapper(
-                q,
-                qparams[0],
-                qparams[1],
-                quant_min,
-                quant_max,
-                torch.int8,
-                groupsize,
-                self.precision,
-            )
-        )
-
-        self.combine_qparams_list_func = lambda qparams_list: [
-            torch.cat(x, dim=1) for x in zip(*qparams_list)
-        ]
-        # skip unless padding_allowed=True or its correctly sized
-
-        self.skip_layer_func = lambda linear_weight: not (
-            _check_linear_int4_k(linear_weight.shape[-1], groupsize) or padding_allowed
-        )
-
-        # we need to do the padding here, both for q and the qparams if necessary
-        def make_names_and_values_dict_func(q, qparams):
-            k = q.shape[1]
-            new_k = find_multiple(k, 1 if groupsize is None else groupsize)
-            # how much we need to pad the weight
-            delta_k = new_k - q.shape[1]
-            final_q = F.pad(q, pad=(0, delta_k))
-            scales = qparams[0].to(self.precision)
-            zeros = qparams[1].to(self.precision)
-            return {"weight": final_q, "scales": scales, "zeros": zeros}
-
-        self.make_names_and_values_dict_func = make_names_and_values_dict_func
-        super().__init__()
-
-    def _convert_for_runtime(self, model):
-        replace_linear_8da4w(
-            model,
-            self.groupsize,
-            self.padding_allowed,
-            self.precision,
-            # TODO: this should be self.scales_precision?
-            self.precision,
-        )
-        return model
-
-    def quantize(
-        self, model: torch.nn.Module, inputs: List[_MultiInput], **kwargs: Any
-    ) -> torch.nn.Module:
-        state_dict = self._create_quantized_state_dict(
-            model,
-            inputs,
-            self.blocksize,
-            self.percdamp,
-            self.groupsize,
-        )
-        model = self._convert_for_runtime(model)
-        model.load_state_dict(state_dict, strict=False)
-        return model
diff --git a/torchao/quantization/GPTQ_MT.py b/torchao/quantization/GPTQ/GPTQ.py
similarity index 51%
rename from torchao/quantization/GPTQ_MT.py
rename to torchao/quantization/GPTQ/GPTQ.py
index 664ebdfc17..8c3f791fd6 100644
--- a/torchao/quantization/GPTQ_MT.py
+++ b/torchao/quantization/GPTQ/GPTQ.py
@@ -3,6 +3,7 @@
 #
 # This source code is licensed under the BSD 3-Clause license found in the
 # LICENSE file in the root directory of this source tree.
+import math
 from typing import Any, Callable, Dict, List, Optional, Sequence, Tuple, Union
 
 import torch
@@ -21,16 +22,21 @@
     groupwise_affine_quantize_tensor_from_qparams,
 )
 
+GPTQ_FUNC_LIST = {}
 
-def _check_linear_int4_k(k, group_size=1, inner_k_tiles=None):
-    k_divisible_by_group_size = k % group_size == 0
-    if inner_k_tiles is not None:
-        k_divisible_by_16_times_inner_k_tiles = k % (inner_k_tiles * 16) == 0
-        return k_divisible_by_group_size and k_divisible_by_16_times_inner_k_tiles
-    return k_divisible_by_group_size
 
+__all__ = [
+    "Int4WeightOnlyGPTQQuantizer",
+    "MultiTensorInputRecorder",
+    "MultiTensor",
+    "GPTQQuantizer",
+    "StateDictManager",
+]
 
-NON_IN_PLACE_OPS = {}
+
+#############################
+# Core Classes              #
+#############################
 
 
 class MultiTensor(torch.Tensor):
@@ -41,11 +47,11 @@ class MultiTensor(torch.Tensor):
     make_qtensor = None
     skip_layer_func = None
     act_fake_quant_func = None
-    percdamp = 0.01
-    blocksize = 128
-    group_size = -1
-    in_place_threshold = (
-        5  # Number of times to see a function before assuming it's not in-place
+    group_size: int = -1
+    percdamp: float = 0.01
+    blocksize: int = 128
+    in_place_threshold: int = (
+        3  # Number of times to see a function before assuming it's not in-place
     )
 
     @staticmethod
@@ -65,11 +71,16 @@ def __init__(
         self.state_dict_manager = StateDictManager.get_instance()
         self.count: int = 0
         self.add_tensors(input)
-        self.debug: bool = True
+        self.debug: bool = False
         self.gptq_done = False
 
     def __repr__(self) -> str:
-        return f"{self.__class__.__name__}(data={self.values})"
+        return (
+            f"{self.__class__.__name__}(shape={self.shape}, example={self.values[0]})"
+        )
+
+    def append(self, input: torch.Tensor):
+        return self.add_tensors(input)
 
     def add_tensors(
         self, input: Union[torch.Tensor, Sequence[torch.Tensor]]
@@ -102,13 +113,10 @@ def pad_to_length(self, length, pad_in_place=True):
                 )
         return self
 
-    def unpad(self, count=1, force=False):
+    def unpad(self, count=1):
         count = min(count, self.count)
-        if force or all((self.values[0] == x).all().item() for x in self.values):
-            self.values = self.values[:count]
-            self.count = count
-        else:
-            return self
+        self.values = self.values[:count]
+        self.count = count
 
     @classmethod
     def configure_quantization_mode(
@@ -120,9 +128,9 @@ def configure_quantization_mode(
         make_qtensor,
         skip_layer_func,
         act_fake_quant_func=None,
+        group_size=-1,
         percdamp=0.01,
         blocksize=128,
-        group_size=-1,
     ):
         cls.get_qparams_func = get_qparams_func
         cls.quantize_func = quantize_func
@@ -133,9 +141,9 @@ def configure_quantization_mode(
         cls.act_fake_quant_func = (
             act_fake_quant_func if act_fake_quant_func is not None else lambda x: x
         )
+        cls.group_size = group_size
         cls.percdamp = percdamp
         cls.blocksize = blocksize
-        cls.group_size = group_size
 
     @classmethod
     def __torch_function__(
@@ -146,72 +154,6 @@ def __torch_function__(
         kwargs: Optional[Dict[str, Any]] = None,
         skip_gptq: bool = False,
     ) -> Any:
-        def flat_to_grouped(
-            flat: List[Any], pad_in_place=True
-        ) -> List[Tuple[Any, ...]]:
-            # convert [A, MultiTensor(b1,b2,b3), MultiTensor(c1,c2,c3)] => [[A,b1,c1], [A,b2,c2] [A,b3,c3]]
-            multi_tensor_size = max(
-                [x.count if isinstance(x, MultiTensor) else 1 for x in flat]
-            )
-            grouped = list(
-                zip(
-                    *[
-                        x.pad_to_length(
-                            multi_tensor_size, pad_in_place=pad_in_place
-                        ).values
-                        if isinstance(x, MultiTensor)
-                        else [x] * multi_tensor_size
-                        for x in flat
-                    ]
-                )
-            )
-            return grouped
-
-        def grouped_to_flat(grouped: List[Tuple[Any, ...]]) -> Tuple[List[Any], bool]:
-            # convert [[A,b1,c1], [A,b2,c2] [A,b3,c3]] => [(A,A,A), (b1,b2,b3), (c1,c2,c3)]
-            flat_tups = list(zip(*grouped))
-            # convert [(A,A,A), (b1,b2,b3), (c1,c2,c3)] => [A, MultiTensor(b1,b2,b3), MultiTensor(c1,c2,c3)]
-            flattened = [
-                cls(tup).cpu() if isinstance(tup[0], torch.Tensor) else tup[0]
-                for tup in flat_tups
-            ]
-            non_tensors_equal = all(
-                all(x == tup[0] for x in tup)
-                for tup in flat_tups
-                if not isinstance(tup[0], torch.Tensor)
-            )
-            return flattened, non_tensors_equal
-
-        def tensors_to_cuda(args):
-            # this is needed because we want to execute the actual ops in cuda so they don't take forever
-            new_args = []
-            for x in args:
-                if isinstance(x, MultiTensor) and x.count == 1:
-                    new_args.append(x.__class__(x.values[0].cuda()))
-                else:
-                    new_args.append(
-                        x.cuda()
-                        if isinstance(x, torch.Tensor)
-                        and not isinstance(x, MultiTensor)
-                        else x
-                    )
-            return new_args
-
-        def maybe_copy_new_values(orig_inp, new_inp):
-            detected_difference = False
-            for x, new_x in zip(orig_inp, new_inp):
-                if isinstance(x, torch.Tensor):
-                    new_x = new_x.to(x.device)
-                    if (x != new_x).any():
-                        x.copy_(new_x)
-                        detected_difference = True
-            return detected_difference
-
-        def unpad(args, orig_counts, force=False):
-            for arg, count in zip(args, orig_counts):
-                if isinstance(arg, MultiTensor) and arg.count > count:
-                    arg.unpad(count, force)
-
         # The way MultiTensor handles various functions is as follows. Normally when you apply a function on a MultiTensor that has n Tensors inside, we want
         # the function handling here to run that function once for each of the MultiTensor inputs. We also want it to happen in the same way as if you ran the function
         # first input and the second independently, i.e. if you ran model(input1)=out1 and model(input2), vs model(MultiTensor(input1, input2)) the output for the
@@ -231,7 +173,7 @@ def unpad(args, orig_counts, force=False):
         # There's not really a great way to resolve the 2 issues, when there's an in place op you have to do the slow thing with cuda and checking for modified values....etc, when
         # there's not an in place op you can throw all singular tensors onto cuda at the start and go much faster.
         # This brings up the final issue, how do we know if we have an in place op? In general we don't so I added handling to MultiTensor to resolve that as well as can be hoped.
-        # we have a dict that contains all the funcs we see NON_IN_PLACE_OPS, we initially treat ops as in place and see if any of the inputs got modified if they do then it gets
+        # we have a dict that contains all the funcs we see GPTQ_FUNC_LIST, we initially treat ops as in place and see if any of the inputs got modified if they do then it gets
         # set to always be handled as an in place op. If nothing changes then once we've seen the op enough times that we're confident its not an in place op (cls.in_place_threshold)
         # then we can do the fast thing.
 
@@ -239,15 +181,13 @@ def unpad(args, orig_counts, force=False):
         # Determine if function is in-place
 
         # initialize function tracking
-        if func not in NON_IN_PLACE_OPS:
-            NON_IN_PLACE_OPS[func] = {"count": 0, "is_in_place": None}
-        NON_IN_PLACE_OPS[func]["count"] += 1
-
-        if NON_IN_PLACE_OPS[func]["is_in_place"] is not None:
-            is_in_place = NON_IN_PLACE_OPS[func]["is_in_place"]
-        elif (
-            NON_IN_PLACE_OPS[func]["count"] >= cls.in_place_threshold or quantize_linear
-        ):
+        if func not in GPTQ_FUNC_LIST:
+            GPTQ_FUNC_LIST[func] = {"count": 0, "is_in_place": None}
+        GPTQ_FUNC_LIST[func]["count"] += 1
+
+        if GPTQ_FUNC_LIST[func]["is_in_place"] is not None:
+            is_in_place = GPTQ_FUNC_LIST[func]["is_in_place"]
+        elif GPTQ_FUNC_LIST[func]["count"] >= cls.in_place_threshold or quantize_linear:
             is_in_place = False  # Assume not in-place after threshold
         else:
             is_in_place = True
@@ -257,176 +197,196 @@ def unpad(args, orig_counts, force=False):
         # flat_args holds all the actual inputs, spec stores the original structure
         flat_args, spec = tree_flatten((args, kwargs))
 
-        orig_counts = [x.count if isinstance(x, MultiTensor) else 1 for x in flat_args]
-
         # if we're not doing an in place op, move singular tensors to cuda now
         if not is_in_place:
-            flat_args = tensors_to_cuda(flat_args)
+            flat_args = _tensors_to_cuda(flat_args)
 
         # convert [A, MultiTensor(b), MultiTensor(c1,c2,c3)] => [[A,b,c1], [A,b,c2] [A,b,c3]]
-        # if its in place then instead we first convert MultiTensor(b) => MultiTensor(b1, b2, b3)
+        # if its in place then instead we first pad i.e. MultiTensor(b) => MultiTensor(b1, b2, b3)
         # then proceed as normal.
-        grouped_args = flat_to_grouped(flat_args, is_in_place)
+        grouped_args, orig_counts = _flat_to_grouped_and_pad(flat_args, is_in_place)
 
         with torch._C.DisableTorchFunctionSubclass():
-            if quantize_linear:
-                H = 0
-                total_batches = 0
-
-            outputs = []
-            for inp in grouped_args:
-                # we move all remaining cpu tensors to cuda
-                cuda_inp = tensors_to_cuda(inp)
-
-                # return input to original structure
-                cur_args, cur_kwargs = tree_unflatten(cuda_inp, spec)
-
-                if quantize_linear:
-                    # Construct Hessian matrix for quantization
-                    x = cur_args[0].float()
-                    # x = self.act_fake_quant_func(x)
-                    shape = x.shape
-                    n = 1 if len(shape) == 2 else shape[0]
-                    H *= total_batches / (total_batches + n)
-                    total_batches += n
-
-                    x = ((2 / total_batches) ** (1 / 2)) * x.reshape(
-                        -1, shape[-1]
-                    ).t().float()
-
-                    H += x.matmul(x.t())
-                else:
-                    try:
-                        out = func(*cur_args, **cur_kwargs)
-                    except Exception:
-                        breakpoint()
-
-                    outputs.append(out.cpu() if isinstance(out, torch.Tensor) else out)
-
-                    # if we're doing an in place op, here is where we copy modifications
-                    # back to the original tensors, if we saw any differences, immediately
-                    # categortize func as in place, otherwise we can treat as not in
-                    # place (especially for the upcoming unpad step)
-                    if is_in_place:
-                        detected_difference = maybe_copy_new_values(inp, cuda_inp)
-                        # if detected_difference and not isinstance(NON_IN_PLACE_OPS[func], bool):
-                        # print("THIS OP IS IN PLACE", func)
-                        # NON_IN_PLACE_OPS[func] = False
-                        if detected_difference and not NON_IN_PLACE_OPS[func]:
-                            NON_IN_PLACE_OPS[func]["is_in_place"] = True
-                            print(f"Function {func} is in-place")
-
-                        elif NON_IN_PLACE_OPS[func]["count"] >= cls.in_place_threshold:
-                            NON_IN_PLACE_OPS[func]["is_in_place"] = False
-
-            if quantize_linear:
-                # turn weight MultiTensor into single cuda tensor
-                W = args[1]
-                if isinstance(W, MultiTensor):
-                    W = W.values[0]
-                W = W.to(H.device)
-
-                Q, DQ, all_qparams = cls.faster_quant(H, W.detach())
-
-                # make quantized tensor subclass
-                qtensor = cls.make_qtensor(Q, all_qparams)
-
-                # Get the original parameter name
-                state_dict_manager = StateDictManager.get_instance()
-                original_param_name = state_dict_manager.get_name_for_param(args[1])
-                state_dict_manager.update_param(original_param_name, qtensor)
-                print(original_param_name)
-
-                # Run the function again with updated weights and skip_gptq=True
-                out = cls.__torch_function__(
-                    func, types, (args[0], DQ.cpu(), *args[2:]), kwargs, skip_gptq=True
-                )
-                if args[0].debug:
-                    act = args[0].values[0].to("cuda")
-                    bias = (
-                        args[2].values[0].to("cuda") if args[2] is not None else args[2]
-                    )
+            if not quantize_linear:  # normal function eval
+                out = cls._evaluate_function(func, grouped_args, spec, is_in_place)
 
-                    new_out = out.values[0].cpu()
-                    old_out = (
-                        cls.__torch_function__(
-                            func,
-                            types,
-                            (act, args[1].values[0], bias),
-                            kwargs,
-                            skip_gptq=True,
-                        )
-                        .values[0]
-                        .cpu()
-                    )
+                # go back and unpad everything where possible.
+                if not GPTQ_FUNC_LIST[func]["is_in_place"]:
+                    _do_unpad(flat_args, orig_counts)
+                return out
 
-                    DQ_after = cls.dequantize_func(Q, all_qparams).to(W.dtype)
-                    print(
-                        "SQNR for QDQ (this should be inf)", SQNR(DQ, DQ_after)
-                    )  # matches
-                    print(
-                        "SQNR for weight (can be low)", SQNR(W, DQ.cuda())
-                    )  # fine to not match
-                    print(
-                        "SQNR for output with GPTQ (hopefully 35+)",
-                        SQNR(old_out, new_out),
-                    )
+            # GPTQ quantization for linear layers
+            # Calculate Hessian approximation
+            H = _calculate_hessian(grouped_args, spec)
 
-                    DQ_from_qtensor = qtensor.dequantize()
-                    qtensor_out = torch.nn.functional.linear(act, qtensor, bias).cpu()
-                    print(
-                        "SQNR for output from qtensor vs output from DQ (should be high)",
-                        SQNR(qtensor_out, new_out),
-                    )
-                    print(
-                        "SQNR for DQ vs DQ from qtensor (should be inf)",
-                        SQNR(DQ, DQ_from_qtensor),
-                    )
+            # turn weight MultiTensor into single cuda tensor
+            W = args[1]
+            if isinstance(W, MultiTensor):
+                W = W.values[0]
+            W = W.to(H.device)
+
+            Q, DQ, all_qparams = cls.faster_quant(H, W.detach())
 
-                    qparams2 = cls.get_qparams_func(W)
-                    Q2 = cls.quantize_func(W, qparams2)
-                    DQ2 = cls.dequantize_func(Q2, qparams2).to(W.dtype)
-                    old_q_out = (
-                        cls.__torch_function__(
-                            func, types, (act, DQ2, bias), kwargs, skip_gptq=True
-                        )
-                        .values[0]
-                        .cpu()
+            # make quantized tensor subclass
+            qtensor = cls.make_qtensor(Q, all_qparams)
+
+            # Get the original parameter name
+            state_dict_manager = StateDictManager.get_instance()
+            original_param_name = state_dict_manager.get_name_for_param(args[1])
+            state_dict_manager.update_param(original_param_name, qtensor)
+            print(original_param_name)
+
+            # Run the function again with updated weights and skip_gptq=True
+            out = cls.__torch_function__(
+                func, types, (args[0], DQ.cpu(), *args[2:]), kwargs, skip_gptq=True
+            )
+            if not args[0].debug:
+                _do_unpad(flat_args, orig_counts=orig_counts)
+                return out
+            if args[0].debug:
+                act = args[0].values[0].to("cuda")
+                bias = args[2].values[0].to("cuda") if args[2] is not None else args[2]
+
+                new_out = out.values[0].cpu()
+                old_out = (
+                    cls.__torch_function__(
+                        func,
+                        types,
+                        (act, args[1].values[0], bias),
+                        kwargs,
+                        skip_gptq=True,
                     )
+                    .values[0]
+                    .cpu()
+                )
 
-                    print(
-                        "SQNR for output without GPTQ (should be less than above)",
-                        SQNR(old_out, old_q_out),
+                DQ_after = cls.dequantize_func(Q, all_qparams).to(W.dtype)
+                print(
+                    "SQNR for QDQ (this should be inf)", SQNR(DQ, DQ_after)
+                )  # matches
+                print(
+                    "SQNR for weight (can be low)", SQNR(W, DQ.cuda())
+                )  # fine to not match
+                print(
+                    "SQNR for output with GPTQ (hopefully 35+)",
+                    SQNR(old_out, new_out),
+                )
+
+                DQ_from_qtensor = qtensor.dequantize()
+                qtensor_out = torch.nn.functional.linear(act, qtensor, bias).cpu()
+                print(
+                    "SQNR for output from qtensor vs output from DQ (should be high)",
+                    SQNR(qtensor_out, new_out),
+                )
+                print(
+                    "SQNR for DQ vs DQ from qtensor (should be inf)",
+                    SQNR(DQ, DQ_from_qtensor),
+                )
+
+                qparams2 = cls.get_qparams_func(W)
+                Q2 = cls.quantize_func(W, qparams2)
+                DQ2 = cls.dequantize_func(Q2, qparams2).to(W.dtype)
+                old_q_out = (
+                    cls.__torch_function__(
+                        func, types, (act, DQ2, bias), kwargs, skip_gptq=True
                     )
-                unpad(flat_args, orig_counts=orig_counts, force=True)
-                return out
-            else:
-                # we padded each of the MultiTensors to match the largest multitensor so that if we had in place ops, we would be able
-                # to store the many changed value and have those updates be reflected in the model. However if there are no in place ops, then
-                # we just increased the size of all parameters/buffers by n times for no reason. To avoid issues, go back and unpad
-                # everything where possible. i.e. all the multi tensor values are the same. We already checked for mutations and
-                # if we detected them, we updated NON_IN_PLACE_OPS to be False, so we can just check that see if we need
-                # to be careful during unpadding.
-                unpad(
-                    flat_args,
-                    orig_counts=orig_counts,
-                    force=(not isinstance(NON_IN_PLACE_OPS[func], bool)),
+                    .values[0]
+                    .cpu()
                 )
 
-                grouped_outputs = [tree_flatten(x)[0] for x in outputs]
-                out_spec = tree_flatten(outputs[0])[1]
-                # conslidate out into MultiTensors [[A,b1,c1], [A,b2,c2] [A,b3,c3]] => [A, MultiTensor(b1,b2,b3), MultiTensor(c1,c2,c3)]
-                flat_outputs, non_tensors_equal = grouped_to_flat(grouped_outputs)
-                assert non_tensors_equal, (
-                    f"ERR: found a function in model: {func} which "
-                    + "caused an error in GPTQ MultiTensor, the function dispatch only works for functions"
-                    + " with Tensor outputs or that have the same non-Tensor output value for all across all inputs"
+                print(
+                    "SQNR for output without GPTQ (should be less than above)",
+                    SQNR(old_out, old_q_out),
                 )
-                final_out = tree_unflatten(flat_outputs, out_spec)
-                return final_out
+                _do_unpad(flat_args, orig_counts=orig_counts)
+                return out
+
+    @classmethod
+    def grouped_to_flat(cls, grouped: List[Tuple[Any, ...]]) -> Tuple[List[Any], bool]:
+        # convert [[A,b1,c1], [A,b2,c2] [A,b3,c3]] => [(A,A,A), (b1,b2,b3), (c1,c2,c3)]
+        flat_tups = list(zip(*grouped))
+        # convert [(A,A,A), (b1,b2,b3), (c1,c2,c3)] => [A, MultiTensor(b1,b2,b3), MultiTensor(c1,c2,c3)]
+        flattened = [
+            cls(tup).cpu() if isinstance(tup[0], torch.Tensor) else tup[0]
+            for tup in flat_tups
+        ]
+        non_tensors_equal = all(
+            all(x == tup[0] for x in tup)
+            for tup in flat_tups
+            if not isinstance(tup[0], torch.Tensor)
+        )
+        return flattened, non_tensors_equal
+
+    @classmethod
+    def _evaluate_function(cls, func, grouped_args, spec, is_in_place):
+        outputs = []
+        for inp in grouped_args:
+            # we move all remaining cpu tensors to cuda
+            cuda_inp = _tensors_to_cuda(inp)
+
+            # return input to original structure
+            cur_args, cur_kwargs = tree_unflatten(cuda_inp, spec)
+
+            out = func(*cur_args, **cur_kwargs)
+
+            outputs.append(out.cpu() if isinstance(out, torch.Tensor) else out)
+
+            # if we're doing an in place op, here is where we copy modifications
+            # back to the original tensors, if we saw any mutated inputs, immediately
+            # categortize func as in place.
+            if is_in_place:
+                detected_mutation = _maybe_copy_new_values(
+                    inp, cuda_inp, force=GPTQ_FUNC_LIST[func]["is_in_place"]
+                )  # if we already know its in place, don't compare, just copy
+                if detected_mutation and GPTQ_FUNC_LIST[func]["is_in_place"] is None:
+                    GPTQ_FUNC_LIST[func]["is_in_place"] = True
+                    print(
+                        f">>GPTQ process identified function {func} as in-place, continuing...<<"
+                    )
+
+                # if no inputs were mutated and we've seen the function enough times, categorize it as not in place.
+                elif GPTQ_FUNC_LIST[func][
+                    "count"
+                ] >= cls.in_place_threshold and not isinstance(
+                    GPTQ_FUNC_LIST[func]["is_in_place"], bool
+                ):
+                    GPTQ_FUNC_LIST[func]["is_in_place"] = False
+
+        grouped_outputs = [tree_flatten(x)[0] for x in outputs]
+        out_spec = tree_flatten(outputs[0])[1]
+        # conslidate out into MultiTensors [[A,b1,c1], [A,b2,c2] [A,b3,c3]] => [A, MultiTensor(b1,b2,b3), MultiTensor(c1,c2,c3)]
+        flat_outputs, non_tensors_equal = cls.grouped_to_flat(grouped_outputs)
+        assert non_tensors_equal, (
+            f"ERR: found a function in model: {func} which "
+            + "caused an error in GPTQ MultiTensor, the function dispatch only works for functions"
+            + "with Tensor outputs or that have the same non-Tensor output value across all inputs"
+        )
+        final_out = tree_unflatten(flat_outputs, out_spec)
+        return final_out
 
     @classmethod
     def faster_quant(cls, H, W):
+        """
+        GPTQ quantization implementation.
+
+        Args:
+            H: Hessian matrix approximation
+            W: Weight matrix to quantize
+
+        Returns:
+            Tuple containing:
+            - Q: Quantized weights
+            - DQ: Dequantized weights
+            - all_qparams: Quantization parameters
+        """
+        msg = (
+            "tried to do faster quant but configure quantization mode was never called"
+        )
+        assert cls.get_qparams_func is not None, msg
+        assert cls.quantize_func is not None, msg
+        assert cls.dequantize_func is not None, msg
+        assert cls.combine_qparams_list_func is not None, msg
+
         percdamp = cls.percdamp
         blocksize = cls.blocksize
         group_size = cls.group_size
@@ -436,13 +396,14 @@ def faster_quant(cls, H, W):
         device = W.device
 
         if group_size == -1:
-            cur_qparams = cls.get_qparams_func(W)
+            group_size = columns
+        else:
+            blocksize = math.ceil(blocksize / group_size) * group_size
 
         dead = torch.diag(H) == 0
         H[dead, dead] = 1
         W[:, dead] = 0
 
-        Losses = torch.zeros_like(W)
         DQ = torch.zeros_like(W)
 
         damp = percdamp * torch.mean(torch.diag(H))
@@ -453,43 +414,48 @@ def faster_quant(cls, H, W):
         H = torch.linalg.cholesky(H, upper=True)
         Hinv = H
 
+        cur_qparams = None
         all_qparams = []
-        for i1 in range(0, columns, blocksize):
-            i2 = min(i1 + blocksize, columns)
-            count = i2 - i1
-            W1 = W[:, i1:i2].clone()
+
+        for block_start in range(
+            0, columns, blocksize
+        ):  # go through all columns block by block
+            block_end = min(block_start + blocksize, columns)
+            W1 = W[:, block_start:block_end].clone()
             DQ1 = torch.zeros_like(W1)
             Err1 = torch.zeros_like(W1)
-            Losses1 = torch.zeros_like(W1)
-            Hinv1 = Hinv[i1:i2, i1:i2]
-            for i in range(count):
-                w = W1[:, i]
-                d = Hinv1[i, i]
-
-                if (
-                    group_size != -1 and (i1 + i) % group_size == 0
-                ):  # start of new group
-                    cur_qparams = cls.get_qparams_func(
-                        W[:, (i1 + i) : (i1 + i + group_size)]
-                    )
+            Hinv1 = Hinv[block_start:block_end, block_start:block_end]
+            for group_start in range(
+                block_start, block_end, group_size
+            ):  # break up blocks by groupsize
+                group_end = min(group_start + group_size, columns)
+                if group_start % group_size == 0:
+                    # needed for when group_size == columns so only calculate qparams once
+                    cur_qparams = cls.get_qparams_func(W[:, group_start:group_end])
                     all_qparams.append(cur_qparams)
 
-                q = cls.quantize_func(w.unsqueeze(1), cur_qparams).flatten()
-                dq = cls.dequantize_func(q.unsqueeze(1), cur_qparams).flatten()
+                for index in range(group_start, group_end):  # within each group
+                    i = index - block_start
+                    w = W1[:, i]
+                    d = Hinv1[i, i]
 
-                DQ1[:, i] = dq
-                Losses1[:, i] = (w - dq) ** 2 / d**2
+                    q = cls.quantize_func(w.unsqueeze(1), cur_qparams).flatten()
+                    dq = cls.dequantize_func(q.unsqueeze(1), cur_qparams).flatten()
 
-                err1 = (w - dq) / d
-                W1[:, i:] -= (
-                    err1.to(Hinv1.dtype).unsqueeze(1).matmul(Hinv1[i, i:].unsqueeze(0))
-                )
-                Err1[:, i] = err1
+                    DQ1[:, i] = dq
 
-            DQ[:, i1:i2] = DQ1
-            Losses[:, i1:i2] = Losses1 / 2
+                    err1 = (w - dq) / d
+                    W1[:, i:] -= (
+                        err1.to(Hinv1.dtype)
+                        .unsqueeze(1)
+                        .matmul(Hinv1[i, i:].unsqueeze(0))
+                    )
+                    Err1[:, i] = err1
 
-            W[:, i2:] -= Err1.to(Hinv.dtype).matmul(Hinv[i1:i2, i2:])
+            DQ[:, block_start:block_end] = DQ1
+            W[:, block_end:] -= Err1.to(Hinv.dtype).matmul(
+                Hinv[block_start:block_end, block_end:]
+            )
 
         torch.cuda.synchronize()
 
@@ -529,42 +495,69 @@ def is_linear_layer(cls, func: Callable) -> bool:
         return func == torch.nn.functional.linear
 
 
-class StateDictManager:
-    _instance = None
-
-    @staticmethod
-    def get_instance():
-        if StateDictManager._instance is None:
-            StateDictManager._instance = StateDictManager()
-        return StateDictManager._instance
+class MultiTensorInputRecorder(torch.nn.Module):
+    def __init__(self, disable_input_validation=False, target_class=MultiTensor):
+        super().__init__()
+        self.flat_args = []
+        self.spec = None
+        self.validate = not disable_input_validation
+        self.target_class = target_class
+        self.count = 0
+
+    def forward(self, *args: Any, **kwargs: Any) -> "MultiTensorInputRecorder":
+        def validate_input(flat_args, spec):
+            if self.spec is None:
+                assert spec == self.spec, (
+                    f"got two different input structures when recording inputs, {self.spec} is not the same as {spec}"
+                )
 
-    def __init__(self):
-        self.state_dict = {}
-        self.id_to_name = {}
+            for count, x in enumerate(flat_args):
+                y = self.flat_args[count]
+                if not isinstance(x, torch.Tensor):
+                    assert x == y, (
+                        f"got different values for nontensor input {x} is not the same as {y} for flattened input element {count}, different inputs to input recorder must have same nontensor values"
+                    )
+                else:
+                    assert isinstance(y, self.target_class), (
+                        f"expected input of type torch.Tensor but got {type(x)} for flattened input element {count}"
+                    )
+                    assert y.dtype == x.dtype, (
+                        f"expected input of dtype {y.dtype} but got {x.dtype} for flattened input element {count} different inputs to input recorder must have same tensor dtypes"
+                    )
+                    assert y.shape == y.shape, (
+                        f"expected input of shape {y.shape} but got {y.dtype} for flattened input element {count} different inputs to input recorder must have same tensor shape"
+                    )
 
-    def set_state_dict(self, model):
-        self.state_dict = model.state_dict()
-        self.id_to_name = {id(v): k for k, v in model.named_parameters()}
+        kwargs = {} if kwargs is None else kwargs
+        flat_args, spec = tree_flatten((args, kwargs))
+        if self.spec is None:
+            self.spec = spec
+            self.flat_args = [
+                self.target_class(x) if isinstance(x, torch.Tensor) else x
+                for x in flat_args
+            ]
+            return self
 
-    def update_id_to_name(self, model):
-        self.id_to_name = {id(v): k for k, v in model.named_parameters()}
+        if self.validate:
+            validate_input(flat_args, spec)
+        self.count += 1
 
-    def get_name_for_param(self, param):
-        return self.id_to_name.get(id(param), None)
+        for count, x in enumerate(flat_args):
+            if isinstance(x, torch.Tensor):
+                self.flat_args[count].append(x)
+        return self
 
-    def update_param(self, name, new_value):
-        if name in self.state_dict:
-            if isinstance(new_value, MultiTensor):
-                self.state_dict[name] = new_value.values[
-                    0
-                ]  # Convert MultiTensor to regular tensor
-            else:
-                self.state_dict[name] = new_value
-        else:
-            raise KeyError(f"Parameter {name} not found in state_dict")
+    def get_recorded_inputs(self) -> Tuple[Any, ...]:
+        args, kwargs = self.get_recorded_args_and_kwargs()
+        assert len(kwargs) == 0, (
+            "kwargs is not empty but get_recorded_inputs called on MultiTensorInputRecorder, use get_recorded_args_and_kwargs instead"
+        )
+        return args
 
-    def get_state_dict(self):
-        return self.state_dict
+    def get_recorded_args_and_kwargs(self) -> Tuple[Tuple[Any, ...], Dict[str, Any]]:
+        assert self.spec is not None, "no inputs have been recorded yet"
+        args, kwargs = tree_unflatten(self.flat_args, self.spec)
+        return args, kwargs
 
 
 class GPTQQuantizer(Quantizer):
@@ -589,11 +582,6 @@ def _check_functions(self):
         assert self.make_qtensor is not None, "make_qtensor must be set"
         assert self.skip_layer_func is not None, "skip_layer_func must be set"
 
-    # this doesn't work
-    def _replace_parameters_with_multitensor(self, model):
-        for name, param in model.named_parameters():
-            setattr(model, name.split(".")[-1], MultiTensor(param))
-
     def covert_multi_tensors_to_tensors(self, state_dict):
         for key, value in state_dict.items():
             if isinstance(value, MultiTensor):
@@ -604,12 +592,15 @@ def covert_multi_tensors_to_tensors(self, state_dict):
     def _create_quantized_state_dict(
         self,
         model,
-        inputs,
+        args,
+        kwargs,
+        group_size=64,
         blocksize=128,
         percdamp=0.01,
-        group_size=64,
         #  `typing.Dict[<key type>, <value type>]` to avoid runtime subscripting errors.
     ) -> Dict:
+        if kwargs is None:
+            kwargs = {}
         MultiTensor.configure_quantization_mode(
             get_qparams_func=self.get_qparams_func,
             quantize_func=self.quantize_func,
@@ -617,25 +608,24 @@ def _create_quantized_state_dict(
             combine_qparams_list_func=self.combine_qparams_list_func,
             make_qtensor=self.make_qtensor,
             skip_layer_func=self.skip_layer_func,
+            group_size=group_size,
             percdamp=percdamp,
             blocksize=blocksize,
-            group_size=group_size,
         )
         # Set the state dict for the original model
         self.state_dict_manager.set_state_dict(model)
-        # Replace parameters with MultiTensor
-        # self._replace_parameters_with_multitensor(model)
-        # Replace buffers and parameters with MultiTensor
+
         with torch.no_grad():
             _replace_with_custom_fn_if_matches_filter(
                 model=model,
-                replacement_fn=replace_buffers_and_params_with_multitensors,
+                replacement_fn=_replace_buffers_and_params_with_multitensors,
                 filter_fn=lambda x, y: True,
             )
         self.state_dict_manager.update_id_to_name(model)
         # Run the model
+
         with torch.no_grad():
-            model(*inputs)
+            model(*args, **kwargs)
         state_dict = self.state_dict_manager.get_state_dict()
         return state_dict
 
@@ -643,17 +633,17 @@ def _create_quantized_state_dict(
 class Int4WeightOnlyGPTQQuantizer(GPTQQuantizer):
     def __init__(
         self,
+        group_size=64,
         blocksize=128,
         percdamp=0.01,
-        group_size=64,
         inner_k_tiles=8,
         padding_allowed=True,
         device: torch.device = torch.device("cuda"),
     ):
         super().__init__()
+        self.group_size = group_size
         self.blocksize = blocksize
         self.percdamp = percdamp
-        self.group_size = group_size
         self.inner_k_tiles = inner_k_tiles
         self.padding_allowed = padding_allowed
         self.device = device
@@ -720,14 +710,15 @@ def make_qtensor(q, qparams):
         self._check_functions()
 
     def quantize(
-        self, model: torch.nn.Module, inputs: List[MultiTensor], **kwargs: Any
+        self, model: torch.nn.Module, *args: Tuple[Any, ...], **kwargs: Dict[str, Any]
     ) -> torch.nn.Module:
         state_dict = self._create_quantized_state_dict(
             model,
-            inputs,
+            args,
+            kwargs,
+            self.group_size,
             self.blocksize,
             self.percdamp,
-            self.group_size,
         )
 
         # this is hacky and potentially wrong, better to just make the flow return a state dict and let user
@@ -735,7 +726,7 @@ def quantize(
 
         model = _replace_with_custom_fn_if_matches_filter(
             model=model,
-            replacement_fn=remove_multitensors_from_buffers_and_params,
+            replacement_fn=_remove_multitensors_from_buffers_and_params,
             filter_fn=lambda x, y: True,
         )
         remove = [k for k in state_dict if "kv_cache" in k]
@@ -747,28 +738,190 @@ def quantize(
         return model
 
 
-# this should probably be a multitensor method that can be applied and we just traverse
-# and look for multitensors and unpack them
-def remove_multitensors_from_buffers_and_params(model: nn.Module) -> nn.Module:
-    for name, buf in model.named_buffers(recurse=False):
-        if isinstance(buf, MultiTensor):
-            setattr(model, name, buf.values[0])
-    for name, param in model.named_parameters(recurse=False):
-        if isinstance(param, MultiTensor):
-            setattr(
-                model,
-                name,
-                nn.Parameter(param.values[0], param.values[0].requires_grad),
+class StateDictManager:
+    _instance = None
+
+    @staticmethod
+    def get_instance():
+        if StateDictManager._instance is None:
+            StateDictManager._instance = StateDictManager()
+        return StateDictManager._instance
+
+    def __init__(self):
+        self.state_dict = {}
+        self.id_to_name = {}
+
+    def set_state_dict(self, model):
+        self.state_dict = model.state_dict()
+        self.id_to_name = {id(v): k for k, v in model.named_parameters()}
+
+    def update_id_to_name(self, model):
+        self.id_to_name = {id(v): k for k, v in model.named_parameters()}
+
+    def get_name_for_param(self, param):
+        return self.id_to_name.get(id(param), None)
+
+    def update_param(self, name, new_value):
+        if name in self.state_dict:
+            if isinstance(new_value, MultiTensor):
+                self.state_dict[name] = new_value.values[
+                    0
+                ]  # Convert MultiTensor to regular tensor
+            else:
+                self.state_dict[name] = new_value
+        else:
+            raise KeyError(f"Parameter {name} not found in state_dict")
+
+    def get_state_dict(self):
+        return self.state_dict
+
+
+#############################
+# Utility Functions
+#############################
+
+
+def _check_linear_int4_k(k, group_size=1, inner_k_tiles=None):
+    """
+    Check if the dimensions are compatible with int4 quantization.
+
+    Args:
+        k: The dimension size to check
+        group_size: The group size for quantization
+        inner_k_tiles: The inner k tiles size
+
+    Returns:
+        bool: Whether the dimensions are compatible
+    """
+    k_divisible_by_group_size = k % group_size == 0
+    if inner_k_tiles is not None:
+        k_divisible_by_16_times_inner_k_tiles = k % (inner_k_tiles * 16) == 0
+        return k_divisible_by_group_size and k_divisible_by_16_times_inner_k_tiles
+    return k_divisible_by_group_size
+
+
+def _flat_to_grouped_and_pad(
+    flat: List[Any], pad_in_place=True
+) -> Tuple[List[Tuple[Any, ...]], List[int]]:
+    """
+    Convert flattened arguments to grouped arguments with padding.
+
+    Args:
+        flat: Flattened arguments
+        pad_in_place: Whether to pad in place
+
+    Returns:
+        Tuple containing grouped arguments and original counts
+    """
+    # Convert [A, MultiTensor(b1,b2,b3), MultiTensor(c1,c2,c3)] => [[A,b1,c1], [A,b2,c2] [A,b3,c3]]
+    orig_counts = [x.count if isinstance(x, MultiTensor) else 1 for x in flat]
+    multi_tensor_size = max(orig_counts)
+    grouped = list(
+        zip(
+            *[
+                x.pad_to_length(multi_tensor_size, pad_in_place=pad_in_place).values
+                if isinstance(x, MultiTensor)
+                else [x] * multi_tensor_size
+                for x in flat
+            ]
+        )
+    )
+    return grouped, orig_counts
+
+
+def _tensors_to_cuda(args, move_all=False):
+    """
+    Move tensors to CUDA for faster processing.
+
+    Args:
+        args: Arguments that may contain tensors
+        move_all: Whether to move all tensors or just single count tensors
+
+    Returns:
+        List with tensors moved to CUDA
+    """
+    new_args = []
+    for x in args:
+        if isinstance(x, MultiTensor) and (x.count == 1 or move_all):
+            new_args.append(x.__class__(x.values[0].cuda()))
+        else:
+            new_args.append(
+                x.cuda()
+                if isinstance(x, torch.Tensor) and not isinstance(x, MultiTensor)
+                else x
             )
-    return model
+    return new_args
 
 
-def replace_buffers_and_params_with_multitensors(model: nn.Module) -> nn.Module:
-    for name, buf in model.named_buffers(recurse=False):
-        setattr(model, name, MultiTensor([buf]))
-    for name, param in model.named_parameters(recurse=False):
-        setattr(model, name, nn.Parameter(MultiTensor([param]), param.requires_grad))
-    return model
+def _maybe_copy_new_values(orig_inp, new_inp, force=False):
+    """
+    Copy values from new inputs to original inputs if they've changed.
+    Used for handling in-place operations.
+
+    Args:
+        orig_inp: Original inputs
+        new_inp: New inputs (potentially modified)
+        force: Whether to force copying regardless of differences
+
+    Returns:
+        bool: Whether any differences were detected
+    """
+    detected_difference = False
+    for x, new_x in zip(orig_inp, new_inp):
+        if isinstance(x, torch.Tensor):
+            if force or (x != new_x.to(x.device)).any():
+                x.copy_(new_x)
+                detected_difference = True
+    return detected_difference
+
+
+def _do_unpad(args, orig_counts):
+    """
+    Unpad MultiTensors to their original counts.
+
+    Args:
+        args: Arguments that may contain MultiTensors
+        orig_counts: Original counts of MultiTensors
+    """
+    for arg, count in zip(args, orig_counts):
+        if isinstance(arg, MultiTensor) and arg.count > count:
+            arg.unpad(count)
+
+
+def _calculate_hessian(grouped_args, spec):
+    """
+    Calculate the Hessian matrix for GPTQ.
+
+    Args:
+        grouped_args: Grouped arguments
+        spec: Original structure specification
+
+    Returns:
+        torch.Tensor: Hessian matrix
+    """
+    H = 0
+    total_batches = 0
+    for inp in grouped_args:
+        # Move all remaining CPU tensors to CUDA
+        cuda_inp = [x.cuda() if isinstance(x, torch.Tensor) else x for x in inp]
+
+        # Return input to original structure
+        cur_args, _ = tree_unflatten(cuda_inp, spec)
+
+        # Setup x (activation tensor)
+        x = cur_args[0].float()
+        shape = x.shape
+        n = 1 if len(shape) == 2 else shape[0]
+        x = x.reshape(-1, shape[-1])
+
+        # Update Hessian with running average
+        H *= total_batches / (total_batches + n)
+        total_batches += n
+
+        x = ((2 / total_batches) ** (1 / 2)) * x.t()
+        H += x.matmul(x.t())
+
+    return H
 
 
 def _replace_with_custom_fn_if_matches_filter(
@@ -776,13 +929,71 @@ def _replace_with_custom_fn_if_matches_filter(
     replacement_fn: Callable[[nn.Module], nn.Module],
     filter_fn: Callable[[nn.Module, str], bool],
     cur_fqn: str = "",
-) -> None:
+) -> nn.Module:
+    """
+    Replace modules in the model if they match a filter.
+
+    Args:
+        model: The model to modify
+        replacement_fn: Function to apply to matching modules
+        filter_fn: Function to determine if a module should be replaced
+        cur_fqn: Current fully qualified name (for tracking position in model hierarchy)
+
+    Returns:
+        nn.Module: Modified model
+    """
     if filter_fn(model, cur_fqn[:-1]):
         model = replacement_fn(model)
+
     for name, child in model.named_children():
         new_child = _replace_with_custom_fn_if_matches_filter(
             child, replacement_fn, filter_fn, f"{cur_fqn}{name}."
         )
         if new_child is not child:
             setattr(model, name, new_child)
+
+    return model
+
+
+def _replace_buffers_and_params_with_multitensors(model: nn.Module) -> nn.Module:
+    """
+    Replace model buffers and parameters with MultiTensors.
+
+    Args:
+        model: The model to modify
+
+    Returns:
+        nn.Module: Modified model
+    """
+    for name, buf in model.named_buffers(recurse=False):
+        setattr(model, name, MultiTensor([buf]))
+
+    for name, param in model.named_parameters(recurse=False):
+        setattr(model, name, nn.Parameter(MultiTensor([param]), param.requires_grad))
+
+    return model
+
+
+def _remove_multitensors_from_buffers_and_params(model: nn.Module) -> nn.Module:
+    """
+    Convert MultiTensors in model buffers and parameters back to regular tensors.
+
+    Args:
+        model: The model to modify
+
+    Returns:
+        nn.Module: Modified model
+    """
+    for name, buf in model.named_buffers(recurse=False):
+        if isinstance(buf, MultiTensor):
+            setattr(model, name, buf.values[0])
+
+    for name, param in model.named_parameters(recurse=False):
+        if isinstance(param, MultiTensor):
+            setattr(
+                model,
+                name,
+                nn.Parameter(param.values[0], param.values[0].requires_grad),
+            )
+
     return model
diff --git a/torchao/quantization/GPTQ/README.md b/torchao/quantization/GPTQ/README.md
new file mode 100644
index 0000000000..89fde3487c
--- /dev/null
+++ b/torchao/quantization/GPTQ/README.md
@@ -0,0 +1,74 @@
+# GPTQ
+
+GPTQ is a quantization technique that improves accuracy for various forms of quantization as introduced in the paper: https://arxiv.org/abs/2210.17323
+
+In general GPTQ requires a model, a quantization technique and calibration data. GPTQ then optimizes the quantization parameters and quantized weights so they are more accurate accross the calibration data.
+
+## API
+
+The api for this technique is as follows:
+
+
+```python
+from torchao.quantization import MultiTensorInputRecorder, Int4WeightOnlyGPTQQuantizer
+
+model = get_model() # user provided function
+
+# first gather inputs
+input_recorder = MultiTensorInputRecorder()
+for i in range(calibration_limit):
+    args = get_next_input() # user provided function
+    input_recorder(*args) # compare to model(*args)
+     # note: can do input_recorder(*args, **kwargs) if needed
+
+# then perform GPTQ
+quantizer = Int4WeightOnlyGPTQQuantizer() # quantization parameters like group_size can be set here
+args = input_recorder.get_recorded_inputs() # use get_recorded_args_and_kwargs if necessary
+quantizer.quantize(model, *args)
+# model is now quantized and can be saved, compiled or run
+
+args = get_next_input()
+out = model(*args)
+```
+
+important notes:
+1) `input_recorder`, `quantizer.quantize` and `model` all take the same type of input. If you pass in kwargs to the model like `model(*args, **kwargs)` you'll need to do `input_recorder(*args, **kwargs)` and `quantizer.quantize(model, *args, **kwargs)`
+2) the GPTQ process can take a significant period of time depending on the size of the model and the size of the calibration set.
+3) We currently only support int4 weight only quantization for GPTQ though this framework can be relatively easily extended to other techniques.
+
+
+In many cases users use lm_eval to get calibration data. We also have an input recorder that integrates directly with lm_eval. This is equivalent to using lm_eval but setting your model to be a MultiTensorInputRecorder.
+
+```python
+from torchao._models._eval import LMEvalInputRecorder
+
+args = (
+    LMEvalInputRecorder(
+        get_tokenizer(), # tokenizer
+        calibration_seq_length,
+        prepare_inputs_for_model, # optional function that transforms the input, e.g. constructing the indices tensor
+        get_tokenizer_vocab_size(),
+        pad_calibration_inputs, # boolean to allow padding
+    )
+    .record_inputs(
+        calibration_tasks,
+        calibration_limit,
+    )
+    .get_recorded_inputs()
+)
+
+
+```
+
+## Results
+
+We tested the GPTQ implementation using the llama model in torchao/_models/llama with 10 calibration samples from lm_eval.
+
+| Technique:     | Llama-2-7b-chat-hf | Meta-Llama-3-8B |
+|----------------|--------------------|-----------------|
+| bf16           |             12.245 |           7.441 |
+| int4wo-64      |             12.876 |           8.316 |
+| gptq-int4wo-64 |             12.523 |           8.026 |
+
+In practice we find that GPTQ recovers ~1/2 to 1/3 of the perplexity lost compared to quantizing directly to int4.
+You can reproduce these numbers using `python eval.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --quantization gptq-int4wo-64 --calibration_limit 10`
diff --git a/torchao/quantization/GPTQ/__init__.py b/torchao/quantization/GPTQ/__init__.py
new file mode 100644
index 0000000000..8d62e68c3c
--- /dev/null
+++ b/torchao/quantization/GPTQ/__init__.py
@@ -0,0 +1,21 @@
+from torchao.quantization.linear_quant_modules import (
+    Int4WeightOnlyQuantizer,
+    Int8DynActInt4WeightLinear,
+    Int8DynActInt4WeightQuantizer,
+    WeightOnlyInt4Linear,
+    # for BC
+    _replace_linear_8da4w,  # noqa: F401
+    _replace_linear_int4,  # noqa: F401
+)
+
+from .GPTQ import Int4WeightOnlyGPTQQuantizer, MultiTensor, MultiTensorInputRecorder
+
+__all__ = [
+    "Int4WeightOnlyGPTQQuantizer",
+    "MultiTensorInputRecorder",
+    "MultiTensor",
+    "Int4WeightOnlyQuantizer",
+    "Int8DynActInt4WeightQuantizer",
+    "WeightOnlyInt4Linear",
+    "Int8DynActInt4WeightLinear",
+]
diff --git a/torchao/quantization/README.md b/torchao/quantization/README.md
index 80737eb4bb..90f83661aa 100644
--- a/torchao/quantization/README.md
+++ b/torchao/quantization/README.md
@@ -404,6 +404,10 @@ The benchmarks below were run on a single NVIDIA-A6000 GPU.
 
 You try can out these apis with the `quantize_` api as above alongside the constructor `codebook_weight_only` an example can be found in  in `torchao/_models/llama/generate.py`.
 
+### GPTQ Quantization
+We have a GPTQ quantization workflow that can be used to quantize a model to int4. More details can be found in [GPTQ](./GPTQ/README.md),
+an example can be found in `torchao/_models/llama/eval.py`.
+
 ### Automatic Inductor Configuration
 
 :warning: <em>This functionality is being migrated from the top level `quantize_` API to individual workflows, see https://github.com/pytorch/ao/issues/1715 for more details.</em>
diff --git a/torchao/quantization/__init__.py b/torchao/quantization/__init__.py
index 15736acc3b..44fc6c8397 100644
--- a/torchao/quantization/__init__.py
+++ b/torchao/quantization/__init__.py
@@ -15,10 +15,8 @@
 )
 from .GPTQ import (
     Int4WeightOnlyGPTQQuantizer,
-    Int4WeightOnlyQuantizer,
-    Int8DynActInt4WeightGPTQQuantizer,
-    Int8DynActInt4WeightLinear,
-    Int8DynActInt4WeightQuantizer,
+    MultiTensor,
+    MultiTensorInputRecorder,
 )
 from .granularity import (
     PerAxis,
@@ -34,6 +32,11 @@
 from .linear_activation_scale import (
     to_weight_tensor_with_linear_activation_scale_metadata,
 )
+from .linear_quant_modules import (
+    Int4WeightOnlyQuantizer,
+    Int8DynActInt4WeightLinear,
+    Int8DynActInt4WeightQuantizer,
+)
 from .observer import (
     AffineQuantizedMinMaxObserver,
     AffineQuantizedObserverBase,
@@ -195,9 +198,7 @@
     "PerRow",
     "PerToken",
     "LinearActivationQuantizedTensor",
-    "Int4WeightOnlyGPTQQuantizer",
     "Int4WeightOnlyQuantizer",
-    "Int8DynActInt4WeightGPTQQuantizer",
     "Int8DynActInt4WeightQuantizer",
     "Int8DynActInt4WeightLinear",
     "WeightOnlyInt8QuantLinear",
@@ -208,4 +209,8 @@
     "TensorCoreTiledLayout",
     "CutlassInt4PackedLayout",
     "Float8MMConfig",
+    # GPTQ
+    "Int4WeightOnlyGPTQQuantizer",
+    "MultiTensor",
+    "MultiTensorInputRecorder",
 ]
diff --git a/torchao/quantization/linear_quant_modules.py b/torchao/quantization/linear_quant_modules.py
new file mode 100644
index 0000000000..73e95036f1
--- /dev/null
+++ b/torchao/quantization/linear_quant_modules.py
@@ -0,0 +1,629 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD-style license found in the
+# LICENSE file in the root directory of this source tree.
+
+
+# This source code is licensed under the license found in the
+# LICENSE file in the root directory of this source tree.
+
+import logging
+from typing import Any, Callable, Dict, Optional, Type
+
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+
+from torchao.dtypes.utils import is_device
+from torchao.utils import (
+    TORCH_VERSION_AT_LEAST_2_6,
+    find_multiple,
+)
+
+from .quant_primitives import (
+    MappingType,
+    dequantize_affine,
+)
+from .unified import Quantizer
+from .utils import (
+    group_quantize_tensor_symmetric,
+    groupwise_affine_quantize_tensor,
+    per_token_dynamic_quant,
+)
+
+aten = torch.ops.aten
+
+__all__ = [
+    "WeightOnlyInt4Linear",
+    "Int4WeightOnlyQuantizer",
+    "Int8DynActInt4WeightQuantizer",
+]
+
+
+def _check_linear_int4_k(k, groupsize=1, inner_k_tiles=None):
+    k_divisible_by_groupsize = k % groupsize == 0
+    if inner_k_tiles is not None:
+        k_divisible_by_16_times_inner_k_tiles = k % (inner_k_tiles * 16) == 0
+        return k_divisible_by_groupsize and k_divisible_by_16_times_inner_k_tiles
+    return k_divisible_by_groupsize
+
+
+def linear_forward_int4(
+    x: torch.Tensor,
+    weight_int4pack: torch.Tensor,
+    scales_and_zeros: torch.Tensor,
+    out_features: int,
+    groupsize: int,
+    precision: torch.dtype = torch.bfloat16,
+    scales_precision: torch.dtype = torch.bfloat16,
+):
+    origin_x_size = x.size()
+    x = x.reshape(-1, origin_x_size[-1])
+    if is_device(x.device.type, "cpu") and TORCH_VERSION_AT_LEAST_2_6:
+        c = torch.ops.aten._weight_int4pack_mm_for_cpu(
+            x.to(precision),
+            weight_int4pack,
+            groupsize,
+            scales_and_zeros.to(scales_precision),
+        ).to(dtype=x.dtype)
+    else:
+        c = torch.ops.aten._weight_int4pack_mm(
+            x.to(precision),
+            weight_int4pack,
+            groupsize,
+            scales_and_zeros.to(scales_precision),
+        ).to(dtype=x.dtype)
+    new_shape = origin_x_size[:-1] + (out_features,)
+    c = c.reshape(new_shape)
+    return c
+
+
+class WeightOnlyInt4Linear(torch.nn.Module):
+    __constants__ = ["in_features", "out_features"]
+    in_features: int
+    out_features: int
+    weight: torch.Tensor
+
+    def __init__(
+        self,
+        in_features: int,
+        out_features: int,
+        # TODO: remove dtype field, not used
+        bias=False,
+        device=None,
+        dtype=None,
+        groupsize: int = 128,
+        inner_k_tiles: int = 8,
+        precision: torch.dtype = torch.bfloat16,
+        scales_precision: torch.dtype = torch.bfloat16,
+    ) -> None:
+        super().__init__()
+        self.padding = not _check_linear_int4_k(in_features, groupsize, inner_k_tiles)
+        if self.padding:
+            self.origin_in_features = in_features
+            in_features = find_multiple(in_features, 1024)
+
+        self.in_features = in_features
+        self.out_features = out_features
+        assert not bias, "require bias=False"
+        self.device = device
+        self.groupsize = groupsize
+        self.inner_k_tiles = inner_k_tiles
+        self.precision = precision
+        self.scales_precision = scales_precision
+
+        if dtype is not None:
+            raise ValueError("Please specify 'precision' instead of 'dtype'")
+
+        assert out_features % 8 == 0, "require out_features % 8 == 0"
+        assert in_features % (inner_k_tiles * 16) == 0, (
+            "require in_features % (innerKTiles * 16) == 0"
+        )
+        if is_device(device.type, "cpu"):
+            self.register_buffer(
+                "weight",
+                torch.zeros(
+                    (
+                        out_features,
+                        in_features // 2,
+                    ),
+                    dtype=torch.uint8,
+                    device=device,
+                ),
+            )
+        else:
+            self.register_buffer(
+                "weight",
+                torch.zeros(
+                    (
+                        out_features // 8,
+                        in_features // (inner_k_tiles * 16),
+                        32,
+                        inner_k_tiles // 2,
+                    ),
+                    dtype=torch.int32,
+                    device=device,
+                ),
+            )
+        self.dtype = dtype
+        self.register_buffer(
+            "scales_and_zeros",
+            torch.zeros(
+                (in_features // groupsize, out_features, 2),
+                dtype=self.scales_precision,
+                device=device,
+            ),
+        )
+
+    def forward(self, input: torch.Tensor) -> torch.Tensor:
+        if self.padding:
+            input = F.pad(input, pad=(0, self.in_features - self.origin_in_features))
+        return linear_forward_int4(
+            input,
+            self.weight,
+            self.scales_and_zeros,
+            self.out_features,
+            self.groupsize,
+            self.precision,
+            self.scales_precision,
+        )
+
+
+def _replace_linear_int4(
+    module: torch.nn.Module,
+    groupsize: int,
+    inner_k_tiles: Optional[int],
+    padding_allowed: bool,
+    skip_layer_func: Optional[Callable] = None,
+    precision: torch.dtype = torch.bfloat16,
+    scales_precision: torch.dtype = torch.bfloat16,
+    linear_class: Type[torch.nn.Module] = WeightOnlyInt4Linear,
+    copy_weights: bool = False,
+):
+    for name, child in module.named_children():
+        # TODO: support linear bias
+        if (
+            isinstance(child, nn.Linear)
+            and child.bias is None
+            and (skip_layer_func is None or not skip_layer_func(child.weight))
+        ):
+            if (
+                _check_linear_int4_k(child.in_features, groupsize, inner_k_tiles)
+                or padding_allowed
+            ):
+                new_linear = linear_class(
+                    child.in_features,
+                    child.out_features,
+                    bias=False,
+                    device=child.weight.device,
+                    groupsize=groupsize,
+                    inner_k_tiles=inner_k_tiles,
+                    precision=precision,
+                    scales_precision=scales_precision,
+                )
+                # TODO: merge with 8da4w?
+                # In distributed training, the model may be instantiated
+                # on the meta device, in which case there is no need to
+                # copy the weights, and doing so will result in an error
+                if copy_weights and child.weight.device != torch.device("meta"):
+                    new_linear.weight = child.weight
+                setattr(module, name, new_linear)
+        else:
+            _replace_linear_int4(
+                child,
+                groupsize,
+                inner_k_tiles,
+                padding_allowed,
+                skip_layer_func,
+                precision,
+                scales_precision,
+                linear_class,
+                copy_weights,
+            )
+
+
+def replace_linear_int4(
+    module, groupsize, inner_k_tiles, padding_allowed, skip_layer_func=None
+):
+    _replace_linear_int4(
+        module,
+        groupsize,
+        inner_k_tiles,
+        padding_allowed,
+        skip_layer_func,
+        linear_class=WeightOnlyInt4Linear,
+    )
+
+
+class Int4WeightOnlyQuantizer(Quantizer):
+    def __init__(
+        self,
+        groupsize: int = 256,
+        padding_allowed: bool = True,
+        inner_k_tiles: Optional[int] = 8,
+        device: torch.device = torch.device("cuda"),
+        precision: torch.dtype = torch.bfloat16,
+    ) -> None:
+        super().__init__()
+        assert inner_k_tiles in [2, 4, 8]
+        assert groupsize in [32, 64, 128, 256]
+
+        self.inner_k_tiles = inner_k_tiles
+        self.groupsize: int = groupsize
+        self.padding_allowed: bool = padding_allowed
+        self.device: torch.device = device
+        # precision and dtype are being used interchangeably here
+        self.precision: torch.dtype = precision
+
+    @torch.no_grad()
+    def _create_quantized_state_dict(
+        self, model: torch.nn.Module
+    ) -> Dict[str, torch.Tensor]:
+        cur_state_dict = model.state_dict()
+        for fqn, mod in model.named_modules():
+            if isinstance(mod, torch.nn.Linear) and mod.bias is None:
+                out_features = mod.out_features
+                in_features = mod.in_features
+                # assert out_features % 8 == 0, "require out_features % 8 == 0"
+                logging.info(f"linear: {fqn}, in={in_features}, out={out_features}")
+
+                assert in_features % self.groupsize == 0, (
+                    f"require in_features:{in_features} % self.groupsize:{self.groupsize} == 0"
+                )
+
+                weight = mod.weight.data
+                if not _check_linear_int4_k(
+                    in_features, self.groupsize, self.inner_k_tiles
+                ):
+                    if self.padding_allowed:
+                        import torch.nn.functional as F
+
+                        logging.warning(
+                            f"warning: {fqn} is padded to satisfy in_features % 1024 == 0"
+                        )
+                        padded_in_features = find_multiple(in_features, 1024)
+                        weight = F.pad(
+                            weight, pad=(0, padded_in_features - in_features)
+                        )
+                    else:
+                        logging.warning(
+                            f"warning: {fqn} is skipped, int4 requires that in_features is 32, 64, or is divisible by 1024, "
+                            + "and that groupsize and inner_k_tiles*16 evenly divide into it"
+                        )
+                        continue
+                (w_int4x8, scales_and_zeros) = groupwise_affine_quantize_tensor(
+                    weight,
+                    4,  # n_bit
+                    self.groupsize,
+                    self.precision,  # dtype for scales_and_zeros
+                )
+                # TODO: just get the device from mod.weight.device?
+                if (
+                    is_device(w_int4x8.device.type, "cpu")
+                    and TORCH_VERSION_AT_LEAST_2_6
+                ):
+                    weight_int4pack = (
+                        torch.ops.aten._convert_weight_to_int4pack_for_cpu(
+                            w_int4x8.to(self.device), self.inner_k_tiles
+                        )
+                    )
+                else:
+                    weight_int4pack = torch.ops.aten._convert_weight_to_int4pack(
+                        w_int4x8.to(self.device), self.inner_k_tiles
+                    )
+                cur_state_dict[f"{fqn}.weight"] = weight_int4pack.to(self.device)
+                cur_state_dict[f"{fqn}.scales_and_zeros"] = scales_and_zeros.to(
+                    self.device
+                )
+        return cur_state_dict
+
+    def _convert_for_runtime(self, model: torch.nn.Module) -> torch.nn.Module:
+        _replace_linear_int4(
+            model,
+            self.groupsize,
+            self.inner_k_tiles,
+            self.padding_allowed,
+            skip_layer_func=None,
+            precision=self.precision,
+            scales_precision=self.precision,
+        )
+        return model
+
+    def quantize(
+        self, model: torch.nn.Module, *args: Any, **kwargs: Any
+    ) -> torch.nn.Module:
+        state_dict = self._create_quantized_state_dict(model)
+        model = self._convert_for_runtime(model)
+        # TODO: make it strict
+        model.load_state_dict(state_dict, strict=False)
+        return model
+
+
+def linear_forward_8da4w(
+    x,
+    weight_int8,
+    bias,
+    scales,
+    zeros,
+    out_features,
+    groupsize,
+    output_precision,
+):
+    # uses fp32 to match torchao.quantization.quant_api._int8_asymm_per_token_quant
+    # and activation_scale_dtype in QAT configs
+    # TODO: in future add ability to specify activation_scale_dtype to PTQ configs
+    # and enable similar change here
+    x = per_token_dynamic_quant(
+        x,
+        scale_dtype=torch.float32,
+        zero_point_dtype=torch.float32,
+        eps=torch.finfo(torch.float32).eps,
+    )
+
+    # TODO: verify and remove following reshape code
+    # origin_x_size = x.size()
+    # x = x.reshape(-1, origin_x_size[-1])
+
+    # TODO: better API
+    # weight_int8 = torch.ops.quantized_decomposed.unpack_int4_to_int8(weight_int4packed)
+    n_bit = 4
+    quant_min = -(2 ** (n_bit - 1))
+    quant_max = 2 ** (n_bit - 1) - 1
+    block_size = (1, groupsize)
+
+    w_dq = dequantize_affine(
+        weight_int8,
+        block_size,
+        scales,
+        zeros,
+        torch.int8,
+        quant_min,
+        quant_max,
+        output_dtype=output_precision,
+    )
+
+    # x = x.to(torch.float16)
+    # w_dq = w_dq.to(torch.float16)
+    c = torch.nn.functional.linear(x, w_dq, bias)
+
+    # new_shape = origin_x_size[:-1] + (out_features,)
+    # c = c.reshape(new_shape)
+
+    return c
+
+
+class Int8DynActInt4WeightLinear(torch.nn.Module):
+    __constants__ = ["in_features", "out_features"]
+
+    in_features: int
+    out_features: int
+    weight: torch.Tensor
+    bias: torch.Tensor
+
+    """
+    This module implements a dynamic quantized linear layer with int4 weight.
+    Weights are per channel groupwise quantized. Parameters of importance
+    groupsize: the number of elements in each quantized group
+    precision: precision of input and output. e.g. torch.float32 means input
+    activation is float32 and output is float32.
+    scales_precision: precision of per group scale.
+    """
+
+    def __init__(
+        self,
+        in_features: int,
+        out_features: int,
+        bias=True,
+        device=None,
+        # TODO: remove this field, not used
+        dtype=None,
+        groupsize: int = 256,
+        precision: torch.dtype = torch.float32,
+        scales_precision: torch.dtype = torch.float32,
+    ) -> None:
+        super().__init__()
+        # always pad if needed since it becomes a noop at runtime if not needed
+        # self.origin_in_features = in_features
+        assert in_features % groupsize == 0, (
+            f"require in_features:{in_features} % groupsize:{groupsize} == 0"
+        )
+        # in_features = _calc_padded_size_linear_int4(
+        #    in_features, groupsize
+        # )
+        self.in_features = in_features
+        self.out_features = out_features
+        # TODO: align groupsize naming
+        self.groupsize = groupsize
+        # Precision of the activation which also indicates
+        # output precision of the dynamically quantized linear layer
+        # that his module represents.
+        self.precision = precision
+
+        if dtype is not None:
+            raise ValueError("Please specify 'precision' instead of 'dtype'")
+
+        # currently storing unpacked int8 weights
+        self.register_buffer(
+            "weight",
+            torch.zeros((out_features, in_features), dtype=torch.int8),
+        )
+        self.register_buffer(
+            "scales",
+            torch.zeros(
+                (out_features, in_features // groupsize),
+                dtype=scales_precision,
+            ),
+        )
+        self.register_buffer(
+            "zeros",
+            torch.zeros(
+                (out_features, in_features // groupsize),
+                dtype=scales_precision,
+            ),
+        )
+
+        if bias:
+            self.register_buffer("bias", torch.zeros(out_features, dtype=precision))
+        else:
+            self.bias = None
+
+    def forward(self, input: torch.Tensor) -> torch.Tensor:
+        input = input.to(self.precision)
+        # padding is removed for perf
+        # input = F.pad(input, pad=(0, self.in_features - self.origin_in_features))
+        return linear_forward_8da4w(
+            input,
+            self.weight,
+            self.bias,
+            self.scales,
+            self.zeros,
+            self.out_features,
+            self.groupsize,
+            self.precision,
+        )
+
+
+def _replace_linear_8da4w(
+    module: torch.nn.Module,
+    groupsize: int,
+    padding_allowed: bool,
+    precision: torch.dtype,
+    scales_precision: torch.dtype,
+    linear_class: Type[torch.nn.Module],
+    copy_weights: bool = False,
+):
+    # import the util function here to avoid circular dependency
+    from torchao.quantization.quant_api import _replace_with_custom_fn_if_matches_filter
+
+    def filter_fn(child: torch.nn.Module, cur_fqn: str) -> bool:
+        return isinstance(child, nn.Linear) and (
+            _check_linear_int4_k(child.in_features, groupsize) or padding_allowed
+        )
+
+    def replacement_fn(child: torch.nn.Module) -> torch.nn.Module:
+        new_linear = linear_class(
+            child.in_features,
+            child.out_features,
+            bias=child.bias is not None,
+            device=child.weight.device,
+            groupsize=groupsize,
+            precision=precision,
+            scales_precision=scales_precision,
+        )
+        # In distributed training, the model may be instantiated
+        # on the meta device, in which case there is no need to
+        # copy the weights, and doing so will result in an error
+        if copy_weights and child.weight.device != torch.device("meta"):
+            new_linear.weight = child.weight
+            new_linear.bias = child.bias
+        return new_linear
+
+    _replace_with_custom_fn_if_matches_filter(module, replacement_fn, filter_fn)
+
+
+def replace_linear_8da4w(
+    module: torch.nn.Module,
+    groupsize: int,
+    padding_allowed: bool,
+    precision: torch.dtype,
+    scales_precision: torch.dtype,
+):
+    _replace_linear_8da4w(
+        module,
+        groupsize,
+        padding_allowed,
+        precision,
+        scales_precision,
+        Int8DynActInt4WeightLinear,
+    )
+
+
+class Int8DynActInt4WeightQuantizer(Quantizer):
+    def __init__(
+        self,
+        groupsize: int = 256,
+        padding_allowed: bool = False,
+        precision: torch.dtype = torch.float32,
+        scales_precision: torch.dtype = torch.float32,
+        device: torch.device = torch.device("cpu"),
+        mapping_type: MappingType = MappingType.SYMMETRIC,
+    ) -> None:
+        super().__init__()
+        self.groupsize: int = groupsize
+        self.padding_allowed: bool = padding_allowed
+        self.precision: torch.dtype = precision
+        self.scales_precision: torch.dtype = scales_precision
+        self.device: torch.device = device
+        self.mapping_type: MappingType = mapping_type
+
+    @torch.no_grad()
+    def _create_quantized_state_dict(
+        self, model: torch.nn.Module
+    ) -> Dict[str, torch.Tensor]:
+        cur_state_dict = model.state_dict()
+        for fqn, mod in model.named_modules():
+            if isinstance(mod, torch.nn.Linear):
+                out_features = mod.out_features
+                in_features = mod.in_features
+                # assert out_features % 8 == 0, "require out_features % 8 == 0"
+                logging.info(f"linear: {fqn}, in={in_features}, out={out_features}")
+
+                assert in_features % self.groupsize == 0, (
+                    f"require in_features:{in_features} % self.groupsize:{self.groupsize} == 0"
+                )
+
+                weight = mod.weight.data
+                if not _check_linear_int4_k(in_features, self.groupsize):
+                    if self.padding_allowed:
+                        import torch.nn.functional as F
+
+                        logging.warning(
+                            f"warning: {fqn} is padded to satisfy in_features % 1024 == 0"
+                        )
+                        padded_in_features = find_multiple(in_features, 1024)
+                        weight = F.pad(
+                            weight, pad=(0, padded_in_features - in_features)
+                        )
+                    else:
+                        logging.warning(
+                            f"warning: {fqn} is skipped, int4 requires that in_features is 32, 64, or is divisible by 1024, "
+                            + "and that groupsize and inner_k_tiles*16 evenly divide into it"
+                        )
+                        continue
+                (
+                    weight_int8,
+                    scales,
+                    zeros,
+                ) = group_quantize_tensor_symmetric(
+                    weight.to(self.precision),
+                    4,  # n_bit
+                    self.groupsize,
+                    self.scales_precision,
+                    mapping_type=self.mapping_type,
+                )
+                cur_state_dict[f"{fqn}.weight"] = weight_int8.to(self.device)
+                cur_state_dict[f"{fqn}.scales"] = scales.to(self.device)
+                cur_state_dict[f"{fqn}.zeros"] = zeros.to(self.device)
+
+        return cur_state_dict
+
+    def _convert_for_runtime(self, model: torch.nn.Module) -> torch.nn.Module:
+        replace_linear_8da4w(
+            model,
+            self.groupsize,
+            self.padding_allowed,
+            self.precision,
+            # TODO: this should be self.scales_precision?
+            self.precision,
+        )
+        return model
+
+    def quantize(
+        self, model: torch.nn.Module, *args: Any, **kwargs: Any
+    ) -> torch.nn.Module:
+        state_dict = self._create_quantized_state_dict(model)
+        model = self._convert_for_runtime(model)
+        # TODO: make it strict
+        model.load_state_dict(state_dict, strict=False)
+        return model
diff --git a/torchao/quantization/qat/linear.py b/torchao/quantization/qat/linear.py
index 7c32bc4b19..bffd5dc31f 100644
--- a/torchao/quantization/qat/linear.py
+++ b/torchao/quantization/qat/linear.py
@@ -10,7 +10,8 @@
 import torch.nn.functional as F
 
 from torchao.dtypes.utils import is_device
-from torchao.quantization.GPTQ import (
+from torchao.quantization.granularity import PerGroup
+from torchao.quantization.linear_quant_modules import (
     Int8DynActInt4WeightLinear,
     WeightOnlyInt4Linear,
     _check_linear_int4_k,
@@ -18,7 +19,6 @@
     _replace_linear_int4,
     groupwise_affine_quantize_tensor,
 )
-from torchao.quantization.granularity import PerGroup
 from torchao.quantization.quant_primitives import (
     TorchAODType,
     ZeroPointDomain,
diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index 37f0cf5bfe..a7eec7e1df 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -85,9 +85,6 @@
 from .autoquant import AutoQuantizableLinearWeight, autoquant
 from .GPTQ import (
     Int4WeightOnlyGPTQQuantizer,
-    Int4WeightOnlyQuantizer,
-    Int8DynActInt4WeightGPTQQuantizer,
-    Int8DynActInt4WeightQuantizer,
 )
 from .granularity import (
     Granularity,
@@ -100,6 +97,10 @@
     LinearActivationQuantizedTensor,
     to_linear_activation_quantized,
 )
+from .linear_quant_modules import (
+    Int4WeightOnlyQuantizer,
+    Int8DynActInt4WeightQuantizer,
+)
 from .qat import (
     intx_quantization_aware_training,
 )
@@ -141,7 +142,6 @@
     "float8_dynamic_activation_float8_weight",
     "float8_static_activation_float8_weight",
     "Int8DynActInt4WeightQuantizer",
-    "Int8DynActInt4WeightGPTQQuantizer",
     "Float8DynamicActivationFloat8SemiSparseWeightConfig",
     "ModuleFqnToConfig",
     "FbgemmConfig",

From a2c5ca19fe51f9e90c4a6c5aad7ab1b7fc403e55 Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Tue, 3 Jun 2025 13:03:46 -0400
Subject: [PATCH 075/165] Removing DocBlock to unblock MXFP4 w/ Unwrap Tensor
 (#2292)

stack-info: PR: https://github.com/pytorch/ao/pull/2292, branch: drisspg/stack/63
---
 torchao/prototype/mx_formats/kernels.py | 13 -------------
 1 file changed, 13 deletions(-)

diff --git a/torchao/prototype/mx_formats/kernels.py b/torchao/prototype/mx_formats/kernels.py
index f643ac3106..eacf0ac5df 100644
--- a/torchao/prototype/mx_formats/kernels.py
+++ b/torchao/prototype/mx_formats/kernels.py
@@ -1394,19 +1394,6 @@ def triton_scale_swizzle(
         BLOCK_ROWS: tl.constexpr,
         BLOCK_COLS: tl.constexpr,
     ):
-        """
-        Rearranges tensor data from row-major to block-scaled swizzle format.
-
-        Args:
-            scale_ptr: Pointer to the input scale tensor
-            scale_rows: Number of rows in the scale tensor
-            scale_cols: Number of columns in the scale tensor
-            output_ptr: Pointer to the output tensor
-            input_row_stride: Stride between rows in the input tensor
-            output_block_stride: Stride between blocks in the output tensor
-            BLOCK_ROWS: Number of rows in a tile (compile-time constant)
-            BLOCK_COLS: Number of columns in a tile (compile-time constant)
-        """
         pid_row = tl.program_id(0)
         pid_col = tl.program_id(1)
 

From 2ef656e2f6ee2d8be833ac52c7383d11ab6c8672 Mon Sep 17 00:00:00 2001
From: andrewor14 <andrewor14@gmail.com>
Date: Tue, 3 Jun 2025 16:44:46 -0400
Subject: [PATCH 076/165] Fix QAT range learning, ensure scales get gradients
 (#2280)

**Summary:** The previous `_GenericFakeQuantized` nulled all
gradients except the ones for the input. This is problematic
for range learning because scales and zero points are now
`nn.Parameters` and actually require gradients. This commit
fixes this by reducing the scope of the `autograd.Function`
to `torch.round` only, so QAT can just call the fake
quantization primitives directly.

Note: Part of the dequantize math currently casts the inputs
and the zero points to int32. However, autograd doesn't work
with integer math and this part of the code path is now
visible to autograd. To make this work, this commit also
removes this dtype cast.

Note: This change means we no longer do cachemask and so
our numerics no longer matches those of pytorch/pytorch's
fake quantization ops.

**Test Plan:**
Updated the following test to check for scales and weights
being updated:

python test/quantization/test_qat.py -k test_qat_range_learning
---
 test/quantization/test_qat.py                 | 63 +++++---------
 .../qat/affine_fake_quantized_tensor.py       | 11 +--
 torchao/quantization/qat/fake_quantizer.py    |  2 +-
 torchao/quantization/qat/utils.py             | 83 +++----------------
 torchao/quantization/quant_primitives.py      | 41 +++++----
 5 files changed, 65 insertions(+), 135 deletions(-)

diff --git a/test/quantization/test_qat.py b/test/quantization/test_qat.py
index 3b32f870c4..cbe279c12e 100644
--- a/test/quantization/test_qat.py
+++ b/test/quantization/test_qat.py
@@ -49,7 +49,6 @@
 from torchao.quantization.qat.utils import (
     _fake_quantize_per_channel_group,
     _fake_quantize_per_token,
-    _GenericFakeQuantize,
     _get_qmin_qmax,
 )
 from torchao.quantization.quant_api import (
@@ -585,42 +584,6 @@ def test_qat_8da4w_quantizer_gradients(self):
         quantizer = Int8DynActInt4WeightQATQuantizer(groupsize=16)
         self._test_qat_quantized_gradients(quantizer)
 
-    @unittest.skipIf(
-        not TORCH_VERSION_AT_LEAST_2_4, "skipping when torch version is 2.4 or lower"
-    )
-    def test_qat_generic_fake_quantize(self):
-        """
-        Test that the generic fake quantize used in 8da4w QAT matches
-        the numerics of existing fake quantize ops in Pytorch in both
-        the forward and the backward passes.
-        """
-        (qmin, qmax) = _get_qmin_qmax(4)
-        py_input = torch.randn(16, 64).float().requires_grad_()
-        py_s = torch.randn(16).float()
-        py_zp = torch.randint(qmax, size=(16,), dtype=torch.int32)
-        py_out = torch.fake_quantize_per_channel_affine(
-            py_input, py_s, py_zp, 0, qmin, qmax
-        )
-        py_out.sum().backward()
-
-        ao_input = copy.deepcopy(py_input)
-        ao_input.grad.data.zero_()
-        block_size = (1, ao_input.shape[-1])
-        ao_s = copy.deepcopy(py_s)
-        ao_zp = copy.deepcopy(py_zp)
-        ao_out = _GenericFakeQuantize.apply(
-            ao_input, block_size, ao_s, ao_zp, qmin, qmax
-        )
-        ao_out.sum().backward()
-
-        torch.testing.assert_close(py_out, ao_out, atol=0, rtol=0)
-
-        # Test that gradients are close enough
-        num_grads = py_input.grad.numel()
-        num_equal_grads = torch.eq(py_input.grad, ao_input.grad).flatten().sum().item()
-        num_equal_grad_threshold = 0.8
-        self.assertGreaterEqual(num_equal_grads / num_grads, num_equal_grad_threshold)
-
     def _assert_close_4w(self, val, ref):
         # Note: for int4 weight-only quantization, we do not expect exact match
         # because torch._weight_int4pack_mm and torch.mm do not match exactly.
@@ -1700,16 +1663,30 @@ def test_qat_range_learning(self):
         m(*example_inputs)
 
         # Simulate training
+        num_steps = 10
         optimizer = torch.optim.SGD(
             m.parameters(), lr=0.001, momentum=0.9, weight_decay=1e-5
         )
         loss_fn = torch.nn.CrossEntropyLoss()
-        target = torch.randn(1, 512).float()
-        out = m(*example_inputs)
-        loss = loss_fn(out, target)
-        optimizer.zero_grad()
-        loss.backward()
-        optimizer.step()
+        for i in range(num_steps):
+            prev_scale = copy.deepcopy(m.linear1.weight_fake_quantizer.scale)
+            prev_weight = copy.deepcopy(m.linear1.weight)
+            optimizer.zero_grad()
+            target = torch.randn(1, 512).float()
+            out = m(*example_inputs)
+            loss = loss_fn(out, target)
+            loss.backward()
+            optimizer.step()
+            # Assert that scales have valid gradients and are being updated
+            new_scale = m.linear1.weight_fake_quantizer.scale
+            self.assertIsNotNone(new_scale.grad)
+            self.assertNotEqual(torch.count_nonzero(new_scale.grad), 0)
+            self.assertFalse(torch.equal(new_scale, prev_scale))
+            # Assert that weights have valid gradients and are being updated
+            new_weight = m.linear1.weight
+            self.assertIsNotNone(new_weight.grad)
+            self.assertNotEqual(torch.count_nonzero(new_weight.grad), 0)
+            self.assertFalse(torch.equal(new_weight, prev_weight))
 
 
 if __name__ == "__main__":
diff --git a/torchao/quantization/qat/affine_fake_quantized_tensor.py b/torchao/quantization/qat/affine_fake_quantized_tensor.py
index fe26369c31..6896588971 100644
--- a/torchao/quantization/qat/affine_fake_quantized_tensor.py
+++ b/torchao/quantization/qat/affine_fake_quantized_tensor.py
@@ -16,11 +16,11 @@
     choose_qparams_affine,
     choose_qparams_affine_dont_preserve_zero,
     choose_qparams_affine_tinygemm,
+    fake_quantize_affine,
 )
 from torchao.utils import TorchAOBaseTensor
 
 from .utils import (
-    _GenericFakeQuantize,
     _UnwrapAffineFakeQuantizedTensor,
 )
 
@@ -90,14 +90,15 @@ def apply_fake_quant_fn(t: torch.Tensor):
                     scale_dtype,
                     zero_point_dtype,
                 )
-            fq = _GenericFakeQuantize.apply(
+            fq = fake_quantize_affine(
                 t,
                 block_size,
                 scale,
                 zero_point,
-                qmin,
-                qmax,
-                zero_point_domain,
+                quant_dtype=torch.int32,
+                quant_min=qmin,
+                quant_max=qmax,
+                zero_point_domain=zero_point_domain,
             )
             return fq
 
diff --git a/torchao/quantization/qat/fake_quantizer.py b/torchao/quantization/qat/fake_quantizer.py
index 90206b5d6e..aca0c032bb 100644
--- a/torchao/quantization/qat/fake_quantizer.py
+++ b/torchao/quantization/qat/fake_quantizer.py
@@ -17,6 +17,7 @@
     _DTYPE_TO_BIT_WIDTH,
     _DTYPE_TO_QVALUE_BOUNDS,
     MappingType,
+    _Round,
     choose_qparams_affine,
 )
 from torchao.quantization.utils import (
@@ -31,7 +32,6 @@
 from .utils import (
     _fake_quantize_per_channel_group,
     _fake_quantize_per_token,
-    _Round,
 )
 
 
diff --git a/torchao/quantization/qat/utils.py b/torchao/quantization/qat/utils.py
index 71e9a96ec5..01818ef2b2 100644
--- a/torchao/quantization/qat/utils.py
+++ b/torchao/quantization/qat/utils.py
@@ -4,68 +4,19 @@
 # This source code is licensed under the license found in the
 # LICENSE file in the root directory of this source tree.
 
-from typing import List
 
 import torch
 
 from torchao.quantization.quant_primitives import (
     ZeroPointDomain,
-    fake_quantize_affine_cachemask,
+    fake_quantize_affine,
 )
 from torchao.quantization.utils import (
     _get_per_token_block_size,
 )
 
 
-class _GenericFakeQuantize(torch.autograd.Function):
-    """
-    Implementation of generic fake quantize with backward STE.
-
-    With the appropriate input tensor shape, this can be used to express
-    grouped per channel fake quantize or per token fake quantize.
-    """
-
-    @staticmethod
-    def forward(
-        ctx: torch.autograd.function.FunctionCtx,
-        input: torch.Tensor,
-        block_size: List[int],
-        scales: torch.Tensor,
-        zero_points: torch.Tensor,
-        quant_min: int,
-        quant_max: int,
-        zero_point_domain: ZeroPointDomain = ZeroPointDomain.INT,
-    ) -> torch.Tensor:
-        # avoid circular dependencies
-        from torchao.quantization.qat.affine_fake_quantized_tensor import (
-            AffineFakeQuantizedTensor,
-        )
-
-        if isinstance(input, AffineFakeQuantizedTensor):
-            _input = input.original_tensor
-        else:
-            _input = input
-
-        (fq, mask) = fake_quantize_affine_cachemask(
-            _input,
-            block_size,
-            scales,
-            zero_points,
-            torch.int32,
-            quant_min,
-            quant_max,
-            zero_point_domain,
-        )
-
-        ctx.save_for_backward(mask)
-        return fq
-
-    @staticmethod
-    def backward(ctx, gy):
-        (mask,) = ctx.saved_tensors
-        return gy * mask, None, None, None, None, None, None
-
-
+# TODO: delete?
 class _UnwrapAffineFakeQuantizedTensor(torch.autograd.Function):
     """
     Helper autograd function to unwrap `AffineFakeQuantizedTensor` while ensuring
@@ -91,20 +42,6 @@ def backward(ctx, gy):
         return (gy,)
 
 
-class _Round(torch.autograd.Function):
-    """
-    Implementation of generic round operation with backward STE.
-    """
-
-    @staticmethod
-    def forward(ctx, x: torch.Tensor) -> torch.Tensor:
-        return torch.round(x)
-
-    @staticmethod
-    def backward(ctx, gy: torch.Tensor) -> torch.Tensor:
-        return gy
-
-
 def _fake_quantize_per_channel_group(
     input: torch.Tensor,
     scales: torch.Tensor,
@@ -118,14 +55,15 @@ def _fake_quantize_per_channel_group(
     assert input.shape[-1] % group_size == 0
     assert input.dim() == 2
     block_size = (1, group_size)
-    return _GenericFakeQuantize.apply(
+    return fake_quantize_affine(
         input,
         block_size,
         scales,
         zero_points,
-        quant_min,
-        quant_max,
-        zero_point_domain,
+        quant_dtype=torch.int32,
+        quant_min=quant_min,
+        quant_max=quant_max,
+        zero_point_domain=zero_point_domain,
     )
 
 
@@ -140,13 +78,14 @@ def _fake_quantize_per_token(
 
     _per_token_quant_qparam_dim_check(input, scales, zero_points)
     block_size = _get_per_token_block_size(input)
-    fq = _GenericFakeQuantize.apply(
+    fq = fake_quantize_affine(
         input,
         block_size,
         scales,
         zero_points,
-        quant_min,
-        quant_max,
+        quant_dtype=torch.int32,
+        quant_min=quant_min,
+        quant_max=quant_max,
     )
     return fq.reshape_as(input).to(input.dtype)
 
diff --git a/torchao/quantization/quant_primitives.py b/torchao/quantization/quant_primitives.py
index cee8df21a2..de9a1ef4a7 100644
--- a/torchao/quantization/quant_primitives.py
+++ b/torchao/quantization/quant_primitives.py
@@ -212,6 +212,20 @@ class TorchAODType(Enum):
 register_custom_op = _register_custom_op(quant_lib)
 
 
+class _Round(torch.autograd.Function):
+    """
+    Implementation of generic round operation with backward STE.
+    """
+
+    @staticmethod
+    def forward(ctx, x: torch.Tensor) -> torch.Tensor:
+        return torch.round(x)
+
+    @staticmethod
+    def backward(ctx, gy: torch.Tensor) -> torch.Tensor:
+        return gy
+
+
 # TODO: decide on if we want to allow custom quant_min/quant_max here
 def _get_and_check_qmin_qmax(dtype, quant_min, quant_max):
     """Get quant_min and quant_max args based on dtype and also
@@ -407,7 +421,7 @@ def _quantize_affine_no_dtype_cast(
         zero_point = None
 
     quant = torch.clamp(
-        torch.round(input * (1.0 / scale)) + zero_point, quant_min, quant_max
+        _Round.apply(input * (1.0 / scale)) + zero_point, quant_min, quant_max
     )
     quant = quant.view(original_shape)
 
@@ -493,7 +507,7 @@ def _quantize_affine_float_zero_point_no_dtype_cast(
 
     mid_point = (quant_max + quant_min + 1) / 2
     min_val = zero_point - scale * mid_point
-    quant = torch.clamp(torch.round((input - min_val) / scale), quant_min, quant_max)
+    quant = torch.clamp(_Round.apply((input - min_val) / scale), quant_min, quant_max)
     quant = quant.view(original_shape)
 
     return quant
@@ -577,7 +591,7 @@ def _quantize_affine_no_zero_point_no_dtype_cast(
         # with numel=0 which we handle by unifying the two
         zero_point = None
 
-    quant = torch.clamp(torch.round(input * (1.0 / scale)), quant_min, quant_max)
+    quant = torch.clamp(_Round.apply(input * (1.0 / scale)), quant_min, quant_max)
     quant = quant.view(original_shape)
 
     return quant
@@ -692,10 +706,9 @@ def _dequantize_affine_no_dtype_check(
 
     # Force a copy to avoid input modification due
     # to upcoming in-place operations.
-    dequant = input.to(torch.int32, copy=True)
+    dequant = input.to(output_dtype, copy=True)
     if zero_point is not None:
-        dequant = dequant - zero_point.to(torch.int32)
-    dequant = dequant.to(output_dtype)
+        dequant = dequant - zero_point.to(output_dtype)
     dequant = dequant * scale
 
     return dequant.view(original_shape).to(output_dtype)
@@ -1202,7 +1215,7 @@ def choose_qparams_affine_dont_preserve_zero(
     scale = (max_val_pos - min_val_neg) / float(quant_max - quant_min)
     scale = torch.clamp(scale, min=eps)
     # Zero point is int
-    zero_point = quant_min - torch.round(min_val_neg / scale)
+    zero_point = quant_min - _Round.apply(min_val_neg / scale)
     zero_point = torch.clamp(zero_point, quant_min, quant_max)
     if zero_point_dtype is None:
         zero_point_dtype = torch.int32
@@ -1308,7 +1321,7 @@ def choose_qparams_affine_with_min_max(
         if zero_point_domain == ZeroPointDomain.NONE:
             zero_point = None
         elif zero_point_domain == ZeroPointDomain.INT:
-            zero_point = quant_min - torch.round(min_val_neg / scale)
+            zero_point = quant_min - _Round.apply(min_val_neg / scale)
             zero_point = torch.clamp(zero_point, quant_min, quant_max)
             if zero_point_dtype is None:
                 zero_point_dtype = torch.int32
@@ -1400,7 +1413,7 @@ def _choose_qparams_affine(
         assert mapping_type == MappingType.ASYMMETRIC.name
         scale = (max_val_pos - min_val_neg) / float(quant_max - quant_min)
         scale = torch.clamp(scale, min=eps)
-        zero_point = quant_min - torch.round(min_val_neg / scale)
+        zero_point = quant_min - _Round.apply(min_val_neg / scale)
         zero_point = torch.clamp(zero_point, quant_min, quant_max)
         if zero_point_dtype is None:
             zero_point_dtype = torch.int32
@@ -1434,7 +1447,7 @@ def choose_qparams_and_quantize_affine_qqq(
         s_group *= 2 / max_q_val  # 2 => symmetric
 
         # Quantize
-        q_w = torch.round(w / s_group).int()
+        q_w = _Round.apply(w / s_group).int()
         q_w += half_q_val
         q_w = torch.clamp(q_w, 0, max_q_val)
         # Compute ref (dequantized)
@@ -1467,7 +1480,7 @@ def reshape_w(w):
         s_channel /= max_q_val
 
         # Quantize
-        q_w = torch.round(w / s_channel).int()
+        q_w = _Round.apply(w / s_channel).int()
         q_w = torch.clamp(q_w, -max_q_val, max_q_val)
         # Compute ref (dequantized)
         w_ref = q_w.half() * s_channel
@@ -1871,7 +1884,7 @@ def choose_qparams_and_quantize_affine_hqq(
 
     # Round zero as in: https://github.com/casper-hansen/AutoAWQ/blob/main/awq/quantize/quantizer.py#L42C9-L42C14
     if nbits in [4]:
-        zero = torch.round(zero)
+        zero = _Round.apply(zero)
 
     # Fine-tune weights
     if optimize:
@@ -1887,7 +1900,7 @@ def choose_qparams_and_quantize_affine_hqq(
     else:
         zero = zero.to(compute_dtype)
         scale = scale.to(compute_dtype)
-        W_q = torch.round(W * scale + zero).clamp(min_max[0], min_max[1])
+        W_q = _Round.apply(W * scale + zero).clamp(min_max[0], min_max[1])
 
     # Store meta-data (we invert the scale for dequantization)
     scale = 1.0 / scale
@@ -2004,7 +2017,7 @@ def choose_qparams_affine_float8(
     if scale_dtype is not torch.float32:
         # Shielding for Version > 2.8
         assert scale_dtype is torch.float8_e8m0fnu, "Only float8_e8m0fnuz is supported"
-        scale = torch.exp2(torch.round(torch.log2(scale)))
+        scale = torch.exp2(_Round.apply(torch.log2(scale)))
     return scale.to(dtype=torch.float32)
 
 
From 4610850b492ee462c226e085f1293e6b1a4c3819 Mon Sep 17 00:00:00 2001
From: Zeyu Song <87307087+szyszyzys@users.noreply.github.com>
Date: Tue, 3 Jun 2025 13:44:57 -0700
Subject: [PATCH 077/165] Remove valpacking code and associated tests (#2295)

---
 .../kernels/cpu/aarch64/tests/CMakeLists.txt  |   9 --
 .../cpu/aarch64/tests/build_and_run_tests.sh  |   1 -
 .../cpu/aarch64/tests/test_valpacking.cpp     | 100 ------------------
 3 files changed, 110 deletions(-)
 delete mode 100644 torchao/experimental/kernels/cpu/aarch64/tests/test_valpacking.cpp

diff --git a/torchao/experimental/kernels/cpu/aarch64/tests/CMakeLists.txt b/torchao/experimental/kernels/cpu/aarch64/tests/CMakeLists.txt
index db736d84a3..1fd2828fc5 100644
--- a/torchao/experimental/kernels/cpu/aarch64/tests/CMakeLists.txt
+++ b/torchao/experimental/kernels/cpu/aarch64/tests/CMakeLists.txt
@@ -31,7 +31,6 @@ add_library(
   ${TORCHAO_LIBRARIES}/torchao/experimental/kernels/cpu/aarch64/reduction/find_min_and_max.cpp
   ${TORCHAO_LIBRARIES}/torchao/experimental/kernels/cpu/aarch64/reduction/compute_sum.cpp
   ${TORCHAO_LIBRARIES}/torchao/experimental/kernels/cpu/aarch64/quantization/quantize.cpp
-  ${TORCHAO_LIBRARIES}/torchao/experimental/kernels/cpu/aarch64/valpacking/interleave.cpp
 )
 
 if(NOT TORCHAO_INCLUDE_DIRS)
@@ -96,13 +95,6 @@ target_link_libraries(
     torchao_kernels_aarch64
 )
 
-add_executable(test_valpacking test_valpacking.cpp)
-target_link_libraries(
-  test_valpacking
-    PRIVATE
-    GTest::gtest_main
-    dep
-)
 
 add_executable(test_embedding test_embedding.cpp)
 target_link_libraries(
@@ -133,7 +125,6 @@ gtest_discover_tests(test_quantization)
 gtest_discover_tests(test_reduction)
 gtest_discover_tests(test_bitpacking)
 gtest_discover_tests(test_linear)
-gtest_discover_tests(test_valpacking)
 gtest_discover_tests(test_embedding)
 gtest_discover_tests(test_weight_packing)
 gtest_discover_tests(test_qmatmul)
diff --git a/torchao/experimental/kernels/cpu/aarch64/tests/build_and_run_tests.sh b/torchao/experimental/kernels/cpu/aarch64/tests/build_and_run_tests.sh
index 1898e8b535..5d28ea01cc 100644
--- a/torchao/experimental/kernels/cpu/aarch64/tests/build_and_run_tests.sh
+++ b/torchao/experimental/kernels/cpu/aarch64/tests/build_and_run_tests.sh
@@ -58,7 +58,6 @@ ${CMAKE_OUT}/test_quantization
 ${CMAKE_OUT}/test_reduction
 ${CMAKE_OUT}/test_bitpacking
 ${CMAKE_OUT}/test_linear
-${CMAKE_OUT}/test_valpacking
 ${CMAKE_OUT}/test_embedding
 ${CMAKE_OUT}/test_weight_packing
 ${CMAKE_OUT}/test_qmatmul
diff --git a/torchao/experimental/kernels/cpu/aarch64/tests/test_valpacking.cpp b/torchao/experimental/kernels/cpu/aarch64/tests/test_valpacking.cpp
deleted file mode 100644
index 02be12a675..0000000000
--- a/torchao/experimental/kernels/cpu/aarch64/tests/test_valpacking.cpp
+++ /dev/null
@@ -1,100 +0,0 @@
-// Copyright (c) Meta Platforms, Inc. and affiliates.
-// All rights reserved.
-//
-// This source code is licensed under the license found in the
-// LICENSE file in the root directory of this source tree.
-
-#include <gtest/gtest.h>
-#include <torchao/experimental/kernels/cpu/aarch64/valpacking/valpack.h>
-#include <cassert>
-
-TEST(InterleaveDataTest, InterleaveChannels) {
-  // interleave 4 rows of 6 elements
-  int bytes_per_val = 4; // int32_t
-  int vals_per_channel = 6;
-  int vals_per_group = 6;
-  int vals_per_chunk = 3;
-  int channels = 4;
-  int channel_stride_in_vals = vals_per_channel;
-
-  int data_size = channels * vals_per_channel;
-  assert(data_size == 24);
-  int32_t data[data_size];
-  int32_t data_interleaved[data_size];
-  for (int i = 0; i < data_size; i++) {
-    data[i] = i;
-    data_interleaved[i] = 0;
-  }
-  int32_t expected_data_interleaved[] = {0,  1,  2,  6,  7,  8,  12, 13,
-                                         14, 18, 19, 20, 3,  4,  5,  9,
-                                         10, 11, 15, 16, 17, 21, 22, 23};
-
-  torchao::kernels::cpu::valpacking::interleave_data(
-      data_interleaved,
-      data,
-      bytes_per_val,
-      vals_per_channel,
-      vals_per_group,
-      vals_per_chunk,
-      channels,
-      channel_stride_in_vals);
-
-  for (int i = 0; i < data_size; ++i) {
-    EXPECT_EQ(data_interleaved[i], expected_data_interleaved[i]);
-  }
-}
-
-TEST(InterleaveDataTest, InterleaveChannelsAndGroups) {
-  // Test this example:
-  //
-  //  group0                  group1                  group2
-  //  chunk0      chunk1      chunk0      chunk1      chunk0      chunk1
-  // [(v00, v01 | v02, v03) | (v04, v05 | v06, v07) | (v08, v09 | v0a, v0b)] ch0
-  // [(v10, v11 | v12, v13) | (v14, v15 | v16, v17) | (v18, v19 | v1a, v1b)] ch1
-  // [(v20, v21 | v22, v23) | (v24, v25 | v26, v27) | (v28, v29 | v2a, v2b)] ch2
-  // [(v30, v31 | v32, v33) | (v34, v35 | v36, v37) | (v38, v39 | v3a, v3b)] ch3
-  //
-  // The output of this method is:
-  //
-  // v00, v01 | v10, v11 | v20, v21 | v30, v31 // chunk0, group0 channels
-  // v04, v05 | v14, v15 | v24, v25 | v34, v35 // chunk0, group1 channels
-  // v08, v09 | v18, v19 | v28, v29 | v38, v39 // chunk0, group2 channels
-  // v02, v03 | v12, v13 | v22, v23 | v32, v33 // chunk1, group0 channels
-  // v06, v07 | v16, v17 | v26, v27 | v36, v37 // chunk1, group1 channels
-  // v0a, v0b | v1a, v1b | v2a, v2b | v3a, v3b // chunk1, group2 channels
-
-  // interleave 4 rows of 6 elements
-  int bytes_per_val = 4; // int32_t
-  int vals_per_channel = 12;
-  int vals_per_group = 4;
-  int vals_per_chunk = 2;
-  int channels = 4;
-  int channel_stride_in_vals = vals_per_channel;
-
-  int data_size = channels * vals_per_channel;
-  assert(data_size == 48);
-  int32_t data[data_size];
-  int32_t data_interleaved[data_size];
-  for (int i = 0; i < data_size; i++) {
-    data[i] = i;
-    data_interleaved[i] = 0;
-  }
-  int32_t expected_data_interleaved[] = {
-      0, 1, 12, 13, 24, 25, 36, 37, 4,  5,  16, 17, 28, 29, 40, 41,
-      8, 9, 20, 21, 32, 33, 44, 45, 2,  3,  14, 15, 26, 27, 38, 39,
-      6, 7, 18, 19, 30, 31, 42, 43, 10, 11, 22, 23, 34, 35, 46, 47};
-
-  torchao::kernels::cpu::valpacking::interleave_data(
-      data_interleaved,
-      data,
-      bytes_per_val,
-      vals_per_channel,
-      vals_per_group,
-      vals_per_chunk,
-      channels,
-      channel_stride_in_vals);
-
-  for (int i = 0; i < data_size; ++i) {
-    EXPECT_EQ(data_interleaved[i], expected_data_interleaved[i]);
-  }
-}

From bc68b11f1bf77be38721ca7dd2c477aeb5e6626e Mon Sep 17 00:00:00 2001
From: Scott Roy <161522778+metascroy@users.noreply.github.com>
Date: Tue, 3 Jun 2025 15:02:08 -0700
Subject: [PATCH 078/165] Define torchao op library by srcs instead of object
 libraries (#2290)

* init

* up

* up

* up

* up

* up

* up

* up

* up
---
 torchao/experimental/CMakeLists.txt           | 89 ++++++++++++++-----
 .../ops/embedding_xbit/CMakeLists.txt         | 46 ----------
 .../CMakeLists.txt                            | 65 --------------
 3 files changed, 67 insertions(+), 133 deletions(-)
 delete mode 100644 torchao/experimental/ops/embedding_xbit/CMakeLists.txt
 delete mode 100644 torchao/experimental/ops/linear_8bit_act_xbit_weight/CMakeLists.txt

diff --git a/torchao/experimental/CMakeLists.txt b/torchao/experimental/CMakeLists.txt
index 2222ea60b9..7313a37e56 100644
--- a/torchao/experimental/CMakeLists.txt
+++ b/torchao/experimental/CMakeLists.txt
@@ -36,9 +36,13 @@ endif()
 add_compile_options("-Wall" "-Werror" "-Wno-deprecated" "-Wno-shorten-64-to-32")
 
 include(CMakePrintHelpers)
+include(${CMAKE_CURRENT_SOURCE_DIR}/Utils.cmake)
+
 message("TORCHAO_INCLUDE_DIRS: ${TORCHAO_INCLUDE_DIRS}")
 include_directories(${TORCHAO_INCLUDE_DIRS})
 
+
+# Build cpu/aarch64 kernels
 if(TORCHAO_BUILD_CPU_AARCH64)
     message(STATUS "Building with cpu/aarch64")
     add_compile_definitions(TORCHAO_BUILD_CPU_AARCH64)
@@ -77,29 +81,50 @@ if(TORCHAO_BUILD_CPU_AARCH64)
         add_compile_definitions(TORCHAO_ENABLE_ARM_I8MM)
     endif()
 
-    # Defines torchao_kernels_aarch64
-    add_subdirectory(kernels/cpu/aarch64)
-
     if(TORCHAO_BUILD_KLEIDIAI)
         message(STATUS "Building with Arm KleidiAI library")
         add_compile_definitions(TORCHAO_ENABLE_KLEIDI)
     endif()
+
+    # Defines torchao_kernels_aarch64
+    add_subdirectory(kernels/cpu/aarch64)
 endif()
 
-# Add quantized operation dir
-add_subdirectory(ops/linear_8bit_act_xbit_weight)
-add_subdirectory(ops/embedding_xbit)
-
-# ATen ops lib
-if (TORCHAO_BUILD_ATEN_OPS)
-    add_library(torchao_ops_aten SHARED)
-    target_link_libraries(
-        torchao_ops_aten PRIVATE
-        torchao_ops_linear_8bit_act_xbit_weight_aten
-        torchao_ops_embedding_xbit_aten
+
+
+if (NOT TARGET cpuinfo)
+    # For some reason cpuinfo package has unused functions/variables
+    # TODO (T215533422): fix upstream
+    add_compile_options(-Wno-unused-function -Wno-unused-variable)
+    include(FetchContent)
+    FetchContent_Declare(cpuinfo
+        GIT_REPOSITORY https://github.com/pytorch/cpuinfo.git
+        GIT_TAG c61fe919607bbc534d7a5a5707bdd7041e72c5ff)
+    FetchContent_MakeAvailable(
+        cpuinfo)
+endif()
+
+# Build ATen ops
+if(TORCHAO_BUILD_ATEN_OPS)
+    find_package(Torch REQUIRED)
+    set(_torchao_op_srcs_aten)
+    list(APPEND _torchao_op_srcs_aten
+        ops/embedding_xbit/op_embedding_xbit_aten.cpp
+        ops/linear_8bit_act_xbit_weight/linear_8bit_act_xbit_weight.cpp
+        ops/linear_8bit_act_xbit_weight/op_linear_8bit_act_xbit_weight_aten.cpp
     )
+    list(TRANSFORM _torchao_op_srcs_aten PREPEND "${CMAKE_CURRENT_SOURCE_DIR}/")
+    add_library(torchao_ops_aten SHARED ${_torchao_op_srcs_aten})
+    target_link_torchao_parallel_backend(torchao_ops_aten "${TORCHAO_PARALLEL_BACKEND}")
+    if (TORCHAO_BUILD_CPU_AARCH64)
+        target_link_libraries(torchao_ops_aten PRIVATE torchao_kernels_aarch64)
+    endif()
+    target_link_libraries(torchao_ops_aten PRIVATE cpuinfo)
+    target_include_directories(torchao_ops_aten PRIVATE "${TORCH_INCLUDE_DIRS}")
+    target_link_libraries(torchao_ops_aten PRIVATE "${TORCH_LIBRARIES}")
+    target_compile_definitions(torchao_ops_aten PRIVATE USE_ATEN=1)
 
-    # Add MPS support if enabled
+     # Add MPS support if enabled
     if (TORCHAO_BUILD_MPS_OPS)
         message(STATUS "Building with MPS support")
         add_subdirectory(ops/mps)
@@ -114,18 +139,38 @@ if (TORCHAO_BUILD_ATEN_OPS)
     )
 endif()
 
-# Build executorch lib if enabled
+
+# Build ExecuTorch ops
 if(TORCHAO_BUILD_EXECUTORCH_OPS)
-    add_library(torchao_ops_executorch STATIC)
-    target_link_libraries(torchao_ops_executorch PRIVATE
-        torchao_ops_linear_8bit_act_xbit_weight_executorch
-        torchao_ops_embedding_xbit_executorch
+    # ExecuTorch package is not required, but EXECUTORCH_INCLUDE_DIRS and EXECUTORCH_LIBRARIES must
+    # be defined and EXECUTORCH_LIBRARIES must include the following libraries installed by ExecuTorch:
+    # libexecutorch.a
+    # libextension_threadpool.a
+    # libcpuinfo.a
+    # libpthreadpool.a
+    if(NOT DEFINED EXECUTORCH_INCLUDE_DIRS AND NOT DEFINED EXECUTORCH_LIBRARIES)
+        message(WARNING "EXECUTORCH_INCLUDE_DIRS and EXECUTORCH_LIBRARIES are not defined. Looking for ExecuTorch.")
+        find_package(ExecuTorch HINTS ${CMAKE_PREFIX_PATH}/executorch/share/cmake)
+    endif()
+    set(_torchao_op_srcs_executorch)
+    list(APPEND _torchao_op_srcs_executorch
+        ops/embedding_xbit/op_embedding_xbit_executorch.cpp
+        ops/linear_8bit_act_xbit_weight/linear_8bit_act_xbit_weight.cpp
+        ops/linear_8bit_act_xbit_weight/op_linear_8bit_act_xbit_weight_executorch.cpp
     )
+    list(TRANSFORM _torchao_op_srcs_executorch PREPEND "${CMAKE_CURRENT_SOURCE_DIR}/")
+    add_library(torchao_ops_executorch STATIC ${_torchao_op_srcs_executorch})
+    target_link_torchao_parallel_backend(torchao_ops_executorch executorch)
+    target_include_directories(torchao_ops_executorch PRIVATE "${EXECUTORCH_INCLUDE_DIRS}")
+    target_compile_definitions(torchao_ops_executorch PRIVATE USE_EXECUTORCH=1)
+    target_link_libraries(torchao_ops_executorch PRIVATE "${EXECUTORCH_LIBRARIES}")
+    if (TORCHAO_BUILD_CPU_AARCH64)
+        target_link_libraries(torchao_ops_executorch PRIVATE torchao_kernels_aarch64)
+    endif()
+    target_link_libraries(torchao_ops_executorch PRIVATE cpuinfo)
     install(
         TARGETS
             torchao_ops_executorch
-            torchao_ops_linear_8bit_act_xbit_weight_executorch
-            torchao_ops_embedding_xbit_executorch
         EXPORT _targets
         DESTINATION lib
     )
diff --git a/torchao/experimental/ops/embedding_xbit/CMakeLists.txt b/torchao/experimental/ops/embedding_xbit/CMakeLists.txt
deleted file mode 100644
index c681a44dc9..0000000000
--- a/torchao/experimental/ops/embedding_xbit/CMakeLists.txt
+++ /dev/null
@@ -1,46 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the license found in the
-# LICENSE file in the root directory of this source tree.
-
-cmake_minimum_required(VERSION 3.19)
-
-include(${CMAKE_CURRENT_SOURCE_DIR}/../../Utils.cmake)
-
-if(TORCHAO_BUILD_ATEN_OPS)
-    find_package(Torch REQUIRED)
-    add_library(torchao_ops_embedding_xbit_aten OBJECT
-        op_embedding_xbit_aten.cpp
-    )
-    target_link_torchao_parallel_backend(torchao_ops_embedding_xbit_aten "${TORCHAO_PARALLEL_BACKEND}")
-    if (TORCHAO_BUILD_CPU_AARCH64)
-        target_link_libraries(torchao_ops_embedding_xbit_aten PRIVATE torchao_kernels_aarch64)
-    endif()
-    target_include_directories(torchao_ops_embedding_xbit_aten PRIVATE "${TORCH_INCLUDE_DIRS}")
-    target_link_libraries(torchao_ops_embedding_xbit_aten PRIVATE "${TORCH_LIBRARIES}")
-    target_compile_definitions(torchao_ops_embedding_xbit_aten PRIVATE USE_ATEN=1)
-endif()
-
-if(TORCHAO_BUILD_EXECUTORCH_OPS)
-    # ExecuTorch package is not required, but EXECUTORCH_INCLUDE_DIRS and EXECUTORCH_LIBRARIES must
-    # be defined and EXECUTORCH_LIBRARIES must include the following libraries installed by ExecuTorch:
-    # libexecutorch.a
-    # libextension_threadpool.a
-    # libcpuinfo.a
-    # libpthreadpool.a
-    if(NOT DEFINED EXECUTORCH_INCLUDE_DIRS AND NOT DEFINED EXECUTORCH_LIBRARIES)
-        message(WARNING "EXECUTORCH_INCLUDE_DIRS and EXECUTORCH_LIBRARIES are not defined. Looking for ExecuTorch.")
-        find_package(ExecuTorch HINTS ${CMAKE_PREFIX_PATH}/executorch/share/cmake)
-    endif()
-    add_library(torchao_ops_embedding_xbit_executorch OBJECT
-        op_embedding_xbit_executorch.cpp
-    )
-    target_link_torchao_parallel_backend(torchao_ops_embedding_xbit_executorch executorch)
-    target_include_directories(torchao_ops_embedding_xbit_executorch PRIVATE "${EXECUTORCH_INCLUDE_DIRS}")
-    target_compile_definitions(torchao_ops_embedding_xbit_executorch PRIVATE USE_EXECUTORCH=1)
-    target_link_libraries(torchao_ops_embedding_xbit_executorch PRIVATE "${EXECUTORCH_LIBRARIES}")
-    if (TORCHAO_BUILD_CPU_AARCH64)
-        target_link_libraries(torchao_ops_embedding_xbit_executorch PRIVATE torchao_kernels_aarch64)
-    endif()
-endif()
diff --git a/torchao/experimental/ops/linear_8bit_act_xbit_weight/CMakeLists.txt b/torchao/experimental/ops/linear_8bit_act_xbit_weight/CMakeLists.txt
deleted file mode 100644
index 4bc3259061..0000000000
--- a/torchao/experimental/ops/linear_8bit_act_xbit_weight/CMakeLists.txt
+++ /dev/null
@@ -1,65 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the license found in the
-# LICENSE file in the root directory of this source tree.
-
-cmake_minimum_required(VERSION 3.19)
-
-include(${CMAKE_CURRENT_SOURCE_DIR}/../../Utils.cmake)
-
-if (NOT TARGET cpuinfo)
-    # For some reason cpuinfo package has unused functions/variables
-    # TODO (T215533422): fix upstream
-    add_compile_options(-Wno-unused-function -Wno-unused-variable)
-    include(FetchContent)
-    FetchContent_Declare(cpuinfo
-        GIT_REPOSITORY https://github.com/pytorch/cpuinfo.git
-        GIT_TAG aaac07ee499895770c89163ce0920ef8bb41ed23)
-    FetchContent_MakeAvailable(
-        cpuinfo)
-endif()
-
-if (TORCHAO_BUILD_ATEN_OPS)
-    find_package(Torch REQUIRED)
-    add_library(torchao_ops_linear_8bit_act_xbit_weight_aten OBJECT
-        linear_8bit_act_xbit_weight.cpp
-        op_linear_8bit_act_xbit_weight_aten.cpp
-    )
-    target_link_torchao_parallel_backend(torchao_ops_linear_8bit_act_xbit_weight_aten "${TORCHAO_PARALLEL_BACKEND}")
-
-    if(TORCHAO_BUILD_CPU_AARCH64)
-        target_link_libraries(torchao_ops_linear_8bit_act_xbit_weight_aten PRIVATE torchao_kernels_aarch64)
-    endif()
-    target_link_libraries(torchao_ops_linear_8bit_act_xbit_weight_aten PRIVATE cpuinfo)
-    target_include_directories(torchao_ops_linear_8bit_act_xbit_weight_aten PRIVATE "${TORCH_INCLUDE_DIRS}")
-    target_link_libraries(torchao_ops_linear_8bit_act_xbit_weight_aten PRIVATE "${TORCH_LIBRARIES}")
-    target_compile_definitions(torchao_ops_linear_8bit_act_xbit_weight_aten PRIVATE USE_ATEN=1)
-endif()
-
-if(TORCHAO_BUILD_EXECUTORCH_OPS)
-    # ExecuTorch package is not required, but EXECUTORCH_INCLUDE_DIRS and EXECUTORCH_LIBRARIES must
-    # be defined and EXECUTORCH_LIBRARIES must include the following libraries installed by ExecuTorch:
-    # libexecutorch.a
-    # libextension_threadpool.a
-    # libcpuinfo.a
-    # libpthreadpool.a
-    if(NOT DEFINED EXECUTORCH_INCLUDE_DIRS AND NOT DEFINED EXECUTORCH_LIBRARIES)
-        message(WARNING "EXECUTORCH_INCLUDE_DIRS and EXECUTORCH_LIBRARIES are not defined. Looking for ExecuTorch.")
-        find_package(ExecuTorch HINTS ${CMAKE_PREFIX_PATH}/executorch/share/cmake)
-    endif()
-    # find_package(ExecuTorch HINTS ${CMAKE_PREFIX_PATH}/executorch/share/cmake)
-    # file(GLOB _SRCS "${CMAKE_CURRENT_SOURCE_DIR}/op_linear_8bit_act_xbit_weight_executorch/*.cpp")
-    add_library(torchao_ops_linear_8bit_act_xbit_weight_executorch OBJECT
-        linear_8bit_act_xbit_weight.cpp
-        op_linear_8bit_act_xbit_weight_executorch.cpp
-    )
-    target_link_torchao_parallel_backend(torchao_ops_linear_8bit_act_xbit_weight_executorch executorch)
-    target_include_directories(torchao_ops_linear_8bit_act_xbit_weight_executorch PRIVATE "${EXECUTORCH_INCLUDE_DIRS}")
-    target_compile_definitions(torchao_ops_linear_8bit_act_xbit_weight_executorch PRIVATE USE_EXECUTORCH=1)
-    target_link_libraries(torchao_ops_linear_8bit_act_xbit_weight_executorch PRIVATE "${EXECUTORCH_LIBRARIES}")
-    if(TORCHAO_BUILD_CPU_AARCH64)
-        target_link_libraries(torchao_ops_linear_8bit_act_xbit_weight_executorch PRIVATE torchao_kernels_aarch64)
-    endif()
-    target_link_libraries(torchao_ops_linear_8bit_act_xbit_weight_executorch PRIVATE cpuinfo)
-endif()

From 3aa93619466739c9d9845e1db3bfb2ff0f464857 Mon Sep 17 00:00:00 2001
From: Thien Tran <gau.nernst@yahoo.com.sg>
Date: Wed, 4 Jun 2025 11:50:09 +0800
Subject: [PATCH 079/165] [optim] Fix bug when default dtype is BF16 (#2286)

* handle error when default dtype is BF16

* skip FP8 optim on unsupported GPUs
---
 test/test_low_bit_optim.py     | 29 ++++++++++++++++++++++++-----
 torchao/optim/subclass_4bit.py |  6 +++---
 torchao/optim/subclass_8bit.py |  6 +++---
 3 files changed, 30 insertions(+), 11 deletions(-)

diff --git a/test/test_low_bit_optim.py b/test/test_low_bit_optim.py
index 08fdfa569f..692a0d9e6c 100644
--- a/test/test_low_bit_optim.py
+++ b/test/test_low_bit_optim.py
@@ -37,7 +37,6 @@
 from torchao.optim.subclass_fp8 import OptimStateFp8
 from torchao.testing.utils import skip_if_rocm
 from torchao.utils import (
-    TORCH_VERSION_AT_LEAST_2_4,
     TORCH_VERSION_AT_LEAST_2_5,
     TORCH_VERSION_AT_LEAST_2_7,
     get_available_devices,
@@ -128,8 +127,6 @@ class TestOptim(TestCase):
     @skip_if_rocm("ROCm enablement in progress")
     def test_optim_smoke(self, optim_name, dtype, device):
         if optim_name.endswith("Fp8") and device == "cuda":
-            if not TORCH_VERSION_AT_LEAST_2_4:
-                pytest.skip("FP8 CUDA requires PyTorch >= 2.4")
             if torch.cuda.get_device_capability() < (8, 9):
                 pytest.skip("FP8 CUDA requires compute capability >= 8.9")
 
@@ -166,6 +163,30 @@ def test_optim_smoke(self, optim_name, dtype, device):
         for p1, p2 in zip(model.parameters(), model2.parameters()):
             torch.testing.assert_close(p2, p1)
 
+    @parametrize("optim_name", ["Adam8bit", "Adam4bit", "AdamFp8"])
+    @parametrize("device", _DEVICES)
+    def test_optim_default_dtype_bf16(self, optim_name, device):
+        if optim_name.endswith("Fp8") and device == "cuda":
+            if torch.cuda.get_device_capability() < (8, 9):
+                pytest.skip("FP8 CUDA requires compute capability >= 8.9")
+
+        old_dtype = torch.get_default_dtype()
+        torch.set_default_dtype(torch.bfloat16)
+
+        try:
+            model = nn.Sequential(nn.Linear(32, 256), nn.ReLU(), nn.Linear(256, 32))
+            model.to(device=device)
+            optimizer = getattr(optim, optim_name)(model.parameters())
+
+            x = torch.randn(4, 32, device=device)
+            loss = model(x).sum()
+            loss.backward()
+            optimizer.step()
+            optimizer.zero_grad()
+
+        finally:
+            torch.set_default_dtype(old_dtype)
+
     # aten.slice is required for dcp.load() when world size changes i.e. re-sharding
     # however, it's cumbersome to test it directly, since we would need to run distributed
     # test 2 times with different world size, and persist checkpoint across the 2 runs.
@@ -178,8 +199,6 @@ def test_subclass_slice(self, subclass, shape, device):
         if subclass == OptimStateFp8:
             if device == "cpu" and len(shape) > 1 and not TORCH_VERSION_AT_LEAST_2_5:
                 pytest.skip("fill_cpu not implemented for Float8_e4m3fn for torch<2.5")
-            if device == "cuda" and not TORCH_VERSION_AT_LEAST_2_4:
-                pytest.skip("FP8 CUDA requires PyTorch >= 2.4")
             if device == "cuda" and torch.cuda.get_device_capability() < (8, 9):
                 pytest.skip("FP8 CUDA requires compute capability >= 8.9")
 
diff --git a/torchao/optim/subclass_4bit.py b/torchao/optim/subclass_4bit.py
index 209d0b8cad..bc5fd33414 100644
--- a/torchao/optim/subclass_4bit.py
+++ b/torchao/optim/subclass_4bit.py
@@ -69,6 +69,7 @@ def __init__(self, codes: Tensor, scale: Tensor, qmap: Tensor, signed: bool, sha
         assert codes.dtype is torch.uint8
         assert codes.ndim == 1  # flattened buffer
         assert scale.ndim == 1
+        assert qmap.dtype is torch.float32
         self.codes = codes
         self.scale = scale
         self.qmap = qmap
@@ -101,9 +102,8 @@ def zeros(cls, shape, signed: bool = True, block_size: int = 128, device=None):
 
         codes = torch.zeros(n_elems // 2, dtype=torch.uint8, device=device)
         scale = torch.zeros(n_elems // block_size, device=device)
-        qmap = torch.tensor(
-            get_qmap_signed() if signed else get_qmap_unsigned(), device=device
-        )
+        qmap_list = get_qmap_signed() if signed else get_qmap_unsigned()
+        qmap = torch.tensor(qmap_list, dtype=torch.float32, device=device)
         return cls(codes, scale, qmap, signed, shape)
 
     def __repr__(self):
diff --git a/torchao/optim/subclass_8bit.py b/torchao/optim/subclass_8bit.py
index 58a51734d7..d3f7634526 100644
--- a/torchao/optim/subclass_8bit.py
+++ b/torchao/optim/subclass_8bit.py
@@ -62,6 +62,7 @@ def __init__(self, codes: Tensor, scale: Tensor, qmap: Tensor, signed: bool):
         """
         assert codes.dtype is torch.uint8
         assert scale.ndim == 1
+        assert qmap.dtype is torch.float32
         self.codes = codes
         self.scale = scale
         self.qmap = qmap
@@ -89,9 +90,8 @@ def dequantize(self, output_dtype=None):
     def zeros(cls, shape, signed: bool = True, block_size: int = 256, device=None):
         codes = torch.zeros(shape, dtype=torch.uint8, device=device)
         scale = torch.zeros(codes.numel() // block_size, device=device)
-        qmap = torch.tensor(
-            get_qmap_signed() if signed else get_qmap_unsigned(), device=device
-        )
+        qmap_list = get_qmap_signed() if signed else get_qmap_unsigned()
+        qmap = torch.tensor(qmap_list, dtype=torch.float32, device=device)
         return cls(codes, scale, qmap, signed)
 
     def __repr__(self):

From 152a8e397e1383c55bf7b87a8eaa2b87ffb2c114 Mon Sep 17 00:00:00 2001
From: Vasiliy Kuznetsov <vkuzo@users.noreply.github.com>
Date: Wed, 4 Jun 2025 08:50:33 -0400
Subject: [PATCH 080/165] update float8 training readme to include time
 measurement (#2291)

Summary:

Update the float8 training example code snippet to include time
measurement that properly excludes torch.compile one-time warmup. Also,
use larger shapes to demonstrate speedup from float8.

Test Plan:

copy-paste the snippet and run it, it works. Commenting out float8 shows
a slowdown, as expected.

Reviewers:

Subscribers:

Tasks:

Tags:
---
 torchao/float8/README.md | 23 ++++++++++++++++++++---
 1 file changed, 20 insertions(+), 3 deletions(-)

diff --git a/torchao/float8/README.md b/torchao/float8/README.md
index 65da67c524..99bb80c4bd 100644
--- a/torchao/float8/README.md
+++ b/torchao/float8/README.md
@@ -17,6 +17,8 @@ and composable with key systems such as autograd, ```torch.compile``` and distri
 This is the default recipe, with a good balance of performance and accuracy.
 
 ```python
+import time
+
 import torch
 import torch.nn as nn
 from torchao.float8 import convert_to_float8_training
@@ -26,11 +28,12 @@ if not TORCH_VERSION_AT_LEAST_2_5:
     raise AssertionError("torchao.float8 requires PyTorch version 2.5 or greater")
 
 # create model and sample input
+M, K, N = 4096, 8192, 4096
 m = nn.Sequential(
-    nn.Linear(2048, 4096),
-    nn.Linear(4096, 128),
+    nn.Linear(K, N, bias=False),
+    nn.Linear(N, 128, bias=False),
 ).bfloat16().cuda()
-x = torch.randn(4096, 2048, device="cuda", dtype=torch.bfloat16)
+x = torch.randn(M, K, device="cuda", dtype=torch.bfloat16)
 optimizer = torch.optim.SGD(m.parameters(), lr=0.1)
 
 # optional: filter modules from being eligible for float8 conversion
@@ -50,12 +53,26 @@ convert_to_float8_training(m, module_filter_fn=module_filter_fn)
 # enable torch.compile for competitive performance
 m = torch.compile(m)
 
+# warm up torch.compile for a clean training time measurement
+for _ in range(1):
+    optimizer.zero_grad()
+    y = m(x)
+    y.sum().backward()
+    optimizer.step()
+
+torch.cuda.synchronize()
+start_time = time.time()
+
 # toy training loop
 for _ in range(10):
     optimizer.zero_grad()
     y = m(x)
     y.sum().backward()
     optimizer.step()
+
+torch.cuda.synchronize()
+end_time = time.time()
+print("Training time:", end_time - start_time)
 ```
 
 ## float8 linear with rowwise scaling

From 801af03165d2afa3b51a492f96417b80e1364d16 Mon Sep 17 00:00:00 2001
From: Jesse Cai <jessecai@meta.com>
Date: Wed, 4 Jun 2025 16:10:54 -0400
Subject: [PATCH 081/165] [sparse] marlin fixes (#2305)

* [sparse] marlin fixes

Summary:

This PR updates sparse-marlin to not use CPU tensors and updates it to
be compatible with Int4WeightOnl.

Test Plan:
```
pytest test/sparsity/test_marlin.py
```

Reviewers:

Subscribers:

Tasks:

Tags:

* ruff check
---
 torchao/dtypes/uintx/marlin_sparse_layout.py | 21 ++++++++++----------
 torchao/sparsity/marlin/__init__.py          | 10 ++++------
 2 files changed, 15 insertions(+), 16 deletions(-)

diff --git a/torchao/dtypes/uintx/marlin_sparse_layout.py b/torchao/dtypes/uintx/marlin_sparse_layout.py
index 13af29d8bf..af1f8040f6 100644
--- a/torchao/dtypes/uintx/marlin_sparse_layout.py
+++ b/torchao/dtypes/uintx/marlin_sparse_layout.py
@@ -130,7 +130,7 @@ def __new__(
         cls,
         int_data: torch.Tensor,
         scale: torch.Tensor,
-        zero_point: torch.Tensor,
+        zero: torch.Tensor,
         meta: torch.Tensor,
         _layout: Layout,
         original_shape: torch.Size,
@@ -151,7 +151,7 @@ def __init__(
         self,
         int_data: torch.Tensor,
         scale: torch.Tensor,
-        zero_point: torch.Tensor,
+        zero: torch.Tensor,
         meta: torch.Tensor,
         _layout: Layout,
         original_shape: torch.Size,
@@ -159,8 +159,9 @@ def __init__(
         num_bits: int,
     ):
         self.int_data = int_data
+        self.scale_and_zero = None
         self.scale = scale
-        self.zero_point = zero_point
+        self.zero = zero
         self.meta = meta
         self._layout = _layout
         self.original_shape = original_shape
@@ -181,7 +182,7 @@ def __torch_dispatch__(cls, func, types, args, kwargs):
         )
 
     def __tensor_flatten__(self):
-        return ["int_data", "scale", "zero_point", "meta"], [
+        return ["int_data", "scale", "zero", "meta"], [
             self._layout,
             self.original_shape,
             self.group_size,
@@ -194,13 +195,13 @@ def __tensor_unflatten__(
     ):
         int_data = tensor_data_dict["int_data"]
         scale = tensor_data_dict["scale"]
-        zero_point = tensor_data_dict["zero_point"]
+        zero = tensor_data_dict["zero"]
         meta = tensor_data_dict["meta"]
         _layout, original_shape, group_size, num_bits = tensor_attributes
         return cls(
             int_data,
             scale,
-            zero_point,
+            zero,
             meta,
             _layout,
             original_shape,
@@ -223,14 +224,14 @@ def get_plain(self):
         )
         int_data_expanded_t = int_data_expanded.t()
         scales_expanded_t = scales_expanded.t()
-        return int_data_expanded_t, scales_expanded_t, self.zero_point
+        return int_data_expanded_t, scales_expanded_t, self.zero
 
     @classmethod
     def from_plain(
         cls,
         int_data: torch.Tensor,
         scale: torch.Tensor,
-        zero_point: torch.Tensor,
+        zero: torch.Tensor,
         _layout: Layout,
     ):
         from torchao.sparsity.marlin import (
@@ -291,7 +292,7 @@ def from_plain(
         return cls(
             marlin_24_q_w_comp,
             marlin_24_s,
-            zero_point,
+            zero,
             meta,
             _layout,
             q_w_24.shape,
@@ -305,6 +306,6 @@ def get_layout(self) -> Layout:
     def _apply_fn_to_data(self, fn):
         self.int_data = fn(self.int_data)
         self.scale = fn(self.scale)
-        self.zero_point = fn(self.zero_point)
+        self.zero = fn(self.zero)
         self.meta = fn(self.meta)
         return self
diff --git a/torchao/sparsity/marlin/__init__.py b/torchao/sparsity/marlin/__init__.py
index 16f4d788ca..86f46e77da 100644
--- a/torchao/sparsity/marlin/__init__.py
+++ b/torchao/sparsity/marlin/__init__.py
@@ -226,11 +226,10 @@ def _to_marlin_weights(
 
     # Pack
     pack_factor = utils.get_pack_factor(num_bits)
-    orig_device = q_w.device
 
     # Original implementation uses numpy + uint32 but we need to use int64 because torch.uint32
     # does not support rshift_cpu.
-    q_w = q_w.cpu().to(torch.int64)
+    q_w = q_w.to(torch.int64)
     q_packed = torch.zeros(
         (q_w.shape[0], q_w.shape[1] // pack_factor),
         dtype=torch.int64,
@@ -239,7 +238,7 @@ def _to_marlin_weights(
     for i in range(pack_factor):
         q_packed |= q_w[:, i::pack_factor] << (num_bits * i)
 
-    q_packed = q_packed.to(orig_device, dtype=torch.int32)
+    q_packed = q_packed.to(dtype=torch.int32)
     return q_packed
 
 
@@ -259,12 +258,11 @@ def _from_marlin_weights(
     perm_24, _, _ = utils.get_reverse_perms_24(num_bits)
 
     pack_factor = utils.get_pack_factor(num_bits)
-    orig_device = q_packed.device
 
     # Unpack from marlin format.
     # Original implementation uses numpy + uint32 but we need to use int64 because torch.uint32
     # does not support rshift_cpu.
-    q_packed = q_packed.cpu().to(torch.int64)
+    q_packed = q_packed.to(torch.int64)
     q_w_unpacked = torch.zeros(
         (q_packed.shape[0], q_packed.shape[1] * pack_factor),
         dtype=torch.int64,
@@ -275,7 +273,7 @@ def _from_marlin_weights(
             (1 << num_bits) - 1
         )
 
-    q_w_unpacked = q_w_unpacked.to(orig_device, dtype=torch.int32)
+    q_w_unpacked = q_w_unpacked.to(dtype=torch.int32)
 
     q_w_comp = utils.reverse_marlin_permute_weights(
         q_w_unpacked, size_k, size_n, perm_24

From 2d4c6df164981757c57191f04bdb156f08a545c1 Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Wed, 4 Jun 2025 20:46:11 -0400
Subject: [PATCH 082/165] Skip native modules if USE_CPP = 0 (#2301)

---
 setup.py | 79 ++++++++++++++++++++++++++++++++++++--------------------
 1 file changed, 51 insertions(+), 28 deletions(-)

diff --git a/setup.py b/setup.py
index 51c283c858..5288ec15bd 100644
--- a/setup.py
+++ b/setup.py
@@ -45,17 +45,45 @@ def read_version(file_path="version.txt"):
 if version_suffix is None:
     version_suffix = f"+git{get_git_commit_id()}"
 
-use_cpp = os.getenv("USE_CPP")
-
 import platform
 
-build_macos_arm_auto = (
-    use_cpp == "1"
-    and platform.machine().startswith("arm64")
-    and platform.system() == "Darwin"
-)
+################################################################################
+# Build Configuration - Environment Variables and Build Options
+################################################################################
+
+# Core build toggles
+use_cpp = os.getenv("USE_CPP", "1")
+use_cpu_kernels = os.getenv("USE_CPU_KERNELS", "0") == "1"
+
+# Platform detection
+is_arm64 = platform.machine().startswith("arm64") or platform.machine() == "aarch64"
+is_macos = platform.system() == "Darwin"
+is_linux = platform.system() == "Linux"
+
+# Auto-enable experimental builds on ARM64 macOS when USE_CPP=1
+build_macos_arm_auto = use_cpp == "1" and is_arm64 and is_macos
+
+# Build configuration hierarchy and relationships:
+#
+# Level 1: USE_CPP (Primary gate)
+#   ├── "0" → Skip all C++ extensions (Python-only mode)
+#   └── "1"/None → Build C++ extensions
+#
+# Level 2: Platform-specific optimizations
+#   ├── USE_CPU_KERNELS="1" + Linux → Include optimized CPU kernels (AVX512, etc.)
+#   └── ARM64 + macOS → Auto-enable experimental builds (build_macos_arm_auto)
+#
+# Level 3: Experimental builds (cmake-based)
+#   ├── BUILD_TORCHAO_EXPERIMENTAL="1" → Force experimental builds
+#   ├── build_macos_arm_auto → Auto-enable on ARM64 macOS
+#   └── When enabled, provides access to:
+#       ├── TORCHAO_BUILD_CPU_AARCH64 → ARM64 CPU kernels
+#       ├── TORCHAO_BUILD_KLEIDIAI → Kleidi AI library integration
+#       ├── TORCHAO_BUILD_EXPERIMENTAL_MPS → MPS acceleration (macOS only)
+#       ├── TORCHAO_ENABLE_ARM_NEON_DOT → ARM NEON dot product instructions
+#       ├── TORCHAO_ENABLE_ARM_I8MM → ARM 8-bit integer matrix multiply
+#       └── TORCHAO_PARALLEL_BACKEND → Backend selection (aten_openmp, executorch, etc.)
 
-use_cpp_kernels = os.getenv("USE_CPP_KERNELS", "0") == "1"
 
 from torchao.utils import TORCH_VERSION_AT_LEAST_2_7
 
@@ -92,12 +120,10 @@ def __init__(self):
         # can be built by explicitly setting TORCHAO_BUILD_CPU_AARCH64=1
         self.build_cpu_aarch64 = self._os_bool_var(
             "TORCHAO_BUILD_CPU_AARCH64",
-            default=(self._is_arm64() and self._is_macos()),
+            default=(is_arm64 and is_macos),
         )
         if self.build_cpu_aarch64:
-            assert self._is_arm64(), (
-                "TORCHAO_BUILD_CPU_AARCH64 requires an arm64 machine"
-            )
+            assert is_arm64, "TORCHAO_BUILD_CPU_AARCH64 requires an arm64 machine"
 
         # TORCHAO_BUILD_KLEIDIAI is disabled by default for now because
         # 1) It increases the build time
@@ -115,8 +141,8 @@ def __init__(self):
             "TORCHAO_BUILD_EXPERIMENTAL_MPS", default=False
         )
         if self.build_experimental_mps:
-            assert self._is_macos(), "TORCHAO_BUILD_EXPERIMENTAL_MPS requires MacOS"
-            assert self._is_arm64(), "TORCHAO_BUILD_EXPERIMENTAL_MPS requires arm64"
+            assert is_macos, "TORCHAO_BUILD_EXPERIMENTAL_MPS requires macOS"
+            assert is_arm64, "TORCHAO_BUILD_EXPERIMENTAL_MPS requires arm64"
             assert torch.mps.is_available(), (
                 "TORCHAO_BUILD_EXPERIMENTAL_MPS requires MPS be available"
             )
@@ -129,7 +155,7 @@ def __init__(self):
         # Enabled by default on macOS silicon
         self.enable_arm_neon_dot = self._os_bool_var(
             "TORCHAO_ENABLE_ARM_NEON_DOT",
-            default=(self._is_arm64() and self._is_macos()),
+            default=(is_arm64 and is_macos),
         )
         if self.enable_arm_neon_dot:
             assert self.build_cpu_aarch64, (
@@ -146,12 +172,6 @@ def __init__(self):
                 "TORCHAO_ENABLE_ARM_I8MM requires TORCHAO_BUILD_CPU_AARCH64 be set"
             )
 
-    def _is_arm64(self) -> bool:
-        return platform.machine().startswith("arm64") or platform.machine() == "aarch64"
-
-    def _is_macos(self) -> bool:
-        return platform.system() == "Darwin"
-
     def _os_bool_var(self, var, default) -> bool:
         default_val = "1" if default else "0"
         return os.getenv(var, default_val) == "1"
@@ -323,6 +343,11 @@ def __init__(
 
 
 def get_extensions():
+    # Skip building C++ extensions if USE_CPP is set to "0"
+    if use_cpp == "0":
+        print("USE_CPP=0: Skipping compilation of C++ extensions")
+        return []
+
     debug_mode = use_debug_mode()
     if debug_mode:
         print("Compiling in debug mode")
@@ -363,11 +388,7 @@ def get_extensions():
             ["-O3" if not debug_mode else "-O0", "-fdiagnostics-color=always"]
         )
 
-        if (
-            use_cpp_kernels
-            and platform.system() == "Linux"
-            and TORCH_VERSION_AT_LEAST_2_7
-        ):
+        if use_cpu_kernels and is_linux and TORCH_VERSION_AT_LEAST_2_7:
             if torch._C._cpu._is_avx512_supported():
                 extra_compile_args["cxx"].extend(
                     [
@@ -427,7 +448,7 @@ def get_extensions():
 
     # Collect C++ source files
     sources = list(glob.glob(os.path.join(extensions_dir, "**/*.cpp"), recursive=True))
-    if not use_cpp_kernels or platform.system() != "Linux":
+    if not use_cpu_kernels or not is_linux:
         # Remove csrc/cpu/*.cpp
         excluded_sources = list(
             glob.glob(os.path.join(extensions_dir, "cpu/*.cpp"), recursive=True)
@@ -652,7 +673,9 @@ def bool_to_on_off(value):
     return ext_modules
 
 
-check_submodules()
+# Only check submodules if we're going to build C++ extensions
+if use_cpp != "0":
+    check_submodules()
 
 setup(
     name="torchao",

From 35ffb267c3d09d106b4d7d1acf6bb3a48d62a716 Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Wed, 4 Jun 2025 21:41:50 -0400
Subject: [PATCH 083/165] Add support for fbgemm fp8 kernels (#2276)

Summary:
fp8 per row quantized weight with fp8 dynamic per row quantization only for now

Test Plan:
python test/dtypes/test_fbgemm_fp8.py

in torchao/_models/llama folder:
export CHECKPOINT_PATH=../../../checkpoints # path to checkpoints folder
export MODEL_REPO=meta-llama/Meta-Llama-3.1-8B-Instruct

python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --quantization fbgemm-fp8 --batch_size 1

Reviewers:

Subscribers:

Tasks:

Tags:
---
 test/dtypes/test_affine_quantized.py          |   7 +
 ...fbgemm_quantized.py => test_fbgemm_fp8.py} |  14 +-
 ...uantized_tensor.py => test_fbgemm_int4.py} |   4 +-
 torchao/_models/llama/generate.py             |  26 +--
 torchao/dtypes/__init__.py                    |   6 +-
 torchao/dtypes/fbgemm_fp8_tensor.py           | 154 ++++++++++++++++++
 ...ntized_tensor.py => fbgemm_int4_tensor.py} |  33 ++--
 torchao/quantization/quant_api.py             |  34 ++--
 8 files changed, 233 insertions(+), 45 deletions(-)
 rename test/dtypes/{test_fbgemm_quantized.py => test_fbgemm_fp8.py} (77%)
 rename test/dtypes/{test_fbgemm_quantized_tensor.py => test_fbgemm_int4.py} (92%)
 create mode 100644 torchao/dtypes/fbgemm_fp8_tensor.py
 rename torchao/dtypes/{fbgemm_quantized_tensor.py => fbgemm_int4_tensor.py} (87%)

diff --git a/test/dtypes/test_affine_quantized.py b/test/dtypes/test_affine_quantized.py
index b74c5d2ecf..68b5f41438 100644
--- a/test/dtypes/test_affine_quantized.py
+++ b/test/dtypes/test_affine_quantized.py
@@ -24,7 +24,9 @@
     to_affine_quantized_intx,
     to_affine_quantized_intx_static,
 )
+from torchao.float8.config import e4m3_dtype
 from torchao.quantization import (
+    FbgemmConfig,
     GemliteUIntXWeightOnlyConfig,
     Int4WeightOnlyConfig,
     Int8DynamicActivationInt8WeightConfig,
@@ -45,6 +47,7 @@
     is_fbcode,
     is_ROCM,
     is_sm_at_least_89,
+    is_sm_at_least_90,
 )
 
 is_cusparselt_available = (
@@ -99,6 +102,10 @@ def get_quantization_functions(
     if is_sm_at_least_89():
         base_functions.append(float8_weight_only())
 
+    if is_sm_at_least_90():
+        base_functions.append(FbgemmConfig(torch.bfloat16, torch.int4, torch.bfloat16))
+        base_functions.append(FbgemmConfig(e4m3_dtype, e4m3_dtype, torch.bfloat16))
+
     return base_functions
 
 
diff --git a/test/dtypes/test_fbgemm_quantized.py b/test/dtypes/test_fbgemm_fp8.py
similarity index 77%
rename from test/dtypes/test_fbgemm_quantized.py
rename to test/dtypes/test_fbgemm_fp8.py
index fe2573530c..d2f1e2d82a 100644
--- a/test/dtypes/test_fbgemm_quantized.py
+++ b/test/dtypes/test_fbgemm_fp8.py
@@ -12,15 +12,20 @@
     run_tests,
 )
 
+from torchao.float8.config import e4m3_dtype
 from torchao.quantization import (
     FbgemmConfig,
     quantize_,
 )
 from torchao.quantization.utils import compute_error
-from torchao.utils import is_sm_at_least_90
+from torchao.utils import (
+    TORCH_VERSION_AT_LEAST_2_8,
+    is_sm_at_least_90,
+)
 
 
-class TestFbgemmInt4Tensor(TestCase):
+@unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_8, "Need pytorch 2.8+")
+class TestFbgemmFp8Tensor(TestCase):
     @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
     @unittest.skipIf(not is_sm_at_least_90(), "Nedd sm90+")
     def test_linear(self):
@@ -30,10 +35,9 @@ def test_linear(self):
         linear = torch.nn.Linear(128, 256, dtype=dtype, device=device)
         original = linear(input)
         config = FbgemmConfig(
-            input_dtype=torch.bfloat16,
-            weight_dtype=torch.int4,
+            input_dtype=e4m3_dtype,
+            weight_dtype=e4m3_dtype,
             output_dtype=torch.bfloat16,
-            block_size=(1, 128),
         )
         quantize_(linear, config)
         quantized = linear(input)
diff --git a/test/dtypes/test_fbgemm_quantized_tensor.py b/test/dtypes/test_fbgemm_int4.py
similarity index 92%
rename from test/dtypes/test_fbgemm_quantized_tensor.py
rename to test/dtypes/test_fbgemm_int4.py
index 51b68dd977..22fe5bc110 100644
--- a/test/dtypes/test_fbgemm_quantized_tensor.py
+++ b/test/dtypes/test_fbgemm_int4.py
@@ -18,15 +18,15 @@
 )
 from torchao.quantization.utils import compute_error
 from torchao.utils import (
-    TORCH_VERSION_AT_LEAST_2_6,
+    TORCH_VERSION_AT_LEAST_2_8,
     is_sm_at_least_90,
 )
 
 
+@unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_8, "Need pytorch 2.8+")
 class TestFbgemmInt4Tensor(TestCase):
     @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
     @unittest.skipIf(not is_sm_at_least_90(), "Nedd sm90+")
-    @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_6, "Need torch >= 2.6")
     def test_linear(self):
         dtype = torch.bfloat16
         device = "cuda"
diff --git a/torchao/_models/llama/generate.py b/torchao/_models/llama/generate.py
index aa928c83f5..0cf166103b 100644
--- a/torchao/_models/llama/generate.py
+++ b/torchao/_models/llama/generate.py
@@ -442,23 +442,25 @@ def ffn_or_attn_only(mod, fqn):
                 f"int4wo group_size needs to be one of [32,64,128,256] but got {group_size}"
             )
             quantize_(model, int4_weight_only(group_size=group_size, use_hqq=use_hqq))
-        elif "fbgemm" in quantization:
+        elif "fbgemm" in quantization and "int4" in quantization:
             from torchao.quantization import FbgemmConfig
 
             _, precision, group_size = quantization.split("-")
             group_size = int(group_size)
             block_size = [1, group_size]
-            if precision == "int4":
-                quantize_(
-                    model,
-                    FbgemmConfig(
-                        torch.bfloat16, torch.int4, torch.bfloat16, block_size
-                    ),
-                )
-            else:
-                raise NotImplementedError(
-                    f"FbegemmConfig({precision=}) not supported yet"
-                )
+            assert precision == "int4", f"FbegemmConfig({precision=}) not supported yet"
+            quantize_(
+                model,
+                FbgemmConfig(torch.bfloat16, torch.int4, torch.bfloat16, block_size),
+            )
+        elif "fbgemm" in quantization and "fp8" in quantization:
+            from torchao.float8.config import e4m3_dtype
+            from torchao.quantization import FbgemmConfig
+
+            quantize_(
+                model,
+                FbgemmConfig(e4m3_dtype, e4m3_dtype, torch.bfloat16),
+            )
         elif "int4dq-" in quantization:
             from torchao.dtypes import CutlassInt4PackedLayout
 
diff --git a/torchao/dtypes/__init__.py b/torchao/dtypes/__init__.py
index 1003491828..692d56ad31 100644
--- a/torchao/dtypes/__init__.py
+++ b/torchao/dtypes/__init__.py
@@ -8,7 +8,8 @@
     to_affine_quantized_intx,
     to_affine_quantized_intx_static,
 )
-from .fbgemm_quantized_tensor import to_fbgemm_quantized
+from .fbgemm_fp8_tensor import to_fbgemm_fp8
+from .fbgemm_int4_tensor import to_fbgemm_int4
 from .floatx import (
     CutlassSemiSparseLayout,
     Float8Layout,
@@ -62,5 +63,6 @@
     "PackedLinearInt8DynamicActivationIntxWeightLayout",
     "to_affine_quantized_packed_linear_int8_dynamic_activation_intx_weight",
     "Int4XPULayout",
-    "to_fbgemm_quantized",
+    "to_fbgemm_int4",
+    "to_fbgemm_fp8",
 ]
diff --git a/torchao/dtypes/fbgemm_fp8_tensor.py b/torchao/dtypes/fbgemm_fp8_tensor.py
new file mode 100644
index 0000000000..735c21c2ca
--- /dev/null
+++ b/torchao/dtypes/fbgemm_fp8_tensor.py
@@ -0,0 +1,154 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+
+from typing import Optional
+
+import torch
+from torch.utils._python_dispatch import return_and_correct_aliasing
+
+from torchao.utils import (
+    TORCH_VERSION_AT_LEAST_2_5,
+    TorchAOBaseTensor,
+)
+
+__all__ = [
+    "to_fbgemm_fp8",
+]
+
+aten = torch.ops.aten
+
+
+class FbgemmFp8Tensor(TorchAOBaseTensor):
+    tensor_data_attrs = ["float8_data", "scale", "activation_scale_ub"]
+    tensor_attributes = ["dtype"]
+
+    def __new__(cls, float8_data, scale, activation_scale_ub, dtype):
+        shape = float8_data.shape
+        kwargs = {}
+        kwargs["device"] = float8_data.device
+        kwargs["dtype"] = dtype
+        kwargs["requires_grad"] = False
+        return torch.Tensor._make_wrapper_subclass(cls, shape, **kwargs)  # type: ignore[attr-defined]
+
+    def __init__(self, float8_data, scale, activation_scale_ub, dtype):
+        self.float8_data = float8_data
+        self.scale = scale
+        self.activation_scale_ub = activation_scale_ub
+
+    def __tensor_flatten__(self):
+        return self.tensor_data_attrs, [
+            getattr(self, attr) for attr in self.tensor_attributes
+        ]
+
+    @classmethod
+    def __tensor_unflatten__(
+        cls, tensor_data_dict, tensor_attributes, outer_size, outer_stride
+    ):
+        return cls(
+            *[tensor_data_dict[name] for name in cls.tensor_data_attrs],
+            *tensor_attributes,
+        )
+
+    def _apply_fn_to_data(self, fn):
+        return self.__class__(
+            *[fn(getattr(self, attr)) for attr in self.tensor_data_attrs],
+            *[getattr(self, attr) for attr in self.tensor_attributes],
+        )
+
+    def __repr__(self):
+        return (
+            f"{self.__class__.__name__}(weight={self.float8_data}, scale={self.scale}, "
+            f"activation_scale_ub={self.activation_scale_ub}, "
+            f"shape={self.shape}, device={self.device}, dtype={self.dtype}, requires_grad={self.requires_grad})"
+        )
+
+    def _quantization_type(self):
+        return f"shape={self.shape}, activation_scale_ub={self.activation_scale_ub}, device={self.device}"
+
+    @classmethod
+    def from_float(
+        cls,
+        w: torch.Tensor,
+        activation_scale_ub: Optional[float] = None,
+    ):
+        if activation_scale_ub is None:
+            activation_scale_ub = 1200.0
+
+        activation_scale_ub = torch.tensor(
+            [activation_scale_ub],
+            dtype=torch.float,
+            device=w.device,
+        )
+        wq, w_scale = torch.ops.triton.quantize_fp8_row(w)
+        # wq, w_scale = torch.ops.fbgemm.quantize_fp8_per_row(w)
+        dtype = w.dtype
+        del w
+        return FbgemmFp8Tensor(
+            wq,
+            w_scale,
+            activation_scale_ub=activation_scale_ub,
+            dtype=dtype,
+        )
+
+
+implements = FbgemmFp8Tensor.implements
+
+
+@implements([torch.nn.functional.linear, aten.linear.default])
+def _(func, types, args, kwargs):
+    input_tensor, weight_tensor, bias = (
+        args[0],
+        args[1],
+        args[2] if len(args) > 2 else None,
+    )
+    if not input_tensor.is_floating_point():
+        raise NotImplementedError(
+            f"{func} is not implemented for non floating point input"
+        )
+
+    orig_act_size = input_tensor.size()
+    orig_out_features = weight_tensor.shape[-2]
+
+    # not used
+    num_tokens = torch.empty([input_tensor.size(0)], device=input_tensor.device)
+    xq, x_scale = torch.ops.fbgemm.quantize_fp8_per_row(
+        input_tensor, num_tokens, weight_tensor.activation_scale_ub
+    )
+    res = torch.ops.fbgemm.f8f8bf16_rowwise(
+        xq,
+        weight_tensor.float8_data,
+        x_scale,
+        weight_tensor.scale,
+        use_fast_accum=True,
+    )
+    res = res.reshape(*orig_act_size[:-1], orig_out_features)
+    if bias is not None:
+        res = res + bias
+
+    return res
+
+
+@implements([aten.detach.default, aten.alias.default])
+def _(func, types, args, kwargs):
+    return return_and_correct_aliasing(
+        func, args, kwargs, args[0]._apply_fn_to_data(torch.detach)
+    )
+
+
+@implements([aten.clone.default, aten.copy_.default])
+def _(func, types, args, kwargs):
+    return return_and_correct_aliasing(
+        func, args, kwargs, args[0]._apply_fn_to_data(torch.clone)
+    )
+
+
+to_fbgemm_fp8 = FbgemmFp8Tensor.from_float
+
+
+if TORCH_VERSION_AT_LEAST_2_5:
+    # Allow a model with FbgemmFp8Tensor weights to be loaded with `weights_only=True`
+    torch.serialization.add_safe_globals([FbgemmFp8Tensor])
diff --git a/torchao/dtypes/fbgemm_quantized_tensor.py b/torchao/dtypes/fbgemm_int4_tensor.py
similarity index 87%
rename from torchao/dtypes/fbgemm_quantized_tensor.py
rename to torchao/dtypes/fbgemm_int4_tensor.py
index fd788a73a3..c2ab6246bf 100644
--- a/torchao/dtypes/fbgemm_quantized_tensor.py
+++ b/torchao/dtypes/fbgemm_int4_tensor.py
@@ -11,10 +11,13 @@
 import torch
 from torch.utils._python_dispatch import return_and_correct_aliasing
 
-from torchao.utils import TorchAOBaseTensor
+from torchao.utils import (
+    TORCH_VERSION_AT_LEAST_2_5,
+    TorchAOBaseTensor,
+)
 
 __all__ = [
-    "to_fbgemm_quantized",
+    "to_fbgemm_int4",
 ]
 
 aten = torch.ops.aten
@@ -71,25 +74,22 @@ def __repr__(self):
             f"shape={self.shape}, device={self.device}, dtype={self.dtype}, requires_grad={self.requires_grad})"
         )
 
+    def _quantization_type(self):
+        return f"shape={self.shape}, group_size={self.group_size}, device={self.device}"
+
     @classmethod
     def from_float(
         cls,
         w: torch.Tensor,
-        input_dtype: torch.dtype,
-        weight_dtype: torch.dtype,
-        output_dtype: torch.dtype,
         block_size: List[int],
     ):
         assert len(block_size) == w.ndim, (
             f"Expecting the length of block_size to be equal to the dimension of the weight, got {block_size=} and {w.ndim=}"
         )
-        group_size = block_size[-1]
+        if int4_row_quantize_zp is None:
+            raise ImportError("Requires fbgemm-gpu-genai >= 1.2.0")
 
-        assert (input_dtype, weight_dtype, output_dtype) == (
-            torch.bfloat16,
-            torch.int4,
-            torch.bfloat16,
-        )
+        group_size = block_size[-1]
 
         if w.ndim >= 3:
             wq, scale, zero_point = zip(
@@ -138,9 +138,10 @@ def _(func, types, args, kwargs):
         weight_tensor.scale,
         weight_tensor.zero_point,
     )
+    res = res.reshape(*orig_act_size[:-1], orig_out_features)
     if bias is not None:
         res = res + bias
-    return res.reshape(*orig_act_size[:-1], orig_out_features)
+    return res
 
 
 @implements([aten.detach.default, aten.alias.default])
@@ -157,5 +158,9 @@ def _(func, types, args, kwargs):
     )
 
 
-# We can have `to_fbgemm_tensor` to dispatch to different Fbgemm tensors later
-to_fbgemm_quantized = FbgemmInt4Tensor.from_float
+to_fbgemm_int4 = FbgemmInt4Tensor.from_float
+
+
+if TORCH_VERSION_AT_LEAST_2_5:
+    # Allow a model with FbgemmInt4Tensor weights to be loaded with `weights_only=True`
+    torch.serialization.add_safe_globals([FbgemmInt4Tensor])
diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index a7eec7e1df..56229b0d27 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -46,7 +46,8 @@
     to_affine_quantized_floatx,
     to_affine_quantized_floatx_static,
     to_affine_quantized_intx,
-    to_fbgemm_quantized,
+    to_fbgemm_fp8,
+    to_fbgemm_int4,
     to_marlinqqq_quantized_intx,
 )
 from torchao.dtypes.uintx.packed_linear_int8_dynamic_activation_intx_weight_layout import (
@@ -537,6 +538,9 @@ def _quantization_type(weight: torch.Tensor):
     if isinstance(weight, LinearActivationQuantizedTensor):
         return f"{weight.__class__.__name__}(activation={weight.input_quant_func}, weight={_quantization_type(weight.original_weight_tensor)})"
 
+    if hasattr(weight, "_quantization_type"):
+        return f"{weight.__class__.__name__}({weight._quantization_type()})"
+
     if type(weight) is torch.Tensor:
         return "not quantized"
 
@@ -1981,7 +1985,8 @@ class FbgemmConfig(AOBaseConfig):
     input_dtype: torch.dtype
     weight_dtype: torch.dtype
     output_dtype: torch.dtype
-    block_size: List[int]
+    block_size: Optional[List[int]] = None
+    activation_scale_ub: Optional[float] = None
 
 
 @register_quantize_module_handler(FbgemmConfig)
@@ -1998,22 +2003,31 @@ def _(module: torch.nn.Module, config: FbgemmConfig) -> torch.nn.Module:
 
     _SUPPORTED_DTYPES = {
         (torch.bfloat16, torch.int4, torch.bfloat16),
+        (e4m3_dtype, e4m3_dtype, torch.bfloat16),
     }
 
     if (
-        config.input_dtype,
-        config.weight_dtype,
-        config.output_dtype,
-    ) in _SUPPORTED_DTYPES:
-        weight = to_fbgemm_quantized(
+        (config.input_dtype == torch.bfloat16)
+        and (config.weight_dtype == torch.int4)
+        and (config.output_dtype == torch.bfloat16)
+    ):
+        weight = to_fbgemm_int4(
             module.weight,
-            config.input_dtype,
-            config.weight_dtype,
-            config.output_dtype,
             config.block_size,
         )
         module.weight = torch.nn.Parameter(weight, requires_grad=False)
         module.extra_repr = types.MethodType(_linear_extra_repr, module)
+    elif (
+        (config.input_dtype == e4m3_dtype)
+        and (config.weight_dtype == e4m3_dtype)
+        and (config.output_dtype == torch.bfloat16)
+    ):
+        weight = to_fbgemm_fp8(
+            module.weight,
+            config.activation_scale_ub,
+        )
+        module.weight = torch.nn.Parameter(weight, requires_grad=False)
+        module.extra_repr = types.MethodType(_linear_extra_repr, module)
     else:
         raise NotImplementedError(
             f"{config} is not supported. supported input, weight, output kernel dtypes are: {_SUPPORTED_DTYPES}"

From 9cd5851e78a6fec36f3bccef8f5f3aa16ec3c599 Mon Sep 17 00:00:00 2001
From: YIWENX14 <164585414+YIWENX14@users.noreply.github.com>
Date: Thu, 5 Jun 2025 02:48:35 -0700
Subject: [PATCH 084/165] primitive scale fix

Differential Revision: D74446877

Pull Request resolved: https://github.com/pytorch/ao/pull/2210
---
 torchao/quantization/quant_primitives.py | 6 +++++-
 1 file changed, 5 insertions(+), 1 deletion(-)

diff --git a/torchao/quantization/quant_primitives.py b/torchao/quantization/quant_primitives.py
index de9a1ef4a7..9d453102cd 100644
--- a/torchao/quantization/quant_primitives.py
+++ b/torchao/quantization/quant_primitives.py
@@ -1270,6 +1270,8 @@ def choose_qparams_affine_with_min_max(
     if eps is None:
         eps = torch.finfo(min_val.dtype).eps
 
+    scale_device = min_val.device
+
     if preserve_zero:
         min_val_neg = torch.min(min_val, torch.zeros_like(min_val))
         max_val_pos = torch.max(max_val, torch.zeros_like(max_val))
@@ -1316,7 +1318,9 @@ def choose_qparams_affine_with_min_max(
         scale = torch.clamp(scale, min=eps)
     else:
         assert mapping_type == MappingType.ASYMMETRIC
-        scale = (max_val_pos - min_val_neg) / float(quant_max - quant_min)
+        scale = (max_val_pos - min_val_neg) / torch.tensor(
+            float(quant_max - quant_min), dtype=scale_dtype, device=scale_device
+        )
         scale = torch.clamp(scale, min=eps)
         if zero_point_domain == ZeroPointDomain.NONE:
             zero_point = None

From 72ea2fc5f0852162d7dcf38378d873854f0d6184 Mon Sep 17 00:00:00 2001
From: Daniel Vega-Myhre <danvm@meta.com>
Date: Thu, 5 Jun 2025 10:43:11 -0400
Subject: [PATCH 085/165] [BE/docs] Add float8 training api ref to docsite
 (#2313)

add float8 training api to api ref docs
---
 docs/source/api_ref_float8.rst | 30 ++++++++++++++++++++++++++++++
 docs/source/index.rst          |  1 +
 2 files changed, 31 insertions(+)
 create mode 100644 docs/source/api_ref_float8.rst

diff --git a/docs/source/api_ref_float8.rst b/docs/source/api_ref_float8.rst
new file mode 100644
index 0000000000..8e912ac4e7
--- /dev/null
+++ b/docs/source/api_ref_float8.rst
@@ -0,0 +1,30 @@
+.. _api_quantization:
+
+====================
+torchao.float8
+====================
+
+.. currentmodule:: torchao.float8
+
+Main float8 training APIs
+----------------------
+
+.. autosummary::
+    :toctree: generated/
+    :nosignatures:
+
+    convert_to_float8_training
+
+Other float8 training types
+-------------------------------
+
+.. autosummary::
+    :toctree: generated/
+    :nosignatures:
+
+    Float8LinearConfig
+    Float8GEMMConfig
+    CastConfig
+    ScalingType
+    ScalingGranularity
+    precompute_float8_dynamic_scale_for_fsdp
diff --git a/docs/source/index.rst b/docs/source/index.rst
index f526c77939..9febad8d5b 100644
--- a/docs/source/index.rst
+++ b/docs/source/index.rst
@@ -30,6 +30,7 @@ for an overall introduction to the library and recent highlight and updates.
    api_ref_dtypes
    api_ref_quantization
    api_ref_sparsity
+   api_ref_float8
 
 .. toctree::
    :glob:

From 0640474276ca5a3e34f9e19519aa831a90ff0537 Mon Sep 17 00:00:00 2001
From: mobicham <37179323+mobicham@users.noreply.github.com>
Date: Thu, 5 Jun 2025 16:47:59 +0200
Subject: [PATCH 086/165] Fix slicing and get_plain() in GemLite (#2288)

* fix get_plain() with FMA mode

* update

* fix in_features/out_feature meta-data mismatch

* update gemlite slice test

* add packing_bitwidth support

* add packing_bitwidth support and cleanup

* update default gemlite layout

* cleanup

* fix symmetric use-case and relax _same_meta_data

* _copy() meta data

* fix (4,) in autoquant
---
 test/dtypes/test_affine_quantized.py   |  73 ++++++++++++++-
 torchao/dtypes/uintx/gemlite_layout.py | 122 ++++++++++++++++++++-----
 torchao/quantization/autoquant.py      |   6 +-
 torchao/quantization/quant_api.py      |   8 +-
 4 files changed, 178 insertions(+), 31 deletions(-)

diff --git a/test/dtypes/test_affine_quantized.py b/test/dtypes/test_affine_quantized.py
index 68b5f41438..bd5ed0c3b5 100644
--- a/test/dtypes/test_affine_quantized.py
+++ b/test/dtypes/test_affine_quantized.py
@@ -371,12 +371,81 @@ def test_slice_gemlite(self, device, dtype):
         # in_feature not divisible by 1024
         # out_feature not divisible by 8
         # to test slice + padding for int4 weight only quantization
-        dummy = nn.Linear(256, 512, dtype=dtype, device=device)
-        quantize_(dummy, GemliteUIntXWeightOnlyConfig())
+        in_features, out_features, group_size, bit_width = 256, 512, 64, 4
+        orig_shape = [out_features, in_features]
+        dummy = nn.Linear(
+            in_features, out_features, bias=False, dtype=dtype, device=device
+        )
+        quantize_(
+            dummy,
+            GemliteUIntXWeightOnlyConfig(bit_width=bit_width, group_size=group_size),
+        )
+        W_group_mode = dummy.weight.tensor_impl.gemlite_kwargs["meta_args"][10]
+
         # make sure these run without error
         _ = dummy.weight.narrow(0, 0, 64)
         _ = dummy.weight.narrow(1, 0, 128)
 
+        # Dequant op
+        import gemlite
+
+        def dequant(input_layer, in_features, orig_shape):
+            int_data = input_layer.tensor_impl.packed_weight
+            scale = input_layer.tensor_impl.scale
+            zero_point = input_layer.tensor_impl.zero_point
+
+            W_q = (
+                gemlite.bitpack.unpack_over_rows(
+                    int_data,
+                    W_nbits=bit_width,
+                    num_output_rows=in_features,
+                    dtype=torch.uint8,
+                )
+                .T.contiguous()
+                .view([-1, group_size])
+            )
+
+            s = scale.t().contiguous().view(-1, 1)
+            z = zero_point.t().contiguous().view(-1, 1)
+
+            if W_group_mode == 4:  # FMA
+                W_deq = (W_q * s + z).view(orig_shape)
+            else:
+                W_deq = ((W_q - z) * s).view(orig_shape)
+
+            return W_deq
+
+        W_r = dequant(dummy.weight, dummy.in_features, orig_shape)
+
+        # Slicing in half
+        for slice_axis, start, end in [
+            (0, 0, 256),
+            (0, 256, 256),
+            (1, 0, 128),
+            (1, 128, 128),
+        ]:
+            layer_sliced = dummy.weight.narrow(slice_axis, start, end)
+
+            if slice_axis == 0:
+                num_rows, out_shape = (
+                    dummy.in_features,
+                    (orig_shape[0] // 2, orig_shape[1]),
+                )
+            else:
+                num_rows, out_shape = (
+                    dummy.in_features // 2,
+                    (orig_shape[0], orig_shape[1] // 2),
+                )
+
+            W_slice = dequant(layer_sliced, num_rows, out_shape)
+
+            W_slice_ref = (
+                W_r[start : start + end, :]
+                if slice_axis == 0
+                else W_r[:, start : start + end]
+            )
+            self.assertEqual((W_slice_ref - W_slice).abs().mean().item(), 0)
+
     @common_utils.parametrize("device", ["cuda"])
     @common_utils.parametrize("dtype", [torch.bfloat16])
     def test_matmul(self, device, dtype):
diff --git a/torchao/dtypes/uintx/gemlite_layout.py b/torchao/dtypes/uintx/gemlite_layout.py
index 1c840f7ec4..eb06cf2a96 100644
--- a/torchao/dtypes/uintx/gemlite_layout.py
+++ b/torchao/dtypes/uintx/gemlite_layout.py
@@ -25,7 +25,6 @@
 except:
     gemlite = None
 
-
 aten = torch.ops.aten
 
 
@@ -35,7 +34,12 @@ def _same_metadata(
 ) -> bool:
     kwargs_match = len(self.gemlite_kwargs) == len(src.gemlite_kwargs)
     for k, v in self.gemlite_kwargs.items():
-        if k != "scale_activations":
+        if k in [
+            "in_features",
+            "out_features",
+            "packing_bitwidth",
+            "elements_per_sample",
+        ]:
             kwargs_match = kwargs_match and (v == src.gemlite_kwargs[k])
 
     return (
@@ -80,6 +84,7 @@ def get_gemlite_aqt_kwargs(
     weight,
     group_size=64,
     bit_width=4,
+    packing_bitwidth=None,
     use_hqq=True,
 ):
     if gemlite is None:
@@ -99,6 +104,9 @@ def get_gemlite_aqt_kwargs(
     assert group_size is None or bit_width != 8, (
         "gemlite only works with group_size=None for bit_width=8"
     )
+    assert packing_bitwidth in [8, 16, 32, None], (
+        f"Invalid packing bitwidth, got {packing_bitwidth}"
+    )
 
     out_features, in_features = weight.shape
     group_size = in_features if group_size is None else group_size
@@ -107,6 +115,7 @@ def get_gemlite_aqt_kwargs(
     aqt_kwargs["_layout"] = GemlitePackedLayout(
         group_size=group_size,
         bit_width=bit_width,
+        packing_bitwidth=packing_bitwidth,
     )
     aqt_kwargs["use_hqq"] = use_hqq
     return aqt_kwargs
@@ -114,8 +123,9 @@ def get_gemlite_aqt_kwargs(
 
 @dataclass(frozen=True)
 class GemlitePackedLayout(Layout):
-    group_size: Optional[int] = 64
+    group_size: Optional[int] = 128
     bit_width: int = 4
+    packing_bitwidth: Optional[int] = None
 
 
 @register_layout(GemlitePackedLayout)
@@ -191,24 +201,36 @@ def from_plain(
 
         group_size, bit_width = _layout.group_size, _layout.bit_width
         out_features, in_features = int_data.shape
+        packing_bitwidth = _layout.packing_bitwidth
 
         if bit_width == 8 and group_size == in_features:
             gemlite_linear = gemlite.helper.A16W8(device=int_data.device).from_weights(
                 int_data, scales=scale, bias=None
             )
         else:
-            gemlite_linear = gemlite.helper.A16Wn(device=int_data.device).from_weights(
+            gemlite_linear = gemlite.helper.A16Wn(
+                device=int_data.device, packing_bitwidth=packing_bitwidth
+            ).from_weights(
                 int_data, scale, zero_point, bit_width, group_size, bias=None
             )
 
+        meta_args = gemlite_linear.get_meta_args()
         gemlite_kwargs = {
             "in_features": in_features,
             "out_features": out_features,
-            "meta_args": gemlite_linear.get_meta_args(),
+            "packing_bitwidth": packing_bitwidth,
+            "data_contiguous": gemlite_linear.data_contiguous,
+            "elements_per_sample": gemlite_linear.elements_per_sample,
+            "W_group_mode": gemlite_linear.W_group_mode,
+            "meta_args": meta_args,
         }
 
         packed_weight, scale, zero_point = gemlite_linear.get_tensor_args()
         packed_weight = packed_weight.to(device)
+        if zero_point is None:
+            zero_point = torch.tensor(
+                [[]], device=packed_weight.device, dtype=torch.int32
+            )
 
         return cls(packed_weight, scale, zero_point, gemlite_kwargs, _layout)
 
@@ -235,18 +257,39 @@ def _apply_fn_to_data(self, fn):
     def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
         device = self.packed_weight.device
         int_data = (
-            gemlite.bitpack.unpack_over_rows(
-                self.packed_weight.cuda(),
-                W_nbits=self._layout.bit_width,
-                num_output_rows=self.gemlite_kwargs["out_features"],
-                dtype=torch.uint8,
+            (
+                gemlite.bitpack.unpack_over_rows(
+                    self.packed_weight.cuda(),
+                    W_nbits=self._layout.bit_width,
+                    num_output_rows=self.gemlite_kwargs["in_features"],
+                    dtype=torch.uint8,
+                )
             )
+            .to(device)
             .t()
-            .contiguous()
-        ).to(device)
+        )
+
+        # Preserve col-row major layout
+        if self.gemlite_kwargs["data_contiguous"]:
+            int_data = int_data.contiguous()
+
+        # Handle FMA mode: W_q * s + z  -> (W_q - z) * s
+        if self.gemlite_kwargs["W_group_mode"] == 4:
+            scale_min_val = 1e-8
+            scale = self.scale.clone().float()
+            scale[torch.logical_and(scale >= 0, scale.abs() <= scale_min_val)] = (
+                scale_min_val
+            )
+            scale[
+                torch.logical_and(scale < 0, scale.abs() <= scale_min_val)
+            ] = -scale_min_val
+            zero_point = (-self.zero_point.float() / scale).clamp_(-100, 100)
+            zero_point = zero_point.to(self.scale.dtype)
+        else:
+            zero_point = self.zero_point
 
         scale = self.scale.t().contiguous()
-        zero_point = self.zero_point.t().contiguous()
+        zero_point = zero_point.t().contiguous()
 
         return int_data, scale, zero_point
 
@@ -274,14 +317,36 @@ def __torch_dispatch__(cls, func, types, args, kwargs):
             assert step == 1, "Only step == 1 is supported in slicing right now"
 
             if dim in [0, 1]:
-                int_data, scale, zero_point = self.get_plain()
-                data_len = int_data.shape[dim]
+                # data in self is transposed, meaning forward() performs x @ W_deq not x @ W_deq.T
+                dim = 1 - dim
+                packed_weight = self.packed_weight
+                scale = self.scale
+                zero_point = self.zero_point
+
+                gemlite_kwargs = self.gemlite_kwargs.copy()
+                orig_shape = [
+                    gemlite_kwargs["in_features"],
+                    gemlite_kwargs["out_features"],
+                ]
+                elements_per_sample = gemlite_kwargs["elements_per_sample"]
+                data_len = orig_shape[dim]
                 scale_len = scale.shape[dim]
                 ratio = data_len / scale_len
                 start_scale = int(start / ratio)
                 end_scale = int(end / ratio)
 
-                int_data = aten.slice.Tensor(int_data, dim, start, end, step)
+                # For packing only the K dimension. This should be flipped for N-dim packing.
+                div = elements_per_sample if dim == 0 else 1
+                packed_weight = aten.slice.Tensor(
+                    packed_weight, dim, start // div, end // div, step
+                )
+
+                # Update in_features/out_features
+                gemlite_kwargs["in_features"] = (
+                    packed_weight.shape[0] * elements_per_sample
+                )
+                gemlite_kwargs["out_features"] = packed_weight.shape[1]
+
                 scale = aten.slice.Tensor(scale, dim, start_scale, end_scale, step)
                 if zero_point is not None and zero_point.numel() > 0:
                     zero_point = aten.slice.Tensor(
@@ -289,15 +354,10 @@ def __torch_dispatch__(cls, func, types, args, kwargs):
                     )
                 else:
                     zero_point = None
-                # this is to handle padding
-                int_data, scale, zero_point = self._layout.post_process(
-                    int_data, scale, zero_point, self.block_size
-                )
-
-                sliced = self.from_plain(
-                    int_data, scale, zero_point, self._layout
-                )  # Will be transposed again
 
+                sliced = GemliteAQTTensorImpl(
+                    packed_weight, scale, zero_point, gemlite_kwargs, self._layout
+                )
                 return return_and_correct_aliasing(func, args, kwargs, sliced)
 
             else:
@@ -308,10 +368,24 @@ def __torch_dispatch__(cls, func, types, args, kwargs):
         elif func is aten.copy_.default:
             self = args[0]
             src = args[1]
+
+            # Handle zero_point = None with symmetric quant
+            if self.zero_point is None:
+                self.zero_point = torch.tensor(
+                    [[]], device=self.packed_weight.device, dtype=torch.int32
+                )
+
+            if src.zero_point is None:
+                src.zero_point = torch.tensor(
+                    [[]], device=src.packed_weight.device, dtype=torch.int32
+                )
+
             if _same_metadata(self, src):
                 self_tensors = self.__tensor_flatten__()[0]
                 for tensor_name in self_tensors:
                     getattr(self, tensor_name).copy_(getattr(src, tensor_name))
+                for key in self.gemlite_kwargs:
+                    self.gemlite_kwargs[key] = src.gemlite_kwargs[key]
                 return
             raise ValueError(
                 f"Not supported args for copy_ due to metadata mistach: {args[0], args[1]}"
diff --git a/torchao/quantization/autoquant.py b/torchao/quantization/autoquant.py
index 41ea588231..998204c8fe 100644
--- a/torchao/quantization/autoquant.py
+++ b/torchao/quantization/autoquant.py
@@ -741,11 +741,11 @@ def from_float(cls, weight):
             weight = weight.to(torch.float16)
 
         bit_width = 4
-        packing_bitwidth = 32
-        contiguous = None
+        packing_bitwidth = None
         use_hqq = True
+
         aqt_kwargs = get_gemlite_aqt_kwargs(
-            weight, cls.group_size, bit_width, packing_bitwidth, contiguous, use_hqq
+            weight, cls.group_size, bit_width, packing_bitwidth, use_hqq
         )
         weight = to_affine_quantized_intx(weight, **aqt_kwargs)
         input_quant_func = _to_float16
diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index 56229b0d27..be25b144a6 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -990,8 +990,9 @@ class GemliteUIntXWeightOnlyConfig(AOBaseConfig):
         `set_inductor_config`: if True, adjusts `torchinductor` settings to recommended values.
     """
 
-    group_size: Optional[int] = 64
+    group_size: Optional[int] = 128
     bit_width: int = 4
+    packing_bitwidth: Optional[int] = None
     set_inductor_config: bool = True
 
 
@@ -1005,6 +1006,7 @@ def _gemlite_uintx_weight_only_transform(
 ):
     group_size = config.group_size
     bit_width = config.bit_width
+    packing_bitwidth = config.packing_bitwidth
     if config.set_inductor_config:
         torchao.quantization.utils.recommended_inductor_config_setter()
 
@@ -1015,7 +1017,9 @@ def _gemlite_uintx_weight_only_transform(
     use_hqq = True if bit_width == 4 else False
     new_weight = to_affine_quantized_intx(
         weight,
-        **get_gemlite_aqt_kwargs(weight, group_size, bit_width, use_hqq),
+        **get_gemlite_aqt_kwargs(
+            weight, group_size, bit_width, packing_bitwidth, use_hqq
+        ),
     )
     module.weight = torch.nn.Parameter(new_weight, requires_grad=False)
     module.extra_repr = types.MethodType(_linear_extra_repr, module)

From d72a6d1f6f34788f63bd813ca94486c97922ea30 Mon Sep 17 00:00:00 2001
From: Svetlana Karslioglu <svekars@meta.com>
Date: Thu, 5 Jun 2025 10:30:05 -0500
Subject: [PATCH 087/165] Enable doc build to run on PRs (#2315)

Enable doc build to run on PRs when files in `docs/**` path are changed to enable preview
---
 .github/workflows/doc_build.yml | 1 -
 1 file changed, 1 deletion(-)

diff --git a/.github/workflows/doc_build.yml b/.github/workflows/doc_build.yml
index 27ae54975d..7ed75daba4 100644
--- a/.github/workflows/doc_build.yml
+++ b/.github/workflows/doc_build.yml
@@ -12,7 +12,6 @@ on:
   pull_request:
     paths:
       - 'docs/**'
-      - '!docs/**'
   workflow_dispatch:
 
 concurrency:

From 0d9631b6b7e31f9a71c15640088311bbe030b123 Mon Sep 17 00:00:00 2001
From: andrewor14 <andrewor14@gmail.com>
Date: Thu, 5 Jun 2025 14:49:02 -0400
Subject: [PATCH 088/165] Add Float8ActInt4WeightQATQuantizer (#2289)

**Summary:** This commit adds a QAT quantizer that performs
float8 dynamic activation + int4 symmetric per channel weight
fake quantization. Note that there is no corresponding config
for float8 QAT yet. This will be added in a future PR.

**Test Plan:**
python test/quantization/test_qat.py -k test_float8_fake_quantize
python test/quantization/test_qat.py -k test_qat_fp8a4w_quantizer
---
 test/quantization/test_qat.py              |  63 ++++++++++-
 torchao/quantization/qat/__init__.py       |   2 +
 torchao/quantization/qat/fake_quantizer.py |  21 ++++
 torchao/quantization/qat/linear.py         | 118 +++++++++++++++++++--
 torchao/quantization/qat/utils.py          |  32 ++++++
 5 files changed, 228 insertions(+), 8 deletions(-)

diff --git a/test/quantization/test_qat.py b/test/quantization/test_qat.py
index cbe279c12e..323802757d 100644
--- a/test/quantization/test_qat.py
+++ b/test/quantization/test_qat.py
@@ -17,6 +17,9 @@
 from torch.ao.quantization.fx._decomposed import quantized_decomposed_lib  # noqa: F401
 
 from torchao import quantize_
+from torchao.float8.config import ScalingGranularity
+from torchao.float8.float8_scaling_utils import hp_tensor_to_float8_dynamic
+from torchao.float8.float8_tensor import LinearMMConfig
 from torchao.quantization.granularity import (
     PerAxis,
     PerGroup,
@@ -40,15 +43,18 @@
 )
 from torchao.quantization.qat.fake_quantizer import (
     FakeQuantizer,
+    _Float8RowwiseActivationFakeQuantizer,
 )
 from torchao.quantization.qat.linear import (
     FakeQuantizedLinear,
+    Float8ActInt4WeightQATQuantizer,
     Int4WeightOnlyQATLinear,
     Int8DynActInt4WeightQATLinear,
 )
 from torchao.quantization.qat.utils import (
     _fake_quantize_per_channel_group,
     _fake_quantize_per_token,
+    _Float8RowwiseFakeQuantize,
     _get_qmin_qmax,
 )
 from torchao.quantization.quant_api import (
@@ -68,6 +74,7 @@
 )
 from torchao.quantization.utils import (
     _get_per_token_block_size,
+    compute_error,
     get_group_qparams_symmetric,
     get_groupwise_affine_qparams,
     groupwise_affine_quantize_tensor,
@@ -1474,7 +1481,6 @@ def test_qat_8da4w_prepare_vs_convert(self, dtype: torch.dtype):
         numerics that match exactly over N trials.
         """
         from torchao.quantization.qat import Int8DynActInt4WeightQATQuantizer
-        from torchao.quantization.utils import compute_error
 
         num_trials = 1000
         group_size = 16
@@ -1688,6 +1694,61 @@ def test_qat_range_learning(self):
             self.assertNotEqual(torch.count_nonzero(new_weight.grad), 0)
             self.assertFalse(torch.equal(new_weight, prev_weight))
 
+    def test_float8_rowwise_fake_quantize(self):
+        """
+        Test that `_Float8RowwiseFakeQuantize` is numerically close to `Float8Tensor`.
+        """
+        torch.manual_seed(self.SEED)
+        dtype = torch.float8_e4m3fn
+        x = torch.randn(32, 64)
+        axiswise_dim = 0
+        out = _Float8RowwiseFakeQuantize.apply(x, dtype, axiswise_dim)
+        out_expected = hp_tensor_to_float8_dynamic(
+            x,
+            dtype,
+            LinearMMConfig(),
+            scaling_granularity=ScalingGranularity.AXISWISE,
+            axiswise_dim=axiswise_dim,
+        ).to_original_precision()
+        torch.testing.assert_close(out, out_expected, atol=0, rtol=0)
+
+    @unittest.skipIf(
+        not TORCH_VERSION_AT_LEAST_2_6, "skipping when torch version is 2.6 or lower"
+    )
+    def test_qat_fp8a4w_quantizer(self):
+        """
+        Test basic model training with `Float8ActInt4WeightQATQuantizer`.
+        """
+        torch.manual_seed(self.SEED)
+        m = M()
+        qat_quantizer = Float8ActInt4WeightQATQuantizer()
+        qat_model = qat_quantizer.prepare(m)
+        for linear in [m.linear1, m.sub.linear, m.linear2]:
+            self.assertIsInstance(linear, FakeQuantizedLinear)
+            self.assertIsInstance(
+                linear.activation_fake_quantizer, _Float8RowwiseActivationFakeQuantizer
+            )
+            self.assertIsInstance(linear.weight_fake_quantizer, FakeQuantizer)
+        prev_weight = copy.deepcopy(m.linear1.weight)
+
+        # Simulate training
+        optimizer = torch.optim.SGD(
+            m.parameters(), lr=0.001, momentum=0.9, weight_decay=1e-5
+        )
+        loss_fn = torch.nn.CrossEntropyLoss()
+        optimizer.zero_grad()
+        target = torch.randn(1, 512).float()
+        example_inputs = m.example_inputs()
+        out = qat_model(*example_inputs)
+        loss = loss_fn(out, target)
+        loss.backward()
+        optimizer.step()
+        # Assert that weights have valid gradients and are being updated
+        new_weight = m.linear1.weight
+        self.assertIsNotNone(new_weight.grad)
+        self.assertNotEqual(torch.count_nonzero(new_weight.grad), 0)
+        self.assertFalse(torch.equal(new_weight, prev_weight))
+
 
 if __name__ == "__main__":
     unittest.main()
diff --git a/torchao/quantization/qat/__init__.py b/torchao/quantization/qat/__init__.py
index 010ccfc8cc..4a4359e682 100644
--- a/torchao/quantization/qat/__init__.py
+++ b/torchao/quantization/qat/__init__.py
@@ -11,6 +11,7 @@
     Int4WeightOnlyEmbeddingQATQuantizer,
 )
 from .linear import (
+    Float8ActInt4WeightQATQuantizer,
     Int4WeightOnlyQATQuantizer,
     Int8DynActInt4WeightQATQuantizer,
 )
@@ -18,6 +19,7 @@
 __all__ = [
     "ComposableQATQuantizer",
     "FakeQuantizeConfig",
+    "Float8ActInt4WeightQATQuantizer",
     "FromIntXQuantizationAwareTrainingConfig",
     "Int4WeightOnlyEmbeddingQATQuantizer",
     "Int4WeightOnlyQATQuantizer",
diff --git a/torchao/quantization/qat/fake_quantizer.py b/torchao/quantization/qat/fake_quantizer.py
index aca0c032bb..b7ad792dc1 100644
--- a/torchao/quantization/qat/fake_quantizer.py
+++ b/torchao/quantization/qat/fake_quantizer.py
@@ -32,6 +32,7 @@
 from .utils import (
     _fake_quantize_per_channel_group,
     _fake_quantize_per_token,
+    _Float8RowwiseFakeQuantize,
 )
 
 
@@ -186,3 +187,23 @@ def __repr__(self) -> str:
         Return a human readable representation of this `FakeQuantizer` with config details.
         """
         return "FakeQuantizer(%s)" % self.config
+
+
+class _Float8RowwiseActivationFakeQuantizer(torch.nn.Module):
+    """
+    Simple fake quantizer for float8 rowwise fake quantization, intended for activations only.
+    """
+
+    def __init__(self):
+        super().__init__()
+        self.enabled = True
+
+    def forward(self, x: torch.Tensor) -> torch.Tensor:
+        if self.enabled:
+            return _Float8RowwiseFakeQuantize.apply(
+                x,
+                torch.float8_e4m3fn,
+                -1,
+            )
+        else:
+            return x
diff --git a/torchao/quantization/qat/linear.py b/torchao/quantization/qat/linear.py
index bffd5dc31f..567b87f342 100644
--- a/torchao/quantization/qat/linear.py
+++ b/torchao/quantization/qat/linear.py
@@ -28,7 +28,10 @@
 from torchao.utils import TORCH_VERSION_AT_LEAST_2_6
 
 from .api import FakeQuantizeConfig
-from .fake_quantizer import FakeQuantizer
+from .fake_quantizer import (
+    FakeQuantizer,
+    _Float8RowwiseActivationFakeQuantizer,
+)
 from .utils import (
     _get_qmin_qmax,
 )
@@ -145,6 +148,11 @@ def from_linear(
         return new_linear
 
 
+# ===========================
+# | QAT quantizer interface |
+# ===========================
+
+
 class _LegacyQATQuantizer(TwoStepQuantizer):
     """
     Base class for sharing common methods across legacy QAT quantizers.
@@ -157,9 +165,30 @@ def get_weight_fake_quantize_config(self) -> Optional[FakeQuantizeConfig]:
         return None
 
 
-# =========================================================
-# |   Linear int8 dynamic activations + int4 weight QAT   |
-# =========================================================
+def enable_linear_fake_quant(
+    mod: torch.nn.Module,
+    enabled: bool = True,
+):
+    """
+    Helper function to enable fake quantization in `FakeQuantizerLinear`.
+    """
+    if isinstance(mod, FakeQuantizedLinear):
+        if mod.activation_fake_quantizer is not None:
+            mod.activation_fake_quantizer.enabled = enabled
+        if mod.weight_fake_quantizer is not None:
+            mod.weight_fake_quantizer.enabled = enabled
+
+
+def disable_linear_fake_quant(mod: torch.nn.Module):
+    """
+    Helper function to disable fake quantization in `FakeQuantizerLinear`.
+    """
+    enable_linear_fake_quant(mod, enabled=False)
+
+
+# ===========================================
+# | int8 dynamic activations + int4 weights |
+# ===========================================
 
 
 class Int8DynActInt4WeightQATQuantizer(_LegacyQATQuantizer):
@@ -307,6 +336,7 @@ def disable_fake_quant(self):
         self.enable_fake_quant(False)
 
 
+# TODO: remove these in favor of enable_linear_fake_quant
 def enable_8da4w_fake_quant(mod: torch.nn.Module):
     """
     Enable fake quantization for `Int8DynActInt4WeightQATLinear`.
@@ -315,6 +345,7 @@ def enable_8da4w_fake_quant(mod: torch.nn.Module):
         mod.enable_fake_quant()
 
 
+# TODO: remove in favor of disable_linear_fake_quant
 def disable_8da4w_fake_quant(mod: torch.nn.Module):
     """
     Disable fake quantization for `Int8DynActInt4WeightQATLinear`.
@@ -357,9 +388,9 @@ def _get_8da4w_weight_config(
     )
 
 
-# ===================================
-# |   Linear int4 weight-only QAT   |
-# ===================================
+# ====================
+# | int4 weight-only |
+# ====================
 
 
 class Int4WeightOnlyQATQuantizer(_LegacyQATQuantizer):
@@ -501,6 +532,7 @@ def disable_fake_quant(self):
         self.enable_fake_quant(False)
 
 
+# TODO: remove these in favor of enable_linear_fake_quant
 def enable_4w_fake_quant(mod: torch.nn.Module):
     """
     Enable fake quantization for `Int4WeightOnlyQATLinear`.
@@ -509,6 +541,7 @@ def enable_4w_fake_quant(mod: torch.nn.Module):
         mod.enable_fake_quant()
 
 
+# TODO: remove these in favor of disable_linear_fake_quant
 def disable_4w_fake_quant(mod: torch.nn.Module):
     """
     Disable fake quantization for `Int4WeightOnlyQATLinear`.
@@ -533,3 +566,74 @@ def _get_4w_weight_config(
         zero_point_precision=qparams_precision,
         zero_point_domain=ZeroPointDomain.FLOAT,
     )
+
+
+# =============================================
+# | float8 rowwise activations + int4 weights |
+# =============================================
+
+
+class Float8ActInt4WeightQATQuantizer(_LegacyQATQuantizer):
+    """
+    QAT quantizer for applying dynamic rowwise float8 activation + int4
+    per group/channel symmetric weight fake quantization to linear layers
+    in the model. Currently only supports rowwise granularity for float8
+    activations.
+
+    args:
+        group_size (Optional[int]): the number of elements in each quantized
+            group for weights, defaults to 64. Use None for per channel.
+        scale_precision: precision of weight scales, defaults to torch.bfloat16.
+    """
+
+    def __init__(
+        self,
+        group_size: Optional[int] = 64,
+        scale_precision: torch.dtype = torch.bfloat16,
+    ):
+        if group_size is not None:
+            weight_granularity = "per_group"
+        else:
+            weight_granularity = "per_channel"
+        self._weight_config = FakeQuantizeConfig(
+            dtype=torch.int4,
+            granularity=weight_granularity,
+            group_size=group_size,
+            is_symmetric=True,
+            is_dynamic=True,
+            scale_precision=scale_precision,
+        )
+
+    def prepare(
+        self, model: torch.nn.Module, *args: Any, **kwargs: Any
+    ) -> torch.nn.Module:
+        """
+        Swap all `nn.Linear` with `FakeQuantizedLinear` with float8
+        fake quantizer for activations and int4 fake quantizer for weights.
+        """
+        for name, child in model.named_children():
+            if isinstance(child, torch.nn.Linear):
+                # TODO: add a config for float8?
+                new_linear = FakeQuantizedLinear.from_linear(
+                    child,
+                    weight_config=self._weight_config,
+                )
+                new_linear.activation_fake_quantizer = (
+                    _Float8RowwiseActivationFakeQuantizer()
+                )
+                setattr(model, name, new_linear)
+            else:
+                self.prepare(child)
+        return model
+
+    # TODO: add convert path
+    def convert(
+        self, model: torch.nn.Module, *args: Any, **kwargs: Any
+    ) -> torch.nn.Module:
+        raise NotImplementedError
+
+    def get_activation_fake_quantize_config(self) -> Optional[FakeQuantizeConfig]:
+        raise NotImplementedError("Float8 FakeQuantizeConfig does not exist yet")
+
+    def get_weight_fake_quantize_config(self) -> Optional[FakeQuantizeConfig]:
+        return self.weight_config
diff --git a/torchao/quantization/qat/utils.py b/torchao/quantization/qat/utils.py
index 01818ef2b2..132020499c 100644
--- a/torchao/quantization/qat/utils.py
+++ b/torchao/quantization/qat/utils.py
@@ -16,6 +16,38 @@
 )
 
 
+class _Float8RowwiseFakeQuantize(torch.autograd.Function):
+    """
+    Implementation of float8 rowwise fake quantize with backward STE.
+    """
+
+    @staticmethod
+    def forward(
+        ctx: torch.autograd.function.FunctionCtx,
+        x: torch.Tensor,
+        float8_dtype: torch.dtype,
+        axiswise_dim: int,
+    ):
+        # compute rowwise scale based on `torchao.float8.float8_utils.tensor_to_scale`
+        eps = 1e-12
+        amax = torch.amax(torch.abs(x), dim=axiswise_dim, keepdim=True)
+        amax = amax.to(torch.float64)
+        scale = torch.finfo(float8_dtype).max / torch.clamp(amax, min=eps)
+        scale = scale.to(torch.float32)
+
+        # fake quantize
+        max_value = torch.finfo(float8_dtype).max
+        x_fq = x.to(torch.float32) * scale
+        x_fq = x_fq.clamp(min=-max_value, max=max_value)
+        x_fq = x_fq.to(float8_dtype).to(x.dtype)
+        x_fq = x_fq / scale
+        return x_fq.to(x.dtype)
+
+    @staticmethod
+    def backward(ctx, gy):
+        return gy, None, None
+
+
 # TODO: delete?
 class _UnwrapAffineFakeQuantizedTensor(torch.autograd.Function):
     """

From 488ecd4cf871035b091981a557a9204a5d50bf5b Mon Sep 17 00:00:00 2001
From: Daniel Vega-Myhre <danvm@meta.com>
Date: Thu, 5 Jun 2025 15:56:49 -0400
Subject: [PATCH 089/165] [BE] [docs] Add float8 pretraining tutorial to
 docsite (#2304)

* add float8 pretraining tutorial

* make empty commit to trigger ci

* remove references to e2e tutorial
---
 docs/source/conf.py             |   1 +
 docs/source/index.rst           |   1 +
 docs/source/pretraining.rst     | 202 ++++++++++++++++++++++++++++++++
 docs/static/fp8-loss-curves.png | Bin 0 -> 138219 bytes
 4 files changed, 204 insertions(+)
 create mode 100644 docs/source/pretraining.rst
 create mode 100644 docs/static/fp8-loss-curves.png

diff --git a/docs/source/conf.py b/docs/source/conf.py
index f767d48164..66ee9a1c7e 100644
--- a/docs/source/conf.py
+++ b/docs/source/conf.py
@@ -37,6 +37,7 @@
 # ones.
 extensions = [
     "sphinx.ext.autodoc",
+    "sphinx.ext.autosectionlabel",
     "sphinx.ext.autosummary",
     "sphinx.ext.doctest",
     "sphinx.ext.intersphinx",
diff --git a/docs/source/index.rst b/docs/source/index.rst
index 9febad8d5b..9df40131cf 100644
--- a/docs/source/index.rst
+++ b/docs/source/index.rst
@@ -40,3 +40,4 @@ for an overall introduction to the library and recent highlight and updates.
    serialization
    subclass_basic
    subclass_advanced
+   pretraining
diff --git a/docs/source/pretraining.rst b/docs/source/pretraining.rst
new file mode 100644
index 0000000000..441b8c4a4b
--- /dev/null
+++ b/docs/source/pretraining.rst
@@ -0,0 +1,202 @@
+Pretraining with float8
+---------------------------------
+
+Pretraining with float8 using torchao can provide `up to 1.5x speedups <https://pytorch.org/blog/training-using-float8-fsdp2/>`__ on 512 GPU clusters,
+and up to `1.34-1.43x speedups <https://pytorch.org/blog/accelerating-large-scale-training-and-convergence-with-pytorch-float8-rowwise-on-crusoe-2k-h200s/>`__ on 2K H200 clusters with the latest `torchao.float8` rowwise recipe.
+
+In this tutorial, we will show 2 ways to use the **torchao.float8** recipes for pretraining:
+
+1. :ref:`Pretraining with torchtitan`, the offical PyTorch pretraining framework with native torchao integration.
+2. :ref:`Pretraining with torchao directly`, to integrate torchao's float8 training recipes into your own pretraining code.
+
+
+Pretraining with torchtitan
+###########################
+
+In this tutorial we'll pretrain Llama3 8b using torchtitan with torchao's float8 training recipes: rowwise scaling and tensorwise scaling.
+
+`Torchtitan <https://github.com/pytorch/torchtitan/>`__ is PyTorch's official pretraining framework that is natively integrated with torchao, and supports
+several popular flagship models with common forms of parallelism, float8 training, distributed checkpointing and more.
+See the torchtitan `docs <https://github.com/pytorch/torchtitan>`__ for additional details.
+
+You can use this workflow to get started quickly with a "batteries included" experience. Users commonly
+fork torchtitan and build on top of it when they're ready.
+
+Prerequisites
+================
+
+1. (Recommended) Create a new virtual environment with conda or venv.
+2. `Install torchao <https://github.com/pytorch/ao/tree/main?tab=readme-ov-file#installation>`__.
+3. `Install torchtitan <https://github.com/pytorch/torchtitan/tree/main?tab=readme-ov-file#installation>`__, including the "downloading a tokenizer" step.
+
+You're now ready to start a pretraining job using one of the recipes below!
+
+Rowwise scaling
+===============
+
+Run the following command from torchtitan root directory to launch a Llama3 8b training job on 8 GPUs with float8 rowwise training:
+
+.. code:: console
+
+    NGPU=8 CONFIG_FILE="./torchtitan/models/llama3/train_configs/llama3_8b.toml" ./run_train.sh --training.compile --model.converters="float8" --float8.recipe_name="rowwise"
+
+Torchtitan will automatically use FSDP2 to parallelize training when more than 1 GPU is used. To use other forms of parallelism, modify hyperparameters, or change other training configurations, you can directly edit the `llama3_8b.toml <https://github.com/pytorch/torchtitan/blob/775a486edd173ceb9be1c9b1b30af6ca2d4b4fa0/torchtitan/models/llama3/train_configs/llama3_8b.toml>`__ file or use command line flags (run the command with :code:`--help` to see more options).
+
+You should see terminal output that looks like this:
+
+.. code:: console
+
+    [rank0]:[titan] 2025-06-04 08:51:48,074 - root - INFO - step:  1  loss: 12.2254  memory: 27.34GiB(28.78%)  tps: 375  tflops: 21.73  mfu: 2.20%
+    [rank0]:[titan] 2025-06-04 08:51:58,557 - root - INFO - step: 10  loss: 10.7069  memory: 30.99GiB(32.62%)  tps: 7,034  tflops: 407.35  mfu: 41.19%
+    [rank0]:[titan] 2025-06-04 08:52:10,224 - root - INFO - step: 20  loss:  8.9196  memory: 30.99GiB(32.62%)  tps: 7,022  tflops: 406.65  mfu: 41.12%
+    [rank0]:[titan] 2025-06-04 08:52:21,904 - root - INFO - step: 30  loss:  8.1423  memory: 30.99GiB(32.62%)  tps: 7,014  tflops: 406.23  mfu: 41.08%
+
+As you can see, ignoring the warmup steps we are achieving around ~7k TPS with 30.99GB peak memory usage. To compare performance against bfloat16 training, you can remove the :code:`--model.converters="float8" --float8.recipe_name="rowwise"` flags
+and run the same command to see the baseline performance of bfloat16 training:
+
+.. code:: console
+
+    NGPU=8 CONFIG_FILE="./torchtitan/models/llama3/train_configs/llama3_8b.toml" ./run_train.sh --training.compile
+
+You should see the following output:
+
+.. code:: console
+
+    [rank0]:[titan] 2025-06-04 11:02:37,404 - root - INFO - step:  1  loss: 12.2611  memory: 27.22GiB(28.65%)  tps: 595  tflops: 34.47  mfu: 3.49%
+    [rank0]:[titan] 2025-06-04 11:02:49,027 - root - INFO - step: 10  loss: 10.4260  memory: 30.89GiB(32.51%)  tps: 6,344  tflops: 367.39  mfu: 37.15%
+    [rank0]:[titan] 2025-06-04 11:03:01,988 - root - INFO - step: 20  loss:  8.9482  memory: 30.89GiB(32.51%)  tps: 6,321  tflops: 366.06  mfu: 37.01%
+    [rank0]:[titan] 2025-06-04 11:03:14,991 - root - INFO - step: 30  loss:  8.1183  memory: 30.89GiB(32.51%)  tps: 6,300  tflops: 364.89  mfu: 36.89%
+    [rank0]:[titan] 2025-06-04 11:03:28,013 - root - INFO - step: 40  loss:  7.4659  memory: 30.89GiB(32.51%)  tps: 6,291  tflops: 364.36  mfu: 36.84%
+    [rank0]:[titan] 2025-06-04 11:03:39,769 - root - INFO - [GC] Peforming periodical GC collection. 0.02 seconds.
+
+As you can see, the bfloat16 baseline achieves ~6.3k TPS using 30.89GB peak memory.
+
+This means our float8 rowwise scaling recipe achieves **1.11x higher throughput** compared to bfloat16 baseline, using nearly identical peak memory!
+
+Note that you can achieve even higher throughput improvement using the tensorwise scaling recipe, which exists at a different point on the performane vs accuracy curve.
+
+Tensorwise scaling
+==================
+
+Float8 training with tensorwise scaling is the default recipe, so we can omit the :code:`--float8.recipe_name` flag:
+
+.. code:: console
+
+    NGPU=8 CONFIG_FILE="./torchtitan/models/llama3/train_configs/llama3_8b.toml" ./run_train.sh --training.compile --model.converters="float8"
+
+You should see the output like the following:
+
+.. code:: console
+
+    [rank0]:[titan] 2025-06-04 10:52:19,648 - root - INFO - step:  1  loss: 12.2648  memory: 27.28GiB(28.71%)  tps: 557  tflops: 32.29  mfu: 3.26%
+    [rank0]:[titan] 2025-06-04 10:52:29,475 - root - INFO - step: 10  loss: 10.9106  memory: 30.91GiB(32.53%)  tps: 7,503  tflops: 434.53  mfu: 43.94%
+    [rank0]:[titan] 2025-06-04 10:52:40,166 - root - INFO - step: 20  loss:  9.0774  memory: 30.91GiB(32.53%)  tps: 7,663  tflops: 443.78  mfu: 44.87%
+    [rank0]:[titan] 2025-06-04 10:52:50,885 - root - INFO - step: 30  loss:  8.3233  memory: 30.91GiB(32.53%)  tps: 7,643  tflops: 442.66  mfu: 44.76%
+    [rank0]:[titan] 2025-06-04 10:53:01,613 - root - INFO - step: 40  loss:  7.6150  memory: 30.91GiB(32.53%)  tps: 7,637  tflops: 442.27  mfu: 44.72%
+
+As you can see, we are achieving ~7.6k TPS using 30.91GB peak memory, which is **1.21x higher throughput** compared to the bfloat16 baseline!
+
+Picking a recipe
+================
+
+**TL;DR**: rowwise scaling is better for jobs prioritizing more accurate numerics and training stability, and tensorwise is better for jobs prioritizing training throughput.
+
+The higher throughput of tensorwise scaling comes at the cost of slightly higher quantization error (i.e., reduced numerical integrity vs bfloat16) compared to rowwise scaling.
+This is because rowwise scaling using a more granular scaling factor (per row, instead of per tensor), which limits the impact of outliers that can cause underflow during scaling.
+
+Below you can see the loss curves comparing bfloat16, float8 tensorwise, and float8 rowwise training for training Llama3 8b on 8xH100 GPUs:
+
+.. image:: ../static/fp8-loss-curves.png
+  :alt: Loss curves for training Llama3 8b on 8xH100s with torchtitan using bfloat16, float8 tensorwise, and float8 rowwise training.
+
+
+Important notes
+===============
+
+* float8 training is currently only supported on 2+ GPUs in torchtitan, not single GPU training.
+* You must use :code:`--training.compile` to achieve high performance. torchao float8 training recipes are built natively on top of :code:`torch.compile`, so it will work out of the box!
+
+
+Pretraining with torchao directly
+#################################
+
+In this tutorial we'll pretrain a toy model using torchao APIs directly.
+
+You can use this workflow to integrate torchao into your own custom pretraining code directly.
+
+Prerequisites
+================
+
+1. (Recommended) Create a new virtual environment with conda or venv.
+2. `Install torchao <https://github.com/pytorch/ao/tree/main?tab=readme-ov-file#installation>`__.
+
+You're now ready to integrate torchao into your training code directly!
+
+Model conversion API
+====================
+
+The torchao API for converting your model to use float8 training is: `convert_to_float8_training <https://github.com/pytorch/ao/blob/152a8e397e1383c55bf7b87a8eaa2b87ffb2c114/torchao/float8/float8_linear_utils.py#L84>`__. This API will recursively convert :code:`nn.Linear` modules in your model to use `Float8Linear <https://github.com/pytorch/ao/blob/152a8e397e1383c55bf7b87a8eaa2b87ffb2c114/torchao/float8/float8_linear.py#L254>`__.
+
+You can use the :code:`module_filter_fn` argument to determine which :code:`nn.Linear` layers should be swapped to use :code:`Float8Linear`.
+
+You should refer to this `performance benchmark table <https://github.com/pytorch/ao/tree/152a8e397e1383c55bf7b87a8eaa2b87ffb2c114/torchao/float8#performance>`__ to understand
+what kind of performance improvement over bfloat16 you can expect for a given GEMM size.
+
+Below is a code snippet showing how to use it:
+
+.. code:: py
+
+    import torch
+    from torch import nn
+    import torch.nn.functional as F
+
+    from torchao.float8.float8_linear_utils import convert_to_float8_training
+    from torchao.float8.float8_linear import Float8Linear
+    from torchao.float8 import convert_to_float8_training
+    from torchao.utils import TORCH_VERSION_AT_LEAST_2_5
+
+    if not TORCH_VERSION_AT_LEAST_2_5:
+        raise AssertionError("torchao.float8 requires PyTorch version 2.5 or greater")
+
+    # create model and sample input
+    m = nn.Sequential(
+        nn.Linear(2048, 4096),
+        nn.Linear(4096, 128),
+        nn.Linear(128, 1),
+    ).bfloat16().cuda()
+    x = torch.randn(4096, 2048, device="cuda", dtype=torch.bfloat16)
+    optimizer = torch.optim.AdamW(m.parameters(), lr=1e-3)
+
+    # optional: filter modules from being eligible for float8 conversion
+    def module_filter_fn(mod: torch.nn.Module, fqn: str):
+        # don't convert the last module
+        if fqn == "1":
+            return False
+        # don't convert linear modules with weight dimensions not divisible by 16
+        if isinstance(mod, torch.nn.Linear):
+            if mod.in_features % 16 != 0 or mod.out_features % 16 != 0:
+                return False
+        return True
+
+    # convert specified `torch.nn.Linear` modules to `Float8Linear`
+    convert_to_float8_training(m, module_filter_fn=module_filter_fn)
+
+    # enable torch.compile for competitive performance
+    m = torch.compile(m)
+
+    # toy training loop
+    for _ in range(10):
+        optimizer.zero_grad()
+        output = m(x)
+        # use fake labels for demonstration purposes
+        fake_labels = torch.ones_like(output)
+        loss = F.mse_loss(output, fake_labels)
+        loss.backward()
+        optimizer.step()
+
+    # save the model
+    torch.save({
+        'model': m,
+        'model_state_dict': m.state_dict(),
+        'optimizer_state_dict': optimizer.state_dict(),
+    }, 'checkpoint.pth')
diff --git a/docs/static/fp8-loss-curves.png b/docs/static/fp8-loss-curves.png
new file mode 100644
index 0000000000000000000000000000000000000000..c8ccbe81a00ed01d88882457c5be0c28f59d1d4d
GIT binary patch
literal 138219
zcmeFZXH-<#);3B;lq5=y3W9*7B4?E(5(OzTSmXi<Bxev2kgOm%6gd|;N43aNas~m(
zNpgm7W1sHReUGQxcZ~1Pz4v8|qBeW4z1G}w%{AvUpEWlD%8D|0*D0=}prGK%K9N*G
zLBU!_K|%j`4GTCk{Z-!|1qD|DDj}gPD<MIrY-?=-wKPUSc@hw*j;*2EPLiapatGs@
z<in@S3WV>89zMOswiimratDX-X)w;C=FkTPU&o~|Is*$-ZckiqGmy}AFn+e~QJkEb
zAGBtmKK%xzW}S5=ek)%1@_eaFd?`WLZi^aaS=T*>hja*oPAQxt2=BmDK~WL%-W3IZ
z4~01SV=TuzIl;cZS(K>RgRO;q-dFc0I`N+(ybdl$Qt#bv$3&s)Bh0$7@LJ@p7Y2$o
z@e|`?6vB*m{P0K)wK)gEwYFp*!jbznnb#{>Y-+CSQ<VjTEj&KEhEgH~=jg<Em`1RZ
zkM@XhFa>Gm9U*x?>ft(ev69|2?wzI}x(aW;mx?ti@WhKq#l;z(0U4g-v#y)@fyPDe
z(3@<b>|Q;Wv7wi`JGR6~I}K!R(!Co2YAv|C2lq{-V~Fx3&cNX`<e0^LDEHY(@W)xX
zxaDq!Czr^;Fl^bo$X`4bkxim(rJOVLJ$uFZ7Vl2ayKmBd1Y@_2-}-#u<McA~6@Zfx
z6w@^E-gS8~`L5e$EO>O*rO>#oD&furvp(OlkIH4~T_*3e{?@Wm$+|lpUB#TNVmJmY
zO{kc2O;6tP(uIClYVyS!OD8e0q4$Rw1!@>SAR+9O41eJjDF#lub0d(tq_8uBpf!}b
zmuUB{|M!fu{3AlOf+88Ti{wjAl6)nGSq9v-x8EX={)RUL(a_Y2=Z)So+)-?vckOq-
z)ELs3RE(n(H3~Zovh|6qBX8Q?d0jPIjCuUhCU<X}2<mBH*P&Dgil?PO>|oDee?}$6
zKp|277>952%93t#8Mf-{l$%8N5gYUlNAe@&Eji75o>6-55dr0Ep8iiTzR}O0VY^8s
zqwK(?i=Qfre9kGrr!&k}$_YoOkx0P){E)p)9hXH`TI2~v7#;nEzl^&ECa0f{M&$Wr
z60J!iCso@U0<OSWa?L%6oB<uzE3(J9cgN?jst7iH{gHXJ`8@)Zhh(AiL87x<DG}da
zy^Q=KRVApa!$7%UjIsRs<dMX&?4^)+74e{b^SO<6Hh!cHqZJC(OHu&>>_cDf+Q(7C
z-zq_@`On6^g1+W4@fgY2q$Yphx-A~qz5JfSk)nW}r9;Onkv6h$h5mRkbT2pweyVoh
zTZBgm3-Ab{Zt8i#RAi^YI*g$)%9T%U(HeSxyDiX-r)tj6G>CeS341kIk6S+}9~5Dm
z<(fs46_(rJ-nZ_)VDhc!UC;Xf?$RAis-tGYVrL@nd4Z_Xh*DORj;*lO{R0-0@3pTv
zCmLVMd7^(j9sT(6qmq8r7ekbFC;!4XNPPiHzO%Ay)RzZE5AU!l+f?m5er1g>H0g2j
zkt_zCk}Qn-CA!{60*u$ngqU-WKrvYLy|34FuuQyNUU1z<HGV;?LBR3}Ttq$iO7ts=
z85-g%#u0e}Ht8p|my`ubR^O@iyhpyGzouh&<Ht$p(S%Vfxqj31O~?_Q_Y(o4AO?Eq
z6UMubZnudT;i&lKKVo?gd%{*iD;S*cu;)%<o5DA-exI{|IvK9#)I*O#lv(XXI-~{7
z$SA@TrMUZI&F*Lg7d&MBVs6hr{x<1hZ<=}^`<~!<7^*y;p+RO0dP_@{#_g!r#xFpY
zsNldz!yygyVKn%zasG|9=IL3<1n<(9*j2A3zGLXT>TM$Z+PVF-4$HbpX*PQM)S31o
z_8~nP(K=2N1`PysCxSCb`SE?Gbq1=t34U%l@!#W~Fn|JvC7r5BBLc>ns+$&?x|`~o
z=9?7fBn-p@B>S1hBI;zHF^Dn4pFbXdGOi#bT_d^5Sbs0?y+T{hH#*zvnvdD<Mn|l*
z$+SneDYenwkGm}w$aF98ZhBWre)@WHnKHX_4Kr=F)^m$oe%_=w1zmYWGM}=N>Xx#8
zPEJm2j!SlPcEAuxj#~DHs&Jm8{zhU=MNOiRx~Q6NO2cE1=o6d$_|-x)o;c#}u&BqK
zS%~DJe#QRHzG-t#9x7gEipL?o6lxS96wy3-UzqLXg#5)q^qz2J(WdJsADXN1Ab6_d
z+`BR3)Z+Yk3oQ;TxXKvKq@W8>wvpTcp{)Jq@#(M(>TI?__TlLQ50%q9=!P-eRk)~z
zIEL8sJZakg*@g(@K>INBz*yQq%0N~gVl6d3TUfjD>ET-|(p!dFTrOQYi%%C(7kL*?
zxugvR3?&VtLZD=J&@RgQVpmVsyY(vd^{(ps(`%)B==*ki>TCQfGrS-1)^QDRO~@^|
z1Ylo;!KV2m8lOh{i?Lg#L6UeIxQ2L36juC}{OkN6zUzG96fhnk=%7Ux&jEK2pPs4v
zU{&iI$eiI_K21~Gu5aXW(an&B5*Cdt4UbH}%sZLa2Vj}hnY3N`-9%l1T?cVfyjgLj
z-P~Oxv6ZohnlT!Z8eOH?l~u;F#YWmDnpQ<3hQ}=(<1FpwIcgC@surRaNe(Fv_50M6
zaUq4>^6}>JtQC^l6|m3^lZhb5?8H3XDBZ{@Ot-=5ZavG!u?9OTNJ6VXd)2DV2=ySf
z06r%EKK>zfZ0KyLRH#BIM~il_5_zNRS?o4EQ76$h(NSP3DOvQ6{o}qjQ8->g6M{Dq
z@)8Q=(-m;zs$LrGHbt`^00zaz&aXpWaI-*8cS1+Jy1KS~l48<zl5KKelD}Htbgd|D
ztaHp%^cu|t%?(j4(P@_&mqj<4?`O!)PpqwZJ!>lrYqF`b!i=JOe7lQo*1MZKkmK}Y
z_pN~ii`C9U#DT|G(@mzmiIu}QhMnz;>x*^Yopz#+X?MJk``>z&Xb3){y+(hEE`(N&
zehZBieG4-d(-><AdmpnFs~1m<=J7S08=BO%iKb1rzMH#vq->__N+|i}_&58i`H5bu
zyb<kNDVcmT<)#Jwrlgki)4TDh4{vjr!v?3!)|O-Y#G45XQw?(sXj&EDCX%`_hTh~C
zEnwetsPj7OIGVuW!wGy-A?a#hZUCE$Pk)upE2|sPs+1&t>|XMyM4(#G_d|G033rCq
z)2|=)RclmrRpnF)70Q!@+*YfhSOd0M)Uk^29=IoG$h)Wy;OK+*w9SQ!hgrM*{27Nh
zRj=`0FFh8Y6@rAdX_rawF(8Ev6<P-5x4Oz>MKv2V7c}b)3aV7jK*9`e76<VO*$KLW
z=+&~-Zo6$RP#6Du<Ka~8Ipi(eCcVoa#^vPFb-6`N3*ci+HzGDZ(C_5zEV@%4rOgx+
zJ#$a1(*LTetoGdzJeTiNT5cj|QrTM^UuxMC@j3Z3?c$srrrpG1Y>&3c)`fe|8SKV8
z%#|DCByk)M^hWFNJ3s3-Se;8~ZX^*TMlhdP$o7Xv8KligH4`-ATx2##rb&WrJ#t3+
z5i@f$fsGp)d^Te(#&9{`jK&Xwk&)3JI_w%3oldtJ@{X)tNVNopMq05}=HD#{&#$Q%
zcXH^aK=Arn&=iDdOjL!I7uZkfuVodAt8c0_IG{WD7)Yo~IZN$I2ZiMEdFFTJ)@d#1
zmpetwW*Wy&Tas8clr>w+A;D<~W9=C)j*E+yim$McA@I<`M8L$23i0XpRr6g0>$K)h
z6zdNrj-k;;>go!X-8ou^<Ksfen#g^#`qTzfr`63MH?#vDegPiKiOxyw3W9ajb+-y}
z*kw671bZC6gn;kN?07y?B3L3L<jH(OOG9RUX2IgO#U5me|AbbZ7XJCSqk#hOz;G^o
zjSQG3gN98^=w<$QjZ2%A?de;wOf(e=*0mnCJMFAl28s>|_`)6sOUZDhq}c>P$Kg}U
zHNjpxe=o>ozy0)vyJ4-xX^OtCm+0W^aG&$1^T)eVVL@z(5kg^lJN5Q+wjUSZh2IMj
z8Yx`LceOs3Q;w(>I!zHyJG*ipE_P~TR*FsP+55lD+ACO`+Hvzc%=IcghgnB!kGwxc
zJ)EFz60JH{{{H=#{x~gcsyPfA)(MXh$?;e{D=TNpUYaXq?yZ5#!M&E*j&;`#6*w&Q
z&W`+NXg53}PHXf#^zhHB&mu4KbiJz2hK6aUytW*s*9fei&a5^fTv|Py7Crh;nP^Qs
z7(DWij81bF>_(S_(OuBdRT_fDk62%!F7z>?zY=#seJF?Z3bi+6kU4jE_Qj*;rsIz=
zE^dJn?_dW}qTqdpi)E5tOzB|1n88QMPZkp;eq~01vQ2}MC}5M04`0CQP3(C5#?)ua
zP&{KP!^cbYxoLml8O;=0M(z!=sf!!D5<Y~knNz+%ei3M_A#0+bfWiVCUqit_r9i<1
zj!=P*7%Jr-$I__xQP6*!M?*pJhoWHotBoS?ef9GW_*~ud+c$c+9||_`7ZLDrPDcB^
zHP(7E`tQf+AAxHqk5naOWr1&1LtA5GD?2l5dnncNHgE#x<r7Ui6cmzsS07Ya6^8FX
z|0B@n8ul6r@<N8zFm{NMwSh6aGwkJ6KPV#3Lck%+*d9XX470Sd6LJ>4`=f;raC~)|
z<1XEgCiWJhcQq80=_IUejp_K<IoUbyie0CpqZ6?;G7(adl>XQ4z+a+w&Ft-83UP2a
zIXSUAakE?7nsRUn3JP*?f;d1RHlPKYor{${#F@>?j{dh!e(y)p*v`-v`qCb1ZAEw0
zFT}vw!Cv(4-K&BA`1wsvV`u2UN3yc}*JA+>$Z>UrgNvP$<Bz_9TSczU3MoUKjV(1L
zp)f#az!+kJe4HXb+W*Iue~<X5J2n1&Cl^0I=+C$Q>C*r6Ry8|gTM26zFs8lOzvt^;
zH~;zKzit%axO((Isp2<1|2PXMTI{+A#~+g>c6}ipH655oDyXE=bKo1Wva27|ufVVS
zzkOdFuZ+|^vb07)d59t_`RKVb>U!dhIx4Byh8x}wHTnoYXrrLcUb{<*3b`qT>hK6{
znnYLq8AhnI?(MYYz^{1QC1c&6I#>IMF*KvU24**5I-nNX=rR#$o*Sl;;bPt7#k%w6
z)yK;^HqqGF0Z~=af#|~8q?7aTfdN(BeUIJ=yRY&5YW3|nObOq=L}^>C3|<_yir3U`
z)^x%~i|)8~>l400!JtDyz4j0V?Y|v9yuhd!HMmi^KdfB~s~Bs6+4jpaiP~SDAJ)#C
zE%K8&9G99%{#^&ZjgU_C&W4oSF%OLRoG;hhMET!_`?oyzLq9V1x(=7poSbiY=}+PY
z<NmFjzYjC|tq6(l_SSSbV`mocpXIv!^hE?Zfynoi$EGh{{&Vw(bde~2x-1mazo58n
z49@jH(=Ob9e$*%TUO}P*{rLZ3Du72+7D2_Wog?Q)|EFm~!BD|@F`AM3OFB?OK^8c-
zbp5>{Tq)T5IU1Q`j+rz1e>Ims=CAqI$0F7wF7CfEt$(%sUzPr^N`Gag{$I9IZ_&fa
z0cxj78%6P5%f_Q-j>#c){f)f{EblMC%JKEYekcBSi!7PIo4ZGV-l>#5Nzr6VM*O7j
z=$`l;!Uw?me38Lq^WR;`K2y<vqHwhYz97R>$<|@5ydm2Y)g?cOy6OJgdUn8Ptft<!
zdHmlU@<$%D-No*B$DX->LiYvM&58-DQnK-nF{4Cwba#awzAyroC_TLq%72%DF#Gi@
z@Nje9T5gPZX98%=Xq-32;|NJh!yLljupL6L+uKaIe2*}`L#S}xqM(}5Rm{Lzyt9yN
z{Xw3D<==R-cTbbq^VU9~_)STZbFK50e7#SL24yTs3d>$%7*2tV4n4YO@a7K(@gE&|
zLor<OYTMh}p&q#+5YYz6Sb8jd!@RH6=>8666TO9(K6PCGR@Ho{T`P^7rGe0u;6uOE
zZ6IgU92=iDVz}(MB<cR$hJ3EueT^dzJA_*4d|1|;9oA+#tqH^O&(~TE2c6xH?L++`
zBeFh*f1|-y4^c68_?jHYp-fJ50Zh{GS6%GJTWmi>Ik~4bg)fz#;}XGLu*jc_84gw}
zaWp;>DLE+Qj)xeC&j)j-E)8es3cs};cQA(Ymww*N%`31K-l{7-JsD}-oIa?ijO_M4
ze#*dUG5o-3DbcCMpT;%2Niz>_zPa66yE}c@aQ_`?!*^e+g^tK-OowJ-^(xVWQKZM3
z_KdA*l8cGe{0VN8>4<-Si`bUyNbTe<{L;PBq?^L2i>uYr-G~0CPvzZp^*H%q(d5dH
zNcSk7XlCUEd580I%v{u;VQsgK&+vz4?yZ@Q>e_YlZm#AP7D(liIhMc65qy*c=wNfd
z(5qg%*ud9qMNZ#*xXf+1G-=^toA$DgO}{}Tke>jPbA2aS<B|(7?!r6dKM4sh{2wM^
z#e;{TzPhFZ*M$*flobo)GeumtZFCF0KRARw!crUFUL9_Xo}r`BJRJ#X&EDRuUP@BT
z)K#Hu;#-N!?SYJ{Ni~@4ZZ@25S~Z>@1f^b#k2EauS&ni($D%zQZJoR+Lp4j|{{4~D
zUZ0E%>xLgi_Sc}jm*Yr$;VzG530m7A61EOwKHORz&S6hN+}d%uCqD~vWOv_1-^pAW
zZtg8uQ&8$Hp*(PLbZH);R2?dG!%NTK9&DFvkBe8j)bsRlHrm*_C2{MN3h*(TqlRG)
zu2zY0z`AR7Xd^`y;IojweU>*neKK4r{oZVUjP~NYe@g1O+gAOQoZb$R6B3U<c#lKX
zFK%)-74TAh9{YLv4u>;djcz@5NfGfmZy`&}50SNyQC^)F{XYM>s*<0h4dZdGZR4?m
zuQZtOLxcGThYLJ!W%TAX79@4N?!1DuCVrKo<3RRUlmrT|h^H31bXz2ViOjXT>L~nl
z^%&Mf@%?n`_vu}KVl<XFi>%&ihFNRydf=s(ZDW%^hmH(w)Ny1z64{~1vO0SlR9WFS
z6->@O>2Wy4|3NRzxru&~G2U{H#`&vv*GL%1da*r|T{+);{4oe|yeC`hxZBMi1`f}t
zr-joF7fo1}c2B}D&z78Hy2Od$1zyW3{vci9{FWN4?YU;fymh_9nvv=)ugg=9r78OX
z1$vnKT&MZy3eC`w*jYi<-1SPpOH^3{%VM*OyVtTc;a<am6anqgG^M((L*#_ZQsUG|
z<AuXvMP)t0DMm-{v?aXLNY&@<1ZN|y`(iK96L)&ASK|!o`6Bg!({K^I-m~~S&Ceo2
zTl^~ri7r=n<m#*iT}H@dUzleZSerO=for*rg9*3x5d+e>5$reRjZL$xcTf^t?Sn7W
z)}16ealReqWiNg@)_YfV!47_^Gs974+8wu`D1N@Td<+GV8u=}Ir^rRKJHSr{vnH)Q
zcjKQohl%VwISf><`z(5~9p*%_)FZrQ-*_@qIO*kivAfxrdGL_>AZV`#=kgeSDF_NE
z%UWHC)~9Jc8Sy$Fv9h#$0K&Jb+m=4uu=c7w7b%bBHm!+nJX^SVLsVN)zhK674YApH
zvDP?g3W(Lf7<K};?O@*g>O<fd=DC-aHmRPkG0R@N4m$LqJxit@Hl*1lBfWflbBo$>
z^p2~Nhw<Gh&(n>~Zfj3Fd&OQiHzegWA$8-5g0-!`*aGurI%(sm=yrgTz4&pv(qx|A
ze(rMp_O{Jom#G-H!F`DbIUA+DV$ZCu{N04(1Z?VLe{G7ba*~Mralc^qM+&KV0er5@
zCML0)3yx>otxV>us#}qT?ip?;18|y!EN82ll}t0KX}~vP9&S1{PHdEq==EJxU0!Tm
z(hzL8<JLBw<TcuQomP6SDGJPDRCco0O1AWIcpY~xi#2`=mz(V7pP8g7+)W-Ra_iKd
zp3^&DRj)-7h);$nG#5iUMlZZBw=Sg)TavNAiS6eog&Z73TDe-Kj9vnM+Yz)NChpK^
z5&vZx{04H^CL;zq=~~enIxo7)n}j#3kmq|@;tsA2FSZ(xu6%QR6PCB88flN)WLzbJ
z_15ePO^I@Koo9VFYt{;aLgyRz<eRU2{HCmuYxsnD9wJrn;?V1ozlJsmSP{aa_8Nz?
z!qeNKN8u@+CuELxi(NKemxo?kp+c+oE6)!mWO{=KmlPYZ#m-lhYQ=$HId*GK-kW!t
zYu5^Dh0Y6(rnWqn?CW>*Dl9cu%UuQXz|nz^L<&6%b=)?}H~Zx{91bV#lvc~@P=A(l
z<<h;FA}pnu;f!nU#i3jrKcc{`jcL;NG#GW*y|%9g!>zqCpT6h~(0KSbp7_aoVYk&F
z``9P-3i?Nv6OHHb5#-^6Whz^M5uTQDd>=aW*m8qM*hCETY}Ji4I4%!)Zdd7_^hZz5
z(;NyM)^B-mfM|?j7|O%E&gM78FL%WgJyTZX_R|lLv=^Kp%kXKp7Ve~35_X+Yz3P!M
znU;AeQr&MC`}&u>LiGUDlIpcxTOV-A=h!j6o-GUaI?3`13^hJGpPD(>H40pP6O1NW
zsR(<gnSx!*A`^=*3j+eH;^q4Ymw_?qzAC!}0?+S0o7NYL)~TmbHhX+i60}DjvG0}^
z9E#RQ&ANU>#TF=zsJ>6nXXS%i3z#bi6lSb)uN;q(PjbHf_ByN>0?gc@SD$&)`Qc1s
zrQDutU#gVVr`MPR!A}tPPyM}){M+8jp9Y_wEs2N8mjMBw(qg?1ua-$<7Ux+KXf!--
zQ#Cd<j^Ap$=K101l+(<HQQbZAAdqJHiSo$W*qd!TvdF?s=Gb=G>NQ%-vx~z<CndM>
zfyteP&NMgSB&Qg-j~M!iD4iYH#8qWrOCZ)yJnm#_V8Y1KbCDY!aAEUk%Wc~t#N!ht
zX%okUxbe=);fp$h%JUW^_T0TReJpmopT$9qJ6{dot_Zh+^VH1Rpms-1>Six6ag+QZ
zSzhl7x2m9oZ9%U{=$EIT4{Y;}=-l$qhmRZ?2dmydDzdJYt;%ZGw!iywof1*jcm17V
zs34<ONG3;Y`N=|hgyO1}cgD~?bv+m3L3MqB&UacRMgaqSb|?LMtmb8b7E?72eWcro
z`qCD@otmbJ#4E{5vC#cEaFD36`Tpo+wOty=_x(&TO?wl0MzddH%a>JhMEHQ0<Z!;`
zEpj`pdXmDIsx(>(nM2w&D}!E@Q;v3pi6DH#TT1$MYxO-9TMehud3Hv)9!tVAHt@4=
zOlgs?wc0Z-Uz*)Zi34{-_urGPi1IGDt>$D&w`L_eYL(SI%Y4$6H&CR?gzy|Rucy5{
zYTYcT-8854I`6s;TXEiQCY8y{F~WyBz`=g960v4l$ED3A+LC#9%U?gx8xsg@dG?s#
z@}7_6giyzW!RwVndFoCL)YNdh9>Gm14%cV)`9rZ<4(V#vAY2D=(KXFpbNz_sqJeW^
zF0Px<WMVhajq>^ofu{pk*@#wo)~DXYK*+Xw<9Lz`b}=N&(56o`=TwLF(c!e)*7Ech
z(NxA;TIa&?n}yEA-$;S9$4n}+Y=EU}N$jxtrq_P7=9K|8?)J9{bXv&CLz7RzhuH?v
zpRyw}=F;5On^p7p_65Imh*P&7!sQh`Oa?y$ZEj6x9u6t#=mCDPaz^Z6)Nlf>9}Bq@
zD%aX#BDnPIV`+|1603$85W_}SoZjQ|B8mo<&h#%9^zRxf!lllYX3maxr_yNlv)kSc
zdfXqVD{T)R$rXY1<qp};oNqd%c{L^5o#<vo!p*N%fa~NQ0Y;Nd3&OLKz2AHyXUMn4
z)L!4hH^tz~lFGz9Nx7~W6@mDjpKuwkIJ_VE#gI@f(~hhOFWilv`x0tZFRX(XSlAX5
zNG42B${x!4LCw*o;p{=w!#eF3TMry+db=ncPi*xTeZZk+3o&5SeX&|a#sDy0&dQC=
z9@w>cHvIjh3S<Q8moX#1Hv4A-(No*SdYvNu=FEu2aPI-(!Z*XYl!(>$V+*@f+#&IU
z21rGdpsqJp(RpQ+QQ`@favj?Jc7eXA#O+nqSQ^mATqYY^^E1DX`y=|a9^15yq?dzW
zH;|dp!*<*NJg$22Wpc+vzeF&7`}!cCdp%osQN*1zV%3wdEbuqzy)gOM9>xJh)~|zQ
z8;ksn$KA`$w?ooUX)fgQ(2R}DC?#Wk>J@s+2fSVy>$L6lnIonnb+(eUj`!=9L^*1B
zf*?%v(k<`e_C}5p6|{L)y;zI{0`eA@zYRb~_dT(ALgi`5L0a|qBIHI|PXg<4p)l{<
z)1|ZB-mL^7p-}ZcsPL$%A`Ch{Hg~w=?3ajp2!wOtKn3Ypz|T+g<kVCU4+SbB7K10Q
zAcxtFC(XM(P7T~*)aM_n3x~o^&f4tHSCM{Mwxq)3swW8+@nh4c;7irRq{BKUimWF{
z#o`sG=q~P9hrkS{=Aylb(Eidx7hjN|@t1b{0g|Y3it<uu{Im0U%$2hZX6~a9>RzG2
zEj9A(6Y9*!K+vL4yja+FiMvNdIp%|(yEM9YCT~~VTAZCYn>GC)q`P07-h#FU`{#mA
zhgY(|Y*5IfB!wBnH8)`j4Cy;xdY=>wm@Dr3B{oP7N4J}Uc*;Jr<v`10l3X%}bhH$R
z3Q_tTqqLr-XX=M0_L>E?zJHX;QCsd>Xg4HlDY+c0w7r^kL~%aYA>N&ld2Bq1H(`J*
zI0T^EHVKCw6{7B$)k&DbnOtM35>;t~@(Agg%|Pkp9%e(syXc$!78u#^Bni?>|Ga1i
z5+pm!H)8P#_xfHP4`N+qAh+cT@`Q%ET?Xz(KvRgJ=4ob=f(>0du-5Ditn#>$N{52S
zYYVpyBT*R)HN`#fgb`Fjfzq(b9JXikr=m367sub2#09nP<c@Uc;?9v!I*zCA59ajB
zs|;Mvv+EV*ca^(@L{_IUax25Bd103^_SR;#ZAY;_b5kx`&2ir#qwO(K)r{PrmD1ea
zoUZ%L`7XjCf{2<y7FC46P{%}%DRqlUe#?+s@mP-OL9_P9Rs9!j=}P9svAXF%_@E-}
zo#BX5WZSDAW_iwQ6Qn-GGA&Tp<8Cy#>XkoSpi7DP7&H?k9_=cf2&P&+G&6NuH>9P6
z`RCf5SiTr_=$|F~&v@m{g2O;=FrM?oOGx{y-gK#2B+PC8%O><>z^!3fV5dvgaHW=k
zm;COwjs4x$#<{IB&Q04l6r;+}ytOx|NUOK;cQ)j_Vu`fW(urxc_9KVOVDaEDInYx+
zSXNdhvGL4N3x8@P?@9PE!rH^ajj}#l0^Vpexm>MiKE9)p`NR_ApxQFK(g4X0HI^4i
zuGswmP2*VJm-0{<aP&P{$cdCanG?0TLiwo(kyD#N7HODxcBbiT=#biE37O+6>pW9V
zbIYrWlMgmT{IF`5X_qA_);uGc44dIqdT6eidoh$Vux0yfoKGdM+~~Pkd2$lz$V8c~
zLa)r4yQ97}ZT+y<+wu<CybODV$^InB2$Z6E;(g1=-o=L;X1h`+Ok>N@{eqg+x&~E!
zQEer^RO_`#J{35!hgbs&*PSUYJ&-%iH`7*ZPGuZWT{NBC!<9Q%itA$ZD3~91(YL@f
z-738~?|DMYOg>&y=+J$iZG-y@^qK{68kn1r7ZEkIg;PGgp-}!>F%Pr6xv)jfwMVx<
zCNWQapW~yw*It~X?1&Bie@+_ewdV?S?S#mpPNhgs=_j70mQ>8s3($G;P&&?-S0vec
z+#l9#^<(uRS&`uL3Y*}JKs?fVlCx3gehWnZ0E-YzFbjsVpHW*uH8`rp6)|jt;{J`E
zHUO7szmIfTYoA_K(rYinS&yyz%`%mKZ+d^O7y`q+nN_dv7<{Us|J4HXc_Ac=4W%4c
zr&scHfx~NTbH<HMLOBmvHkF0@xypfpa{Tpk?E{C39yTt2uJtnF4Dh3N&i5|w%JK4S
zM3h9l`oU>7aA!=t@u*mv#(cj-`Pos)e#bZCL_7%Hm!B{<$$Oopjlhlt$$MPuJelAj
z=so?d)kbHr*bFV-3{z4o0GwFG=a}A8^mv)-_E_6HHxe?sqUktJqk5QD(LA)uC918g
zAil4u2&xp{jqR-h_A$Od-Q;0PxfR`f6OwR;sgZi=ByeKKS=6Ka$$8l0v>U<~EXbk(
z$HJOJ;}6Zf5$o4d);NcsX&;%h&Q!IZ4S`eoH54Y`=5D%(uY(@(CU4fp-kr$cYzNMs
zX5y~VPQ8?{Z+vUlpWErI==n2>^2a)J4D@H?+I@zJWTy=cR(as<>8G1mq04JM+PvuB
z74D3w8(!wh9s%yp*%zC5y0nLR#0(^H!Y@`k-92n*`8`q)YI4y!wz6~4`zLeS2A%Kv
zJEE#qTpTZV&$nvBJl75T!aI)6io}EX*7q{%8$KMuv|x;(Hmu`Cr$BBvyZ4}G8X+=&
z?BR)@S6q=kSf94^+QEuzRM^y#rt@sj?n}Rxd+$j>(c0u((M$(Rcb1F(UMi{7gjh#a
zP<$bT)H*NMy?mU<s^i>H^{@n7n%iF0KO8<T^sIMfU{!?N)Le?vk;D1ZjnvVy^NcvK
zu(^~;-9kS2U3*ysP6ly6A{(E$aY3iXa77G-lD4TiE~06J2VoGAKk{{xO10IP%yGM-
zK`WK5v_wD1OP_&@kd{0`hRQ~=Y{*(9G-jD*_|oVeA}InVcWDv2_B`Y!KP)W|@z&UH
z^*Ea6CnOBri-3o55YpCcnH%kOtgft2n^Rib%nnm~`0h9KG?0V=oNex7`Ff198bvWh
zmAuYXp=PV;q5%>|ASF$U=pz*OV#TRR5@l3X+7R7x2^%0CmsQByFAMwzRdUlRlS)tW
z&B!EX9mfK}h7#n(5R-l7TFoT@u_8IL604*|y$_`N+^(YQ`rD-6W%K;zxMVaTOg_??
zncy+^i(Pn_zx+8feW~3(q|a~aG_wLJ;t5bok0ul{u_m{r!6EY-D5o&e+}U|z$Nm!q
zYgg6Q;3<DiJmGUCpG{3(7+#I*{^};Gu-?j;18CnBk5M1Vt{1!S%i;bh(d**4uWh_R
z)uiteHZ9fEWt>EB+8U2T$2gHHoDH!#xTMf)ceXc}tAe<{VR<gbsui2%rt6mk9x?~i
zyO3$)reGFAURV@Cegx#@^>%Ru^B~;X!-m89%{R9c--1h_+7q4|!ZXLAZh+5NIf-or
zi5QQ!kBXjsN2c{Qw&;|btCd|p1~ye?6CY0$n0IQ~On6<Mr?Ke`X=(>~p3T!L)rbCc
zKkwlfhC417?0wGGdZ6Wx#K}k}Ei?qe&+@2%BjQzq`jFF@*6ozcrMoSy#w}dyI*WL<
z&I?07(r5>Bi_S8}TN2VfT4z!oS~Ev=;NF!RZlb%23cX$fQE$Z*785-+p~m4A{)5*=
z5R&8-``mYcN#R<bGaX%t1&@n?EP!<qq#g@hNCl6Fd@kYUrwuXWHu+*VRkojuJMkzF
zrIf-Eo9gAO+M~Ikv?Bf8xDm-rb5s1p)?(;rEn99Fgvn0Gvmn00btsUz{EFCfolXkf
zcX<mB%N(&`?JSDWWa8GH7&b3A>?euz5o6sh#Trs-)$(OTSITSk1elr@W-0M<#PU_@
zMr|?8gA{9!33T^M6pPj(&q~;@6G7n1n}b%3Mss8(pn}=$C_^39&TDGqCF5AbSu6U<
zP>0=!q`ma)+7``f+l=0fJ@5adK2gwoZ~fpVIjp^1@fw5>Rvq!aEo%$!`C91|T|y%G
z#Ft=%oYtc&o%S9%?DR5uN_)Yj>6t^1dp$Po5|irf_Xa!O9R)dg;1sCwpQP&M?YqV|
zoJDo!!d=;?Voj6C9mY)I9y)a$0JAVK{Hk7|(bBjmd*97Ud&@z#5IdHz#^g3~6JR&o
z$|6(180N&$NygC`K>E|1H+efEsduC{mnC$+ywC$yrV9sO??_jn1RLt+4aI9^FxW{>
z++$qH_cYg1%NiY2@5Pa?C5>j+r9cqwP7$ddX35`+WjU|#^Z>XKQrJwcXANnYukj?1
zR<JJjM_rf)wPD^Mk&HGImPbgc4wRxB?n<}pUXi5B?o0Y7md&g?fs;h4d8Ew}$IC9k
zvI-N|m&x6rdC$s0@{4&DuRgTr4h3D&iQ_HqOEFq%q?CFFbo8t_%@b-Q(9w3>P`FIA
zNdilSbC44C+HUfO)sX#V$Mb<LvF7-}E3Qd~mAQN>XE8!BdqdGUCT}I_$;tYP{#&R+
zVw}A4)Wpv{nD=k=sf)#^#REK0>Q2(kxO2To{~To#bD>TD;!+(R8n6Zuou&m(cJzA5
z<xYw8d$s#XyvE0s7AJt2n94l8qWb{<)f-enK1e#{N~3N)@PjR?#YGV<lrzkM=GCwk
z)|DKVER$;%qo$fFhLn_*m?1X<l-yHm_xk1NRhK*UFG_Ajryu01*RzaYSJlRGtT-Bb
zA;c6~Ke5uj8~}G2>8*1gshuV!XL3!7368AlP7vfCpV6Ffbfn1IK0RT!+mKTg>WXnC
zfd{MYt6t40Wqg5ag?e58)1`>GP3|e5^I+cXADpP}MRl(SJ1BIncu_IdeM!{v@qU3y
zKlgBxn&0k?tfXhrWo#yvPuIvTLEWCmo%$^jGB(h7FgYiPr15;ix^iZ~+hExI0nGZo
zstVR5z>=nkX+c<Y2g|})rnUHlxb{Z?_LP+T&B=q@`fv9*Y*@khZ$tM-)YNqs_Vl9E
zv^Rp>fY&0vYyjE1Ryhl@?r?X!UA<Q|Ufj#G_gasGScGzB?%c>zT?A+Y77we?yxl0a
zr6ovCS(12;FSMMz>>82>GcbM`+TRZlOXnFgQZ>D0qIqD9RazE%KA4@$@j`U1uG19n
zxRC0i+nKx=HJrb^JU`BJ3A)xfoeA^GfN!FbJK6;C4vL$<RiAC%T3Nc{Lt{IH6l-Mc
zld%4VbJU-X+ozE83C^xts^rt-2rE0nvgxo$C_5Ik_Ic%kRE#ltwH)Ni3xEh>F4u-A
z`L|gj0P&1Yd-QP6x1`}4xY5}m@x-YhxsSW}V!os^p~CmW&15wpknCKs_|Yc<X??#n
zAzpHJP)!+&f?Wq)4Zx))Ht>u@#he&uOZ#>)k%MI?4$qC#KY5YDMwwq9b-Ge_lD!|x
z9_1f1x|L-LPITXCe;-=`>EI!XzABGdrQj9qeA<hq8nK<mhF0GHpvUDoQgOb+=-qMV
z!BCDV$;H5PcP*UsiW$#Ssg|5BTm(u)>@90@0brlQYtK@W+<QEbbDA9#$GN}}ORUwN
z&WOGjF2^3wb#Dq=sL-ZKl`ROu?{=`>Ry0VG)S;v`^%9A9Qy(D^!Ifb;mDB!x#lsm^
z_gQgk%`?&^*PUlLLC`Lh*nXRPybPqox;Mv|S$s3+RJ-^7z*GL%?D3?%K~*IOttryV
z0VVM%C^2Nxpp=OKsR%cQHRfdYzNyHL6uh7I>`)_1GZP^*9|^H}u&w05XAEjp$g|tm
zX-Q`+73DiFw^h}iH<wDPV)Y8iP%|@^0$yfl+_iI@58;=#YqjZ2zeRhl*uN!kKHa}n
zR|R#`Bkvu*P&FyQeM-J{qRWg_IAQH&%f#K%^AXY$%`FxKHb|r|H6G>R?30fH>}Xn~
z`#9*i_E5+7wFLeoIQ&2Mkpc5bzW&?h*8)Pbu$ZUqZHJqu#r*!xlOSutthyH2c=#^g
zwZYFt5sxy7pKOyvp7d+z8+3kq_bG)jZ5G&4FrMS{)yhfbNZ(&5jcZsRrbW~R#Df`f
zlq?^v)Pbj#eK`5}NSuNehpy9kFc&b+D>d31qlNZ&aIQB!HEDV;Lo<f2mYEP7t66Fy
zwbUd<<q2%ASDY?C>=low&fvHhDie}xc~_zNyc1azAqL7dO3s!wMesy?`aaq!#wU~&
z=`p^;#mAKzq3VT~R@_B~s5=3I2_-^cZBUG+@-S-?hg?tVJvo1DAV_YoELT>#NWS)g
zUt+-zZ~|j8Z0Ucj9o@n@F(_lARmYp6*UHAX9>u0jvOn@viZ_<Gcr1NnT<qDReqD{?
z(%{uLnnSF<R(S@ozD<N+ChX==kKj^*8D-y5y$GIgGlJOY#IhB^9W`N9%T~i-^mvu#
z-OcF1B!C(fh8gEE&dW7Y_Q#2Jp6E0kmYhrhkf3jiWaU0}lUy+n@t{`Cxo#qhm$ftJ
z>?c#@8x<3)8*SOcc0$JN2Ylz~SmfIv%AqDjxXpH8h!NKZL5@-}D=pFcr6L#9dAlID
z{aW=2%vOa)0uIk3m!NII|CV%oGk&{LTX=L@IPJbS6?1_*uoGw<Q=M0pIif*fB&l{Y
z%~!D0wqtzeaj0=?(NdCIMdQq1F$r69?fod~&Z6C+&qYBI1J~&hEPYQSM%@QkSP>-e
zx5LXYb=(o)0<(;F;GiZ(`1C-O%L$s6pUl>QovXe{6mCAScbpGvTCVG25OtEz(-5k}
z9&|&N0YFlK9p-&Mw758Z7a$K?{E}=k5U3GxxcA5@i>tFt--rU)T5!!GWVG4NTpsa!
zAh%J&G#3BL0i~L{x4(I6uE{$b_*7I_Nw75!JECPnH0yL}(ylioSZRvZ93XNFPl3H{
z5`^U`z@Oa$X2^M)yL~WgCMw2NUm-I%iQgI6D|IA?RZhEF>`fN+dR^>#t&HwES&p`+
z_eVv6^zj9czM7pXJ4AwA!SK0&O67H`$0ng*fj~D)+!YUxOe2()YLoHTD(CivtJN=U
zItPjdVnESGEHoZ_ecQL+Lo$1-!2%um{S|rUpctd!L%!ymDjx7w$Jlg(E8@bHCZlU^
z^ug_{D=NG%P<n+;VQ=gUH?Is7s%_vHnq%6xBIu*!{P|WYo7nuJRm_P$Dm>vNF|GHp
zR>Y@MfVUKMP13cT%q`q}hEN{fsue$*B?yS_Y`dj;j?H!<gR`1lw_mHs$^re^%Ku2@
zErQ48aajj!{5WJ}d7VwxPN=E-qjKy7TYr4cINhSL6LE(%EC2jF)eKyyCvD?Md%i3q
z<C>r;qDU^@P3EW>9x0p3@nIjc3_P}1K(fjo)esXsn??NW#5n$-*`c2dWL{SClr`5L
zR``jD`+G?a8-Hn8W!(Z>U+Hd%PK3I?&7fUx6J7h>lQ<bx8v}X;#&Gam;-Rt<#kz8$
zHh!_@xwPWF%NG8Io3TVE1U6fNqVNPG##OOF4?06R);%M~b`6z*179dseD4t`zN|#q
zBqP{3wn;M%Y!(2Y8z2c28wpATzgrChb9XFLW_kc+m>ZxL?2tPV&rEbo2XYl*%{fQv
z1v+EpC*`I3)2*PoGM4Sdcxx-KmVMmLsmu!eAyImIM1F4#&!FjZxG;imsC21>XG**#
ztSs=kmpk~qxqGZbP34gOF3GWAZ#aR+&$#r59Nu+6b;11pqV<MDA@uY0S|i^QV1<dh
z3@;`P-F<WPOs-z@Vve-&C1_*yi#c>u6H|LQ`Ut#RsH&sImN6s=T6GOc^>k_b5^fW3
z^1{sFYg3aX&zqz|zIByjPp-k)dJ)`O(C&vv(G@^6`LKHI4gitZQ-GHw7j1ms>l(Yt
zN&2(B_$N&7DnDfsJDy-)m}_Zf`BJ8p)y-4hivkriYwV;YM5+#7cs}FFQs;p8baAc=
zK{4#}iPaM)U?=GXL*C=V5nuweagfS{S;H)z^;@uqgET_T4Sv3Enx+QP>fU=zT1Pjq
z+S^mS>Y2Zk)IPZf(~_!$AhBjPs}F?d-qPP40Bfu10b8iLhHKmi*o%y6aQup9z&K5K
zuPZ5|-cRaYP`o>?-G;nv?k(w@r=2Igsc&2)%DBm^r~!$_WxF!d2vgYR*wxm~IM)L<
zWX+_1evzE&yIsQNJIOE{j=Jxkm&abL4I_doWORVN+%kofilo8P?zyGL_Adja>t+Wy
zW<heIx0JN~Rs}u8<6IRJD$s|9V_XYn#7@_5-Lq-G7hQFOz3QXqW65hjgI#EMe{A*Y
zPgh=V38(GLPbfJ!3`!NOKOuJ<(Xk7uJz34Oc>lmpm(A$z6IKkP@kEb<vG?yIfGp>j
zQFTd9|3syKB7ytq*JcjSV&S#?(o`6Sn}qvUZ|q60vsSOFFpqV^4b$=cgIV66&E~6z
zyclI385PC(a`6cX`EuD3%>l(cxB1v9-hWJT+gvdkzgJ$9U!b~9<|upJ79S1$+IsC)
z!{#e={FkR&jg1pFt<+PwYI#>1`|Ay73mmoLK+yzx!6GaOqb&7DS;Of@C49o7uznIK
zvAGFzI|;FNM_z5jR+53Z9{r>S&-*LRU^~E{#JgCQLN)Dig*#Vy#4F}Qg?p&o){7N;
z5vl_nHAhwWV}`#_?FNuCnYz?k1L`BP=(x2)lL1X;Ky`7Vn(^BkKVw7xWj=M+sBGKr
zD0=0WUq$5WvaD-!h8A3l<OF`YNj&7NJV5zh3bSIv&z$4$59Ez@tx226eEF)lZ#=x{
z6_kt!Erj6}WaNpa?DfAHnod~^HP+GG)sqa^K>5z}3bNE2nDlo8{bo{ai9pTt<`Z(l
zzw7$94Z91V{_#w+@76!JtOn|fJE@t`e?~+8)sjEL0i}wwy8d%ZIwwGR)%3;>f5x=^
zbw}|C7=G7OO6i|lep5t2vOA^Y{&ao)wc^_g82%!E8RxI^|2}JfI_o_Nl&CI*en9=1
zZ~iMG@)anX?ST`E{&UNB!a(in<a-d^PnY6fdOZV%KQ2vW`sbFmfR#iGt6=?2-RHla
z>y<bvuCNz)@1I*f+ytz|R;J_CKbzkF8tMPvjg$qkL{GE*)~o=V*8Szz1e=+vc?km1
zZ+lD@!l&z{X>vflLRfxuKkeUn9A#ECZR`4SN=izLR`(HIr)pwWaGAaxA-gw_C)bC6
z<639=H0{-YRX+wRX=mKLINdtrn;F#i0%(oWWeVN+3<nBFwW(muxeRMTjDs;#+QTa-
z5x0J6RoACm?rbA?i#x~#Ei1`2*KJi5zRJkN1kiyXS`O4GiLXt!l<ZG-fvoi2iE2-N
zmqFskJN{I2Kn3_x)C0{q_L}9pYqLc9vKUvj$cI36@CZ<IJISU|l$@>^n~9I{gO-D+
zL<~Mc>==juA$amu(sztQAafX)0%)QIg)aF_9Oa0ZsH~E&*|IDW*1$WlL<2j|NfOM%
z0|Elrk%}`mAz@+aB)4u&&?U#E=elAbds;-l5H|zlH+ih}RXS1$Atj(IRm!}|{+6!F
zJCF80!pR)bZ(@$2BH5pe)rV&a9DKg5!xT9GmErJd%-rY=)t8B!>#rjwg(0}Y*3Ta~
zG!@-=YPDsQBU|?jbLf2>!~N>|hz!PUY2xQHxV6dOdOiRkgHfk@>+Gtu4zzw%<|~P0
zpT^>bcFL1Gg3ii5EBe8$kwv@rh{58xwMBb9;cU$|BwDk383On+YY$>os7zCc74>mz
zUzYX6G5hI)4Iq21MK>gt@-<Z=jP8+0dzpuG+V{lW<CXp65~QT5h|*8Xr_g0Djh33+
z(F@?Obqbl8N;jW{xjwho+d8a3RE&3Y$8gbu);QN)SH26e0zNdq>GO(`4OQr{CMZLo
z=P_$S!|m2tv&4I<xU~<;KCcErNTa43#tcS}!>{Mj^2%zso|?!h%*nCjdk!){RyN|<
z{1Q2GzMnuweY0F<f`MJYiMAr`Qj=~Tq#|h#P&e9MH6X#sZ#nvfMy|JL!0m*YTWP}J
zgb(~%hkm*muBPo#a{@OIFHcmc{L>tw<e5WDzg*Aa@Y5C0GVQ*NWM?hrJTV;gO|ct(
zkRw|{bR$iiSC&l3v^zYG;rC0soSFuscoK+DBbI;!@9#LZQadqFIBHuK`%aj|!|tL1
zStUGe$Q~$a?&-|eZuG3L-R%+PzWKSR^9^fE51HeqCy9d30_VHhURS-E6Sx-3%_M7+
zK(0wh`eGFG&aSd7(7P{Un-nNu)|*QqN@pa$u079@$_TA%lDPLo0d%{fMPE{(-#Nfv
zkq~KRX5U@+5|F??-l`_27N8M`@Pv)o>=d;PS4}6cEY55QC=6R8f_so2%AEv2q9uLp
z$Q&opp&0i=2io3vB+Us}o)45{2`JLvI&cY`FWTRV7WLB=7n*JGhmaN=oP)9$S7ewb
z53^-I4>jm74l<lCzd5Dhm8}{l=%7Mc5#E_rx|dAsprxB-I@Ml8SpgZvlPee-0i@TS
zc~+7pK;x@tSC}DSRZx*;ByA&dy?#+o&Sp{vCew|Jw0i!!yN(7~5L*)(N6g!vjS=r6
z$}7w5K+Vf)9{vo6Z`aj4++;OQ22AGYqHGlW{@RPtkT-?Jq=uus;PLmjfX>Mw^w`M)
zR_XclOj0%?pwH6y4{aua_f2K5BiTuVLntwj1vcS};e@=h>|~Vu*LY>;8M^P?F%Q?_
z<g+3)4{wo;(|!yfn-rsD2oSmdZ%RJIaO>7Bps+YU@dfZA%l!QO#t79LSpf0KPbnCO
zKun+FbANg<8vFjU4&Ck6MFy^$gw4e`<XxDLY%CRtZlOX(W8Zx;A|!KUG|myZk6YVu
zkCPmQH$YaCg&;64-4;h4>!E^yN>qo>=b}6vv{F={t4PL#kDTkD`-J2&fo$E(cPM&J
z;6c4dX@<bT)!GN<cJH8@1lbe)-1!`6H!#U$h$~F{bap?55l6`m9-JfVe&2V*KaN49
z+XK{6w3~9<gci4!(}6#d*DsM-unWTnVk&*z&Rdx(KB7tT;q6vNBOupoE*6xP$9MxV
zeT)_H2$14K#!fQlI!p9NBa}ggAHti5|4I1k$O2oOF05A&Q*hi%G-T0@D;H!iYMeq0
z*8feysJYST=NjktLy`Rx{Mxv}`YN;gK)Wjmxz_(AVJ72t%56Pb^YHIHhwWs@9)Fb>
z58$x|r=Aa!Ic9$2yoKwRNY31a`S>@5KBJ0%_eqEFU%K{7#37f*@`jlHp~47Mz}H_1
z5BT~&3I9X$lmJfFgnq`sMY2;NN{s>`(Y{~}59Z$_3^deNf$XOV;LBOhSOOBt`i>AF
z+5gbt?-ItuHTkPJdjQMmO7Z4Iv`--ipNej%I;m<Jj>d)~<vGb5P0~3@ul=S_NgK<@
zSay&8tZQ-%zr?Hg|DnP^=0BA&M+fb%!ds#MU1i`fasKe>;ebyk(Sqy)?*2+b=1>n=
z-=VNSnT8$^7XHxTUnKmiX^dh2s`38N^{*K358;2^cz>A2FBmUa0mQ{M+tSi9KBbL_
zqNJs@Zd|032XY9=suha`uCS_Y3=S5uC;0XvT8aQ4Q$WD0`=JVLFW9dI8rp@&T)T$s
zd4tR7^RbAVS#IGG@cs<DcRNb9tbB)xi}D~tq}&S-iaAk4$#a_9e!2@pF?c{8k<T-W
z0aV6aMYiUm&d03zKxF$7v6_oHa*9r#QTb<7T33)cHl%-E1N>^zq8Pd1=&|zkLIPe{
z=eScNd4)L%<~p%KhFR!l1eaeTK?dh3@UC4>ZB9Pdx_mo?kqlRuTP5bko4L^h21c}0
z0lqsv)pYkmyJZdT(%}l<0>$8>A$!svL}L3w)T=QV(UTduu7rOU@%&H1lQ{yy^P%7h
zm-fH8MfM};wF5!#2BPRH9$ra!yA_adRmO(uk3d{V>!*7qVK8LrPZIJ55M+EmQI2?%
zRjt%Q<|y{z^STd&G;=evq@{@ao`38M&h@S*5O%`f6#8~<^bPLf>*U{b&ABe$_5ySb
zSNPv5#C;XlbS1o$g36zS|DpLY6rii8w-jHHIsOSM$o(dv3f1WqRA{!jf(k*9B{`Nl
zPoUlJI{ZVzK?Xp=H3<cxE5)lu94TKf1z3TYn)nV1WX}gGlh>b$xaobXAO1_BfrfxW
zZ@m7KuG{GVsjue$hYJ6ge_mN&{{JGp2|8dltO^3&07$t47+mWmU#{nI{3fBC&H5FX
z`IBk<24;TO;a?>Di)nO;{i^Z)(Dg4F?+@XB-FSbP#y=Zx@fAA8;pgKU-kdfspFBEp
zKIO%R5Pkf6S4UqwumAi10{FMv1EQZ1=dZZE9|7mr-Cpw*8vX^h_aol?y4(BTnEgMB
z**_xU{~%^x;iF%Q**^fsugB~k5%K?fF<UJ{US7Tm*lDd+%L7YAKhUii1pf8oiH;&1
z3!vyMimDuB@sI`VPa`Rr{B*19)_5qJZ4w7rIKYAPI~pTU#=v=@95uasGRKADf(dyt
zM+epX1ZS@Gj#-^b&1~7#Obx+pm52|>YO7M^h(U#7+qn?D+T!BkgEt6pCy*Cc0yF?4
zkn{a7e!R!|>$do-`0)z3{}1rvFFVq?IHQg6ax36PtPN)^1o$+@hx6*4|6jr($yEY+
z4er(2MK8PqVy=D00$58*A&npam&D!Wn@eFVPVp(fpDmluY(P(APIPtYbzD>2UB|gk
zMWty{Mel+1m(^pYiEI624(CK6a6WlKNdZVti50$BD^p>!d71CrZp|@!?S+nHKhmbV
z2~g*EqrNJsL|}N`U_eV|lx-q9lQj?jYV9ovWF7$;0)kQ~$k2&oTLAa{z-(85Bj#G*
zU$DrZaUTwV`+{$0q5)Xo3c+N{0tkkM(46QBE&9bZU0q6H<htjd1ArU(_M0XEV27-V
z-M0W<WPS7513o99vvF#yXfqk6ShWQJzC4e{F6PkFKAclgfOgqe>ZC!khscjE<;Z>>
z7H4xa59a|v;8~0~+LvYPe_g9nQS7=`RM!CetUDdR=%U>mw~Zrnj2g;e2VTQo9o2@%
z&W+YQ9%_=Y(ZO?CD^;P=R?m(*;#|+2)$`ZnT3=08Ip#7LjqI(%=f2{%GIk8p8JXcO
z)F$bSIX+JpTFEFK4Gj%9+W!|E|GyU;H}kfSms?DwN(GH?muVpmxc&oVrBOI?J5dJN
zYI=2E=N7#AL=2#Oc4tS+p4|_P&omP|R;F4)7DLmTnzw;BBBx$s-iV8$ISzh^g0#YL
z#%s8ZEci4R`i_FP{n~d5cV=E$pJwViyyoFIzw#cbn1^Ep2^*LL|4#$$+fE<gAwqhJ
z0_cMcM%(k_?Z(fpb*|nZ6_T$tnYwekwY#6Y&=MH=?pVGJFmi^e-WV{lREf*{i&0*s
z0f4kA>hv+#ZAoT?CS|%9Nh*Y6H!p@fQs@^^*ll|o$3PI+O@)5N5e>7j;?`=lt7#P>
zDI80~lGaRUc}Kddj(hG8pVC~K9R}GgMUwE}B361eSLNK|kl;O66`D&-%iV0V9lR!h
z-fTmy#>!-ZTWc#Y0wck#tziZ$)(tW&yeyb_Fv##Dy5-3JAJ*PH9?JgvACFXoWMA7f
zwv>GhEh;s#WY02XEZL%jK|+!#+Z2+0mo-dwhRB*M*-aRgDHRh*lBN94rF(g=kI(1#
z{eJ(s=i#2XuIqK3*E!GgJkN7pe@8dpdDubii3x^4Iz76{wDwILPr10hylJWbQQ`hu
zbIa`wxEZtJtA)}Qd@6lY+4}C|LWdT*ZcnP{CwB9PPgbj1OeHY2x~D26De~YkW#76a
z1zAXSXOvuofYbVvV5T&P@{PJYtTKq&SRmtniq_3izoYe(;uh*4%niZlhPW7#`Ea_1
z@(osaMcM@w>anF;-E5b)U3>M+V?4}Z?v~StsNwqNFzSlS`IB3@+E1M;T94;yUmPLc
zWr1l+>7x;{vb4ku+X-{1kLi~4Qw?GiPPEsRrHghXIm)+Xi8|p4z7Fia9Ye-{bqtrz
zH_s}1Ox5NV`RkbNe&SR$wbJU=?G;X%pq~24cur_Uzf4XzM@1_5+Rv$UmEyEZ_9r8-
zW?SE1?+L=1=~Kc80?oyaO^ZTliP@>O+`AMN(S5gPRF5d4HM}GbJF}27nMS;!A$`Sp
zB>uT9O<=!$aVU!md6&=gx3dpkAL(-?O$8PElq=>4<Y0IoT0DhIJh~jRP1oH@Wzs_L
zn7h^4SKHa(5?5O)QebpbWk0uo3LcZ;<D#abh<1G>sc_XfT62CF2Op!_W{z+8a3PaL
zi||qLu!R2^(2B^C@C_4<gmSx*<_I;Ox@KqQ52&TIl+S1yk$Ab<D`Fl$xG6z6`^<`j
z7ALrfnM=^wl4EbxJdCj>4;fZA1-B6;h1?H`rHkfo+?cN6#*OJ3{_Bk?id|(PO*tkw
zh-UHOEbP5A)fzv04b)@yVMo2*=6z-kqi)<FS3BI`=QnWS*y7$sS=#ni%b91gH0MJX
zv2eTG_{!nUMlpjHPn&M#ib}A!7H!KB&9Ar-vgIDujBj+54c6X|X$H!?n4gLVg@X-P
z)LLUMjka3a7O+WvKA8~^IawW$7|Sl(>dyaQMtNJS`%eYQ{Wc&l5g+l`!9uz|ZR$D5
zhdaet{NcwSYH_gWV_rTwOw{V-d_H<Q-?Go3{ck5UQ1RcKkhWd#aQt-HN>hm2&qI=)
zX9}6<!l;RiCfC3|MK+gocyhHXvKPFQp-%cNe|?WMfQ!8B@q7qg#oRQvmJDId_KNQ%
zXO7NkV_rc;v={BrOC4Ps^OR|uEYW;I{bGVF?Xe`+u^W6iy1VKp!+iO0PKC6?Rc*$O
z@wgL=#&1Qq+PRyQ)fHh@f%^d#cx25V_}m;7rGt8{89*@{yxI3jmKL$y$o>2viksQm
z^SU!fR+F(1k0QF2o-ZXeu_aGtYf}?Zey`@oeH-(SP#@BuojYnkhtyLfJH$4i$2Hw2
zPMFCsdSzfJ6sKFad%-|x<V0?1R<?>%l8^sXGqLcVsl8Sh)=c#CN*8b(dx~B}JV?ye
z8C^^WPs~1I5z7z$HKBY)kr#%Fd~>!d=fg!l@Oqd1RgQ)uJMntcLd9xqr7#2BMso*9
zi;`y5L%fG*)6L9D;L%;D4ZV!H+D#;_Jp#gPlWL83aksh;Z6~MfY3?ajGSPzhNh1Cv
z52G0JP|l0zdFX=dE8cF-9HdcW{)FGDI*ik)avmxWfAHvRTrEr)I?!z6wi#dt%iW#V
z89_7gnyzE{gFV^lTe%4?9@jxDN_(VIS$s}$-ayE#nX>Yjt9_WeK=cR;$+>z2YYKXe
zJmY`}NE_r!nj^rmp37h31IOxc;SN7o4FXNt@Dwunyx&*T!uM_M?PDdXj4@!L|G>s{
zK-0J(vIB9h6zccdPZPyLepPLDk1)KuW26DHAw&#U`v#~Bv;CVz`psp;ZiPpd2q=p&
ziiwZS>2Cx+xAh9{nlndPzp((2UXOn0>JzXI7O7u@)jp;NkI%R7nS&7tABT%9;{+O?
zwC|ot{a&711M>tZFbwb+<yz+<1P{BlhH>YQWY-5_<FrI+3%-J|YjckVSGI92Dvn6w
zT#7A)DmUTFauK@<$$+I{eEnsRs~z8(FQdRh+WuBB4XCE-W85Kkux9K&)B(d7KHj{{
zFK~DCS8iB1b5Q9`xOU?)r{1{89KvH*PaZhj0>eX|rCe=d(p$HE0wtu=1G~Hi4cq{q
z59CbPgdZBeb94>sO~&4-Il8|5au$ZRR3O5hl%AvCdQTwRXtuOdDhY>a;N-(0MVku~
z_>?m%Zjt#<<8hhRWd=fHgO8^3#0iC_jZ<q}?MhzxhYzrj3b=`CNAW2b*MbO^=3?y?
z+=m>|CxyDPQ9vc4U(b#YqHq=Yav<eA@M$bnu(_x5NXTh#7?DuD|DJmPMv)hK{I6NM
zR>Y3M@EJ@Zb_s-wuj)Z$<o$a6*AfLJv{V>5K&=D~=28>y)7}){sf4J|C6L6Ci>zw;
z)o{P-o(G$VoQ>s0vg`9AWt1+8@~mLd#(kH-eGjx~p5$uhF(&eEZhfMmd+;QbAC7NH
zlC>tkLLLb`2J%RQsEtQ*j)q54J*pV0izy%gckaA})^iW*V3uSkO!_|RLeURgF{<*J
zw^@P~)lQ86;*c9C>d*=_yLTOV1KPD9VUm)YIUHQK_O&x*_k-mOHh=Na-DL~)0quV*
zs{tM}Ivj5{(a=TlnXPkbl>MBuFMo}p)qR5-oFs1$o9<Q!v58R1;i2gp45$<^pa|Q1
zH?d`d92J#Ch-jdhfr!3aE!wxk`+Ar0I3!^=p1(W>&Tz|t8_C~c8i4px?$MtT0iR%*
zYe6#qvM@Z&$op%DSXD_V+Xc|S)|x?|%4|&9S~f_-BJ|nTLb1v_4esv>lcO=nySj9B
z?kVf}N&9A-Gv8L8gwO8hgq<|0tft!f#N6osYs4hXU%n)EFP!?mGw$?QO%m&aMs1L)
zm>vFVp>r2&#+;zd7M+;w`K}`VequI{T<mU?BKp&F7ukJ^=tFh|s52}iZQ@u;c^Xz(
z+_~s6GLwm_r}kN4DQnM9$8$^HSNU+RTtc2Z#ruf^3Qm@`PnTqsNq6)D%}=8ORjvHr
zYF7Pv$UV^Gk$Hojt9`?TaJ6r^5D7vj;zA?{GwFtkklmOdu7?k|;d-2-ovSU=ViQ|7
zk|JHhjie~%yjfl?k`&oqxi*DmCAn5nhB3bHWBYIk*MCuh*^Ycn*@I6}E=WJj<4S(y
z8tFR_Tt(_=R`w{nm#7x0oI_DS#U=y5U?44{B?#STjnOw@rL2{YO0+)l4L!iTv$<IA
zTaFm;-G}t;pTX|HPkd_`MCH8CKd1r>RBuu$5M1Tzv0GuoO9c4Eu-TF|CfV;@P5aRz
zHlA^3_jC`;+5710V=gzNK!X`YX%00Hp0bJ(hfFP1`JXw%oSA#8FvsP-UuB@xl0#MV
z`eP42iszLPvbWHR*=&;jSSv-r)^x<T-lvZunVUjAS;K%MW4CS0BOSZaK%sbzVBYKX
zT)xEgajBK|sx0e6A<z73)8$Eq;kcUtW*@!r$bYu7(hCz|>P9v6r3_J^i(q!x^2(O&
z45JLNH%dOnCuT?94wj%N(MrR|z!Pq$2Jx(d*7QMlHz_hHYjV&zN23lTXNkVueMUGv
z(eAbXk{4Xve|24Ywwk(Q3G5J+ul9i+zI*p=K)(b<)!m`~rSZ;zgaot^6N@dme%7nR
z1InWt)86K8d{8rL*YnF7AfBCR_GRQc{-%dC>%LyK##7}olj;OQigjYzYR?W!(%b~4
z-okT)KdHLmHEuw-39Iwp6lZ%k(aU+XLop~}dQW2U`Daw0(PQ*SfRH}FHZcfYeTWR4
zLYi2Vs=D@Gd#N<8zN_eB!&C3)K_zOeB=0)vuFb0h`&j6aAv=^Z(7cMj;_i%tc|i?N
z@3$<C`vq2w99i86&x*gglZxHb;+HooQ+u<<dF~u3o2lPs`g(G<=BqsBgO9=PAl~|q
zr)JZGcU+6Z;P}_S=Bd-B91gF1%%aG)3sH;fzgy(4KkVDPmtOyRf6O?jMEgI!sx`B6
z-*Rs6PIj^z>GQZCwA6oGzeqi_^Y~^uc9r$Dh5b7RQR8eW4BtXJW=V6iM?e&=_OsJl
zfZ^oL#M`TTLpLd+Ik<ZaVy?2G*w5)+gB}J?ew^}zPnI7H#!DPb@t}kMeGAKb|4p!A
zw+&f?%K!2zGp|%c<pK5g4~)iP+bB8yXjy`_C~#|QX;d+n2+B;ujwFmrEKG?Nmy*8z
zvY!oKIt1G$Rqb;E1j387VXLZY4?e<K;l>4FZF)?Zlh1{d-3*cvR;j!O93K;Pn-_$g
zMbC%6ZQClPhz{*_k>P$xEDSosefx~AA>B6t9kj0D=BNXVQHj~~9~I*b6+1u!9fuup
zuE@mDoOd4C$8+YU1DTt#ig0380EY-#R|j*CaDRSMxNcCtJe71uj~5X}L_Q_zG|x7k
z*x|hrQ?59*ymWyY@V)VKJPtpr6lQzEhHrbwB>6rcUK477D162_Ks=$?gIp|Xwzv40
zwl(+M-PzUzWi-*dQCIWO5scV_EY2K%eYLe2e7U%G?7n3_+~|&Xli||1q$^Krl9aEc
z4qT%c2;eE=-xB>?6YweGZ8?~^;do^YAClktii>cshhECurP-(MSDaD+(%jA&Y!D}$
zZN(&YKti$KBtHl+WEe>)2F5~a74&azB}(q{JtW#fEDX_kv<+4Uam27r|KNzh6Y<EI
zaG>xQ5%Oof!_SEWziOdTJk+ntb~mTSs%=NK$bPY4tTG~xI9G`ky9=nrc#n>nL0%=`
zl+M@FG_H2j*nB0aFsk#iWy-GRo&vd{b|@s)Z{^wFNG!|KUX%s@Rua_8n1?=CVCb(i
zh#GRSmc3OiYEHrxS(ZB*sGW2TM>8h@j3ck;cLv<YdcU%dtEpd_7^5Jg)9`|B@i_k*
zlQ7IJ8O9-=S}UE?XCXcHx#eF5LX8XdBUfB>m`XqR#te93AA#cyNl90c+DK<qijj0i
z-`$FD)PhZjx4kn?+MAi@V4jy0Lz*<u%Qt+L>;Yfph$mdxJ&0QVdijOpAWGLj?zMUz
z`s@2w5Bl=ZiJ5l4d?D+7Sw6gfha3%BndfRio#bpyxN?IkNU4I>!Jwambj>}8_NqXJ
z#-OV7dBrtS)uT#Q`9t~gfWk8*PTq$&8Dd@ZGaYiVIO2Uk-ptP|R*y>%T%@sxc4Q+L
z199`e=VJQ0hRDt9=o-2#Z)XL$%egw1*%MGSM)Uv$a<r494sf={fZJjSGiAkc%`^_5
z>kL)O-|WmeA!XgZ8(%Y2dhXZ`Xl1ClC1x(a55~sr=@gB;jU7QLE_8+@qK-b)6$nkt
zMmtZ%F)N}24kjsZD57HqyOep66_Oj>32+{Nlc!O{L;yE`fRtS%TT&O8usZ4ADZJ&<
z9*vRiBhIr5iZTFPIu-%A6sriz^R>F$W_KyFhf%HEl`hGIQQOWW_z5E_VAqzLke}R_
zT|(udubm#fOP7xp*k?P7J{R+jP|m)&Kr|sf{wk=luE9*}uxl2zp7{Voe(|Mhp>#MV
z;6~~U`ksgbDSIlaXsH@*NI2I7=UfkhrSXm#so{Hhj}mYVD&7~yL()_^(^Y!-9Z%r1
zRNU^~SIs@{o-E&sXMrK4JNGf40a9pF9xES5b1|JT&wYADG~GEt89*bOPafR6#W|Wj
zUCH`6nTTi;9R~huCDKF?_q344aImA?vf)~YrGKBMym}HBW2-x?o-}V5b?v;86Do`<
znxAk{iVwH^<nrhlpka&@(r&=yPJ~PY``RGWV%{NS+PN47<aIqGcHXh&JpGL5l3AeG
z$<$nY=~gV4+YmmbzolFfO^X;fC*;7ubH+Q2dhB*jylAVtmUWOPi0)2)+}97vI(myu
zaRB)Ce%&cy7{fw$=;qlxH2qHByIlF`jkmaw>Dq<y;ZEG5maYLo^}f9nz26+V>;}AD
zbQX0j{^Dg8l@5skkWvkTai3i6tegtDp5g=#`d37(3{61Pk?;wAm$B^l36N`@=@K%^
z5CvX47!P8z`|+wdn!3^ZySB21U`O`Kdg#H}3Ws!-I7G6JyR^>=3p$6=7kahUquhbs
zhC;kAs|oVJ{}@zE+5-QR>b}dNkyx1J{JsS^h#enlyKiC5lv`hf#wBJ8^>`(PBxbvX
z#d1n3qE(Y;l$h}t3YVnx1s2lR^YTX9VOw*_1f^BlkkR<ZIh16h52OUrl^c$a+pHg@
zh`$^7k2EHbiMoAj$jaZdkI`x(x<n@~zlSG4HVVk){$Zm?6r*8U&J52Xi$T4jA?J#F
z|CWC~u_H5SKZM+V59Ib?PF(G+SBqBj0En6q<9|pH!rxjf8T`#wc<JBy;Q>toaeptC
z4(!R(@vH(M)jDo76~A2(O^^{(-~tl0rAw8Yg_Im5XN7|;@G2qXYKUU9)XV`jr*g#o
zW!oU`FF_ydLyM<n3s?K`=gF$*e-I1a(dKA&6TckUz}Q?o&%qYESFz(9Ss;)dlx-rr
z4;*)n&LArO5(Z`4S#{4_U?5r4raHtxPL-Nd&&$(JE>&~tUmKe%4<D=Wx;HkH<43xA
z(RW>Lsde?CS4vXNSUket7JFO|a#ChR=YY>kxVmK^VN!)JUtUDpJ(<Z&CPjh}9Cg?u
zlMj~=wZ)wdkJ%~bpa=R$`O>{o>7q=UQ(b7#jUsnHh&ujU-8dTV0!z(Q2Os$!U8ZVl
zu0X@Z%gqo{<USAXSes698&hQSq&w<MX~mQ*3U`-V{+R@<c-Y7QQ}irClXl!)D04d4
zBS&R-mw3x=uJ(NevvKnHls&n<*Fk5IQ+@I2ASxhPbLNyTN8)6_vSG{*_w7Y-|4eWE
z{7r9sB6)?hiGI5wOVe!F%<>L0!D9@;`_3!SZc9uEEEp8ddF$8A7E4`27t#i?-}^i$
zw5%!I;t;bA$>~g;-Z>#Z?Dk^LR`;vXej+;Vv=E7EJy3L_XH#T;=MpyLEh1IkrGu!6
zyj#;}bU7Z3Pjnc@_+)J_u)R!<jEt;UaI3IzyK$rLXX3w=)(Y_{n^NTFq{pm~EZwDF
zhjcMnP5;V(+)i+Vn<UeVx!UPMQ}&sJQCW!e(_sMF$oxjI4H*yKpXI{^F{a4sI!8w|
z(tpy^<+$6+Kaefj@#j|>C!v6J;utmh2J#v@%OtYQm1vVDIGfKT#hew<gg?3Lyeg+u
z2yGh2w+u&4s>nRk7y$Jk1NV7l7E&X_%llGz%+~XCUadstGc=Zbc+EGt&zU(#-)!l*
ze?Sra*H;nwpy*@JT0*)ZAnY>jw@{+BC@Xy~y&Rc8BlGzrwj7k80u4DAblt~|?N4`x
zPx>eX=+*;qoBx84%8RFbWJyw?$7486c4>$?NB8k7xidINixwQdt~ZFvlD|9&w3M!~
zVp=ldgP)7<-`PkMq`MF-UExM%`Y8jEq!u;c*1Z@`Nu1%CaUI<R9&q!fEh|c`?&(cz
zXObp;Hl-hX-9}_K_PJLsOH<#wg$&N^Sf7R=XbNv~S@SwaZ#uPfCLyt9v*Aq))Ze%$
z^7brh`sX|)3E=(QFVCo7+r>iiiA_;)cqL%;^F#9C*WKg()L?tB9pEswD*q>=<-`52
zjMmI5<}rpee8{3aFD0OG$a&AdRnd*MHR};=2Bc<&<7;`~a;0!NT9;<^tw|Mz*s>32
z+>=wx8O{E#>S&%x5Ym7b;d^WQV?jK|`j%e~h^m<m5Zwk*K}@p=Qi`Esd5yIOF$|(U
zcu!fHTw|t-EQIMW#LLatkV6-Uu%Z?K7oQJ{6UyedKT>XW7uR;^jG0ssEID`GNa#+c
z=XZ4wI>|G?-OfVVY21^#UlEPOh~v5(w_d#R06XkCcv~_Lt$EJ3T1b|Lr?#1>f+DCB
zi8Tc=Sl*IS&R>r$ZF|ODySi0fe<{2t@AeRg{>~IeRocGeFq9R%8{ZIhp{x^mD|iRI
z%v~}nG-2q<3JK<A11$s9^o;N^-DprYLngEt&5(zV&bvxTyzRF)5?+@8e@~ni6ay3n
zD-!ec@F|VEy(iIbt0_45=F5?xPH~@yvsHT9Bp*z0wP%Q@9MTV?Uar&pr0Xse*8ggu
zh1iMQx(rS8oT?vT5QRAGEsAKy0}d}ii?3F;v-qw{G{5|%YLT-K%Z*Z#lP~{=7pB}?
z>=8>TF7g|{piCKS{rX}xu10#I>hX-#hw#5}pQ$H~^;i6)%0_9s)qSJ1Ewl|OZQl*I
zO~uCD75f;&hdbVxmZ%QrY$T??248FOYw%q@+OUt|=T=2@@7G+>l0-Wjn<m7~td?6G
zQa*BIBB1+tJiN?*kj3gySk!`M6h4=NkC}1!4gQLEkdTVXj??br-N9yo`;NJHrQAOW
z>h#d<A7p6N+xn3rSQOJLT$;R+Yp<^xjc}kK%AZMl2#Rfi1ma6j%@+kW(4czX_qHA>
znn6_r7c<yL<a}o|<$7Z`MK-SZ)8rAy*p$P$zX9IJ`F#!PDm%=7ejAq{47|F%wxiYk
z`E>3F0yeHk^qV)VdBf)Dg?8fEDUKC$=jh(KoA1{0(a|-x10E)#zNzh14P+tNNhN#j
zXeN;Us`B5g6~Ltw((te^ZBT!?HAln3(%?*ljn|mUQYpTpXMY;)ZlyGTy$i@0wv>Xq
z03x?ffB(=zEGseKW;cv6K2G_SJc#<PSRkzF9DN{fERD0d=c$&-DWJf(eWzRz1x?nQ
z^x$I{R<%bm&&$;yeC<jQ-D5K<;?ZXwM)g$M*KopJsC4C14b+m#n3lm`+#i}tQ^R8d
zk7PWBPKSc8KNoUDKfM$i^v*|Xnmi4h0BQa5?G<pbc`w*{1e@Jt_Fw1H0mHR!RNVEn
z2cL5PUaewI+Znmf!&X3**0?>H*a7+5HbgT4I)h23@1U8mel(W^6|alx#~VViyya{8
z9ky`R3DXLzbM%IsA`!JAr-)%d<P=Y^NRMunT}O1@MdYxB6MrOdNzZp93fQSzc_ged
zys(!GG}MdVDD0lsC(c?YFcUAeFOyi<isReS5HDi#uEJaRW54}r3>M!9QBHPENAz_$
zDt|e>GK$GYEJzVeUReSyMDd<o6OtjYKPBQ_l+hGcHM%`^qstH=+>robo24@G{8m;Z
z{B7mZH;(%O2SgrJ89j4z(q}(2p%&bk*TS2ji(qE%VkmYHe`GePI&;hhq38!uXk(Sr
zx=kAQVbe=RvV1tZAJ|KQX$##!hGw@ru<hGZeGHRU!5p3T%rtt(rmW2RPGkpoR-7{%
zH4yTqY_0Q&-_$Bw1=Lm;6`{6Nrgoo!zp+94gXH6HlQ)XFT@?6FPx-U7oj7y)&XP7v
zkT=^tHLBas(5%<Ht*CTC@$;owrKzc8rNBhOzC;{X`+(bKJstLRl_@1~Uhc`@ykIe*
zEklOZ4{aHs71?OZ5Je+x8P3s&ek3&!h3H49iFR!f{GT1jq0isF`xZ#tqm=&zE(-#A
z56~1RAkutYSsKH_17E?&N{r=Fb-i0{RrnL2AmVX>&$Qsxt^UialaeCDNnf1hIe324
zPR4Rr+X{oLy~n}wHgCP-3JbbH*rtnqy7>&71Z<MvmTkKje%GrJz1OS%TE=mT#*Wmy
z(7Sp1m4L?|NJ?+O>35oIs-yP01>mKwvDdd`al&Z_atk}C1M;Rns$vl}LH>RK^d_(R
zzBUmBBQF}2<cK;IlxDp@r7O3A8+7{-+`!!I2DsrV;D(OrVH9ALjjE!q9PM`TK>1k<
z`wswa+O|{5vs8vL$7V#JHRSB=5m@am|NAGwIKa8V2La*8@R+|ivVSxtXrDG#5d)w;
zzAYBEJak&b&?$6-ORKAF8$1tmq;yY8Zj~TKoFI5;uD8QLh%K_XkJnI0*<vCirkN-x
zfT2pa5M7YYox51&zdLud?<d+JApUM*_6CT@Q_hiZRWmkAF($Z*g<>5n(+V<OGB;Mw
z3Rcf(MC>nDmRBV>2A7lkd?wUD=pNDyV<e;u-7p+*Ii`zQ(rrYS^12gZcd*I|wOSX?
z==MAM-q9l@+97-xF!p_4cccj6DZL*B0{7uDRFTTGz4#RW$b!4XP<)CCE)kanVPRfV
z;j=j5k$O?wrdD@p_6y;#AC``DKwbv>ffICHv%x4>ls`8b5RE8U%RF@TwrIu{JO%jS
z@o15=nNpwx{KR(XGW=8Q%oSn34V^l3W<EaU7~818!kS-+`%%9)xGTERI;1~pXfzG2
zl*5KXBWUQ!d!!<D&nx9prb=;)#rsyMp6;Hh?Y{jxjf8U|{zDq6h=w#$?1FPNNIcv@
z;&HfOm>3T-0#Qf3PYSPyGgkIuRzNgNe0%eG_UBAV$H{9w`3q27YOgJJDnPuNh`jV}
zQLvAqKZBn*q2_-R{5CwnzXd<IWDH+>icj=dKrTiY^OY=Mv^m5EoXqJe*1$yo^|N$M
zop)hv5gL8N*ZdD_doBiL@HQE7dV7qac^W!tbhh?-f>)C$n<YyONV%bNFvCT%io>ZN
zblXl;1}eeXvaRlx7XPOhN~#!rsVlxO0H2blqo=oifz1NT4!rr<D>1KZes}sL0^+{P
z{twXYXQCZEpngmorxEz>8rEn)Z(;^-t*nHke|KMQ+Pl;7&*%x;ZX3&vF#v3%;wm5a
z9@Fio3vO0|ioyo$%iAE5Y;6ViT=|2)IW4{81SHzLnbU38pzeY&vzjur+biJex+}6x
za7Yc#fBva`f-zeDvnd?TT-0EHD(A^TT#icR28k(ThLD)zghL34$%g|HQ<0uUt?-4h
zAXMHf){1)cbZtx$oT<>4@~~m(RX+Oh0V7u{_=jJs)Yb4Q_FnX%tj$t8Gvssl!>}Wy
z7g8PNf|p#nUY&mFwNW*?&Z(moMs+H^W)p^l5ZE#sueF&-{ojO;dsyDeU;h?DIKr@E
z*z39^L;&z;M3-%1cB0`|VzI{&=|pE(>eakG7xsivkp>=UA4Mp|jovP0=<P!KlAv=6
z>H2}*E~M)x5w+0}COZEQ&7eqk(6>Xk;a%)I?{d`f3_hjhfQ^ezWRl%z(Z!mkqNk1-
z6UFv`n*QG_Z5X?WGZ_20k>U9MM@~6lsuO9Imm**vvg}&ufqdplW;Y*Ob20y6o~SK&
z47>5nQPJN@md(!5!g<4iI?mA>a;HJmhTQ3IJR_a~LFwBa9wl&D#6{&O4W!?zYYTfK
zR*Vjo67k+-T{*<ZiT|JYxc{^dcV=S6_JxfK7}<ia{-X$T{>n%WNI|p;3^#)_<MwtH
zg=LI1ezaBF-Ri)sg)RscBx|&pd44A+5DZMO#qu0fL_6iVC<3EX^zOi+^Ul%z=SJLw
z;oKecaNSMNaOFDf<_~d(vBagF9xghc<UR~8yG_m7VmOAnA<)f6--Db8U<HyB{r`a#
zh%B|?;&-H`{pErLzz}Uj<D{ubLk+r%rM|0t?G#se31Mj?V@5FJ0Y_(!Q*^=BABWxP
z1L-SEO4%joVvRk|_Y>OUdVS*$LYkK`yyhZ9ODvg};RhP?MA7mH(4!ZrSUKov#ak?t
zgl?oxP%6%SEG8zFl%~%A9nSk3;bpt>5J4X-FBX&b+coz%#8P6Hq&+UyU3t~p1X%6c
zI$d6;He5Ty{>rxyuJ*`>-XGtI6Ygk@d}RKcm5c0&eOC(JsuM}=K*fTjcFxfoshutd
zq;_8+D@DF4K#Pisj+4o47^1~SuNd1FI^P^%6wcB$fBK5#G3~W_@*$VW=-f<Q;2|Sx
zRCBx2aAyaf!D^?93X0``hw~5w5UQdFAQWO_5He{50lpji`JaIAU#Sxk5noIDv5*2h
zeM-3C-#@Z0rl2weaU8S<z7)L0gr#jx0<KURWGSypn`jy*+%KCZYHtSf;c9r*0p)0I
zBPVOnHBTyQsNz$cd=D`1_+5_95taS-ax^qC_9mr4k7V7+ZZ@bEEeo*4K=hw4q-A%~
zvOd(lI^CTj8f8B~nDj}sN{&YmlIx!l@c%0PvnKyMRhn7VHh9oW9(J3{lDm|Mbr{u9
zX2gvH6mDo!?Z%Bqe~$tQ-h-kq>7Z~sZPm$?hjx~*e0$s|hKo@BkQ4d~{*u<YiUABO
z^6X|3YA)W8Si+fViKnha<|hD%_(K{s&UZIzf0*rlO+Mz}Npk#NttP1O3EzGqBSVW|
zvJn?zQA3J<Tbg?|ihrWANbxTZ4aGlkE@uwpD-k6coR9Se#t3knf{Crkzj~WQA?#HC
z5(S_wk96M2(3G?d+YYF8oAM&7My-F=rv=%Np!wDEs7<Z&T0BCo5U8r6ww$KGR;u;=
zGA#|C)tnFxkr*zd$h36qA4}&O`2~LA5g4o_t5=a|6LIEYq4r-SmiIQ}w~}F0P!Xjj
zPLhc#+;}Z_t9>_`jf{i@d2%Ovq5p}e@#8l>oK{G_%0cJouq`r&H55Y)um^U4z|4j&
zLQh}U#+Yw27E9*ex$oP~zjEuDsnTXWQnjtVdj8BiBtySm#4A=p@)@mpEEa7#YL58G
zvI7EIfnn5*833*B$P9p7l^rKO{4oPyp#-WNPurU9pf#PPV(Q`v-ToVqcRB#z@;P@m
z;1jdK*pl|)Da3cxQp#ZHH5r!&kMZFK-qSGlOL;>}q+Ba+GqZNdxr<XzeO{Lqdo<U@
zdraR@_E>sSe6}baG9^suzvL@~$@u?Gs(HgIrYl}H>nDpEdqQ$Diy+G@H5N6uTQ4BN
z+34t$p+(!P+E1(%EB_@k^Uzg>2PVCnYHdc)3-|vE^s@fs#_tC3UG*v~Q4nVD76^9o
zH}@cR`HXm$ClgZ8>$`posZlCjc7Lqhdk+BI8vt<YaT+Ei8y-FJUp)Hn{{8<kQIw_q
zCyx%lCNiV=Ic!|OW6I6et;dN{xWZ)~i$vd*diJksK&}_2rK+{MA5Oae8XA<%fBvem
zB`<#9oF;)6J@ESI73b(*H#Gg@5>dwQS3l_L_NVFR&DoGc3fA7#$<nsUZ!c&+zHQe#
z!qHzoRaZgJ<3_0ss)17=@8OUs!W)w?;1sg3pr0{^t;r&=7x0*Mzx1vmS<q7s@k)8l
zTruxE+DktH5p$FCW_-4a+s(UMvO(LsX>cp-(UDE;%-VF##e0d0dmwO5(erSDeE7Jv
z%Ml2i-CGWd-*Aq;)i`|PJY<8+=dFM6;kGmtb@r;!h{0-aZ*wO9YPW&20|`w>rt`AK
zK|#-HL<XH21rEVuUp)Ht`F;wFgqxLWSi83Lj4eRs$$C1lZo!Np%SV8@q4=4-%J+@}
zxO?P!agzVwxYKbH>;~Ko`e(Q+gx|GvOdx3e<;2*g4)@p(4ed&D7X)qnc<(<xr6p&>
zVzv3KjriDow(w)9^Fn(KZW=RceKp*E$}nHVB!83PfhcPBi*bzMK4M^Xbn;csE=BV3
z=MUWqWa7Af?d|$yPK^9q@nw5B<+<L$wV<+xx92JH-@Ei)CZ{H(9-(}o{?r}1<e=xB
zw(zv!L;A=0tl53Uv-|h^B{%8;4MU-#`=3AG-5&FN_-K)zI$D7L6_o*3x;Qte5rh#t
zOi%EKQ68p;J=H#C#|(1nt7pKWYo3ob*OWIRr(c<<dCwXL2L~%2K0Js_iD9BK&|*t1
zQN$U&I>mCyuYK{giRHbsZ@#-y!Yh2XPLYMX?&dTJokr!fn##2EV6_yugD@v;EZjmG
zd*pi0<m@MgpFGp)`UZV)bEMs2bu>!T!fms@4ZkC5U}!VRww;g<qr8fSO)4x*R_?@I
zrbq773^`O{5agLf-#?G#K3y!jlK*pcsSr*D5>q7ly<VNjJp%J03y^sjxNeZkXf1vS
z{PlqW*R*87{+W}!s8!K*+IBijCxbFM{y6cqMxW&~o}MNl%bR>}x#Fperz(0mrpWXy
zjJbP>;pdFc9%3h()APSlV8BH&Ip^<E4;8r|r5h|3s&nq_XSna6h|2=%XuDe$m+v(8
z2zTwwz5bT@V&3k+wRx>iRpZyrwl^ZD>=`46*$v9SR5v0`c?T|eGtmUT`Pjy63c_4b
zu$(I$Fymf!)X`{|>D}S+*yPQS_9l;U?b|OCH%-O+TMOS*RWiWpaPB4A?ulpINlwU<
z!HZ$p;u+tdb&UC%V~E>y7`~uH4@5Y@^3Z}Ag4}{IlkXm}G2n_${<s_t*O)^oW1gB9
zS=HybAMd-@HprZyNy>UXo=cc0EipK4a7Cv5R1~Y<g)VpU3b%>IRJC|1_GP&04$B7N
zLNTIbv|F_YCpn}L6BSEEhh+=Sj{8Jkt&l9erjCyCY)%o>=P1UVGSjm*Q+V4rB}Qb{
zA>Qp20bD<Bau!Qzd(>OJ>~&!=a8PpAx4`!d#m7dAa`lF&?86Vih48e=rz?C)T7}vR
zT~m8x+I>H^`W>25x!}5h)3T0>vrZo2B)8_fOcZ}X`7*WnYNVp{FblX4v5vDcJu@?@
z?_eme>y0}pv!2e*2YT?I3LIbsG_s=IGiMqJ(!&p)yuAL&@MwUSk54sjntD$ohv(PA
zQNJ1;n(9$A$p^oj0upvd`p#_Ab2%ciwEBs+$n2>9FJ_K~<n<ryUcWd`bJ!{!eQa5!
z$I8l@kIcfH2Hj<TcYcDTHT{Y-X~hAH&G^oFRq}yb)XiTPCXl0hreVUZfrp0&kHe*c
z`%K9&cxbwbS^BZY)K55LinWH@xk~5Q`ZmR%O)=-U3jXj!PN^MYzVL+}lzQIzxvAQ}
zf~y-Xv(|**eX71WbweT*W#jHqju-2olb$?VAyxxt@fkldbn?t!_iF>W?_!(7#B)@-
zMn|mKg-_YbF<M$$sXv7k#5&9JLT}DA_84>8?!0;I3d2*(PweE$fh^g;r%sXAuTwiY
zKD__=Mf#q4(QftBHR@Wow2FECa#zfPUiadEnH+YPaPz5ohAPny&U785(Jp)X_n*VT
zYQIW2<rgy3I6IK`%d`Bl(?P)?5Gw0qu77$|5&jLs{(8B`yHt1Y7uwK=daF-qQ*odA
z;;T~2(x3W&*IaO_d3|(o;$CI<d>v{1gvMO)x})GrwJ&h)q;5S-S~pdGeM3Gls)JcR
zb4L2<51U7UASfh^>Yps?)80Wpx>g4hzs-;ls6!1u#~R+phn}?+PM_=l)wu0QdcfD1
zv^->aWh=C#Rhia0($>(fTh-Be_oFbs)EXAlrXNZB=dXa~_&mv0t@OKNu0Fj_^pR($
z0{Bx=*Me3rv+4JXRX>*=NQFZVmd^+iNiZ9C5RO6K<@=$0B=Y8W6a$VT&UAS8Fwvue
ze+ybjr|`xdOrT+;m1k)G(e9FV@7I|V^)}hQXZ+uExNxQ|1n`}=G-$SLAIni)>Gq%g
zcxZLBZGq*BKl_Hszvg8xsq{TeT^0V?8@@EUvUF<P`?ddcqDygTmBHaoottyS&Ip~B
zEnw>~E=W04tONPUhl5?t!Hq*dnm^$#bGaB`932MS$`cy2_6e`#c6idmEgcq&I?YHs
z`C`_7fC2Zj^IB`A-Bl%{dW=6Um6?Nc;;-Gfbi%?>xxq#A(C$+2vqz^?N(|jE+*2hO
zjnrYVgawX>h3oVr6|agu?w}Obu=(!e*1TysN{5?b$mx8qg?yraC{*;Zr?zZu{V@ez
zQ{TvP7d!ctFn@<ScuhwB<AQMQaL3xto^Os_!kVOKtXa-qO8Y7&UGcbhs!|=xLH0(W
zGFBZ1nRakv?DQvN?EahuKz;)B+fJxGMQP|+i$Sa8>^#&I?Cw#~b~9<i;1D7sX!F;t
zy=i1wuQAuEA?uH7v~O(EuNW9<b~CSsA*Km(Y!zbPOYGb>!8IB?@2G?EvT*dix>|Wd
zSHoLzioCt;qv$iC(_;Ctc$s!n87*a|AdF|Uh0EQ>9)TBmqQb;*Z9SLnH|WP15zfNu
zXya=ZE?f0&SnZ8D-=Z_42b|>@aHj6~qx?ab9|CRtbU~N^5sZd_k(t}}&paP44Xw?F
zjz?k%9{VG%(RaB&D4lZK?vX5reZXl=$a*lOZ3Msl*EO9O^=-D;dd9p#XT}U_pYY+3
z<jYE8(C0|W9u^QLmf__Hp^UW2URk^pBkgM;ENAg!2xQaY+ds>+FE43D$XgR^jTHm+
z<Ed*bw#jrJLRkg4>+p-svX$nHG#jHqy`w%HYC^V2Tl6`SGI1-<V#sg##t!;KlesEJ
z*n(0t9(E0i1tBum3dxs8*Kc^ek2U+Q${g3Kb+fUDkXhvY>XUirb%mS@om`{4eoh_n
z`u5O&<?2Q0F87P%%mzjeq52ko#k;Dr%$DDHv4pI+>bb2<v=uGh#SjLZLFbsahfnm=
zzEl4DQc=#nt8P2=`;}|+q#yf58|iCQ%<sb0zRl0i&s)u@nT3~ED?b@=i)kmBn?<Gf
z6BCWb=uq3~mUEr7Le}6#@l?;ZMAW|hp<~lEeCO>Us<SmlL>7~Zgp*?(cRny$6JBi>
zrH{Ae<Zhdu`T+ycj9?@y>#@DPdyiR<9D9}|3XV%x#%FBrO);nRH@cj3>S#`u2_*=q
z0^&XcCy)6>cXXgl@(->rl{!}xz!;gtp2?z<@Jk#fOOGAs)m}2pXA9A*`Dw;$stsUp
z8Mkrqwtjy5a}s3QW%Hd%c)OlxJe2J|Y0Vpxi1XV=EbEki_zGTtLBHD`9}bebZ33%4
zM|d=DwK0bLp1<=l1MZ2qQv(~l+Nw^1?0!0WQbgnJWIbyKvya2@eo3^R^=Fyam%^f2
zH23&?9c^()+H;xWbVs!^Ut8S+OQ81kUlNPAO;VsHgf~j<KIH1HY3-2YD73&%Zq3O0
zEcFFd8QLbhCl$40m#cS>*b`j^!ZKn;Pws*lg{8kpPJsPo-y||+N3TXQOqwl~T<weB
z>>}yxGvi}vYrf}RsH)qE=Zze6U9w}1CpURq&TQff+J)p_K~P%%4IcGpcI!uLX?<5o
zJ^44p6eGqI1;R*n+Tp&p=Oy5sYCjVi7iPeH7m*La*&h`c&~k)_Xi&C^XZH{a4*Txc
zC^Y6E&>X>llg&G?1MsEwDyzRKJ*k)bU`~KKTGr}B8n-@2?XA|qdtwrJmycx}<d9-(
z_eD-Jcl*NxKNP&%{o>eMb~5*VpOSlRYcsh!^8C_{7@lEw%Al+jGgbIFR?Z~GQ;YAO
zOuebfBjGoaBioK)4^<Cp)XS!6DC$~|aEiK%v6Dk%>T>b(C=D!!H%IEp<aZj15n`X1
zVya`NgD6jI+Xq1rZ93CnQFP#E^I0W2dbL+8etjB2DZFw%W(+|X+35J$Qh5!5h182e
z24>Q`#dGdHGT){gQShu&Yiw#xq`X<E3TtZ}3fRu|4{R6FNPueP%|<D3X70$}%k{b^
zh6czkq%Zu>F7I`|A3aIWQ^j;Un2DjxwkpOTjC-_e?Ts>vn(MkYL8W^l^Lh1|KksmR
z{V=a+ar0DlEMuA?yt>stU)@yv|J9|6EVj=mNrm9LrTyb5%SX=}&s~u1SAQIK1Kh%M
zuF*q1-37}O&d|e&N397-PG6qtZSt@Zdp388KAw6>pss|o5lTB>NU>l$lI%xZU`x?9
z!}bde-EQl{@%?7#rqq^`A+qXBf0|d@+5N|?p?I6lBTSSul>!LEMytPoSs+_-F!TO&
z)Tuu|jO_aRciCPdA%y#n5P~JVf=VhQR8pVs-Y`RpB_C+FFKwSkl`j5itUi<&bx__<
z!@<HXjc?Rw0^%)C_YpZI>yJiql9#hW^kc#Ol(cb=wQ+{4mtQ^4DpcL@S&Ag6-<2mw
zc!}z%`1$N_Kj?ZEOBlN^Lxc^|r6dFQl9VT7s@%Rr@lLCqN_5#oAG8(T*w*b63J{B2
zZao{@3QlM9mMe+ibP}z<R36`?-@oCRMq{ATQlR~)pKl0@bjeZWuh?<yCC22F%rKl}
zUy(b?t#Dh?A)lnw%mB($c3j~%+dT7dJu|aiCu7&t`Ixu=l06)=cF1gs7d>X(enbYY
zEpLEj(Qn!fw-^)uXCkqYQ{;fReZrOuX@-YXP~4WC<k<b;66GYEv!?%ige1q72M{~!
zt)<}_D*IUXr0&0|dPy=KT&=D#-+rPkTQ>ad|8<rr1cm<~DEtRo-fk>b@37btnShJK
z@Wb<9yqO`Iz5g6}-?T~SPPVCUg$<$8c2~bP18!fwiCYl^?)}#t_KNhRa}N$w>8Yb@
z>Q0!0Hw`m<KO8D15$7#l$W9K)G+y@Nfbj>(+?L?mDmJ~fMVytd;4{xSjD_RUi2kl~
zOGo^(dndOJn+|>%ez!F9Y0J#L_7)-Du%qM-+4g798vHh%syV+^O*IHZ?B~9q5`=ks
zH`ofc=$TjBr3Lh%t9LJNV+;e3l&7fZ?Wcv_fhiw<VXEE708H+sC_ON~!+lYH5sk%G
zpLH`*I#1i;wtt?e_%1SyWYI=OM%sb<q@@`hAxeD@0$)G|v!_@4eoO$Y1Tj=5fG>b=
ze!Ey7j=x<(-EJ~6N_-j)_j>#+J~g%YXO+||yN{{hLf#~A3QF-{syleIvG|7h4L^lT
z@UWxnb!PQH<D^hT$-r=*df_Rui*GXb9aS8DVkU%%R`;;o$(;eGH}6MM2}-HzS2+~X
z*dq~eg||J%M>2At=?iM(tJD@tr(|9&>kn4++aV8y<P)(OF11U5>E36_dQ}ArY7M=y
z&vK1ipLioNJ*BZ8u0|Vu{(M)XQ0LH7qYv>^J<oT$n~@(ZAr+@EcBliKGg@*3oA%m|
zT7bZjGfSy$i}C#Phk8%&$IK!<5)a_jW%vZABsca%dL~J|er#HNA?Ez}H%A@+rfsQp
zO70g7_VjC#${M~0g6rR+(daANP8VjX*%43W*t@NoVM^s#pZ0--#$r@&(4iC7yz$l|
z&^T(w@v-sYGmyNUN57v$Yt!!{%lSk%GDtqLq9<`+%N``aQYM6dGoV*fR@>W&!6~Q4
z8z>8<Njy4d<mf%>zivrc3=DkwV9~rK5MJTB;x&VPQ{*jP>mw~ft0hr|+nH!qQA>Up
zdbNf{cavQ~DUx3UO2WnFE%%rWy+tEmQEJ6}zxACSg4AzBywajbX<|W36oN@Yt>2Jh
zP>R_#A0w8a6g3H;DT3-p3eT?lovHV0J(DRjl0oUaGHZ1D%B#4%P&PRxYl8jsM3GCE
zyRxR-y^-#Dm^7PPTr(w*u=69xWg2_#o?6=*l=9<{H3N8p7U6)M`oaOsd~|Qn5$9Xj
zob}~YRr3$TY6pkxm;s<8kmkD|Scw!JO8s<VV~?b2odmwIr-;k!vY<X!dPAq)`VGVx
zP*+Zv!)A3!m@VI5K49mA_}f1K7bA`QudbH?iXs1u*f)Zl_jGDwG3PEqtR~niSJ$&c
zn${mo<p56|CaSG(3)cf$#5iD?b0n`_PfecgZm(3(iFez&o}76_Qi@ca4LkFWi2)~U
zKbP-BPfC>uRSRv@LqfIA?<oEj-GZJlYW9i#`zvMmO8$V}!7wl=1H0zbxW=CPfSlgh
z(R`-GRHM_$c-*Ma`f9CmC0*ic#S9*{?#f8{y}_HN&f|N`Ni9MSBBInA^lJQvmj*<F
zFh>U`8}N-%0g<bp?l%_iah|^jl+Z<Lz~PpdZzm4@ash-jQvG@d;9rq;uVL6N<|p`v
zPBP#Eo`0fd$yTTae3HJH`Ro110oVHwtA~}^ZnA(K@gH{h%;Aw78y~R%4&dXsejFrD
z=fc+o=t(~mXLC=`lLGQu16fm1$aQz>_p?>}DA`90hwG{V1s5kYVh-Wb0ZC5S$;<n4
zAx4bcYkQnT)n5->&q%F(6UUMMM^e(lx5sWLY|dU)m$-Q9;}*MQeQU839|CIO@7%Fi
z8`(*21#!l%VU3Q#!3PDVg+FzkDYA1k#+(!{2zmGg#j{sS<&*{yp#X=Vlk)t`)$7+S
zKCL%2{W~B^IT{TxIqqKDWu<nux~s7Qb(a<B!sp7)zS+4z=W$SLS|`$mApe%bLoO%<
zMCQuc)^SKa3rXwq<eH94`kL_b#d2Oqiei<_Y<;4weq`43>2nm7*9h(>c1GT3`U>H(
z6Cs3{Xls35L(_`R)b~l8TRxF!-(Esjg0O7y(HoG2kF{OiQJzSJ-19b0iEi6r-YJ!H
zZ?{VcdRWQ4IhNZlwC#WulRYOnc9UwO2qQ>-i*83-YM`0UmY&=MbPV0ycj+h9LpOh<
zI~Xd)bPRP`goCU~4~J8Lqkm}r#SQ!gMUHvTM8a(8KoG^~b&^q<imPpA%b#eW?Q(!j
z0`-qv<q3=TsL0im>yV=TPbrhAe*co46(1|01qDM3R|b6>ZU==JNIj$aukUBT4M)jg
zO(FD{hjyr>HTE1$DIqJRice>RG&`?P%nbSI?J@v>7Oi4x=NNa1Ffw;JuxIHv6jm}2
z+%t)~`A;c+mwR&U=*O_ep1<;V!CjAhIRriAPglblymdCSd+!r1{0Xn-{SVklp~?24
z;J;xfg>5*bgSB?PP0;^<zTF`w$R5=`A2~uasGojk!X$M{L%?IK(p7ssq-v3QV%tU_
zw#&<7K3wf@nJIOo1-;2bD7V;`RFGurdi}@O**XPk%~Ll5FAvWkVVByZQ-t0%fGVAl
zGB22ZO_%)A{&ZCNTN>}mOV$fJdl~xGnLO<{8~>5xUYX;GiHRvNG!L+N@Vy8qlG10r
z^}<A3P8G3ZNLZ6*-b-9C<gwrWxi}^9T#359iPOC{njJy+wL_JPa^aM>{tu=H1&;yQ
zSt2_*o|^Zrd>A~m;)6b2$n;XOO_3b^mTWEhuy6Fo#77yaOmEQFwM3@DYQ$^&+#WU-
zI~Y&up@^JfHG!-EFmprMxM7#3->ShQX&%rP`ruP(mk7EUyIwmu49n#hbh+y|kIroI
zxO~rEM;_9->>SDkMjGvFguN0y>HLH8vD3=>Hr|Stm_s(DqPQNtDB{#Nl$twdx}V5=
zD*x*Yg#0vB$;zDoIO&?&0a>U8D&P7fMY`^2)|MsfC)<7-_iHvS^FXr@?<pl3giY*>
zneie6^kuOIUZ5v^Q9PKrnVuw^hd=5dor+qM`m|RP%+S<Et_P|Ih~wC>JJqyCJ;Lw=
zPTTrJk%AucexgTM!^~t(FG5aycP8AaiYN^7>U>E*qU)ZEF>?ym0IPrO8Nx$QmEyWW
zjNyc#UzoQcki-#Go^N5K-GVA`rr#negtv+Q0)SK>1o6H>*F`lIYBJL5qMHkCkdG6W
zWEpUBUUS2WK^SGt*?Xkx3YU01>H<C(3+63jIGyKvFOR8g#zMYvr|6==kS!rxSnzut
z161A3?2t$7XZ3cYCm}TU*Mq6q&kx6sNz?mqG<^H=NI*SQTKk8|X$?^C2^a#ITQQlF
zn>#dUyc*d4weVVjL?XnGzS{{6k^t3^ToTNuftEv}z3@S9L7iBciLWA5JyQom9)pVO
z|M@L!OKp+XxKRKBSWNNuu%@+`@ee6iz)N)RI^OEWT``q3D?u9@ean(9OSBzWdi7`S
zRlB@XiSB>q@*NgYr-qxxf9-6H`GF)mZ_qako6{`5pnf^NwG?5%J(Un9?xt4@%3SJ|
z3&OD7S68tgGCW`9E>Z3hFf>={_cDL~G(}P?kuCo(A6FXiv0W%hQ|;+XDM{akm+eBU
zMfVD)W!j6MuhvUVk+1k$nVz=(5dE~l1?;~tvh&5tJW6WD{_{0Rf?m888a?0>-ODAJ
zdqEwV!cJI)G)kQu5-v<=l#)AssN#gR1Ct%oKs+$^)^m%~&zrD|^Ffi*CSoPp#`8g9
zCAv3yRx&Pn=s3p3dY=Da3xg;NA3Mvo+ehti+0_N(VPnk?1z{4(o6UhF5h{A|xcs8N
z;ibsOCP%=em%C1!XV>SrrTu>7{1U32u*(Pz4s_x=S7a(U_n+{Ppv3h9@4{R==0g1(
zB_5A8aE;b~ePA-pnd_?46}2QqQlIki>8utwZ-yRhPQft=Jqu_AnKmXP#FoI^DoA_h
z<xxi@rsHU2_RD*?+|mGV`RB-Xow4RcSdiybG|j9z;wkc8GH+k>dV^l;Z;o@`;CGE<
zUwjSB>PHg8cxe&CJNv=)6B^5Ca$t(~Jav|k<yCbF-}VM;41*1E;rE8<|9eBcg_wUQ
z%OoKdva0M|Jr)cwQ`ZFdhyiEM$!4oTPm=LGKzdP^noYZIULpjH_%)R~mD^KM3au~l
z;~GJ6xvyB$nm5xqYDmYLHzEDuD3DtWr7cbXQY(x&E4J&rb{Lt<l3hro232q?)+zd)
zPM7)$#XymM8;LPscQ=@*DHVi?I*yQ3>Ig}d^{88qk#@O1!lAe>6}6kgvtI|2VV&S5
zFSvojOaaQ^=UsB1tzLqM?N;!ayAA8bNt=)chf{yDjoxxkq&Wc7w6#|G;xkqQaCz7G
zzqiB7tr4M`%R3ohL+q4`y?~mk_I!8zAT0H59lbCV(c>0n^%P`5anI2~O6s98P3Gn2
z;Hn#$Un=VSr|pN58=+nIxW1k>Z}|;(E`4j>JA_KoUSgSUdGfN3_p6~32m|=@Hm<Vk
zi9|VdmG<J5*r~_2RHbe?|M0LOG{g9<9SF@P(4NeIbN}c_Vy0IcJ4uay`A{r0cq?WQ
zg2XiH2j#CPX25xIthtE*mj(5|NATp({JoQz0}cj=d2+_c(P5!4Ua4C)BgLR;?>5<X
z$T)ra;;BvS+iJim-7k$bRQNNkmQv}^mLTVdNj$RVk%0J+jUen>VoZ9ahTDs`;ZB@5
z;p_%8`KP{pD^E;JJYet7Gam;F+c0`JKcZ1DVlY8K1kNkyB*laSwd3lcUT1H``nV9q
zcP$q~e|qO08E8y2z8)1%?T^~_WN#4k0IEtvH}){$=6FSj3m1gNwv2v9=_Ohl%m8p0
zj?$6^)^|I9kungF1cgK<CR%2c+_)Aat!b$E`3ojmShnTbI9Tmv4S|75)!l#8O47UL
z63>O-xir?s|0M=;WPOa4S%@mG=w{lCE#c>2>zx8d+KqG18Uz?=YXdEJ!Y=!9?75za
zUxQ07^S7yNPDN>%EG*p?>v$<M%nt;tiBkGgfOZ^(Erv`q?c11M!$0%McnU<saGCZT
zh{R272zi#q_KTxYXch5NGVM~IR!K@z<cqFWW{?A0&>bBSBQ6;6j+k&mGPl&SvJ9{B
zt9*nzRG1<PrskORqtmdD<pDz%Tt4Q{PTqnt4SfWJ1S2W^(P4^xZrs`=zZuH(>0d1N
zw+wNQ%YPOOn2h)%e6==t&=U5hJ_uI*ev<L!i$)<o(YvSL?<D)8@TVXB@xk>Tt?nFU
zxB@ixr_G5s&wfGCpPbEVtrb(n(c(wT9Q1AR&K09RF9j0-q}ol-nv5{uE<osj$T@K)
zs&FS{vVXc#$bSY&W)UcapOozX!-wySs)F}Cp-nB9>3U+cHX(IExt*Dr*%=(<#4sBB
z9<k0eUq(sbVPUG1BF`uEi#a^ED+Fz_F#m|UPjvOS@}bD@s14keuaGnN-w7?>{ikL%
zi^&hy0;*R4D2D20P$0Ljq$Zw9vehIJe$;E+RsC)%kQ;&}q)aa1Ab-5_$o&G}pL9ph
zS@UFGlX5ZliM?CCodWN{TlrDCDdwcK`$bj`@?wZ?%PGhe?Y@)H|B#S>A5o;(j|h$0
z`zu`H|HETft(7DzaL<;PH7H;1xvN@<mQSsbX`gp=D&wSA1ByKnqKA}*s~1G0a67Ao
z2XE1n!lGG%>Y<>2#6ek3Tc>RqaEa$^?pY*PbB{Cur)BD{B@gu>1;b$h*$~`_p2jNW
zD%kpA4S_P2Kk$O+9Lr$jAJ$Ig5Q}z`X^&!bs$uPVVxJzRbK06W^!}Fe<JM-I1{rfu
z#PDM+^cLdHF<j@AjCjCx7;a=RF$@Q+o<Rl!C6hN$GNI>@e%R0SyXwGz!}+erSOU)c
zwP>_$uwH+UlVtrtkIUB;rZzMXKQH%^P5CzK0hzF|yj@TJVuDI|!PG5wJG8QsRZq+<
zHre}fl<YfaB?w^?Dr*lRa+9|r^^`yL2b({Du_d2<V^0Uh_9D7a9Nc3H1nrm7guFst
zw(=tL995+doVq}nE{F71nf43M-(c9|ZRb$)nS1Hgr0u?xGQx+w`vtDwFE?FBe^O*q
zm>lGud{6G~X^FY}nqF(uVxya*<C*U6?xCK9)KpX8)7lpJADp=P?@*N3s+)m<2Y={F
zVEVj$Y=@~>n~-HIf45yc)iJw#lrbp9B-ub$%bGVfc{mZm8D6d+^u>3S!L#scesy%q
z<dh?;e)Q%GEpd}*VIE}%7Y3Xv-8J6;c;XEg6NHH<I8fodC{Qu~wL5ewajsO}KMgaJ
zC5wswGutyzMzTGX^_!|VgjlsE)IVtTHHf$Uz~N&F9`~=6zQXJM7F`!|9Low3XoD$k
zj8S;@#x)q6chD{6L$IzEH@`f&0hfL+&xSok51p3NC0ek)-5HdPMAsd;ZUS{tZEVlk
zV~%n6Uwi_-1lhQRf7m?NVe^!{cQ+LZN|FC|L7Mg=#)mazk}LJLE>t7LWPj7cXMjhD
z)56aqwbxku;k*z4=FyTKPY@o+YN59YTM;<7SRo77{(~6H-{oyj_#=y>)TaM|IEs{h
z-BSZz!<*)Rf!~8xc6ipgS%_pixB3F`rR2MuBS5c>`(GT26`M~9|F-f4)$e_?=Ko{t
zJK(9_|NkWwDWajWZgrw4d!K`n=wzHCBs<9p$=;EfRV4F}QC1lt<5*=ijIy&MWN)(n
zug{@%$M65WkNddyaUSR1KIeSS`}2OkUeEP%!T133_UYF)wpBXknn~fHzbt%n9;<~E
zWB3AJC!ZaJO(5Y!!UI#A&!A^ng0KF28SHWUdVLqHX9xY`L$cMGs2qohoS*HZeaQpf
zc<B4+koNn6b_=py+!?~gdC}j#XB%|4f<40$gLS>VHTv2QD$r&1J`o@z9lu|10v%P>
z*@wb+5L(%Tv&|PyvyfMx!iZ?O@b`-je9w%L?Hu}nbISUluBrX#P{g$Xyh8oEt7w4|
zkbKUE!K4(UQQ8a6ms_IC9nMHlmIssXFP3Sy4dS@#&cu?jm(7tH%KbSKAI1An5U8B$
zzN8QG8m0VOR=Hw_vla=XP=5?b>lWYmPyubUjgisCeETaTu^IyS4?+NIZ110JhH5WS
z_0WERHO>lG^TTlq5soQv+_EqXtUxma@s3TlL2(pb!s5{=+0OfE5v7pM`K1=hoHXlC
zSD@(ef22$gPsRO)_IGeKE6TBP$C2a|o+YV7SNwJnVo{*xZ0X7b8DDa*YbY&7JqZ)3
z*8`kX-pV<VS)1m0Ww5zwkh6to9dp${%It@w9AqKy(`j%DVl#V`%Y)sKlLNu(F^~3B
zj7nTiNf2=v3U$U7^)XIdf&n_i?^t7GHI&xHBXf(!OorVkIWAQNGOJ`|Wesbs&uKNS
zE_BD(%eDPP&A)y#+c^e1>rAE+Yih&Vio&2PUfE!^Hd!Ecz(y{q;#`(V->!W!z)B&v
zvx>nhMLp9B_RJ50Uq8e3mDBUu;P&X!PgeuskgB3SW*gMo>WSfvM%|dZpNcO{6M7X}
z2gPrJ+ks)N9HS8XL3DTWtkx;brTWn3n}wq<KQzV%iWx<%u1>g=EH#L)Dq2A_Tk7JX
zomHD*VsdQkkvR}8CF4M#G7Q=@&#8j!vp*64p_sW(VdCA{QmbXLtF=r%sw(>0Cg*pX
zF{ZoRS`mYOvQO0P{gJ!E99|X%soDYOAduaj0s`3?dfDL9rYJks0BOogWxfrz1||05
zn;7hr-#PUyINCU)iWYV1(ODP8n8?V~(?X)68p~Bf73sA*#o!R1QN`05Ezc&3zi^&Y
zaZ$os)?<f#Sfei`#yA&<Km^p4YuYyB`GYA=%k#;|$k$<ra!V=zosY57TBX^FX8|(n
z)TZC0BkwXJ+WPt6FvTbl_#j1JzQYb%L?@H~Vn}FBa{B6|TJ72J;yP1vQ{|e8=-Zl+
z38Y+AL5<@@D%Iu_&rx`+HY;}QRuOHhUf=QlTcqfd7xhPiOF8H{PwMw!6Hee?;4oML
zO@-RZ;0u>U9Ab#_BP)+$`f&)pO7pngz0{oBxVF071Q~<Dhg(;tnAbCxK6;5IAd}Kl
zI32%GQXEjxuu>W`k8oKGby0P|-0ao%0;ZX<hg?ijn-#b6qpjxa0-@4UIW@-4q}Ne}
z8JM+heU-GsVSRV(yj~t25F&yt7U~=m4-l{g%xXr*GuQ*IF0cdpgpgLf*!Ku&WgGOM
zku6;rgSC5pPR*y3gRkOL%Q9phUJ_mV-si7smf!z4z_l}{MKcu{HlAD)DVTb12em+2
zgIU+~<J=^i)39PrhP;<`5tOa=$B&O-NYSeHBc>{+J*?<MB?tp5xrEX2#R?j$xn9=+
znW!SxYzxogSFqKbcF|IS_B+L|y@0FAbaA;*#1&sRoR{if3gcK~R9N6QXSB)rg6+s$
zu+zi%AaCu)^#&A8utR5_cIn-m73HXD!4S*S^)rhhT8klVy4;Z;9L9{bQrF<7UhZ^W
z9veo4Q8Tdt6F~6y(l|UQm47x1<ug;OLy^eK+j-l+iY5jm*`y!DmQJ0_rtjiO+up21
zI|mpLsk9E1l^(IX?XOpxf1KX0j2Xz|%6^T5r>fB1gAaB(^5!1a;~A8iZzK+v2Jds@
z|BjtPy_UIpVXGA`u0+|WE?U%|Kc&eCo`wx-)WN8wlazpD$K_1qHLTY?o3rY&8%$1j
z8Z*v8Ps}pf{&D{VZ5%3IO$`JN$3D$4T~{zrad8^xS8G(2cD}rRb$LwDAQw=iIDu6i
z=N9*C7`}Fa+Pk7~hB=(lji9h#2#%PyPmb*K@Yt54TSeutmsfET4rVt<gxXF%y7Tqn
zl>{<t;%9{}GGn_qNce0iC=Gu}O5)8Jo57#I|0PqfC)6u|MO;kIR@6oU98-se46S<0
zDdu1XcIJ!dFJHd2*?eIXbG$lKk}$huL^V2VGd$&XmxW76D5+L_edVxU%-U??u(bFR
zjkfz9q5ehvltKKwn`ExI%dr0NkS?yVQgbGvCF#rh;1R3o)xhJm!b@@bjf|m8IKTYw
zli!E*Q<s~I(@cg0S0>d=ba%BL%K)u*Tg)M9%;epO$jB@~Zr*KjJ;yoieCl0pVpb;0
zhHKFiy9(&;=SuhZ@z!3V({jwThY#KaGlF%@uHW1leb>3X#Q6)>EwtWf>rx%%>Y(S^
zjKq5WYf93HyKBoHYYv{oe{M&ZPayn(`6Lqlt2Vy5AmjxKXI*fP(`iViltvzI8GCwR
zJ%tBR)@c5c$M+fSZN}E82P$DK>Y076JLuMAKvCEd$!TvjBc0RBYxBy(y2Q3Zb+}ww
zD_E$m!pls2igIo&=J*6DW}-2;abh>VH;$qC->0ZfdY6XlM~9P-M%(sM@S{I8gkyr<
zs-7gXuKl>2dpoyOzB^(W;tNv+3%~3(sc4zVXs{7nnKxUvZlB6_9YBwMS0OWe^wmFI
zJzt?{+^VkYspZ$VG;{ZuSI#hzePK+uJ3q~lQ^jO=LDYHH+rA;PD`EDSty$5W^4#$H
z!pWTB%t6)*jKU*fB9m+j>+k12<*a+z-!kF3ff@No-SpXOT)y$c4m8<p$(`cKH<V2f
z)mVYQV*Nmh+jlKXVm*AS=N@(QTD5oF$%wadJ<qdh70g_g+naPj@oHMUIM6Y}eHKI3
z1>vhL5wC;G<CFd6H=y#>L60?ydvs)ct~YUU>(R)sL=x?eD2|ajP<Fkuw`ju2>}W;<
zj&8YQP;3Xo7qV<tkVq6$M6^%rYaN=I?bDf!-^p1ttB{kI*Xo#D(Bnqg2#jW8@p9)x
z3bo7kG9O*M7*GLe0=kJyLIa*8-8zGw1YBysrcN?^cx<@WS2J;zw<q!0vqx*vWX#O1
zNt#yEDFY3UIJ*r6^K`E4))a_H8v7==kQ|>oD&seGM0`sz=TY&pgZe$oN3SD-H_$mc
zduG;_+8_;gaq)L5g5%2dqKJtMU!~8EPG7LoQ@(RX80_=+10%kmq^#l`NL{2Ngf)%D
z=bE~9im%Uzry`lDMwXUWYU=7(l|Qb(8Rd;x^lK||DM|6V?Xy=wtg)`C8+!jxQfv>G
zEB?%<-KQfZ2n~(vC{najcwKDg<YROG4AVs!cdH_I>j<|_x`9@Xx~n(K7^>nDI>m^f
zy&-`1VU5`>l!(%9Qyw;N4<bC>Lk+UFLC9M&zd&c7#Kc77b)n8Kw(5OHp}c_uJ!1eq
zt&)ny)2^uin-eD2Obe$fC66P@<R-{2ZW3Q96HhAmEEn})+O?Epo8P1kDf$cjljK$Q
zSN?)d3d458k|1AMVzi#S2dro1UfyBPKHfRSs8!7pixiVFV#&Uzj>T+i!yw5(9`5!-
zEl=S9^&YYIV;LiRqwanfX7Y5AJaJ}p*J(JP?;ihlg%o}Ey1v1FT+o)sPZXz6ZsoNf
z*`iTfPw6Dmwo>dZR3pHq{O}=7j(#1J)%xl}Dz($Mb4We+Ty8OruIR$hguT#Ul!Z|@
z#q?xZk&DYdK=PGtAbK5`Hew8Q!{7_&%mTX!730A2Tg8<vA5DqHklgmbg7JIpx%{DZ
z%M5@i5{1$OLPVjoaP1b(X&H*qqjY(7^W>vTWOR#qpg^VU(0BNUx>smRC`~KH9$^{Z
zPExdJXz@LH7q8B()R;@l@&uS-o7BBh(|rY0ziCU;p(W4P;8_>=5aeH_KYgKEwlz*1
zU}<|FUjDqH=^CT{VSXRu@su?OHSI*)B!4!vfScZehu?guSAjEHs5(8L%2k!g-l63Z
z*0+|2&AVSJ579UdD9D$QeX}2=g;#33jzy!;yc8-uSX5F}ku(M(bQHkm5*%k4=rm8;
zDmr0Tr^vkAT4mI&i%iLVA~5qQUfS5EwMou2@I#Y)9~BHy{Td~s%_=>jDFWEW!sMGk
zV`z@jsENp=?9Q9aWeocIEMIn3XF^iYg12yOt?c{#R-9$WxSyWrQiFP`$UMmUfGeJ_
z!eN9CS5MDssQ(3<aI#CS#5Sl)2#fJ8m5&=f;K0Phq|7QGbxD=U^>YE{mz3+CGU>CA
zh)T0w{25&=-sfVWZdjjfPEEt10U_$5O`U&NEvQ$22#Rak!4IP823liQA4F>m&noiP
z7#60VD1p+Q@9GQXrvFkw*&Xvx@lelvvFgwxv1`n8gJ^O&+3+C0fumcwjA5{kZlo!!
z?`lX*3!STmm@~JQoHkun!RmsPc8fS6EFFLp)y_4Cvf$Y|jsf;56nAR7iy08^S-z_m
zNeQj{sh)_F5=bQPTsrECM~L5iqalY;DNdKrrTl9TlLX2?nnGV8Nxf9IDK0dLa)tTZ
zRh@^hn5`D4F3*jN0$HPvn%hN+PJVAQ9$A{k%bYAtF`B^Eoo|N0>We7^_F{=INC~x$
zDCXlC!Ox3Xi=a0=>aMQ`ARhwxsppRcwvnPWy3SF0HLVr3(6i4?O>O8ijh7kk?Z`Fb
zoiEka2Yp?wV**nJgN#zKMK_r>e({3XMQv8d*6E@ct^a&M4Co`|#T07j7K-_G@C9Y@
zA{$bIr9ge)o>px47N%L8_Mj^{(_>(>VoyXrN~oD)=djHwm?=JIvftxC+iuf?O7}wj
zS(dIwMJmk@SZQ?~zk#-|1OKp`m#d0aX`+kQRl`O~p$^t-isN806ooSn?H`rOr%dCQ
zLDn;HZ0<y~B=UkKW29Po8iY0Ph8^nBu6R}nTjlMpczrk9EApKTE>kh-iit6H0oU?p
z!>R{Dsm6*`iq0{rE_E(VPsyVd4XPGC=diV`@($#okNN0p2OLl7D$*w<jQb@-pVekn
zTC8<~n+{hq=nR&XlS?+rVcWmeDHq6;Y@!S-+TCCK=x>s^+wvfh$tTl10N?xRDb0ON
zMgicJ$v>Ul;K6j&9&^*!VBx)@axyOJRpyJpO`<E?Ka?Nfl^DJOA><S)WvEIrT8oBN
z&Fg2i9f;W<>n&5Wa~OMlEVvkK$iX*|jt1ki?`hT?;DnVj^`FVCgBs_vRY=h|4|8>R
z=ybPWG`nsDG)NHORJ^#(SK_#Pb5Vy3DC|ctB+He%!sFi3qi3r#uMVLF0+1K8XGzhY
zrV|Bl+M)NQX14^h((HC0Fa`wt7TGUh<)*C6FBC+kkb`yhG%(hW)Sn)Rycr<PQ6M=K
z)2wnKwsQ%u_@Y1c7g>abMTMdk6NPTMT7Fa0xS<l1g_0M%M=~=g@IsONFCx|3K_SYw
zSuGgs4Fop{(#%bQ^#6O6k+0Y%$3jV>CDZ2dB2~ebamN-8A}=~cSTjbXy!$*59Gb!W
z0p*_7Z70=Ep10wxiuJO7Hj$;au~aX9p&vdP)^{m{{gr98d8XqzJfj6e%AJZ9Ic*h8
z-yW5}GAJRm(s+CTdq4f|en-?@)~U<;7x<w$GVamcwyDR|TTH#2(v)(To_;1%-H7cW
z&@Db0s_$iC^;Dl<I^l|+Wqi=(!Z~2OsXu9Fu`~FR(N?msRGt^uZK%I<?7JAj{gw%I
zJ|-6qUIkCrP5MnU*B`fZq$2nXmI)NGm>P$ngSdLi<9364THiGkwgf;|eZ0cX13)MC
zT_zv*0&#v?E4E_6C;;tY-JRMM8*s|QW{xga1236Z!d*oaYlQV7Vhur8jl8z~8X#r-
z<X#pPQwkG^@23^0;1nzwt0(B-T3Yts6?R9L(;Z()xmQ~I@0>I0`|Sf3&(9HBv@A2>
z*(A(aX%ESxyU!7bnwHM#J{n8v4#Sp|uURqNRW~{6rMat!U>+%&mrg3bEI?En$VvTy
zqfUIjtPg81Dy-YmVvQEM*rO9{l!Izf8NmtGuQVw}UrzOok^<<spM>A-Bpl>>GM^k+
z;;xE(%oKR&`p>oVFzSawONObGK?d2&s?9~{-+|QymD-(eGmh*r!?4F7`!0bQS8pd3
zP<e&~M@y8M2e<xBX0F$~3l=m_DXk@&EB>!c-dAnu!c6(!XrH=V)8cJv4_Qktadf~u
z8(JQ<d;uG7YH0Puap(wN{kL$_sU#X@B39W4)QrzL>2{4C?5(~2x?<p=u{;$=iHItA
z^byoN{I-v9IFW9nuh9+A{XqfwR73p=0+`g7i%V}d&M`0vutk<|k`fSa2h?{6v-PMd
z_^THFkmGS!vPy??tzgMcFIZV&eA3_NrTc=sZF?{KUm1H#w)v5ekNRCbsDAW83q#eu
zwkap;59`6D44hd#ojhBrr+6s4PJ>JVUTOrv!VcOI6Agf46+H8AN3gOMJO>bx{QKbp
zpSDCNkf(g90|k^;S)2$g#QUda=HVFtX-ga;Z8>i9?50UrA2>ia6-e}R?vu8%5(NGJ
zHw=QWPJ`STWZ^`)vqcBUoe#h*IDO{(RY04oq_}7@zF=i%cp$U`0~ul9M2t=#IuThZ
zemD_1EEXi;YOJ!o@<%~PV^_Dkou?{QIsGy{XLrY|w293+JS`|G@?*e6hRiK;F+R8=
zJ>u$s!;0))E(KhXg2B-?fW(zi?X_g-V^;2(nyY#6^AnlKDHKr|f`RGgn-9$IIuBNb
z`RIsOh5=Rv3roHn%Iu-ef+dy)3q`|>!*A=&R;P#L2}Iu8sxZH!ZTZJWn)hf+btZA&
z7p|?8dH*>~7htUkfVGfX4-Q`l77P>+#m+b7zfpmvSS!R_jV`(zL2z24Z``?~pv3lJ
z{V&3`7b%&U+*&fv(t;37o-9JI9t7J@vmQFSm&(6f!aH!jVKBQ^(2&NT-Jrw(N7u8!
z*v=l$%lx*V4M-a|oURWK2G4@z4m;N6P{FWJd$B$oIfH7O*<CddRE-5GHD8JOPNF`u
z_1t0xPSf#9g_E2u?ZV;jSGTz015>_V-s_5I7V%DVE0u?AxthI@El1<><b*}kfwr0}
zW-3e4C5{CRwfowz&U`EbS67&KOOb@>9y>5~kIcF^_Y4~eDd7rV9QB@7pU2`ki*Xq2
zup0xp8;F<4!!L5u;vm}muLGzIN(mO$^B}K#T^m;eKTHH-BY<CB-mUuu*?qpMV{{sE
zv$zr8k7*&^F0k3G8TOt#AEwKEWiov`DSDl6>giEZwAQ1^R4O3*K+qF$RMdx4R6*Jr
zXqC}wl)5YH!zXv<nP9Ks4ZgF@6~FJP=y-5xtu9Oy26A^#@t_QyNq_^zSeM1HH)6XH
zP}t-+4Cy)VXcL7UxhvHcMUTtTAXPs<{_^%<B~1GRdo19{Si#YJ3h>>hCjkn2AJH70
zcL>TDdi#P2cT{Cr9^Z%EkcG?t_xTm76L5}lta&2JNSE_8;ubO40z4adn*QY3_JW=Z
z3{LMSQJ1I!;TB?Q-X|TzDIlmnoM^bLmuxH<?7n;>2_TP@Ie%;ks3wC&w1C!QVa*(S
z|2Esjfmhd<t_eM#pC~F882^B`{^9v~F+*T!?2Y~WYU<z)Ff^q^l(1HtJ9~210$=h^
zM;Y*e=q4T+Rj4?KS{n=&v^GkoqZ3Zme|Z6N>*$-GlmOZLsgHY)ea}~gmmo|iO<a<G
z{06P{(+=o9;A@d(<h&qx{ZupcX4yU<#9VSUy^^6S<<=TtphS+HlyFd~rdu&Q8s(Bx
zedz#f7ODwl*LL7&A8YC<`Ldq$wX_}C)9R6^Y6-l@dBoU9KKfkS?@rLmnoO!OO_xs<
zM*Z~@%`L7^(PNI(V+okUdo4N&(2LK3E&9A;Q^w2(cNc-DT=8H{(Q}~n_5z0nt*5-6
z3fK%HZ4Zuo!M^$U?tBQDHAhm`O*hyzNq2xL0`@WG3&(oi!=q@AVTsj<U>mREt{Uf`
z%p|SO3{1&Or?42++^Pk;@(i+J)3oOIPmBzw!H$hd8c~I(-`ef}^uSPFOjGc+GW=1s
zwaCs{KXq}m!weAdhqRy*yz|JSq{v^KWB}I>>~KWG)*tqd>Zh!(#U=22tr_*b<iYsJ
zEUl%z5PkRcYeLGE$LsBK;I#*N<k|r_y{ABQv2Ww`wS<bf#V4Rcm(2Q3&O~#*u?53L
zB1%gCKI|O2+B~x3r-PGN7dF6C+X{D*$O`ArqfYd&LX{Cyke9X-*ZWgF!JKk5W9IC(
zFZ_F2DY{8cj=^SfSLf=YcEIxPv9+b-t;1c3fsf*POWW=r?h@&G)%<#_y{+>4K`6JM
z#H})MRn3Q2asjKfi|s(eR<K=xJuIY@!*ZK%a`z6Lf~<aZgcm#&#I`fI9I=<f^7-hy
ze2tWlH@7<uO-lId23yeuQUVBAvYv1b2%XM$*sRzZt8^b9`q}YhYy9YVxE=q8YtzBC
zZK~TiVOf@Z?JcIl(dHJfT1#uUaOQtchqwbR-3icY6BRPZ7ROW`Cl=nPl-iQyA8KaW
zH{f7E2l{aCDwFmHu0LuF;u-|iAtRW$pxy+hNDPL;==(VmTyNk3F(o(FDeP_+qaztJ
z(v;n7@Gm(U*EzVS`-;3CL(O;>HM_67`nQ$;qp8wZ>OQxj;A`q46gP0Z0w-0+tBU`l
zIGw2pe&WpxE64d;kJ^4)+U|W*@gNZtx17w}Ns4AxqEUw9f$O!yEzpWdUn0fLH2pl1
zrin)q_0I#kl^diGVSVn|$Wc5H_TrDGY}2Pyt%7soF@<C3S5@<Z64(2<q%IX$isu0j
z+Q>)U$?=(Th+~orKb|ElPdRooB{y}(CF9$QJYf!<*k=9yM{|zJ1`U|O{SZaYfjoxV
z*cWcXRC1Zq!+-KNOQYEL@ue4Ez;}f3gy(Q=WF6bm!bZEXBUr$qu01~ak^~VcOvRn(
zu9<p!KJ>(D!_xGTZ2Aq|lA4SnREfs)lqOKZMO^Q1^!<&oD?}K(pN1yQ7sU=i(-$%n
zcwxQp?(S-VEB>Yj+dTfdC}1~YZ7tGzR9frc6Se=KoAA7FHhl+I%63kAxo?~LWK^ZZ
z@?GRh-5IW62rU!NR^qCPJ*li&1bTr?D#PQX1cZ!g-UDnD-_>M!kc|+HdA30t#=PLh
zU&g#p<h=b&D7UME!RtVq$C?uuU0K&HW}PorXD-kRpWI_HO6IV~7m=qa4#ANf5`gjE
zc5VuFw$v}_0tO2~AGfyQuG8F<R5biyG>K2$u+;v$(}ezHAv+3XQMf6nFxkZnC)9ST
zj)__Hn5<2k2SXd!>|Pz(Dg!vnEpQGJkHA0n>LYfvjcjlpCSaP6yl`iw_{q%~Al%%u
ztL}5Ot>+OF1NrEwGk%u$KUSM3ejG0xIzKlct=0IfQA^zFOy~0K!&m0*Tg%icn@S7%
zU22{VQuD(}+}_1#UhO3ufK>E*T0gTKu5%=_{v{3yXXnGwQrnfFUk86jgs+n*qVUxf
z-@TOgJfO7pxKnc)bZ@%Hel~vYfHs`&G|as-6hLThnJEz);e#<07AZL>exesY!i0Xo
z4wPU&g%dL%oDfUxdnG`M&RucRz?asl=ykvdELL-w(`!vrs43$PoR@77(Iw)lv2u8!
z{fMhZ$=AGEMEz}iB0j>ql!Hz9g}~mI!t>le)@wT-BD!x6tJ@l;8`EU2LO;;@lO)W|
z**v2_u))^%D(!)&kJ=sc^Z-^LwQgquKxZ-><0D{pX%@uUkXhS(Gk>uko{(RjcH<M4
z7MMGqj$d5QF0M^o3$(8g#pO_?@-PJ&E{PE;@>Tgu9O7OuX+fod{P`T!nQCjrY4X~G
zsXXH&M>8x2$9%j=NKU$7CC|eAnZW&fS{IY<FGol$pvEaGRk!>R2tqO1+t?(fLS`*+
zf=8MIK1TlJc?WJ+jqLgX(^K1#GmEZ%;WL==*KzFcDY&XGzmFimWUCJHcsvks*9<NA
z0pO<uuSpe{P4-vmfF;#yQdILWt~XPNN~SDW$bDk5p3FL$5)}(XECrkX1gII%yeC!4
zuY<N|bo^>{rbcvTHK69_u>>dWfU#-6zhVCSd|7?4dzk_B|Ng|yg&(B7h-`5ZC6?5q
zzZ=X!!$(ut5Y~L5<CLpLT~ayzU@-A_+GJ0c+1!bz`@8S|eY&4w!MR1ugDh(_)6b9v
zgC#l$aMuI%ZXphWX9jmy0VX+djp8`b>hkgUb>5#1)HBZy6U62BBKl|V!U=1FSW8!D
z5>bMIRzL|-0VNQZb4-GagdO`=QjZAWdYQj)vA+p+hnb*C5E6sPOKgL<tk~m?NMV*}
zmXtL78jMrkq8GGTm6y`|s|^0=p+G(?S|SveriuCJ7%{i7S%|h55_i!VJ$L|oX`P!~
zh393cwNhR)EXTRKSiwU0>7a1oFaL&JiD%F}ZyPkp#~yzjgFW=9Ozqqc@s9YHBx3uN
zIT;aqJr#<R=e;*xIzt;Z_nTEqR{&6k@$8x7KR4F5*&D_WRHftMUE%rj6eYu;2z~0s
z*#sB=m(MT?pMg;xKEv&7wk!n<4D|e=Hcxw0ns%%Ac?$x+?WTa;3+kiohGf?TtBSp>
zi=AV@Q#<Cu{Srz=#GV`tM(|yIV2$3gxxrmuK%MAdh7-c2<9f+X94+C^>Ks%Q%z_ju
zG|)eOo`GftL-+Qw9ij%`k@1{t^O55#Q5R)uuuQ}Uf@?R=F84P(Hc?95jkNCJ+b2fg
z^AJy+Gj6Pg<Dm;hfLG2|V%t=0X$|i$G;=~qQ4}iryf*7)t2%qo4#@7oy@xtOlAQX(
z1JL^H{DHmKDYdk}$%Qgv^vn8H(GyVX{)Q+^Y7hGCi4HldJ&5R9k5vTQx}n2(CQ+|1
zC>h1t1}T{D$U5k%!KDzQdBRm==&fqT?<Vnke566unK&XwX%h5P7Ob&LJ3!;of{R>r
z=KA6Mqz9$7+vd2Mp@W3stEpgrK?-&3G)m`0uXKnlEz~J5c4B<Y?ti}wX&1~Q->*XV
z7nnkx3cPbzkLW8IBtXD55&QFrh`Q8P(Z{`^YMYW|Tq+}$pz8n2MQ2btNxj7vF+L8v
z9iKy?7SA?r{3bZBrL<)yXqJ_vE@_Zi6A3d{7^v|^KExoviDC@o^P6Y6P`3wBAgBte
zXGGfys%H+@Trg$ZA*NgqSRx`=A8_SzW7u}#dLJHS3V|~4!mhxJuY+w-p8AMHn8myN
z4&Y(G@bM#`iRGASe?6nkT&ORcsIhqJZhbG|w27UdvM*&2Z0K>q1NTSlv_Wm?GpP#L
zDv~;NVIIZ8<OfJF?hS$j|FDj4n7+$w5wHElbBv7=V1j<9WRzKtNYw2JIsrB634zxG
zo=%WhtcU3W5EufEE4t0&kEJs>V{0{3S_oP=^;7ys8DD3=!TjI<$^6@&hq`yujEa;9
zWERgGq3mjO9`5z)m<>BDvShicJGQX7i99%%wWzacz>po9mWK{SVy75J8enYYe}l1q
zi_rRlZ3QFiPt3O@^-8J|zkt9^5j^)<vb-|+2d%}gz;}?!V~QM3AG!ydxU1??`b2&n
zrLTV0n}y$?-b4UbW($UArsq`vZRY!Odk_?SDuko#o4Hzj*nhxIs({l%u2ytpDI~zh
zCBbHZ=;pyL!Dz_0_j*9+Q%lA+&``;%AR#vWM`i52ggGcIwLfSFY~A}j;SLDfNf~>1
z$gGJTXfo^LXQ*ydV6b=NLN4({Cy>3}!r{tFaVeYjBA^3X?mUr!(|}D~7G%TVE-TUm
zqB_&hgr(YC;WG2N&Exr~s=@0RuBvTYsVwcQVSvhhbpcn6*LSx@!$;Ge+Ib2@acA<j
z;QU!Bt`?HYR0Z!N7wk!%LT&L?(H<g$@V(uRa0rxc^NV$a&izVu_g2L2l3DF7Y^ri+
z6D_CT@qSGn-GH~&bAi1u?}+#>pb&Pb-^8!5fd&A9^HZm~xfZ3gs~}%_L$Vq`);0S~
zFxi*0_^Q93Uy>KI^VOQ_>ZFl0f;?WxJg(2`8Gunp%n&hJNIRhB20(b5aNbC0Htb%v
zy6FCduYX^)|A=1ut>X=+aQt4ztnBjL%Oxq=Zr~8VxOlp9ntHPG^Q*DN>#Gx~Q&Z+v
zv)?|+S^$H-k+{OGpl`a*qT|r#XMjeidsuIjoEPItUyeh;3DWB?!U)m~sK7tFK#0kJ
zR1e&B2xN(N7yY5yAU?4-j%FA(uvpDCsifxT3(rZr%u45!nrdsGS*___@n6c(TISC&
z>lVuaN#8#|3}bleCfCkr#(w*U3d+<1poHL?e@4#yO%LCL?X7Q67PO^RL-j=fA`=?@
zssIEIM-O#lpinlvW*{B2zB1TE-!<uZ?L=Z({?f=|olCLE?Vh_LGu6CJ$PCUoWN@u>
z(umm)a~%<Mtz=km$3nOkc1$|P#2z!?&w8_Qca^?<<f$@MV0s!tnLCP4m!0~ItN0g!
zo6K6_QEfBp2FOX24ywi2LK1L7lt1f31o50geYVAlM3%}2wFx_jE`AMeDp_AHVRw>7
zlI$BnM)NpqN|$*#Y-zQ7-N~v+NhLYmc`nrlq%C_|tq?lO6|X)<umV0#%3v`M7pnmw
zd*uwABeeuQpwNiMth>URH(wJ_Amku2YOsv)|6In%+WN7j(z{yJiK=uu&eR}L4_8X&
z)JmGH9cKn=E_#^}Y$lXl))!p5tuZFQrN-C{Gg)-_$S-rBM2>q62dPJI7_ulgBT<Oq
zfIm8>Nfc6B{EA(HJTow97#SEO%{M77MS%{DpPyfkxapCPlKJ3sn-t}R&v#n4n;5|q
z>|q#`oNE8|p){>xasO$v%P~uhiH&lCoe5%#?{F*uR!e`NMZyDl^s)1On<%|Hx@T!B
z>^zcRWZHtK0g&x3F=~M_9;tVDp-bVV8;ZB39YU9Oh)0+I;MTOqOPE@f*g`5Pnv9e{
zKF2TiBQ0T}b54A<K|HyoaDac9bFG)Nv8%{|e&$=1p7Q{2%w=Q@=F(D2NgBBAJ_$9C
z$ysPGJca1D_8|s33GM#(A;VVb4jM1ok4Xn4F|YLOkPu0%G2PffkRUr`cx4XSnSigG
z(x-?Lm?WL+4J|I5hv1i*!dY(qnfj_1eM?j6;`I9jaE{Hf%qdyaot>CR%SCJJa&(%u
zv5+l8XvEueg*%9`c;CBARBOe?P(4|%?%B5GmsHC*(53|!*t5-5#C4%$eKjW+jBhl~
z#-u+aba8XWNB%<n3kQl9X>rN5op9(*jo3;cW)#ANP4&bNLM(UTH&xNJdm1c{JACMn
zUFEy?r`iNvZHh)TaxzSvoi+Uf15-bLR?Tr<wV#8a(@XvV0nG!epiO;(h-K#sr7W~t
zX3j^EgV>IQ)QKi<q?kEXI>uH3r1mjp*W#nQzP~IUkRyD1ty`DmBD`eT{-v89a~{92
z65LjK=q?G_UnIo;^S3y`%)LVJkneTvgjCVX%VuMl3vw=<z+qVFmmiWNTN|xglLfii
zM5;dqp1@&5Ul=I9mbX-EQ>^H4WdPAV6+<eZfX1gq6ZjGR%^c%r-ZAVyr+xeOCA`bp
zVve&5B$u+Srpwx%J+t@Yy3rH}7qMd;DR2TDJmIuQXwL75RsD=Szo+$r)})2i`nItx
zYRn(_IKo|~uH{Vj-q>S1u#QR5wEMQ~Z!ul0nro^tR_C{a$@a<A%0i*V9jEVPvoZUZ
z>UOQ_Z?n<#Oiz44HQTL03?^J>a;RdoX^nVncl56(%v0%FwlD@GyVZ@TeT-c%{ODpj
z3A)X@tU6Fi{g&D}+kJXgMV`M~$L9N_PDL=2Z1xR*LkK)zm6_@29InzD9^@=ptT9vO
zbol(iD3Gl&aK|T5{Hxg^VY)Z%N3U3D4;t|fc)lTPrkG@eEC4CqBi(d5((fPoa$L@d
ziDXhdciN_OGjX%BR-&$khbX6;AH}!M`Itc4(M@+b@jZkyIciA~!6*1ri1x!LC7co^
z0D;}O;R4#mUrBrB7$2BQQ&0tyd>)F{+O)oFE>T<n^&P7S!$|mDs;Od_@}BzTi%yPV
z!!y~sdEn;{WhL#U7?pg7PgboqXHjRw1)PL)&F0ayA0h^M?G~EAZ*U~X_2W#SqS){M
zZL2LUqG*5!EQGd*mPDAQ7SVS|^j5T}!{I@t)TT-Y2);Z62{JY#8Y9v-hNbm19maBo
zC)UO%cxpfjK@l1jOfg!10iO>h`kOZxIg`As%@%t<y_&h7*I>F?8$Q<q*Fv>9>B*mI
zMvXO7Z{E1IW$Jnj?W=SL;siVxp|2=L3rJ|~58{p@{_8&M-(NU}mC9#)7r4fJ@Zcr2
zTvH{N$sI0F0+_|qx*+_LZPiIvRTGTz2JeJJ5qFX*8jh&r&8v=#ZL7oibjgAp(~|A)
z&bwQW*vRL+2o^*LpCfvI#Do3M(XYki>J~Np7hS@~?FR9QNYyc3ylgt>gL9Nv{az(r
zi(z)vxOw9!2Yjz17Fu%G1D4-3&&46&bN6b$O$cq<?&mL(zP#u&;jj5&ymUAO;x!3u
zmvES_UBp5?_dp)qMV`7NpwV;4O@kXl6J!S=Wk`?@+?c<;KoW=3=JQ2L=9<--R#pll
z@OUMgF1y5~_bSD4(auXl#RHHwf}{n~w4UcQ@7@g`NUCK{f_P_2o_E<zd^Q<uD{e5o
zU6zEThGf?MpfN{~WHS|om$i^6R8MFz<*q6U3bJ8x#UrYTu+lWTi_^8QgWon3h6YTb
ziY^7&P(@2d4-{EGC(;~;H+}swo4)?NKK9{(7QIJ+-wJ&E)cQ_6mNi*F+OG0_#2-i&
zxy7yBdc%@S@@SP<jS}R9PkeuJ3G!inF`?i;TRFf*3MpIHX~ex*X%Oap5+!x2cgGZ}
zH}@{h8PSZ?D{TIKe?P>2kNgo-uvH-kh#Ko`0)ZK6jw^3oRlLt@NQ*(>d6xbE2lV-8
zg4z$RKn`jRr{AKXz$;mJVyA_A^e(+0<z~N&(ld1RVZc^Dw9^4<Dopiv)KnNy(+~tw
zo<sqpEMN4$Im3D07($lU{cFlV7U?frv<+@Ja3D`lcpS;o<ErXKO(g3O^LsGRgeQz@
zM1njFiT1IjefZMG<S?#&|HHR?CsB~|(+1XN70K&3SiFBkv@IrhYUOALd}xXH`&qRb
zkAvylME4mG??B%{#1<sW{r~Id|3elA{r9mlcAV-{G4r;{R~02r^De3D{3Yoog)y$1
zX{O~*f6$lJK(Zq#i4e8-Z?wig;@28~?QMxye&5^D3jl1nNM&{(z!s^U6FXls5P}mF
z4Hk0ri_-&6G1O{Aoy;ETUmoSE%Ks!Syk$V>qN;_U(od6a{-Ca#EudV#IqW$wSj@Gy
zQHYU2DtU0PBH@v?v_GA#_eLSq2#GiYBiQZo*BszkWQWK!oAp$A#Tc!;cd8KCXieaB
z)L^t2MVjC@421rPnPDO*od%#Z(ddWkCF0e=dAbub?`>&`kaBc6qeD01JJC3@We(BZ
z<_8{taHP8|Uuml|9b!L_|B$*#X5opQ&!wrKoewb_jkt_AZ|86A&TlvK9|3lDCw=M8
z>jV@%IBT_YY(8Zo6?Ap^lp2WIIp7DtDKwBr1mrg81mbe}gK7JFj|E}NK$QO2K@@)^
zgY4kesJmJSC`fOUKo~HMZVyu$C7>0rU~Ie|rt9*R?H59D7%_6SAN=FG|D-Yg{wzO1
z%HI#T0}#bzbn8~NrHHN@{IV3Z?Jdd_fG1U&0G>qj`3$sjTHU7_+rAMvxmS*JGm()S
z4myOP-iYn{E%9$t%l8iu<i9Mvz30KZ%6a3$zE3B!m&b>t8$p!HT3fdSHE|9R$z)eL
z1o<0!-=cEB1O2@GE0QcFJ#q>UJ#XysL3NA|!;37-`>gLIWNPzmX@#%p4?Qa7pggTQ
zNZb0ZzWswK#4#WSSt8H&iljO-raq4fIBn-~$`&P^01ft@!6gJL?>(mk%Py%$3xIQ?
z1jLq>C;`FvxI}!v1YyJoH0??Rs*?ezraMm70s_&iD^xE)AbR)M%ASGN?%k7{#`o;~
zw#X8v*0d}T$*@f9eCSbTQsuySkO;h=7Vp;3QYmSG{g?f`>Yz@5-cYA;E{LW7r!xmq
z$0(17BO<=W&Qv%uA;KmSiLiP2h9Cj%dTh{%q;Eteak)KFNj%rwQmkNjuh3?qs}0wV
z-Q^7-O~kNLIBk#8I*_{J5$z|jY-+t{OPg75a|<#mjxlAz8FT&VL@UHvGN7$x$3ABz
zn!~8!|1!=_rtPWDv<b@I-*`GZGPx^l7AKy*DP9_@S8-XmNlFl41EdoPcKexEq9fwL
z9Sf`6eP{Pm6H)@=Q?1-Et&&-5kWh&FvC<#~(-aC`h{?j;cGS8C7zTozgW^GkItD@S
z6Qt}<pZB!hObqm?z`67$E%m*Z$t&YH>p{J-S^vi)Pu!t@d-^vjqdyazIPbq<a5!=f
zcm5G$ThZb+)|TQ1dGQ0m;Bxsb2K5g?#Ks=-_h`)j-cDi%kG=;XN#X61f>n!k{kl2x
z>m9&Hnvb-b*@X2uzpHRzByw*Jz`Y?kaocgUC6%j|;4?<@+Q5N>B&%&C?|FK9Hg<HV
zo7~@Mxtr=N)%Vf>NZ?(*D`!81Tq2rPQo{8`PYilM2s2mUVNHFSL3w#Wvs*=X6DsO$
z0~QU5Vn#BLu18VB$fAIL!!DUBSfH1J?5L11KY|s6Df&OC?z5#0FR&Sb&7J;8IE0}h
z0ZLX#P4al%L25(y(aF(o`xSoTqjW;<V4;w>l)Q2n7;Al|_xC|V`{-ixXPHgKn}TiV
zT#j?%qSh0d4!z@tx);Oxh%w+uLb!P?B!naJT}L;f*``qD!x6dcq=Z7UzCtD(?a#Nm
zAhqq^_RPK~UoY-!2N^ai^VNa|4r8M9Q%aynakXVw1=Vc4c6&B**~q4oKX6LS89<hw
z@p$j@JWJ(~#6ECVAZZM?v`DC4P$>sH_n|>Z4gYgnGB!g)TnQ2^0r3VE6LY;`y6OEx
z*VG|6vvaq8N|l#NW7-63cEiATeKUJ6`^oRTjK+WEjd-&b+zadbhRUhm<BH$!cUc}%
zah^WUkA!cF1d>gneo>22ARGGmRvQI5Sj7dRDnV}eDW&=%+}H%h=4)Yn8M8b}?J@>}
zkjy?5qp4+OvGUZcD`nhiP1vN{xJ86I@WZX+w1fIcK-<9B{ZbCj*S6`b8NMp*7(7jD
ze=OZZj%^TPv{3B~9_=Kk3^5}qXn^wk0DS&kyilD<$McorjkQ6GQNWxo&yL#kBnT-+
zH($KnLW7%xd>NvVk<8jd+yA-(DdEJ8>@G4_yj8+wS#MS!38@jeY<t=fN-muTa4BLG
zjTP<=1hIqRC%V$U$tY(kT95}C{Quba>TS*noFm8&*xoKX@miys&BN))fY7bg`zgO-
z-tJ%XwA%`O9^Dgz<Bw#uRY<>*ghJ{nLSNcUqmG}dqm71K2wOJ4zL%4zfNhhucBJUQ
ziiZk^5mjH-99BEjKQtkWyUIMd6IShJYyl(vL<PeLVcgPIFe5EUgwCb|2INkY3<wdU
zT`kmwdbR05L8n|GK?x{5l2O)&bqh)R_{L!h<#C|&t0r>ElfE-?lPFMvyaFYN+0%!L
zfB_=s8l)F`JbrG$T{SgiaxD7;5X0lW?dJ>`bpjfYsVfX0kd7Jb8Q<QDN@=tHQUsm?
zRkRFNbI_KS*k(m1{Aja&kNpM1i;V~5M+BE&JPS56``E2AHf@Zm1$}9AO@YEJdB#r<
zcEcKRjA;7?&C0#&Q5I1AA>%VP9XA*(vV2mQaX~h6X$vvny>#(czmoJvNkdC4X&N8-
z-nrU<#7i;x9Ld?YA*3c6Sl)rKdnzS{HT#1u^4&TWHyu8%8cg=)S~A*nKjlt&>1Dy?
zFU(3h`=?N=Y42d71|(XgKlI%>;;QlV<w^+SMi-QS!i!%N1ZIN|4=Tt&WBJoP;<(R(
zA$O_B(|S{aeJiX_(+yqJwV8gZq7~821f-S2DaiUFA7yy6;AjZZ?Az{Kfj;oqWHcwl
zt*ZYe-TxU@#zp<lq@b+X=}te{2+WAD%58+1*m`qmBWga#77QqoO%5Z6EIQ~DAJh%A
zW@j0~x0C1+eb>fag=KQIe+=>~^pStdJkOKE9gV!94s&&g*f*K=s|%Ha)UFzi5!+j6
zTs6S>puj~8Wl|@zU`V(X?pu4fZNE-{!|rj2;xxADIL#DM)4@vjGn0TA@z6U0^h~t5
zH#-O!ldeti1E;Rf(7O}3<vqfeEP_DT_U<084gd;W)*pcJ-#NIjJ_U2M#wi&Co33Fx
zc9RDS<DF{DnHt|WHNjPe6yqYj=64VY4`Bf$JP=5cg#=Q>F4*gACWJ(nAF@xUgQ6YD
zfBAy__0}~A4^dn>l}3z=-Yg&+;0Sy<e>Od~vo4S`MXO{sl#+6ExRGLf81?46zcAHL
zN>*qDgg8hB8MKsGbW{!mOByKML^8<gsq{}{utL{DR1JR>F`1VC-y&w8<|Vl7XZ`3{
zDo)Yp=~S)7J74(crt@US^Vror(<rqA2uEq{Bsv*5Pn}AFhyw2$XBv<+F@$&oI~KxD
z+R`GpGnw_T0FuiXAH>rk?g}$B0v;i<^IrkNk3rEz^GaG~?r_^s5F%09G%0D!`u0G8
z#^ONLZ|1XZFrWRD&n`N=3I3{oux}Tn+#||b3>J9{TmqMs(4sIi<ICGq!cf@v-=&*^
zJ3`|dnZ;jiE`N86Ru`OwHm#yd<-z_`6yt{>Z}T;SZ%DCjUszv&tt2yu?_r|%44HMZ
zfh2Qjus7(d?KZ^LJy^*PF>RP=)PDc(TM-%dT?Y~}Yoa6-(d<pdvs7m?i{zyoJ)KQh
zt*KK?ES~R>)K*D<*pntN(PdVhNpzxEbo?k{i_}^+0-OU_AN~UbGA7ErHmjPk+0CkE
zOd&uT6lENDT+bN<ZUlflgox^a*yrBDROgd>hh-_po{7J#JlM*wqM&Ts@*$qbN<+FN
zAIDgvr)A+&n0o=JCqzXCI1%buzcNU-ka1C@gbVK39owVJ|1n9bz+PJ=`O0BNB_ey<
z{Jr{LBe1?`96^GI%oQF$CsV;*tKiVWe0kksg$^-vGLB4h=czerE5q|Sc2#gk7PvU|
zf2LCWO}@V&EQj{uZ2zceFBXL5w?SG!7P347-&5RFT@U<1`14^ja_6<_9)>+ud(EJ>
z{qUqE*l<f~7xS0q%WRURJ);xlUCO{g4Ycd$HbxsV8*2fUfmW)j)|(LVD|gueggc)R
zt1zq_WXJ@@=btWO;#;|NFvtND{(>4-xYL=vw<%olBoCKw(O7h_=3U_A^{}2(o<K4q
z%BBukwT-kSTd0&YMow;mY}uO6rUYN(X=Db@BEacStPn}jI=$oz<x6N@`t~W5laBA&
zQBuOU<KwAkF<4~&2Pn(zeU?ohl%|<ksvE%ADg5am^BPcqheit!UNf{O9I8?m$#$5L
z;ka^+^RNPI_xe>eMUgzh!qBm<POHRw=v56H2(ph+?Y@S2t-=2A7D)SnmJ<eA4yJW3
z|C>>E(>(Fp-Cwf@L@|(FMHPw${ohs$SJh)zDW1+|twoc$k@e;3w9apn<IP#?=)5XD
z+77FbW?RyM)*ngP4|c*@MR4d1P#Q*CAkMlCo81N|edgEp^g8apvb#5cyjC=}@I;bn
zfZ2N0s*&Ctb}l7Y#p=1t4x7MTVz^bykhL_z3_3cMS_~!(IHlWriM*U8B!w2Yr&+f^
zs)Fh{KjBwMB-QYMt&YywvDVCEDP0CE%+MkbE$*cp%6c<%Fc7PXvpIDn`o=_8(Z%(@
zaSa=4>{{5X0fGKN3a#g(3g5WR<gFJ2-$N3gD=b|O?{q_VdYjpF(sX=o*ZeK+;@>Bj
zyl4t8ucveRdhG7TwWm-&?MdNBSmEPEksK?ED&<hnIi2kx{ECG8%}J5)zEfX1kKId5
z+94&c5=fo??ZUf6^f&}<r+~44<Z623y)a$Gutjgt5gzyzHshcs+yuUq1MmO!m@VzQ
z;lzcmcfko-6%SkCEWfUjSF$#VS~U;84Ks<zLPSA~S8L(Q5CREH<c=gzd2QYE?yOG{
zgj>JvG~u)>_pQ>Kzf*;ma)!o%eEixx(?H%fa%N*hNb1f9j|!4ez84q`@gGz1iXe91
z{f2em#x|FO%vZXy8JlRmv=N&)Y<;ro7?LBEUwR}PQreIN(F@utVl$VN%Ne}luH;+Y
z<gZdKLo<&TjPU2FMLEm|pq&QsvvdPjm#DZFaA1gg^DV2JE>>9Gu0N#b?wNaFB=~(Q
z#9yhbhU#x4li&--J<gpN7>3eG!La)B|Luz2EE0X)miVj4Y&74hT&01K$dB7aK@16j
zE7veKt^4l_w!WhnCDyf2*7okUo^}?+X6#n9#X&Jo9DU-77kcMl+N!6$u)dXqWPSal
z#o4eQW0^+r6k&`?;cGZ+T5@et6zVQn!Zt|?Z>pp|x1Ah4Z-kDDxKWM?@Sa#w>0r4Z
zkmuKyr^6m_meEr3y#JFY7aq|_4rTb9p~Z5!*B+&Ku%~TweT^+DayYVJLAmKgKYDPb
zcE-}QGeyy=c)|%+F!Ca|Ryh7<U35|BB{%6F2-VPbe|^M@;d-su@@UT#$z4Wr2J>>7
zfsk}Zz1jXW!Z?rk+Ek$HcCw>nUGuMU!}|izwX+Kgk*=;=E^ToocMUBX)su1_sEMRo
z{p#93$=y(6*ry+PObRz)yA*L!w>s!^aCJd=Ut4pLRnNlB{+{VCG0Sbu9~^GK_el&p
zS%-c)HgrygE*xTebUep38ec^R?&!DiSgC!`y?+{gkCfD{)b9{)b(PpWH?NS8!9aER
z))RkyJkx`WBFy$@F+B68l8bbDS;E=u?F8jw(b+9q&XUMUh+mL+LM|6%sWG4LPZCjX
zviAPI=J@HQr6pM$4i``H=|xddk^jUkcb~fkK?SpKPwXOap*1X;4_eoFPinxl;&|q4
z2@>;;o#7b^bSDEoaE&YPrnk=B)p0e#TyUy~>DWMLxhmRhKGH$byOOatFQ4w$|5cW@
zpGRk+DuXg|UHNl7_S%uX^J_=>v8@-DLPR6VImLY6Z!b$bfm$U{dE#B7L_%pi@fMGi
zXt_K!j&q?ullQh_+b&WUoHAF>w(~Mqu~#|xiKN$-jKR@v*Op!A0tt2)e2e^<&M=C5
z(G32`1mtp@GQsZtDa&xZj=>DSU0kE@&ol)ZUvFJ}9p9j;-6|}nW%ydRHDvpX89FHj
zG*0Iv#iP>!z5?T9?mUSfZj^Thn0g9v^p`}=&{bquM8B!0Err3k*AhAXbO!mHo^A_d
zIf=Ydf5l>cIO^^_>0mNh=g7tvET8kt<HON5rtvH?C45iFt+$qOTpgZ61?VJtQOZ5k
zZZ*7qPUV!hu7;z5&oda(oo%NwkVN?Ck1o%AydGQ7o6#G_KWaG@cjWLc^zKvNe7BUz
zGqWB(DiLg;eO7Cik`b-b=e?KN$v&c9JfLt8k3ij8Yu5|ZX`x~aP;!IGuW-Lw$ccCF
z09S7wPZHiJiOPI5(wx;j9q;0y>M*un-n^URYPmVu@{Opc5LM{1e7J6_mBfkaJ{TB1
z-F4EK56kNQ2BYc4Lb2B{_oY;DUWJO%r#NhiL|c(H*JwvyHNl&Ev@kyVfjigePS;N#
zeE$k4O2`>W7(P&SKGKFq<JrnSje5VlU;!uY@jX@N7yc4Y^AeiBSH<%Z?%!6Wg>)aC
zK`}4A8+TbwBCk|)S<IQwiu0Zc{{GH5S2Y$}aQ<WW4EN|te{*;>7c>hg^=G(8**w~l
zEB92%e^OG-xK?idsZv9=LGKy=xaVVz`%)ddI|)fV9KN^6&DBv6YwDEdqtv12_1$z-
z_~M+^smp4qnS5(W<rI)tIA4~jt#U3e;c{hq55up@@z_n@;B{GBseHP;yiDH?%OCDy
zSYhh>!)5aO8I9atXDFWYC^)mHYWT!ung=iwIl)fl87%k*OuYSeiP`<2My4|Fc-*W_
zea*c3u=Q(e*T+7(tvT*2-?kpKKHJdEW5<V;F>n)mayghx&O7MqC)7pnO9wm+f{Kg9
z8sIPQTiV*Cv-9%;#aT2gFuYi2I*rYE7h1_OiDG-1{O<k3q-PmY<0a3ZiKxirA16zK
zO~lN%<+n|QcEra#_xf$SlMQ<E!c+Su{Ltm**9CVvvwCVwYCJhka?tv8EX5LhsgJX{
zvP^RIv=L9J4VqDB_bOUU8w5pATx!F3;uWs%bNA3myzBn)TxkYn(GJvLpiZbCrGx)j
zh6c)@J-5#@sLiAWo3jc(<DM`*l=ta5gTU1NQ-;qzSn8F-v;H>vOI;4v=*pLu-(<N)
z?@KiXj_AO1ru#|t36}UOKMuQcrX7FkBWnD%l3v0=Yo)j`WwnFWrc?cT*$1sP>)Wgp
z4q9uR`!=?1PgR#fyVCVEA6@S80EV@Pb@Bs@l^Sblu0pke_&R-feydGw@^xCRykgSz
zbz2wT-?FiTRZ~{ilBLmrDxQ9Fnv>5*K+3ZGo=)Pu9sZZ$iMw$;BaCa5^cY63;Gp$M
z*PR)Mdxg%_D<+J-6yh*yM3zzkrkBb*s#hF$R|)<@l&Ic&;(z%3u&0K$d!j6zTo7$i
zX-fWcENOg7z2zrV$eS@)-GkP(mz3<Dz>M^B<I?x4m>ix9k7YMh_c5>AX6b!6kago7
zt;NvOP^lPI-tvqO_pctDgL%n4!nnuYeVC+0mjLSCtIJ7fI^@w`UtgHH;jI(8BZsRN
zCL-S(e6D)ERqy;Mza@hpF5B9Or_>QB<J!gvKaz+9Ua2F^8J_sBVz6q--QdVMCjKY`
zrh3EXs{XkIMpg=%*?mxpvtYLWc7#{w4H>U_uVj|hh_c1n;$S3_t{0x>s}o9*rp>0?
zy6v3RfFw;-_z}upvhH&8hw<b0H3vET%~|oLV=L^{ZN}+IIqOFPj6JkWV1F=5P8Q|b
zMQA&D=@5x0{^B(w>YZ{5=xuCUC*^{Z$UeV*@)1Q9q<r?RLD0@K*4Y%h(9%As?4ya8
z{*wbiG928If@T8OvsdSHOZ<1C51A~C+my8L+P(Yyu?dhchKoq<A~aswrbJW5aiW0t
zxUWzxnF?2k)BdXS{srv11+sL=!saR=<vD&IdFxUL_o!PO+Un&&>*Uy-DMuqvCkhl<
zM^ag^yGi!%r8yIfdPBP+&xif_41765OFCg&g_bolOJD5gbTNdau|gUp=gE7_VXT-h
z6a(UGed5*oRT5m{naWJb{C*uSd#aGV)`h(H>PQkHyR!3R{rOMcgjfeUrDj!{s*tl|
zSI&9sCVordgMrW&zgR!x-i6jrO5wZ2hkbe*-EfsWqWlogzHRqeE=zjGUHXW+|Mt>>
zot}6eiEOW#Pl3*jg&=7WWM2PXRns4;C3ds}RCz5?b_3x9GFnSPivxls!o61soCmGP
zK2j_k^wh}fuzAm5-a!$|73hTu@MW-4nY9d8l*d%a+I5{YLF<GdhwthAubCtncE~tY
zm2;1ZNbI|@Z5QD$!-+7yh=gO3XO+pZ!DQImwF#e4!mcwbe5qI#Ty)3PGI@pZiHQY_
zMg537>=&%=LSm$@FgmfxTl--Jm)_25+eP@iH>iZa?y+cA)emnsD-m^08WZr;P_uOt
z_12*~HOIJDn!(2X#M_;*_xp}Yb-uF<FFtJJ-S?LZqor)y{l3?)&+_WmMg`0z@1cUd
z?#pfbam8JPQwAQ2baJ#*Evh`bm4a`)K2cs^5VS{iA}Z_WE}4Yk;@VSltEKg|)B|$u
z)@@jawFKscysGdI9E9r8qJ=I{;w}2+52vKY@sDcGrKp4>X>T{DdMgI_)9w5}zcNu9
zmf{*!IJf`G`CWu3-)bM7>J{3n{`!g(1ATCFp&GBApDK?-kgA|X2gho>!3;-@Ww>5I
z-Z_Q|32w9}JY4bgQ2hK$8RN`{ZC%NI5Bn-o7wNWo)VL5vxkuY#%Q7X&p5bCli>E`<
zCF6$#OxkW#1~3{+1u~g9uP=8;E)*{m-7NFm?K7Cuc1UoPqj2&K<Pb3*B;CPi`M|D{
zH=0JT=+<W*i?ZE<WS%5LuOxa9QK9f?Mp<>8%bG=&!DTCBot*n#t0H@Zkf_I%4%<He
zPk{kR!#=&GB{+dPdjn5l1A{wNB-g@i0x^Zn9VNGXRK-_RB|pEKkj?5(N{lpFuDNBG
z|0#7sP<P^c{Grv{Wwqva_Gh}39pA}l(iUB^gz20&Me$3~N4czqugrkPvFo{NRwaZW
zc2Dui)W5%13Ub=CZ+v`Mrr8xyX=kms6T26kj+6+V`0Fq7C)jU0u<*~IOFGOE?qUzz
z?{=saLgeZ}?l<E|0ZpfV`>cZ1{5E%}HnZx)2#@`wYe0MDaQbwEfeJZn89443h=lX=
zdqtQiUatN=)mO8&JYjZ#L*1ZjCVJsuxaJ8NA9`!m+ISA~yClTF&p41topx^ZE3ywi
zB)alBEt_Y2KDv+~e7myvX8OC}HhlC_>r4OknhB=QHy@iAIZ@hv{C;^r)xl3-hup!C
zrGhJDTlSFr{qN8{59UUC6|bjhl|<7uXdKNbzsfy&k*p<G=0m%L)=Dp3jn?{-iUp*X
zM)ZFOl|ISjH2Y~_CT6|x5bsUdY)?D`POaCo6B_M@^L)d00i}>5YWhqr@_^pScmb6c
z*ZS=$6G9KTLMqtDQ7HGNq%_miayiBf8)q0?SLfU7-qsB_rN%SYHPl3PG2K(E_ETFk
zWubPlW_wXhFpu{S=dvaoLKozGZXRlz{~nPUTpfp94&(2;M(?U9C~joW<Wwr#Ih`bW
zdIoaF#tm<j&zDh)GZfu;v`8A&bDVT9i>$Ylky%F`_hF|Yy&zNwrE7eE2%8ACTo9$0
z87?TC@#});srA49`zK{^7|lGkix9%D5|Nr-ERrm;Oe%4PkHS;qjJr)FGS1r20>n<?
zFqgbxWeDeT*jzX~b$Ml`PEc#Ptwq+wW!+nMthjtPp+H2J@Lfomn)JDj3iUWg_IrC8
zj*Kf#e$VM1GR>Sa?tFn4sKsQj=h2LG?$58)h~OVbW#!DIa~Y=>9d!x{Y`Rh8UHxF2
zIjM2$wzC##DAh6!x?5c_<%g}i6r<SB@?kkz3&knqdPOVpX(fZdy45TPj~=!T`nIw-
z6YscV`*y#TOK+s^@{hh55LcXkDc=bRgZeD;Q3lcT*@@vM?XUcWw7Rs{;R_fcdN+&8
zL;8L~&Eu4w8pJYMhmK<b&jULjQbv3CjTR>IkAHoSjUON8feQ5$&$)$XY9+MhQAJwr
zx3_z0ke?d-0H++YX>p8)&LFyMar#{F*Rq<0tdFQ--Y8CSKCD=Wqd28pFT6FA+LVF*
z;=cD4_3qvMfziC|(mnr=w)22$YTN!bA_yYAhAPb<pcDzccOwQAL_`4zHAvA2grcB`
zG-(1Vy`u;sMS8JdLXjqj^lCtQ2azKB){Y*J=l;vRZ;bcGaOl{FL$b57)-1pI&AGv2
zxyutz*x&QPbB|iP)h<>rEw)C6MHJV5esrlV8MG!aH4XaJ7dwX-Ry9d2y#4&jWGZyR
zkUGc*cn#iVr*>uOr4}B~cpTxEBQt~?My>y+`GHW|%ZZC>lC-r;(i^KZFr3<pK|e!G
zEa?iveAs+ZO$34b3fu9fM1(~bu*aD^4;~TCO?fd=7;yfylEq^e3bn7*?-K!i+Xbl&
z4jn0qk!Nuejgd0Y9M72Y1&QiO=Jg=Sn*yFkf4S{o%QGI1r`WM6P&^_O6`rZ|94qqt
zq3WF5U#YOGO)BL1FKq!Aqd@;?Cklkuo{)<H;q`}6X(t3yKlDz)ZTP|1%_w9xlH}|V
z$oplvr)tjQm%ymX!BLe{;-(+Z<<kYscIPHT9^-VH%0PkD%fWA8@E!u#ms+3i>*-hR
zn0oA6AL(|Z)xbkL^K1#l26U!p*hpc9$&1j5)7L0XII$KgJx=YlIcL3e4dVwQu^|c)
zuP$$0(<PKJ9D5YEKiE>Ss>a`xR=JP!m<aF<q$@<&JnbVE^`smg3(ME}J;G}dBZX)Y
z#V=pK)~0c-dWC6#Wd!qtOD%hKva5pL?4#nb9^G5=N_JG=9dKw%kUqNtMNR<Bm*KGV
zh%v9lxjq58*NJ+z)AqEr)=xW9juI7Q>@-tuD@a67l{Kd7oB<gnqT60B8aS}{K1qvL
zFW8y_0|UDvm?WmP78(R^qs@+`y|SRgcW}VN+xMf4NmnT1p}2;r0Jtc-(d9yTQch9P
z`;CnagfSNkCiRyz0NpBN^cTUC(@P<MIblXQ?Mr`&ZF^gyO#7qbm)h>JiF0+^I-m~W
zCB$veA3@F^IIUtX7`2`;^+Pdq;);Ty^XNmxIf-!W*Brl1#G119U52Y-=ezYSFqHTX
z%13iyO!z{+;quCR=-kvyU!r#0$H3an^IgJ&ocSVZw6(t1`bNcqQ*ps_;YB#STUVB@
z-l*H-yWt>UsT!_q<-r&7DxnW+^MthDdbYp>A~#XTTNft`FJ9&IH2dh0=oC>~!cZVp
zw50f^;CnYYZSD1%J8@<p!H=ytb*HiT8HK|%SADU2)QeN(dU5B-OWh+gkSW;(vA01E
z8Zb}|VhC{c;<mH=!qV#>{-xfl#1`f!0)8MSnVrzl)`8);E_8D4CteVd^wbYhD2xs$
zo3b>|Uitv@x)XIeUeRND<$Ww~`WFGcR!<@DHOTMx9cn7>ZbhZWp!<8mUX50C3Hw&(
z$(%qSQ)lK~x$%aQ@}7FZXfu(WnxVpx;u|aVRPEsDz)!f3WQnuwqpdam<he-%iHNb8
z?|A6M2LarReFW@Y*<)ZIKb+7T0skH|wi!o4iGNIt<Ja|Bbr5%bcTbVmrmd}O-uB}Q
zP96I;)lQF!<xqV6UOR59{p#p~)WVwJ^j9Ak&VPLfg)8UAam%?#$&YxL$SYneoB*Fy
z(a;+C31}x21yu36JU29K4vO+e8IYBS8%)VA-%F4v9jH>qd^=j|(!CiqK%i5}JC?nA
z)F14-X^|pbyCAd~#l7#A`|%y>hT+ZBC}YwUig-9z*Y57mpW%UV9)OH9h5e%EcIMqk
zjm6**pr^He>AQSb?ofbZG@8Sk3KOFiY<bAK-<7e+<Bl)|V-xb}$JdfYSdo}9rIj0{
z*RO4_y!WeSW|~;)bX4tI_&S;U<itV}cl{e@Jwp02Schxo9&i{=S7@&33&>u_OJ+cV
zO1kP4_FuW+!T#%Kq$@pkun^#Rax#6EUY4BISd>1{#N6*by@w|hKZ9KhNz&#~);S-P
zDHtVAq3mel(_ZVQH)4+c_H1aGbap|Ae&n7%u^`RDyqMlfqW@#+U4`@dVM({87CxTI
z6l46A^P{qYX-oq$kmtHG;jm{&yUBC6ZoN*bqRz1bn$H(vQT3NWI^})S@~^ie9U?-X
z+X3n8)Per4R@;8XQx=qHp(t^(fqFP&)6)I(kFkA*JVSXhl+|vuDvIfzD-@JoG{k=1
z!u%*!eBl+s2nJ{)bZPlf%qU}7qFY%A92=OMpY4*1%#RA%+~B_r@4^RFoRnH9lV-M7
zf#LSWrU?Rz!^%&2krK;ubd~pm9*-B<$=OeJQ<j6XCrU$YrB~p5C%y@#TSmNLdD`$M
z?yZtH6Ybo0l7fNK014#NGi*Se5>xs}5ePr49h9%pDV#rZhUGLnDhrMw7v<geI~C!w
zXLXqEe0DVhhmR7K?)e(?VLt&ps>nu!8>~8XSoL_!pySCOm749M^TsE#*09?iClu9C
z6(`t@u^ErdXx)}P&%;1ZpQPwMrI5~WkTnF@2<(L&k0Z3o>HWtfI1otE6(Y>Yg+1Ot
zJ}IZ_XjQBng-+bYmoMO%AE~Xf&1HGO@(pSoNxR4NbfkEw&Zo5c`_8<$Ve%A0;5Irp
zj83%#ocvE(mxM!YT_a{fsjvlsA%a=Wwxh@S%0CRBxR!0M=sgz7c#pLSyWfawwviAQ
z<E3p7d@ER8v<ET(s#Aq!q3CHElb*&fwAt~|!m?mEHYo4PgihSK@JjLLY<WnFcZmwh
z;Q#I8%s%7%(XHRLzqo$bqZ^e;G#bT&!`MX^3wEM`R*>HvGGc=N{kvpDg@bIBUq4GP
z^|tdk61(jm9gk`t#4&jr*GR8S-t4VsVa*qX;d;gwY{X$Wi5KVn+hDlQwhK0gFw7k0
z;_40v<Tk9fUuz(VpnE!W07k3qt0_)#MSg+r=8C5KkZWc6z39Dt{I}5@WbYJ>fwZyj
zB7ZJ_)P4aa+oaHmh}(+iRik}GvX}TQe`NUV&0E>pU5OFvB@gX=ZOg0j<>eu~p{i~<
zWhmN=dn2E_vDgG<<XWGJyb@^TiN`SaY<y(r3AS|YeC7tj8_KGdA26#$dx7D;$qnHg
zeKh2eeUPbtx#jH2i#HUP`O*ZeZ2JC4CjKbd7sfYF`$W`sg)FPO3_q6z4s*!9rHv@W
z<I}K(NYagX6ZcFea_VHn`b~UsYv4uLv~_<_y?gI5>4g`9?0S9(BuvGzof#F&Rw6YA
zGP&PBGTa-atJMu>=QLkQWtM>Q*6U*u?zFYInY(_pSRT0_&tK^CRBAPj?fJARYvK#N
zM26a(N8i0VVKDqA4p$?+dVxw(-2{f)E?M6@O{+Y{*%5y@*z)ff@2~JrYT>4%!e#&7
z;<(c3_vwc%bsU0Y4xj3$2H!c<rROkG<B2Y1^xlNw0=#as&jOW^EO?{<t$+BW4jDFu
z+JI5H6z0W#U)H2C;Yg{7?&XFzm!zw1_SeOw@47r}Q8TA1I`Nd74&5)CVV!*t_zt+n
z78lsX`uZn9YAbP&Z8H-&vmXg|)RD}$YKVh=8EoX`TsSa5xnmPFnH8G4EHF@jU(*Qf
zNPq`h>b)V)k5ZryU7*bqjFP$i8QY^WmHI~D!04dUM4R?*bhzI5yH}SExD~X&Np4p1
z*3xvM#9DBbbzFwwJA7yikRY38y^#9)XcB>Rg)*io=(x=K>u1oFl||XF0L~xmIiG#P
z$Vq*0pXxZZbRZ$i)Q)@(R#>7}zx-a0XSc=WRb2sA9%#AlZ-Pf;F6+>$h@PM^(i=xI
z?Ke8rlf6Rh#^7Xvo)BJb4vJ3-ZF#ORHl39pPp1IplUV~DUtgTfA}nwljs&L&!@L8e
zA{Y+&w3q><br=%_1wBxh>$ko3`MHhlEq<^>lv*B*2<e3r<m_iW30Ms~$CGT>lzj!a
z^Y1D6@2<a>diH%;V!iozYdceR?sSWq+jtnd(tk>U?LeAvcVrmHoRW9wgvAfKI|>K!
z64XgDB4Oxw&KLZK8gUew?o+~D!X!lwXf~LRlpGK-#^zb#4JAH|jiqm2Od02Zz88^{
zYi~Ef(>`7^9!YKkcVr)YER;oR;ZBC4SuA+%VxL>g#Qq!i+>ay(N7-+rKIm?IAEmaQ
z;0^4M1Z0;VbbPaISREhFNR)AmlEJcIw!w=$j4la3Zrxwqd~sVk8`;v--@x7}OtKKj
zq?~W(oivrnvyi_^MnWHf_Sii%G_=*Bmq7jTN<S%oPbiM_<N>=xfy?C*SlnaGH|2zG
zE4b<1UH)aAG`O%9cLPLR<%<G=Y`wj*k+|l5*%<S9Db5K2wx}!thI?LeaF06Jaz>S3
z@fK~ZorTs|IQ$?<l!hZ4k8HdIG5-uKC_z2gGPEGKl@l+)Yxq%&3A`zDz30{k7>+*9
z?D|aTMC?A?##*SYeweu8LLITcFhJzfXU+hT=?48zCG=_hS-HPVHw-rj>tbREPNnB7
z(+z-kHHJoccM2<cce3kRp|XxM5JlO+Yul`D%w7RGQOPVu0)~rXHoM*r!yVbbu=1Iy
z3A~{Vctg_L>jL3=g(O@H(yH{<KdUqWkzM%fsb1*?M5)PT7Z~mfx~SS75$1rK3#UUF
zAKpy5BylPZ(-G7E0$BNY-qJH2K+FwtYVfh?7lr3Gc1kT=p}6eR9cufTqKB1_SOp({
zD1YgZLX=UqIao-kmZNpxm_;x?_vJz*YMHb=U@;0)6X_VNj?yX<`m7ELiMq0VRyTq;
zYrL9pEhgg6K{zQo47wE2)2x;cDZ|lboF5Hk@4~V73R~{z#+^G*ZbJ9)F*1cbz}icb
z4DZHqvVRo@&VxtLAP~ZyrIJ6~XWgHdqpN!+)RqnL^bk3=Ac~o7pXrgP39!3IBf~0j
zg9_`N-zNn3M|-Zc%<2K>GCqelm0q}MU9!ak>H|$5L&UR?q^nNh2HQD2+p`bCYSwJV
z^uYF|K(_C(nv|6FWC*hycwh8-k>CwlWzt*W4SA1TA=l!0mZ@dRA8HF#NuC&DkHJSl
zeO3PgtNr-920K=(9-)<-k*%Y3g1`jH&T|EYphad({&JEq+(v*fh^2lVZ%`C9M8&c)
z?0P`)PJLkGQK<#Q3+4-_ft6)SJ7Gy%`#^*80v(oze^%63k0+N*^o>{&p#<h#5LoFf
z^1unvP{n=m#e{nwSHrR<4@Y#Kq#2=jJ?NdyIw*HRnN%=*6}r-hV-3%hH0#bm-mL!^
zqS7g>R(!#b9$K0fQyJh(<00c=(@&{`Ydpu)#JTTKjuKIUF-zu2o;gobZr6eXMViJ7
zyUiTT$B~`H3E)w54{Jhq(<ugSlzB|RmA00ijM5i|VkQM<aUNtxJMl@f$czV1PjaKO
z?i>JfQNXu$q#y%m0z_rk3K-5QhNg&*sG!o(Z5N?n7-;P6X~7JIDG76pgz%z35fjX*
zJZG-<u#gR%Zl^0rdMsET&x7BQ8o&teW5sdODl2I+lVf6q&-I7EGZ};h#$(~gd+C0k
z`K@K&O}>lccJ4<S?CtG+Ml_qIf{oO{ng5Lr82HO>weM*0h1?t8)HtvU@~?eLwRxs>
zJC@fi*qiJ*y~Pj2GbDQfoA7zk*_`VAZ_&5~o1ys<n5fy$Pdb{V7Upy=Ume0Qza0L^
z$(fX6xbdZ8@ddmqJbyPP3_d$QFQcle8fkanzyTolU!73qMuX&o1HPR90>m4-AxYMx
zpj(2GP@;6|90dr(H3Mt-Z?ZJm7Y3SD28g8QCZF{-@2$rdn|!@&`oBf45m%FR=!&DL
z?x3d?0*(Ynqs;`XER=Y`ww=93^PD}{5)+a8o&%f0_w4=^!6<DTWxv8#;S(q5R5Yuv
zut=(r8x1ZuzKL6h&L@*lQMGlytk7F85aFci-g&P8UImNjuK+44Fr$s2ra|bk9ugd{
zg_roOCDH+#<l-H4jvFr_T=8%Uq{|NylJIYfpCyttv<pSC#hKV*LMOQD&4xWNphD+_
zh;K_{<;2YcWB=-T;MXctw2rf}^pPjTA9b=pz$CD&v?Mnan;4!!eFDK4xs^{Th8Z$A
zR+yw5ctWZ(JHA7)MeGm^UwGoF(^EEZZ=?!zuqDvHTluiV^r_dP1)}huUs+CNhEE96
z)s=TQCWdStc4Uvf=wxx3>gxRXONZY2(zXdXH5>o$?M1qlN1cSNYF{--s{^~T9@pnq
z`nGtUT~qzN{vWmA_v_ky!u~*rIuFB**v`zefhftoH?vM^fk*J!+cO|7rx+@E!q^nW
zbpC8r=)}F-xB^bXYT@07(veeHXP*V@PaH40NrQS<_|ysU`J%Rg*XeYpK79D*k<)pi
zyQ05x(h-Lsbl>qi{%O(hRp>sn;yl7L(x<bL-zLk43JTC7eTnL~{5`7wEVkWZ8?f!q
z%h0rBgyBGKn1zvefsQR7s@7&{qohJ7I?g>nkM}4>I>a1E(`68PFZk()NO0;8p6Pdt
zcnO9p-_rx(tLYOeoLR^<NE*Q~|4{6R%Y@;sN7p0vd^*>6d1#eiZ+i+V(<+N#@>NdK
z*0u<EJ<%kT$ec6fI!dfEu1a;H#ipd@3+8rhIPumA3rnxXp26NY9Gp7z?ID|Lu%&r(
zjh`hVjC7ThbIfk!mBdf%gAZQ_u3k$7r|$A7rSA()U1xn13!-Y#Vqff8LJ0?gJ&l4`
zb?xNKDt=<s4X$v+3UMCHalU5DI^0sfTf=Z-f{k8biE|1CI^?Tyi(~B{9vie1%vCvy
zI$tU2S>3paINVU&-Dc=l0$g9n%c)0Q!bt;pl5z;7U%#^(Cn_s3b;kx@{EXqo;&I!4
zC&#0=w?NgEUs3-a45z4ZXp)tH<=1gM&4Nu~D%QvsifR?Oc)AXXUnKkqGqcrP<}&uD
zJ<=lHUQ)U8*qrHkfLXheH<H+I_*ilEep+LVH_WH{sppO`t#a<H_;GLA+7B6?J8v<}
zq$>o{sZ+@hjR@=Bc*tJYBOE7U<OaUrNT9~W_rf`F`vFlR@4cpUidMO3wmlW3B5pHv
z>P*-Ll61^74N1q0O+9BUrj)$xBi@t}72187U_Lz?0>__&QZri1j0c9R+3IAbOVT;S
zQbW{;n;~i&ATZ3wPtV-bMj$U=PM@6}P#kJ{^XB&K;$jcm(XMk*VC_HO@3xi!hw8t=
zHbPPOsn@2Pp%dquAJo1E2e}nk|8R64jc7#O`R1yZhw&W{%k%R~{rwfAjM-nfUFJX$
z<!;&Q0<*;aV(BsmzQd0`^*u1fzXR}>RY!^ahqw+Ikz*|sa;z*EK?2(-NT*^>wY;<_
z-VR*N=~2&>dk|j}9@9s|DZgpkUtMp~bJnKcG_s0&F%vmFo;P>2OW0IsN$&=RS>8Jz
zEM09rlUJ@Pt+H3unw&AM^3}XWF=^V`!twPTJ3>j{#*`r_wsR{L8R_uMKd$TmK>}i7
zP{6IdPE;g~+0-_&4u|P+2QK1&lmQV))hg$!Y<NRu?Jo@>XtTqcW#4{=D8eA-1SO|*
z{@V&q4ugnZ!4O3Bp|)N-8l3av$GOT|3V1BkzPXQ4^Us}F(4%15y%WQ+KYI#ATl<@Y
zxI%vj1*T=5O4g4%dgRGeai_2>OGcRwt@2~SQEHI9?mL(n0-T92!^w`rcnMC9O`HBM
zs#qos9+3&=9V<dftt!7-<P;S5pR#LzAl>EDK0h8QcPUck_F*0#g!@$6JI_Ti!?(@P
z$Un!pTK7j10<S7Vc$EmaU3C0in%z#}-x11tE-=Fj=wLz`z?G4T6u|kqd^fd=M(5r+
z;0d|(Y#o$FsIBa|r!*AUf_wC`_54viXSzK3p*X)cGE8KC+;w?iNTnF4P`mR#B)Nhd
z_q*^#I(~KDAvB9e)6v$h6?<;C03D#z%xVD>OS-}^#}9~0;t)um{+gTiuBHA}5s$By
z0NA4OY2Y@H|4v?{6tL|#C3}&L;*a7zQaD-6)C5A|84wCbF~^@+5bUjwd$Mp+MS6{I
z@Rr5L8kiU4cEqzpW#i=qKe)`GCuK1$F9Xo=&?W%kQqt(~yG-PD?ddOJ7-rJ3OA?m%
zuu2EYi0n(tBO&NMwwoyy6ySL1X3UJq0<CVM>}dp`iv(u-JQ<t(SIy7Kg-&GM_n1)9
zEePyO$&+2TyEWVi?1TNe9!hNnp`yf|-ZANgi?%FlOtiK42d<_nC*{b>2^`jpyW8eJ
zKink@a*l0~b2KkhzURdks;cokCj$-^a16zOW1vDlJ8DP3>S`$W(h~cn--^+2U@e$B
zPbG&LWhZ*kv>WD`YfHLK4RrZjFLVHJchw9hy?|@Ds|vrkZp@eeE-C)S<`GH?ihYQK
zd;ACYA&|^s3)*p=RI!Z3!6S{4-0j2F?%bvq@P+$yi@9OAdgCGyEUmJt1?C<F-jId6
z#zvE89<m~#wvZLsk1Ys~uE{PrFv@x3TVUeNVV1U6@`a+Z!p>7jA*}ZMsE)WjF1nZZ
zBUNaXXCFRrpn#$KBB;kG|LeOm;tPMN{Pf}GeSf8LKo)sdn_nQkK++&-mBHRR1ojpb
z<O@WZc4kOW{|uY##vC5ToETI6k)?N9KPu6!AkVBfv`)_!&)wS@p6qko;#nrgotO|b
z$8zRhx!~_0<~F?K<O-)g8H!my(Dhfm;{eWX64R#}pFxyoN?*-FXVb5!X>wdsFv>Z=
z(l0yI_6utdGw?|4{XOzr@(XtNYH<x*-dGu<xp>zZa~Y$-d)&VB4pB1C4lKuwoDGZa
zjLTD)KdQzFglx|Z{ykTl{@LlLQPf?+o*9L&QHU`AsJT!^lrh!Z&Jdxv`~6u<CY%1A
zAeBWqa2lO8>h%CzSPO%>L}`#=RmkaIsRRRgt?-w;wrLNzip+<0GY?&-kf(b)S!9e_
zw0D=cKHAMxV<yr4x+9=T7<wJ@yG2ao7-l7{e}u|E4?0j&ly@{2!N=_}3}_*fS~&M1
zOYkV6gof)QWdI}&-@DD&B!)S|p%W8qSvyH|Nc&hi_DpW0AW=jbBej9x2A}MM!O?c`
z0#Mla3-TmG#r`%Te;GrxzWP&M@Ns^lJLf2Zeg?fi!8Q=QP}0radD>Du|DZ~C1%av*
zmF|=M{N#WT1HRCth;Cg0g5tbdxKJM;@FW}gcJif3FD4c$D-LtvOmYon4dNvtH7*oe
z2h1)nGq5nea05wA-|ah*HDDE<9r77j1j|2_+cCq~<e61e=}IWEa+`~w#af8$_zv~j
z^p|TlC;1qQxXtvaDj5;;20Nd9Xx^>7<y)PDQQItf*(LJh_HFQr`ha5n^8=Fdxc8JO
za)U46r=WCP#-$BR<beapbYM4eohj}Da%j~-##egO{86*iNbq+Ya1RW`elB0Ia}tgZ
zb(T6$BQL%1PfK+(c`{hmz~u`v5dGToa%#(^rZn3wa%+=WERJ7Tue(+^1M(-*8PJB!
zw8sZlEh|LPz+!W-k2#g<#^vaW75HLei?<Auk0%KqH%9lY1KZMY!E*q3$`IM(<sfY;
zq?8I+ZY(}jx4#T|7(09*<u-#r)PDGD)LiI<+&IO}W-qKuyGo{l8);YFAf2KYuTN>e
z=kj4;n3axPB#%^iM<ru)h8jp0L3qzcr@MsBJ85zyl7x8*OYQE#-`zQ{;OW;V{7K6E
z<`WpM!M24>1|&Z5P#6VZFD;KK1XB};u*N}zMJ7Cbk_nr#zl_ZApe4^G$bKDM^yGwA
zg?QBYt`)w{*>;i_;s3zA!m0LdOs)0Q=U~IdFcJkOD}_KlUwP)rgUWi8ba6kZ(b2pf
zZ2X&j73v5G2xyf1kFu^`WF@IW2~~{6Y(B8+#Ace6CyICrgMGLgF1JC{8(oMqdI+zP
zTg(a<1~xCA?B4!bkOJ`M1v7RD%idnnh{G^boy-@|K_KZelsj{Nkwc~Kr@W-+eQ%f>
z4D8!EMF&cY=e(=Exxm)=kilxjOIy35V3aIPRDixOP%~`s8gyZ50(tQ>zF<rLR}&6t
z77hMIgPo-gY2aC0chfA@jpm;7EYt<3h1!Zbru%Jn%pz=s)+R5+%ul}i;!@vMdU9qL
z*pjBO;LuKCPzvPOpQQ5#z6-<cD0DFcx|tnL9tFT)>$RbrD0JU}lsC{uSSCCE0SL)t
z@RgC!i8sm`;TynXk(s=4a~?NU9eHA@Y-Ai-l-}nu^=@^G`lSQ-#`=*X=Z~m~y>~OP
zY^ysTTKzi~{ActB7d>QNSrm?*2C<+Xhy~#_7RpcpmuF2=$Q*2W?Ln>~44cB0pCKj~
z6$mkPp%Xtzyh6U3=ZPZEo9I+g+3Ug;FGZH!*d^+Q3Sbs$Dq>fw7w(-(V)8Za;__zU
zOsw3m!0^4Hc>Okk*;pg)0a-p(yiS}qR2s}co+9fBG_dLS(Xc^^0+Es8SUf5k#Js)*
zTKQpU4(6eO>$*ISc<~2=p%Z5kIv$A-6}YW3KQ<P3zblj70A^3;Vnt@WqemLyVN)l*
zjb(Be)Gd~<=XD8~Sg|v>B05CajTBQR>7*Q*2P4j)uBh6Pe-9+8VmVH^N5JR&8-PWD
zM3p_wngM*y$FE$8p%WD=V7xf^g*os!W18q*zGzo*de7y%nkQ#}t9DlIv-fbPfs7IZ
zICI_RQVSky#$M+D9naZ0pq8XVs`0|}lJ})9Uc$T0eav&1{qXqg{X^`>q=4+9v>%?|
z0@*&=D_^;l0HW2Nmz$O(76Z87^*8$&a`FL$N%Le}4Bbzu?=yFosfmO!5)~kfF<im$
zCwlNLdx*=|W(rv{)=Dz_u8njrg@MEC|FUkU9G)4HC=%LZ2E-7&m3u3Oxqaay2X|7A
z+JbCl1iTB%zcP{FM>kr5!pUjOIyRe|?gmkh6-<#_vMnxSuSQb9lbB&R*BGL;2sjf;
z0<23|0+v)q|3^X}I)R(n@@eDpPST$~xJL4J_bj!GMyOTW>ZtRLf7BO?vssBqxcx{U
zu(pqEnMm_ZQT#rh=rCI6gP*sOKxluJcoDKq3j>kQo5@NfFX{ti`!bQ_@YmXNFdQ!#
z@tQ9M!Fn4Iq0av6$zutCft3FOn3g{Y3>YqPoaV_1q5>>m<|hLx^^mEl{!FUaSrGVq
zUbh->*85>^xv^q7G@}wG=>~-ao0TUv3f}Qg-5Ghb1B`gH{wI6PtRY^jEj;sx@~c`m
zJL`V7QB$$k)^$G&Cf05VTHzGa)_yc=PUt7vCs)Wz9Qi?Yb8a`1(0>xNObE-K(=^qI
zqtNx5v+EKDUss_Zba>+9S8~<9h`NKv)Fy+nZ2Qzy@>RnT#$d}UPw(UdDw1_1F}9(&
z6{1;5w<~&<fQ47x$%{~+51wlayQlEz`sRS6d`Ee()lH8yo`ROnaHDe3#fl_1lPG)X
zjRMVpM3Lrl2moEpBR*X$s(9{zM{PFEKd?VFv{`!7hG?(Zx>ti?{;GIPXg>nU`LyO1
z>KRhbZ5T7vkven|V{M&L(hd}QD6G5j$^3mvwXIkvfL?~`mOP7EJ^W~ENn{IN0<5dZ
zy<c?*9xA8~@rw)=kD{WYYEMygztfy3+%0h5uD@Ja#%&6zy8BWLgk2HbzD{i_in-l8
zKD}FS+E~gW>Wha0v@3rM`XA}TzPmOrx16&sy&8K4jJQl9{0Za#PKW0%wbhJ{TB$P&
zhYy1r{Tv*{GC|!uh%54GcaBK7`g*HDk{F`o_6PZsCgwz2drped>>!qh=W`x2kY?|Q
zR-FRD^Vu||PX)o2xrZ+8msC?Ka*;8zxd;RU){Db!alE=P-(HV{@7nOi;WgdOOfD#s
zQ>W;L<g*qZn4DUwdhz|%MEA>6WhWLN7oaQc)Au6lz6qp{u%E7TWBP~%N1lpdFblXE
zTOEB+4+j+j7-ev(-g%yIr=pjeC%}WhANp*43TX%6t}!64drxzMvdkUv1dv^UZK`;d
zwwA=G5fw-kAB7HDb4C$RN`ip3aJhv+N+$XBoU}cwicCjfg=E}j%4ODb+-}yOw%z(V
z!;8`#>A1(*R4&shw??mU3{qDL<5AZ_Icle}77R+4Y)auJTZ7*(6UtKLmH<h}6qE!n
z^fq)ciw4NJZ<{5C2}L9~=xG9F*WWegdlNV3FO6N9bolc2kR$?nw)qKt5Ll~iWHQ*R
zrL%m~8Sm6)kcFOVo;?WwN51uEm-kxU>%0?_A$Lr{1}n}z&29r6tExMgO=$P?7YHmy
z2*9VVw-?>ob9P@W@7qZfHn-Q)@HcB-rrov_cr63Lp$nB`{!^*TH*?Kj`j&5lk&tAh
z{w0?5EuFIGnsGceo>y2~GcO%>#JL$c5ia%yle|D#&%4e`yKnN3=E&Z<#OtSqd9A*w
z=rC2^^<7%VF|j1twUxeBUFpKO`laR9mDuv*_@PV7m%03+m#?0iDHeDw30TH&ukMd=
zdp=Y+f5+B6Y(lJw_$7J1W=pjr_1d7tv8EU5R+ZIOXUDoR%&h^7UpH^aOZN}UeaHHH
zaPGcLcE0Y01ybxi{D)leOyo_Q(khF|Q6m2E_mxml>8r2zaO(i+EvnM1ijAWVg@+a8
zS=uv`ddgn59B_K(O#wfhz!+J`t?pmv(-m%I*IRTsy*j1}9lvd7_^;Gyz->lY`PQeS
zLtS50$|lw&=W#dHDqbHu3IhMWXl~!sHkG{BUnfUC;};ZtVh83+T(@8Kt$elT_EKTL
z0HU>+!<UFdxXVoGRFQ{!sv=y5mZ?zv)vwQHzM)IbeQD?JpZaQO-D0my!Qk7fYqHVJ
z%L5kua`Rhddm396>LZQlk{i8z+1Uo$5tl13VAUYD7NcdoHu+A7R@tZU6{brNCBSTe
zg3=a>I)-*=&fe7C@~vANy*rL->xmYk4Rp1p&v12#iSt@1lWgQR<jW;Zd}j@l<y=oh
ztE`2ZZO5GUr`Y663-)^JR;$~+@*Vv4`&$AX8#Md2{YrM1YLn@><yLmziaXRAI8=Tb
zV>{vbwGsToKxZ_90?lmJ3;iVykiTtxbljmmN%l55IUNNA)w<ReBH`aWkG9xW+D9ji
zJX)+WOIqpE=k|G2j;4EAl_=usd13>Og7r~5ReoAT)<(MCyoLFegSqjT)A4*#>aLmF
zn2%xh^?lsk`mUg-x@N%UNpibGk?L1ODLhj4*3J-K=+UkF3B)6O=?jwLjo!(oZt}L>
z!xh%{t>2}27S#@`g~%<nVWUUBO6`J~IE<(l#FFnWyFN^QO>4443tN8U;v$1PY)LxY
zLP|u<xS4UyORQN)dbKTU8NZzs-lk%S7{Nh1K&}5oP8d<3he>+o6++&310!>FR7J>r
zsYPX^HD2=l!;8bk&z{Ll(WJzk(gon^si3~uaQPyRPaY>IF2l$RIL^WzSXqXC5v<E9
zEw%&7g4EHMVAzjye-CAvrTB8Qbayu6g4c79`rOCusSH?2SJjpHkK!jpS_(0$a<%>!
zHvG;Tm8IX(6SVHrj(dr8&TQzr=4|RX$u_?y=hqkzw(oR0R)gqY>;6NoDYv}piE8Ec
zdIslil6~N<aGZg9<k$CGJ5lY^kGI`+5zfTNng&L^h%i10gzg=97a=(9LZ`5ARVVvF
z=YA(!LZ-K&(yZ`0z-yH*iqC+j5F0HuOD~Y*AkZ7sJ!E<v^aj;WFTM-4B}s_{tl5gs
zjT6NFOIK<Qk5S+YSx)x8VbOl?77r!kKKj$|s*%B?34u4-2GRQ)l6Z}cT699%>#9D%
zs}ad=o?LERZ8G&bm+A@KjVHHPGyYNM1`3!ouAGuq*(}k7@vGPCT}z=SEl^{nJ7^M}
zilW9#{HriEniiq3`Dn0^S)0d;GQCnnDC*_oig|+6!k{*Wt`2NE#|OXU38TsZr+ieN
zB*-yO>>yjl_>vvmF_mGBQ8uxAi)||ALIpmNii#ozd2g>d+ovE?Orum<?--bSeyzJT
zz45T!b>U^!7wJ4@d(-&|lRh_B3%6CKTG_cLi^&PzbX#@98gbr8=RPE8h6?U%J(Pj0
z%PGH~12ySM*M+O>%^H!I>o$O*qpg1I^m$Q&2pn3+>%+yhyM?uFpVhyYR944ckOPt6
zi%)E)TnX5tryW~?3Qt#b=8901Hd^UM8VoleUFvv2#^}}G!7>)FvpEd{l|*@TFWO<^
zF7Ny_IFzl;JA($xmRIClhlS&#POVeR4{#p-T+#Q0*EwYIsp{I;{kBrEh|-vuxvfVZ
zB`<wJI*W}#B?gslr@3({BUVf-)FefpM7R~TZikV5_m@l-4}-xlE`K%4je7P%P^=<A
zq}z7Ke)zkCf#hDEswA;_(~cxPD?!q;z{VPRsI8>aqLL^9+sEkZv+s9MQ`Z)gvj$18
z43!8+l8*Pz$DZ4_7ZFoI47L)V(3z8s4`XReIyfPs;?VEPgH@PMauhNw{A3`$UeFyX
zb5M5iX(`u->-oqbk@&VzG<D@%xP7uW`Ni6^kDWBiv-Lo6PxqYaJA$D*Z~9!uPtO7B
z-ssuxhrd}f=jD5l05@-vG#Lv@5VbrRLH_r?32uM?`uZvuvx+uU{c;Y36dj@hYu16F
zPfYg5`}*Sb^ocr7oBq#G@f4__>&fx}l(w4urUtmatNyj`=%Fg>TDo()O10K-r}$7?
z+-8AKY+qZP^Q7qW2$|~hBI~ph#~6q^?@RnjQe(`@!bF}nmldy;^GUDP%!>o^du9EL
z3nHwj4HwT5Z0WVNeN!$t_5FfUEO&6Kkd7%2z<?TVD}Uq(PSv(Eg^3ZXw2FDJ&|nuB
z&DnzQq0I#Pqhvu>VVsonOhda$SeXk@GLG6z9bt<o6+XAIQ0qL@@~D3JW%(Cr#n}$I
zrp4;>ao-l!$D|K&NFZ_}(|OCyJYJXW6+es#3G0iUx=5dayaEY<7-o_X7;JgGSh?$H
za4HL8n^*W3$BLJby#77iu>lLHNwnM5AKQk>0{=+wr58R3vRQ%J#8-t%kXZ7`Z`_kZ
z4QuNe5$w4gJ?#gPas98%gJT>~b?1e&rB~<X*cvmSB<gp56>JHLSXVir+QU8q5I6r|
z;5?X{0^VpOp@7JgO!mncC{GDdKralo1adD6I91=~sd^D%$v(06PlMBnrp$R&<)h)q
zxoF+Z2Ap1+?CN=133>7C^xc}^$XSF}5O5#j@CE4uC@smq2(5!4o81WfR}RC6P;&3h
z!K`zDfPMUSexZS>3Gl#I#$h;cwb3BGkn%**eWh0=hGinyDmLK7V)4tinFa<&x9pyS
zFvsWjv5vQ5k_ej(hI>+yO3x!yPS@3iR;V$cK5!-9kIq19IlT5<>Mc%I^2|4{@o+ka
zt-nL5=Ma~5HxhiZ{%_Bk`S6C2c=)E+1j1PX>Ubqq@O~jEh<MRu#&c-!+<>eSXxOC7
ztmFWN-baHLVdgBKc_qCg2mCezrfRN!BNSYI{R;aWF`ptUR{DvT+!Vvyl<a)%uUP;?
zRL>A=?9qcIuhMzLL<m5EaYI<06k6>R9^EsO6c#`r1*Ckvm=IxJ57-}p#0!1qdS)Gz
zMnDGxEc;Yt@<Kji(+Hud8mNQ{g;ZXP&jq8(WzHGh44v@3=9LM6eU1zHYK_r;3$}Xx
zR{_i3L`zS9{xI3`d>w#?7{^09uo^HcO17*vbO>Z<fma77>H`F1f~=~gE~`#@fi))c
zC@Zb9uHDf?j}5T}v@~zSK=~;upx$9WK(hDK$k~8xVQXEiNDhuS)3ue)(qKo-&>*QX
zAB9c1eNL>obv-rhO7gxF(;MRr66O;>G0|2DOzaCL-1-ivt@(&6UqK)TsB3Tdf!bR2
zI{Z2?a8HjRKuJUE)5e?)S3`*znQ{^+QJf{7qUXk1oOlyu#fM!uie<YSi8kBUOfMIJ
zp5}LAySoqz&ueMEbmE4w-5{GQ@n9-MC);=eI=Qf)_hJpcOuUt#9p|ANT`7`{tb1JX
zj8O2qv3=s={{8zSUFF{D0HO8tsHuG<Iv1)tfm&3imL<PLn62ly4-X@;-}ZX#NjmH>
zr8i&tm4=ejt|BJGXEojcJ<>5|Tn4In^3YWrCs)HTJ5Q#{`Qsk+f|}XT2F<nwRNhVH
z-n_)(XH{vVxnWK?sZxDkkA(rne6~#;1!C|d=yZX`F;Wk8>AEfjr19O*JbDc*Dfu!P
z*9XAVzq#`YCbh7E%{n4@m{7ug%n#H}7Fd!SKHpK0pf^Y_yo;U&S5qLu`lA;D?}#!E
zimBWQ*loWYHQYYzKOZ@j=`=x;XlMc}90E(iy8GjFYY&{SuKNs<rJJCw*BgK1eYc@^
zl6lp&%tZOCR!6!^pM=FJeE}cSO!9luC2%KghWwxq{wFb*-hkBrMRs5?Nk#VHR8q-3
z*z(hTUw6$vztbrjfh(~mB2_peMc|{L>AU@^*-`@i($aJB+BwNyySxwJmKJi_h_Bs^
zcAq=MJ@Z@S)i13OaP(AuekG~u!$+sIG}Deeo74tG$=O^;_ROyzXgDvmU}4u@njpQP
zB2<>)0U`wQ5BS!*N2648N>&~)HU(+VHBf>c|BR9qVerF{kI9FCcBgHh83xo6np}Af
z@SYhTlDwgs&jK#S#Cf#bHN;6|Y9uw9(|ZKw(>pHOO1SaKgkC<&z>f9dH@o9<uga!B
zOIJ@0CJxPBUwl)xedcO^nYd4?u2gRzU|skm%5?9bb0cHOCP4G^{S8)8+y2K8+7vpW
z5w?6EG?-G|CRdF>b3kZQWAQxMnKvQQ3qU+V0rAN7&A~0kq#V`l-a7aC=F%zCv+z+!
zzoF_akd8J?`@kn0bw}d>ML|p@KtHoeVUh9sR2~Bu?E!N(|1nx+O5wYF<bSY+{m!(+
z1gpQSHoiC;fK7i^YkrfVu|*73Hk07+eAW&xE#tRte^IuINOrou>@#c<EpyANv;&wB
zcDduZkp_c+5Iag!RJ~XxZBpb*QGk{Q{gkC1vmcJ$raZ)+@csMuxxh?aQ(&?3vV__I
zn?$Ovz;LOIG+z~n3KmO4_CO_u02_3FP^({U8`NORvI*iE(zuIYOL4omqhKDzqgxyi
zb!G6hh~i5XPB%)(6uo7g;g9K5qr2=-`DLyrU#cwHRr?!{2%};v)Q?yeb*qJ|>RE~8
z%&A7f^Ehs`KL;>|gUJ1UaEKt58-@cI+Eaj`@xPGC0m2YOsKLV~ZhsKzVF$MC5?}-M
zK<S$q&^rcqk8Gu4Vz1QPhWT`FD!<`T^Q}p&!G#Z8O;5z9UpnMmHzd0jdph2YR@u2M
z2PIXs{h(*2Wyo+)#p0<W>a$@<3!=DPcS$u`ac|q<)7v12(f3n{xOpk~m%OR@&wFmW
z@v>{<vXZe4DIsvt1Nw)H0B<GqEb22j#4t2l5MUUYI_c#C6>#^<XtY2Z51AcRGUyY4
zu0WpvRHv4D+d(pl_(Hqeyf0ONN=kh4UZHd0<&{#OmW7G-iSusK`VndDlqSJ3UfWMD
zWjj~OTp*qdg(v#0<xTByyGgx%<>B^?afp}kq;2StMD%ls<SF0lOH6o&YnBaMjj20{
zva4{u54K!GrM@(WhPZqRqRn7Ac@lTwNJ^9Y4*{8*V`&E9R1zBkRRA^`0u*|oN&x^4
zi!&q-&?@_-U_z;}1p$<)(tvZDe7y7&NV^Uij=LCU%ev4ok<SCW>asgG8|U)69An^V
z7R7P(S>|y$(#1Dr2w8^X{puCbVaS`)E71?m2V?Pd;@~*I(|99Auu_6XXO0$LK)t|D
z=*f6383x`0qTo-Z0#x&n$(J=jZNI_s>;O36K{>bjG<kNLoR~PBz(|kDCfT3CvHaNk
z7ew!C*E%8Z_|@Z`<bDu~aK52=Dh8T8A^sT^yRRTA|02sWm=`A>w>;)Dxhqhq#-(fW
zD5i3*YNTBzZI#v?zd~I*f3?a#zD=5d3%JWG%G7K-iBepBFf+$u0E-NXiI1(4>-ilP
zXCG-Om|t9Ub!QLJg1AG9M-Qh%(YYxZNpAr^bkLhBNtZ`i!<bG0RBp*?_M<?>`1h3%
zbftB!0SyXpv{gdwnMfXie9^Y5Fp&`Yp;xv_gclKYPo}o#q{yA0M9jkW0JlEan|MOy
z;j;&Vbhgfumao6=cj%e>JeBzgcAkDT9u~qI1MZL7=(94Q&O(M04}i!jvt>*J8dg$~
z42G4|Xue-|XZjh4|Fga7XIL77o>p)2IRQE*0+W7BXCS|Qs(Kh!`So7=6WYLr!;|;g
zbEvhC@pWnMR?5G38S#|q?kW8er)E|z)$B6zE>0vFv=k?OneR)kuitGi`_z?ogFbra
zf$@2D78Nt~Yp=IkV`_C5k8zb>>2JQo=h~{?`>_<xH$Nepk>|1>qV`gqsUe2%8({c;
zc3$BNsaf~x4iNi|tZLh7@P(Hs_EZ2(^!Jr2xcVE{R0TAVWMwSa=iubLSy2BL*I><*
zozu*8PFG;@g#aApaiSro<6eTmk+GqNRX#oWX|m-Pd5vn-K}@X%?<?LrU9q_F+#cpr
z!O(nCLmF}9^_OVQM|UiF;zF8?9$Y)ksR!;>x061(>U3E3{)69L^+3s#lj)V&Pd-Yy
ziyw;hdzgiPA^?DROv}1Reww+doI)!*ACy`E*_jWl=ik@@4FxLeUeu{OB?rP~%?O0J
z4=ToUSd*_(423?z(oYOc;EhK4*Y75{_Su`XO=Yag6v4y3R;Mj?XMIe&Ha*tvzuR`~
zBdeR-T8@D7TIc3L=b1>wt&%Uj^y*6YLcXjD!mjUuT<lN<zv0{BLw6iTkfaiK;S4yn
zT2{AeLv8nXdYA-)EqTGireul~deb?XaKPVL%Fk^30r-y8cn9qa|MU>}YVugwKm#2c
zXPCTax?h``$yaHH=VP5~%)Mkz=IAYr!5EuWrn8HMW*<+M;9Rd2$dcPT#p0V5E(ESN
ze=@4|Bh2vbUeu5K9xA)`2!NiccBr~7HkVsgvi|z1nRrM25P741X)Q@B`Q?ftp|!tV
z5Ovxw7gTo!n<fHWkdIbQs}pDeXtVMG#LvT!=ksQIJhdIximTu%@Y%fCaRZ*(D1#Yr
z88o{8A{Z3Y2jvMM4*mnANfNf(yfkf94lkLqOw~)vDA_4-lI=U4VAo6c<D@9Q`4Z?y
z>?#jgvSjtESz|~dusz9-X2BQwwmFsjqca5)1giJYFem+=4V}-}o1PP`UrT^Y2iQ?o
zy5Ll}+y()}4$y3+3?!l?Q-uAe%#@`Y_rPg#pvxQQr&6!(q?5KF+1>2!gy2ik@!fv}
zdK17cn~4G&_U9~@&<OxpW&y~O1!2mU!;ZD^AtL(OLHrITT&RIs4r1?kTvM_0K~yJI
zr|_TCeJtZH2rZYbDnBVbW_z*ynBM3I)vsYY2AtWecC4eFvAja7b9^yirqWKI*3cwy
z-*55tVo-6A-2Uqza8%Ky`GUYv1(jV|<c}I5KFi0Hhfm~R%Sep@j#i&oUzrNNnMJ~#
z=YRj3fyCL=_Zk9{UAe^CS%kds3bXWDOWOHvE}!Rm69@0%bkeTsrS%AN%ex`mr#oCd
z68`g=yaij+-0h8H{J%94mDVVa8o+Qv)V3<X2uVf(^?}a!dm0$16hGv4VjUdvE^m8o
z9|MQw3+sgsK?bc7-`B)~`q0<s=<DmtHDUmjct#t&{-?wt)YkLCQ)=M<Ah2yqII1UL
z{u<~RBsFu8IxS{COE2(1uvwQd2{!8zCUs#5V4w*3a$gg^SbSSO4IkfB?4F=<S*z&}
z3_ravSYb1)op>D}`XP^v%xHjzBbb?11JEd_?8YM4?oH-wOaN&McyYru135fVa4!@v
zjTsA8+yc%ZKPgcgE!<<ryP2KtFNFwEU#<U@+R<Wf5~DuDMe+AwC5j*c>wZyTUComi
zW=i3swEIw5_gN_gGLg6=0bf?3f?4_HVn-?{y}$df>HR<2EPfGKw8~(y4pKuCqVmbX
zj4Fs}?-VBWS0?E|bE`Dta<bn>H6F6}t2<jch8g`@=-#HTHXBBFn}nHl0?bUayGRIN
zjl3$DaB{pMw~#LpU}m4ROh7Lq%4H^u5?k=c#IipE7mo(eB-0S`2-7KiF`<)<Dk(=<
ztp%~RG+6Ng&~vBV`zlPQ>St}+H#n)18nVyp?K9#Yjf(G?5YfB*mkAh9K{vgcF^IaA
zhVV36Usl~sd~6V}=O}rh_zjq&H(kY?y9IQUR3jIqq(i}}*@TBYAPIO!rhF4f9r($I
zFePG@&Nbdw2x32a?G!Bl_Q2I^L~!Z^#UobG6O4SL<Zq4$BV8rs2wU^MJ_fq)$)CrV
zHST!ZOd_jq%%3WCnCr*veoCCkdcWt$!{~Pr!fXt_4vP$?HxRfhvCS#c{x3mql%a>j
zU+B?)f>8ZZLH?JfUIeoI+&TNn5k;3Nqz`70Ug+wMEl__p^mvC^c&|E=m>Zv^MpGD$
z$@rTs2(C*{u9$O!ol&k?RD-5f1|5=IJjAN=TRn173g-<_&jbGbfF_N&r#X)|!F;B2
z6YGL7v)&zVoX+UyWVguJhcP}C&4}cR2u``xCv@C5K#k?GBD$BQU3w^_?GsCdb-(%T
ztq5SMvV}fEet41fDJ>b^@W^qoJD?2*!r%XKZhrx(|8uJ^E$EkEtEDi00vQPD<poS#
z6|jo~LG(Dl*9G%hX5v7WdL>uGo(zT)b2`h!`jbr4_&EgakE0;F4-E+pru;A*)Iv;p
zU4Y-mJ%#Xl472RH9C`wmk9}dZ*N+^!smF(JW-BfbY`L&>w6qETxg7#9?b$3rep34p
zEjT4dj+aw`{&i^R)gNn`ae@pHcIx7FO4G8K%3W!y1oO)~xq8Q7IJ%>EMnN-Il0WY|
z+x}Uo+(T+MV*#VT7&wvyHF=zEw2i<tz&}vW`r>ZrY=N$8sZ4QtM3{tHnNA?Q>+Rh_
zg-+p`t)og@&cx5=hp&FfGeU%<e9h83`Tyf>o{A+Q^Z*29>QdDMhB98d>BD(EI5oZu
zm&zJ!3H0+D`v@hKA8`+1#47QvI#o{W!trv;Bf$`;Yn2WrB+9<5jssn`bg6wJS;)F4
z@?O_5vBRA{eu7B^XI~i+$H+RF%`GZ-LP~sTu%!dVp87s~$E~OyM-bdYK^<tRr^JbH
zf#6=#<TC(3#Y2X}4lp$tcAoROPnx%OI*>Gd%_-xT|Hd%?F>(tACT``6(VhE+7tA`9
zwLVDrfB#kdV*GcAZvgRyyv9T#dGhZ{FBsRe+8rTa@0WR<=E4p$W$}yiM+N4*wEYk|
z5yeP(X&*EZatIDmdI&|zLf(N;Bup#`MM5zj`{K%?A6FJ6G6O#1e`caV?{i6}I6JK}
zG*l8y4g4>C2m4W3;S9&SGLT?TNzy}!CItr*3H&+*!%MK8);zDpLxsH2l*81-D?syt
zoTzYeP#GSnuta^f7&P3FZV)IfpAK&FCkd189qx3<sF<otxZZe74vRqk4v&;#f#6ji
zSaB4Z8jvNzM<^lH{1kejnjd2msQIxTBwm1!=6|!#JDDSYPyeEJ`VVI${$U>2AoGx+
zX%D({#GLX}!8B76`<kRfI>GQfsErX!S@>Xl;|#E@CK+;Mw94fl@3MdiYYG;Q?^y8?
zhc2RfbpOEw5*3cU>UIF!7JJ^x9FSs~e3BwSJpm#K5lHWp+;=ck?19HCpvLodLIu?b
zI_%ESl+ypt<0OAkx4&!~xKYd*P7pJY2J7JqaWv-++=ib;8Z2sphAhY;VwfM6edGfN
z5Ex-PV1$p$exe9Qb3lXB0AO_I`~^>@CiH5m+$93`V$R$A5C!`1<ubsZKGqeh^960|
z*fh8;Z7t$xkQo(<nQz+ZgkD^Zrf8iKCKh0janiw-To2wB1peDTxu3))V{j@B*SP}$
z=-k*xgMpy$?2i@2#QwS1kh#3FA2>z>ltKVlHV9k=J@*-G=Pe1?3paDy!T2Bcyy7{~
zJ@!XqVz4D?Me!1Jr#|%nlond-E@7~uMf6F+q@G1MGSE1|6H?18O?!WNf#6gwv5%B@
z{)DF~h!=Q|h(S%G|JimR-8?slJ}zE)dyp0{K|*WM@s!Vt=LCP=VdzBJ$skh(EDs6&
z<;nfemN!Y5?i9Kg2%K?Vrskk^4DwSXKgj_m3;w>tfB4g%J)6LB|8j}HHb7F&zwQlJ
z;4QD@9TWl68Lw4!#EJ%6vX{Nh5C6FV1f#kI+0Lu}vDW{|?)}~8oxSt3Rmt_HqY!x1
z?|-=5Z;MSd16%kZrv0xY_R~rJ9vb<}f091h|Hb{|C5{_^>cJNuie5)>0-gAe4GgXD
z@4Z4gm<|B(mGUurDEn*Z2s$^I#xvlTQ~w8O4{o$G;{-LW^4~{{mJF2z?QN~Nj}V^U
zDg3t~`OmjUL$N{lIqxrE*?yaZe{5iH&radL52iWQe^*lZM}+l%6_J3&h78Ha17KLm
zqoix(VA(?Ek0pZHqMG6bHK7wET>ZbTk3wYhFO%>r5PlF^>}=$}nmVa@2rB$fdPPVr
zw*Sd?fI`$?#<+^9f2J$Dy$U-4jsJ^uQUA7rPu$;B-1-MM$JA79z5ZR8Q1X>^`V=EJ
z<&fO6krvMlBkU5z9|TFVvLXTr`uNlU1P4VXVBT7A$2?1y@Nc+;WAhy}2W$X5io5OU
z*=#}n3YP&JKJW2>wv7K}v_hyt2W9eC5rL?exe8u)V7Thc^&OpGjf1~BnBc4b(%iHt
zrU=mqhrUj#ejS$KGOhI6#g(G*2ZS6(dY@m4y!rkjz%QVABw*)ycf=hbDv+8*6*i$}
z(ZA+s*@9-#WS}hlF7~fGguvg0r;JT!BEL<^U&Uc!q3KR(zg_4_kAHQcqo%!J{GSwy
zh+)KOCF%LK1dmlRsRbgY*!5@1F%SWy7off!0^Gz7X!H)9fEvBQv=N}m{Hi#hIY_fl
z;>xt(3wxmV;qTeoq*32E&>&l`9by|s-Fz<L1l?42wAz&l*P%xjL|P4hP5mTUR|hcA
z6`GC<oYzW<tN{Ugp78c581Qu9z0ZqZTB&va_Iqp^ZI`gmne`t$h%izcEh_e3FbIjx
z^~MNJ7F3X^iM88ko#KflLS5WhoR9t>2+al)m2x7{efu(QGYI|JbU}^fk=k}O2CB|}
z!|@PO{qQ)bA3E<lJzm=-Oq#R;CYF=2Y`Gzj<GdNVJAfy@jjn_yhS+IYZ_IQ#02-~!
zBjLqy^@?Upt;&2qy5F2)I|9sd;Ls0TQ~(P{nuWpG#C}k10?0WNe=c#brHtTB4q#RP
zWm+bnjln<`G$^lJ1m!2tc)2Me$e%qs*~G4#FY!up9+8N}cUZ+6{nvq&|M)K}OaYK^
zoR*fRcV)h>NIsnX_!VHrEhwPD_7`Ih%ih>rSS&9)4dhcWQaC?@`T&In*}wTCrZax$
zki^sC@>CQWXi|bR$H7F^SrMOqyz##hjbN;102=z32l&az|NS3Ee)0%V3G^^N@UQbY
z|C@K|{8>W`rT8~D4t+9y4R90W!l@55|J}y~|2G(c1u2Vy`~LTv2*_YckhTq0-0Zh)
zXVT|E^MP5u$$pyyO$!x6ZXMPypabqUqEveQ^C`f!e@##aEY{SMWVaKSDqOH|D)Q%4
zK#lahmTUUoe71kAV?YyW)@ytC<!?6b8(sQ0LP%7UY@dZ~VHJ_4)TV)Ec}*zO24w5v
z2lNZc|J_30X9_Scbs!Dr<Z*A4=6vr_y2IeVvLBjSUBjtzHvS$s>3J*HvH$kQgeeTw
zw(ZuzXlK>g`+d9Yl2$IS0JEJ0SkCwJDo6=Pz8F}^lKX2^>(7C$|MhQ;c<K~vBj?mc
zx6$&N*izc}W})bWLlRYQhQafum*AR{K~P=&Xo>~xzx%E;c*%?WzdUPq27^X%rgs$N
z5C}W9Z=V>FZ!A@dgx*BHPzATNxcX_vmO277LqzZ@_eSuk4ua<@G`b8`w7U$vII^=(
zSe+?B&NWGKHYcvFp6aj*_=Xuu!BpP$CiU-K&<rkr`04Xu)Def(M^&a3-%IQBdOiTd
zCkzUNl)Z*r<=1QaUUu;KOvX3>vor;W=x5d7LDlW{@s{j+uP{D>R4H24V}4&{f2>LV
zut{6FE0O^18c;S)0-C&z%GJR#QR#T-SrStKjjU1J=+tfp(_q`*1|7=w89eO2^@*^v
z;K8tO`^G9Xn->ggOaO;nzuU*cYs7P^MZ5?xRC(3t^i0)6RQUHsmDMmK#0M|-;}`Ax
z*W%J)iOhG2BIHo#9vBT<7;~dV^44~1Sa?CV<hMz+v>tQ_ufym{usp#lvj5R;2)Oxq
zp-tXvZ}v@@7WqDm8RNKav=jgOTLbVmuce`><N6;b!VgnJLu{v3@C;y1^ra_Zr^JSD
zz%z+WYSl#wV2+gW5uva2Sie)RPf{kYKZK)_Se;^X!Kh!ojWA5CI{0$*dIJY*Je_U)
zF|j%q>ISRF{C5+l0S_9p`M`g5TK&hsw{O$x^0#)n(=SfFd+BI^5mQ`={;?H31u>&X
zT&p{q*FLujses;x8Lg_0hNEeXAb1dz%<dVZISvRU(4CLvsn8BTE27I+)?9J3MO)72
z&}||Ixjql}?)I%8%Rdr<PwoaVk{S^Vfcf-otyNNf?E7Zr-l+r^oTf&EJd>=X|7v))
zKmXP3X8emBLHWitDP6vtJpeFAQ*>)m@v<g<lOOfA{TMIj(tqDWY?nuCeEa>aSKIwf
zY7RR5>RaQ1Q(gLpWx*8eh!gjz3LH~CAB81fTZ;|(7_TNQ>2s3ThfHXC?ADLHsj(k>
zq`?ZjTDQ-{F?uh#r*osmq@h{vKI;ypxW&Ox$2@U{PU!g~i#CI;4@B1F^_C=aB%ATF
z((aRAL+VVo<}d$H$`jpGjCupOY|eGS*-Nz$!8~k~-Ds0Z)@4H1ir4Ou|HIx}hE=(4
zZNm#h0YO^n?w0OQN~A-iL70?uGii|S?h*u45NSlZy9Fsh8l=17y>8cDd++yopJ%V*
z`}rNm^Up)(yytz@xXyEobBw_b4?S<E7aiejnX##}4tVRjRo0aTN%*BB(u2v|8NRZM
z>^0xXJ7oVy?bf#|Rs2865D$VH2reBkDW!Hu_4mVGZpERTX4Q!=j$^=k<RX$?q?|q^
zoHp!wt-fr!cu}d)6k@n{lMTwR5}#kQe|@Ttu2bufKLv)FR}ZQ?+Z-0~HCVKBF>!~U
z>QOyczPaslWZJ+#K$olhXcaCR`{7>4tS#HD2QRhi_Gy>Mj{RzGI2&g!HKP#rm(?`O
z++<?comWM~NXy<&?oo9|yAd9^N_dNP?*?gf%o%s@Yp_$)2-dv62HE438~e_X4xf-`
zAKUpL#`^S!YqVh9700(7c@KG|g%3UKbcC|Be63*aZ+~EkAGjQzuVs@*evC!_6yeW6
z;{FgnfmpBB0_QD@6j{_Zs5?GVdZiKcLq_x<cKucF!<V|)$JkJo139SY{gm3axMvO2
zA!mJfjx8yQw0!C(%pco?Z1f%~I~&2~1T44==JWQSi6iO`{YlA<NBOH_w})bR!3R*C
zdMav}8<+aS%w2BKDZb$R$F4Vis!O$K_70`tWnhHc`7*s2VM7bk;jY+*tP&^r#c*&$
z{ng0TtpVBl?%n$zPHk^bY$N&f4fg!;C5^QEukjn!rGjei|JcObrg~(|C;Gf@sx;4_
zQex<{@qt4ZDC){~7-{R-rt7g?RYyaQs4Y*#=%B=eIoX~QA8ZXB&b;di(*aJ9*(SZC
z1^ZT0|3t~27y+Jh18mcDhTCE&q{Lrc3}@$cowb)aGKxM5U2SbJ<Dz=ym3*l}$U`lq
zk6uwBJj~v@j%;w=`?4SC0V39ILuPflL-0nZ9CjJA=P&0@BkE~jXld<K3%i9^if4na
zjm9v%ruuH`A+lx4x}*3Z?~{typu}V`P)ED*9tzkKIq$6{^nWHM`;R?JJ(knoic4({
zIMi5~^Vp5tdC<|He2K<kvvT)wt*t!M0p~$;vpDP~{9d9v=cs{c^oOGEd9I$sQBuT%
z@-J82yLaHBy58?9Ik%SKiC53A&y-wMmW4op9detN3|i6`LE+D3s`y%Y;r503OX17|
z>xAK9m)V@3+L6W1TAtDLwVk-dB7Z!Pc~L+SSCh$jLrI}V+DjaMQ1A=9HW$DEU%TI1
z@U$vQzY2p>7c>aNLd9VC@h?j#`JPiHY>~^{DudOpsb67T-M00qJI}s7CqJwm^0JX^
z<=hUr5{(&g9wPN-unn(YI0LIM;NEwfq+?T7mxo+>5F=%iA;sSl$=9KPbOXLAaN$8Y
zHs81(X-g6tV8{G)2_&WQ+5(9%aThF%`2#ciz3w|xZm~@Q2X#;NF=XA*c=eO5U9qqv
zUP`aY#i}G2HF6WX9HF_MZSjsmrRqlnX%7y9<TGbVy5I1^A2X|!HywYnB~=-}iL&t4
zf=SXg^1o?jHaLF{)%Q1toz%@=@2uxXX|y=*PTfznJL!`PFdFncE;6u|e=FC7^2P^#
z&l!}qmt>E+9TU5b*D8mB(gpB6_SJ~~IlErQLhh41St4b(I!e=sdaJqq1{xOju-@+N
z?3<&))jaZR^E-ETM2MBYmD_`YxH9Z6F0Xa7I6~}c-PIy^7#-LdhjQb?<RdTpiazts
z1ZBVK3tv0ntgUBY8md~+m(XX3#D~jnL2_|!rk5p*Tut2(9I9F8{boe)d)hM49UXMJ
zdG5@;{UV)HBDnq!1|oIg2ZRHRbT;&DY&JXNcR`^Dy>6k=5_J5;L6)ZFG?@|E!sJ1A
zQ+-b&ZW&eT{zoVoASq^qoRh=4<m<1G*i|rVD!5_O>v1M(%ssF#4CmF$J7=H<Q{G2;
z<W(fET(9=KWQ?>5O5<ab2c)D;LQxs0P2bHc&q|6Hu*avrs1>mBZf4?ZqRPncZhHX_
zl{o3Sqe1wVQM%+RGbH(NP>9{#kR2o<zhVaK4;3w!%G+p9r~?(`WoRh#cEO!xAQ{w9
ze{B<fWgQ!vYIM>gsJ?GRUKyfAUqIS{i3D0-+_Yu5Ok0e&qc=1(j1U(M1d(31VwQ}-
zUKL7P@7$4H>t)d8xH4HDzrESLje1W-w9MDGIoZ=41{y>-w{tXp3G`i8fX6Upgkg_u
zc*lAu)ts>kYQx{20jOlpO&qa~cKJuLw+i>D;AgX4_FI4yrShy6ReI6cZ%=)0@hz}7
zFmuI*Y3u{8ek4^@u9!scdY{&<Hr;GCNz*W~M}>MPj?B2ccKOiUu!fStbPJ_SMn9g2
zM~v}kl0w5Lg2z!vrxCCj{XV?4NBF@qno;CrUi4g#Cs%}a>JJCkSDwHp9%j4fOka&A
zH^RtBc-Qp>tq#PFKPW}E0-leYyYa$=S73y#Tv$1c>JBl?DZ8I;q~w`MZE&Kyk#03p
zd3AO@zfw=M?<`k4GDi1&s7sLEO;VT`kS(~$H+%(sCzcVc>f>i<KIyPxnlO4(P;5Tv
zVIYJHDFg-b;R}(f6m4LqZyx@zMiL}+If#*;V5~bDmCF+y%lH(L3*|55rpK-#Uko^(
z@6aJ~@}x#&#UA$-$Fi$MbTfPnY~!0eP_C}+p2p$SerXc}(oAi6$ye);QU00Ok*iY8
z`MUKHhq=^IH{#MkwQ+qnifwA^>S@z$L#%~5;|?{&7!^Qq27HHWL(%9$sRhpqQY?5a
z*YS58GkM?CI<BQnRhSVIX0qm;nGEQ__tLm^f(cH`vr2?@W08pmfccI^F2CKwydCxo
z*~OrwU`GOb5Zv|!qKWuO`3Bw3LTMs<8VV(rldwK|)ynLMKt0m<v~vu&bN0O3=D51U
zJ0beH%nXh+9!^uVWIXrJefPFG_HKEVgH}Vw*yM1N25t_A?fzHQ<ZoruMn10A5fpGD
zmgvQr#pM#Om<-X2?uU*XU2t-KOngNz+*eNQ5PiO7Cg#zezaoVRC!;-0>>_cLcaraa
zOc+Bk#08@<t?x#E0u@frRWgC;rx``^b1Z15x>)?0tX`ffYL{We0L*K#bon_CHN{{>
zipw^-kbUurLJ*C_=hZz6QDnqjpWDkkWJb=!RADPywu2lKkaf1|{MkdVGR5}LzVR|p
zoW5<4h@I0Uu~=qIcey1zq9k_2)!~lRJ|+Uk+&l7a_0*G~QSbrUz<Q)%U07vg#MjuG
zRoF682RRb#BNd?qqosO}1WszFV!`7wsf&Qwmm#s>K?t8B%41?(IT525c@YmD6$$$$
zBhwuC=*y>SK<CoBq(YM2QnQzMsN6gAiY&%rtKF#%)MyPVyg6SF;fdRp6XT4uxjGH8
zRw`JYbDj6f!yic5Zp&SqE6jAc>@&D=I69Rm;H{9FD7$P%7R8EuS9$s6wDMWNIpd~!
zk9I95=^`lUMNBcw4s37}CAH(tvBB+lcf*^j%$RxHgT<g(k6t2E&iG)KU5dL3i(alF
zIF(+D<$Y}76XQ06(}Ne(osALw$<X!xeB29v;IxC?yUh3vXXM+6;tDDK9SgI`p77>!
z#kVXgBlY^3vu4k4u__ehg@Ea1%5zwOC)QgLv4c*CBWQo*8pAHWRpw_>e&5j?JvQkz
zAQX81Z_5VQAQu7;H#?@>^0q5Hr4bZl*Q3HxlfF6YX~Rv`@Ll9X%mmGb?oy8-RT44M
z+BWtQA(jsY=#k9Xwzu{w7Dy(js5@{mjwyC4RN)DIWx5HnBuNFlW@Y4!7JN)W+FW&3
zMqGa}=EH|&*P#AecFUJx%~<xZ@cN$>hAsZ<v^l0KG|tPEjl%u-Z%qOdM3R+Gv0{+T
z4qQGID=?@r%gJ(XfdghgqtJffD<9znCsdZ_=WyuAiM1G9{&dPU$e&k67b^^41M_Hf
zob*PY&XL1h4}G?k#%KK>3Yr-@)QGtv%Z=jtHwno02jX&b?#U{ctxYLq4zp?HvmO)A
zGzJtv53XD(6QscU$B)>L!ug4AY-gN%Xw=RdC{MG>-@S<_jSJqZhDr!}`%LrLf=uqb
z<I<(6-rWZyMF*`p#fhxWUrr;a)vv2rQe!)iDzIHRw;CS{lNNvle1hWg0pFv9psIXu
z;cYM(kw{I<^+E3Y+3?<ea!&uxwIM;V`8ms48cA`me%ft0#{q!$$0JqVTKrNg{0F~&
zF9DQG0+Jd}-Wp9lM0!ULO6?v7bmNR-E$L67#-x*RST2S)QiJ00y63bjv=|&~nEXF|
z*I(6#&}v=orCF9(NJjD7h%a0Rv8=OE+ejhx=?uA$%ApJGey~l?5k7L8sK_#b94<0y
zjC~Rsj0Y!2^kU~d=I>@frFdHyNcRFV3iP>KYE0FY#wYSG;pV2_Y2up*Ie#e@Xe7_m
zbH*9m?~FLr%Qf*o@Xxuzh#k4)q_wFZW?wWvYhc|R?YRRdY+#peEcReL%|57Eh7zSY
z?~ehInN;iUP$(|F^jGx)Dm*m^_(sVKq&`x)2$OGMIL#d;2OeaQT;S*$!-H&+;50GX
zQ;NII$bQ=mC}6pZTc+SSG1bsx7*ZBqZA}b*04(6d51DMzGwd8tT=D^?69Bq~o{{&d
zF5b&Ll1rV|6V*{joccAr3)=5MEoZ)K1W#o{HE$z)RrJ__FT=f-k(pD=avgX~xDN=k
zap$VdWF~vawJr;aL^=z7P@Dj&HI*sgj6-H}aGcfMLJ_L%DN~E*{=QJ>fzo}!c|dWD
zs^s>RTUBvRF&v)|PQR(~1GE&1BwjqT7iujTucY1oYE>8L8$t;0dokykWD&C55?U+=
zsB~lR^n0Be8=g^_v~bc_^sBaH*xx-x8o$5st#4s5Z7fEnv<>WC+^hz;dL94KTRSn6
zug-)V^w%;IDY4jY4h8_AK%Ryah=1bSffs|T&7=v}sT&2mBW<ahaCZE7z&HDtN}uon
zrR|r#wvR9C7axvr?1;#S<Mrd$t|eSbry@vCuvxMlg_}xVU9%BM>`-4`T;w9}9Qf)>
zkA=+Pfl8YzqG|2(-oqKG03<YbtIrtqhR(%!Q;wPSg_Cn4s!a$a_|sWPf1cjue5yS`
zJ)k{J=wj5}+b`lke!hU|<CZMf*Y}PS(Y7~%F%o;ae0HeZq_006C^);1Y(-_AiiHmo
zw2YU}WhRUigap{5wdmJ+e8b*ZEUXaF3PHXvjwSSbly^K^SUt~C`>~ViTPXRs%MA|)
z_~z^T9xlI17mi6xe>K56dzWn21*{Y-lQGqOd1n5`g(fWx0gLi@c1@J;E9&!KN(0B|
zCFBUHy;~p`|Md~p3$lVRtr^|rC)c2Pm<<GU%#ZXA?FnP)H;H<kC7sl+B*e)Y!^IyR
zvNn=s7Mn0Wm6aFKBBs!XG2y_w9mW*+q}UPLqsz825UJcv0ut<4Jv+ne(P=Q%C6)WW
z6_($`$bSaxJr8fET0WEMl++=b(Mw{2Uj%r>axLOvk+G{(m&;k|b17?Cm4u|OjeU12
z0E$Te-gr_)U7(VLegay^nY#-uyqtI+r?eyTW1+hH*|wbTf$K8V-GnW<z+ek8G+C&)
z6U)&+{s!2=W6mFq5joh`jB3X-p!prY>Wz(3IxlOQqE?n!57%=zT)ki^*+SLilLUNY
z_R)?AE6%u2Bk&Q0y7f*wgal<q5aC(NGu{IS!^m!#={^=@Vz#%4nf7B~+Qir@2XuF+
zKP`f)iL98TCLD7h^}>A8MVJ^aAv<T4ke<zl-n1>hPwuA}lv&J9g?6v+tD3ADW_JP&
z@a(Bqo`lplNJ6BSSj8s6g!_%KW@61;e3-EKLrT`olpd-<2qeYKQy%O|MTmr@ql7Th
z`{1|R#nxz~hhOQ(s5l<*Zh}rvSfq^*@>7}R^jf_>oflh7fYRn;5m@p}m!<vy-|LpZ
z*2)o4h~+c<Tz~LfqUqV2q)X@JZ5Vd119|F^(9*A>&rxKR+HE_aS6rm@X73Cr_*%OH
zx_pJi^X#>M%li`UOK=A64FrA9ZN{Ewm8(!E4dmSezNb#~r&&7=nS2g#6!ud*&ZmpO
z{UghbSaYuZ`|Mn?1%*er#F{<i%(QW=1#W(-ZOYB{-t|Y^vRqFWynI^F^szQx!UZI=
zbS7IH3Z-%{hRUTUy*$snjlS(2hP_);bqV;<c)3HY@QGE+z@dkB1m#9U&1f3iW!G!h
zBhQ($g2F`Rdr!CEd5;h+9W~GZ%+<05>6t~mUqC@Tu+vyYNv<I@d7b8lO>G-3auU*C
zFGB{W@eZ*L#&!c;zwkeyQCNm_lML-UK)w^(4&Wc$4)sA=a-KT5^Lx$kDQs(drxA?$
zyWimHEJwesucaGP32BKxvKyRO8GC>vy61-}sW#hlR8USPUWfevD%lZ>%);(5)t4K~
zy^p@Ks_C8G{nbo<A4{h5lQlLLXTygODtOEz_SOah+XJB|(qmJ%w?+rOcxDH_8gu?p
z_=JhHc@<ETH-c2})I~Z(`fN`Jr`;61hWZC$UKdB^PTQcwdM#+pM75OU9UGA3bGZdF
zo}Em1<+M(f3se)Em|dRBry}lClb?s216QF9RDEOW<4EDRSe0p?vo`Yn8Q|i>?mAn1
zgjj8G1$aNlTDH$k$j|MB6aegM1ePMWa*by_qI?-b*o}rmRK|90e7&(HUz$ghDx|p>
z=rbf=j)2602+cJt1sv)5XT7TEI`AI#iBjAO19@T{2==MpGBynzviN`!SDCQ=sUhzP
ztI1MI_kFc2<F4@fXDoD0DP}IDwV={P@G8`Nj=S}?v<)NtWpp(}pQMIbR_;oiU&mFq
z4+zd^j5czAH+}$ACi$O%IG&98wV*G!2bh{NKnpzX#f4%gr*m2cw9Y<`FmjY`qXCe;
zt-@WdD$UPg&?x*|URtMDV#+v5fX-cF10>&PlB32;=|GIhp}c;9VGOTFq6&Vv%2Psb
zIn(2gQ_dS&zx~Xf*bfN$)~&g*yP;+UZ0z>jX0CuA%BYP$%f>S9N~=}!`lUwAC0!sC
zuY!l?id~91w)=Inq}x1P$=>1;V7XU;VKAn#tRCW$@_Ug4)l?tfZGoP2(gnInv07B`
zUw+mn-CiSa!g{9NrpWou;H<;3$Z9$3DOpsAO^iyl%krmh$rf=PUt%xi;D_41?_}d6
zgv}F^kyaK4fjb#@J9+mYsa_uLJO^Ks8rzjdKI@W23NVA8%Sjvd&STW+zpdwI8nZzg
zI>32boN0-6n)L|vRtylTU4#uxcK4C+>A@|DroARHs2fwkjQ0w&0byiRnbwR-(m`BG
zy)ewo?`gbdK<h<<hg_`;KM0ajZ)20|(Lb}>)iUsjNv>UiKZVdo-PvMzWIYxGU2;n0
zKJY+Z(WZ?o^(c8eED;9O2e4Ei_Mp8VC0~>>O^x4RSh0<%=Z>qc<XW93wRHB<!pvCP
z{xsav2r8ZmnP$8tK;U@Yo`O53DBb%kc9$w?g>@1nrZ7ik4IfZY_>{s(QGqJ}Q!!u(
z>Wtle@$_`g!<O45avKd^G9<7=5z|?Udq;ZCAsO_uepD~4>@gaj1%q9Lf|@x}n49^)
z?;-V5U<e)+%Sic7*KvSnB%DZgs{28CW|p)~oC#iFL}eT{me17^d0s3J=XPQ}3RT`Q
z?1C$-4yC(|3(gPxA0n*U(V!)INw~CH@9p)Q;CX#KdrHioQWPEG^_1*+J1{RH!a(Lz
zyaPiM&|8FW{`TfHvVP#%KCYieP$o>SX)pe8wRjmJGUd3uI%d{5Y=Iq9cKJ!smeBRl
zn1bhh>krIp-8%c6uU{67C44<-HUT+ns|GhKw-v5rdk#?>x8C1Eo_&+V=Xv5(bed(A
z>#C9PB5C~7xXw|dyH>bKSyAz$qEj{$N)&%{%HBAXky}TROOMsttkeFCRL8;PZ<{xs
z8E}tUx;gmVrAP97$7}NQL;m?j6y<zBD`cjx%5=#&k>f87M3P?6H=BVLa79a{4qH==
zjq|IztoglI``DNES-h~DI`a_4E-jgJ-K^`gT(_niZ5elcyW}gOg?Ty7d0Cv$s9V`8
zhB=XSy=OyK-f9E}qXl{DCInqspAKz}8qZgY)Uqn4i{8^rsx$-|s$4zjW3AE6Y*Tee
zpX&+<jG*RV^1{;1c(^~RSYLRsd(Vg9iSf85kH0R@%sWT>2a(ulW8U6L^f`tvvm!00
z84*bK#}tLEBdjF8$SsnN95GtvX3nK0>jnMshEzX_aQ$aO$NmNA4A_N$iSh80Bi4KA
z(l<z6zq(6x%-;rv4I%fUDU1GmgDJXBQYyHo$NB7&X=%vP!!j{KkwFHpkeoLRZ(^%F
zE;b5fWUQwLhfd^tRk`Z$F0c<A`u`wU3QSp@tXI#ENZBIA*?UtFh)(?6(%8WJ+@!y>
z0?#x_y(``3S?S@tRM%yr+z)Ky=e-mvopBs=(pZz>?2QC>(~C8ePw3N=Bd+xu+&iSy
zPbtKGMc>O?lD=sUV=f`+(>&h!AvA}zONMmv*!0=d<dl%}R%-qTN8!F07J7FDRkp&5
zov3S9l_>cxt-)QCTQUe1iHm)NA%(<ANzM1wpDV`Ek8-SGpTY6-<B$>Fz-*h&SJO>w
zC(6vUxZ}M#z*_6Eqm_)xGNZbjWp;Pc8>aZO`v-7n^JA;`r^MbQ!3JJMa6#sVAA`0{
zOhm~oIbU9Aw@k;n>IJ%Vw2=DQ8-gxJ1|7YEZ)~!a#zOwOeT06<fHsNsesY21qA*PI
zAf(k*Vj{{GGe68672RnrvSRTg6LFWMXA$YWnj@C`d}tkgn8iXUNqA2@4T(a07&+Dn
z6hPD>c`TQ2jMJPN^~d*=+gqs1B*FD-)c&Y*+uRSXD^1}AaUcS#azELg4kO9)^OmaX
z(;nRn7GYzO_#~=t97+4Oh<^9>tJ8L;%FMdX<}AJNZ|dIjj8wzx3C%J%?l~&2<Rz4z
zj>T>KRSO`y>Gizqfu!Js@J(+49UlLQ)szof!be)S3Jwj~(j`r(I~SfM_WXLZyz(Sy
zNl7HPj3X((8CWcGz8qiXkF`?UQ@MoOl3YgTRfBzig7dzLa*Ky%!d?_nSMF}p#D%u7
z{tV4yskcZypREr^>zPoWi6i2~_#)9zApAG~6huU5|M<-zZ~F3sbSd?4@RsMr!srkV
zb<ykmL=C2-*8c41(G=Kffr}E%b&NfJG)=xHNafe**;2G^q?*Sd?^E%Xl1NW%{h<Hh
z`M-ZPhZ;9WY{Px?6W^3g>`fPJyZ|R9QBkr-e)?8<#LsGAf_r*^LhyBFvai41+VxI@
z<A3v_|9pM%aBOh`=qk8F8&P$u1RS4aDERtr3%3S8)eC8I48Jorx!7v|hauApA0SO=
z8b?kReOeis<sEvqEA0L~-yzHTkg4Hg5(RhyPJ&4Ae;SWCVr(<-j1{iS<f~vsr6mx^
zL6af(av~6McPcca^u@y4x_bHF&i20z0%sCHzc!$+n8{tUlB2%_;f+?%qX$PHgs-Zd
zwDjeeag<9frOvYc^H8)<ttv;PU+p%W?l{%lPUzSM9uA3#d4ixq=FVKh!T}QAR&RxU
z<bNJbd~7o!8VlAvOfr%rJ(sB-x1?&v^>mxBj8Gijdd<H+j#mP#^ML0={gD6kq#Q>a
zP0%*8%@^TL>!=+2kA*)x!QHd~t&l`8#slN7sBOE`wFl!tV4bb`-SPg@GW#N>$r_f_
zuHJ`iwx(5C$J5=phBm8;fk!}i^3{~AYQ^Oicu3lSu&xb2Rvgfmm{cG9_+x<l_QsUN
zs%E9!3S4BtYwLMi>sS7#*M`oAxC|v&c$G%kU5Wp+b)Z$v(Sued*&rRC^}jn&|6F5m
z<c3v%VRBBe9liV?58z)PH%|sjHNEnERZ8wZomc4N-~5}ws3oGwL|)s!rz4kWDd}0C
zRr%Z37QrRpv(Y^RO^78v>o+`2X4BK&*1+4+e$YUl^go%0f4&_nFs#J<c7_BTMv|6#
z(!!tp^@<ixm;YzO@{ez_Do}(vU+y;ftbhM(@CDo&Z9r+HeZd*FrdG<FYxneT-#QPs
zJKPz?8O7z3#eJ7gvh$9AJ3W;Ie$@;U_J{XfSWlFiab^E*Ix8RfRWnVrfN89{dEuu2
zpEo59h2JB};iL}1KNu#fy2b7&QT^>6AVOjabzbU<#uNcX&?4oSv(#EjLRwM(_IIKr
zbK*3UCr*EjGlNPC`QtWvEhXc_9!7ur#U3e&Q2W2;oB(ujhUPuIP;L_$gM>gjf<Q%g
zjtCb_=93?e&;M?6<arTgBZ_Dy@{dvADDIz3z}KYa4*&LR-!jCFJHC3Z>J6~J54*!O
z`2wLw;jg{)KOTi?QNI(0i6<{wO15uj4(`+bXA|m+#DoQH<~#nR*S{E?Q-?B&DjQoD
z=r>>At?LQ<{^sxZ37+5nQdcm*2mw_S+RVbBXYR40j)hkPskXVFzaE<33HRS_ZyW|G
zU}5kcCjad&dzKRjY(W*4xf1o??HCF_RbUIAtJtUhoz?P1(hdQ(^nYLV|F^U1Cus;G
zTK7R`#PEu2?+c4BAa*~-B=&E6f11*7f@FR`aI<&;KzZ}vZ}qU>7N8s4LVcrlUpr9b
z#jcNDfeNN9@J0ilYaR?vQBbUT4;+o)GUKkK*}=enZsVK}NE&+1<HMf~nih9#8;&*H
zmSbhY4$ng&tP1W{-j0rlmn97+(|f?Jho8)2x(J?v3I1Pab|vwpKI$7}Oq>248)oPh
z97o;L)rIcmY*DYL^Nn72hB`o<IM$ofPGZ{t*?79D3m$g_aIvmYmtOoT>M~RNAhcE+
z5RK|H1~l>M!col5R!LQzXEx9s54vmHum7lXb-O<P-bUuJg$-JlYwqCavHd<O))`=r
z6W{s^{#secF``h56ggSXTZofme^7s9@vpHxLYmNX{b2|ECis}g3&G?;k$iJs__MPo
zVetyBsPq}ix)IIE5BI{DKW3Oe2v$r?UNwcj%!IQ(-{ix;nqrLTmy*8)5cmCH5{GAQ
z`yKe3#aRx$jL>Zv)@R40l=Ap3|84*{lYXl>{J>hY0r85~{$p64p4ajC0vI+r5co@U
zY!^)#Iz;TcAFZpbX~~(~L!^lVWn}e%6aGvh?EzRPU7%+a3OiK%4a~(asQ~b3Z2XMj
zSQUxA^<@M2#ss8MACQaI1CIEnP!6p%kM189LwplA1xOs)BrrwPS>$>iT9<V^TKM5Q
z&kDB(Iy?<cu%cm`gJQQ=cH=KzK3pRf;t(JajBL19lMG=IO++<$4k`Y{5b9Qd6ZP!B
zllxq8K=reoNxFb|R^|)Px`toIeefI<Si@V(gv|7?F5>uomknVhppBgb6=Hvd7+UBV
zi_v$TVIbImZNaR6pD<twU2v8C%TNDB_pBkPimd(IpLd(N0fcD2pN_vO;boun0@bDc
zp5RD-TLDp4;#Dw8{_L9wVm>yjs&S2NHbmUAs1W)s@HezDmkr`$wLgKu@K>ZDbV617
zA}BBr9y@Vf^mNt(R45J~8Ia_`B;haBGO42vmZ10fF$mfF_dI?Ncqb_!1#U;%jWPq;
z)weOFU?4xE6Q%yHWtLgmjw6Q@&;Wx`$0tTGPSP@YgPSZqTwK4@82uE)A3DcI)~pj>
zXrStSb^73V0TuCvyf@BCJSL`KNtsYxgl%5}lvxUdmBI8`ZdCQa53W$_bQ%i*D8Ikh
zQ06x0fj{Y+`&4P=)x%HGIs|8@;uw)h?8M!GG_gFrYGVV?aW?f4w%EOYjdR`DbwmpP
zA-j>=Tc;VDrduz2QHA9ikMot}HnzI0I1RoHM+bhVG$+a(8tC|8BVlb~ZO6rq+k=x?
zFm;ydnsf`~lJ|i%(bg?Ae2JXMg%i^Zqlodj2U@W=p;603v1EO){9f{^=7$R!pe!Et
zgbni$gIV-cqo?aSD~U7w{>{=^?6+|-PlwiS^>lRM^GBi<3=|Y6tzd#kClIx3k`_%+
z+yIFl83j$G*eY5=>p5>)ftryB-wS9F7eHb7h%w7gRT`Oo1br4sipyqA-q)?@T>V(U
zd6>Bu?Q=yfJ!Td?m9n8~q&IEw?^EE8RFL-i<D{DFYN}Zj{(c{O6O#Lk7qAG<Y+(ns
zQ{K*n+1~DFKt!u$mLADF%}`u9`rLktW8U*Ha7gS{7zm%~e!lnq^`Y>WRiC^-@F0jS
zkVc7|OfG^>(6vBY5Oyf93q1N|R0v}s!4c8r((iaqpM)wQ=8R6Rf-qJDVZhPm7z9$d
z1OM3NU@rM$Wd9v746$KkCd>LaCR{Iq9uPmuwk*tWcurvqPc=zmv{B4YJe~Iu8$R3t
z?qp^*Gemn^(CPI-f=9aJpukc^s=SE5h%NA)3$ARg?>m8UJvwb#3}bFp61&E8nS!qk
ze~#JbvlxB1UJ7|j?tIS!FoHB$oVF!O2(TRwNY%5*6$&p8e5q$$H5nCn4uhfFg7tg#
zAwTK<S(zv>LYg)QfJCAViC$Vw7oTa_cqa2wRIs0CU7TzayPs?kM)wc^E#9S$8=#1z
z1+Ugx55sfH?&9k{&Jz0Mc5}XV$5_KtBU<dn4KQLJ#9SC>Z#A_tq)mL)Lz^rg-j;oP
zwI*n++u33zbo@=N%i8Txw&y`l$M%NG*NuYoAcQ;j0>HxZi8{jXH68Rab0{y(*fz1+
zY(jPtP?acPy0<mm-$`S=*C+)=Q>r#m?5D_(K^5g^Dd3bYX=MXByU|pS6X8^Hk8R^Q
z9fpx+*H4r#o${vJ>s@=hHbYw5!YudKR^k~3`WB+h6ZWK2aVb+4ea0G88}5HX;pS!9
z82qIu!C&w9z}prM%5KyIED^LlDPIU8enk3>p9^aeYpa*=k{k%xoi&mj*ICNDshm5>
zrVR6)e1YrWEyE-S8PzjJOMX~22*_;ZE^-e(M3M;*R{%yx+!z(q+zyPu<=6UPrmmfQ
zEos*$rc<$r>d<Yv19{Ev5%hD9$xjW0jn&`o>na#gn(Wv$(&wEDV4PeDku{9K@67?7
zy@eXM)BP}{bBJ1^bm-3RkFZR=zT3ja{B)!)rPye?dO7l7eM>3YxHG7yH*!}qdcETW
z1Ycy+zn?Gj3uoKZ?{|K=3cyuFNw+GO&9pA(Izpj!dj+U5`mAF)BvazhWZAtG1g`To
zpy^HLMT1x~9_kn(BB|<1C|D>qUGMW1XQZY|(rhFjjv#MPWws(b^EdDFBf?THEkcmQ
z9C3rJJ-YZhc03F5h(2=*8)@A)dgnm_G3?ZFZT(`2grz|2JU)XD$Kzx(+ke6N_pE;P
z6^JtTFd||6FS_I8q_YdaD+mqT<Gk6JO0ZgN5A}<{=A0={!bD_R8@4DhtbuesP}tDp
zm-`rhK*%E{k^EoQKM|qDG(lmh-)lW?XKUv|WX@(gDwn`wHbD}(0#e7QhHX0}dTO+t
zE^?oU)){c!lHebfJX2l)7CMoa`Mk$5;g7p4?30PJ3%8FJ&AVEz!7k>lOx*;A+2uKy
zcZ~h5lNnp~lbLs45fPSp){$kz5w%(#XjLr<l}|!DKIWsKT|YQTETUX$$^?CGWIL5(
zim$%CSMj6Zyi(DX;63}}7H^2-%6L{npe1UJYE9msTFWoQw+BFu?9whWk9Si9vxAc{
zjw&r-{S848`)q`65F(IBuT}hgoe@Fqh}h=YdR`=Om7uePm<j?tefWT{JsXGSD`nsD
z=cUwX@!f8t7on{*&ol8yVEm0At*3PqBl_;Ukkrh&Y-B(e)^Er&%!$N6E;}LPkR+e-
znDV||&qf6GonYzmrD!oxL79}oZ_5BB;1#5rrhOqQ<Pm|}>nh_w@dRc;SpqY3GGTtw
z0xQ}6RTLLUi5HgNCV)LimYYY|6;u1PorgB3w0@5O|3U^j01uJu=*BcC1pLO>z>)N6
z8-6R%_Niu0TLXPbOK!rx-0E&(WdsXm#tMPr20%}O%Dum}jYA{FY9b9qD|dzFNEu^8
z-*<7Pt<C2=c{9q`n&~>HRd{7*ABYPcUq?S2W7y>wZum*>enUvld$~?W%kCIT`=ou+
zAx2S-EbE9ulwU>$R{}j|k^%<)58nR@NJQ&i)CC9k)ohShrTg1<0qKo-E7_k#C1076
zK1ML3`7j-qGSg3%iG6Qqz0ce(;RU?vZ+&iW?9;>&zP)2bmu4IU247fF?O~XQ{0Z>M
zcdqS0ek9X$>ql-obW2$bD<6InI`M75*~X*tWnLrs)f>u03*?4BzNajywrcQ4X!#Y8
zp{WYXeL@ntSO(XOamSMC<z<Wn2IC;tWZ!8NV@ba}H%%)Tzl){$W&f+pgnu|$3^{Qr
zH0hZOwrkh2I>==B<2MZaDciA?6EZlDNP7f507J*V{8`Y~Q2w)7v-;;`3&Cb7>!4Y2
zhD4!&KdH$thL_0^9#0wMrO&^BWe^<bY*dCJy@oagk(_ViPgs)E_H@;93541B_uFyr
zU@R8Dz}f0<%#+dUrF)CaV5C#-*@=R&1_Fe2`az^7KK2guOFwWpVn;J3PXoPQFn_Lh
z(B3Wt=+6&j`L2+EquL_^>ldn)iB5g$8b<w+K7tWu5;$Wig+s(t+MLhx;(sJX{1F5k
zpxlE=#Ph7xlSa<Hwm5qr$#Q?zqf&X%bDB+WQFurku{n-MrgY|Y(I=w<eZfbIbD)t6
zE}`9np536*<egNC(EMb5!JSqfhbCdJ_*m8k;FD~h0=X!8R)i;&4cUM0dVa+FE|E(s
z6FgKg_*+DREGDYv+KS7H4i05rU?Hg1ET+>V$^lh@o1{hZbcV)!hROQondvq1=`prM
zE%8(;<sa7S|9OHa{HC#*LmdFXz{gB-{$t6F5)HGhEcU@K#vSF9=7lG4T268IhXM5#
z1)02n=RA@E4H{l*Tjb}qz5l%wdeuJciiMuGbtXw#1&Zt<7qbiIBY)xtaX=Yz^OCl3
z0xIic%RJZL1_yy=OVwXK#u+BFtI0Rh<?2m<e6!`|3Y<3Cs0!iiS2DIAiX}3w;oi6z
zsS$smlN_gk`7Z<WUl+8qvt2VE<v)>b+o(0mqN9gEj^|BWz7^-ph+>J9KwlP~gU}hJ
zS-Y<{oveiPmD_ZAs>A+0TO#Mh!3)AP>PZ#<_?xVA%ly*=i^5EedX|8OkvtjX=dPk!
zSm^O?&tw(Kvns0FFofFWg_5w(ssL9rdnxp%XLA5@r_1~9%yA<EYJ$~dC%$6sfa)TN
zgRPPfQP4b&;$o%5__6pbIZ8#b)Y3e=^7Ego1TKDgZ^WZxh|&p<08bRThl4T*KfQhO
znTCWztF7z_BXtIT;svXMVhe^0`olY4oi~#j>hBfG{ZM)%^hFi2I;e=kKHblz0CzKz
zU9cLWN8%u9>6y}#Ev4?GCAU&uOz4n;g~f2FMj9r6epe0%RS;mGpWImJfw_-*lB3;%
zQ5L#Y2KY$zU}U_?%MU&}F2TgM^&F-o6~&amdVd3bgh=juB_jGfu3Ea3w)cVKUWe+0
zg9ei1`z3)$*2c5N7ne<o7=dEowzAnL%uYII{LR7?Ks@lflgrK&IwHI!3P+W@ssk`R
zY`~c^j0h9h8_%dFkO~vjC#G`^lN%bhoFx49T!ae$;`8RDh#tEQt~q$7oEL5}RZph)
z(9JL~Lak&elCteuQAcD4oXRo9t{y|gC<%?KTwrP$Z!4tN8>s8YK773BKUpezjm#GZ
zEQzw;AGGv6VVh%xO7?wLf0)v?>?rwMsEI!-nqY9|Gi>(#h$Ix%w;!+a^sEElK)wRH
zI7kBk)5+ue0q#2D-KbxPAx=GeA}Tk+maz4c?HRth_bnE^+hl+X+NV4ClOmFu@Tj>w
zCLXhlM;Ckk38YWOb!2r{J=!7|0~Eb%|AL?kaQC#bXnL(tg8avfp`o9E=Rj&+S68`%
z{Nhc4L+%T!9lGDgR@o20z`NolS;9yM{(6nld~ZU(?IkfYjCX6a*c^EBk-hlGrACO_
z59sRx;HRu}7vQ}~TmYWdtPTl0s^~ySsCw~Ik4M*OM5;pyAZVvqx<t*qCbip}>+ntb
zLc=au2Ds!AZ;*M)_BAp7>P?Imr_0vltg0C_`3ZET0C-O@qRErzK^pR7UVT8Bjs7sz
zZt>9RO)H|AT)AXj_(>+<025Si7y|x_yB8}j;$PL=-dqL)w?dU0dVnaB7(j&UnqUm1
zQ&k%RoTsyn$RC-MDG@F&Hb1vD``t0N=#unPjZKJX#~Mem>or@*w?2olB$hk(p}L%}
zVVclcbi^T!^=)_US4`RUtNC-zyh&kM+9F77%$`zhJ=*dBahvcb`|7d1_t<}WfSq#6
z@6;U~OwOD@+PE|*wDi@%$L-!B%fxT&mBR}-+UvHFJnlG%F?9C>;N3v*O0peWMF_nh
z?gwD6WlHFWADmujcbQd3qg@up-J7whP=GuDVd<+LlRSkqru#Xys9akP;u(p5-cFTI
z5T`<3lTd<&W|!MF1{BQ<mLKq~wUaJ<-kleqxEyiUf}=J{iHNa}t0Y{;Kh%!KUa!0*
z73Uma)+K5sV<C`Rc___GW=#Djc1DS@Z*}A(Y}jzaSY@5ZPcRGu38M5iN%&i;L&HuH
zo?`pzjjW%Pvd`Bv^-Cq5^`Dp-iItltX&QyPp<KMfmGtA%kM~6qeB>8|B(!t%J}-(X
z$rpA5wdSEvX4a|>ChcR0mE9AcI~byzNXDJRT2BHoaW|BYkAKcz?01oe2eZ_W6LY^T
zT_QkA!8Q+Ccq!4|HU|QczR@gG>S_uPI~vue&j4r%^EcHmmEZIMu7%2?KaH3&HMnYc
z5I0^C$>hWtc8y?-m)}9Y=mppX-hpd^EX+cqeE@E(uubf>5TfUAQ0~@I@dD%Xr>llR
z!nX_wdl=qUR(5l-iA++j)t77|^wal_5xGD$<x@grEaNQLIBar(p#^o2{siRcb?qzv
zx(yg3mQgJ)HUt!JCJ@+UmQVK+NT8g{J1ZS!Y<gdjE+%4WB`^~cP&H>;etTISV5Jy^
zF}AYS%;NN27Yw)!#?r=>Gh;0?JV+*Kvr2XjQlmQq!sq98T{rUy)Hi_7E|o)cz*NXF
z14a@Z=hy?BShaSYgk}K{;p$Lz0ak5|mzI5FARt!36(lmflL#md(bQcBgl?D;MIC3$
z6hzGlND{B4LR5f3wYS%mv}*;=H9(JgT4{83432_~=+XA9Q8=s7#u0D|)T{>^nFuVf
z662jn0KL3);C*xwd>!DcY6b1w^hqvP<cwCmjL&lppA))d7z06PWU9Zs*#k<<dF_e4
ze0zl+8=&N{1LQe~W^mtgm9U>6v8>b&Gc@7%I=zM>le{D%&#6(>sV9%Ornt~q-_0rM
z*s;C(Hf@S^44`=jJj1ANt6VNa(Pz%{aA5Kd`=x)E;N3dOZlym7q%Tr0Hbq<ZXfl6(
zMNr=2a=g+YTi95FT(7C!yHP9t40{Gw0I3E=`NiU%X$-z?!<b^hTE)I^j|1_)C`ZjC
z7UszX@m71qDqol`?#LK_{v!~O796DLR1ws|VT739Yn0;Z>DL@H0c#4J&%cf|g_z9?
zANI#T>Qc&jBD7tpwl$WZA*{_%COv-u<M%=Zl`9E??HXqv&v*gTU$!+1#b-@{&*2L*
z75Q$!(QZGQi&gVs<c+fK=2J9Q^|dLR+pi(RVmRwD5Ve@)Mo>f&q^$!4I2R>x^^leY
zo`v;??-!ZqLGDg!enZGf0ePEet7gyGvd6o)qMH$zn1`F#F6Hy*$@~pDFLto)61RX(
zFKURlvp9mV2z$$IRrL{9BBDaq)9yT@7ZZEmu`^=56sg%7LGqSgqwCa~r)a6D2g#pT
zU5*8?O=+D24Qa9v<5gRx{$7E>rFyo@g5nN9!Dm;V`uhFF;Pqg}$#IG0-_#GfD4t_A
z@5el>pM*hattJeI=}Wrc){!&n)b=Jl<S&bt2!@le+1Bshi#MSz)sneKvcf8-^-C+R
z*V**0P<2<R1Gt6*q#kL#`?h001rU8+-mg@%EXKM>X6RrhP>b6tk}PfrsM`pU%<`w&
z<CwATGAM0oXqhA$6_EK8t?(WWu2iySgI_mbc^J%)g1^PU!#BV^2IFH_9Q*79Xh{eB
zH^7jB_+&O-YMnZHvzsY}e*Rn|l3;9N`T%#I+9IKA%Uyh=&ZwSV;4jQ$81FM<?296#
z2U)ulAi8g){19Oy;n`3Wqrg3_&Lid$=~82llEfR=9_dJ;7c!OdedjQt=jB6?Q=!AT
z02L)qj1hqtz(FvA|J$8n{J4!G%v>SjS?&Pu42vhQUG`be?1}z3-Tclzco>ZENM$b}
zlPV3@(z=CBKfvcN+hl%-bYMaono^LU&GbE~34vq+f+P_oicuyRT}Og&;H=Jdq}hIx
z7l6(WNC&-j-JsxR`@v7fGnB&N?pW%)_>5vvcga`4P?+c<)3V$D{JAVk_y)LzWVbB3
zoFVOj)klavnd2bLt-0wRkaZq197`-3!g6N8FYUvV=Vr?37i!_{3&FvDfn<t3ZbQ@_
z(I1(5P=qOb<G13M-xnmzzJL1SVY}ePJZ&GE3*QeXwHzfp1pFRKr68`$gkMsLQA-d(
zxq;5SeR9GBB~j{Cfb~w+4U7b*0LvwQgZxO>uEi)35iy$}eqZ?Qkm&>w(LAtd0E^$#
z{z5}NO!6vbjU<06o+B!+63%%-DHrXK)dN!Hn*za=R{FXnD(uCSVW309`RG3OCf4!<
za5LoEb-5*=H@|8N>fo?xtkIkP{-*&k7eu&QS5V<N#4G8m?sZQr#QDQFb>gqW>{5R*
z4GcwJ`6%GxW0#hQCgdt0c=%&>rjz3hHPIT%$oI%9U<gH%M%(Q(-KTg?2yECP2QQ8v
z;D<s<N=sfW$0i>uF%wn0@2^e)s<exnc0#`nX(Pf2y%J!|ReAu_8Q_V$?G7l2p!35s
z^`ps!&|W01_~UO^fj8|5+qCN+bSYl)bkUmoaZq1}q85CdaLd|fk$kq4s<mBFJ-x(N
zNtz#m3SrYzBV}ocnXi93EYf6vafM&a>ilCIe_n1-WPrj?gGL#E{tmf=Z@(elKQ2CV
zZZH+n)Q-r1S=PUH9r)7peek#H0|htIfBVJ&q`M$--+^LE|0NhLUIYm(UR-7A{_E#+
zq#@9QG}`uGKMdXp=z4&hA*<HxFQyGe1Vq4ZPIDcH{M%3d_0LKyKZ}A?y5iE-`yCaL
zq(Z#)AOiCHfdA`VhRL9)ZLn>R<-a}j_XPawGyfR+dMWsM!L65@k$)Quu0#gdVtYa7
zfaot`@ZUcY{I4Jj7y!oQxV!ORul?VQ{LeSohETT0SyH|9|1*_;g1diy(+@)qENq*1
z)m+MNyYkOJ{6B+=5%+);QDlv@pZ{KA(gxORv((@d-(LZ%|MIi{diwuP>;F#c|M%T$
zecB29Y|)R$)zt!n$-VhO-J6fH_|pv@r={Qqgf4!X$0D9*dv+ZUUvh6~{tlG=7n|~b
z?MUr-@w!J_?k8y?ELBJ4uik?6Re{wE=KjYLr`-qXwsZkXo!%tUO~<AL`v-e_Q(u&H
z;>*?svE6{bw+*<4iKB#ezSx0)?(&32mee~)lL!gaG-ll<OJBVLg_2kX*XZ3(cStWz
zcgaBvul(v`*dd7Yqj_DPMBa*k;LQT?)|PyUCjRUE4U3{aZqx(>w+*D}k(4xE{7U=L
zE=_EW2h@R$peT*lZ;);h-A7<Cob!Z(!J<T94SflCtU=`;L8!veE8uQ7IW_J8$$VrG
z6&kKl%6>flO)Z#j-jk~yL@gHpskX9fy6Oc99c(NhYP$d)J^0xH@`;I)B1Xc8(jYzo
z5_HHO=~$Hw7w%;ciFtc^DvBKTb1eYJev#wsRewg{+QP@85~BGY(@f`yGhLdq!&n(I
zR6yMwy&cy8+*MTcH5-VNV<UtDz0ZvLQ#cj?$H4@1qN~vTSYHQ32wOo5RpKlVOA6~+
z7Szyu709o634XQ}AdEIJEo3P+%uw(&5C{@!g>~HMFdH^YsvWfSA!VkYqD+q7eHRpG
z;uCU$Bt7rIkBy}Z?C5BxKOB==^<Grc-AWHU+_H0Et@@@qV&VMq71lo3H-V_QbOG4Z
z(%)*`0(diwp-_sZ`$qnfAc=C*&4p#=cJBZ>!DEUoFv?e1@Kw}$T_YGWXZP=zAhbg3
z{7Btbw@c)=1YPL-{_(6}MJ>v;viS>d_oICRfOwNr&_x3XmgBmNGdN-0F^_?N;JeN(
z7<e!s%N$W2zdo_BOaeyK25Oh7kyOBHY5_oR1q|g!jvBEU|5M5(x=zs$Pl$+B1lvQx
zPjQ;zgwx^@y}F=yMM1{mx}C4b3^zcWvC!W7^{qtkgiaS?Rw@+or4)A!a^HmWT^?rN
zlH7oB$%M`tfYmvN*oNp(rLEvZ4ebxh1509p-~_dOH}KJO@X8OozBmpyrbTS^03Iy1
zrmF)x5c5m;@xTCQ=rhPzES=+pKpj66;RQ@j#a7Rfh2p(8i2I|((<y`v{Qw&*pNFmO
zw~B222x&Ugux6C0D44ZoN>otz?1awyQjhZBEc{H0GtxP|(Q<vl`hx$5Wwq8Ky%=}R
zteb?}$p-ymy^nUZxFb@Xz-kKhESQ}A#aocu@hx20>~SS<*>oa&1AHC-tJ8++nlzvx
zAqk85wjjC{aR~xi$s7lVz&VP+U*BI^^yVAkpZA`49o^&0t%_iv0&O6eJ%pqnHFNIF
z(Cxke3cs13G*I5t_qjgiNDp{}9jf=dG#z+wjihJ#xrRtOqezKwK$N>PA|48BhS__1
z12*sqB246-drvYqr=7p+wE<NOc{1SW)_!4s0P&5Qrb*(9RuEhwm#PQuLbeR&2`%Rn
z<BUqc{k!aORpuGRLnHCFe&skwBW7laJI+_IeO=E@p$z7C?U=uLRN(`ky9U7Xfn`ap
z>2ml|T10Izwj0p0zU(~pX&1<{U+RoR;~zj(7Z;`(vjNExeLJf_&^nBY`m^u+d(+Ls
zRd!fKY>Qle03^VvhG~H?Ya7^z54!|0L1)&pvFsal9!me(dqDozB?o(J@+r>H6`=Is
zOqXfKs6G_Y!c4R$szO_(5}Jm7cXRoxA#W;hbI^NCYNXOJW3$1~!Es3a<nSO%{WlVO
zYW~vyhdc2R=AC=iL`^j`-)Lh?-m+J`9MY1&+1Vj;_i)?0@gSO>b&gL3D=XCgMSa3y
zDUuI^f4sa?{1=b|Gq8bkm)r^h`b1pYnwpV@UHbw<r-8|`1)qUO@gDVPIKAUv(ojDa
zDc^4Mj3)lbPzUKReL~^s9ulw*+rWo8qQd3;R^CLQg-yW8?(uIiOgQ@ueoW{2#&-{}
zMFO%!Jc6KVX(aaT*d2XOv93Vw7q0v9uZK`g6FU(6#{bUYhl{d?ww8a;3@oIY?vSv`
zJVCx7<A9{BGRg9N7b$s2rE?c?06vu4&NlQo!fF*nqnQ*BgZr02?mIP>RVcLw@YXPw
z82hhrrZNi0gA_Bd0HCZX`y!g&P!ASly!e~mJ`(hp?XYH``Nq$tjDS}ICzN~31c-n*
z@`K`3OCk?IM6Mph&tLqQSCJuo*dfYG$F&QU02*S+3V(p=lCV#!iO?r@X$rJ01QE@L
z9AeesLT6BX4nRa!KNsrBSgo347okq}*RyK|k1BqByk0HO{h@GMKPX@Kx<w&q8wv$H
z4UAJHpvACbGl@jNRZ&mqefRFZKbcB8l=C-R41yC#PdGVU8Ncn6xcrgaaPLnp4=kTK
zIT8b<Y^|lgNA;9xIzgmfA2WSx`ZHTjH9L)X1XaaS>bxD$IbNZ^Ty808t4g^b-MeA;
z;f1g@@Z5B~;IHk;$O|63M{K41nT2Fz6;tF$x&LX){xw*RiZASnc1R)@OF+itwSU8i
z+p+&}D=Z}g4C_8p+F_P65U6ylk$ds<;0zLPW2o9HWo)VQw(!$O*(2hjymkYm_pq*W
zZWV^h$7@_L=cfyxaHR)gggvBx@OrwI>8jswxuA8RPU&Ga{WQ=I6no*B1zF+8)r?iX
z_vO_+TDv6eaQ*H;C7*IGo&aw>4i>7acxj&wQQLygG>F`9-hH=L<N9aJND$f2g>rJF
zVrQ5-DsseC0ef@wWvZl*H~NsUbBM?`PRgU3{`)RRnKKPo@J92uHE7sB61XU@vqafF
zm3maq5vYFRYr$f_K=`1HoHUp84kdc9W}}RrF;X4Sn^5s0+~~ZO?+e7&Cy3r4{|m$m
zk|C5&bj#<_<Fx(&CQWZF9VXujy1BT)w#ME>p=<+Jy&`od|Iw3{^LW1UohV>P_dvQ$
zATUCOUj##=*qg2#(0Q3ky5+I9B!|a9<Wm>j$cQJEb!z`nAKq3@4xlUW-#h#r?NDpb
zTv@jb-O@5t0*{JxO{pcJe*P2KnaBP-Q$giT{9}hL=*8el^c$4$<#>=Qy3$D4hZUmU
zi}hpup{`B+i`UtzOZl&n>eL%Te<7<s=_c-4nd(YO_=O6ae!+RA6XJ0;XpY;)6{EU|
zk_gJTqNt~S1(HYOsaH`QjtRbOSuN_uZXjvE*tZR6=7@{LU_)K@0;1N2iu?-!i%id5
z53D*-D0BcsGREqJ00zT`sA+!+gCR~v(rMR2%*8)-C+Z40dMGYJ7;~&FbyxS_3K;28
zm5cAfjiT!ynDAZC(L{U83=QX*KWRR5XwbV|@i{W)BYlDT$A)iTqDdbKVSG@P-gvJ6
zvsbIi{|Am73pPRJ<7Q2OS{4n1jSm)|!I_ZBR#58xK}?5lP-0|#nh}r#K)8}xQ0U7Y
z5_%N3s~x`Y-IHzSPuYbzpWFF!gDkY_II9{E4igj1K3o$6)ew!F;ytI{0dvb{1rAmj
z4gX9+Id!x!XHpOqlko9Z<|<OKK)tc{wMaBE^vc^FkF@Fm3{zrh0daT6OHdex^im)b
zShzA;gc+<#_^2%XIGTF*j#9znskVAPRc}S$Jf~5PYL@33z$?PQ^7S1aN-6rF0b*u|
z*iix(>yImy?|w|kFBZR`!<|*`iL;HMxZ7Ksd=RLR!Ow9qyk}2Y$<a7K>@CoXZWhTR
z?*1l<OysL3V!|<sV`W&2qQFYRUZDg=s8*Q$lU2;q)<aF`_kcVS+x!rONSuR7ojvRO
zUK;om!CiGG>t>Gh?&OlXT=aCMo8Ze<Ze`O<+H2&t^c3Xz@zW}WkQJV@Nn5-JB3FJz
zT-xy}%kQO~M3w=R5<%@IM|zZX7?hEMiz~&`__DoX3-16Zs6jN*vCA0gCuxa#mjBYg
zi-&ivW53`p@;%&$s_YWSfjAfl>Hh>7y6uenIc#RXq}a=R=&>5AdA*xbE(@zrfW)&P
z=PGh3^HcTo$0sdO4k-~{-EP$G=fMBMoK>QfEjpsoTE!s^{Bvs9zTK}mj~I5<dsPJn
z99GuLFBv9HEcijVlv^@q`jmw;r4VGN+#_9v&5tzx1g`MtUEK`6yBa{fC<MuMSm2Dz
z#idU<nBfCF-&yYICCyF(b*^|J-DC6N9J|F(`p#ySc5nZt^w%J`$~S8#(JxJn%a(XO
zkd67)255FZzr0J?q?e}TPkM-yVsG_PNd=LVobZX!S?T-rW_~BPx3_Dopuz>vqOeeC
zj?yQHv!iF@uLQ)upq?yaeM+O{SsC->@w;WA{7AyK#WCuo-y4L&uK*V;*k3ogcKp`Y
z07jFkA0kI5dq1xe)doQt<V27-&epSzc@RVXB~^yIA*n4!H3jl~5J#T$0JVkOjEPv0
zSFAj3{<?<@Tv4CN2S_d$?orVhN!mDgDGBdOp5Q6|rN|#1M0tl}Es4!uIsA10*H{X*
z$t@Qh#l;y^UisS(+BG>1Nf3{-M<ij8!OtxXy(%cieeyKHS{p#Nwr^@mr0ZRAu4l@m
zz9_#Suys<-?EE$)2sQzEaKaMut7XBN!9j(b?$41v!iT7aeREK@a^7HsMa`*pHLT}`
z8wHU}xd{h9F3-W<X1ETL_>y44CDz@YmyizmEhv<7WTMGb@HRmih@Wr?p@dbC5=xri
zk6lVI_J6qh%djfjtqT|yTq4~_cOzZW(k<PR(h5j72q@hxjZ)IBAR*mSBHc(S-6`LB
z;eGFCAMbbXy??*&9}W&!EY@}AoMVnL=14Ht%Mcq_l&a%FnK%NOX^VUkOwbdbx?;(w
zpJ+w6%ZI>!Tc`kQHx3K&Ms~?_V<mYgq*%HlClGDDCrQJ|d%tsqFTqJg{t!_16bcUi
zkUvvJv%jLadhJxd+W6*HnTqVn*uV2twLG|=P2>yG<ZK>4EY4VaCpi6sGs45%?e&}<
zQ0sJ4qa1y1Ou3AlGlc5WMb472M)N#0<dSPhi0cT{B)q}sSC(ixy{}AdAM*JdW3m$Q
z2T_wC`&vuSS+_$w!M*#4!pj5&6th?!iZI7o=?bjX00OoctT@S*=P<!Re+jR>#nxk`
z<lV=~yxD4ScyMRA+6Ih3w<FbQ4i>Ew1ioUyQas;4Hskx(MPnWcNUk<tz*3)JG)Q02
zZe>;O@PG#N&H^?bl2xy`6m5|JR{9(X7!qpC@X=L`z-Klx-}6g2#%DpDf0;^NNe#O$
z4%9NUt03<7{F?55L}t&?&;F;#%qvsrw!-QlQattrq3gLs*L==V&x;S*)=e4Eoe#n*
zTBI6})}2WlWfWo00fKqbLzA~>+cy^}iH-5n%!&bXXZuFMl-(rrA;NPt55Smqw*-nQ
zF)F+!r|K;Snf5YWyn2O#xeh@c2jY9(m*befHcDHJG4`VzS^j|UPy`p<0#ywaln&CA
zZZJ46zW}y`z@xZyX6D>R%vG9)gn2;>SRI!091u^TILbz(ivr4={gg1Gi!2}na!
zg=o^EMrEcxSlnxnUkLjJmT520kk~oK9@l|EWkDKNe>>j>Go?=d{@%>=KsOPmv(C3G
zE!oi1I(v&BP9GK+O~65gpr_g#7uO8BK1OE(8l^vWY9bWAp~dm#4!_s|1-~LUS@@M+
zJv!q^<~1{LmaKB7l!KtRVt}(Bc9D<?Smc{Af4F3#IEc`=ML4mAJvOY}FiKvn?syj7
zLEiP4{HS~DS;133QLz4n^$Etz6yzMN!62>Zn~f%h8?RrXR&3;G+t$OM+|pja_+VQ-
zg>7t$-Joqj;e%?c1Kr_$dKB7-&u+VhE*|8Zzj`VfKtbIUX?tKv955D!B`_kf77#<A
zjQ3Z93-vR?U<}&$-ynzWFm&IXgz>U89gU9kzOF7v7%4Xc_<lGoFXPv-7+vgYN`W$P
z*;K)bu(lwQ+cV`s$3fF5xn0L9BRjxMeVaE>1(L}}A{f0Pty6}58)*sh_i$$S0LeRP
zdH`C!^t2TqA?zNFg;`L`ntQ<>-IoK;*=;!>Xa60P=G51n&E}R)-*26Rl#xKef^(<D
z4B0gi@s>R#dI?w{1;!K0H(?+pg`gdXUC@Op#JL{_I4!K9Z_WkgH)p-`IW-eFvu`s0
z#zRFfsr?AL-QOtp8K|99C5+%ljf#gnGrN9d20Ox>d@T`Ts%9wof-jEoiJY7*j34rF
zKmo~LIH3nrl4_}ZQmzmC(umd5p>yy45CCorBhY1XXN+H?{Y3JZy8d={kN!KTFeMsj
zzSL_iBg4iAQ(}$?c4_59LNahRI1zA~$qtCKy3`#tO4Y6C22+m461F?V*(9hXWi};n
ztzC1Z`RhOTg49eI!J<V;Et8wTjR_Ut7|LJmn)O<vaFoDxxqn_W{k*u7_u*MQL<C`X
z{L!Ps`F5YdTmZ;Vj>9GZ`y4Cw7Spmig-tgaTgnZ%-n=ZCM+2WkRp~j%yD$*lBopY<
z(gO?}RYpEVacbp7Y&gFkV>A_gd=DZH+(r>6auob}8<)~QoEWKJyxxigyfn_?-5g4V
zJVxSax-U`99!IwCX|QP%**iWpPIey@7Gw$txSVxtN@9p?0a9O-nB<Vqq2eScYOGXU
zWkCRnN*hB~M)E?`IX9Un(07ElJuBSShb9N`g`%|J!&yG+Y*9)P2dD*61D=9qIrYy{
zAPuWT-2((^f{eMm69x41Aju}R%X&os2Tj7DqR=Exlw*8?Rj!693ri$5F;l4Srg!1}
z^*2a3;((db4p6SA*2y{o8O=_so|9nVQi(r;o^N;!I<D-7d`>WYE?Bj`k-0W`4ib5O
z<yCNZ8vC_$5I*$s&`3?Dp+!Ex;FH~4n?#`Osda;Ms8S9{8mmK$9g$rdaG$%814HX2
zkQGEKvApL#bOq;rFofI~t{M3X0wC`8V8phXfdM<;HqqQe0BsTXKTG<o$GHntlRZ~r
z)n=&Pe+A^FJgrW1NCl$fz7%MB(hc$?yyUs3_9_tURsnPw(yB3md^QB(KO(mTCHYB|
zr<jE<b~$bUoY=u3U$})`bpHrYh=z^cFt-FLwwC>Cd*W>&Ml1?PSuzp!c;uLo=(-Cn
zFz6;{#@0N{wuSo$LjPbeLV{mj2+adDl>k!kPNo&jBd|hwEh$_;DdKPGMyfmMn|e>3
z?t!Zor=^8p55)b92zHvEmAJN;upFD9kn=<tx<r534nIaEsIdkIznf}J@x23@$-knQ
zT7}T^&RUlsQ<~PDQ2NXec-{HR4itPgM?{NTN;MfPIM~`_T><GO7{oZdke$5A#_&6r
z<|v>W;bAo$4z>?IRJe_Aq4nZ}O%WgI7#AVIJLmk3pfJ5DK4Gerv#)AIqL6=F1w$|(
zk?hsgzTY82D>HFP!eIT+qT((ap|$$?)6Z3;segL`0PR4TIE~proSSpO^#eVtcavGk
z=g<3CfHcJsI-L^{H6BjpZ3Cn9;K}k(o468Nfc|jUFN5>)C90mWV1y-AqBcO74LBG5
z*2z}icqj`31DQ6EIi(4ge1i@-8qqvD`4k+)VU>pXwfELh#xh8X@(I+<`$9hm&p|4v
z;Ub6Zs%hd#4c(yIsiJB4w|F>->)1ZlL4&DCM4N$AC|l(u)jnoHmbdqrjs7*_+8Wuy
zH8EWbOz`7pP}4Mh?O-@q0sf~TFX8TV?F-zYsK>w0>V&RS(gR4>WzF+|n2Vr5UE&#n
z7o<|kel-9X+$5k^7k;m^?Vmdc+7G^ni-`G_*yhs!^=K0Hcn7p=UBnxJ-nOMH!>%lH
zH(K#g)%02JzzhHiw7)-j1R}&cU4%#Vri#uzl)-P7+Jo_<8$fi2z^MT&wae<#$=r`j
z<&rKYV^cl>SBD3kLY~rCwNG3PYNzOtT|<iidqk8LUM|G60YKqpgHDVMY<b>{y))I8
zLoJthnol5i_eZ+VLTR5BD$akBH-{?_aZTtH0$JPLZ4~wnfq6WT?5#`^ConMpac}gm
zE1>IiR)QBYg-CHNXOW{zkmc6Yx>}|RB!L03@-sSnSJb2h)~}DWDt@Vbppe>wOKCsi
zrppd%?uHPUy6ulMqb3i1fm~Md2Lf~oP7C`3>6DmzcWXnSd9u+vI$c-B2D>wq_BNLZ
z{i&TVEhp}G<tlD9LO^d%dS4~s(YqhGBe4X>b%Y@RTBmohb8tj)<pLFrh{4=s)S$b&
zkiLztucxG)QRc*m>6_a6a{8@!30l+!SS{9$K&R8GmSlDUAn{)u-!exN`CcQ9zH_tv
zC~3}nxC2@7n^zUrZ-Qe92+-TWVS_2f-@(@<jTmy|yev>p)<qK%c)pJ{@&gj}?TY|X
z170&5Upqb<UzR;)<pKnqN;Sw&6d7xW#z4`JBy{#}L+UJhpxx=R#P&&*jv^uCG9Eol
zS_j_hJH*YPZsB}()+<Obv<V!_IR-%qolb-p>7(cmYK7DlY($7{kdf8`s2+sX?(h8k
zjEcU>B@Ocj8Z*epn?|(mU9z7nPigfMQBR^V9bu6<E{Afw;3LI1!dV^jIN|BS-6E3c
zw}lSN8fExxalkOW#do5@9I{>!cKMu0#aq!=Mu}ag6rgi7l*!?yeNo5Wg3J;g0KAl7
zB#H}}`bFe1U${LhpvR)Prbi#ZAnqIix0Q;jD9r(q|9(dsMR>C0zizfDF=G(3gymI0
zS~7NE$kUzHmI7HN+$VW#HfIT;X5k|<5%@h8#p5Gtz!ZceJ!^}<uU(ani!g;j(&$_8
z>aX%IO5wk}<DPV%Ar-iOj^6!pBNFCJpKdSS6qn`VIyeCGQe!?qS>=|^<_I9YFK#9X
z>P>fb2h8S7gueBpN;oU%x;aR#VGKR3I^Z)x-usd98$fW8Q{51=(&7a@n3+L&ievh+
zli&NhxB81Ta-bG-xJu+aWFpN0?^$Yyc;(xmVt8FDF8aV<(+%&9c$ak~&%K5&Y$vbV
z<0M+N0duS6GgK2O{WQaYZ5L*h+#!H&|Lt)(5G-9w3MIXoMu4mO1wpcqe*=Tts8)m;
zG9U;=r?}c~ex61qFaOJq0XQkdv`SN8wMv*>SSl#3?PAGr%_t8ZO!DP1`tyUd{>(^X
zBECsP-Usk{8!OG|2W`@)p}5`uqoiM48|c7cJm4pn7gF5R3=m9~q;YQm4W|CsDmxLf
zqX!#T1Rkcadbjqun13Y@gw*M!51B&oY>en7-LM@@kiGnq*bTe!aDJ?N?R$eyn+*sZ
z0wR?S!SiHfjW?Nm+y4UV{*CVN|M<3s*WZ<P5-wb^0jiHk^KeDm2R}(av)yv&cE(<>
z5+@z$1T~S@DK2+L{~v#O`$3?P=+A8qoeQY`uJn^)QJJp)Du9WizcSIO+s$m)($&Ue
zxuppI-|PSFPyhbbN)CQotwO;Mb0<m9bE;yP%BPLQX%Nri?K?01<FAi!+UQLmqvtGm
zaz(g%)QKCwuK~Wze|^Ik(KPDevU?4@GT%@jg7W`(F*Opf?7@DU_BSZ-pI@Gx1W`WZ
zzM1}w?EIIP#)6j;Aq{-}JMw`dt$%*GiUOcu)aGth{)gZH+g}aKf|o|Z*4F+f0|Wa5
zEnsWtjUMUz@0VK9fR{?cJN;L)n?E0aEDjJmSgbvn|AvJB^JnIUUP|p>4-mtDdxC%b
z_Bo_RO5zqy`rj}8Te$RZL>y>y{L|pp0?mN7LMoZUfB5~s{Z%9+FOW61`=j#yw_p7K
zee16Wm?g!uPoio6wFUmu<M~TNq#+viN08?EAD{bQKLyD)Q1`^;cmIEMxz^HFfQnKu
zWNtA4s#_*)Z;+NC>NMn2WUIXVucZAS=Mfxz#B|Vpu5UO+E&lpRL#Jp$+@zUs9g*wF
zBMHgt@3}AAE{$GcOGglsW_rJpJhN)Ev^{&c(U|NCqSavAPjes9{UBF5h;dL-T~f#e
zWmh^tP2CQ0S@Y8!`}RPj7YJ&A0;oXjUKqTUaJda|QdJd@^DDGlW}V-t6<o<IK7me%
z4M`XfXML;y@m&xokMQXO#XV2MAtVF-o%tJp4NJi2+-qvZ_18E{No5z&J`u#bfb_9@
zAWgm%CwT**4@8Xs4sGNR-QZTk4S*k}2oioyA>f$c@VS-L>0y0Pv(IJM4c{&ZQqyPJ
zbfGPGL*3$31oUG|K%QP4Viv}jj|jpj&qZOtTo*C9I@{krKLN$#4!7DMbaoJc2SGXo
zkz|M)LGXkB`Phd&kVU@%Oo;k-1_sb=;|PcrN<43hAUXDwc{19=(i*k5p!(Yeu5~g)
zP#Z1s)_HQQybYL)CLk!X+o)RRK_%ubX|<(0m51L4z;OE>n8}9`z>dc;YjEXuh=yU)
zdB(vipRVJGgKE9lo_<e0?0LJi6r{bQURNBZ)o;_$KQ4uDfUA50IxD>aVgX?YCfpCs
z!2h&13Bg)XKp9X00(zNutglKy5dJ6~NK%#nWY}NsC?aDF3QLF}_IA_v1Q~oVB)0n$
zSp8?Kg7nL;vYi~*u~qcarNMww$G&f@&3+UZ9NvVi!~td|FGPQ)#Q=BnVGz{q0fBh+
z(HS6Gw}GxyBpDLtE_|)ZfCs(7&|7Z$<u$qh15msYpKBhk-A5(BJOK-Z9pv(`sL<`o
zZZe2UQvRtF1u8-*+)>S<fMupAur)cuDrX)00|5q6%Zy7hN1x%WrUU$|e%T(jpDqOB
zp!^C#C)ImNisEi@5RqmQbaQXR;?eT?5fGH~Ux8A}S5{ZRxY+msOFc+`jyMGseIQCi
zOEvRLK$r001B`-pP)dt4!b@GrTGm$<KGtY5UBlN087ssp=wY)PIR}r&6-8ce*fsVC
zGUUz>ZNS;$)w9am>&E+ts;<Og-uNr4`7J>+@v(LK@BPEjeW%o^&w+)O*9*qYFBS|P
zrr5sx#%3jQRj6}2s&<%vT&l1LLT(hW_H~(G_bSYQ=uD#;<)WSZHzs7kch=?(s0o4h
z$-UX74ItwV6Y$DV^bdg3Put8szLiUQB+B;-@OMl6?m`rp(!Qw)F;(}cx6?K(hBN?}
zC`+JM8Jj=`)SPk;G7tlE{E2Q5gM^3Av4^e|aF_wS;8O>n_BN=D#5LX1mZNxf6<AVF
z>N-hzOCh=pQ1=3Sq$OZI23+<ieryABl!H*GuLceUap3g_ZgwDXulS2pP%!9gZ82?K
z5Q)AEL<^j(7obIz>3Ba_j-+;VO9)(B*bI+pheMI}3?WEOI@Ye~cpL??W01&+GnT2K
z6H5zm(!Sb$xdf0rbO_Tr1M+s_;`jFK0Vq9h`-uW52CbO#DF*j_AAzV4ayo%vzWeD1
zX4BwIa-Et>2cl;IO8+&Hf<8*>m`#u>h7K{q4+8D^8UalUS7ecD`YC`S5YOrl#z}5)
zOHC2&y2&1D2%Xixq399tHjJQr`t3tfVDxU4xOx7&Qg4>h-qu@Fst@;|0MGW@%O-aB
zLb(0rc$H+y&q2n{+k#%QZF4--JLr$1yer;)HJE^hxo=WE&k*YbowN+9xlT4lsG+=)
zBW&|!Abu-EKOU@P+=bNtUFN8Cp!J%%WfO37_;aB-lfg$2+y7qXro%y7V%=r7V?`q&
z0FU?*_Zx$?hEl~0sEoA(HWp#O_Og5afoK)v?P9U9#QuI^7aYauT2lAji}XY#op`a+
zt_hqdPi}=m@L~?#1F*a;`wnVE&Peq>Y$rldC4fM1T%JLEjks)7k|9RU?Fyj7$rOVr
zK09B>6`uv~jD-n@#5)N_cG-0kW5~R(WP}&4`xL-sZ?!r{QyINd{Jw(ZyR2>ys8s+N
zDO+A#Jxd*J<e7dA;PrQ9!)2NzJW~GnUF&IJPLu$X#RS%w<U`;Ed919ud<C2-L%zSm
zyw7tR_H2;ArX!7IEarS4+L3-q+?9@eXz^Y1lE+-C0VT7c_m<_5zYQtnD|)EHJFvqO
z^hy%*;Ly6CLUkjMjH<2=e^cao;%v6Wo)b*A%JJuI!Kez*`$MXvB=3$*#RtAl{f_I5
zailVA7*ypBTGSnhI9sEWAvTRrZROR6jgEP6nmv<z6t%748D-8_*PloM1huP--)exY
z27wc?I!Gm0w)+BNtzq()K_P1oP79Wjkup3hqd{-=o2|NdWf6Y6=@?_TKh%b6zC+=G
zDG%W2z;tp#<L<v@7~yo#ES=Ap(gBo!_Q3g6;!ZnLaS1k;BIq6T*j$?*R2!W+LBU=r
zQGy4cPk{hC;IueLCljjs!N(Z6#DF4a{{D6di>?yXl|rc~Sd6&;HH3l2GDDvg5Xgx7
zjd`U?6pYNVw;7`APYo=mzp?sTw+<<=*3+Onf4F%9DoCc?L4ZI+Vb}`c^Y8tnbNSvA
zvH6W{TNq2;B<otF&?cFCgPJ7(BMh{iwep_!2;@OGYaCC<F1R&@0g^I#AC6v+=Oe)U
zyQ?0W?a~Glu;m%~9BVr7nMb#JIP^F)NouJ2hFNp~qKvIDJ>iU6Um#-XU39+e`C~`)
z_fnyw0>E{mx*+u1Q6vGdpA&+>I|8r65w|EC|1mGt1{_)<t0=`alX=SfFFVu?L)cgn
zI4If@L$sT@P%X(~OLZmgbhg&FA`rv+cot)z9Q&4B$OXsHs@cc4^AhFt5DPMvmE`QG
zatyw^VOzcHUs*bPJ(Bb8yfElxa1$yVi@B2t`XQxe#w|!zT^BO6ykszE4sBtjo!lo@
zv_QNZme>K{L!lcBOkfGKtx8Oegm|P>zg*YXsh8-7@8-TjzQK6NY}Y%DB2KYeHK_mK
z6TfwJWL#OABD^g%m&Bk<E}?=R<Us_@d_VZX1`xJQ^gfrHr~v(sy5pJ~**1rjG_Ddv
z*J*~+*ERT`MXb07sRsHj`dvB2Tr(&rslef-fB2D5QvaLr$~XbpA|k}-L%nn@<CO+t
zxR4Wo?}rH3{gn|OqvwS&mMTq|M0hPtHGoo(<PFJ?E`0x9_-dr#dlZ%$m7~ooP<&x7
zQ)=e!nuU3(9EVv7PKagC0#fD*!3m&cvhJ)v3=983C5T}0O3$Uc!gbdiMb{;AsHFc@
ztFYG7is6N_r|xD0d-mh%6RX;Sk5iBU_KczmV{%D_ZhmRosvSUiL_1O!YZRMI`KXZW
z*+8+QBEa+zc|Wdu5pErK74e`+PiM#%^#_qUHrKI!i+>jdtQ8}t-s7W#K=;5nOF=p=
zJOQu6at8rvrzq_dWD1FiS)U0ycDXrJ#EtLE)vN5h{@^xv2xMuN+A=1#z{@o3+MI#*
zHFZoJDq^bStYzd2I`Kp&N>^;#EFJ_C;G(W6gnw6|L$)l#5Ni_D&-4l!VNs9Y+Yrv0
zSTFYNbI6Bt5GcHEs@uEyol6!p;P`SY{v_v3Cr3Al`nuQGonL<$OlCiTxiXr?V=*5B
ze+n2$Gr>wQAxNp|Qe0s*6fq+x(Gl2HGvG=+8c`4@`m%CV)=w;^aKzBMA#)0D^Ulp5
zKSc7`Ef^-aVBK=SQ_ECYBweW&F`FtoWML1A<4+z~kgm|CGi-hmw%vs?a(`z3=l2BD
z+Y^q2!L9pj+~I`4I(6}hrycOIt*>Ne>qk-)0<8{~y?Q|m5YJnBC|9r8XMugks<%$S
z3PS#nVMRVliLa&Dd3D>&@PM|ei}n%Z)3Q<>PL}b|QnG37q5z%$N6ZF&pT!OqcLocZ
z{y{(=v!a;cS@;^8hW}!H`lGIFU=A2~^n}&ij92}=@Qbs!Jw`0tp=uG`gFMP{EdAf0
z&jej5lkf6F(~>K2=iw#uQ$lzn7eqS%JdtEH0cKwrqxq35Y~gQUew~euU%|H<N+>_-
zFAKam<}wz0OPNZ%^ec$i4l&ut*P{{Huqs5a4U}-XUn9MDHw4K5I|wWhNNmiUP4W<s
z8P(Di`49*T0g<GRl0F?1;Q<0E-w-e+2zQTo{ySF;VMYmfX3W02xrW=1_3z9HT>CN!
zF`j<|;;Ce8_^;LZ5bR}<P^M?X(rjrq`9w3=1_{v-!8q&hO72Qq-$QubOYi}5eDKFc
zW8}JHNjxEXBm$bi9jQ+X<<9dl8&f2Zd&h3d2%iA5vE;kRZ6fR~f;S`8@MMbA7LHFE
zxt*fDC-N>-at%d7GR#!e3<C~hSVT1*q$K0(+lxg!TOs;$T*tKhplErCsYKGj?Av}u
zN)ukHKq(tyjKjHuXa~admqb3EB-kLabGmvm1CC(R4#%GkYE12{NS5g#cSwDy54-q+
zD2Tf5PmS6~JbGZ@JaTratl`YK;+E)uIFZmdQAs+*5Wxn?VK*Y)r|Schdif>am)(da
zhN0d%IjGbDNJpjA>FbQU%n`>PUl`5J7E}%1xaDX(;Jc@V`9==YlriU-oM#r~krnQL
zKkuUpa4Z}?N7T4XXOf{i*C9eiHr|qa{Dk@GJ^%Byvx2yxds#R`Vga>;ha5^Yi>R-3
zkQbNr6PW>PKn9N?v*FAJF$pqb^B&|JG%E=+S}P0ak!C0Op0dV<=#7|sbRh9|woYZ6
zkvJXH*H_YE*-lD3!TY@HH1-+BK7%gKl=e^m5RfoI)$!AlFUM_*c?e@P4Xi#(fK!o*
z<rYjV^P5eLzx1%$95I(@;p#*3Pm^SrAc<9o!4x7D0%l`J?7c1wk-O{&xV;vD^D6q0
z>@HHDE!7#Ner#VfbyOxINxWnFcRgUI@iu45qfbELl3GbMAnqVT8^3Ch@71_{l|xo>
z=|?>h9V|j+3&Ny}b^9R_LBa`TCsWB*&_1zqK#Zy+E-!))A?gJ_)n`mP{>QN=sP6Wd
zqo^XfpM#x+sBRpFX>(BN?zWU5>M2#M_+p~evm*FxrSZIJ#MPAIW}fmSp#7vq^MGwJ
z<hAaKRC<Z{`-{*IwqfzyUP6EKHCJ!>HP|@%ulI>V_b-F6o_u}jWJ>KDFWTi!pI8H&
z!cDzJ>z~_1@{BWFUM6?Rm=!HJbdx%GRgEHvzYn-0Za7bXLm|H$@$MA&OLgxk!JA8(
zU*y38rgUA}jK(1j2uiM9>bKx3IDJT#_{=>D+7a`A80017xh2}rA?Xe`ash1y(?=49
zS|d-(XQaCrNtzF(dd;yn8UZCoiAOS6UP?o%tp`3QQDz<iFH@NQL6tv8)gFO1?Te^a
zKjr0%@!<*k2u*o8BanKEy5fvaAsO#;G;a&E8=N7Hh;?4`>FT6D-0BF5a*cEUbNK+$
ziN3d~EvF?*^rl-1kF8-sf3ERqe`B{%0k0tQwGDOkR#x+=rla1prH$a5<hj+yK}obK
zrN+rFvgYOXOM&?4kjzj&A(B&hX3_b5x`kt1-m2LiB{I+Wev%;tqqdYsaU<5(P}yMn
z9zS-Y&vDy~Qi;z!)L*3w{Lpz`rIavA6u6QbAu1^)`3bmx(QkneNOe)-t%7a{D3Z(I
zUWO>Wf8fChd-S~cn-{B8S{s}USsNi+E2!u_%{Vse0wE3l^S%JA(m)=-6!gS>SEb?c
z<c$P^6T#FQ$xTzUz1Y^4`noTT4$TF~gl-9<tC_vce@heMU*GZPHET0D+M<9b5{p<Q
z33#H!V77XA8OjA;AX&?st<rZ1g@RG{yGZ0<HnJ7emuRsVrUKjXk1ZKnSrb?Cy=j}2
zdcyjNPQ`|vqRN0aB5@fS8?O{r;UdVq_?{4GWAaJF;J~Q?sZG?WxZDsog52dLs4h6$
z!GGs#LxRZ)i+flu5vuo%UTSFpJ*)hdr2_u?sb)n#jsu|1_F#Wl<4>Gx9^>|<=u3XA
z<?c(Wffyy<I$;z3G7R~?S*}UK8to+G3xIj#ty57^mTG>Wl2SQ5xQ7+}D_dXSH#PjH
zqJ0P2R&*o6mG;KGOb_M)=Culw_MbN5L*`fV3DHB^QbnL3c%2Y5L_DFiN4PTS*d%{=
z$#<)y%mLR7q3eW=tIgZI7t!oXg>G%pSvPDy>+6l=vA3G9?7RuQXJXdK2CvgZv+Dy$
z3v$zu?~?avQWDWpYi3o&@V&J%R)AsLWs)zUh{AG_%h$us!z|udQ0ucF#v)Bbke|Zu
z**cL6SvF6wI(AG-e{GhfIzvqTlqJ+imvR@R)RCv6=gQ#ykS&ZHzZr**YE6X{LCNz;
z8nGc}pX<Yf{0_A)Vk-LXyfIW-%*h7|kqHjts-v98C5*tuNZIj#L)6SqevEJ`98I@x
z*_1uGX>Ciyj3DNos5JbI(qET_XerX(rSu}|m)0YFS{+*R*9A_rlo98SSl_K@j`%_5
z)48B4QvGGBBuhVl^t5gFp|BX{1?F6jae)xdmz#ueQ<9FR(cL8M)Lu0tf%ln6us(~m
zYBW>E3;9a6Wzv=V(1sGFQi-J2Z)F`h0Ms=rH2CjA1xyC`R3z|tE0h7~d#jiolIIHW
zwU8mo1lFD;($^B6@yCgC$<|C{_OmwM8I!)f+DQ_(AZ;C7z0$BruKgjwL_cYMx2Fzc
zFzu1Id`LnBrMe5^$3mLP#0Kdip}epsQ$H2Y4+U<gkqcs#&XLY!VCAPj>r)B;?J~vY
zn)D<I^~=?T!sL&vSA(psp92xc#48jwFQ!n-0jYt@Vjc@?$oS1o+*wDdDmigwRO@#o
z!EIaxaW$r}kYhDzGojix(2>A;@ihUjnXCsEAAgs9(h|2q(#1xu7{+UXD5+BW_vs<e
zK|y=PbetkqWeObKA$-K~pmgrN1QZ|9w56EmAv^N5Ls$<&`=~x6X<08MlqQqcfla)B
z@U@m=k2WU)E(H-oXiwDn!hA}-FM%^v(p1wl#1FCjFJ4*pIIIU#*?bBeKrr?|fjcgE
z?~A`AmK#Vve$Vd{>-P4Ptb9t$rs|WmC<WFvA<sBhDjm_W$0<2E5we42nT9$XcY@~`
z`Ce9a?Xu^6aA05ox-J*bg-QdW=vA*7^XOQ4yw!edi%*cGXd@j~<nZQjKt55*9fMk>
zG9izNlJB)g(ld?O>>D2QE5>!BKDAox@e$4?;K0aSo6--0OeOj3)O8IWE2|f3Mayjf
z8pOYT2(ybvl8Mo-%0DX@ZT{}fIZm??Vc2d~q*?XjQ{Sb}s4pn8zqz$&&;!2y8Ne_6
z3Pll}>b<=^Y_(LQx8RCb8{e}NB6xAAqqL&r2+@g?q!^+mROKO${^lzS5vQNo2C!*F
zxYzN|M6HSQE1+q6W?ce~dL>S(sot@iH|G2b>vVe89pZ#VW_+ja98cg$fej5I5;4J2
zhy-HJ7#*S8QMttI!_$K>W5C`Jl_9)K62-R-xx^Brbc)8q(H{>oeoH~HV;&l(d?{O@
zFfpjW86_G8nou|ubXMZhb>~oWN{5DMEXS2}%3p8VOFHiU-;|yCn3l9!{{F<~#TpRs
z0B}27-cm1Q@ivftJ6c$DOS9pLk{kCNx2HM0R2s%aw~CmjgqU2<rXj12WWe4dYxKyO
z<raHHaH;Mn@ZxGvEh^R5-K<NMC|;DX2u%gf&x^J?6ZO)}TE9)lk3)<xXI+D-wwK_R
zf)azM@e5HVHzyj$KN3cpRCUz&_2ip$ZVoBjkQ`@_g0AO@+TdGD<HFM~e^Hf4peSEc
z;&o<sL^Wc~d(QT~rS=@7(0wdg8bY@bFD_m6Yjx`z`K+V<m3sN_)YI=ZJb%-Ei4HKJ
zttz`UkNx}?k!$?=K4<-)Aqu!lLt}%Y-2?MbdD9K)uZ_MfTnP_vB#p*{O0@5Qet$U|
zkC9x30@iWj#jFZ~--cTm3;!A)d4PTxFKt!kA>|vW%IzP*!i-k7@i=%<7N*VLdI<3W
zmH1(j>CTO3al)bx;G{iNbg;HR16RgQf7+<VS`^`fDjz4E6R6FK4<B8M6B=P2GuAFa
zMO<u4trJG?qD02=)pfz~-?S3FuohCcS*$hS+5#B^cW>3Gt<%n=Evx`CS=FRz*_bP{
zLaX5Fc(R_-f{^cFA?jWSj&jEnR{+XSs<V9&Ub)|erNghv_66gx@C(kh*(FeNUT)`a
zGt__Gb#5lN(;K2+fpw83Oywpg+>(c}K8#~2@y~TWc*>lltgvglNw5jT=Y3(Gjrgh#
zuhr}eAG=PA_~ajSqJ?@|KZQujgEHCE>l#iyG_SC-BDUk6u-<40h&1ENCsB`4Qmyq{
z<Zq8!9xwt%5Y_EN0cTba-2N-50lYDT%R#cwC);?27eBt*AGIfc`uZ~ewUH)7mujaV
zqh!Ex=|v&avcA*Ci)fJGmpevF%T`>;ednRJTbfl7WYx%f(HW}6R2Ay$rB6ShUxcsZ
zh#bcvyS4zF`hSKPY`tETW>f)mOgVL?w#-Y)&&aWMz!Pz#6(VnS`>6M_Jui=M4N{SP
zaEGle#0@b;7g+Co1&MLx<^kv=waj02$(~`Do<hf&q$tXargKOb<dFBb83l{1pC9@A
z+-f+M^KS*BIB!a6l2$*-9bUPrUwla4pOG8F=t5*v-<fZ#Gu|+8>omapy5S#JwQ$%?
z`C$#98j+XkRUvT`i4l%tS0|&zNpWe(Muu*);e4_*e6*#I-F-3gkLccGmET1EhX6<K
zFLwpe$VLaO$mI<Vff!GeV{0U%d#qc6MjLraICGV3WdYAFSKfvBA*;k{j7DKD&MVUS
z&p<*EAX+<Ah~1!7%aF)J&mQJv{t$_$`?1ssi7#E3)meGfw)ALVo&yP9#AI`v=4Ud6
zXIfMnx9+4Y5)dzK=IALKs^N3dv(4~OldJgMu{R*_C?j-mt8@7AnukCCzBLJy#>?|i
z3azpn>r)2+HGo*9BJxab++DLF$}ZI;rWbr=3@@Z=yg$-dxTdLnON0r^Q`;*ynk`qX
zOnL|c4VkH#06H&%xQFUX$UKGZ!;t|63QLyo1VG_7G_F9y7Kx#Nvqyz0YT@~f=PUMx
z7Y8G0!6HrxBQ%a#w$)Qk5L+ob3%!lj$ChDLPTFuBz!W6m+l;@YvV`Q>%_2oyAeUHu
zN$Vl*CvQYzFKmYD6%wzg6rx+L`j`jECanJyr$tK<Ri35#R$WDnK73#)Gp=TFzrU)L
ze#(}JYYy<@qT;LO`uH<Kv+3e4Dg!FqL`@V`d(Y75F@rhO8R@Yvsj1YY(;V8t^1*@1
zHR~1Cg90z~yWHQW$LLtzw}kE@DbNMVeLBkRPNu0)d{q)W4r87&oxSI$#kolA)P(b|
zUx+JTA&dXe)%<Bd=Y<Y(BL6`-3gK6EUQB3-*v+Z(2n(IS{}%J<Ykg2?<M0#mDgmh}
z;wYUU;luAY@$2NYUy*FG?;)=j{TttRhGKZ_Pbn0_Dn?WH#srtThv<3JW|`BN38O0~
zhQGDT;E239*%uOBK?0;bj<@fbkq2|RE81FJ)!yCA)EIp3sEV5!O-6m*Bbw&<vv8%K
zbg&fHU#Z=RikES{qw;OOz8MeH0Eocs%YIcT1LVw%cUfBr={->r5`N_2yemn_{sa|3
ziS6qAzvhgvAru&lt34p=C+b5q7S?s*Bj%twuU{z1V{WWre(KA`0`{Q`V})`6#e`Ur
zxTEu^>HU2y2XuM{w$;LDQgkt*-fu?HsN#IF_d;5OHbBWnki~*>RH!~7JGt!ZU(QIP
zPKbLA5<@gy=&;Zj|Hr^j&Ams&=b|Ii1yS#O;b|AnmGpinHEkpplYs)@?Js5lojN}m
z-R@gD#8AI%?-RM-=~p5vlU*JXUxcFM_OPce6CN{}_oj551zL0NaBvzzr74}DG-Jvx
zq~1`&pM0z!ffpe6e@?p8m^L!#cSkal!|X(@@a|JU#9MBF4W(aIM<0Wa@1NSJ92*(2
zF9cO?O|_83-k8BhlRp+IJB)@<F(AfS*Z3Fhj=gEKPZwA+wn4SuyUF{9i(DQ+kNV6{
zgSR2-It`Tb2xaPBqQp9>;In!^UcTC%LuyR_c73*wBPA{itL?yk$}Fd%7dQFBnng}i
zRa1jeDoy3Pn&fw_+5|nlr%y}sawAKv81<gXG3Q~&Qi;6}=_wOq{`yL!`{u`~87J3i
zJy(4F%zC3???8sf_-Rx5I{(ml=AkfdSz!cg{&gsCGUy8C{*FIvMV$6Gm$5c{XEd&g
zsJ|A&@Xx!hZ?BEhUbiVVef-eR(7^q9r&Vs~4GMWfCEjm&fiB8bv`LOwwoNud+S@C!
z-r{Y0U>n2d1S*PRY4bobS={j)$99?@+=d*Ekp~TJ3=I&x-#m0^l<7xmT_SthcIAi*
zuR}r|>6_c0TcLbnP&8~Wn<}4_!E3AMy`d=9S0g0W2w-24-|o{DCMcs;dArr+g(fjW
zRv#21{j3R@JO<Lb^_^DL7!pt>E77E<u$V#R!+eE~uu$fuF4Je5G_|6FhfbR@qv4qq
z8mva3Sjs0Jcg+4H-I_wNsdqW(N*V4R^st>2qH}&;T!qYq4<o=dM)6X+(4x`8iZ=Y>
zh-CTRZ1o7LNyag8D$AX&g8Jm6{AK1^^qf(o8r6K|EHc4bOuwhVzIxfx4PUw?LrZo@
zSO4*1zgS>GlH~&dZq+Q=Kv5chk-=hp6Ahu$7izZZI>8tCq@e`5GNN(P?-IJIXI-!K
z;qD1!ip~ewo4LF4fe7#}DM}rB6!2kmMU|a+TBa@$go<QF-20$RLcib}iL3KPj?=x!
zN!Yo2rg1~(kieAfnIU+GGST^8xETe7m-ap;8EUj&U!^y%Tu2l=uM)?zbd&EN8x@h7
z!QZB;nHuKsZ=sk_j;aP?BL{qsHC?6dXDzI9XGMPS$TfEUyjT^c33GT}*X+zA)}edz
zDC#ITBAc3{`qQ{2mkU=nfu=jnEh8>p@0F|^c-(chOm~n*T^`oyx=R>1KbIpD9aWfv
z*ptYVD?m~4y+Ao@a<Pk(+m2(m6*$%rkpUlUwc^BUX62TsMC;iVolPX=@+%FiJ<}fx
zATInSLu+JxX8QXP86Q#=9zK)Jz&nXfc0tEdcYa@sn}{DPjhhbgm=$&GY7XV%@~Uc#
zF+YpyG>|7Nnb9(iy67jRX*u!I<t*jzRB0@^$zkXc30pJd4)-TzGruB^u&7|j22aQ^
zj0h)y5Q`qCI$wx`97zeu8;o;(c{8}X+Zh~oHfO0f`7{^_l7xQ?!3ieO@41eR$aGT}
zAU8ir;iMg>>~py=5ndant>Aq(th$-k=JOV7%ME|6JIBAEu&sXBDUEx@`NO;6y(6HY
z2&zVQxkuE)g3ORDS_$TNuZB$Qqe-Aru(OpS>6Lq?=@^OFC+?rDELn#2(i}|D*Lg2A
zexAt$_crRPkDhpIiuy-U$D9gCosdhHj0A~m<*EgKBoJ^PVN8GJY~i_6zb?=6dDybH
zMwx>%1>GPQMQP&6wEKs&5iHLiJ+Ua;#iJMqTTGj08PG#}!lor#(977$79OL{dEPK+
zKN)7d_iM7nT=|M|R&am6j^*Y>20V1nZY^bQ*Ed6~aYIQQdL`6c$zFBY*1B=M7oE~P
z(hZ4Thy&H7YpfD?DK3Gg{L=~|CmGX>6Xjdk;T=%)c&Q~oB+Y|aWBP_H(I_1JXE5e0
zl%fU1YgF${F{y_XBA+RAOT9+wXB)(g9eCWoA+S@tD!`DpvXr=Jm}ff3`gBv6)VD5+
zYn1h+Px0u<l@i#c3=b&s*qyB6+c@*6SPk=Mhs>zo!KGOS3z1^?*>(@%fnEFz?x$fV
zX>C>inBGKDo==!3Jt4l8;Jc`#N3>oiXFlb(GtUc~R%}5ZEI*l}^){^*es43MJ*W22
z4Gs1yNx$%g{_bavS7@(DPDQ<UUzKWSYqXRdla<PVve@lY{Noo5w&8qu*K|7S?dFE>
z%^bpXk8$d9yt%KxEVWxZt#}1EC)i|1alifIeeghLTq<S!CJU}%{6_Eq5q##`<L4i~
zWQ)MtvKn_=a}~__r}<KDjlBrhN5)X{q?_eFc{!+?tWfO2Y}Qidaz!SD44q*A@D|X|
zbgtlSIgOKb5NB;0PAp8SHODbtxEZmO44c=VeJ?q^A*LJ3#O_keARx;S>Jl}8e<4wh
zur)o*)-R#?pWYITb1H1wxuq<h%WYMQh26NtuO;_0q@`9b@QpjE(Il_9U+`ati_y5H
zOrB3${XhQ)=xMUa;1RZdzT4pa&rf&z*dNqd{0tK9%l_*Wfz2ljLj`7kBes7IfZJ2x
zpT4N%`N1_XE$Kh`4<q{5Q2To#5>ylizn}S!L;vR&+469AT{YY4Q~%5Qfj-eOCcCjV
zhSaBb|83;JQzU{xDSG3?^Izs1`o}*h!5EW;*-8A5r(n8=I;n}Y{`?=;_5Y33m;@MO
zVcfZ(|M3)>$Y4;g2fzQXDGLT;?8)#M?SDK)5iS@M+Vo<^f10TO`<V&`7~^9VXX5|y
z6dM1pSa_u(@OKeV5rMapsSf0%0!Uprkfwtj6r3+?W=sEXR{r5TThZ(%_qVikN-cF>
z7W=<jr@L+odr?A~v^g#u_vMkL>)ZW{AA4PA>uvqYQOMQ#jUx!Yc%-|Sua0ua0|D*9
z_#Mv8_@`z(h;0xkQhXBpgm;Q&3p5uonRA&yQ(&%?bO$Q%_7AE#ZGexWzD;LP-U=T~
z=4pkx21%!ufEkY6-uxVN*<_2#;NEs)ggPbgP8z@7Ygo80vx6C3E#t2UZ-bB%5u$bU
z+qnTN7WCH$XvhHEM;8V?c@<e^Z#D*;0YN^f-f2C_Aes%xl^ZIcb|1h~f}R!XSh5F%
z*nv<7oZqwQHwR=dojz_>feY?84C3;;F8G{6Er@tL95V!5!X_9qzwrXfBD>{a`W`^>
zf`9>ew`Hw7u}+h{@GRhUwm}wGTEJS}-M||ZV%orGBY=8X$roRMCvmp-U(+vOQvI$b
z({J~Qzgyy|7ATFk16-Z7&Q&Q>h+haqYbM~bT>=8~KD&=n3*WGAP>jyR2}Hczq4sy-
zWZ{C^U{6ke7EME)#QJc#m5hPdbl)zk|0YirBly+4$ZU%NYiSpANBcP2tMmT4YKZv)
z=AXI|KpgvBgRh^mtg2^SXz+m!tdMsT&Rv(zna`jlbUVa=g7iwu<xIb4fnz~k6KL*z
zk7$NDT-zA*H9~=`rdO0$0mx|&Y&BWuNk6+lTh1T-q3GNam=C+N(d1@a;sBfu;I<Vz
zKYk>Cw;z(!{K5jt7rRN|Fr;7yxgDVb4+9IRL(7A6-{~6brIPBwFf{H?BWPWk05=h+
zyFsT>XO{KYIq;$)u^7rUIJjKKI3#<y@A<pL51v%QZ=EXOLZ1u3)`#w+`d`+DvWy-W
z0|_7!Fs65%1YSq@x@)i74!`RL?m}%Mq?%XmmZdztoEmC#1pmM1)L9;CCeS{R!i9f6
zhyiYg6=V&kjG|mkTT&L=>eQ7@(644oC`sU1p6&hxFm~a(TD<=lvD)HmpYQCm-Ax^7
zpCdrs40rkYKoHXnd?MtUyZ*fR6*Fc9b8YCsWOxF2o+&C8%{L}*`7Yz<ySNr^XhKGF
z`bSMVSrs~WCw|TIG!Nb^+_d#97~yq2b~n13y3x~G1k^<gBT%+CB~m1t{yD|9v5^yv
z4j~!d#*KhG(|#922-C{|>f^CgY;^rR+j1R(U&#s5azyt+C`M_M_0=ZGPQUU8Mb$8W
zDFDnn_7X_&8M_ad%Wg6PK0}(fH=!6jpu0Zj0~~_~+yXa%5`@Iobfo4E9Gcq9lMS>E
zRWVVoAWEi8d_|=rTmvLh0@PfpBS7qH1eJP@Cwx<Ibr@v8hG;)=P}+>%9V~_iB=}8D
zn_m@8(K9j$@XkPLdjCXW&Jq$iyO95s;NIfa1p7*TX5Z@`u9Xq|*jK_Ou^78#16QOB
zK{vw<SQ_%=h;F=68f@M7I&I+%m_}a1-4g(cy~PWRBn9F_hYo$$b{Oo{<;+4CItFar
zy*W+5<vEE%TWzegz4Wxt_6wu_vNiDT8-DP$h6R1GnonhlSKU7>K<&&beFZ@O8F$iL
zJNbel$cft3m?FLn5^sqBo~UE+e8o_2k`(cRX5f~r+nkSE`^m2;Xkni)K%v-E^!Z0N
zO$%cCr!nv@jI!FB$<@D+4J43fg*leH_Kq?>Y3R-F5>d2B;5Uu$vd;EwVi}f?mOlNo
z2Y9%`ylU6^dlc@#-HWZpT8-Iv*J~j>OEo1sApR3UMgPN9$3M4B4I11}H16NnG-;gX
z@~E@1hNYQ-2oaE5$e<j^a?Pgv=D@pM+XHc6NA`?%^FgBMiXs!JX?Snh9BnGU5&%Ob
z%n>hoVFzTMOORfDCU0ad^3emOds(HI-Ydilh-SPWG{79>*+S8K&11Mxm3hD!K~dT=
zy1CFEh-s4*l+W{<gY3!5O_;l_EToNd#Xo<78t@{(rF{1LrTcOCT>$qB#Wd0G0h@Mb
zS8jGv-eS3%w7KM6Je6!)lrhJQBImX5<0H@cGfks~c@fqK#AGa41ekK$YNL5;f#G*Y
z)P}R{r`vm`hTNYQr^3{1E-IK5XVr)`;zJr=@c{{0=a=_3!#nR@l-uVTaHza~^&2v%
zTeqP6O1X*tOH%~w;2`jECmfuBdE77YNCWS>F*SwG`;tThZzZCS-g<<?H8iTR{s|aG
zXE4tO-I{TtgbsQpHwGB4^u9UbXYu6B6I@GUydY91fK#)3GsiQbk0WwgKh&w}3drtC
z`}u7UT-SWP{j%F5Q}!~W4;05p)}5c3k?P(FL!n+H^Ew)-a5mu{0EQ~WA6_Ru{K`M?
zIJ4&j)^!#<w~$lDyLQ^bhlG&>8+Fc2MYt7$5Mk*!`uu0uI=jpZsQV!MCwfv0I$)rT
zHAO%4LciOJ{igfz?@Gj-a^K@(cKgMax0<v=49ilyi}%4LWCwd*ucRsd;bW9m|33Qy
z$3&Oox7WG9enRAWAluXDpmoS|IuyJ;h{x%N>EK-lblqC&le@Uzeuw?S_ClVHC38CK
z?G`972(VuK1$Hymx0EAbs>}?8{v507^1qyc`3x&!b}VOLHW7y3fSYKvy(d;|nBQ0k
z)Yz&HP}lJb6Jjz0xx;QAUPXNZYWXugZ%=3^!V8b3-1nERkq@k4IZ`a}UgOF_%B5X&
zm(!Gb7i{GqpiHK<Nx1+r_P0zyHF`%6Xk&DQPDycUzHM|#Y(lW*dO-Gla1+}R5uZZ3
zTJ>kKS&bT$cjWG_0Hp8%WH4Qa9*+r;xgE;VL36S%W6%Au?g^pdjL{77p(WHs0bT|#
zLsIIi05U^G*8#+?gyeLmyl(vNmPWr^RP$W%RKTiq8qGcdPU=yf%sX>KyQyIe7%SQj
z)EE|}UOxS8$e{R4xqRBD@MLysClmB)Y_8gE_MdOg#n0LIL%0()_a2I%hdE#bwI|76
zu4wadsqDLjD>4HqNOP`x8CrZI_&1b<kH@Ou8pcvWy~r73!ccN{KvlNJec>9=Ey=&E
zWp-VMk2wzjBeVjIcMcgI`+c@)E~#FPc_%BD;H`b{)k)(%rv8C8nYYE1$C*vTA^nKU
zNd2QaEhAsOZ`A_mNydD@-1+%FnY(d%`wsBJiX76k_G)Iz7VXCQuqvP_SDY$9G*f)y
zZbj}<GrT5cS?oB4WkpWCDiC-=@iXNKUe%LIvcs<qU-PI5#KfkhtYoM(IsDtWQ=>~X
z^u4T6R^HYPRw+-v2}5xTEdx5)N<(?eDh)M3Y!|zqIW^@Dw(ERW!9<|hvJDE;AZG0N
zDRhf$guvTU8Gq^@=?<R1`w62K_G^^w)T#IcQ5gAfriuIK(q2m<enGU4ZOk2idZJ|c
z#I0F-2nj%q!V;yd6PL=X8y0l|e*AB2RKkLVm@u|X7sN%^01MvGil^C9m`TY)?O7G7
zf4*ZLhy_rD`OpEOkk7<Z?>B(&qQn?{>Fi~OR6KL?#djQ-*u7<tlV77>(5$|=$kZlN
z*%WqJ@Ie{+A}c}Nq+h6?x9Yw+%aD8Wo-={z>3)0LE5-4_o-U}fqOYVq*QFpOfz0bg
z&~I;)X`kn-AO|S->tIoD$e9GVtx@J;#d$a)=Er3|e5#W)Ur9pjuN6=<C4Mi)bXf=S
zGd7IIy;}$`fgIT6q2w(>Ye*~gaqQ_<w5hyB?)lPe^(%E|OI0W_wR#1=aJBZR9T1c7
z1xtn(6_$K^e5%N(w>JhHfwH-~evd%43dCUAsFNI=Z#?gudJzeSp`5k>UCgiW+zw{L
zva@wOEgj17$hwKjx#bH<z2^GvwDChQ7Z6J4M;h7gj9oHj5;vFzwRow6+*<*Q4qx?@
zN$6<?AcUj1XfTZDS5sSaZN8DQRDfWV7`z^@jJ`7UtL99X8X*vge$4`$Y<B`L-060!
z8AjGI?adEQ-pyG8zthfe<^wKL3dE!li)tlG6xhV-vUq_5yvG2e04VM(m#+*(*jO}a
zov_`xL)9TCDW)-I@^Ls*q5(Z)xqiGLZaNlme55ta2D{UIXSUwqh$rVBgkbr>2Y$S6
zyXWHj0tgG{CI&Cf$f_>su8juQo=4ZqB<HoSYZ*|M`5wwikeF+;m?i$gV$W#}8L>EO
zt_O$4gCnYS$`^(v*pBkZllz%{uqJniCRzbdrF%q^8)A}-nySV#xm`4SlC;#3&vUSL
z2HF@ZnvfIG>3-!Ec&Z0txkSKnRrVpf%jJE?SzLI9LY4hRcfQA-74a8gVfPas1W0NG
zZ8Ryf{nk)xiOND6n6qz3<6sA2^vlkXmq4asUoxiR02T_oVxbDsv%wI^W>PBzF_+_K
zM6lLcR_kYXGQ{R}0)8zfA1LJ256V1;j45q&%p|E>CD#0bjnc?6*NNO~ayXsAeL&Pj
zhVrztPBvdG8T367!Go9)Z<sb?x`IPzG|~!TsVps5q*V!SMe*9~lv`?YFa>qaBXX8p
zMAOF++__ls3&$XSdvMrV-6(Y%=v^b*lV^{-F>INYsK>wU?x2-ZjdE%u@D`E?+491p
zVN**-gq-5-93ScAt1IMTxz46pUo9FcU-WP3D}u_5iA~Fz?-Tk=N9s*^Qiju6P``SJ
zKv_tg`&r9%>Uq?ohGyvQH%0zo?Jgbki_wWi^Cx%9hG3Q3-mDDhDKX^ZT#}7Lm%*Wc
zS5=g&+AB1)m;Mae4{-ok*3fGndm;SG$|EWmy|1Qn_@iVRX3nrY-p}$ev})>j1(swH
z1vo)pGGN#{0252Y%AoD}-Qkkt6W5&aF}49k>|+D6bxdzejS^*x3~7Rm3OVldHUj>1
zK~+XOh$btCfa6uSkE0#Qqst#xR&J(7?Z_Dge^#9>h4H7=MUZq|l4>N6xNPEQN>BY2
z%P9?}>Jy!(sv+B}v+)EQAWy2onZWd19UYi3g*rH}!-+-k$e3^op;&luNn9%6C=qsr
zNXC(n6~s5HT=g|!oU;`49nIt4`s}(*^i5Q)k}1(NUDf_5hRRBIm?6(?0AWl1UYP7F
z(cxHe!vk)C=xs=_S7F3tkQ+Pj0N$fe8^^j@%{cbZB8yvu)6@RqXmjd&8=%LM$$U1^
z7gCl)p5%BQgS7B%<5LYByicxXc2%dy+Yph&8rD|fs1(Di2qwkA70a4uymy|m8f$OY
z<8(Y}YH>ef+wqrPb%vZ8#p351zjF`gAMXFj298m3acz%i@^P>NFL49C@B%McPaD@x
z&Q>#<fhTO|`SROGQKK3yQRa1zoY<B{6s7M75XAPyMbYL`Q4zxxh8;XmGsfXF%N0Cb
z<{o;vfAJk;X|7kg;9N=)%?z?6GWW>O+0$=76fca+#3zW92{S@&75KT$*0?90ez$zg
zQ|QoK=0}QFX+m5U<FLcM1O0-7jj`gWq*Hguo`G*0$<~PR*!+ZV6Vn%n!#Xc0zs3JZ
znWw(DH4mWTx8MCIY?k!;coN%O($LMO;zn@~33JfNf!gSv(IdQyoF`ENF8j`GHCeVG
z6>$);hIfB(8!7Q(RuDTsGci+J`1*^eLLq1CH`mUT{lvNDncFZtJg7lLC_?7LjXhWv
z>M-2<Njgw^6or>GwwS~#TJ8wX_0`th^jaQHFyIL+V`D_lFCtsZK`xPcRA+QiS`JRo
zlMc)5A?tvGj8vq!Iiv6vb`8}rea?n_-dh@XY4b2~d-h}Qy!SF?_C$=<=?^s_2VHmc
zA>47nMofK0T4Bir5Y9W$7+wfn%C|(yEmS-G*b~eiiOr_OSOi|-XW|Q7Kch9!g$Cl|
zBI=JA65(CHrwdY_5eT<7BkDiEKRMMg=^)+I4n`%!mRZ1KTN%1NZMS78<|g>5rCYED
z-nV0(+V8A#``Tjw_XFwB#=tSD$Jd+6rtNoKqHtjYAT}rGw)$pLP>1Pms$o1YZm<NT
zZPBOZ0=+RxT!I(EwguxWPiCMs1nNv+o~6h0_{CEmhsNUN$$O6XAZ+PmZV?NS=Z<xD
zf&qT`VBhi{ZV&R0dL{GZ@}p)lmzu_I2?1jP?0BD0^r0!|?FiqTyV|L1Z%!f;$f`&8
z3wRj=yvCfu6+X7}S#tp6=H9>u?+yuU1#?%JckJiEdgR~g;a1fjCHb1T#>8USodqHG
zC#=Ii)t~vU#4Wrr*WSR&^n9W9_WbvKmvf(7zqy8Li=baomtXuO4S08?9g)U}Dop8f
z&1l$VJ~IVq6|!q&jYTwh9)}g)-Ds8YWK=6*f5+OystlYu@A*^0OGC0rJ)d{lL>r?Y
zK8{r+XS`rzNmmo#{8=)a?xx}X_6wchqbFc@PDh75bzsD=c~)PIvRNv-E7zyY^dh(W
z*^zO*xM;*kkVX~LDxdP<36^nAD`%n_#>i&Fk-RB|)0Ww5AL|-&YSc|Q>EW0o6lR4f
zsOiw1Sh+a4?^05cYC}$zUe>tecydI-3V1}ka`#)UfSu5v6Kz}F&kL229_e{3Rcg>8
zH<56L!)NjXE~nup5D07*SCtRocQ-{%EC+3Zd^VyeXMG>i)UB)0s>qV&S`KA$6yIr;
z`1x?mp^CAppA_|QJr8KAjDcxPP0#yUl3gm|!@D5nvxoN}%0!!Vse6o~tmCgm8?!F(
zeGG1*8rrN-C-%v~+EMw3fslEng?#qPIRM&-?|Rg@Ip`-Wqe`z178LrCPEo3L+vW53
zA|QR^wVt3<ktH&nR#vlSGEUx(h#g<zaq(UE;T6Pv{1nQ+qnMzgv5bKrl`|7}{+Q|S
z&s%IBpA3uNoCi`2Y6fp7Ur(N*VSkWmVMUu5iei5XQhn2(azwQsBKFws`SI}_nBtU}
z=FU+DlVE@2jBAS}JI+HEUP<BdS7ZGDwRh#=P_OO3qp?Sd?1M-e5{ZN%OIe0wCwoU_
zY*}Yw$`a8@gOnnBjj{A1hqA9}jAd%ZPFaew8?SIs;(fk)&voA4dmYp7@89+Fhl}g_
zF3<OVp8J08=e|Gp=XNz17dnuNjNTX*WhFj}fbVTsj+JbE$Wiwk{b8Hc4b?tZmDecP
zvHwiRgvj~XrPK^oNe812-V$Rers*cC=zfZE3ZM(RC9=fPRTevHnTmWIV>GcMNB?Y%
zaP0?}J4s^>b6n(S1WbE9!ybGM2-)TBlIpRvFArD>^Amq6aD2LWDOVUAELSVMC({oN
zfJM!%5On2WgyGjYZ+q1V8gZOG1J%A_X8H}t<<M9d<-4kexHGoO9&EhuQ8{n`;A`#v
zr^#e%5Z9O*-b9FqYVXl;Q|v#?aY3O{ObM03GHnsf{TN}bXn7boafF^<!$4XCZY4p*
zJVT`7`Z`ksk$8#2yJ0>ygSvmPs2AtG9SfOUP<BnWUao_VJvb207b@{eY<P=<%^AwK
zrF#wXndguX@sJHq;F^<XZoWlcF%dS|MTg+nljrs93SNo&BI+&^Bb-nwZM%Q1(zbi2
zRrl1wv&fza>v0{Kqg3$*>Qp#cWt8=R<H2`Iy4s1bq<MMLx1^_XAZ7V@R{o8@o}%Js
z6)G@5B8Yx<u3I@~*}p$%JV+)x-V*KBVTJQSlqh~nZ&b<IveO#t$h6&c7LCW?UL%1r
zmtPa2gOd65<&;%U!wCnb4_^7<duK5XxlI)|do6yKx!w}QF#~9rvfn0lU2t!p*1K<V
zO?;FvY&j{UmMO1%C~!2dn}>_WNB_M?L~y#L?sm*P#CFfJQ9Ao2vziklNG|}T)92gv
z1s+Y-XDJn35w*CGEc;T_w_tw#F^KLWZ`N{AVbdw@8=!<9Pq=4nM4a`(ntDYB;rWlL
zhVFWA)UT8|7@T`#Wy97pe0w_dBo;8w()EESG)Jf+HzQv|ZS6!a7?3|hRIh!!(=f2C
zZEr(BfiPS8T3MDzNrxwtp65f?F%@aKx}zw4-^i97iM>*;$@-qh_hfxs<8w9&4FQo(
zSU^~^Y)%?zCQW$tsqKMVY`aBA($_-Z&3@o*Dnc#QJbZUWlL<RG-?fza0j^`L54)#+
zQ(qG${JrHHXlmTx{gt8<jhuErFo#ADfx1{b<fB?}(*1^i;Y6`*(p!ZX*aVxjKdv?}
z+{rB0yUiUZHHuao2ApI39Fi0410=4^tu5IMjk`R19Q{cL#z&dM#eZzT@$!wLRZwg7
zwRLK^7$}yGxi5%+mmO$Gta9m&^(Od^)=!fip9kIhxS0wcep^>@YJl8g=<z1>p)Het
zk8v!gW+7-#IhHc>U?08t_Fe_&OHEW@sUqXn^ud<&0;I+#d#a9q8?xC$4&+08DAmy{
z4ZXJ#X&UYkMju<Tkcmd=)Qw@b{gimf8C6Tf^>%js;iZ}RBBSTg8CK<Ym0$RFV?&Z0
z!SndgAvbNrfyXd5eeq3wT0e%nX2o_&xDUi}H{6HHJ{B)g(d(nStjI|F-Pq*-$$2Rq
zIL;||Wc-}9cJ|@#k{*Ia7^C)%TB1cGJ;g1aonlVjP=vLX795fDIc;5<s&RW5G?L{P
zM~{Mt94IeTI9hsl`9r$^B1_E%f<JJDo?dS|KW12Y*5>F9ZP&QYJ9xa?>tAJopR${k
z8?U1t?*;Vx_^Fh0sx3Ek@RAa6At|0<Hkn`p9u<dn=DBBT*UHl(s{moA*QtLfZe{&A
z9=LJR{3u9?K~rgxWI-7jbh96C91?lRp`(n`NR}IFNLh;N6wmoBcgO*qT|Y~&5ui-A
zyMsEA>k=f4|HWnasz04T)c?58E=TOlf)~Jb)>{;O4wm!jUw{JYY@d9BbKPKrCo6L;
zwiJ#b1r#|FW*txjsuIY|I4eF6s^Y%woiGP?Bgb=5`aK{`EoBOMZaIi4T`04>Yvlm)
zBhUNBFFFLB$#shIlDQz#TAY-p-0S@4O?y&?m~@TL<ez$AhlKRtPnVt#in|{~uNrwa
z*du_z@9a~J$y*4@Iaid~TbQNlYA_?Ck3NvBydYF3&&nnILW1iu>Q38~TBLstv7LWH
zNvh~ToIUIVy0F~=o$mmO!NwQ;90zqhP0Nkdd<IGe*7(C)H^{ZP<=XRr?%w+4FB*r(
zw~2V|<#FBNfX?-?X7nlB_n^Ot=xGg5SEq-|nt0&$39dy#xUt<D({&T~s4Mk2xWqEo
z`g{{=*X%>d)YR}B5%oREJPBwYg;P3iXHP?MSZegXkU@)WHy-$WAN|jW+su6f)N~#6
zWA*MyVof$Tj{flL93m3EL3_KfS^+xH$m5p-{=j#)a%&l9xRj2nu7-l+NTqGS^W02}
zW2X$&579|{@yXSuva^L{riHg@etOj&`kVdsvT)y`_t;Rd*u|MbL^8VrdYao<z5r``
z6sGO2qrR5dp2f1b?A@%g2=;YO$Wx+9BeO0U&#+a3UH{>Y%+_PGQ2afGY5HsP;DdP?
z-^rOAYcG&ck*Vv$A$wL@51;j$2Ok)l(b-*|hEs9vPr3(ou?VIjz3ko}X~wm8A;|_s
zc_XRTY(w&*Dfuz}70y`{TPz3xyedTaT9vW)7nn=<HpaK}d6=gN$XgepT{UVHbv>uw
zW(XLCRsp__TM&(MyyW;tI^eNj0|f}qNPApvx7#)x`~8?^0r3mJKCx3<zcFqfhSYRS
z-)A54kRs_iZZ1z(9Tgw#{1ne-GHNYSGV6G1m5<NO0l(k%>dAJcj-$K~rHFP!tlOt2
zr{1_3ENnuoBPCi=Q*7zd;sJycr}xG{+<EUM#Bq>j9;N2139BRUl8x#PT}Nt{g$Vmy
z<T>s?<Q%ZRPKWKE=4x4pOuPq(J-Q-0?<liC&02V9ml~irUt5H;y0gnRp5tBpuKutI
zld*cT=5PDf@WFZBz*H_~wuY7k!^BqD>Abb~C*+3>()N4E?!tm}Bg;h9cxLD;cA3{|
zsIHR`sb5Mp0L^AD2I4I9aQjw$XS77+GOkuu<Slf4?X5kDsqOXd#sGy4Wd{m-_@P3#
zkYC-{g&Bya;}XXcC{V1`L1R1T-ZYl&m`aY1Pt6$#2W{uZaIo26EfHj}-`wlgWmw<@
z<<97O78F&2eR0m4a;yWa-LDfHDZI(@ASF=x-f&?_?7V$uKPVfF#&BemO&u|X1ID}+
z63B7f0&7>R22EN8*rG3MM9A~-gxQBSau+zoYiTWuRfan04-z{u3URnoNWagdq6vY{
zPVPg#jaT~$FWfYD!S_6seC2ooA3&g$r7I_qJP6!cYaa$^B&EVtz$D0g_@IoP{>-lS
z1rEYTHdB>6+Hd-2<CH)~NYSkYpVD%ixjDt~J7B|cPz-;Qgs>cAQ_}Y#@?B8=$|Z+y
zG?v<W#x>x-2d_+U?*$iiB>1~5+Yq0&=^c+Y4<<?V=ilnOo@E}Sth7H}imkj;Uxc&*
z^<xq2`6OCKR0F$ZEBPywSpe)dXRwz3r*rBqW@<9UA<+WK0RRs6k3WV$sb2S~ioJDy
z>{seRvAloK;VV`kR{!am$?n2`M{+pLRI{}jLsP4nR?nyh->bgg@&RJ!$40dEsgz1B
zKt#5Uj=>?QYSk{G7^`$r^f%f$)nPuicK_3<iWhbFNGRp;lG_%|6eR5o;Zg_GVV!EX
zb=_1Z%?li@49^(|zs*HilHd1y4FjmAd6#T8E^5yx=x;Q%Hq?ai8>;mGy;IG}w`#L%
zjdH@K{GXIp81*+74agemwzR=WeXp5i?~1h$sT!_rrxXe+KIPVDEdao7V8-Q$nXAEF
z)h~u=O==FU?NE2t*Vux&$#Zq8|7iiv!R7=nLy3zR)99GkWOphTult)KlmheYgn;Zy
z^LeelPK-68&z)HNi-zn$t9U_q2p-6X0Nl%@=m^IG-Dgn{v~zj7Tjr$S?<SrbPx~i8
z_W=vfm$6xkC9NBrIXS3kmQrumyAr(Qc2Uk{3F1F_jA-}v`GfNcW<#yW#keuvhZbQV
zY{p~?Yp{5dnD8Qla=`W(&zT(7&D?0QBD__OUphtZ=6T_wWTy&fW;?_KaW$rCC*^Aj
z)-uiSUq7IK=#lX-@c+py&or-X#!qD!N6mtavp_<$SUv34dW{J|d|Y62J3U3CGfxQy
z0qz)5VqXF8p13v$H7E+tIyb$CMe3zcXG>^oyq>bsBqD^#buKHjJLk3(v!(1%p5Q_1
zP!I`|r7YlLUtVBax=V4v$WofRc=9DzgDp4$%hQHp+#|h%oG<YO&bYR!#F+=ehP(1>
zepM;1z_+`F2h|dC-d;mysmOSt7R$ebK+U@f2<9mioF7i~W+ut@_H@QpG*LqmWQvSi
z3O2ugBgZ=eSL@gG=MUaedx1~Xn_m?V>1Z&7>x{bmAOp*(A%->Kdv+L|9EtJ%0J3*%
z<KndnS39=s^BTdVh+VIAzh2zkoNn&@C;D$nnwpOk`y!ZVOFyVcE$>o-5rWNf`a^}C
zlIuI__Y2xX0N5kNwbP}gv#P6_QhV9o9oIePt1jrsHj>DXUnxZ>rqygca;#4coD3E+
z*P+E%EvE`6((X@A)^FQQ{)Syr1C=se$A62L3sOheqS05@m8lk0pFP*pt62#1xuzMy
zTh{8C_J535gH2SMz-)-1Ap4MIIaaSj5-vi~9=KFN12s)mVZn1dp{R_|b}tx<w<p?o
zUV_J!3(rOn!#E)ip5uiJl*}BrE%|p)kuO{%BnqopeH7leFru<NRcht9@WTtKm9AfH
z=#w*(b?wI`^hq(qtUVJzTmGV9`XCXjA&RpyNob?O=toYBY?UaIhglajb<|NO%?yMo
zi46_yi5T<Tl`VGwF5HSo>N0>q<tJ#TaSr&uqj;<iDv0yo_6}(!zcMC>ac|XzRtENc
z?(&3lf&(ACfi*!FxV<}}(fAu6?1?l#)3sS26~*PD92YzPxR=dJ!`0;HBWWizD8Zot
z!EPIYA3w_&2<02Q`b_mkIEj3{9Fo87ul)Tlvj^H~+ylKq6U9T%n89|)12xW81Uzqw
zn3*1%&_c0vu;~7RY5mt<W_JMy%zoL?mcg*0kb*Ec()O}V%`kWr^yD5%fOzBA>}P;m
zgkF@b53ph?Ox4wlh6bMZ5`y=grDC?1=8j_J%QpwWxVVVoVkqhOUmy6_zceiK1m!Vr
zHD<Q&sSFtA+4bQnM%QO+8?&2asH;%GS}rVYmwggA`Boky*c9P(x3k7==UIlt^=Q9g
zQ#IHJPT=7h<wR~NdOx`9OAW|&@3c0cyYxA8T!(2-^z@*j1%Tic2a%+nsb;&9)4Q>p
zM{W=pf8GdlY!n7I!#42p(s9@R`(Nn}4CgfaB2&?EJ93*yiPu0@goXu_ZrgEiXvEDv
z;lk$T2q)w3)|D;{t^}VE!}emr6~2pQPWX%a2h*J&3cbx<H@m=fI9)AJ7x0_gkJ0$&
zx+8{}I7WA#MrcA`$lT10#7uv)wz(i31X5!p)8YTktdOMdMf!u&HWz4l2X(LG0Kv)c
zk;B9VfE}YMg1Q#wtcuqnyRq_5=vs`I9DkZNM~ljVLgP{1R;lcM3lb1aTg^}8Qq8HX
zYG;f5QcPz}a*JY_3y`S#jqw7U6+qu@Qn%t7c)8gipJ2vlhRm|rZ$hv$CM;+y$pyT~
zImy62m6cH5G?zjbkrIc(+N+?rfx%>Cn==7#lpShK2_@SE)dD_A*7(ePJ8Ofcv4XjT
z&0l43H?(?=NCT}(ip}~7P?RPCl%FdStI9xEp-E2K4{)a_67?r<Mc)G!j76tLgwe-=
z;i1?COXP@S06XxPN%)(;lnsF`iOL?1V>mMrOhf==erU0H;wNtvJ_KZ<L!(2{kR7!P
z=!^wG6r&2(KrD>m@VJ0X`X$iU7@LA@Z3GZ8(Q3owCvRl|GV$VhQL`QI+j)4|NkGIF
zvfG<BgW+jM0hy?<y&Gn54P?U1P(Z|p1E(2o<6x7}0W$gjW%oaY`F~{D1<i~$Y;6F0
zrGmcpGu?m!Tp3sZeO~X*J=YNiffaXNs*oK*-_y<mQP}WJ5W0;b%n2W&|IBi=vb~NN
z1_?sJksC|rqOd}Oqq2Wv8vbJ@N-CMvuhB)-LC416u;gP-WA#_wrV9bqeE9BbcO6FN
zq43PknjD1wg$V<J5T^hLdg=veTTEF1$XUCqRiD+BV`a80WOjalwlNqjT*KM3fT-JF
z?6kYH79dzlrQ=DVKN&RbAPgeIO<4&5TV@u%WR}N$-sorda4_@ZOT41V69<20*6GZf
Z;^Wv;h+7rm@Lk}?=&b3PVqMqBe*r$FOYi^y

literal 0
HcmV?d00001


From d6cfdad0cd38a97058d179840a4ab17e5192dcc0 Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Thu, 5 Jun 2025 23:22:02 -0400
Subject: [PATCH 090/165] Fix broken circular dep error

Differential Revision: D75980282

Pull Request resolved: https://github.com/pytorch/ao/pull/2320
---
 torchao/float8/__init__.py  |  3 +++
 torchao/float8/inference.py |  4 +---
 torchao/float8/types.py     | 19 +++++++++++++++++++
 3 files changed, 23 insertions(+), 3 deletions(-)
 create mode 100644 torchao/float8/types.py

diff --git a/torchao/float8/__init__.py b/torchao/float8/__init__.py
index 8d4d58fd6b..ed21c93d20 100644
--- a/torchao/float8/__init__.py
+++ b/torchao/float8/__init__.py
@@ -16,6 +16,7 @@
 )
 from torchao.float8.fsdp_utils import precompute_float8_dynamic_scale_for_fsdp
 from torchao.float8.inference import Float8MMConfig
+from torchao.float8.types import FP8Granularity
 from torchao.utils import TORCH_VERSION_AT_LEAST_2_5
 
 if TORCH_VERSION_AT_LEAST_2_5:
@@ -41,5 +42,7 @@
     # top level UX
     "convert_to_float8_training",
     "precompute_float8_dynamic_scale_for_fsdp",
+    # types
+    "FP8Granularity",
     # note: Float8Tensor and Float8Linear are not public APIs
 ]
diff --git a/torchao/float8/inference.py b/torchao/float8/inference.py
index d6e650aa6e..42ea5e9dfa 100644
--- a/torchao/float8/inference.py
+++ b/torchao/float8/inference.py
@@ -12,6 +12,7 @@
 import torch
 
 from torchao.float8.float8_utils import is_row_major, pad_tensor_for_matmul
+from torchao.float8.types import FP8Granularity
 from torchao.quantization.granularity import (
     PerRow,
     PerTensor,
@@ -116,9 +117,6 @@ def _is_rowwise_scaled(x) -> bool:
     return x.block_size == (1,) * (x.dim() - 1) + (x.shape[-1],)
 
 
-FP8Granularity = Union[PerTensor, PerRow]
-
-
 def _normalize_granularity(
     granularity: Optional[
         Union[
diff --git a/torchao/float8/types.py b/torchao/float8/types.py
new file mode 100644
index 0000000000..b332a9629a
--- /dev/null
+++ b/torchao/float8/types.py
@@ -0,0 +1,19 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+"""
+Common types for float8 quantization
+"""
+
+from __future__ import annotations
+
+from typing import TYPE_CHECKING, Union
+
+if TYPE_CHECKING:
+    from torchao.quantization.granularity import PerRow, PerTensor
+
+
+# Define FP8Granularity type alias to break circular import dependencies
+FP8Granularity = Union["PerTensor", "PerRow"]

From fdddb2cfa2a4ea930dfce9ef23429013b466b22d Mon Sep 17 00:00:00 2001
From: Daniel Vega-Myhre <danvm@meta.com>
Date: Fri, 6 Jun 2025 08:44:27 -0400
Subject: [PATCH 091/165] [BE/docs] Add fp8 rowwise perf table to float8
 training readme (#2312)

* add fp8 rowwise perf table

* add fp8 rowwise perf table to readme
---
 docs/static/fp8-rowwise-perf.png | Bin 0 -> 344318 bytes
 torchao/float8/README.md         |   9 ++++++++-
 2 files changed, 8 insertions(+), 1 deletion(-)
 create mode 100644 docs/static/fp8-rowwise-perf.png

diff --git a/docs/static/fp8-rowwise-perf.png b/docs/static/fp8-rowwise-perf.png
new file mode 100644
index 0000000000000000000000000000000000000000..ff5b41800bea8946c832274e9c216e2776dec45b
GIT binary patch
literal 344318
zcmaf)1ymf(5~y)c@Zj!*;K7~6b#a0_gy0YyLI}RNJ6UY;Ai;vWg$)*h2MA7ryS?GR
z_y6xb@7;6Wo-;eMGt=EOUDZ|9)!#;Gsw+IfBF92NKzO302+~48Kw$^AIt(=6jH@};
zF9ZY}H3wN)O(j`bT1|HsTZcC`2ndQ%sru*!+QZNCjI`)bFhEku+iG};1X9WvFHYlV
z+37Ixlp&bX{c#-CKj-C8Mx(2>h!(JhEM-l+Y{2`0wFS`1m_1AV<qrt0`_EUh53)rc
z?zYAxw{k>14yX{eO#;gJNoG)JHIleuo}AmMsjFKg`XM|$MIbKd%H&E=5uTV>MMzsc
zKiD{X`HppA^r>=H@cF|ml!<5<6@hjFuM~UZy;x*03W5u<qRkZoUU7n8ekzylnit;Q
zP(di(EUQ}yRuj8hE0!5$Lsa~R%q<2&ok%{{D2h}e?r|lOH1qVwUi*+_5Nn#$K6<T&
z=`s#oUkq(yh=8klt5$yQeX9EA3jdS>|JCgner2@Hrv&6acL&bk@rTT~2a{uW;$9Df
z-ts&q>?qv<oRf1_JNXQP3fWt|Bx*9$S^)%B&Sy{OpY!mk;3pN-DLA3HbB>Xj%ZMrE
zQ4CV7S%uxc<BohnH=giIJ{)(B$R;v0MSwflK1?W|1h<yD?<Kvj`C`IXw>ij<Ro@z$
zq2?UAdp0wH?NF_UdU}?S!pXsgdQcl(;8-p9a|ujK_C7?^wLZnjm$Y#yTYX_q=8B%#
zx-mpJSw|b#a6H2s1tpmWr%LGM(P2kZ)zyq9;||7A!3j?2BMysiD=+bMt3N3q-4{G?
zKdaPWTxG=Bi~N<`8)1bXjfA9IyKbGxNT=Sv?l&3mU@&8_sGdb3ZXJIU;~tvYM%H(9
z{Jwd$7WK;2t^D+ez#+)9ZA7DuH=BmM>KJ_my$6v51>u=ySJqS8cW-F_Y&-3Sd6(zW
zcA@hoV1l|VBFU%|`F}8k%nE5@1Vt#K{9;(YMfaC0Kse5quT@qT>nW>#N^1qvC`&@7
zmd!!$k>YIA$6;5J7gI!ur)9X0PzW$U<qkJCNWFW=qp|JerX2c!%M-myW_W6$VoA&M
zj#LJRetr$D8TU_EL~jL6<+u>V1!>%RjQA?g$K=CzuBqSTnuSe_87VewP`2M+OUqs<
zJ%~s)6Hj~g-?_QKo~F7nJ0noKk_h3VUxe{}kx3K%)x`U}5<DLq^Rt45-&(;9T9Cp+
zBpLm6JCXb?c{Kz3h;eW(O=`^!!_{WoDI_odM)y4I(-R7(sK6MizHxJwPaX!(zoQuZ
z;He~Y9E@W<8jAMkZ(a+xi=jGYLEnX#@|opT@+P~N`jt|b#+P>lOza12*!~(%7*CAi
zt3NiRyzIxT^&tpZ7fP#7u78d&auC0JcFt~l_~kwKLZ_=r5OUYekFKsR4YTHNRtWpv
z5j7ur&4effZW~~TuIHbm=$>o3H6P2ob9pMV7<k=9nt@C~8qep7Y}$p3@?H}UbxoQ#
z1FaqYe$N=qHpJJQhZWJroY(-Dy<6`S)$}{@p9uCyRX<TK$#T$1x^-PCs`H!=DNjRY
ze<Hu9W&9A%jThL5QVZJ0xBC!#NgJXlL=eNs;GoD%FHJNgW{s&8UMbC<=%o0fjz$=g
zBQ;K!JEZnYVlwnLs!f4MhiXPTR`a>1*oeHaJt=v-x*Xp`raj#&NVU}SZ?8QC=Ogo^
z;D!1VoTtL`@rbHVtSn11kOu~u4T#d-+nDpdLDY**wVE+N{*IJ?VpEB|*T1|9$_c4=
zMQ?sDdx&EE4&F!dbM#2L4b7!bV>SKg#)sxUQ;LC<U>`FNh1!CbE}1(<Q-+mgpOKP2
zC)~d*`!Gw9kvHl)$h(;&Icl!2rEjC}YhQccdY}55tfgcWXp&_vxlIYoD8ZJmBQvi!
zuO=ej3fg6EXR1h48yf#b>yBk8!%3f>yf>sUoIa#6M8ldzq!P`-6ir_=_OY^Pzo0>r
zQ?r$g2KGwFv0U(FUY44PYE^-NriS)`rde58S!S6ptREIN^Q=r4_FG%D;;q^5+}6g{
zToHY7U6YR;GJ)yWZfDuMHTL{j#9!mnWJXJ?3T7tNC;v<=zvkwreCb0j6B|aZOCC#}
z&TsmS%~M4rLL$~wk*k!Z$gJSvwHALBe@j-tSJW)stcaI2j^~a%4b1j(4jT?HX3M8U
zO3!q%i=2w7U@xXQzb{t@YTeKwTV?Py;~-jLTA{D=7aB#ttg3pahQG5-%@t04oGPuT
z+Jk1pM2(u1FCv{u2(4c6_>LKGDsLigzTCXwk+%}E0$HWSI*@uej8U}L`UUyXw`;Yx
z`{|!8@713opLv|>?+Na#yzF|ik7J2rOZJ9G$myG?o?YdvLHCczTJ(WsUeJ@@I95-#
z$ejh>2<{8=3SbE&kvs8=I7~Z^@t^aJ3z*skOg9gHuvoLA7cjJQANxh7lHPBzQO9mj
zY7kfwUP4!bHRV)7RYEgX`ITTSdh9%F>1AnF{a3!R+03TQ3&RWpkil3ztf|>Xsn*)a
z*3kKrnAO$5$UOV->oVQs8Er>#$2_l(UhQX86j`w~UsbbTXFqQQ88te^{kC0*c?-*}
zFiA5>T|)JrUjAzOrgN^tgVG{rP-wV$*KL++no8&?>eI8Q7gU*Xt8sF1YH?fxMi33M
zPQTmCqx@XsT=(3!LQ8oC;&h%e6CctrgGCmEv2!YNYE+BVaI%_REl>K=InM!wdci4Z
zOjeCwtzxoZEZNfXWq6T%(Qom^;?$yGi<#Ztr^30>IXiI->U(Nz@mJ!@zOBBS{?v!J
zy`$aF2P?++b{O}Rph}|5;->;9oBl2*e~vA#imn0<rZyaRM=z?*1Ap56VL4scx%gl;
zI=s2R*>>oCoPI@f9Nc^MYkZ3uw+rb#vNEy=(r08sr02*7sF|oXXfx<%s9(_FPb8>i
zFfg$VsoZnz`UnqS`v!je^YKJhBdjc<KTJ1V9HR+4J*){-fd3KSk>L;MmAo>2HdKm;
z>$TJLlKtLx=7eNFo)y%p+>&}wJu;WXpE(X+P`sM+k5^mp?a1W<rT}L2henW}<!ei)
zwd|sIMK6_1k_R>NB(DPMr0axQgu_yjGV1t>gOz`#oN2den`o<O)u?^W6Y<||aX_1L
zFQv*<&mYeZ;*L#7OVLX|Po(Lu*}Nz{nG`I(z-)g1<o%Y6<f@28{E$(D{3&CvsFm8l
zl<L9Q=S*?K4#N$@cFXE!ty^AEMt{fi>>OB*i7;}DQj7n|kgtPp1k-#H<!~9<0G};<
zJ7r!)rO1R&+^#x*js-jUcM8LC+3{uo)n(yI^(SyZVYAs!ZB5<7w|Z-pq4l3_RcxE!
zwb}J=#*=#rdT2J+JWxFrHZ#YK#18HQ#&4al6Hs@s=bvS9ahU#SXY~PpwcK6H>F<0d
zOkBlw?Wi=FlxA7DCfASKiFser0V)LPxd)cbPFAg~tweYJHV|-|8?eb&2`lbQ5l&4_
z4>aa9xF7W<?5MbOHkTWSj!SiZ-c(6nomAP{IPdNCmAvX@m?L#{tieKa+~;b~C9}QK
z8cF>>S{+`<UZIw<`f@&UC-O0|6#_w(W94nHHq1VIC$E;+WG}yY=G@WH@1oMHS6F3Z
zv=Yp9e?QRp(<ydFZ)Rg5Y5}`ZayhYieGGS>=CwEZKF7k9L%OxTzS^6wWv?#g=S6y3
zQ_t+%p&fSKyMJQ*k<R%Ah4|krj4m2A;_hqj`!`BDJ$y#CK%akFhbwSvf3;pB3z033
zRb0;*=qRZysowmxIo|s*V&PTWtEYFrE~l#XroNXmv?}OP7gN8G5OJ+MG<a~^Ia(&n
zWT9?UbNLeJemwlV)Kc9m=c#Dm`Bp)`M&4?U@Z0Y<Z}x=Y9udJ750jqDzXPnkINp3T
zGYJ--Uj07d(|sp%A{QU?A~#ti-t@TLbIrYLBfsXbI;WG|_w&iCp3fAs+BM!wc*{P1
zd>5OeMyO2^i>96tuBE5dn@h+3;TPq>^><D#=|;1OH;5MtG=1XDcbbQXR}5E$@k{;j
z4)LS;8DeFDySELWSzudh^=$Cge3ks*?H5-jdlzb4Z%l75BUWgB2PWUNnvIw~y=}Qo
zy{|9{Zn>TLPO}tz;I+Jm>!Q4}+gas1805VfIC;ZDV;jgASb1rEQ?}vpV@nj-7a3Wr
z10s3({2k)P1T*qGNpD0c6|{GV@Yrd#@{?6_X&t+HX_R|Hy<9r<7z%_ZhxrmEB=<|k
z=;kX=5h@EL#EIY8lOr5aBjgIX6+O-0K!fLw$b7I1J+P82-YO0a*4D9`thuFLLMkrD
zCSAJ6ekmJ@=U1{62Fx#_Z48ub)zlDx83zIe0tzBI0xEEX2y7CF6#pE{BeEhO|8*V-
z0U^Qx0p;KKr~~`QPXe$#migBnIVl_g9r#56Y(51@f8UM5UV!}1aUF0CL0Vf@NeS3%
zTe;iVID6Q;c=~|7fVm9<rmLc%2Li$~rpFCYNsI9isQ-t9j)A9vnyQGEixa1XwTq<<
zr;n5CV?79BJ|e)OlZ~eZt&h_iXAcn{ar(dR5CM)KPjk`J{&kC|qd2{RnkKERi@Oc2
z04FymH@yTFEiJ8>yS1%|7D)cz#erYq^!A>ft|DAq-rnAv-h7-c?si-}!otE_+`L@8
zyf1(|UU>LAds_IsaQ0yMS0#Vf1G4e3a(8g`bZ~K|eXQ5Q(#6YDoSy!%p?^OAdQKZ3
zhyS$X?D6l{0$z~o@d_6YCpXtWbpu7k9?yzsI{4VUF$6g{0euFvA;H7T%`5g-f&b^y
zf13QSq6Ys}lv_aHzl;9YrT@FAu7{1gtcw%SsHen#1orR3|9$b_1;w}?-~GS(;$I#8
z*IA&aC9uS}{*jsl)<f!P9w10c2atvium{xa@q=Ute6jv(4;&-KycD@uu0}wRLQn!p
z>-Zq<=VG=6Yqvb4)1~5+Db8kmzyq(D_L^N6x-;q1KeU3#cl2Zyd39yjNj~Cz1lcmN
z+YAv;N+H`&6O52*UEa_7FWt<E+vVR;onPb}9C(jk1?J7}<+OMD*BsS<H@)$d*fVs5
z&kQGV$ai6oA~KkxK;GeVBmLKp3?z&(8>l5#!~2;3_u^l75}~N-G&B6q!rVyOXo!Tw
z+9hnpc>kmB$Ks%{oBylDznkZ_!Q%$=*ktvf^8EJ${e9W|v02>zf3w_Pcs~2JgOeWl
zH;eoiiyj)eGA)dcFBpPJd)P;)QRKUs$?{cjC4f+|9~}GmEKB%4$HOdB#vWfc+)6}2
zgsmsrh4Cd<Tlt-k4MOFi#8PymfV^o-6i8Q2Y}b^A<dX3H<+`Yg|H6XE=!+&}mUz<*
zmnE;+-}|k5)wyQ3Yb1PF1sXxe$+=$N4NFgoxdI(t&F&S1K4m}qVV56R;w5ftvkI5E
z*?&LxRCJ&FdA(EW>_z9poz{S0$5AZupy;mzS>+s!;Oi;m!OZ=4`lh}%TL-}p{&4Gu
z<Md8XfqDDFajfT+-}op6gAYS#JSDCt;@^@+d<UL?Ty*7Xe7v8;Y*Eluyo;?gN9)r>
zbK}tf#cU|#^kUinz~p$vCf!6n3%;*@d)SN1byn2w+<AAN*MBu#Dxur+=gUEdc<<Gw
z4~lc^PRV<!gHQQ)`*!Qd{Kmq&utMdW_Vf9Q)oLy^q7a(<!-!le@5S2s`PUV?*MwVb
zc0ODD!|I~Hb>@E=tz7F({dVwh%INsKQ<9z5YUb8Yj68FaX_vRd9e2F^O=z5y_jTsd
zHPV4t-igP!u-&vSmC&7Gm1Jp%%H}&jSYwJP_ot<jUIGhm>R%tusuTo?olR@osonu{
zJJDL%scvY0xI5rF`{DfMx2@^|q?P`$-?42St3H2+)su_dxdfeL7elZ)n}2pW6yTkV
zL2t)j`)+@Xh?Y^mpQEU7Jja6?xwLz+u~>Y;v_^;92I5Q}h+iz$8%?{-1|KKqLsaZ;
zemBvOIH!=%zGD+b`KtOXR$-c$7h@fojX_A{rXq?`-Fbgqu3;8*wSg=L^oFGI+TpDs
zGcMu)JC1#<+EN_Qmp4KL-W#d<oJZWJrS&*dO&_MbJ8zak%J0Lt0xT#8SaMu@q}*5t
z?BDKTX9<a&|FB}widBjgtvK8IlhsqCHyTBT$iS_OZ=R;X^#qcm!r4-E@@3_&`efAX
zzRqJ(i6z$JQ|H}p7mb<M4eYa()b>Wi)pF)!Xw2+r=uU5+Q-`K_w&D{f;%v+7{8T#X
zxM;5-cO>;_#pF97PmT;NMO&ZHGjh^3>D-3Kw93(V+;t)2QW9<fYV!N`3LZ>NXge)w
zodQ<^q5i%|tqCZ8-q6zrlGBfDT_z2Ob$zq4{Z7qcVnMZwwv0z!A+YG$JKnODw{Ue<
z6TEcw+a-8G+N{Sz>f+*uRXmUH;d0*V`VA{Ap`Y;<*J<2jDX@2!j89G3XN^77w(|V{
z>?lR!8k}}?+ctHWL!nbU)oiCu66nC#H*aO=!r8Knd7)>D(CqPY7#UaWo1yzKlS)P=
zR3{5&|9VGweSTk03{Bd%1fQ5=_8TcZYN}Q8E$|do1B{S4*5I3km2&@3Ke@=r{>Tgy
z`oaKp26p@P1?MkS_-`$EwU^mqQ*T#dd=OTTJZE(E&#(jz+btraLkRP`5$W)K(A)|S
znm|sPq}!dRCug%}ojhu7(T$7lqXcLs*tw%gv2X}ka3}%st7D$$Y5slZnXnEiUpfkj
zlT3J@HM)c#cw)zg@9S-m0bo6%yJ7{GGxT0L6l>jy$z}@7StrZ0N<3V_OXCCgt=PUm
zOT{QM^Uf;mQe7p1vxF218)xfLvAeuexz%6(w5AvyG%Wk=6>o`c3CHfZ@qCFX6;sIy
zI;$`%_T9=AY(Gw|QLXWtsTg5aTB3hKxOIPXpfRVZoaw6Mdk#(cy>kD1WfHJz`E~xj
zBYf3NUvB<<;aYMZec|vi?3wZ$lZP?BbMtDr)+S&-#9n;auiKDVjY^OGl#-f&LM?f>
zqcM85XZCP?`ktiC+*l;kc*rpUTcAi|zM`^D`IXm<?x2(NbqH<%Emh#@1RH#;h)_eU
z_Gj?#&$A_AB&I^`*E2PoXXe^9%)^e^*yq8w>oij;X4jJqYthfs4jbf>aiYb2fWiHB
zhl$Hq>6Pb%9N`^1+_F@#ZS~2{Y6K1E9ZKafb~9Ucirv=enSR?EaWOR(zx_QH{OD+q
zMnm%cC|)~nRoSt!R^IQoqgnPbhs*Vlf<)5sWW49ujQ-$HtMPol-LlCvV`E^%PQ{p>
zLU}H(x=T!po(vR~ezkLHKl@G~Na28roX2y0aguk@=H|d}BJ{gqYO-;`*(k3`f!epI
zfzalwe1PwF*l0aq7<s@eXVu=R5((|lNw+~N!A)vOwBOp%il)ALpZW?V#7?Fep8s+P
zL4BtAiGaC=PhIq&&7&o4_I3Kr&k$pu)iAb$&*1T^bQ8FCUKmGbeWRYqtkU_Ka^?qC
zINtiyN&Z8?61&2umeWa<QNE*Y+#uJn_RCNSg_aWuPBseG;zeJY_&TM--HIAh)M6Yl
z?CDgy)eWv-Ux$j4`?90B#<ul1QLSZJh6#=CqGf7bv@7dur$(jH{2;#(c`dS-wf3Mb
zT!~9_HluTQ72jvIVuUIAwUAh8{Oh4d<LN$b&@E&_GVpul;r_xVz$PG0W{E6fr)E0;
zl#Fm!hGs+sb=07{Ik+2@B<1wD((RRXqFmAd!|~Rf)Um4l4ziy>N(r~`py+a<y2O>W
zNp)Q4`K;;sll6vy?c#LPR)`X09fAq*Xe)%(d=P6<m~+sduP}8EbMh$4x4pP02-{kd
zrMcGh+cR33Ke_wyJa9f*BJx);O)+(QkB5fPH+9Ha<Tc6x_U=uD<n6~c*=-iFy&B)I
zjsyo^oO$g#!MD=abv;jSD%paj65Ut`tv8+>6fC`6c){a*oJX!_3OEZADq5}w#W_+Z
z)$m$>Kub9<zTx@^GHgq3tBrEhtL|iPSY8fZhW(MDDSBb=F@We=6v!`t_1qIh0LxZv
zw8-Gq>#}04WiDp0{0DFHYr}KR=c|gz-b%?0WF*<wdaB7=(X~kzXzR}ow0D>?VXUpv
zI5hB`nA52jjX$72$G&6>Shv~W$iNh)jd(FrzlGvmiv&twU0P3mX_H+u5XKLrE1`j(
zP^+*dQ$;cOc^di7jhgD^Ew!B%wuw53dOls&n9deR`xO{6BKkg7e$T2c&#Q+QZD*<5
zW%<mPrgf5eTk$o;pC{##gm0~RxvSRy@~T28$0~J}jfP*c%&cR*tZA?pYYYhpdLuU^
z_CNKC_;%Gyjv(s^+x@mp{>eE<M17tSkX7WAQ~4&%Ymz-CuGz9~j-qp&nz+*Y7dc<2
z8a)@JS;Dmb^VNo-u~2G6-2UCfSK<z~_*>qcwk`1kvIvG99)=v^_dF8~r=k91+pK0(
zC!_753aTk@ruoB}o;F)2(V=l|IemHnA|LQbw|qkL=W-58K775P^^Q44!w^`H-9|Om
zBy+Ibh_ZcZ+KAM`Yp#gfI=ycL40kz)eKxX#%))Dt3?qTpyl?^;GtHo*p*Q5&vQOzJ
z3T5_!tzL-%2~`Df`>wxE!*A^(-vKf^ojhzFv+*+Y>_FvH<LO==TiQ7(E+0J3=ebmA
zZ&)iQBNayAfoTD%pdXY5SJUyzf)oK8E#)g)f^Y#VMWQqGHn=6_wJ%rVg%m|RmTf?0
zY|K@k$MG1N)UZHuv98dybu!Fspw5=5A?tUngNJ%PJo+Z1h+iN?E%0_6WT~)@55Gr5
zr_@Z{0X+C|hUX=nDleF4({$l}-m&dt{%c5y*u)dFv*ON>&)2!t9@b)S_=4ig6fe6)
ztL}5&(cHmSN($*RcRfktv0@qA;;{yFcZdC>zxr4$d5s^#TN{20I$hTtlb;)E-<GWB
zdM^t*Uy+?z?^_FZb3-Nin+<5VQmD`1C<bKpR>8ZC3aG!IFDd`-O0<)^>bFz2@O}2d
z2$CMv^>m$wf?#kjN3eZiJ}yQrFsAh+PNuYCi|pcbdkah#pXx_W@#d3ss&k<1IL+O*
z!i=~WJ(RnHwQ75n9~?-xi4TAIM_`q**GrTn2%>SylWH<}cd^nrIlL~aaUD6yl(S}C
zr<y*R$fVpFp};Vy7tEO`e_Atl;SS0aHUy>(CDcf)oa9A5ZoHrDzPE45+n0x#CPc@(
zxsCA*LJU>zXKI3UyGME8=W)aFh(tY7$h;0S=#!0Zu1zWQs(v`fze3&0>)dlVpfV0n
zkTq@u&%ka0=Pv2Ms|Y1O*2aKtI`(g@O}^iodbGnsjumQ|)dN}zb3oqOOAIee^CGDI
zwn?pu)#)4hO~XS+iWsgo=FYH!uMJELdR2U`KNdON_gQ)HZm49NANJopX`YRT(NeW9
zvWbq^niO4bkWISBbW{g)XMX-NH)Rfa-%X8q2LgpnuFZA9KDM*QRIdbHEa_^gf%>@v
zqwO?y3Qy~j#iN<-WM<hyAqF^^&15clx(5Z#bu6gw>#z`+b`*3J@fCK~9AzPF)A?e)
z5@<`)Bpa#jif(q5Yl6`XJsw2Fl6ic2x%QgJV*Pds4w&dvzTtjR15g1_m~q@N@;;lO
zyf+6Qs0g$!6j;aUyIH#{IG^$)lr64h`r&6N?jLK7yz*SD>moL&%-Q$Ea|M2CX`KYS
zeLk-w-3$=aGUG4RjE{zC8j=}pPaO#-bq{4Aj30>~&B22jr=583L%LZcj-q&cwK?aX
zu9wel7V<m{GqZnq5*V|U-cCp_fd@&lxK>-}P&Mt9aAdcuu{u{|J&0_*m-#Z4zbkKA
z({SmYafr+}urtc}rSkN_^r*Qsh(vJ8+EN<Mw8OK>cfXr;{F<KKGu}-eo?gu+0q2K<
z`UJ_Zdm%AuAh~vGJVe#wz5q5ONhlK3XooPb^@w6@I;gF*5JYcimHcOKN!e`nhlJtv
z`{T&LVS4uIII(OF1`BuP*@g?u>vz>h#96FvldS%4`;2Cqt7?5n?|fC?C*Ssh`WcaT
ze?huDW#6U0<xhC|?I`J&O++ao-&-{(396e9A}ERr`|It|aS~Er!BCcmlIb(eucubD
ziVhUa>egxN`&<Le%H_M4NAbbNbLoEWxg-wBL+>1pVYJj-!R?okG*5U_@`DJ>(#)w*
zWi^`R)?~vGuL{kf+baCYU)%ZMV)e!)_qUt45a=PM!qU{1eMGke`BT=QQ>qjrTZb-%
zXyv7a@Va4)DUKoTD=X3pY9O3*skAJs{{wCedhZ?8GnEI1*3w$41)?O;V?}pN3Lg(K
ztXB<quxa;w%=t+>T)n4jh9}+A&I|}yqS$lWWh_Y{stA1gl+2n>t(Y($+ayLImhIHe
zLQm3C2bUd>sxKb?#Lec1w#J!v@$gBh*m^yzV^rLhZ3o`)!pfd2ae|u_++APL#(iDL
z%^Cfsh%)PAY`vu~nIc3>;7mJkI-S<Wvq~a6;Jcxn?uBJ%JP3823WNanHs#eip7JT;
ztw$_BF8JdXK*X#Sr)2(@;?aFo)R7`rX8kfiF%o%HcpTD+gBV#q{LJ=+@4%j^>*-xk
zIE77=6&%!YO&5=~t6>OLK%jPdEqWbY<kU%4!j+tUEoozaQdyQ0O6i++%v&cj2CJqd
zBfL(GSI(CRRmWT3%ju96fy}8*f^@c93S8t}C{7v9lqL`4bq=Z1`?lhR8k!inPRf=U
z0yd3#$C_E`Lz)R<!DoIy=kPJd+5%L;e$;XeeMbg)WM|$j%y`pJ!El`xQj&z>X%gDz
zZ(r8(BfSUue5i6cb{&`4Yy7m+VG5H6J`WXfKG<~T-JfA*Je$uc6=LBZSg2w{cWHXJ
z;YBamdB8mE*16UA8S)t1H)k#Iz-r6O^@0+Ql(5zzn7vjPxWLAEG?2&zxp=l{Q2{kG
zor71E(!lQ6g0P|$B)9`;Im}Kw(7IVB?vyZ5Zi#4pJL`Fv)}ww6O^3ZjL>~$HHr_*1
zLc^rhqmt|rZq+b!NrrY~FT`E1L&DbDM!6m%LjGxgI~FHd(u}+yuBgWF!2qp&Xm3Of
zhY%iSvGgr9=|de`qSpJ#nqu76K^*iyoy}?&$%;CCbDaHz;nUg!sTkq*eYjJl1_NQz
zBggTrnk;8D*U{FzQCP+B#GqJo1Z#vpCq3!@tbw75gy4{mumETh^^|NTgX%sDZ(i2G
z7t*F6&ULGAKFutADv??yEL4i32Q}KMW{mEO_6_Ra*n$V-q6Rko43^UIiDTmxb?hOU
zK5^vnP<qPrnnN)aof1VIoGG)LSiwXX44yJ-|1o!Ooh6URcu<qH_@`kBPt+~<_4P1o
zBv#&PE6g|{JgM={Hsfy_wZL$YqZl{f7MRdL%Egc<Wi%kU+%#d%tR`-S=ZRs}vIYum
zTO50!Kl%pJ;g99wm03^XDlXkp`z^ZP`~#!|%jd^GNpLIQ0!3mi$0{ovEWlQF^3n(k
z4`9YwU0JGuh%QPS!b4yiJ%4^GIUW9;u<e}kcxG>({6s<Pgb!b>T1q;)gj;C|(idJ^
zT9V!w`o^x=LoJD5B5DlWvH0)$x0s>`N~JYJIk^^C>DdkbOfXt*eU{L0cE!o~1%6mB
zE@`vIctWVKk(BMx{)ShEIR+-R<4n*JHjpl_Ekr~*^TjB0js|4GkId1F;QgC<qG_<O
zu8L|%DdxN%VUXL|&*5okAU|am<hV`RKo{4xo{^Uv`sIrIYLq)lKJ)k|YYz)~!BNni
zm|s>T?R)bHm3$2cWy=Rtvqg2VO!oPmW==_AB-VVX5^eG{34gK{3w!u)Z63);YTKM~
zU=sA+$aoDu3Ib?p#;Q)c(Dx`#*Yu-4K8Z+veB#<RU)in!>os0#U+-Zbs97UE*@jwp
zAMFk|Lz-a3b2wYxYqtT-BI+IPyby{Fq7Y)csb5sx9&9;evb*ctog3_wPXzFZk6v+f
z4iqZte8aW!J>$S2#3$}OpAA}%9SAMC@6jT0ja)C>MMmq<nr)@x`9M0l8w{CSLMcqJ
zQT4$se<AdzX(eb0sxzw~tz%!Nm#QQIrWhu)`4L1oMcKfGds2DCF}v_?#jUf@;Mw?w
zE`GY$#M6dR?)OKLe|p|Do#K7w0?9M>?SkY^+oqaLxk8sk0XKE}Nn0%O3nbKQbxC7x
zx}!HP#tTZ%DQ!<~Mm88W42q0a6x$9&2~nHh7TzYvalCrAtT2+kg*$P{O?HhGm>op;
zFl|b??lqpx+_dY&2&HfI#wi@;{>;@^x*Iu*0~L|6RV<xF!5CG<ph+Kst-PI*%Rb#Q
zC>aJ45Il2{BH|3(p?E*TkSHp;(-2>DNWCnu7~+q@QDfVl_%>la|C@Dow9zeNM>{JZ
zu2QMURpS}B`+AfaKUvMU&s;DphHr+Kd3TkYT$f8s1CI=C>3CKp+vhm%r;V~dYn9Kh
zRxv}x&KKu>iL2kf4lzS)-A~=+e6@wURC!hJSrLku+*KWRV8>6CbqcyF-ptb=9$=Wn
z_=g|1@jH#k8Kh{jX|t;|6-Guoqv-3P98F5?g8DxNMmM;s5XY6<-I4AQ5HFTwzMV_~
z!N~xZ#Af?zg|Sv+)@~@fM-ZPFf?ckW93n3=*31SuCr&&<L7bDfK6Id@WaNa4Mi(Dy
z8tx7%>VO1o&#+(2THwr*b}_r3dHUTw+xh6m=V#d0YA+TILcLg5<sKm4!Td{8^u^&z
z0~BmK$Luj1zvW)7Nn<cK_)10{3`SZduMY8M2A<EA@{$r!L({hG@iN~)p%ib=cmVz2
zQ#GUBG>jP)341=soD@B0B^FTB%PMw92$hD9(Egryj+2Z<e>Wt1fVVasg>|ee+`3V-
zAv58sOO=rUi-9Pg%a>s<d;emATK;gWRoD5%p?S7#3#kZXk<rnl8BsTds6`I2GGjE%
zeI775XJn`xpzPTb7c{&^a*$7ay7=Obv~kCHJy?*+$W&@uhrnX=N9493V>om9X^Rg2
zLmNwi#n~2tFX%y42ZCY1;)qg$j5Nmj(R09XwZwhU@UXcl#5AFqUNFj(oV7UehZ&l>
zakl@R36N@&?T_N~;N4b{S<Q!}17YQ&NcK7G2N1`~?mh_pE(JZe4iNVAr|ZuIw=dd|
z_VKc*#c{N(_8aSic!;>I4LWFTl%i1;eus;z`j?Hf9xS2QsBOqZrGlk|89wr<-e*bg
zZpu`(p);|=La$?RxY>NvRAMmTS=IuTTKQ2w1X_9sSfV4NOJeacNiN3C4{(c|b#N9+
ze}xtDo<OWXwTz6dQE|~QJlmzV571hjm4aFX@J(r>)ww2t5{B_qHX~<Ef=VS($2D5F
z+R^$;vJI___4X1E2oYP#YxL{qURU$89eQHVJ;e!#i<tTek*N~tsb@J9;wcBVP1m_E
zc0s6jAC>s2cZ8!X*4&vQsV(RWEq>h3yR_khC#LiL@QKMq9ZrIvK_3Msz<Gi{(WOht
zOqc8+)(#L`iJOhWoB9|SX~_!CLVB1(ww;=M#o<h%cMgh`TA<8@@bMeDB-2%YDxUq!
zsQA&}Sv{d4IOCW5+e;P2G>Ls1fh&yjD<7j^k+VelAi02hFO9yq$Y_hfei3j;MB*pn
z;R-P?BI-#S&-Mi{kiLw5-vKfeQ}G#$<p0nRyNn9qn$-VHg1iHfF^k;D=77EzkIVu&
zu~KDoXK}3NvT#v(J|CdFCigkY+gSSec5+~`cNeZ^lU?b^%+8FhRBDA%LWiW4L%LWD
zd0T;oOchFwRSH7xG;L_DW{4Jc`|*G@fiV9SfdPkW+aS$iO;Nb!z*+S=(o{VWmQaiH
z3<#6W8BvQ4J+m!Rj7*Z(OyROSR(JwR`~({#?7am_m@H2gBfBN5HEh0{aWQRp3{rWg
zsCAxBCcPKOIlsd}KL$By2Ct!3p3`=+_WpvuVLI!gC{+6OXDJ*O8BIbh*Hady)6+{o
z9?nyUa#V00tL&kD)yxc)8IcoT1X7sBsnXPlUeNbKBOc!*h-2mEi=3q<G;}VS75c3G
zbcU!}vIQ}tt48qLs;!Dv01M6NXP`B~n9wv*+HqPKdjy*29RXAlI{38y-D|5<ZEK2+
z3dzytJ@?!W!iDF5yznI_X1{878HL^B$@O{gH?9T7DyXfS1Y$-)05?`N)!0c;y5dvF
z)9L^LW}-;$#BIC5yZK`!<y>yoVkJ))*i=l=Qs?A=AjKv8_h>I3@lO*M<e;gGgl!%v
z(FAl68Ns?bGygswq|i_4_DjK($fr1p!AW4HIohyYnP9MFbkT>?Pd;jH3wXr;awdLs
z%KBhmp-J^}g{C8x@U1oqF#bsoVS*=_0%`pOL$Tev*kht2)z-pqB#QdHh9EiZg`^12
zrEQ**!dq0jUFD?>aH(6`#XHw;S~D=30se(;c=-Wq95cIoNcj{$(i94!am-75X=X*b
z8j^gkJS-Bk0zYZX)0y=FapKdkcg=sk3`<4UXB<zGGRK)dP0<*E?h>V50H&9zL?XL;
ztZH`!q~ls6;qlI$(Z&&&1?!%h#J}47rejM#{F9!G438J5`Fw~W9->5nsutZTFdEIr
z%=*PE(WnduSmijd6JpgM!z&l`g2C;dBnKNihq7oADU!2AI7MPzH(s|6iKig2b^Vgg
zPt=-ju*2q?nojKW%ZJ$fG6tbq?A`FY(iFz{v$`Y!`tjrGeCgVzHLIu>ex|}Q>8qs6
zuy-(&-5{|6!(Jbgt%<u#!`jxN>|zRhUEG>2G$arKvCW^^u$$Kh%;~SLZ73X6bnF=v
zT))5C&B*8eDY0%ybWJyV6{`93$Moz=fp7VHGIvqh@uK+9_hM@Vc&T74{)>fk{k2mH
z7yfZb60Cr-9rR~TtWYi7s0Ij{ZArk=hV$py7B_XvxlZ|?ncF<oMh9rIeO4|gB8Y1i
zc!EYUhq2nz_g3j-PMsr1`A#_rz|y`t2h6;h6q3jLpk7@o-L?|m20Hd3Gq_FmqvuFy
z+WnsLblGRb4hll`-O1(P4c$_O@@QVotWW^rPZ3nuffAZr<709b(+q|PxxF)m-ZQKI
zih9pkXlIaNpZR%GH#7S*-1)kGE$%;ory8EQ%R3?aqdFS}TiYGY1Rf%D-IoRU0)C>~
zsKa;L^kbEE8K$NNS@^%?s!4d<);VbU!bf^&E7I?|-PUlp_C6FR6!bX;ql{2SMGI}8
zKzqL_(6U*Ie*so)wDAnPV(61F+~Ef^FQAD-qb65`3Y9`Oai-`zxVuba_M$B)1PYwT
z6OpT7R2TY@)D&7J;oTkitF$;!Y)P9p$8}`P!MiXCv?J&faXL18(c`t6VIS?ethlx@
z;`G7}6YAcP=0ci5jY(-sCAY%-Q(&r+kS0LONX-~IA}ypu2%c!v0NWPF9+M3ZD!St{
zJ2w!Uya9_DjuWnzLnv>6FoUZn`Yj~fXYmJ7aUkBRA+#+KMw|Cmp=LI0OWmzGLYe{G
z`Pxw|3RVy-_3iD=)Mm_)?`&xp8}biOZ~XB~C%uRxxcJ>mGVY0Oi>r_U#oZc1`87ul
z+J`8>>(FuWrM@5_cDi}Kb4KA(f&`XsUo%i?VWB@V>G$|iCFy2Dfgnhhd@aUyu)yp<
zuKky~9Djnp(iZoO-NN2y*0yGx$|q~;N(u1EqaC?=(H_oy)L!7G4np1NDVVPBzQMW(
zIBigz_mGsBn$%c(IaB)tES+O9&|lIKMv}kV&BrcHqP5^2%o`akB7nC`@M2ZVa629>
zU(Cgddre_lSi9uql290lHUgI)@vDIrIwo7ro2@rZRub}0BDT<Y$xc?KI|1{QtN&7$
zSUmHt<dEX-ww)n!pD8uL*s@I11S~i<t21R7Qs1bE@-08{5k?J3<78RQAdoT%kp9Rj
zl@n>BCy@v%fY9rEN_H@wy8o8f!HYOmVqj-JYXx!aZUM_+j%V)ruWE7H0=S!*5@DK|
z7Ry%m9A1&`U5My9zIYLh`b(E;K@+)cF90VJVUYGC7+UwNx8ZAkGdK}l;o6|GaF^<2
z$NMRBPX@z)ugO{xjs=^Ij2qANjS?d}QM?GKO;f74A;B~m+<hhx7~MgfZ+4CU%Z5sH
zgeX5$@m*P)+A>~BDGgYfv`u)eUOBTtAp3NK4)i04e)6Nbj(Ngh<HwcR!AKD@ddhGn
z_77@J3_c8}pACX{<D`omkFK1_&322lk{v~(Us#2W$YdP}&KeHl>@a5HK#>Rp*QkNO
z&|%69bH$}C6AKVuj%w6;_I%9(elLjwFLMMP`#-WT+vm6)ERt$!=h=1A3f3#W=<}wz
ze9ciaIC}y=vv=KV=OzP^jO&)#D^N_Rw5rLvM@_358W<cbc(Ngaxiu2QV6jJ#&%&LD
z6ZkQ2@Ka~uy}}h)>F4<5-Ts?8PQOM>S#mJHt$TdO6eEz7P}@-*cu7c{90Hx<Mw+5T
zOaa?Q7V;EGCrCfF>2$cTZKs`sl}Y$Gf1c5^DJjJyw?*7r9mXxpd|9Oiq$W%^Cl2Xx
z1v;i<QqNYv+|9rAYOYT#&A&+;b|H^qb2%$BF_AJr)ycWDX_k&GCECZ`%HqQ@HVRA*
z4a({_ePUem+gWwe4E_jFREY67A0<U8$FG^E2#~#W`jqbf!fTtwZ3jHH1t#uPyN~X5
zXL1@SyRJPziWcqMadeW~`RM9JNW>*hGNOOA`k6P<zUl=WL*A{u%KpI5EWv%Dq1Gr{
z!fV#VTerHQ_SWa8luq<^PeP<t{!Fx)OVsLG+~JYmUC!D3tLP$k?q|}R-}g-8DS}52
zs|bldbPq)?BafhmijO0)i<4=%4X9uEQSDJb9Vrchz;Wsid95vl7Tq%~W-iNO4=wNU
z)X8Pnm>qd=wtfyJb^1NfOS&@Wvyxk7Ely&V@_fpl)jaL`xbnSNE%>+K@=$Ec?@8Pd
zgr{dgrd)gbmsH~UmMiumHH5@Rd=Pj4(z|RBnoppr!-7lr&M1&tRXfWdo;~!e(D3|5
zEf(<xvhYi{Z0n19q?V~C$$;^EIRAF1&+Bc&*w(ORLAOGWnU-{gFvZ1d(#f~RDH6mt
z&#sc6t}F64vPr_zJk^-#(eP)$cP-Qkex^&TEIG$4s)A%;9p7Hm2+Zofoj0=T$n!YG
zQ%qx)Hq&nwsildcYU6KJGP-Lq5+Q7tAi?}KV(=GPgc>piD}6&+a+{=7<J13ql0JrG
zk~ouC-<W43-EKrRXr$hWjpCZ^OIfLY$8qY8Fx*#t)~8jPdX84fHyPG2#yeUhM`EJW
z)Jh!@mAvGv{r02k<9c(JOUG4fNfkxUPgE`+=~r*(Y`lCIc_^gWTohC42ojG+1@XDy
zjHS2kN`1MJ*1hfKEw{&`r6e7PVaQCV0)}+ThP6s6T<xB4q0CQ;zKwJn>3V)gF=oai
zVsNpOQwSf<xj5k)UyqF2ljFom=I2!nTCeOshP~Pp3OH<AWUz68p6=U8ei2g$6~hHq
z&^aI2C|De-TQ-%&JnrVpj6|HSi7ZY^iAFtc0b-|Zy3nY#b=)II@TV#~`2NH{jsi<^
zh$k7w#)bbJ-u1W$E)8vX8cLp$p20Z(24E1>PT-Qkd;IeFA$CM!e7-t)4g*jCt@z@i
z2ay$<n)@wjgPYbc%$$81+j}|Wa|k7AXMOQ`S_}EJ_X>!Gv_LI5*IX}7f)Oe7F|0UF
z=+APR;8n`t{h0m8_ng+Hw{yIx?IWlfNqPcrxLk`7+?9dU_{HN~8#j%#J@erm?5A*P
zt1ZgIj5wyQuz6_{G|m}lp^3nY2=;Vd9wwaOLH}A`buVV$8XC?A=3&)(Y6qZELMXtr
zy%~Y;Rwfsgu{z^*28cfc4I{^AEo#T)z)zn}kd}T6Sdwzkd`&U|pl6CQk;82yY9q@S
zRtUpp#wxyOZN{NGHZnbyD7GR<%<Q&)*k6L=%|Bpdz)1JNJTkD{hDT7X;5pJ*pD8dY
zwP7X+MH{BDC}}(W=t#NpNQ%6s`}9>{p=f_I|Ck`^H2>i$f5)rF-^4Oa@<2A>xTLB0
zlkbl1$SAl}uiJ#2ftwxx%KkMI-b4WoGhi8n*DZVYC?z6DS03X#UtNMcbjR8NkGI!}
z{%TiG?l=l~fO=xYG{36a0rD`{H|&bb2lTmb=N)zo;eL8kPG)>ad`|)VjjvkCgpPrG
z53fs{C-|O+2m90cyd%67QmUwaH5JC@(vxC(R<2(h{BRMRPhafL^Vm~UctiR5D!x+<
zbsCz>Qe1a~!MB4PM!jOC7Qe5_L%{S2l3RHO9bpkfH<YysGk$wj>83aHv&<Mn(&uyJ
zHdi@~_!+4{S7oHyi*o&M@~(gd=vBX-_3ZzG{r<z&LAokIU7-F-(1I_(9Q`lyPaK~c
zJV8jk!vDYFJX@wmp)t*mkN$72a69T<RCM0qWyycxhFSoSQ97BdA(08-7F%Rb|7q8}
z?@{bLUFysKR7Of25{fG!lnc;e4#{c)N;e0c4~Ljf$WG=RYt-^@f3f_9Rwebk$L7rV
z({b~s&rLo3Z+1jI|KWCPs`GZV^Yp`deDJN+JV3ova32I+e3^PA*6y4|t~LcbGw=60
z?<*GlhE+_H#zpojOU#kY3US4+w+naL4+350Eh4DM*WL2nmjK#kBdF$6Earz81xh#2
zHL!f0xCy{*?#6yQ#l1_lrTGB7Hs#%MlG^~_ZzXr<3oiR=54?{ZHx}|JC1i>vU4ei1
zBex0OWf!_cLY&0)b_0MY6xRgb?bSE@z!g8$d<AfGQ$V6cf8)y!%a~&SgZ8FtahCkC
zm$Syj*9k%i&)R<tP`Ic*+9zUb!1bzh-fnPJtf;X(uFtjtCU3NABh83&3BYR9y3sls
zzsX<|L)ZB7uT<xOx(540i+t88Rx+xa*P`8B(oNp7frb}7;NqP7v?SBsm|p;Jur!9V
zl@+tz@7AetjyX5zdS@s1Aiz#!rzm;1>2BdsI^2VF=1|KxM|b@n{}xu)skGF<@;)s)
zx4|p`*&%)Z7(t!2e1G0VBAYxHs8SC3V-bmUcyo6UoSz2ZbMmZ5_L0;Wh0N@`jQxOx
z$~)ZLk>}ul*7_D4sGr^mP)$XE-7u6Kq*T*^g!D@O<yVG5VWJ`bs1mmgenPFFXk;|s
zxDbOAK=Pnw57GpSiC?t9bL)h@#=Reoq)CIl!vIh;aq^h)q<Gxm%ifuGFafbwl4XA2
zd1i`@{O%WBrsH9!rlqtrL)%QBvYc!fDS8yw;~PdW0B`v80HM0$-z|oeLEb^cBclPt
ziO0m_>&vJ>hG(WetEapAog!6j$0Js@?T-*)$}R_BmK~y)(n$3`KZ1HYc9J)SE%#Zo
zZOmVRMEH7-*ij#$jbYCPz~(goxM14NBkd`iv{esKVC>^+f=fC*%a4TCFjM+pe(#a9
z(hh7vSbd};Q;QkjjQ9coP7y$LNmc=H=8RU7pYQ$sMQ3_z5}AtTGehe{b~AMt`WYR(
z*>1qZdnwi6^$|c2a*6|Mfl(XmzmWC7e>xxT>vE8A69GTlz@cVth&?KlX7YB9lplOg
zbNdth5nxi>tE^W)`aqfn`|+m!>qrnzds=YY`RAG!PHLtNJ1{_+zEj!DIxjA^8#%0T
zNRjU~SBjlzW%1J9J#tR#*AbD?-fintJHL`OsJYS6`TiOS<|rc1{u%LI7^+~DWdJqu
zt|R|G=i2*3bg!l}NO-I1z7f#;ae(^MOqHPM+%R2ku5Ep$aXgTtyGY6v-m)4_QO-T0
zFsN#fQULhYe9;46xIcL>_`9lcA7jNQ-<42x0b`2wjbdi2wcBk4$?~2+z|T{9#NX<c
zR8+T?FOD+GvK+W+n#=|QG^^X-IG`bV#mRzx92O@XIJv4Akf;klQ9D1}JYtQ*jNKXj
zMd=qluxgw5X!ftpEcjDzBK6()GI=?bO$oIAgie)8oRzt&lQFaRh$rJSm9^p9+W~BF
z)yVN9@(DGBMAdX)cc4?cN~OZnfzisddU@2?)Lyj+2fU|$$6tmwgAiZQ!?M`K?w{T<
z_oJn?(ijj3x4D<;Aq@@q`f_$(?Cx}`SOy3l(%D0~{kb6(j3{UhHn_2F7oK#%AEC+V
zR1hA^tFJUDpnDw$7C1!z>P^ShX0hs(BmT@wh~;FWC&SA+Z)v+QVm;QQV|_KEHp-J(
z`SMc?5~g7M!o|^L0^KFH2-o)<bP{JNA>-}6xRPzk@}RJ_ZN<yB>0&%7dbVbOjQiqs
z4www}bIP(~I&~xH8cFA+9E-nq3jgtOe7Ts2@ODAyh`1uvpX5PnLSVG5!3yKF&XeEj
ztc1aaO!=u2?WarCtutX6{6BINfYHT=^5{T|=uDpc{qlVHh-Chx-gBuP2`J@u_sTLh
z-1z{)z2R;;u4yuwO~St2?0<!gWA*3doe;nXtGr4;1arS;!wm-LTA8+);ZYuTOLKtb
zt@$GdMM9>erwvvsO1|KLwGn=Q<ygfo#)8K^5@BV!30_LyLUEuwmZ4qTlDKGLr(_`=
zrYE8GV+1DpE+e6X{WSn-NdWTId{}VlG?@^=lbYBbA2lfVUs8uEpo02=p*^Q1I9V2>
z2)XT#PsAhkHG}Xl5@l>`fX*ycFPpA8L8wWc?pmL><SCqV@KqQ2z=&9X4S+650DM2f
z<p{9-hsIasL9yQFDTH(Qm~dZm^B*xM3~k5A3tz+uZ)OlY>lHnCDEMg-zZ8k(tNjKb
zwPW3Ig?}ZC(0=tNOyN$1MUHYc4=3U7cICH8(LV81Q+OfzasN2!8^IHZc^lQ+9~Ken
z%T`v#EywyC%6<t5Ns2ngKm^@tOqDvAs6cIKGKFbM#6HUnLRFC<q9Kq)QtI*YjfV6T
z%3KXFP*bSgscevM!aANq-}5)5gteX6c~@A^*tMS)zVBmsbaAVXF0NPfU4_fP-^ZMt
zf!4}p!KulKgZT!_{ItIqk#w9_28iJ|*{MyDjqQTNq>G|pT@}&}H2(XwvBMw+$^%3Y
zkdwtC5+=aCQeoJrYm+l5?~$PV6-9#dzBFXyaJKXQvvI|PRcAEK!{uQAx)m^is}f^3
zu%(Xzq2{rIA7cRa_!YqG905ezRm=!C4p^H0nAD;y;==}45%$h|AQvZevtKW|Px8_4
zr!;RSw1XlF>pFf{tz$PINPrXimf8Sut*R6d7OC3H&36Co-Eicj2B>csfaNnkh=i|_
ztF?TdBRaK@dDOFX>RTX;a8Q1|_?a1s6pv2UxRe(EsZ!SBF`7uKj*Px-nR2^wwE*H^
zPB)AQR<TjlIH9#jciaPf>zej+_RhWfg9PkHr0Tf~b}Aipb|jV<%WhKVA$VrB8=a<d
zg|qW>j<o@F?VBv_3t#)IL4Xp`c3LbeCM~3A?*RNux=4cE;zD6ZN@?vHvZ>BWEC?06
zPJnk#U=d7ANR0e`*ZfgFJdg6R%9<yB`F99%hnG-WN_Ot|L>=(#miymhodQ#3!hP?@
z>@oFM(4l#zw@V<MPj6(yAArz@BvgMZKn-MJ-52AtE#Ro}sxQR6+vnLtkG|j|rOYmV
zJiD2_a{axjTx_mco5GCUB@HHZnB)JaB^QXj)|sBHN`riL67)?BY@wcq<Msp_r6K}h
z6Q31{hDSd<VM;~60RH-rpSCg~YD)y_2iPJ^;tI-c^-*J1jb!xU42(zb0?fTZcCrRD
zxlhd1bZ{`rLmxr;LE6Va#NoC6^xvX7m6aMWZ7QY#hQArl<z<^KQ5&;0hH3EKS*qL0
zslyN{S01p0xJVM^3XF;VpEJS~uh|bOYC2kt4-|BOP%5}=?Gq2{k=!fpbxv6kPF)}1
z9|YxMpRM2f_+$=!0U<5}jysi~0rOi7EOG-(mGVqsQlBb<iCs}))Xm_YP6J<JgN+Oo
z{1KkajvMD=0F&_X`AN(N2Cq2Lv+t@%HH6qNsn|koTmv4BU6-dEplY5@!s&m-RgY&V
z-vMC;WC%cytyN>^__c}<%}~m)f1w_oo?(q2y(QHF@csbyl!ilf7$H*83$1tD^FsAN
zYD(<49GwQLz(7i$NP_d7NAdhmkGr#3{gmCvi5FZD=_oAvQJ)eCFAJ_GBi$<iq#%*5
zOrC)JN|_*ibBrDO{<^>8`*i*;>FG_?X;viG+5i)6&m>4rQYUZ)_#2HdDqx~LlvTdu
z{XLTamWg=JxqopF*j&~}{fZO)V?Z{_!2lZtplJOimLS0zh@aTqA9<a=8c*}S!J0RH
zV(T5`p?Jh*cf0z7DHlLgpa&LtwMHMB763K>xx4%r?kyqJG^5KJ(@%{SzDGGE1!sLo
zJ+yh6h_#rH0S4;z*6~e9JFn0*1#Dni{UH<KJsPoZF+ZSJXr_$xo~$tvzN6x8?kQ&4
zW(=w()80Uq`9mp3Pex%>v`F;56VSIg(ZGa6`16K|%io@63IXsm6B$<8O1@gIR91~j
zKTvoF)|0cGiYUO+<N->u4ps;!Y&yO&u2i@f9S}OQ53oqHdD_^&{K06;@w(y<)&$fe
ziJ~}(r4cW(ot)8%B0w0|i8#PARZy+WmD&dwE$%1nS8qO%6;l9OQAOaQiH`=n!DP#3
zmScGx-u-tYmlwnThrPG{%W7%c|D{7Z<U+c;5v03YQ9!yyN=mvUBrX~WDJ2yYBm|_p
zr3Ix^y1T!#bnkob`|~`{fAG~`L|)gr)|xeQ&N;^%?{l*Jug|`_`7%~ct?p^~R*`6F
z86%oyXQRDsfC3VENYh--1vyG2o9#c-1q!nG;X7Pnq_}!!5XqB!blW6DK8BUgs4Y(e
zLPnXqMSx@EX+)0glNre=#=x$yU<}I^x_~R%b<Yo*(*h&f=TC|WlAo?-hQ*%yk=G26
zuvx%+cME(JsC-@Z1afQ((w&vVv$^tJi>Ly34NU3Om(}hrNlkxXYeb_7cmqEF^{gzs
z=LLxHYtBM1=vXU+nD<bLO-G`BJP`I_kzXEq@J12&3j^!!(=`UC^3m$40v+<%KUttF
z@~`Zdp4^rH0=rCl=wh)~5|b%&?F<Sav$&(@>|wrOo}FUBC2?$`_3%X~6{F;}g-y-b
zue6c<Ual;o(-sn(gtpxFZoWent^&nG8_)=9kz5U@xp}^eQG!Vo`}<-15Nq<Jrj;>K
zqW#T&vc?0WbzVDyPYb`7lmO&XO;uHboZm&&ICg(pb_>kQLpWTo{$8p9YbpjJYz$g%
zvDjx0X|REX6F<w>$e*}@b?l6vs%E@?3l2RO?uWO<=Px{Eh7ZT88txeadpV1Lv0KZU
z5W=6nwi*Tc-puJ~@jok=D7-FXRHZY*%)GX<NP;yGNtJ&diGz{gIr9Dv=Q9c9-Tc$@
z@y1NBQrOA+u47zpyo)hAkmjCWRkzH+va=BfEwD81i!uGRcCUw)>ts~3f5&)m@A!zG
zIbA%xT)MRTBU#t{kYx1NwW)J6!P2gxi#GD`wlK?y9!nGnTCdGtj3BocB$QB^ul#jo
zXbO==uKa10*7hI<Ti^$EJ-8(`kW8<$_f6~lqaF}K;Y=3a^>=XlpUj`hFogTrXbRK(
zJ^ua<C%+eX@+R5PG{yWf`tK~_{{a?N?*hSr5nGwb;y=USUwsIyCx}3pB9t54`_1_M
z_q8D!P)P>dUar(y@Sm^yf36M-45tONNjAFh-)p|VUfti43AYV&d;HA5v)2D{bub%g
zfmTx`lIj%vYm)t^^?u(bBR06b1k^mj-?G4e-T9y2L*Xf$cJ&mxcA%2<T#~+n(zubg
z{SzR5jY!-aNN7ALe8`px{L0L}Hy5)S1HRiXBaJ}9Q2*4THa`rj^5^ddtY6Z0{mINe
zeD@>uO1g{s`Nix_=FDk_U_Qzn-8rhjg07#C3UUbS=*|W<zW|7}&)z3-b7=#qkX&9v
zksTqVONfi8i=A)xHEs?yY`|KEg8wu(`1k7F4=kl}!FLD%>h4KG{4Z@)*&_q1RLfyo
z<BJIvtu_!C#k4px(@;nZKG&H;q8G!tF&V^$>7SD>4n+cHucC*wC^xxoiNQWzF+-gR
z(1sE!Rnsr@g^W!@hza}$Jo{aq<c)Cb0`O=Y;&=)qF6VLcigT}kiuuvaur^O(^~mTd
zfcLm)2hx##CqaAjYK~qH%_~Ru1RKxPY{up8=;e;Ov=i&tVfD6G&O>RZY?=fl>-=Uj
zZSr0Z1K8%0XKfZ_Hw-sCBxHW<Kp*wJP!^<E1!<&;`>e0KOyP}-&01cvI+xG<?b?}>
zsI^G&g4QNqaDIiBEm(ojT6qm3AGIc+KuG$y_T~dlL>I{0(jlZPk1j^kS$@ok=rymy
zjpR`P5)QNSM&r#zqfW=M_w2<CfeF|XSA)$zRO<&EqAOU{A9CF3Xi^a0kNd4PJN|&p
zL2rrYdf|)FN-PS9DLN(834XXa8<z(IT)}-HVhFFTX}m^mJjmF|J?IzVf|Q6giR(oP
zE8EgcAho$34k;8sbM9hK>2AwyrU}yzc}aKOOZ*UW&OW!|*wVK`L|Vo7$NJxM_^+=g
zXRnjMVpf9zYk(PV{7|7QCLFy3yq}Ao(oZ^ES9hR1RbN7fC#rHq?P?B!u&mRa<VhRP
z#r%Qz;zMHqyNx4px$E>Z3zA3yrZZo?!R3F}t5Q4G8CyB8aeqGeFd^&G!r*)dG{Ep(
z+mBj?5`cjmfza1=_o{@O3;!F(37~b>PIHdeu1PXwdYIMh_psG=_)bpFBpHD&;a<N(
zHbMeM(n!^ofinmsRxreAqhY=eZ``Ndbc6v(I}D***_!>iHBn`p9a~hZz#d3-@uQPK
zeh{*)R{(Y4if)%kh)@eb3Iy<tC>G*ntFiq+G)m_2RQ&e$&*-3O!|a$3bLKXLOL>m1
z^IgOWK>{0=`2K-V$otcw7{A1R!1J2*)o&Q?+!ZRW=M6)p3|#=ijgI2&^V^h)cVBJD
z+lzgB3Lj2h&4HDAU{i|#;6~CYpdi!hS<O<s3a06<<IS;S$mh_e3lN*N`yu`hSB-J*
z1A<ogIC}X>nnR6^*HWAU!2qROdw_L%%A?^?T+YVJeb*kA0{S}pV?b>d%bfviGZR`P
zIyZ*DKi#>x-Z}hI;`?c;zz7m>YJgZmuoW>VFS1qfP-w+?a@WJ3!fjNGL41ZBPJ)Nh
zczsmT`$g>dM~;W%?jn$h9J1@w5NVD8G@Ym)r|W>(`^7<c5Kx82by7yVFG+~FQoSyL
z;?Dl5;e7q5_gV}Iis(pphaN#{ycPA}7K0eyvy~^Xz;3Cx;qOz@6BUvp!Y~zytP(f&
z`}hWO6V!!2ytyX|Bm#osDZ)5tfxT8(RIL1arwHmW;q>=doK}dk%^ozp36|A0qK=7%
z09x~;$<N5Q7ID|CCB=aXvW7%;Dv41Gl7Se#vR5Z9K*M`n$4iajjWLfN;{(<b>OjPN
zDpZi(X6e}sB#SholbZ3@8}>JbK%5GpHnX`sFi>~UuOA=gHtpDWRl_OK#1_u`U|gzB
zbs{Nd7bL2&Y_YIdHeghync8bQKkbw-YT3ippcECt3kwBWL_vBLhK9GK?3~;|w0j-h
zCjbUBU|;*LsTeDRRq3>(krvzrlBjQEd;xhLqi6l2@O$a}Ym#`H6&P!3k7B-t7M>2%
z0~xg#I~)|8_)`nOEIz=M_jm9YK!1B#>X1Q-2`3pl=VilB_T%OYj&DCd%6BXHNZ4>R
zreAcyj_Ywc|4KzSF&)~wnX;Z1+53{&Xr!LVXSKNl_Kx@gT1hMy?N;x^!OB^b`>K}P
zq2ftx4;Bw+|3~}`+v2YgW!-P|dgK})h^`|yh@fqgXHPeQ3MB-2+>l#JuNC_gU^i~5
zN0IYy`cn~T{l^B)(yu^w<K%nOXQ1?+%I$QK>PC00+&Sha^8yWXkKnZHL#=JV7vGa(
zQ{Xmx@kUsVA&HmIC5k&|#QvKgUkr!@#>!LGxPiOW*KEdTJ<4By2`=Y-Jj5NF6_^j*
z57j>bf?OOW&;y2FjIxcTRnP|`Agu?{YTW1E5X>n&C2tNC=F{(hvtLDAOH0@jw2Uz6
z_Nq?XoB;2akAdcH0q)4k9;Zo3_;RvwgD4r#b6_(Ey-v<Jm$S4nyKltU2C4WUZROL4
z{yC-l+<7<VOF?4G1;wK-Fu>fzGWtF)|JWBgEMT8`<MkDlhV@*GFqeg$M!hLG^$`|z
z=C^9jI%5%q>;<tMPmSip<NORy92*j`$fKH7!Sas2!QmB))pbgRsKCuMyo(<Ie=?qU
zEv`t>RWy?nH0l!DpkV|r=(`@vlIghDA=n{wPPJ$?a!}yK?NCM9OLs?<5S9d2V!wGG
znMo&Vdp!#x;nC#xogZ8@L<^_xd+j6zpbSC%Xr7Iy^lL@&z_3~X(PADCRWrh|>^fcz
z`26DIc|w|uMoOZXaBR9mhyI$Gchvj48&JAgW?<~KA5WrE?yOW$?T~leKIhzOOOeuF
z6Vu#5tJB}LyM>gQ2ef{xsf*wWy}L@jYdLiaYfNr-d(~#_{=ND$4~~~<C|f*e5HY2-
zXDsbo%Hc@3ch9lU_KTA=UqLy@GSduK{V@_yJj#cmty@v*CW(9*#GqBlU>V$Od%QZ;
z^C*0Vw>RHlAVKO&$#<25_P;pMP0)SkZyPf!tF!ZAQb+JB6ZFIrp|<!yYOOW8@?Puv
z>p3(DU8^`vJI&GO1#;mLFK@5h(YMnwd^svf^G?)FO35@|EzQepwbUYrH~aZpMY-m0
zcTl!~R6>!!wYCZ7@%H7E-8S2a97GhtcFbiq%)M0XHfG>18pFHOdJBubZ`I^;05P(>
zA@H8+!-1hxt3z>gju%c7rBa&6I9$U)cKM)1bDdcxfx9-utQPF)6+i_LFkfEq+XmuW
z)$_m^Oq3?)Xrp)yI<Z?Z&5<_OTd?jptl()7gmI6F+2*T{rv^@ebZNLOHDH~o+J3RY
zkmMY>+z1ba;GF8J?t}mLaW+1(2p;2|@?5zrB!7ExCM33gWZO!0K8MoA2NGeS%y<sD
zEOMFNc&|jQk9Y$Z(r$(no^F_0;APYH8$1-mBFfaTh+SzkDmIcu@g~9ASB+(?Hc8wi
z9~w`wk$ZYT7kxk5F6_RdNaXul3hO<mgdt9F@zGwqAs6H!uzd7omgm~)xOZM9icU@N
zlSHPxj|Z`r8WQCTLhd|yZ?LU10PUH-ZJ4bPL?GqX_W^re(Hq8iCUB{t`yF&|zv)tL
z<he{>n5WXEDUF3#qtI4tGic#<I(9Ik({^}v&|&N#XMT}7Uc|$1^1HKXiyv}AX><pD
zDWZ-Bm4f7b&N-5~Uq)i5Nyl?545T9mg4ZP^TFoN2XamfNx^%XXvaP?&;CeJlnaF+c
zzT1^^E1q&cY^4y$h9=gc)^_kr_PP^N+e5o`y=R2iX|tDBW<N2J?_MmAhFFL45Y&0%
zq#-XD1QQyG?bS=3O1V+Dl<~0ca7;w=q`7l?A=+cnd=MrW<2`_;u!D)wdmt@0!K4cy
zL5@J_;a5f_ljIqRcBVmkAdAu?%H>)7yX*p)L$&E6J{HWWgcj=MBuQA`=6XMzqWu0u
z9TtNMUleb!R<N$1hOU(=wW6l7(jt_cN0hR)YM@B+$egtgb~Gj9y*euGtMCH}5S!&I
ztU*;LLM?o32e`5?HnJs#+}-fvmL4`r%lFPvQ9l*Y%&}VINhPeV@fuujk=~+&sn2z7
zj)6o)cRjL~4OQFKGm0-F7l8)BD$FWs9n<<N>9x|&Y&$z;rf}QFoW1@Al!@oDWm@^d
zT25f2<Mq96m@wI|hCt`YDrCMFimo|#whcNZ=|p{BaeWTp*$N#(aG0iFkn~+cIy7u(
zX};^i{jO2bDbZPV;v<b!WnzOHP?VC{D~dC?2s9Otms9*yYIhlKpHmP-eGrh93s1i>
zB_BDSQ}o2g_enPoFrN#+z~mla7`P?RsbDb*Oyn)y8_+7|Hp|$rGbW=%BU!mLYiZQF
z;d}}ntY%zk%fT0SwBEU%?xUGgZ>dsAnq@tz_6UBS9YaGdXSAokvA*Vr#|*3GovOa!
zy4mN-8(8=xQ~ThRqUdoU)0K|7ZexS7pk_B2T@o)%Z1kbrekUHuP?#xNrQ&31o$Rwc
z+yNr2XSvCy#q@O1qFJH^a2wi>8)WRPMxy(f+5LE5@G7-DxVFK>xg0NwFaf_EXJOT0
zyp*utbbGa}j>bG;sD%3}46}oN0=+EIiF}xfHU*o54q+$?`2QZ@prdx^ofBPYAQR81
zv8zeJ7Iz!wDW<ipIy`6S62ni}2r&<h(H{kuP|e%Z*bo}^iu^dqwuvE*J9f*E^>nhh
zT*zn=k>25%cFaM-S1>0YxOWuQk|NrZC(Of@H9!f4P0Fc^BCzamVMctgo=VZgy|5f9
zOQ$J|GXB%!HWKP$_%1;r#c)K&yF~rrw)d~g?u@7Nl68E9@!7u#Hx<aRM2laY`SA0D
zqV`)0^S9K@I36y~>1UsAmX(rp@Q*Khu?MA+Qu!VQEpztKzq{0OSPy<Xnk{QCdOWEI
z0t??#EYDK69cxdPf$1Wa=$ZmnaHLg2HopD|t>m6Gf=m+{D6`39QiEat_Gp3m-Ndv}
zkH{W%toCD4L*D4L=LsU9DDHw)xLp~l5OFsl%lwfaGHIx@Duw0?8r+)jL|<sj3?uZ8
z!*~Tt2Wp2kKlArjM43N56Q7ZWpPR{jY;2L{pH8wKToAu)AC5UzXMRiN$7R$&YKI@o
zGP#dt+1FRxE<M|qhf-fchHYFD6;M!>r<T++QRYy>gSZ6-jqt>wDcut&r$b^svDUPA
zcZb|ES0a}cX>rcKxX`n%cNCsmPcObVV%oPzBH0fkU8$yFmc11m(7}Wyc1~yh(DyPd
zw6u=P>pP+J9U1r724g1HE~*&h4!)$8Es#b&`a(_b`HN?L0qaFtX`QlN6XE_sYJo<l
zyISL_N06lWIEsu@Y!uc#!dd=SoDY58$V2<_0*li0_dLc|&mQT~D0t4cS!cQvE|vu|
z2vra->Kx_=N#@&A_j^jj%KHr9zd9!PITrPvnkp_Xu5Lwm@z%gC`y4LaIk!RZpXwj^
z8X447jH?BodZ?M$)$MhxeRA|IivJYt_4ug&qr>G+c+WRb$1rS<+1`!X6%pTT6_vew
zUhk!k)KgqW-UZ%@l&paQL7=SUyI*`g1nH+LA96)>W%p+}{0<nr$J{ksj&vB+8-@lG
zbh=~IV?Uyb9zkpoWc5Vzfu40QmWyFGJQt%^;0F^m*jwL0B~2LO&evPOic9Qd4AQrh
zVUZS!Xz8QsA)6tq_Iv?on<2uNpJ_>(uzl9|!3Jx6-)FwwZq>MTQbTLYTc&NiE{v@t
zo4ZYt=!D67qX+X<6ADK};<0!3mE)>H#j%-mHW;UNr6tdD9ej?l_mSmr+DYkjGO=Nk
zqu6m;kNqxpB)-ZmrUn){35H`b!%XPSwCR>eqmaHe$-k6Zlg2CcqYMgY=*JT5;G=(N
z5D~cd(lo$%pp3}3zl1|eE6X(GbdUfCP9vME0k(4EO?ksGO$WCW^&g-f9SIEhi+yvD
zm79b*kkeS!<wQk!SVWBu{u;XZc`&+mv0!*zN_HtpxMUb(U8`(jJZgtJzxdZssqWL4
z)@TEAC0><l7jD_vvv!S&D^F!@Kf)~73pj%?gXwJ+g$Hy4PY{<>xB|%+gx;m2571^(
z!C%KF=C+<r+LHzhkHNm_wt482Os@zr#Rx3E>`)jU<)avhu`jxyRX3~7ck#sOy5MMV
zAr?Q50Zt42CD_qEyVjezUT+#q`(_cupbV$*6FPggG7F%3vJ(<`p;cgTnZ0e$);>G9
zwl-+V3Fdag$8XkEzbRDFr%>Dx67^iA^BUOgpQEh7T0$|ew)_QIK7M`qU<<UjCL%fN
z{=41v_wGDGm8EB`<`Pu?+E}hFZL6@jS(i8oB$#jQpZN2q)w<2B@W*Y5aE&h6ktEOJ
zx;S)EMaSiYnc-GBmf9O${7b|Nn3jj{V|5TBP%%5XX&H2uAKj&;J>3@B?sglZ#OEE>
z>e)+?JZt_=7W9f#2Foe>V_Y&~2La-6a(wV4hYHJj3;SLunS-vcms)NZI${@{D07o>
zc|wb9d8Ar(cT@P8X`K|zbgqj#l9G4y;YK5I%(bj9{+ER9b~@OgBTE4?!`<viVYBy&
zJlkVTL?wR6?pCd-3_(paxLCwW{K}IA#JsABNurXcYQ8+qN1{Awy2jTJP8_s^?W1|y
z!U?-!e&)>1QQr=BQDbTQ#ViI_Zv3Th0FafPy~T$gB?`y;!Xxy>#u}d(_Kr3~`w2(X
zaCzQ_nnIWgw-oGv+MWM}Jg*WNKS6Of>{U~aMsM$X9kI#7D`BnXj`G8D#+RXG?M@Gl
zNUhkJJ{h&Z5b?Xq`(1iZ^DP7F7pCuo)mOI#Ssz!7sIz6F9_n>Xoc|yg`JQq|Y}hr+
z9p?nUPE2+bTbNUJ2h^yjCw~@nIx}Bi;1uJdXLc(PNl!g1R&rFPZ_t`FVV%-0IC9xh
zMVtHA5T}V^ZBYr(^H(GH&4RhD9;%Ba6f#*7(2NR*`o8{Mi7Z~gMsCQ1ejvt!Yn|~(
z38@9U2&r9k;j4fPib#)rswX6pdfKnwh4$y<@WW6aBuLS>mII&kWu{XHsT_?$T-@zv
z(~qD?BJ8+jjb|OSgh(~N5HhfdrA$EEYAh?KeMqFyfobbNqeQQTpb$>IRnr{R%hn-8
zn`5vyNiL^7ib4Ht`?I(&RIV%8Vx<3+*6ls6ie!p!XEoyOPgQcH?YFGtA7knfW?FQu
zOrr<IN0!~jsisLly}$V7B@bNxo)P9Hk1a8Fny^D5`W{r5jkorLEqQm4o|ynmR9cyH
zeKL1iK7)+fye7Y%z#drTR!`JQ&94f=$TrCWL_{oP1W!!b=M^Oo%rj${VHt;lR=Hpc
z@Xfic>qUWaym$vbZA{YsqW?{IY?%D>I*G2YVG&YTdtP2a;x|Vg(_s;n1Ho9Q`Ki+a
zTkP4{Hq%~Y*)P4GB|R#y5k2t`X}`|@7K$-jG&@r45ph_^WP>$vvH`NEt6EPtQ}*&p
zoT2^HN^{Tfsl}`$aXe(16g~TOv9PDzXuU{})Z2p;O$^$aO1NmWVH9610(^0)ALPh#
ziF-DJA~m$39;@9ybSU9EOj$n8G&G(k0^vOc?nYu*M|4yTx({ckNXcb`s~A`<PGx8n
zvNQKI$z){27faDzuveM+V`eHuA2odQ#uzrp^tW&At<9O_Ww-xWC>BbqK7p0U%ag==
zEl>IwEyAYlpxUP3T&-^BU@ZnxOlL!jA>$U{i4sY_^$U_NzajoeNX#7QY-`c!jD;sk
zy&fz}w*0vKp5!a%HdRhOg^vgDrNG2WEqvl7E|kwU`B8crb)ww6>pe_P3}73z_d&&t
zT$SNkh*0_J0~0wIPf;inD%nnVnw&#PU*Wu0uN`r@DRU}J8IQy*aOsx5tTGE~{qbtR
zYV$^5JsCHp=7Q4)l4hwo2S9=1jn(AD@)Cw7qc2PAwILz9n{c?z31%gwV>KTjWTVkN
zOzZB}%yob%sFgb(a-CE8Mx`pBbCg#mlBBQQup>y~C&v*bBUkLbhXucXE6UrnU{}m-
z)`)w2m0~E{{&t|Tr^x(wG#Kg)a2)A}0Zu(ZO8dRqssvnXe=rRBb5dSg1D)NQ==ya%
z+}Wa?@o>yz@z|k!Yfv0DIkc<GfiJ1E;!Xb|0qpaf;qcbO7PUQ65f5>?Zi-f(YpGwQ
z2pr{`)5u7fd!_162{SjQ##2IG1?*F}8Vo+b;n0CE58kJBtn|=W0hy~WLtb|R_1!s;
zLQMo&```rz#}?rAZog?Tq16zZb|f>}^K@MM`rzjR<ABGKB((y*(^u1DYKv}F!-;iC
zkHS@#<yB_41sN}lvt7IIJL3l@J8Q3?w>xgdSqi;f7{WK?p53TNan`^OObtKIHK{Z-
z=7^Qf<)2`#;(h$a>TH2ML_C!x<Zbuv!>=2dtJIXliH4yCRsq^n(fbZzeCvA+{b1Af
z&9~esJOo&yRz+z}lH+qOR&$R}l8J9WzpGYS3;Gct8#n2pT0Z`DY@85x(I}!EZi$YX
z_stnuz)1#hn`9`NDJT5R%cLZ;iVJOdl+3euh!b6e$)<I(*(P0c*e`4E8Nr<CqD}92
zCcNT`_`HLh1%qe%aY&=%Qi~$|@DDnUlD^ybg6`0iqt+xrN`MTWeLU2WHucayoJ^|l
zN^44M(EDh-Mgb)h4>p{6q(;(>yGUYY`2wFf(KL1?>$w(4GVQa%jZiP&ZuP;MNjL$B
zKS!FUaZqQ{G+3};l{iP;5_cSO>pj<+=}*J~VwGfF+u5Q_`*XjH_hB=LYH7E72-)tg
z*>~*!_;qwpO>}Gcwe?31tq)hu{Eyp3xkYJEJzi8K%hXW~gs6<T<cjKE2UjVO2cc1r
zR8&dRd%SLJ_%&*uqttRl$9gDwFY1i8T~T4j^1F^X?aAS$+&)%WG6SKTDK1Oh<|>H?
zQdxS)Ufh7)!#l+X22Sv7=VxEdCwINZW3A|~PdNsd`j;8Hzsg#~C2_BNiLM*+gy9fj
zyk&f;xbu)>8h&=_V+FY{tSWMBO+ik;FGbCo*H@f#Nd3lbu`c}mAOXrYoti_ned6S4
zH`mv=cuq_vhtXK9Fsw<V&{^4V%&nt<78IJM20X=dn^DxnW%*VK(n7ZwOd`odU{2E7
z-wlp6D=5*8HSkSPBJG-@6U{`2?P`TDW{RTUr;=S4Dd{|YP@#lo7NV#7`q5bgb3_{|
zC9HZr!X!40&*_VUK`19C1)pi3EFEmiB)WOrKKX=z`zEr-V@f-&%p_pQy#gUk0F%Mt
zQW)t%ihHAj7lw{Y^n|0}0~x+E9b;6rg&C2o+-49=zWRxIu&JGi0i7Gt?ZuQD8Rs=N
zP6m_K#&Gs4>aS8@VNuDeyH56|(wEVTbT_DyFL=d*^XhGJVb*$7TwAC&0o*Xtw*jvu
zC1M;N))Q7Bpt<#EK)|=LTk^I0t*aE?aQ<e#=#|Vp7ETRYzNDgtBf9dTSakBAxp7|4
z;9;gToD~H~MtZSXa9r3AbZ;S_Wj14$l|8**FVF9-IBnW1zw&!^a@#yAsTUvD5u1Ci
zrjCYIi)Xd^Ef+S=cKb<Kk}~fLX<fGiM$<;5_5S-m4pG8S#myub#c!014jJGtdSVV~
zSr;-DV{hG^RcV`$@Dv-i_9RiH9qPH?{($I9QIaR#V_ApE-L~(rUXh1O_ZCGK#h0WA
zyYZAzy22Q-lxjcW$m;Jm%uTn~$_zyB(x?d}bS!rM4^d?=XedlN@GVw$?*8y=K+7^q
zowrfUze!T6&~jM(DB?{c>BFrOQ^pw*>BAq%qnwSXnu4K#FUx(Y`Alm8Khb+zC6$xJ
z_6CeD<b?TtA!QuCpv~CgWz2H|%o7G)gEI<jv7W+Zk*STmSf@s%iVx%`6^t1!EYH((
z0t(eHiwTJhS_3*xWi(rwIUJ-h0-N7hA<N;K!7Js2td2>M)NSAHb-m@R=a$!Ez{a9N
z=6VJ8O5YwD=0(yfdDB2UHfA>1h%{)&>nDj)rr#YgUX5dBQi$T(y<vXm7t6`K^dLJg
zj8I+|dqYd=%*k}zMbR%7Z%?nuLq;o^dElIYeL6;g)HUvT_{l}a!)QOSkiaJ0FTG(^
zO|#BUM$qsIsyqNz$-4>6NL$3=V#PEczmHoL!d>8>V%bD*&_iKuM8m&h1dxg_D0+Gh
zI$dNl(Pa_k>oO(82-SRxY#QIiD{f`gH9kx3yn@4?k}6DlBihl7;Gc6_@MgNVlsZ(u
zP*KSA$qhO|wnuCZm?LfF<G@F~q_i-gCO5}4f7@|?h7ONLF~M5?>(B!5%622gzdCUz
zn%UVL85zZ`n8ltCFX7T_I~7i*F=Aq^E>WWw>I^6_=KI>@jcD3Pjn1Pqx$C4si2h_E
ztu#%%_kNcJ>T*nrRTq57fTWaaXQS>DPOf{_!iXS#)b~T|^@*{Eifd>0zW~Dm&zH&0
zJm3p4L8Wc#y-s|n&Qjd{z?qvUwY&MXFsDq|_hhMng_pd!dPE^ZaGwNcwj753H|FpJ
zEB+2$%$H?h4|?F0;>nDb@04t$Sxou5YRWM8nz2Y}1+^080cbn6=w)v;_@gaSZ=IRh
zxo_cUVlHl%_wJ&qzbcv~42%0dJ+sNp%FSigVW?o8RC1v?du`X<X^Rf{z3)e)FQ#|g
zfnEFN49lJZDU6UvGWcBbv0}}<JXs)V&(~mAy%tIDHu09e39u7tOsar6P<B_8_wa+3
zp`-9ZbYB^E4`E0(-hF5%s?H!Oa;~260@iD@YZteIg(*NLs@(k;5yokk#2ljUa4>N{
zju%K{H!c{Q$>v);Lq&}pr1D291X6(=c%}zhihNkNlDg;e)hO0EXV+cS2GZ8w=3u4g
z=W%0>?EKg{E9p!Y@pTo8F-7%dwBT<4W@s*)&SyJal3`gL$ddU)t0G2P-)EKVFbiAI
z&WKQh67MeTB-TxfdyrJ0zjdZ0Gw9gY(|Gh`!K5-X&+a^!-V)(qQs$g#lM9=TND`Zo
zsC>z1k9xo2fpTX<bNvkVR~0!%m+jW6CkU{zJ+nlIHM~%M4@xs(lcp3&ulUME#66EH
z-v06>24!D8v%2x)^u0h!d%SzF&RE3Q=~2?5WT!Xh2<BM6ar}5)`l4)aWMvITM3Q$s
zYCcOb2fGl}iTxOTlAFB!1v>`kRySHcL5G6?_IDjU*Nhy|IaJTk$#qH5v^qgLPi&f&
zi?kD$4F2%t{WBn4$hIFkNF)P-B+v$aOZm1D5^VlF(V}GiDdVTve9QXb_p|0q-b7EW
zGBw3>E5=*D70xo3Y+@idNqJ^32$NcxjPMRC%(viWuppL7*HdFsr+H!6tLsJwQ=y_g
zx7ZT%g$+d1JTMrbqKlKTGOvwO9}R3!^wfMo*Zn}lvCLn_?sJj2Z?QNZlVjL9C3>vU
zru~qu*s(>D3(<hYa$29YS?r5URn>{y_A)wjv58baiOnCwl{@3TT|Yu!p<EfLd|o%r
zUw6!Ohs#Y}dM2THI^O#p;@WhJu69;ew6D4e`Bodj0Piw+<tOu>G+Z{`ih81q*<nj9
zCZU&`Oz?U<9#zdlGLefs6!F9;r`I*dWP+2S1)spCkZ08)o9&gKK1CQ$a*gyZ)`M{`
zziY88NcX;)=wkq0ClegmTb6<KDBMenPv(U1Fm-;Ss|q8&X|^hVVim@~-0?B4V>g^q
zhWUp_((Vz4Rk0o-pYq;;gtBW!CH`tmfapu^*yS^M_6|hRvlQ1@G_#vg@)qzGq@b@r
zSH>}i{5mOW=(~FNtPu1jBT7fVMR^Ml5B$6vNE#S0Rq+990OsE}RoaPA{=Uzz{G;p)
zbzhh?d6_43FOEEe-?c)>$B}!8TX=)cyk@0X@RDb96s>+ZPrP2edVQ?<G`U8G41sPi
z7$l>N+CJZY6Do3egCzHuakiuF?g+q(u8BTGN17t%(<AmpbbMJXjjgs`e57UkKqlSK
zVT>okwEyZ7H|WhGEO3arDL-+Oj`(DpnkmWWbMrmqf_Cs6-H>r;$#gC8w{a*T`W6{G
zuX*darhs)(NmRxmR>oWWlpy>$HdG&cg$o;Qkta;dRt%zk*Vez`s6&NYxNHL1mL)j8
zN}=`k@@h|xxl(0dfvHgXoI0Lg90$_p|KTSJw1M0vHj}QL)&J|S|Nl?_t6B2zA!>;3
z$$A01%LphOE%0e$z6JCNV8Cj64)h2Zj$r4%Ojk|8_)Rclvv3Aw;o7ZA{Rv?9VM_m{
ztzrTUL#j~ycu?T{(=Y~8`e3;SWB{44O0yq60rlDm9DqqjmBh%y6vD{}mwvNL;%D6&
z$ExPpg235xBLXbh{wiRXXudkv@3=fGPp9$x`|>$dgZcW%_{Pm3WiduV{5L_!Bypzn
z8$5%Mii%E3?_3B%SZq0e`RBp-0fLlGN@Dzvoe$pBh3^3zA;T@VxeWH3(ItS{MLu)o
zW4{R~=gc~TAB%0B;r4i7Q{uQZCJ*9H&09d#Y7U#P%SmkG5VPSrD1{dFRYFgK((iP>
zVxzb=A2_IlC|vq@Alz*yC6~%;^_}zsP0FRs@&R>6&tCnGV9%4<*$isdb?4n?G?KDx
zzv;$5?z*?6z=QLx`n2$0uR%T<blFn8#do^^87naGnF~Z4cF8<QKLpnOd-VX^WgeGT
z(!RW0k<bAC1FP-=b!}jwl2C+<R3nfpt+2^08&Lxe(Cn%yri>V$CAyGZK&r73WYPds
zN5Ko=KE~}Q5S0nWi>pGDtem@@Pv>9WZxCYS(Wjt#(m<0}0X9l&mLp&lHMXj|S<AZq
zP}mL$lZU5^F$KU(DOP{l&ZSOb@LZ|}FmJs(RSid<Y_88%N?M#-hT#A?WHJPv@%94*
zq(f{+51BXMemjCeZ<!p1>?mekoS<5^O%S$#A}BxIk-~jR&9$Ek&;0@r-9+c-8kEG4
z8KP#hthYK5^4=vaBc<N}P=KWu<GwX1N+t|+CU7WHvT-J4z$<H;i&x=PN;dMc@tQfv
zOct1S9eI|D=(OGv9|4))mU(*#sZr=-Q9wO^M~H(S7Ma<LcJ{>cA(o)bQD}!?yWbWv
zU_FUyCQolX`sA1gSpqO(P_QmqaYWcZeQv?DdHv||nzHsKV4F1Xu%PPMDu(F4fj@?1
z1Kv9{VrNSUd5(k8>|BA|Z*k|Ac>otpKM`Ze0-;Oc3K_=0LX!uKHkBTMb--^%o<J!9
z_}|Hy<H`qU+tdCxS8H-yURq`!y2cxhzf_DqP+{2Ssy`f_`pf4lDe?cnUoObJN`u|P
z8jHpPyG0Y0NR`2Qpq9VzPZ%YkAE=<eJq49b{Q;TRGU}F0RAKu+z^fJUOqC?w22LV!
zlF;V><<KAwO|T1#xt)x?xBi5YRr&OxhS-;yB&9IcD9CvB{RlcFVA;zkU(+zhzzqvx
zFIfGq=m`-Xoz~Ik)MO;z*B%#~v@3V^)$}QnZ3%zgPiFpjtuTF5B0(TSRUKZdkfI86
zEwh$$<MP(lW*I?+TvcuwHsJg(a39d=1{N&^JO+%c!l|397B7qTt|2z1UrT}F(KfU-
zlmQu@Fq6Y0SaH=yb(kL>*R5JC<RmB+_d~!a&-`WUpU!(u7kiH8g#IsItg0b0H^1es
zjHE@?mHN!aJ6hVZ73q}^1(~eGcv>_$0t3$O*$DLjG);aU%)}AW%eO%Re{nSf-h;~h
zFl@tC>KlNV4(i!|`Ce!%0nUq1z7Mx2-3(^>BwWg^mHpDS`CaBVw&0XzkLJxQgimFT
zrR{gV+hf@o4$R=T$5Ii^vc^3p*!Xq^+@sg(c4%Gb=z*IIyr^`3{=lALN6)%%m7G!6
zm(9v#Up*vG_NbBN=CzKIo-%$n%7lnxhu#rMi=pq)cLqB<M@6>hxzkTu!2rt7eJyzQ
zaX(BJ#UhNmi0VW6xl}-V!JnCL5DA16v8Fwa|1^QgI$i9E=X<!UA_kTse78<eawR*G
z^X?)8KDNa+-I*<cIhM63=Kg*->$m%nR7$tt%NoAx4<A+6<>mlhPy0QVgD1VLxlsNI
z!0_HhNN8mvmLTBs0^5;Jp)1t;lb!Ef1*OE9W+ZzhQbXwB*U&u;ipjajL<M@#M>dR;
zsbf{*27zbk`ayA|PXH_qum+OS@28+sB$&9in44`J4PRAD?!wOi1Uk`8_T&XM5uP8L
z!L^sd*Q8_{?Q!bbH-IC+?^UcBC3VDJZgy<>Qz1d#gd6PWVudEi{9~Pd2ty#P=EV}?
zmBGQ^1<>jv1`@5n`P0J@4W04SWgUa0N94d4^?j#qMQQ~qlYSOizRj-J<t?H;uY33H
z^Zj8Hp<89Meix7C_pb>bHF!!ytb2j-xQjwbak2};xLp`ZGf3H(k<C+T`!hI?s)04N
zEa9Z?z2AyP-s2(E_NoXxby@8IU!uAP+EiW0vS){Mtoz9lh1KjOv68ar-uuKndn*z*
zU)j-q+7x7Tcsz`iP;rk9$0NpLD7>vOEDeq^anv5)(=PpEYi=@uW?d|%SO3hq`P_)m
z)cR`q_K@!A8MJBh8Wd_mbt2l5kt7cbh8&<#Hc%Zo()V0~VJB|UrRj~gwDQoJX}Za@
zACISnMO0hNfdfoRS_HPVn(h3F@R9e~!%ke)e=d|o>pJ!@k`ft*#3;N*a!h9ST<j?n
z*D-W^^z|OIR-jJAZvA%6hFO{U1ifSWlO+51SZ(v^Wy}pp&sBkFdy7_4Q3qMc;BE!*
zT1T-I`2TqXNq6v$Tsu45|6>*pw0U`J2LJ3JhC-C+M};$hr#~bao7}$!1s~Y&;cEq!
z_7GrW&<A3TU!sKZUKG!I+?@iM#d6FckNDZQvM@m5y^H7+2OC`tc$>9Nj`Z<ZLpikD
zXf)Xi;4PO7k2(_!n>eDp{s1Zpr4xvv6W!5>F_IPyc`cRI2;*h!d3zcie%L6H$msdG
zPaZKa*XLkdp=VhtJR%G~?WOV$lZQ4vX(%x;!=O{spGpQT&En*W^sE3ef65^A3$_?O
zrx{RPy0TR@Ys9%y0@wER2ieIZO{%{pb6l|hdwy$a@;_;4)2RHd0aViL>SNn1Q~|Tm
zBk1^-JOWzQ>IQJgzzc5XvxN}2ja5631<hR|l0{PImkjiFWnFIY2Y#LPIJ(EpMz?+T
zq?~>l5SmJ08PaiHNSVMoQ+@G?JxG{0F91bVCc9kKcxC@ce)}E}Pbn5jvl%#*gtn^}
zl}T%^igrpQ&-d7<?RV{aWPZeNL+98$kCa8Sr^O8hPYg!jmzJ<o$b9_jifi9mwrB$k
z4h5FzeI|1IUSq6IoyT}x?DNr`sK&HIGb9X>*W&=!x_B8NL635!Wg|bVw08FN4@2+`
zbkwIE?K=NK1_Et@B@gYIxTAt)4bJgOdIR8{r+U3lEjqZ<%Y_(Uz6wZEA8p+g@w<D^
zq3tKpV_CUN(WejZ7lVgTGu>l-Pd2Ic4bvv)bWSIRkGVn3CX!k6{3s_3aREnJ8&AMN
z_K8M<7i2_7COaS|>Pq+Wq^`j0%JCA$lhyJ9WwH3y#u|UT<=+k`7&(Mo=HPw6L7LO<
zq3Qz`BEK_QkmgvSn@sTqaRS^hJr=1Cu418RcE1CgAH&%Fq?0d5jXTG*H<|VH&?XU$
z%I9;dHP>q<g)V$wHEGi`FVw6B?fb*+<&u^W#z<d5DUi-hPf0J>VZ@}YwkBtu-2HXf
zNvo#No9I2ZyB=brmYO~rd#9i3$$sPnS~3?Rbyg!Vn;x~t`K8$q+%a8KJyfPqQ%pV$
z!LGAfm%VMz@sT!;_=JFl!*}7(-+9CJDamUIhlLLp>?iXZY?!V1JD3g9=6}w53T(zt
ziG1sc_vP=Wf*i#1)Ui?RiPj?{1S;%tzW^1*<M#W|g=<>*9&hg4+gx?r%XxQMxHc5I
zynpr%g9%oI(e6@;d>e2-3w!%12dZ|tb(`72dM1G=9aE7KT?xFu^lqRtp*r;!`}w-#
zA#4aboWx^Fj5FQ2hlPd9ocW|oD`U*adn++nE^)VwEab4oJ@&F}MXLD{f(11C(3Dh6
z_h*P$cF^Lz@{}4px!?`e*70;u%Hw+xyze0V%TkJkkRAe%D8|v!S}xxF_2M8JMpyLm
zpYj+f&FG_G$HeHnuvXkjW6Jg;=d-{29X%oOHu68Ck30xu(n9$k47L8uhbbM<wrWSz
zO7@>+4FuP0;obk0V*X&p@m=+jBS=lRXf>J#&s0cQc0#n2lTI2HJ!eB$bd^cE|LQoB
zA|RqwwD!LH`#b;D@(^)?58*GtbHX<NnS%d|ka<f1V#LJ!^5B2&^1le5CUi*6lYaiE
zXv=?n^7jveP@R;mUFWC&`_=!HeW9sVpZHHV|F1>yQ)sdL!b9kHNtpk6b#7_!Y;ZgS
zCcydq*KPgvLj_pD%Zb#H{~uR}(ST=@M=wtJhx_`k%S-_GLpFsG&i`?BI39R5I^=Ps
ze_oEfNg*ACnC3yHV~G+Dpi%>>aS+o|05Ty)`?7AvH8@{C%w^zDbqi>qBZ8~sNPf4u
z``0*!M#LNH=b*}2F35$e5??^8PiSHB#ICfxaJU3`@YlcrWGZC#6<Rf5C>L#r|9y@c
zH!IX0n0f{O5Q9Jz3y`E|W!?rykj1J46r*s7k(HI%2b^*SHBvb``1W%2r`Es4nm=tH
z_#sR(1C(ZiRwffBLD<SpYTBypk6luKe}az;e1fmm*HGkNuk=tB`2KYP$ukU2PRja~
z=Gb77oz3LaVDsl&=peQlUD7T7U!4dzfx)Q*ksOtZ;8-XJmUEg{<nb>6e*+MYJQ_oF
z=;BRS(%^Gg&s25(iGtjS_V^%`B(o_7wRzTt6sS15rvQcnRq-ho9I?Ay*!q_O5DckM
zG^gZ0|JAcb$O1u`dChddz=3?`1?%gU)&)Rf-qYf#Py3Pg8{krfhKp(~qf6kw#tXM6
zG=jl$zR@n%6UYVd?zSu@3Zz$mB@O@UAOO{c+_KF;O$}ynuay(e%p)AK&9KO?!LAw9
z@N`fW9`t6n;eR*DIy%@SN%RDWxH1}rtL7sgLSkZ~zus;jK2)5f?Usn=zuH~Z5*cic
z#E2d1g0rSx4+93_QG{c*8EaK`@9!D|DSA)<(c4;^_}8d^ON<!zJ|NvB2D2N?#ak7C
zr%29%xRV+H3%T_w{C#~oNdM}3>(=tGTm0APl+=d;i(KFQzZwd>w7<t;U>xKfvKSOL
z{rh_VeVMl$P++0`wfo=y{r4bm>Vn=M@6(LWf5Pg&?*C6<xdXbPJ-&;_|9*873n&#O
ztx*5FR?XkH_17SK3dwAhVM2BP`_;L5p@D?;gy}Cp^#8rb3J~Pw^xMe)DO>cfh6%uj
zkwSq5^%LR$6<9#b&E_z}`9Fw9I2L#|x}Y(Pe+8Dm+XZ?KdkFcw!}IF@AP(h2!L!9l
zZ3O=xFJ=tgH9z(vU{^9AUhljXoC?>GxE(8l^I;o*yA@=7DHqo~<@f-Y;wU^W89xjr
zRDZucBnXjDUU)Z|R_LOqb3qxzk9FTApnd5FN`_GJp@!Iz_6j&wZu27`ob$E>!69)S
zFB$;^Bdl-#<&iZgYr{Sdj)TbP2b(6dG=73YH<t%04NJb@Jf;`7e{Gb*0zpNAqH-Wk
zJ-#vn1&%g00nM24n}=6I-6G?8P$JN{URWdyB8#UrShTYFK7~$VOb1X7Pt8C99wH<Z
z*)V0!g6btcs@>ot6=y)ddpzL-WU!4*V3*1ObqTChpPWOUXg7fwkHvT<^D)1Rt#QxG
zy-v5u&Y$pGiyfe9{nR^(AzYXsj`-<ZKPdY%q+8~<lPPu4!M&5&fq1r%OFLNN+YKZh
z&J8<o>E$!)saa4jO878`8CP^y(vxZ^YgOk5w_42#_fCw_PL3{WmIe-DP~|eUFuM7-
z{4|G&qaAQW<lTp>QZrPohwpe&RTrsjSYP`B@uL`yL<9$wq3l)nG;zKbOAw*;rU%^$
zeLo>Sb`EsBPsJ`bVRX@9Rlefb_#VKMFAS|ozZX-Tbt!awf4O3OMMJ3}ezwHA2_z<P
zbl<L;4Z$9uxJuyUEry=UuOE4dr~0B#fr3yWb`kcU4gkwpbO15=A!NCZ+JOg3ppDPh
zi)xQ)(7Ad?rRUZPvN&@C&rwlr5~a>NKwlaB@e9UYHRY_LT8sw+e)WyB=<p?~ax4Ta
zJjL}N0>b_)BC|rp<X1Cdz))d2BesaScsn6lvhkRqwZwPJHtGsx@gd?*guT25qL?^x
zieFbl8@{=hzUiXKsP?^5Zn1#8xIkT5t&Dfr$vM4-<>Rtkr9Mv|mPLu;@C49PCpJ3&
zXUl#FF{=h=rF9<Ou5(}qAsy(h@A`~7o9oqCP1sk(%VDvEFnj|U&)6zidcl)f|C|2O
zPD&AZ8_Qo`IOC{k#6WqPV5<Q~s}J9Q0e;hP1=@b()2(>{YLq3t#GVi|<M8@&21<Du
zFM9*o^#xSZgU6R6fAQdFOcNyWd?E3rWAzC-i~@4rO}RVqt`@oR=>-X!=F`AC&opy2
zBWi1F^#ikMBx5B%BfmnHeo2qVjLhQDj6pdyJ)N<@nb&et|8>)9$C(7@P3*K~C{<N$
zIry{V`}617uW#P|A9m0)87vpl_VVXG8rHs8m)ZVND)Y^{m(vfIWrw^WNg}{9!Vu&0
zm%PXBb{~3uL*w1IChmO+blmWsK_SD$ITi0e7JDYMqz+e{vp-)>D|4f~*(#ekO*5OS
zc6w|<PpFxGsxRHFxzeA3^7WlT=NX(>eP_g9_B&O$^0G#Sa+98+@CEj8sd=ZM9YXO{
z3B#9;7%Hxb9lM)7aahD-gm!1k8b;RBn5&K`GHKakT{|W1HeN6B-7Wj@h#)lFLJCat
z5D8QZ-b&>D43UBt*F6fi9Ko-egV2hWVQA@yh=`+g-_isdJr7soybSVHNgr|N$VWXm
zuuo3jGtu!jo=KJsVXe`fHZ8)C6CB8rAh9<cdBzZv9Pr#3l`PxjbYRl8xX!(zO~^lm
z^<<gUC-sm9!FvanLu(#Opg&8ZWWCaQAagy)#(LQ^DKp`PBsi%i-Qxpn(fo9G-m%!=
zEA9T0#-@^F(Si5Lc6jJ+8OQQYvRa|g&sLn|p<}Urvqj%?$|3YKLUV%W@{K+&97A8t
z+A)VH8M!8^9B(>0I~A@dQ@BlA$gYd${FK&^o_u+hx1g-YcwBtdIeDG~BOFvPC@rsX
zJtk{=oT&PQ<?$UjK7-Jte;r$B;`z6-?+jYa8}*6mvZ)M<xTyUP$6)&n^sIe|GAo%f
zXXcjEE(JN3CG~Z6=|!?h!(Wi2DaBZ?`#n2UdIfAH?wlcb)W6@4_P9F#;=yR|nJKq;
zc)0d3ka+7O=|!z(v6%Bx7;~qDY6NS_a6=Hi*1HJi$L>b;UPqxECLWJfm7XA`eWJK8
z6p78b0q;+}^=P-u_u_?<f4jT#a?k6pcT-)d5w2m{R;6G38=qviklH;}JAQqFE|K{H
zFS|}KQIGf7+vRxkr=Wq~+Hjs@B0?!n+y0QC>0(FJ`Yc!4(!s0`c#or^ekISH^LIQ+
z?CMlz4~E#*kkFe*ublZ(Vl`(@NH`5V2nh&i+4E9zofAET!e1=FFVGn3Rc_{0{c}gz
zs(9!E-@C4D3WnMD`rTZ)2eMQSYAHH!E`rX-2`j6wB8_%a(%u#37RXsj4w05;rlPca
z@d1l5(ZxzL*eA3~MH1BPwyuIPF==G_c%zgBZ!<I@4S62?s-N$FY5narE~<X^ON#M5
zAwLr4HDKj^=4otf%rN<^moL5NB1i<gy#!%41}(#YsnOfx^Sdd10^-NCqu&tx`Jbv)
zpUEU9l>d1Cc*U+^K%JOalv)3}%cQS67Z-z@=G|&&II^X&iuU~=Y(F#>aP*_+Q|pn(
zB}N=GTFOF`9F67z_7l0d%|1(?<}3rQE>3jZ3cnL`Ek20n^NlJ0p}9WlKyf5C!RsvX
zi+&F7cecIBuh$$_maZ*?gN0QwDQQXjx_7VYLz1d{<<0X-iL%LCsigJ<Vamysf=-9n
z*&Ll?_c5bANaNylXEBTIsw%HumBSva3rs$)k_|z;^O!qLlO<wF3eGziD;x524t8|#
zG#nEJw<pPZn5Yq1Yn*oAt{fupT}F^nG*Ttz-rK5R5U9rTf6t61uqa<Tw%|g@q^>>7
z(-}?Sos;n)8PtnXG!B=*^SCP5KPjQm6pqBUcJsTr_AQFhS<V!-&A+1lo*XP*JoYpk
z<M?gyz4~zi;(n8$Z`H5E3C4~B5Rhhe-<Zqo)L9yXs;Bwi7Iz4u3EnR4mA*LMTpSMb
z%S__1ui%T1@bf52Ii9Q>)0$mm7qHuiEZiyOV2d#~LX1A_bsxLl;*(E&>VoO;!+AvD
zXFOSNGM7%|{Yn4(lT;swdoy5hlG-(+Gu(xac=ke{jBnff?{Y$|GCVV`dQro`T8*S-
zg!M!qU8YqryG0ex^;*v^9FsDgIY|Ic+<rKDcGpr#Ooh5I2E&puV-`i(tmy7?Ml)6Z
zgzMS9<##E{<RJo5yO|FL1;J7AvLTPX&L>u4Up~2w#>n!s?}<{s$)cfae;fjl&#ssI
zi-iw(MsSICR)w#PQ+~P_pD$ng1$@f($nU|2LRR(B6FvvIlL?MSs?&xE(RQ8wbRm~f
zpRM6ITsC4)K{-V7RD~fzkvwx-q4u)SgRPLP=)xT*RI;9WPqIg|IUGzU66wg<!zITe
z56|)~Y+)!ebv}Ipd-UD&t*<_HxkQgPb*El08lKZldiO4_z6PzLy?t2eh?ke11pl0&
z>z{nxN{YpD!oLXhmB-CJw_i%&2q|T^z%_j?_-sV*baZs)n-puU5}lmEu&>ggSAj_*
zYWb@2KOL03dOjD3!DNrll$oI!zxB#2nbWY%L|$lTYwOck`_7%pVa*vHILpj<D8s|z
zgh^a31aB&Ia(v~q^ybiVVQV%Hl-qU1hDxHh9-TA1m|}gnsnjH}Pk3{+?=L4&w`?wu
z<pv%zVK*0jG1q1!-!T-2;@P-T(Xn`sci4C;+euPG0+CI}Or^tgjWpGz`$t{FXP<Ub
zd@9tmj>HVcNbR0~tpfj$&&TBoe1BL(LBzU5SEae9(x%cx&ah<>UQkfbl*R}8#8q6*
zMbG7Ga=<6f*CO{1u(J~_Zy1%0O$K<!Q?F(Gg6ceTK-3_%w|%+%>lfo;$>sbcuQulW
zrLlB^K?354WJ|vX_N(_PHCd_PzY<$I541t+e3lCyMqpkd8gOOvj8Nhls9>Xl`Si~;
zNo^1teVuvHyF;65W{fz&Z79lizWK9UF$&CW{p;x&;E<=e6L|a`cHOtX4tQ^+nrR@a
z60rzJJnK!M0z)V(I640F_qOfn+V5y1I3`5ashhG7zZMY82PH?dct-myzkl760ZR@r
zvu_PTT&|t}^)0P1dec`y{`<*&Fi6icVg4STNVOnxH2Pi~KPqh=(@KX4_EZO5P^hcQ
z?usioXvQBqX3diHA5--oEA;p-33xHg!9lwSL+$b?U6Aj^CWG}kt~HNEiC_8B+MD--
zUMnlnSwC6Sdv3QHp_$)l?^+3CN8r$UC)SHkk%%iZqwJ#p$rWBp^}RFr#q(i+?h2A{
z8EJ>B`AIM%=~iZHer`V7#8SC1<~dm0)t<O9C~!86p%fc+k8#SgxlAfw6p>@9TV57>
zV#wNmJEIvjZSC37w~J`k;*6s?bVN~=9$?U@1hp68T$YPs&0CXIbZhZ4L9FNV_kMje
zHhQ>;C7_GgLm$2X)3BAwVfa|F(Ib?F#(HU(J(bptlWL}e*kcmt){=h-C&9(VeWV~I
zB^7rU_6Q0&>1*D!)4EnZco?#I#-AQKjNN-x@;#J&*$IPb3t8{^^Uu#ee$?IJ9)r@O
z9-$HcIu(C<*4Gk4tO(X_&=fX&-!hz;OQ<3_eM=&}Ikx`%TYQ0Sw)959%bVSwx$z0m
zwBP9Neb6Cb^mi=)90h>(weacmbkZ!!H22g_OC^mZAZMSam=uvN2Wbt}mRV*Aq<dh$
z-7nVc|LNdaUsg}=tNkNEdGnV|hV{gHTnup|UB5}|Ov3$PArb2ecZq)UPJP}r4a8_4
z?fa2YgM*r{gmtoecON!-?6vfqMBQP!bSmtd+t84v(uk~xe*EQp-k0*$=e#KUh~H7>
zCU2+IK2kK=4{C#kv=?)Q?O6UA+(Yf*-6&f^TjC;H%kD@8CtDKaM+(^w&ImsdJb#?r
z?-%rZ@pQVx<YjW<qzdRtJCQWrC;Voa#bKE3vKo50#YYd{MX7wm63>+j!KXR7wjb*^
zn;2{H-^KLq=0e-@a-J;P{{bT~$zbL3vcxO27fNfh$zXNX<2*S(vemM?IzL)JQWmS!
zzh13K9xFC1GO~5Fe^+m7VbrG-Amj6Mz5h6c!#MF!z>ayjV)DIfKi|G`W6o4E2lpnn
zbA?;a)sMJaY13?8!}3>iV_?Q+<o}^xTd84crmgaTS>qTKHF^Io>b3X2<f|RJ1abPN
zB>tY0ylgtgcyhU|@V}d7=v7<abj16^UXA`)yeCCu9atCnpRX=vYuq--7~*4JvRzN=
zbYaOw{7J1@j(Y45mFDbge8wGPYu$GWeev{9g_NPT38GOr;eT>{Q{8-s#+Z;80R5$5
zkPIS-b>SO)i-<u$&%MOgCEp20&L$+|m!W+wU+$!s%t=AOs0!nYO8Vl5hXLL!pLIX=
zqe5+<2XbZGku1Kv)TXwds8CE~)=IQo?*0+ilp*3SiG-A^l<@1*xodt%zgcT)jRon|
z|Hs^0M#a@d>zZG%Ai-UNyK4nWAh=6m!Ciw(fS|$M-Jx)Ig1aUV910H_Ah<hs*LTk8
zbNh}yJ^E*l{HR)?YS~^j_geFP=G?O1$cQ%|?=C2RlF};YtQf-+f09s;TI3jc?$5t<
z{nAIQKO_;Dy)PoH`9>B(O^?O!Hwh>1fBfgcfg%Ih>>QxyNcbN=6NeLq0(^>^zL5F<
z$907vqGVlA5TUsze}@g2vmRlSK3edwI6hag`Kep>x1ZD2^LNzkx#HxHS<2=f7BkE@
z-NI0Y+{Xoy?JN3}j|W3+>-+n(;4`Jogy15COO{u%>U*Ew)tjrrc_x3OWxgy=hdQLv
zGMgB__O$bdm5JXr%H!Y*ss#9EQih{G9Y{4R$WcnsQHDnl;n!5^$@KvJkO*d)BVog&
z3y-kEE?{Db|F`@BR^E#*khKBIviK|%@^ZiJfX@yt)6!1JqsX8@<v!xzH{-+)M<4))
z0vR!TJD^rn-S81p4Y-6-6-g?0YI)!j@#fSng$Tl^uuE8=(%>z_<ZlJ*DnuizxLg4T
zzgX3>Q8?<~@-D2rJ8j7;5)G8K^XdheUKPjybx2Jm*_I@I^QDCiVNc9~4d~JuFC_O`
z1|lZXHmNTUbU-M1uS_(dbTScSrVF%}2XyM}RWO?a9i0&l&~_hfM3nz<oP^{X<T+Xm
zxqr*yu(E>89PbyP%v+v>NlkZZ4;y0psC-HaaDD!v1yg~4%K*c1q$N)02uBTn6$+a!
z@u?BqZ|va_(y`?EM!f<2Ue~OiR|mny{UO@>2Y}M#-`y=jz^)hO^5++o!&--<ySsFi
zPE+NNqxEh>y>`n9^7p=vMA{7&l9?d8$&Rlsz?osVywbTAI1;MY80eFc^E>|Y^?Vzw
zG+Kp0OIe5QBgaVtcG~#$f%StULPbpWN3w&*2=lRT?D+CDfIp=x@pnj2^<baR>$(nk
zuR^8gV9z5UIaF`f>O<Y-Z*09*cZyLF`KW;X8HmfB>h1kS;b(!?0udCw7MIjor=(h^
ztXk~Q+IV3yQk3<wI&7$wG*qV8;NkwHyT8tfmy9%=7kaD5W_kIR2M7O;!;}A@*R|=6
ze}5S1A6&ebI|h&0(ttvgf}x@4*O*gYZejY#&8%v0MfJ~>Im=G>tYZ7weK#YwNAF70
zScI06IHHxGZ$z4+rrgJ5)RAoumm={Cg@&Y1rpu(qKg(q7u|Zp2{^_**)le~=vLlzT
z-pm^ROP`W#o=gy~^I&$MrYKTc&|&+{zg=1DgB%HA%dI0g5s@x7K%_f$f}$nB<p)T{
z{TDaHZa*8#RWOQNEYv2lyL{mbQiDux_IaplRCaSG8${n0$|tL`nclv|#leRoU3S9)
zU57hN;Rw{{OFu3BGB!QuZD+RAD0^>A)9!hE+4PsdHcOE09Q7${F(A4|t;~F^wm=B7
z3Ah}rptV%M&Wdt-xyj~J6bauCxp{VW_B3wu2n}+Iu`B^x#Y_<X-ST$_>9fsi!^`V~
z?MPs!6?(Zpv$a1{0*L{fG5IR_VkU;q16>HTAjqfJ7BtM{-QK}+{llBj7k{i&C^3&e
z_=H54{G$HpzHX${o+5)MlA{K<BC*hz4f>R%zfgcX?VGOGS^e-xr{#NE%3qz%@H$4X
z-T$Zi35`?0?eBU+x;q6n7WYdU|6vY89MF(Jj}%&;ly?aUDIbUc7ZeljNo`s{V@wmS
zb~EWk)c`pE4Lc-S{l%Sf*9fB{@cUMWmFxV&epOm`4L{mvLk6Uv@mp3xz2|HR{GxCy
zbLjU)><4&b9OoDY9YLP`!@vJ>2umYUGh*m<MB#p_DR2s>KD{gIn)@Op%t;D9yS+n8
zI{IVRD|JTQ^018piu={@6h}h!VI_W2>W|K9@LOTj1*b#_%}r&yx~YG@MB+^n40jGI
zt5`xA^=RNa4EqJGfQPNjeJ!9!i!L>?O*&Y7eUtlskfTU$(rXK4o<cCn)_TUsc-=q-
z4-qtvt-X)K4<aL-Ph=DxCoQnAquyM};rXMoKCFDWz^sS$$6>Ya?B}QW_%7={@7I~3
z+q}eJs@kbld7}cS{e+<CVPqj0sLTyK!S#i=5J)PzE;gD#QRTY_7!4G5TYX}eK2W1k
z7>7ujT8#zjl1$6}{<T(Axq=0<IhM||H&yUjOk6ye`gS-)y~TAuffDzY3>Uk)x_WQE
ziu8D;mF9dAHL!{<0-q)1t&p1|*BcUEWPrS>f*N%D>Tm0Jdg7O<l@L7qP!2>wR}Tof
zfLU7l>+d+EQ#J6wW%40l9}e&d<(w-bj<8T*Kp?<tMil+~&Qzw8q%>FLMmN~wWZxyJ
z<kjGXh+$;C4rFs6T13T5fpgk78SdxGGPUu0v@<U6IZuV9did(1h<vY|dWX(X*3%6-
zEdOXj6w-Z3c<NekcI}zlPXYR_ADEcV-=cMcqQf_!j&!zKVX?@zcyzW&52u*q@b0{%
z;0@V^H7cPSqhc>Fyzwkq8QaSrd_<ilY~Gn5v3>~RTREq(A5F-5bx4t3Zldh>$W5uw
zkAEH1i8o_~VsnfV-6_0fgXV1NQNQGi9$u?iVu5;ai50lvEkF>+!leN6Viy|E2SEst
z_M#)n+cs4HpP%|`v`u*#4WKzcB-hd==a99!P~|(?s0g)JC6iN51iq~`>~7vwh)8nD
z0uPd7^U3-v@KtcvZZSllvn^i>6uG0`ldyxV)j{^mK0Z}i_!O>c@AG?FB}%99%}=Cj
z(c?EM4)|Wm8ZMJ6WP*O+H}+^|_h3BYR*&>FNlZ6)@f~l6lkbOf747d6vGG4JDE4=Z
z>v9cO2pRXA2;hJ8M5D}p_-^elC1EQd=O2_0MoTqW%<CF?D%jB-G+5Mu5B>eS6-{e)
z9qrEV2V(@#D4u^%ceuVFBmqe7aD6amnqwapaq(w@##Ab@wke>Vj=7_=bE@0V54`=m
zH*h3d=p7t9JYs%tdgeO^DZmAJI!H+1a>Q-^!>B(59pe4*<3I1;zaMyBYO(?6iy_uc
zh+OQB_j7bVLdY*-XqhVqux(!BkaE#@@?hh0yxgM+JYe9%4}Mt{Du?sB-9$viAc@iA
z6(X6=Z_03R2#so;^u5<J4hAQsL>=ZS0Uj|<ls<R^a>urm`r0MEiM!<+74upCq}zRI
z1^c-HgE?*v0=m=lnuQ>ALm{Y#5|rqS94ey>ZLtcB4h)J`5rVeJLvP2`p`5tjv-2y%
zk%P6wvC{6o5dTh%Bw_Dsvaep3bmvrT@mR;7yN+U5wACts6w|l`Pw|ufgY(r5e<o>v
zzvHE$b}{O2`;1Q-n~P^AIs9X1kQ?_Z$lrZTLcPQLi9}n_6&DKKGrik2n|n{&#~m9=
z=v<;4I%tq`BJ0I$YJ=Kb&M#n3YfRJCNlhIqi+VFU)1yf^ckySi!%nD3GFaSte+$8M
zt7P6@MjBx&WkY;c>I0?iw)0<Vq_m$%5*^C3a2rDG{#&)jJycog=b7TRWF3y!O(WA4
zK236`pS6^$0#53_rQmJTKH{S?XwD@{t#V<*j7xnsA}NiJMl`Z*<KL+Fmv*g5$js8C
z=IVeMQDfjALh|vOCD{wSo@42+00&9t^bE}(5!eRdR>T~e7J9E@;R8N1@fb3Jpk#!H
zLPnigZme25W}Rl+aKNE~Lfl=PD)~NRZl%?wM924Fw#;e@f|&EcD@5e^7Cv`+=@NMK
zi9yoM<z-NA?qJlxNIcD^ulFW!rXR@?XwW+Ewd41^EM){XJ5(WBFY(YYV*Ir5Qhv`T
z`U6Bov8}#4u3Ale7Jm)QtZ#oCQywRcI4ZoC1HWGOLjBHA-&7dl4m+&$Rc3otAr<I7
zpZLAtrw-1!Rz}`Xg!~CGw^C=MKw7B&tXuUy#vFyLh_CA^fF2igjt#23+IkPV#sz7H
zm~PP<o30C)&~O+R=&;IDd)hnDLpG7q!3)=DA7>IIxmv&jM&IZ(%tsvc3e5F~;n;SY
zt_xGUEk(Q~yR4<Y+eUnm&^nc7p2$fp(r$bSe#l8vAkY`Lrnj@r+$~LDNYxpqp$1>L
z{tYbu>OvJ}VKg2GEElp)Z$!S(D6B4Oq<8j4ML9nLy$5lkw?t_w&zoM~g^giB^N43_
z#ih>zYU4wZQq7&s06)i$_zii_S;fL+Mv7+^9R+@O3<*m(Y8B;|7QgLjbM=#xK#M}2
z+}-&^T>OVO0~+VaUp^<8TZeY;{yCn+XR;>Nipyk~$1(0biC!U|F3_tcV+L6`EWy>R
zTcQGMvt>ycmx1Hio9;&uU!or>LENs_kDQLEB=>D<<AQagJ}Kf`mF_%6{LXvbT2X}L
zf~5A&c0|&*%f?5~fg8|~Z_cfJP^b(vjay$!t?*^n=1|0IEg+hLr^gjaDY_q0+TwPU
zK}qIuHz=>8oW<{Ck}nN7q^c<U`ugI6#u#!ZJw=rOhc{jf_t*7>1wsWGD80c!Jew{^
zRH{%R9ml)-cEGt|J+NG(!sO~;uFr{H*M?C^fDUZTG6)q&0oF}xW_T&o_nKNqF+DtH
zM=sv<XM!f24af<}&9EiNRQ#S&bfrb}Pg0;fFJ&3O3F{Bb@hGQp5|h*VIXB=r?;Z6%
zqCE9iLrT;Y5$&4tN=X;aqz^bieQ?I61jYr0j-KUqU<8mSE@;zQx$GhJc#Xz3YR1Sk
zSswz#TX~1RrU$-@F)THZfV=E0B?Q6+*F~oo@KW%+I@Vz6%eG)|DzpCW0F|{FP>v>!
zK{%uCen&oOCeua!)R<cOP!wKDv|f$BIm11R{Zn)EJKtZf$dnYksj+X|`|05phZhO^
zHvz}lb2iZ(rt}b#zoTkaN-3Pjyf%x$WEG#)65~bxt@#BMQHy=odG_rwYv-y~q`)A9
zj9tmmCh*p2%c=tJp#x6_I3Nu`+M}w5l^|s=jIL#B@Z?Q4T1_?aCo+e$hglCk9s0H_
z47S^De?NbTc2-FVLp7Mj&h1i@n!@=9v~@!bH|M@420U=tjUhBU+a@FMmH^X?8e+n7
z_wKWxEp6Lu6$++vM1^8>2*&U)+@NUd-k7>6AeWcn;)($FN>LypX=4;^+=v6mxx=>5
z!sZ0HRoUGcy4adRM;Vl0d0Ay21}ta8NrgZfNC1sHCs(goKi~`-G+!!u)jWVi_}kyU
zOtr}IY*P~K3+!gBW=rFtxxCg1r!Kv(-@8nhSE$#y$|aOyQBTjs4oF>=^(#mW-s6^R
zfJ}uwHLAYN)1m63l+BD`RetbAUB36A)R-Q@K!1T;ZC(v4V#kw!E}f;%2g0+cnLS!j
z7CNuSzVfoB5w3kvxZE(J6E&r%EWw2TPE6&{EA^>QYP*ze9=fLhl~I6t2!VTlDhiJ4
zVZ}th4?@52<_Am|vXFCBmhm$N$9<`-IBf~2RWU1sFEqwzq1IpK>MQW=c58wPryl+d
zN*9H{7PkUd?oiKj-T=+2e(U<v1A_+U73SnX%&K?KKK%r&$CAFR)6aRGh|}LsB4!PX
zdk9XtH1DK70C%&xm=wFlq8-xCzYAiSsODAb)4q>*l~jK`+C#l)G;X;~?fh3I9G|#N
z-gL=cBM!w$N)qUJwglhjaj|Hk*<MoqW&X~L-;^5W1MFFF!r6J|6L`iz{-#r@taf@V
zpK3pwE^}?wd9J@Yq_H7whvx0QMIX`mO9~w4XY<(vjufNErDILU>Q%C+U$=j-&ReXL
z(qI(kY&kDSJkO`P>)`i!A_*Afzz{mkS{i?AKFU?Yln@>k(e!|sulNz`9%PODDYN^m
zxxlagp!1>5;gGQq;vQ(X<daah!BESU!pdC#7>A^bOj?l2+F(>5`qq^;K<>=Hci|IV
z=r}WI#4w>p>V}<Bo`A?gHiU**E{W0KZn;@oTRltg3#xX#7FkN|mcn2tBFp}dWR||V
z;!O!Pc{5I@cq(zEe0c-=zI>I%dNCaQ`(Sr<iQs{u_Wf~S#Z;rEPI+&-x>jis9R0*=
zzzO<!(lGeVY2q8Xj0J<OR?m_mQMVIIfG)4pelAah&AJ7+w~J#*IX5=YOz@W`k-y>r
z75RA1k3tcYLu#9hT{DfDCKKYmkfy)}WLsCDg38-QW!QcfnKXT%>^n9-rr~?c;UPXX
z6JWU_>MGRk1c@<QeOY%tl(3~r_}k-1L0iB%&>UXHMWGr*h4JN~m0q3Buz!KsmjiD&
ziwaMaHg`yX#4xva9G<vaHn{1DM%RC7Z321Nf|?m>62QiA7>~*(70a->L5mS{E?G~T
zE2$dYgQUHJY>RbPMcWlpV{U8pWWe}`4(3)_U(S}00iD0iPe5Io2T^d5WQP6o;Zc_|
zL8u2w*K}~_CIpEzGdAaA!^W%fbu?w2Yp&1~KS#WHjWujx)fBaspD|kj)=VGSAC;60
z6yp^n)DH_~8>GaaB-2#r@f*up{V0vM7%`NIF6^Os=E3750n)b;RNaIfho&I5m*0%k
z72Zgt-?h4IFa=}KrM~Kz@E2tYR9@b0ypdLS+?$Sz!^%(d8+A=s@IPMuj){n>CH6rv
ziys^C5@P?clZ{~4Zwpf?`LP71prE+?Yss~`T||q*WFg2Q1nx_8Hi)N|thE>?0p~u3
z`=9{HdSq-nGJS!&F(U?>F1STxqI{<c0i61XOGYDtI2?KzZD#M4o3)F7O-}XW)5KdY
zp}Lzs{FUM&^TClBw~!=5i1Jm~VvX*0XZPJUF*PgGL(!gL1GkT>x5*dfuXz+Gr}boR
zR*Mm=cJD_wr822&r=-)=KToWd#E$l@(MW1utt`%}d2#5W4@)8S4SfPZJrtm6#4*tw
zLD9^`{UPaL5iZ-fd7DNeElDiFYi1hxicKT#gJ5cE<=5!3LFje@%RbG0cV(vT@jf{z
zNMq|=q&~YrMi3wmNBm-ULQa=waF+h4sZcy28PeRFQD9-WW`0*O?op{PW)#=NZ>pN@
z?_z<54yK>II*E!_IBE-PV^<)<WeUoJ?ba)o;fJIa4W6uqI^gb~O^&(?@Bg8w%?)tb
zels<ts^*0`bQ1lBZ7D)6)lz{PEfSxaTSlaQ$*Q1k$wST<+R)}Ekx|pt=SKZQAztC~
z$@O?hG3jXWla^YoMleX@M1)A%O7&>vGW;Ya+9Jj2Xh&O((}GDdno7RYSCJG4MBSyB
zJ9Wz!DgU}K|0Ln)6@g#W(gW$2bw>$A>7(C!Z?pK-t(O|DxxB7zdF?(s>C^+RtPPid
zY-?a&Nk~?ml$e@I2q<mL*U1!i2-tKJZkY_q<YfGgJs@53;RFN-H8U+}O_2%sg^;WL
z$@a^mK%MeDA+8=*7wv#deiOLI2**1UWpaEtQ^TVWloM!de+svFFW%mW`-gqq>ziR<
zNu+<d-6du_;m<Lx)E?7=jtk7o?}5?X$fWT!gN*21Pq!$>{nHDKUz?X>u}NXgbbExa
zta=t82fJs^4JvA!u;|Pu7rAU(QGR~4v{Cw&)cS*S)#KMHR=Vod_Sl3c?}3E4>@Ijo
z0Sw8{Hcd`@)8;@JL-cM@r0GBDml;&);iVprkBH7+_URrYfRwPZQPH`hI79Io2!EY$
zH%#EuZ5OB$pS+3LG~2WMq90e2_CCn4qAc#8jB9Jk0zAOx<k2fr8X-wX#)KWqv4YbE
zIZsL93hpNR8XZZ-yQQO${^45xl%zRk9b~x?u&`fpEqJV7E$!)q_yZXgUT6M8A&?9}
zi_m_Kxk6)wdiXcus#o6RL^}5LvRGI-Lv))dHAKuPFszVT8-=vftCZv`toFrlBnUxX
zHu|<}Y8^PUHb01L=K_vY-&3a+n-_-)F!H#5p$vB%P89}{Rboa3YVYuVh(Y&e)W+Z4
z$83Z}u<17E;oW8a9!SAe_&8hf36rcmiH#D_P3azWPjN6Ybbo|jq$f?%yXD<wje*=x
z)~dz{3K1Tve$N(2V{T96Qe6F&4)UvGX2le4`L7l57PvIGqxd|}S099E6eG;Uh*&Tv
zLWfr*9a(g7^qG@zzW#cI>fWE-pZKY;Id-J6-8g8GHl3$gqUZ5&b2+D%)`0_R!AtwY
z4c{-fuGal<LG(eU1q8-4B{NsVRe9;a<6b)J2TU)13-ij~6{$!wR`Iyya>Hj^4K=a|
zs5PdhOzW7&mNn35OCZ!NBX`r~Td5RMhCD6FNO&<q8$`Z3D@V*dd7`||)H5`64ggvH
zRT`sZ$du$$0v)aXWc&*BUTgOUPAr@FYYC%3h^uSyD>DY?t^-kDnZqJFvz!yr+fij&
zNg3rxM8s4y1Kbef$dm%ny1rAJHU8<MgwiltoK*`(`S;E78vU4Nt39&XDO0VQe6BUR
zKkb(ZPoTl<c=Ihi%IUSW4g*Hck3abOtSxBHB{!78-;U!YEpsp=!oUNu_<;{pvVF>u
zJ~Imr65abQhl1ygUg9)n8DXVHPAvbo+BXc^1>5Etnt=>Ed(uW*-(?v;KK1tbV*h+K
zoajL6ma$l>j&ch)F}!%g6GHobbAvQh_qHdj`2H!`HwJc-4M5d+h;Qyq`5^%d&pSU;
zm9cP}xh>c64hsVMQ+)4sQV(!2mYuyjT=!LHE3NGgM(?Jj5#>d@nV2DBCR?kQfNRI(
zUHU8^jR^iBUY*V0w1-0RTvxtLe1=RUzWy?eaf|zPI-c8XCd3o!(orTeNe<>R|I2<`
zrN<CaYlymhNfZ2L>j8Famlzt7?;8^A8zS6*hH;P_k%6d%W**aOje!;x7G12wrrvfH
zJNlF3t@>B7hQw*J3AO5p4~X^Mo*{rNY}aD^F9^$G-sL{sF?>!4eUWc$EY<sEOMSVw
zBjnB*vW6XwOWTw2+<E#|U~G#wgzPtBLP3KG-g1}dQ~>`+U$tU~C3=e$>83^u2S#?z
zz1YRD2z|?6kh3sK<5wG^f5#~jUx;(#=-^0gUSHAMYORsZSa;s`w4!MYXHJxzlpSwz
z)Pi%U1=L3~NmGwkhSDbaWFD>ID&Im$*NbGxWq<zX(m13Z4n_B2Q{oapeLYc#ne)Mr
zbrhKtBr`a~OY;6YmrMFf$6Zt{xGDD?`;!wXJ~E*O+V-I25{2Tn#ip{z;JtC6hV2_P
z?VxqBPc-k?Fl|)Z5Q6hNzJ1kgra}}zG~8dsT&ItXqFO~|Ee}bLDuqf4E0AEE5fWgL
z1&bS*&cCmtr5T$Lf+PJ4%6qw7EZ<V}bx_~uVT2<^ya@M+d8V%2IKlOgzC$}(KGzr#
zH?!KBrjrbt{+jt+r<Tj?8{iminF2^PUuv9Sq0Sk>Zgoc(-^1&$M#l1~TD`t!=kf6o
zD;9}{6lD9c)p=*u<=PGKo`S0~nhJ2)zuT`0s#jWRU(gizLKF24cV%rQav#T~)N9S4
z0g&}gmG>_fO<3y0&flPQ-b`i>$D|sLKl17=lg}NQv?azDj-fQnz)>{%XnTJh{6jKl
zRa~&q%~fZ2xE|rqw1C!lOSj2f%_?Ns!JG&(BxME(=+AW~QkNc8fC4`2UO`i|2*8^-
z<F%!n-&ema4{>RV7*Qg>OXg*=#r56~oN7=)Z%O%%m0+77Wb|yZ;i|?oydfpsWJQhC
zAV(fby~A0AJGvBri%YC=u`8w=@f`QqFp*>uvYr9Bu!DmV5Q7)ST0Neb$w(#SoJOV(
zx8n_EaTn~ram4EyTz&3qg6u3O)=l~Sf`iqZnu?V5s>)aL!13o>I>SZgfsv2g`}Rtj
z-z?;ugqz0hGxpPgDIpX9ZNH*taC2O2Qu<=HAaR3Y&_p0^1?srrxSFh%qXQrRSZ(M1
zm`#&qAMxgXG?j@4Zn;U5&7J?nFeA-e9!-Q=CV8MR*zfP|?f%0_66=<OA~4xvK+Ox=
z$hNhC@)+8mgVCptu+9x<+nszGD?Zn)v^$5^a@jRIwv{nz8U>1xun_oVany>Y5cpmY
zFb^VFZ~U3=(}U)f%m8~^xhFQE!^?z%uZ7CF<S3<Esj_k(<G&4rP@@d%0`ksd<0D-6
z^>6Hic<G};UN1U8#HN0Q1|knJ?KhFD$V$}xLu(`j3CPtm3Vf8OrP-vkZb@%)!FiR_
z;T^n;NwKM$L1&562liCNxPU6Z@^j4Kl8Yk-QvMe8AnivN@YABaYj7(xU4AU#J#+iJ
zLF26qg~<iBH9X68u#aJz2FjM<okXIa3!Ldk;Pp)p#s7Mtf+Vh!KH5)9p*pFrIo{FJ
zGHbnN2FW<c^2X<9O--oPAGS;S{E&`C$4SW#N3~31`zZrcN>jgShoe3yv$zx?6e2*x
z;VkHwA>tqkueZP(VYg1H;fu`V(lCrg@5?V~Nu{@YS0svXfHcXAqN+(lXT%GWFRe%t
zkCJi1d|(>)^_RQ_0zmq#$q0XP1N3vCybLRUFP{?c2NZ(WY$G5Ulz{+10>wrXO9iB6
z&KBUku_NM;(FGkCJFt(>V=keTvjxty{tmD#vil@m_Oj|k2EpgA3K7<n0lm{hq;<3c
zkWnpQvMoTg&rSexXX(xbS8lSz;Be*B_xJ6z%xlznu@8;3%)<6hKTBT1V4`xY*4_D3
z5yF}ptPbT~AB0p{$R>@-xtA~m_`I4UMZbAM=`B&?<Jtscc*G4sc87{w4-}@U)?G2^
za?oLs0`DblWmbu9k|ct;F7ZgKlKw4I!pfp}_(J1A`EW#kO+$`yp3c!iCRfWL(Ds`W
z-A7|Q^8}n)27hIok=p9(ZR(3}z*8*cxnR@(Pw-iitXxkH!lrM^fI;(EA`TXg%xdAB
zknE<P17qh5etj*Bk6?!h*!ty?6fpWu_%g3w6PVOcxhdI1U{Y}<_v(n9_wuBx_8^LY
z&KykQx{M5{@0xt|#;R~!FeQGV(i>eLn3p$IU1_!*fC{hLHdGDJo<sA7QOyQ8_*~2e
zG@sbRQE6;Ac9((qOiQin2>k!jEYMtmrt1_v(3}{0n_Unsvug#(A}5o78cazy(d-JT
z*2lpQ(KJ*5!J1*xH(g*0M>YM+A*IXluh1XQ0^rZ_O@sgrEg?DfQ)^9B?qe!!*4gJE
zu~M=SF$&K~V-{eP;zfIfvOsg;)R)jVKyzT0HY)%ra?M9t1p(*sHjQZ8w4{$?FzKI*
z#ZY_!7>#%Z2R$j!Oj=TP-QN`0g(NJf0-A}6SQtr`hxCmsMcy^bL#TJnSx+eG@&I%I
zB9{7jO1c1O4)eoaEk4j(zN+gqEzq0<wx?|ffGw2b>o)@1;x?5)ds3=!)YWn+kOGT8
z={x(Li3v=bh3dh@2FrLFX$<uWP4t|c9GL`KYNQJh-k$TDo8i7-G^gVgfo<U6aeRDS
zs!@^BELib`&!U+JX!O)4J^t_`i43uxz9(y)r)OuqfM@*ld`I5N5CFAi%haUVOlM&_
zH{tPG|FrmU-R`aIz}+@3-V@h{wj>sR+FajzrO)U3P2^}d6hrk&?6<;;gqjP-ZH~k&
zu{k{lrX_J)bDtQ2%!oSpEI}}(yTUm{n3D=n@7H|LKuS4MWYft#Qt6vP(FlN0UE}vM
zSoz^~?P(AA@$43*-tPvT+2RSMdwas}%WC%}RoCUI)7YvzGU3VE@F!WEg2xGwe4kNj
znEtDwO+%3uU)tjMhdqV-eT0T|ER9kYKO=Aoj3|n~oC!K9ET>|bH`(Y4)H+_nC`)8e
ztMLIIB$C$PC9-kCSdE2|$e<MT-$=m3oU_zA7eE<2&r@i1cu{B`iv+be35%Ywrf+~7
zm=oxuNJ!rui+nuMrgGC*s<%Z+`jH~};rrGsaS)EZCOLml)cW)T-6xF3GL<1cp9qw2
zRR8D?QPKU_&{FWu5!B-}u9nMiuG_7|d@+GB`O1>dX4txKXiZ$}t4d(>d68l;`v0cr
zx7ko!G3Dk-T-)w}y9pBL<q8kx*D$)@y)RMt?v7f;oFcuSwK(fiQnTK(N0$%vIcOYV
zxpc9(v{iY%uUe%3GtF2U2j5~6GMc*qL<<Bsw)j4I7BY<Iiik8jtjFA*ZAH5LheR(|
z=nNoE5;Mh$G&}3<?wEieKRi>SJlOhQqP*XFmk*;#-p4{4{=k!|at)UDKT!$RAjsxu
z#ivp-&Q~|N-5;O4TO9$J)mG32L%ZvVq+$6nBIqoOl+|9)h5X1;N0@Wri(M!$Q$hvv
z2iGe>-*kTXvIKgnfK7(ev(ZeyJh1-?kyb&y&aYD;dKzW~(2zpC5sib=iq{a7KbCbJ
z3#9Wd28VQJPuvum5iKJc_)}HHyl0n(P~rm{>Yq@{BJT3?!0$(5J@-{I3MUX$34<dB
zTRpE+<lyP2Z%pH)sLm2>w!h!PH2v^z)x0KT`<DVFcq8H`(Uwq;1J-&hD!vjsH0pF#
zpP$R>&EZIyb|n+IgY#E=L5&$VQa5*zb&r!=PSqAUWc<!YNbI=j$^4?;m4DabWvY<t
zpX_d?F22I*HthJ=`Yi64%Q*!^Y_9m6<B^7q{m9t$3c7TZ?qjU2dmiCxc?M~hvecmy
z3zmX?X7g`emjn{B=jZrQc0F&RsgGp8eZ6;!&?!Wc%8Hshgf2m>_Lvq`iUlR&oMi{?
zx}T8kcmaFRjvXOBZqPx#5*0cqB$nRRTM0UX?H`R36@6d)4N)Wr*mw_LqU)4PJFJx4
zNCNv$$5eX$J`8dx&^>_`^gAIAo#T6f`r{ts76b&8Rr=<1qYLXPgfEf!*nh6Ggd^{T
zeNDPG<Hh*>{u0C(wgp73`$X0n2P#UM0Y<V^`*}|r4p8Fz03#xa3z(xQW{q-6etx3m
zW;@)k0PQ0Q#40%MPt%DCI$E4<4sIMAL;&Yu|8NX?8YoVn<<G`4(Lf}vS|k6AB0#Wf
zwDRAdVH?|p)|s9G$rK>KqWkOv1T(1A@NC8a1L>02oUXjVR<K(n3g#)qXC`iUBE9Wa
zK4LCSeYc=HHxQVNN;AB5_jdtOnNs>&dy2%AVP^P%r}FQ74pMda**o+-eaj#t1|Pj@
zXLrf_nlA6ZAKrj_%p@dp%`57{EXGQ3j8)Ps>II@#JK#;<*@Y^P%ax`wl#DbyeZ4<W
zP9nJ@6)x}}x@Wh;j$Na$H3r8Z*DYUS*Dw6cwpbMz6uHDUFtW<)8J|CX8^=9rX@nLT
zl4!9Bjn++@E9W|Yid$;-6erJ&F5PRe5+I1fA5%{?3{FO8p|g4-xbG$wKhTtZdc-Dh
zi@_V(mb$|h^?0_t^%56X&!T)<z{m(|G%V_=|5Ys!p&b^xQL$h;o$}VP=#}-&j~y}%
zyHamp&E@dyQkxCij~#A?K+N6_T3<%Y5xs3g>gs+D2r-lW!x*hyhvc7MQ3q{caW0a#
z`3}wXdx~aW>vs%A;?C@N*pR30F?@N#)Eh!F6~Z<&4)mnyUnn~?uxU|9{I_x{GX~Rw
z4-pocwRIt<y-=&55Xpj`A-SO;64v8E=xuK`Ga|@}lDU?vr3R67mZLo?+p2fyBgc$U
zzpaGi#OMsC!v$#U>@db;k#(Nym3#_~(G>S>d*jCf)xo2KEFSo>6-MUowkn3(zv6xw
zw`Kr5z~o)zzdQiX6XTC)osKvDk*PG$PIzXaDF=Z{Jxd1Qj>!`|vMZ7Dk1k*B7x<Dt
zym1N=#cB^XC$DwY91m98--Wy(hI4RmxI9@m+<yDs1FO~LkCc%SWt-a(^Et?2Eh>Rd
zKEmfY{hb3ja5yKtN^@_NkOTny-UYMK1Vjd<EUX<5;?XoN(*a=)p1YtFLLxqxXA20w
z9^td%2OuLdo3=(Zjq^B*0o0j)xIZ17aMswl@U5@?BK_f-+4@n-7%v|qVDvQ`xGofW
zu&ZWKAe-;K_o*sCXK=US&s5Av#C1_bU#A{I*DRdW%D-Cp22X@VOQJD4I$rYS>7YE`
zHEE#Ux?kj1GbdAyw+uGvOhVUr>cwwL%eYz(yBP6UVsZxbQj13vp`MTD_^249(QhQw
zs}7+$RiDYwB?3YAp?=w)OXGPeG90$w^1#Rj&*-ctZ^ZE0YF%j!Ho&zn-P=nO7isxx
zmHM)bVDhjd|CN>(Nn<TO5(mSQC`GJJWCWtw^m^!NpBX|Tj+~(11A95bV+fAOQ`jh5
zCgWnrS_Uv9vSwfAl|GC_-Lu%{`9l)Og}p*LR_`eZv2)%}x+Xz00xW+iBcQumeXWaR
zea?s?iL?Mbg+>LQpEXEhv$5c(V>Fn<%;^tMXin0?02{ZrG7}Ij>Z4u-2ofhYy;2kG
z{|P-H+eV$ml90aIVuf01eX26qs!MbveuoW5+Bh}<b0H%Fbb{tld<^ms8%;?0!Pk#w
zZq?VvBZ@u)_5RptV6>o<7KErlK^-`^-J3IvI;Xh%G#v@`#u@`+19X}-Qtw#A<z^bo
zwoArK7y9LLbT8I$)c*40E$dr=Vq~f$GMLP}D9L3V0|efRU~@!y|Ejlwu6y57*mO+*
zZ?70<&AvHytiqG~@k%&El8qu%twae?SJtuZ>jgcx<u6ts?O}IhfplzyHyfDC<J9O4
z5$DJ4i}M5kLc!ttJd2e=oXqlR2vCp*1PY#El!4n8{XuMQ$PnTM#P2FXli8RhjMOZ^
zFVD{%1{vJ(<`LD}qK8c9og<*DSk7cP1Jx!YRr*%EqpStnsiRtswqk(Za`4mslictU
z^(~~yu7Yp3E<6mi*{W3e=NFPhZNC>lQn&<feJ^V{i>sX)KKs^x04LaTw#W4&K@zc~
z-{-@r^=$$~5Vv@Xw#qVhrVZtM@}JaEm}UEY{uHXU-o)0$Fk{a{3oI>Z>u84$o+7;T
z=T1gd<(da&!k%!|GdkzufgP3Sc9^?Ii?PpU<9wCAie%lsxD8fiae$RR_j`GWZDBoT
zaGL!|m>6CIgCZnODtntM%I>7rxNyNv+voVR*KdQ1iz19qIp!^{H9DRgqrIcaNRLib
z^zYhldOzhd4DQX3*B+m8o&H1rE}qo9-g5Az?}=CuV>u`vpo}VQ<khFN9zQ@((%+MJ
zg83Zm5n7uaJut<yIk92&Ys``p#Gs@14&0Y+ZUN$H-XQCGPR#ku9<cH%4C`V>Scjyl
zU9G{Ik?8e%^+pAV<=f%4NInwlz09B`i4S)sCu^Q#Jg~09AcsHE7CUnNCBawD7ZIJW
ze;;If@$-Gn66XUX>wu)jS%y+^-O5$J$@8_5xK}$?`?2S1X`R++9mQi<^LYE=Sc}Su
z<{SnuvIIo?@$+WSOj;@cZHr9!RjdZbXcOXncYZL9Nl#pFIT3@3&rHe6s=&YCeZC!T
z^*ox$5YJa(PCv7-@QHtYo46KOM**W4Zds$6L=g>&Y~ZuKDVmK16Cesv6Y|@fHa|bV
zZ@TXws22kem=5{<P^wDCC8eEXMqZlA22WgSA2!X&-a>KDwua_%RBt$@q%C)Pj5df|
zY_~j54eHo&z}Q&L#J#$1CM4-+gb++6x+ih@SM}Ev^hhNxdYMd%Lu-J46)Kv-RW-U<
zWV#R8lL^GI`^;rW?v_|I7Vo<n*YgULbS@o!io8;r%xcFTS;-}#r7=0Cll8oXAvkVG
z{is@dg@lWj_5Md{kPROFCM3=uriIyxxWB3@9ut#xHX4p$Ybqm-S7=8O8ukXrhr@^O
ztrEYySYpUR&$W3>S8C9?JQkVTC4!p`*8D`_6Fs-+1FM)D<&|uI5+6YU!3pHtw(NcB
z(ekMR!9AmOwz!ygrZaIqESE$G2W3<8Sk1$NhXNb_TGg5)D#l?U;~v6KROgBaWP1(K
z))&f?*$pF}>@HIto$X>dpYAagRd)B9BjT8lkO=M>N<#^Xj<{UM0F9{bs!t+6Kq(`$
zyv=}z#3%pC84N%NghLZzQ_~L?Q}qQhP{)f}qXKD5;M?pIK({pOLp~q8L)AZ+{U)8A
zq1k4&Ed(c|oYmJ_h6@Nd4@nQ(EFA7$4=McSE;|yO#{S*L$#mof5(#&|bgjO`9$(oM
zxG1_{t^WuFHfixeD<ooY3aY%eP^_ORY`90}x!7C7v4jr_GMrrT+~#sCT|T<o*&=@A
z#5@)Nf`MQ*TMABtF$;#h=>S*N-(<6({`U>Ae17-B8~gVb27%0fB%#0p0jq=>|3ozc
zG?K}Obba@%POJ|ssge~C#H!iJugBDtLQY7!USFu!U&Uw7*X4#I_0EivzQ6~4aTj;i
z(J_lHC6bE&SbVe+8Ry0p7np)(rMBB8KKk>85c$G!#)8y+T>@YuX8ue%9h+PhGGbIk
zXbBA;DGc<rC0gd+CWpxxlZ|h=Pm2hRY|kb`MjH$7H)o{j7_R-fl34Ab-6%q{>W^8M
zG%Oe~SSBf@oPZKBKO<d0D)8$_qX|xjkc0KI^wAX(hHev^+t<9NKl;^Pl}>l{`D$Xl
z^kw;kI$}5^Cz~lj+N1;^Ozfwv=izMWEUOPYW=dk{Hj{Mf{$=Wd-U>%Fn?X)AY6zB8
zk`V2jGf#y8FgrlsH!wcJLd0(77~t|ewzU9+;?20HW&Vz_F0zd%%fcqF_Nptx-?!g?
z;B%Vw;wa>&Ukv7u$9v-!I{b}+(Gw|DDLa+TH=HYgv5w%Z55R(!>hf@d0!jeCv27f@
zZI-mD&T&5m_izjE@I+8_6@wCul?FeE5fY`lb52wrS64T<xkY<~sd=EZULA=@D*RM=
z9_?uaTq!om*Pn6u34BJet8MUY{;vH?Hu$`*jYa;Y?#9aMo@khXB>s4YE*V9#T=%xV
zP&S$k;3qDpclaeS+yo%f!z3E{w>?HapV-nU(B%pG_iYxi6}pt6{(okVj~V6T1IH2o
z&l-WEFT%uG1Vj)fgGB_xbL?w1SfB%`EqKl@>Ex2IGzrM6)$2<6zZ@iezUxsE5IC1c
z;x5<()+p!Y!JNF7W^JI7k`4p{#031dqRR3hM%D$4!QfydVelN1^cyfFI!p}d0k}K#
z65!ejOeI@LF01m(*g0nlQ|Manx_&xg2S^CsS*v>@BIOu-240(wUC69T;fFx*t*KHB
zWx}T|qBHc>LrZFAUxhn5O)GCot7W4WA6#sFTdrO}zGH1{B93ZHP)?|7TyyzU^D8Ji
zNU3ap`sv|RzX_~2Oe=v)Vr#(gx5D{VFQ6+M_3QLG?P^d9hE^@oLL%Q#=F&HBC}g*#
zW1s=MMW`eJ?)a!Pge5q@*1<G<hx<!2CGPcPLY-MSj`XxdPuqXe8jk_f8x0!{4W&lw
zgh%^6uBSivjDxYEE$jkT(eG&}_AQV`0h;FD0q4h|>fkrNK^-DM_4hH_#-c@gd7jL%
ztQZf)(`Ho4Qa)`ho-nS5(2WnU{L5gFiPBP3>3_m8%=JeqAZ9X|TY3fN_@G)n^)wIs
z$du~Su%O5c_>J|1P|6P!L>pT~q>YWC{Uy?UNE>p1H`$<8P3f6J3|oTQIIz-=+c)tC
zFAP(yOOz>*>gv}}6^)GE?T4=mm#OaGlBN+5SZP*#bbtBAYVQ&L`wyPEf^24ZrPVG)
z-hJn3p*e+%)!l1pZ0()5qGs&tO@wcU5ewe4;b&}4$+oVX>i+9?r5J{X(l9}#B~-^1
z2z7OWf`X9!ALWY^J96YnO<Xqz!uzHnh9YQa<3Unl5y8(1-ftK;WCdzu;;94P$fmHS
z1HqBhWZFS9jn*?k9B<Yvr89N@WMx?vngQVC`>KZukOic+*r)>4&SV|`uzwSpXF&Zq
z@S05ej`2W92f$(Yg;w16%fk*-qJ+tLuwHFw6p@KpNp*@y#uB~Q_#{1#niTaD3e&LU
zdauz8{&r1)FNs?6A~AtktgqB~6^LMd<9gr!uAdQI3jZha(O2n*P;1RbY{|>tlLa$6
zlMnv2Twy6_iwRVg_UodG=YilL$mHW%Wq!fIn`FSMia7yn1~RL1efeZ@+jjdV(OoV7
z@eIRsLfykeZa(MJxJ!8sOQz@ITIA!JM}P@24<)>S@u7I}hFqIumtux;I#XXly<x;N
zA4?>r>P`o7GhhRM#pgmI0=+lH=J7g5%f&K3$Dc$LZ1-<ow#3KR=CfJ0zYunQ@}q9>
zQToGxU?LpMd(7h{O#j6yuwH=L@iL0u+_~jO%(o9aw2fDi8`wO>cw=jj@s0(c!#b%0
zbdnM1<OjEbcGCj!ci_3ZvsY=|KHqzWB;FAwH4I7-DsR8U*BQt3mcrnX%PQ^WPa?*O
zy_)z->Yd&1VkQfhTCIB>^gow(#;lVPXS7FD{^VgW9h+9cCN4Bg46zbV(U$X+GEHZ-
z6QmyhWN7Tw!%4UN-;1UeSAkBQ@u5Vk-V6mNv8)R8)x(35lJcXOQ|UCY7EFM=3Vjg)
zJfAAHUd13mB#@>IDpoDK@&C?O;r`+g$Q6e;f5?KxDcxVO#WX>e0@!$?GJqY&`+UrH
zIJ`xFAL&|56uKu_DoGcN%UC>g2?4**d4!bHhJi}WbKCFfT}t6QZ}syeZfcvB_`Q#i
zNT#Oai?`!yYUoMA>^_7Df?%w(s9BO2GovTK&-NDE@nY?~cX*fZ^?6f#coO0$TyY9<
z&k+_6$KJA%{fJ|`zblo3OUf0U#i&G8kp;<!Gx_mBb@Ff|CTI7ylov1tF^(6Q=h9Tu
zi%}r#XLEj4g&1FP8cBF?ty5;7EWu6FC7)c*(KSQH*_$ulB`DjxUtakZxg#VJHBX5E
z!p?aea21BP8#&!Sacoe0^O0c;uZu4-b)RDv8(pv$`26~%M&sKWDTzFaTaR}Agi#%>
zS;;yjIHX^3Nym;1(yO4~{SPmP8XP<?Hbo<Fv+4p)7XIkYZaP8qtklNh;dliAP%(!u
zeN+oL@XTy4uL$JD+@|ZX>Dr{-Nh{F((O*9DmdJ2f^ukc0;R!=ZuVp31ge%LjiwMWx
z&j$bmKU<#t89#q8sJ`1jCDSgC&b%p-KvO*CytQH*txRjdz(jT=hl>WQ{)<qXau%xc
zIe4S^EZ#XXON8)nC7asUOiCt~T&^i(9f)T;W#)Z>=VStxD80QB{faXDCs(=>Z9JWa
zK`xm&7(h3|*a&TBiqShdItEm+=^3D^oAXt=M!EPv7^&vp&20GB7|7lD9qRz9fqk7c
z8m3;R8g50C)$IhNZn!MasL(XYy-30;?Qj?Xj7-2z4eJ^5g_ZI%bplFqB?K#hoJxK}
zN(oOWalgA^bZt5|_0nG_3aP`8?&%GSV3X*I<2nL-YRynbXDDZrxhY<8x{Deua5t*N
zG!K{7N^O?OK19ohXl(oSnD#pNNnyJd#|nE{^QAkvp=%R_ZzC6{Pky`7WiqqYyagwv
z6@|w3CsK>dPGsV)@iCWaFx~t<Eym4|2*OrFBXS%DPRWsm+M9Jbj|zn-eh!uV&Sd1<
z%R|vf5&Fzpx*HNj++Ok`2DsWf(bQpjU0xK==%4d7bF#o1#(OR>paUBKI>xurDA9w-
zck$$=@>dv?rAx~3r{+XGMvCybewZGN$q-=o+Pv#=ICJJ@)Isjgc%puPPnd^{#l$2y
za`0@x3r``vQgD)mHI_d)#54NUU@F%S=WECd-~j1uQ%Ui#y*{>yM(6%{A~CP6U!j|V
zyL@2BB#CmKCdiT?DRJ5sO<;>>Y|D#-;f{8FNEm~zJhxeMl7*PokX$!KF3FP#4<nki
z)`5Q7na!QTYrk_;O)+m-sE)D!QpMIN@#<c?!<4WsDmMzQG072#i;@Ek)o8J0S%8=|
zfY28<$Jns*_dr0+v}uvMh__VAMpkjC9RQ9r90{JQv+(=|qD9`6HpW(slEsTV<yfCA
z;xnXobg>wAc?W!~WgFJSQ*eaJFR7I1P~fW-EBHr7Ms~`pbb5Z-P?<TF4KxE3Zm4({
zGGL(DELvB8CL>G~Hoz;mITOnb1mH*|^v7^x8&8}SLj=7f5OYbtTMGp+o{M8=_*dm}
zFktAl#%QY>qI17o*L)IhUAfgw#Kv#8W>Q9rK<y{MI^K@_XcSmUi2z#Bku)-$c;$g>
zfj6A_-b?452NL^alvFTqa}1S5s;_LNBy+4!SZHmJ=w;JYnx!3%AlnZdjl?ml?+hLD
z6ThY)&`ML54{%=MH{xTK83TlFzf23<6132CeQRqhUG3ZH2miV{h>aI*6ro}1XZos_
ztKuTVYcdDswnk}n1uE5_4m*P2pn^bXF$GhW-hw-&xNXhCOda6H)!&ZH3wQLsMSO2%
z@xXOQL|kuF=4jSp@r?l|VMb4h2V~d(@w}^sf6ZITM>#s5#xWeymh>}SKZv~3`wzxY
zrB>uXE<FIB<lM4LIy)T^or_};wUG>l#aVsiDSJKgdj2w67hGW^90fT|E|&dQLl_A~
z5gNRtd>v|Q&J`p^9i^r7U%3Fr>)~hlp1ib8O`oYff`!(+uMd=G3->Sqb~pE150Ze6
zMjf_NS`5{nF#mj;zB(}SYj!LUvW;ySPkFLa)mJ+%JAkJllzj7<-?gRo+nzy9vxmc*
z96lI_Li4)ghnJ}i6zMWo7ywa5<-5wS-$u#%tw;rTw2p!;gzG3|{)0pD6mhuf<g$Gh
zdz1n~AI$3J3Ke9rA+Bq?b~2*t{475ATg%%iH<4A9(H?+9isthX&1as6n92M6+M7LF
z#Ep{^4y9EFX?Gy_^3z*;XL?*>UtixaO9nEm+&|{z_yEa=V-t=lOh`t?TFHt>L69{(
zPohWhP|NAe4UimdMraYf@}J7E38ASH!}Wu4SIZ9S8jAT%x&790O9iULjX*5uH1NyJ
zmx1qVHsVGX=67-p{jum5@*3TdUnk5uVKfYN9!>Y%rEarSU^E4jo;A2{XrX+mSVcW{
z!{%MSSFoxhN-Vj{-!s#55o~&7)FPwnlP>HO+;nU0xCHx|_8(q5o{k74bZ18Hj#qMw
zS!+u+?apgqx($E<gm2E<`_7Ly@#4*<t{T$!%Z;|4XW4zdoH?W83&Z25;QW7i7Vv-a
zEc}m5p`u@soQv+rsqCxXW`oqb7Q;{pgmqOebNDbPtiO$h`^W-$`HB|#Fp?RjY+Fts
z=BI_dr7Qv#I|I8*@Vjg{O7A3*o*Y}i<VNR4nzCdON&QJmv^Ho;@3pGr0+VuhFFsFf
z<Tz(<Gy@Au>lu!8+jIbx)Xds6IJ#Dmz*eQ@hYXamBvTFtYPC2Z3_>={LI9m(fkq-Y
z?kwZ8xtPBY+u4AC8^i<wUT3iagKY=Sfzj(!vU=Wj`T+UUay}w40`5+~vRF3_wv@C_
z$7_-=)(yckijuK++~yKSUW9Ybp%*Vj-3-l*r!+VUvI;u2gM-TJekEq<CP1i-S}9mK
zs0txX3sCslw5sDNMd6lbPFx=`(U)4P|7?43>9@J|z4{}hkvG$40l*rw08;XN3Lqth
z-)LXJH!<qNREjmzo;|$0ECe@+%4GOF_FaH<sTtCPB)Ru{kK-gFx`bDyRhB+=-8%<C
z*4nKfY{C-tSHhmQL<V~_JBoI*l>NhQW_+oU01v2oYMr<H9gsAK{0k%%lpbHIQtOlr
zpeYZmTnRy$+CnTBC1&{-udk$SMdKMGp7*ZSUw)GaJnzuapY^5U3wmLSC-G2$^Nj+1
zVmY1SX!EyxdvjuPy1XT!9$^kBq~Qg9NLRxPVYl2YARu&_5o*-OjVO8Rk$Z#mkOi0q
zR8f`1e#}2-+r*}U1(?<}!Tih)1Kz;-0&G)1t_n9r`Kkd2e~OYsJ6JXxwG8^g4lBRt
zbJrsQuc{5e-xFbfPmk?F1^$Dg)1*N59{>)a7ya?M5Fv^l;2Ve(O(|+S0e<6KA85V`
zIQFvo_>9cUK{mzZmW^%zW}+AGdLx4+JOY!!hGq@W@1<rlY#Wk3^1@>Hrzj;FGyyHY
z;q$eK2#})SxdB;G7f4Z{P_gv#Yy?z#!p&=q4p1p&CI$O-0J)+VkTfTQLZk?gB%B#T
z!bV<nuz-HMN?jn0kk<WuTopi~geEoj9@B-R1~MJ?^L+w(tu!yy0q_b@rF@GPK%#*-
zSfT;ZFpDaHU9gxt^z&s09vNbZozV;@tDdIW^zzgTWC>U|x0)saMx#0?HDe0kG#Lm?
z74bNn88BpqH`=G?8W<rw>ax~%V1#v-S5&&N5i;2Yt^$b_kkp`|Hq`(ElLgo+hW~A{
z{n1QArN!CmQF-KkuM<v;-)fzwLqvhGgdtI7G)A=KGVtstjt<|~;M~$i#Ql0{0@AM3
z(Vfb6cntaevv^OG+~fX*v|H`z#Y=oYyE+a?_E3o6$^=XIpvu-}mGm!?q5m(Ep$<IA
z0GI;(Qqk1t{~$UdVMGVv=Se#nKrqss8wrs`8K{K8Kn>@7&PTv>)?b@61FvD)cO<QD
zK&Q36xR!xefM1E$1NfDw%FZ+g;MK%n=o~{8t}O|eMb|O{eO|eLkqmYik^x{cgfL8o
zeKzl>)PE2ik}#qJjc>0R8z4HWKAZIyBA95xM*RQMj2)~Q%`PbzzalknF!mjI<>D~?
z`kLvLJ`6Hx`=3W=4jY|((;fs2H242Z<NRNv`9GU!hBd=tNCV?n{s$W8e;QpqY;;9B
zu2YQv2aO|*0|eBO)LV>4lqlz#jHPky&6XwVT>g*gAZEEc8r)9|-jKg1dbmF7x6Jhk
znJ$v=A0B>f==ap5As`H-5J26X$c<fXci#dsl!^i=@unIqm1z~yI90W2%>RWy9xzf4
z1->PR#!wzJ<mTN@q)!%orlVE7-4`kwvOIHUg|=d{biP0Ji7-28BFp}Iwg#WpWJk#U
z?DU#RL^&WrprOCYM4MI)%kV$bI}jeP^iRV}*B(Go2B>WDex|+BXHJotR$fOZ6&G9h
zmnK;&`k>12BBlX6g6J_aUFasl<vaNYsq2$&@gg$q$rcsirYK@Jz(DD>_z=p=l(1k@
z;GaaBh?q+(FypU1b=H|75*)6@CU>r!`J9K{ApLzBt6C=d?goFI)y-(6ayoo@TB?a{
z-K}7Zq!nff%X{%W&&Ik`N6NC-IpHH0ZmT_6rG!qan8Ya8x$5mmVW4KY%r;Z+{lBPt
z%b+}-=-)FqL4yW(2pS0P?he5ML4rHMEm&}Omk>0#1PJc#?(XhRa0sx?@78YpZ*A3m
zyS1-in1_CPdU|?JpYu82gC9Q-BbWN{u<FG`Z%Mvmvlx<cLriAUP*o5sh@PClpns#0
z{WUqJfXgectlW`T#Q8W^fC5cATHcMV_`=C@sWnO`E^l7NxJVjDf#-`89Y{7uu01K!
z3}h9|wn<(qdH3!Y=frDPpny@b+SNh7SZ1(m?JjZ}@wxt6hFkXiEuY=gDeBDPKJDzA
zI@{My>3kGZYE*-xd-HWr6JCb=0`pFnunEU=)F(02S2qR9Oo9v31)(p15c%)tKUQEZ
z(-eP?y!R3M`RRcXPzC;FWlZCAf`Wp=1XNZIc6JzDzTb*1O-52ffYw!L=XBARY_O3V
zpmt0FE^UyJDf3f)*j_pP*kc+QrOFThD(7K83)c7vZ_@ciLF&Ej%{i+jpC_iel2?!m
zTY)UzDmR(_<hhb57N3ggw@z=JTVd8{yjE*0iNF$x4cONT%wIT;8f{<Cp70B;%L*E}
zBD@_Z#YcojOEG_Gd+<vEn>*c!pjRY3+~2horH-E8m3@DgITI&KC@{ODb`@|Juu}Gt
zYbJL>iyirS#z|P~U0n~Zm(M6L$;CIisM08~IMVoNPiC{!NH0rt6klc^uzsR+C)^DC
zq+D(IBs)9q>~3D`Z+1}|QDm9vn0(n?g?y0D9?sbpX@=Z8)w<do<=%*GW`t~LUGdf1
zo{wm!)_KARdZu9(xjHfr2jv38yO;4-cKEK)QvSyn35qbq^uMq#P)Y&^D(-hDQIP`#
z!dxb@!NqWVM)?mlq@vA0q#!LTpsSwxaHiAkL?lNl7S`CzyJ7u|*-r2+S?j|@TMu2o
zrC7J&fsC}v_w}c^52jjq*!r8y9cY9iH4cJ$<K8QZ28PQ3gTd$4D44;82mnTRc|)Ap
zY?>fkql_)~KE2hI;_pPxKcq!T^eBgwVEnH@>Vuhs$GMl^RhNz73%oNizsTH^U*9hQ
zdR&*A{Ezg#rxD8^K4t58*<|);`1>JqTCdG@5B5ntjt9OHtS+7N+95Q*!Vk9j{9ZB_
z`mXGGNL}${7Rh-1aA6>r$#(ARM`bST2)<0o*Wtv1MAp{U=95+a?YS~PqXj%%?Ml9%
zZ`e9IiUYLTc6a1mjMw#%`dK&^7RGF;t|aC?6CRHPmDBM;0Jr^4@FCC<Kxje82Z~Qw
zAfwzs@Y658y@hI8O4&qjAYBn`QL57%%GeT|sE7lHdI@G=hs6oBJ{)tlAp|=UUr}DT
zsFTT61<xHaE9pVt-$cKh4`rDo?D_p^H$AH$p+GN|&UqASV@W=}#YiqjdF}T|Upbcq
z%B>ce=wFjy5}<C!$e+#$Q5-iRRqs3E_5aN<tiYBnE-9?9`KHQ~HE^oP=l;&VRps5y
zF9FHBbwjD=QgL+<#PJs(l0idlGkGo0EipP0{PqLdTu0VW*?65Cam54tb;s_h>GZ`6
zeD`N4F#mKea9`5~?_2*-j7OA|H=MD|cs^WzkkOuEymbo00|FTL;lbZ+=HB33LHBN+
zZ5N5TSBVSUt8KHnUb(`?1a#M_$|*8Ss>YaH5`)&7^G3Sdlc#@8cfRX3RgF_xtH43j
zYJm2n_Y&{KOgM#cbA^DUbLhT~uV$?}eLq$_ThF$-k+Dx^G}TTl-<<$Ls}3+V8_N%C
zGo6xLEY|M@KE==JTm=rYf?=@VI8CfIquseY2{D+jMD&2A(+KqrkXio((=DN>)&<L;
zBk{fqlP+J_f}x`L8^@#QDhX<HkpAg@rJ9tHl+RF7YP0g}HrVGn5DUJ(;IQmjdTLhW
z`?oAWW5f)0%^ktlR$~R0)Is+J<8H6ee(^_jufQmH)A@2oq_!eLA>$evL@^YIsA73N
zUA-M}`Hlo_^f0G*`}blLq~^4aFFC{3yyFfW_USy|yjkUG3L2OHk70fYUUYl<=VCNu
zitkNh0CWylR#x^_TU)st&(?&uM$#ZYK0dyBYeQgXxA}0|+8ZUPAt2#$2d_Iy?RYTd
z+qCwGfKEiBUSVW9mH`DsciPnJ+-?|J{{5A)Z3f)l+wD8|WHz%d7xEXH;QQ4*qtW3E
zKmt8O$~^g19QodV<!#+1*^+*M!F4*!*jZfE$1FPT+V4Qh#`Ab(nI8oN2G0`(XfCb^
zf{8)qCVO+^Z<X*|D9N=#N4)uB4D;Cj68u=;yZbryd-sSJ+pJaE$8nil)|fa}0Qp5O
z!>mP8DriQrFe1a}dU6+uHax4!$f&m-8C+;@$!doY!B{-y($qkl=%1p+rfx)j2b2rb
zH>tZpr_=5L1OYu3pX-~+ZryIqyi4)C{Rj8=<~;94f`INlG)v+86-b=POOs;JCmBf$
zf5hRiuw|9&66k$?P16>sob%(3vs53MwZJgKFpIJPQH_JE^uDE;cL0d&$^&^HSA5^E
zv0ZqsgsjPOe_kHv?kt{^vBPPqq@oc;eA--07v^`mL-PGnDmtIat<WeXT#a<Iwpwm^
zqeFMF2;;(Pq;T<Hs{6+D;cVa363)Kq@3RDN{Xz|*H~L9~)#QH_h|3*p1=&}fdX2a6
zinH;rD<?l-a%?RAa{A6^WrcVDDJ9}p#6gzf@BtbKM*F{vB3n#M`A3<YY-55&Ux~uP
z??S5T+!{5aL}Z;m(ck6lSU4wU07ZL`Ve`F<L&gK@77l-@^3+QPs#JDXr|4YUP9M>+
zif?e=YpqKX7KL#6WmW5D{{#@VCiW5l%e*jjJMtIB8E1JwuJjMg85HhsTW#anlH&H&
zV&Wh!%xty57W16U6AP9=b#-ysG#-^`Y)h;5kSNV6Q_^eATI&d)@vVJC%>514JqqRW
zbKUoIGC&~sgQ#(^8>^3Eu^MxZl>R@*Zs2;G%gVeCCSjx3!GnQJ;kqh&7NR1*8DxzN
zKU1wZvfho|_iVijTc53hlGkdC#MgAvz`$`=lzSd`IDy}Bb`)K?G;7}y=dUQJ6MI7E
zK)<Z`YodQc3EvMq-gfabp)<(I{yj#DtYryTv84w-ShkPtqJ#uTIJsYU#=R?^H*oM&
zTPY(~>jKob!bD`0=NfPC{UoV2O_)#lH$?N=E(KU#=7ZhQ0qPVHJFc9W%Sf9m`=2SL
zh^Lv-m{D(XPnbV1xC$ojeE^-0?xri3{Apm)R;z@J@=*5Gp~o&G1^_ksv>w)SX}^Db
zR2m`vtVxev{%1D$C80S|rzM=gFK~U9g<|~=K3ka%O`O^FbmNVkfqRB1`}Xk?40Wqi
z==iaQ;c|PY$gWG@MkNaU=`Hc2eSFDkV~_#=edwfO3}Ix+tVIi$6XaF#MXsyDrm8J;
z-+u>ks9YWe6>VMYOijIBuq=99vf?E-t{BCbDu4GPo8h;(B=}XRo{#%n5a9`qVddU0
zA^AJfxA#M<2<MyK)rFIN2roU1M$anr_u0W2G?YrgRW+wx9mbk9onPHgQY!xY!*718
zDDTS|w!U1<(_(4&x5&3f%PG8@Q8_ot(#*0b+5zp8CWa!lBL%8lzH9DMgTE?kO~Vev
zk@TA+{Z9q1MEp*`!j=*GFqb@x#^QEWF{Hy36U}NOPYO-1_#(Tr-st<&fsfSQ0%&Q(
zMnQjT>hA|)8gj{OihoF|2KkV%sYnPdzHwjcE0!CG2R*^py=2iLZ}<;FUdTJW!yw#E
z%53}XZ+o)xXI1-OG$1Wui3f2|q8NfDk0WWb;gw!tNLwg}wH(7ti9?*n7&!ShOJWcG
ztgz?pGZ0w?+XJ0!mW3aTf13Yf-VDFMByJc0CK2oXmOEDO{*ktsErkoFaX<TFE?Pip
z?G@ywsnBP;F17glr2kusLlF~4vSe9oZ6TuLz}E&>tm{kn5pJbjQ3~X;4WJuN6`rQd
zPtFb{Vy6+(#(&uU(l&o`irF6eNXGT9h4W+u>xrJmXf$+HgR?tBe2^RiXMhE>ChzRS
zGsi*~8ZWOh)2Q2vC`1j`hx5Z==Dp8FG!1h@I-J+&T_Z~Qc21w)=##TR^|NNU1Q(S3
z9EiTyUX!=#W<fu`Bd>CBgk3j*+)1vpwTNmekK9~Sm@V*JHofo}wA{>=2fT#ZW;+cQ
z%^Io(Hd~uPX*r!2tdtl@Z}1^NElm8R<{BZ!*nYQ5j6koaa`J6`#1krQ-@sRcS^2Fv
zlG17Z2+tRO0GYnoRAkVe?_kzPva><8(2UEJ$|;)l6xlwX)aRXLcoqdwwrPl@4VgsH
zNUDXS75d*Vn?#Z9t=y!DS=*xaW_O?L4&34|IpMIR7R&Je#u@Korb9{Btk;5VcoWj_
z^D9gK%r{tZA3jL{MRjGM`I+VW`ZXox9QDreVr_t4)u8xXZ&xq|d9<LHXF0I{07Ccb
zrXS`4FvBXs6`R8VdLncAizw+LD<4n$1x+S_4rBZF7Kketgao^0wmX4vp8t4|sM|NA
zU6n=xji1!|xgn8kQre<u1K6#Ysvq{fbx$1oX*O75&{E)C$?i---eKY(JDvKW-|^}Z
z;~ps}of|WkdD63yTA)c*lGfZzJ-kHGuC}(uta{up3pJqr$Y9rCdgLdOs>zHf)n1(o
z73O>_9yxE<^^dsU%v&31ewY)AA&iadJps}R_EZO*@qc)`E%|2Gh2_sR#yvKBBRYcu
zKY<6eBQj0Q%~kOGbg}PDE`5Sis4vgwu0VFlNW<Q>6|{0iMm;_TEcNo=y6ERCWs=G-
zsun9WY$-ZX?mDTN^W*)HS|o&Daat*H7t=!nR;bPFAYiEarbHO4FVk4NZtSRlqnh|_
z`1IBrJI18P{Ho1-b58CW3pPva|8zL2oP||2bZU~yaI4%Y<YT7gq8ix8Gc~$cNJ`vr
zlbkMCqAmPC$n*Di<jdv$jX^}UoA4F{o&G)#&$zlLBd@4UU6{yGjfxjG?RI0hYU3j%
zeqSqhL{|=lYSfxpAY{l}PfAPAxG3wlI4+a0j;$WJpgGenkADFKps+v2eQt&dmJx^^
ziU;?rm~^@E79m6TqQ_LTx$sA_mSlJj4Ot4BEP>3N)K|wybnI2!rqKjU)c)kd%V`V5
zyc>8!y@oH&@xv()nEc_6Eu5nA4rius<1FM>_bobD|AYpoox+jFzCv7eU$TVK?;xWx
zT#0IW6<Oc52h{4n<(4HVq^g;Rgkn-i>j9L#V?5VD(e7Z1+Nj^a&VkKzjAXrYV=PmY
zO1&Zn(Z>9fZ;|SsdqKA^P&(b?)vLG*8`x$sWZlcl%i4Z!zA~6(uu{;>pghG=8f@*F
z{~B7iwnkH(sM*7npo#VM&dL_0f2;pW+K>xT#Y=&T%3Z>plO}uEYV+w1XUZ6t>cqG0
z?d@dz)T<^3JO;msElT5F7jVhqVx{$c>nQ)|arsAcGW?3)tk(hEgOCui>BANuLrMc@
zy%6|Yvy&;MLU4-8Xzs4YNYO56sIAEDo)jeSCCWDD6LQ79Eo<4rY?~LCh#7qChr<#r
zE7YBN*qTM#O;rA&EyHGb;OoXdyAAcVPD>y;k-U^4>9XEhjje1x-1d<5JB4f^BD>RG
zZ=_==%aC=j0Pd}(Y02|+lO`59m9i5XL;o*r4?@Va=qk_j@Z5_14)js|cl=&=iHW9|
zp(BEH*w0$YzvJQhuuaQgmBUGDqu+c(U#BBGlrzY&McQsh7FCGbNmV!Mrhw^(RVHk5
zc>V6*2Mt)9hDigqe?#1<seF;I3in>^3f>}&Qt1e1iRq@mbuNiE{?>+}lniszr+I*&
z69v<eEIsdy9FOIGb(|b*pdW-)F6)NXlvjhsX}CuqNoDCwO=gEPQ_2gbWQ;WHET_Y)
zv`%!7Vp1D79`ZM}W32O2PpRo}`xxB4EAHlvMr#C3bB#qZZyk@WMU}SKmauc;pXSj+
z`tPR_m#DR{nOP+(P5B~1qnE8yG`*om_|I8lF8?RC-6?8q%nRzpXxzj}wlzx5uge1q
zd2xMjFa_+2&pn&pVk=}izm^twYIeIpQV@2Nt4Yw?kR>9pTL$mG@kVExVzqJ+W&1$*
zm1O~^BfPmker7Yp>Sfi{INOc!e}jDBTcUhWB7HE}-<Sa2J$!Wh9t5q4K>4i?<Gp42
zonkX@?6NuqS)g!ciT*|2#~Vcdp`I)3i05*G>n*F3Dj`;sqe+kbq&u%4C}bvw_<Lq=
z?h5k#>>peqc3+SdzE@jtf?RpL`zXKZ__`G3l84+-HKWpyuLL%NAB-(S26pa$GpBl$
zI9tC>xx%~vaaLl7H~SCeXuG;Jmdl8V7+V;E{1^3hi>5awahT%a2K=s%oH6~`EO6Ze
z;wOTgh9CJ|4`#HhaszB#psR7``^)iuye_D_eh{6yLB^iJwp7uVrk64qS!pmFzw&d;
zUP83-vsP$OjOc0-=G9d(W$63ivxAx(Mi~bgdp{tsHB*e?Iu#5%pws#c)2+=P!|tKs
zuQVoxFGZQLLGw5>i!YE|Oki$UCuhNW&i3v&h!xvn>mZdn-RQgxpa0v<5#xOWx0h>p
zIgMxLoEm*o52!EpPi=><>uBDUKL&J6njxb)u;KNKS{@Tcq;@+qT?u{i#YemMa}}&6
z`M<J?bbk(W=4EbmoBSXhsS`i>-JAc34EfhoUQ}Eb9hQP!09~H>0&izzG4)da|8pCN
znxeG?vl>YeK7WmV9gpADY$4eo2oPkP+%bl+`k&*UMZ%2RGvNH*5||wiOgJAB3{a6H
zQ)h_aew4l^a=ShXQKCZ}nQB)TgoZ)gkxwnW+)elD0shnR-%20a(|{uR`b7H-K8kXg
zg=GD=Kp{2|2!d*KXX4M(QzfLU6bV4$a=$GrFyurZIeW<##HKb-tFj$J26YMSw4=Ph
zwAX3!ki_TaQ}Dr!3PV`H?`}6sMdB74h0kKYO~b|cL554Hp*>~zl+HprHBHoF!D+Bk
z;sG75ryxRpjBjaX*Yzoq7$M0!6lCsYhv$2-m90Iddu8q+rkl<SvDH64ZQvB%!kgyf
zM%_`t4E2zDym4A*nIRMmI5ARG;*sPqTwLuZt`Gh6sva$e>;}`#u=y7<n9z)SFlE?K
zKXCfooyuSLQ9XUq?1Rthmm7i*c`p3!HuOXa#694{D~kN(eORGlOJ-5JQcY%<!<SK?
z&vMm{FPQLI+W5a|(Y?q?HM7c0pmx@qP8>aItx&9rv0la768FSjs(@=u_2!pE?fzmG
z65N2%&uCF7!?L(ybJYoJGscQ*8jw6WgMyweD5>uD#gKOs?%ms$(Nf?jCu_dXCQ}y;
zNHp@i^P}^=Q0s#?ps8Vsy<_-BYp(N~tQ#{pp1bj%G69=%oj)Nn^J1$k@+!|rr(&xt
zHAZVk6{Gq9xWv(qoJetK%2{(5gVcfk5~<Xb&Ov+gLRE+ET0|`fkxC}|cs{z1DV)qY
z4bNND0}5JkNI5pNk`dks%jAXAfeGw6Zho%usA7>37+-y%X~GLLkY@UzYEs8GL`*l`
z#C-}=Q&D&ohLhQ`7)Vo_{e<C0P&$BuiRF3QIo+I<pP}?ps~2&9|5OPeUa}&UegIiB
ztRS>^&?YGQ2V<FjuQ==YfXL0<JU(u-*65>M!(_cZDu&y<xc{=^r8MY29n5gI-=?gQ
zoJlZaMTh_*{HSgq6gHI&Vv=+354w8K;#|0($&Kx@-^#cG$7IfPRVHPNh>cMogCG1a
z`f#^l{soDVjL8`)D!(HdT6@uW6mAsAl>+r#z&~5^co1Dz;YFBpGaJr&!dfDWvP!G-
zjO2-@rt1%*f_G5jXmS`rZxYi81j8C1=3u%j8h%HWtGvG__OREG<$^(QLNZ54`;h4s
zb*%e`2DPSBCb(5C8|G*e%h9qO3($oj6VQcKHAbVyb%gf&2w;4zp&%_SRgn^EuvJq<
zIs(D8zT!KoI8Jm`v@ls?e)~a=+ZdH!a?{dhrz`l7{&bJEOYZTuXtR_Wy`#b_(~s0L
zFqYf5a$q6R%d}u1diW3_$}zChS+%~VkCIVG>GzS5aIps4QSrHW-s_F1DYHfb2d`=p
zol(9LC4wMQ>|BY2N_h35ev=jJzGixe(wfLV<pU>sl#8Ba&V{e65L}pu{rMUf1|g&G
zNBdR0i3Yg9WOu>PFbprC@Z+<={}3{jmqJ}BGm!JK`v;t+vtCy!T+get)Ymzn)WogN
z#-=~qJ;aY6J%t@TtTu>rF3r~xm)>Zhx?~WkV66HUb7xI=%<HQRGtHb>iNpRxk5E$H
zl71~(q+)wl0*+j=Sk{lc<GBTq%Ea%IjaHx}P&e?8%BBRf<Z~@IyE%s^31=<q1>jUb
z;YjwaHW`k|8oi&Cdg!@2i!G*epRvTwo7UVjWbUtBMWm+7tIE!%DhkSNOG!?ogTiSV
z9QZBIJt=v?LZO&eAw-yG5=h8JX03V5^{ShSDFNj@M8Pg`L)jsd3&(O^Pq!3ar^ySw
zHDb|JKN&vr+9Tq(=vyT^D8_*Ued@D3$}ciP-MkYKs`1cQ1i86IU+P{JzU>QJep?Ev
za=Nefeoiv?I9#WKD6~HZ@y58x_e|wLA`T{+&WQvLMNlsS2j9F82_6|Slf(}$!~U)m
zmqL-@TN;tAM#0*7oxwGXeoT|l9Rg`Jpn%hslk{<$MST}68=Gi92(L`o;DCSp2oqrJ
zM}C)5`6J-V84Wc3gkjK))V&<Dw>)xZ$9lO@J@eU4%FXFm;s*Zm``IiWiqK4q<G|IN
zSF3R|HX?uDe=PIc_+=!Yf_5tS&xbO*ca5eV{aYaV2x3JT9W$50he@L6@jjyU6B-(a
zf07&-8*kvuYR)-ey9pO+aOMUK*o@8f#te43h$kX!0;+JWS3_bhe&WH{v}CUS3hd;w
zi!+FsqNse7*dAD;gquy1QYTd7?C5zQVO760$F6dM>4}qRTgntw$XCuuNpjK-%(fKj
zh6+{xy1DNsTczJK&!fgEq4-J`p56)mmVDnCemU_|yS?OywkhuS$)5%>vYNFR6#YDP
zhH1%M68Og=9Zux@j{?l!Gxq~`C_e}6gkNJjT+HPbC4Lez9W4BT!B$X;Vy^Fw00$zo
znMkhdZ5E-lZMc}SdF^a>sjS}}ju%v5m$&RGN3PqCTS9KvjD!p?_r}$#OfjsZ8L5=|
zV=2n@+M&s%NNM)bP0;lL%%NV0q4@<C4(|2Mn?LeVlJnk32~e7xb@ZB6Lp_R>w!$$L
zRZQaAv!?QMI^mfC!N_;vi!+gIKxg-298;nF%JMJ2c{h(`zK{t)c~m_k=@!mk@#I_c
z*-Nm{0`#E_u3HMaWJO`bH7^;K5~V=tT|j@eWOlt9db`)86BlQ(pUyOm`Se#w86h~%
zx|<_7zFDgd>wCSi0z^24OY3D=xIS?)+*r_5y{(>1ZFF_a1-!bX-M~bLIxD1`BWS6m
z$8rwkt+co$grYKfh6>m<UY9AXVLNH(nVQvk&{bzvvzRWd1KAMpoYB$MWZ344!!t4^
znd2}bxk;;QaJf0zjd*>vSw>6Wj#rI#8b2nO!nvv?=J)0Gc}s|`ls&O!fNeUPCRBE*
zfdi!0eKEpBV1+VOaED{G)wHnt2<{qlwI>f1IWl~=+i<ZND&OKcW}|i26Nq@@B8X0z
zQW~3_sW%W>zq1<qKsJfon}WyfRgT#3yP7tQ5uH*|S_8ga)~v5;Uaj)<)%C>4-6-ZT
zPTuLu!*<#Onlo~_O4j<6#FgOBpG!wCeO}0xEIiNG^p?K!Y~*;nHi@)`;8~SPfjQ7Y
zf*hW{=c-&>AnsHx(yYTwI=>VhXZZ7bIo}@O-BRmyihtKrCNOa_`=AJg<N7m$pj8~L
z%neafWNRpClFm(Xs)tZE&hM)^E`egH#jXt^#x@rY;SE_*z|kuWUjBE+ur!I!C}PW$
z=`Czknn|%vR2zOPUbk4zR1DG@p)&3Jvc}~2K1c}|Ua(6*4BE&}3P<1fx!(9D7MBeq
z!ejGZ{@&jd=7_~8(8DjcUUIpY-IH)1hIlDOn|Suz#EZXo^j9yHy(cACX#cxTM?@$p
z^e^wd-1SE?x2qHS6G68~x~j(HqsGKtzn?a%n5O692H5U43DjG0L|?ljUOKnD!5QF<
zFtQQNlGLs&SYq&9Ts8e>pO*|7>P!E|{tZ=$;T_{*KOzXOs&nGSZyYiH7O-1xYsGQ5
zA!xX9i#uXc+`ja|gj#Yvdoypwx&`T<m@z*s^hS!nIw;_ZZsQ`MRfuWp!ecC@rB%RS
z9Fo>c8$eQi&&1p_cnE&!LaxMA%dddOc`X}${<i`Aa^6u4JNFx!1~X%9nwA!g2?1<u
zE=efSs4~bXM+#iwl&RhYhrl2e1c$H|>OkR0BN%LWL(>>+gcq8C&xq{%YzRSbgTG)F
ztZkkxfX~6iVVYvWDZf`}?_ICPQNTc;q!^<_Dv-+Xjq0?Z%^*XQm2Q*6R*3NqDAnQD
zw-<uKd9C?W-rNit-IVWW$@32Nr+=PX0pC?__d#D*Nl3gS!OPO7)H`&pF1rMn&->p0
zAAMz8wNN_j{mwzPV2@8}>*I-`+|(89fKL~-(uXn5FQt#nXz%6!IBXj7Nf*pM-#wiA
z-ya+_3wHRFVt#m%LU!aPwI{Kk<Ve4~*L@Vd{ODZJ6ABXwquLJzr>vH%R&1bvR8WS*
zthP;pt)TzIpgdHVI-`T8OYeuDf>3};Xg3Xft~XNA8^38Z5hxs0S^{>aZlBwik>B{)
z>UyFL9+m{1f05wl`JgWUO^G)WzYL>iZ;5y4?RM!ew=Y5gzjEI`8-5WI|97FrFKpLF
z!<_-z!wyqHkp}IN!WR+xL(>$0rc-660v!s#EB^KdbV#~ftvdsB2*;poL6|C|!(2QY
zK9B27E1?2t=<k=&X4(vq(TT9ta&Tuo?}~O;a1=64_PbB#z@2aXH*J3kOpwaU4X-0G
zGrWk3K2V{lQGhA-f4V@G|1OXkw+JsDbVvk6l@}3o=#S}C8#cnm&zGsF`*cw645z%O
z?t0Ga1gG4^=ykQ!2u*WI*L?d9{QRE-67@15qlQ<o-B3kaV6gsA7dY^8fi&F)IDVhO
zhzGZuBV>XR!igYAq((SdX%17&mLR30Ljg6oM1XMlSh=C(OR0m8vG19!Xa+z%POwYc
zw%s1UsjI8g1MJLKD^Q~{6vS&bfuj@TxxkrE6+nT+cB7%h@#5w4&ED>2$w<QXu(yl~
z1q!5d3kz956$aELic!~WPU}Nd)_Q)#m?3(AOZk*8zERpLk?ZcFr`yW$nIf!&yu5$V
zWch0`-#6$?Q3Mj12DYBOn_tas!8nKEyLkcDDzq8qK23Qlz<KgtJESv&+>vr0J|Qm`
zd?q0dWGe}p`WWXKo7$vm(>CBIS>8Vkr9PR<zVaYAu++S>_nL0r?F}apUsu#`r7WFu
zvb`^*9I;+Ef6CKVkXfK{W=~do4<13al}mEw;X@VVxBiAjU!~IM)QdM7KrM{GVO@iA
zxtoS+g=|y(uvrO4?a1h6gtBRq_Z7L%?FJBj)dA3{W{<bDoi}8cZNld%x_`bib2(QD
z7jBgw!VjKKl-4raZJQJFIO_ygimZz`*zj%*5#FVp_ojOpj3>NPYj$I_Uh(pF`2E>;
z5%qWsH%WHqE&qYvej-?4OIGTGRNmK)`30S`d)O#5>R^j5)`}n0?e*B?K#FEI&hC(X
z<+hP={8^VR3L)<Lt4a21pX`<P+C}?P*pUx@()tMu6Ko!qwy+qNmJGgJt?7yyMhimb
z1Nlw_CYy~zh6}m)->88D&`Tz}fV-ykiQoL+5{Dqf;B$4xysDE+MyZ^k*tqvUsXexw
z`z49<{NTYu;1i8`|0W$s*k_4{Z2(1=akcS!dlNd1s=neUVhyIbxj8+M<(mb9$wW|4
zP(2))HI~Al213NH#yTjw)dgx6!Xb7z0+|HKA2cdegI{|KJd(Ai`a^&jH&}bB0LlgM
zxje#iY|Ctp56;dxu45v7?GKNBYK~@$4C_9-_^Hq7Tpqn4uMz&0GwIU#S7UI?MM9`W
zf9u1D>;w@#BwIWQ^Q$9pmY^1VA8BBArQ7eZm{X<+l4R7;pRGrx5+n8`z4nMXTC9V5
z?H+X;ekW3_|EuJd+k+=NINxeD;5DS?4b^$tE2>ECR-eVF^emB;B{i-#+>kv{Rd`?)
zeSg|PHE(Fx>>vDMs@sgT-y?JMZ<`J2ITe+5IW?MY;MraY-&)WGsU|Kjq;N~|m3=A0
z@p$29xXGO?LZ<^1S6F$BZT`)sbJoX`J`rFdG49pom_L(#m*p9c@y-t#{bkr&jztyA
ziZF8@k+q6_vHD7hn@GS5<4>SlXyJ|u?dE-2BbVDI<zJ(IU+uVF$lGL?k8fv==07Y{
z7wX`&YSo8AZcfPIpb8%H<+{+#S~!nYYmMiD?}N=o8L~&^kS%(g{QdGDoD-qR@-2Q*
zGrvI^C)%X*$HSOx)CR>|%#ulorFlqeto1+tvJk_F2D^U~IBXx@8MGC8&QEZ8-i4aZ
z)>~WMUY%rWY6tV!zO-EWeFcw@*=DLobb)Kx?(%zA6EnfbxGp{$LejOu+?0G_PT5`5
zd)0Y%7hgqA;5Q?|SE_O`ynk=DgX$>=r_A&gTb&&N00iEk6i*oQ_5LIRy++lW8T5y1
ze9tAD)s_gl%gxc3s+?Th+%L6gH&UMyeUZE#uYSHF!@HD9Vxe&N@UYt(Bc;=<k*(T&
z0>~c&2)caf@qs}QOZvn8qJB`!!`8M1l4|;r*^BB*dIiDATMy16(FVgcH^xzjGmyq+
zSgj{E(WA6*(2wP5{f-LV2ekwWjv>LEUjIlJB;aT$mAr(fRtwub6zCd-cLf%Hqe1%M
zmFpNZsf$T)QLC_2Ip|_Dh8LO5F3@frE&Xb620WFeiy`d%y?BnD*af!_UeBVhKRDYR
zlN`sINTnfJ>W_c>XOx<o#tJVwur+WuZnBr@V<{AHu_Uh6;w+fJvzYxY6Iuk;=a9o-
zV<F<~bRO;)Y)>hZ>paP!XDz#U(7(j@-Pzp<c-}#)q)BWHKip)=fOklj`e6Yvk1?gM
z^NC1b0Y<^+;$S>wp*|W}MD>t!7}somdIiHQN(OS<zkgMVuigbzz+HrW-83UY(ke%)
z)FvD&6X8y6_Qbk+r)~C@AFBr89^!+Z9w5VPbqs%LGmm1e&C_*>s67pKlPGB%5K{eh
z#A{p8ABcm$y|;@ngm~9CALg^P{}3<_<nJ>%r#5{<wLl!Bl1cE8#gZz8{!-FTmrrV{
z)<QQokyq1<3`H_p?qyCgkuM*Ce)+gC?M!$b)4g}{aWf``L*Ix5%&ttOuO#0QK&>E2
zi4jOUEm*q*Om#mbxOBSI>93qYtXOP{h1R|$b85XK-$g}u%WQK*qDT7?R*z;Ug8dNn
zLSi<Or6BM-*uF`TOS|ZH4Gtm$A+ilPVnNSv;6l&`z9-Y^!XE{Owc!=UgByUW0)k|p
z*d!9cdI`8I;BXR$n3$N{K0Ji6z@QPlItSI5^?Pm}ZvxZ8li4kheqveU;o%`7ARyR{
z)>thn)LLsR&TJ9`XQMOmlbGVHV&Azak0tR}8|>c7SsTTf<+t6HCfx(=%@J1#NR}a!
zCMTak9hVTNcJ#3zG3AUbM(x#)yv8Oy-%0jsSJe(ALV1$Bk!B(~(5(B;4PB2MoS6r9
z@sERlIGu}~6V8_}*m;+)eD-ndwBCUR?QnbP9Ob7mC}nJb8dp@?M?OnQEP9J)nLP}Y
zaUXBG<QADTE!;rX+=Lp?x&RTEMs(unRi{_qjE20IpL8V3`8*zxDDHW)#7<JxI47pn
zh^xoKim9EVRl0NMl}rVKmuZ3=gBL5SC2+pc&r8m50~2OI@sQg~QqR#kg~5QiEQ$`o
z<|;j-Cf;x@^6?w((%$JGm6Uh*8G0F6x?y>E))jhdZeRRQC7AEwe=F2^zY@knu{&IX
zdhDN;$}Xxs&EPqnnWa*JmN6I?{L@Sn$pVFQ`gH3J@}Wp2^TOviDJC>-_KUtyE&Sn>
zp1A3R*D%!}gQvnP*jsFR9q4RrW7%<2Q6yBZRj=UlYSNEQu<Ghe;s)MveYz;6Tzf7=
z7gmkA&Jmfb+QzVW)?OHFUHOM0^$SiMLlC3+jF?2uhD){~h@nT7d1ZDYCt|^#<SS#a
zQq5XpkH#Ty@7MYXzkwHBYH(mn=d?a=TGvbDTnb9M`m+mm3BZJVZFIE0zOGm1O-)55
z^$I&OG7|CiYYfLzGv@<d5$w@l{IptPbJ~7}pOp)hKWcHp(a0`yzaYgxlq!US-|f1q
z$>l=q4wNFxN}n~Nd;*FG7%-xs9JQk(yDvn8*Den2xer!3mBOnn!Dn(jX6T+@lbtzE
zBJNzt7BB{>e<5b7#8>Zc$AAQq7W%Ujy<LL)r=LfHgs25nrzb(geL-9qN}5MpZWyO#
zv)Nqgs#8>n=(-=bSZP35AdrqgBOF--WYRGgS|PKRbN)qsbAoR|sitFV8u2rRAsj^=
z^?8JY>k~0d*fk*&3{9Q3((^~IPsrihXpf3KyQ6w%S?ub{OYXOLjgqLWVJ4YZMZMWz
zhV7@cX8q1*<e4o*JEh{Cz3OLs!0kWj7|OuwR*uDu6ZA|c5cY7@U+mXC`{j*ZQ(Pe4
za-g{Dm%Al%RHOI0XVIy1KBZNEeZ&^5Y<=_3PaVIDX2<*bQMJu7_ZA!T=e^C*ojQ(#
zqHMXp`=~cNRTw?U*NsK;YAS8Lml@hL+P{lzQ3~B1CdaMS;1zhfx>?<bH_SGz^2MdN
z7M>ih_k0Hgc4K{j(_CJ+(MJMS%#q^mc8;LfgB^d`&X!{Nd$5cQ%4(cOvy)Z>ISK>o
z&Py$r9DV1=+8hXlX&gNQ)H1>FLLGj#Sxe$N7h(i$!ffGrYKsiAbG0Z|VT$~$5eayH
znQc(sNnA+q-(H8X*q{)YCvuA5YG5zMTJhNok=0g=2f6@lG$uWbRL9Qu0&uIAb}NXR
zE`|id5J%>`Qo;-P)*|3cMh-1bhVhz2=SFDR@=^?;r=7#`578DvBjO7N3(p1s)1`hb
zy{YQKE?DE3uQ0|smRshVBlCl?V6j69yT3XNtJo)Yx}wsmW75I+JA6)8S85|z5%$%!
zwfYC}RbT5i1fEpl>gg>f<0-GcGB^8o!e>Q<HW}2-?e)q1M$X{R!ckw?$4DE+S}9@K
z;}xjv8Gi{FnqRT4-?*V^=oB4UR#PQzJmR?i8cu%ZZJq*A)1$`kaLaikJsE+HOm&&{
zaLV}^NnB#QT5q8r4W>}h#x!Ov=nimc!}n{nna#I(!i2iTp=<9))TzKcSkX%}AXum(
zy`PDgM^R(s$&65<%rIa))^H-?#1PeB3-q|iTc8a!bbEe9_+Ixft$kjswOH-1jdx?1
zFoeS=<MQUQDQ!c-9_LmDo$mH&uTGO0P6{M>w<-%(JnYJ#Y1qE1@7tkwWA3l*!yu&0
z*oIfwFV8F^BT)6NNBoeXJLrLBxj-XPI$p2Z+y`Po^N?>s&Fxm2$<s-{&N^~@vLPk0
zZiT-GL(Cxj31IZpIC)$nd_)&jbBN&wb>t{Ha##^Ye)T$Pgli;ovfaGltjIgdb!m%F
zU8rtf;|M%e_d=@UO&YrO;}49p_(*EVs*~{~%X@9yS7GxfD!*K36b`&V_>Gu9?4ZVi
z709p6<`<`RiAJam{lC0m7r&(egH+C}z2x6RtIhc?ey=cVdRQE}nXR&CE5PQFrXH5f
zI+C`%{5>c+meuTNYDz`GZjSxuiT?Pj1~ko+WXl#1QE3N~J>C3EyI7%10>+`Fb@*Qx
zbeizecpO;{<Ag(i#1t^JAXx%HPw#l4n$;q^77I+|8tXkyFKVq6Hla}hco_mYBAB<Z
zhKETPbEoSf<uISkr+YSEblqmE^d67Lv5p8%ysNN(%wsCpZ7s+-By)V}B2JXzJ%sZb
z@NfQEVsH>?tJQGx3Jvuj!zRtV$MZ@n`gOsaJTbh734K=?uH0CWstRlQWqKu|=BKm(
z+%FwRWNH6C5(oV0BisG5z;9fHm<eHig+tp%*6TLyijnUNV{UFI&(|NCZTJJJheS;=
zJ+syx45ZZu`SwVs42dcmRLz9|mRx~26TQLnI4&MDIu@}ysAL^MhkcfXJ2{~|HnTTk
z?XJkigQ3f8qp~Yyuiy3`^!#?TM=_mHxcyO^AwDcO09)zRgg)`v@;#h#;<pK&LCq*a
z(NC@Cwx=`r%_*E5keqiuYAI;%+WTEtqe-m@DlOczx@*?HVIdVPl&Cst{X53}TD(XF
zeMC>N?yHfT-RR3KrO(UpX5DCI^*1oAm5O21L9p0>7Ea<woQElP$<>vU{rRbie9iu1
zJ)2ATl?i+@Br6to(f4rvbC&k7Ih*cM&(Kw-2q*66SF0MZrmmkkGPyHTFnD@o691)K
z$K|RZ7>%Bhqb1h8PtuvyRDWr^UuOui?6SgCdxCQTZye0c?e!JqB9OEOZt&9(q}pPQ
z%=lGOxwW7E3JE8Z%msX7N|`{YOE%Fc#K~33N3FNWJ5+5xn?VBxVUEI2n>CS(o=Q^z
zP@6csPDgJXfpVQtf9#InJu?)J`%8^GU-Rk0*Mo@T!tsJH)$xF4V|aDz<28h<EDyJ{
zV@jlRPAceS!i#>f$r!wJ!EN{bRf&s{VGAcI*+?oEx<|cDY5f{Yuk%PJO)*W2>m?p@
zWcYM6tQoVwqEgWppWw!*BR)EhoZa0!mMM)F1mfKPDV3~Ck*K!1?#yuTBYs~HZQSYY
zU!auphf9cgt&E7c9QuN&G}@p~g(Fs(_GfKe$K@BCtOq$zf7V0VS4`64K0Dm}aHid?
z*j0^ZHTl^aC(q-s`Xz+!ZM5nmaK@(4u1vX12}_zPRHB<FPvT9((?-1m!_v7^<-eM;
zH)7q8PrF>y-Hg}z^&MsDYWN)*OnU;ZEK&i}c9mm-%WfR~2Q6wqaRh5yTjiu7e%}yp
zpAWE)o`Jp{wkAG$YM&Rbfe#<I?!5Ov7>jbqmQVVu#<VoAHVSvGf6DxoFjBiI93ETN
zZegrlB8;#ykmrRC;Ih4jw&ZID0vpUQat2{#raTYf;#}Q-xGVMYUQuL+hAj)sJ^EGp
zS>o?nG&TL2P`l1YVRDrI+3`<5(kR9damb9oHV$&p6j$vi8AJNseS&NA(Uk!h9bnC&
z`=G^J9VK8Be$6@r3ESymvKfMI^a3Y*56!E5b|P9fKV+gAdzN$A+(tyCa#G<HeeKU*
zF1^VHD-uIHEYlO%d>I1iIx-oAd>T2imef2S)_Dq}EvbuJm~s&6tZ0l!3pG@>O^Eh|
zL-zf{QRSUxX{DGY_PTw(fTTN`R8*{Rvf!!L726M371an)V|qvLFN<|vm&lO|Qzpm^
zw&8Qh?AY#_G2dHZ&qjTSmnh_;XG%(rr=yJgw@W2%_?-56LM7ANte)kc_xf;le&sYl
zrMQGJQcj<P3vlmiwM;PVUsHkGd)$6nu**-x-=EwOQA{KIo4dPYt(frbhkNk{yItix
zV`?E<rOAoFJMTfs{)j!O+^iyz6M=e`r{I`B$p-r^qPDs%@R2!gkA06)*)q<jnK8N~
zT(3UlQ~h|cGD=n&gBCjZ`jfNJ)KwA@@+^1;-sao<3oWwG7oUun+v-#0s&~7@k&8r#
z5ZxD+&srLKUpb^$(be#&)p$A-JL^?3{`$%|WetO)y<Fa9j)u_S$}mA^nv<klh~bwq
zMpxMqV!})>zIw0kV;)WptrDgE6zsYW)&`va)`t2u*iSGD%tSK~^C`CLuvf5e+StAZ
zlxIf1zzkokSH*`(<;%z|keuW6e$x^C$Cem;dwi)7iX|nu)adB@PF)M=dOBna<^Ph9
zc}<@H=ZA};W13S<E16`Z>Q-+t-5@XktE@#~!GmTx->8mNcN5HF6Kw%M3SqAIgbh4v
zD)-%qU?^iP-*A=NpT4L*1%}X9aSg9ka#}se%{az|g!cEveomV*1K^9DeQw6;SqlTT
zSb->TaNV1m)77`UYVKPOnX;Bv%qAm*tY5p}m2GuVlyl@#aDm4O>&9_^LcGrXEF?kQ
z-_I<8Mg{3hi57-cAS#4XOQ9<S_CJthLQKcpAALY6{;B)X6)*SV7mEOPc{Hk+#n~FS
z4@P#c`3nU?9X#HX2~+maVeCIC2+t<HJ7jI?76k1$bCyJ+C35YScp8fj*)Jx+QaA@D
z+x$BmD$Ivi;pT|gHKBrlqihqHaRNS)jKT?9#^b3CX2JSrOM;zO#L|k~HnTc(dp0t!
zBy<cl0hux-VubsDYXO+q#j|w(2Of-4U&xeuUKdCaKejWVNu1j%47uZ0_~1bl^xx(p
zF5L~{vz0328dJ|DNz@Vvis1CFcTo6GCL};GlguP63|;A>>5*%sE7riv^t&)~2$Iu*
zk9552H@IB<sbI%WylFxB$%k$Ibz73z%z}Bolele_{a+r`o07uCSyS<{oTq|9DHz#p
zvspE>zo<JE!6pfA7!uGhmxT!xF~}bT>F#WZN%1Zym=_91EhuxJCE}9bmSsF18-34!
zHrN`z{3;VdOZ~3o{~<smJ6-XXD~rr#{{!HfGKNci(;6T<sBtcj=o1mCRy^W^08L?I
zwo!Pq{L&x69hYo$n%I^<Q#+{NIIUSbfOe|_9pPlLaGuA2f~rse%IElh?;4y>BjJ#7
zgKM|cFkk9hC2>MSqnKq<e)<&-1v4~>+yk%7blawimD+E(JCerbu=nN`Ul!<PwgD_j
zJV~36Ql2e`Lgu4qcPiy{JQqh`!ogIP4x=%!adzr=Hp(sP$c@#QZUX}+L^?drkuFP>
zU_=R~LMu&Qppg$=*O@Y3Lc-D7VaUj7MpvrQ4Ml4+<?275Rhwb#nyA@}zBB`>-D1ew
zQC8&2(5ewj|0R^QlY?g~Kz)$7+Mq*|DIvB1V9;dNn>mFUeBDszjF{_if-Me~pe4!w
zwhReDpchdal12~f2&7r4K~ef^4oGba#TbOtDybA2KvFtzC^d}5$gw&URGvvLccJ~)
z*U*z^ZXA9*FJ8pKOEZhk>ZEoYva?}l+hb((;gFhg*uxMJ?z6+e*v!TpF~6J7#`1Aj
zmeC-rV2+fzEsj>13nXxq>}_}Ot2D1SY6JLUbFpNmQeIVs)<mMc2D?0e;sG^+Vah;6
z_`!EmoXPA2B1+}BH%5i4kp=bW^3T`7kFEr7XpV0Lftr1JuHhZ|S4JlIJ$D&91Zm8I
zE12%y*C|{xrqk?}JA8DMwOM-ToJbYwYKN+`l3=uO#qtr~M)|Sk<L#mjdx#D}nAOHY
zT(VQFfG-iAnoKLayGgi}9SsADM{ul3F^nZR*rn6cd+GxILJ7P(;KWsjp=!K==#@;@
zJST%9QaYQWFK#zj9$t-5$_>f2Rkz%!i-%&jBZvrs%p_t%LS*Y!>t!A`i?4U&s)wV=
zQNSG-L@h6F5~>tK>PQo+q6lGJX%1q%3uHAd?>BoB>-iAzrq@84ojbY0RSl`>cmE)!
z!g*j8O)X+-V2Y9TmlWJzsG)Chx2YGMef&OHI}!O0nSHj<-n$2Z<^RBt94;Ju>K{2C
zarfWvcHXHATMErwnw5836)19Y9aF(zBtYAkLstVpbX&|&+HoLBAo(YKz(K&@%`*TM
z&wGh2)wu2nVLx-H%mkFY^fphJ`JE;w%xQuvy=F+UU`{WZ?xz=^q6znC2`;Lew5Khl
zbhTB~5M383_Kx=;o-VTI{S8F<R}}+xf86^_H~urF1_xZ@Ki)`TmgNlte(}wjsCOwQ
zWVVw@xNk?zY8|Hji5ut>;Ia{YG+QxA{<Jm~tbWm-D#&t{2V^S}rPU$Qn9<X}t?B=g
zw)*N#WL{oAR2g^R8Of)kv3~p_!Kg-ezgCB>NNqDiw^6Tnc=eqD3`8^weD&2CZo|4*
z2J9##o9Y#%A1*IUZ>%-mPQ;yNjp0@*+*cn?4>O`92`EgN*dMyRJUI|-QCk0ETQyF+
zras_gHnk>Gp{kK{L+Wz{H519piYR<Cg#8}&6;bIT)j2XmfG3B-IFWO~=T9ZyE<JWb
zxy4`D_v1Sea$u{CRbs5MCbt?O13ZOD;r+}OzRso>fr2d0Z5KTf;lGFnn}mJRTv}oS
zuoXzd-cxu*0jG@KScY&1oS54*NCVab5?*~j8Pipb`M$YM0Fma9i-LAWZaj?MYQTHM
zFoz)^Y#J4z!c!-LvaJe@PF9MM`=ekNHC|_z^K2%2TwJXKsD-;BTx@bxJQl_?7de*w
z9f#b23cMx%I&1k`&s&=%q@O)k<3(SMOF|_QypgOOQkMAmsD;Q7cBcxIBaiS_GubP|
z)a*>JTm=T;mCNYn8rrSqX$(0clZ`xwsb#{V_nRduoln~FH2CVGy$ZCC%{8j$U$7C>
zITfR+(CRtQ`_yuN7*Zf09)n9;5p5|1HyA)qrM2IA3jD_+veh!!oo^<5$OKI|L#<{K
ztj=Dmqt-h88Ef=uhu)pZmbBHyrt`HnN0ph}ATM)vHj=R^8yP#0i+V9@108?P`*tMx
z8h&$sO^N2;kBcGRKdeALva?>T_gX@s$+v|b#mxFyaut8_bpex{aDPVkt!Hx#qnoOo
zg=DB-Mal$zkJyrDcB`}OPe&C-Kx7P=AS3<6x0m8Xxq$DDEwfp~6sJzCkYMHT?{HgZ
zk>;L<@*v;%fw)YPcCLw;#g3KHUDx8&XY$vr>$lY7&p&Mr=7aHMW|#xmpP@Q==1H^*
zm3!Q-bfN*<;!*||Fgc|T*cP~sa1NW|Z5Ko4VMy9oZEk;4dGc<Au|zr8@OY*7xpc<u
zMkw_hDk2-K;2mOBYt-(77}%dZ%$+u30ry~p_&5O&;JRHA8L0cTjf5~c6iwP`vVW+Q
z{-|5~6R;P*Udk@7jZB)vca!2LsZfTz<!H@9$I?lBir;a2A2!Dw@)O}vG7SV0nP~4|
zVptt=KE@FKHl5`a*n8J4UjJ}OZ5%2^I+4`V%lb4Z@WNfBi*O=-mx^P7`%J;^y=1q2
zG3ab_zP4}wPpnP(@9BnQ=>|{2b48jgGmY$BUxQuP#9&@F3NbY~hmdS(uj*6E=d9KH
z$IQN0G08h={?Z^WNGFpCp<7j^jyZVFg+%SGU`tuWa#IyXx@YK}7JJRJ8n<y`%j*0u
zk_3Mjbs{4ElK-CiJ#bBM=U2+7v8<0khFIa0-9vW@YC>T!?Sxb_M9456O-jjV70%O{
zm9r2Ak(8z0XFVUO7{Spzu?9+C>Z$u6g@|3IH-{Drb$j(F^b-|(BlW`;>PXs=l)Oab
zwYYzrEl_8Wt@rbl*c5w*)_tQ{uYMsY;#{;=)u3?fwv{_9@&RG-;o_5vA^38nT4l{{
zs1PoI0)+VACFzPo;iM;JVmjvkACF^S&j0`Vdu{pqbhBy|OaF3npQ&VZrC0J!{}dyX
ziYLnzv&q)kw*N-LoV%rx!=)Dkqw8T@uAxGM=6-cG8~QpFhWQ(by?qK^sd~fNw4hi5
zLjg}WR5z4|9ROMGV`qO7{(+`xd0%^VMF+gwGCI27s*nn9W0z*;D*;%;>f=$rPLr`Q
zc&-uk2|xx!xp_UsTxa-T{6k0E#6C6x)Fa3D5v4Tue>*1p@3>u@`T?AeH+ZyUd^z7E
zJsq>*-STqpJo*o1B2}SqbYmCqT@%38k)o85TLawRkJg7r>fp&sYHL}t#Zfrl{{E-;
z17K*PJ}Vij65gVKNz-kjmzARpP@d22o`JKU|F`4Fm*d^FtauM_Ub@_~=I6_K!`uTY
zJ0V^0zX2^<R}_-Kuff=F<-srWzm0(7^~(sz>gih7ff4xDG_x58MnLlSZ)RFFcX+@K
zZLl&aPB4I%#&12rP7CV)?YQ^l*xpugKmeT2RTEs40mqf)pB;0!G8kXDBi+CEvDqp@
z-9NW#T7CgA=6{R;j~f^P2g))=PAxD3+&YKnAHfJ@Phs{YrUSJHkT0|j!ko5tcI}`@
zKvwfzi^szoJiK6_78q=S3gPgtt>t{l!!TSl8U5AX*$D$k{dSPdt=RP4j*E*c0|2r;
z99l00=Id@i;rZ`3C+|XW>1h_KE$1hS)Am0CzahxqCMyJ$Y<xhef@GbVgNksW?yFT|
zec;@ib2vc3RI)x9xVva;(dW;RPTq<$T5onDS0&<!lq(U9rU1S#H^x;jZ{TOK-C96Z
z)Map%=VJREl|GrzYLUN-h3^x3*!mpFE-97wKY)&?|A3ByCe_m3{{?hl{7<06?*9#R
zp#4vvWAFJA)NXhII?iW96sm27xoXS<mHQ25Biw)v%-lZ;T=9iwd3t3=jlK=`Qe)aT
z6*sSHT%*KhF8Aqc#tn19^-c5Ml$nnT_!IGkm+o`sx}Im@EtH^s{_yEq5kvd_n1ixJ
zBdqf+Luk!5GOo9MP)%PFb@qJo!$@lHJq$uO>))@#zW3V$8J{L4ZZ-0{n`KWiN%=D&
zjW@}M5)U=$d5~R3Jcn!rVXnz$ZdS?Z2z#~G=QsSDZ^9eKi_4W80FP&Pb*)`&w4AZ}
zLo5U{6GQ<<-dRS|lw9<LPIF;rLU4eyxh5<Rvhe;}#7=?4h_&tE1eEsS>~vu+H%*2J
zf#Sdw+4GoWYeWR9YKa!L&d~n?F}^a^n~swKTy?rQ@)L0H2K~{j4RwX*eNmu<aH51s
zPxc543*&LwW)$#%JfDFCdJETiwO_o>46c`Z`h2rUQN)50BdOfy2h+5Q!0soFXVlec
zw7im>2Lu2t!}JwV)CW)kD9=Eh&-D(eaYS1zvsjSSNWtd)BZu`1xbaq>*CI1ocTVbq
z5hoN$q)uxHnlNj3HDzw-W)F~5_#`M*&-xTRTyj0(&IbbPd|omQ%nRubo9vb}KRUDD
z7DL`jaaNFYwGhX4D{|fvE#hCGG_3DSuPJYl*)LpcgW{5`KA5Yoy*EGtQQhPJ#ob$m
zRrS4#+7bfNNV8}pl@wTXcXxxNbccj=H%O;6sC0L?fP~Tw(jg%w@ecg`_t|mI-q(A+
z9zLk+V!9Y}&B2^wJkR~y&lNqx=4f;<+(BFz9yc3U=k!H3*eg%{AW^hvx6mwm<Tiq`
zc%r)n&3lH8MB@`T39%2!$G>t~q&H^rg>w_^{b=IX(TKSBs@(sseV)oCzF1>k3ax&)
z5|vxpF9++m_3I31iGT$iX@Y`Fi9UAhj+gPkNdn!6GxO35C&_9pmyKV+vKEI&)TXno
zGSqq<Uiju9&cmneBchelani7U_4A8`z#?`U(s}8ddiIz%?UeJb<+><7ZWA56F2y+W
ze$;Rb261+P*|5liFiSxd2wZv=Ha41BoodaNQn@%)piKJV!ceQ8iUz)B3b0seR<7%4
z8;_2G*Am?H*dW-KKrcP{9i<N)dn57%D;r^{M2B$Z_*bi=>IkGIpdaEY`p5qF&NT|V
zGfDW0k1x_UQhmdPf?PN0bP%yCz$)ZpcKUbXqCX`9S&fAY?5E$~o(zx$_w|D8L01ke
zwyus^xgMeO)`)*uSy>5$-6HM@BLXUcAw2&5?U~{Wg-n8_X4jtX;E=xEM0(XYZqOGB
z;2jub0yu`fzxQXv$%=gE>us&!RT=>%S+sb4`qPNw%MkK90p7)au*|hnB#a!**HCF)
zx6TUhm$me7w(<i#Z}&K?JfeFt1n)6z^I>tz;ELD2S2SR<HDbt24KQF|e*2a-UxU4e
z%lK;V{2l=4-AQhhbI8UMLIAmM72y-kXfSzxceX!^XZunMfnNUSV6*bn6tfCc&M%_l
z;ZiWsfr!4G<lIp*<ol;iJUqq$#I;w4pV<ghXfze3j$Cw;(MlZB8VJ5#9t}J<_flg@
zeKTmbexoG!;tPZC&99nII`k6S@_BCl-|ezmUPeqw?hNb<eN8FZlk+^iZ?pL97ZK}t
z(9tH~a$^$|bSP2T0{JYaH2`0#75HTSka%SV@6bv;*3l0n?;K8tIZ97Xh2~&GxXrsy
ze<0~KA=G4s<WOkK-wLmg)sg5ueNyc!^W-l);d>Wc?z2&Ke6D?v&4u1nV;XZp*xXD`
zsKn|*v@gLGz^?^G?f3)p;!Q5(P77+)OP5{LvxwF#>?fgJePEJ~S<RpV9Zuoc32BQI
zh87`6?1db21=`6GF-O~hUq;j{9_%jO9;|h4V)Y1ItWz}dYXz-#<c&X<5`X4d_a(4r
zu(&*~iKcI2*!KFbR+EqlxXtS$;fOxiS=8FCz%-5%|GvpuyA*@LMHqW8&b#zrA*UkQ
z=l^ZgACQ6+KwdM^9F43d_fdf4?&df4;p|-=Konu$8{%Ujuz=(Nbt&X6kS&3>abeb>
z7!Wz=W6hbz8EQ)&hzd&fM-hUf(GHf|ARr>tdwsSo-Vun1fuO6;atE5Mbswl^j(-Hb
z(QEBj40v%RLE5HjBQm@7;TJ9PlnCoU>~59GmC{Dd$2N~hHoJV~OgBl*31e2y^-pD&
znc_f4qSDUCCB&;=B=i&x2UTtM$7h7?BD5&|lh+yvL+<f5+MRafe~S=#r_n-<M4)by
z0V?_CwfoBReQ<rwrUO=zfo4f=jC=8qkjDG}1!<JCfbQkohr=mOZjwiGgq6092`3jr
zU=zGvbeK9`2bZ2Q5v!Ye^7IuB2pa?N+way5E}lvhA?QymXZzvn>Q;KzPAqDtpPlpZ
z@jNCrn97xC=`kd<iffalLsF+$Ux=r3fkO+$I-0?BxFvSP6JV@K`P0t#N3j@#Q&qf9
zaT)#XL)cMpUNRX};w_iL($$IcLXpp8d!Iao!}T5#^X1Z>w&=YqM_P$AZgR>M$-U(g
z!qef*7T8(NVQTf1&<PF6x)S%p4b<fbRsF*`e|RGx1Fwd(v@<@M1A%9;eBqL>3rZ!g
z#K&moT?LSr$aC`S&uH*mOcaCca5{x2qw7hR5tep9ac=N98thAi20IEc)!@}y^X1DI
z51T(^NYETm`AO#&n^tKSd|{NCq?zw$T?V_^lNa93oD}<EK8)$cTuqMuj4|4{$$6?(
zSxD`*)P$fRn@XInbIov4rHf>0bxD|EDoFT_Di64?b%Iuf;x=JmFCUhQlf*#iR+9&d
zi>kt+)zv$VPE59rkxtH_R^q33j%65rC3*r{5SD0^r9WXh-5Ny!IcXw(&)Ul2)zkaC
zKk-1>#BMvU);sWMzX9ExMpEEG3LXQ@K74Nn;>gFKHDJ!gSat-tGTU4c8ENE%iy3~d
z&CT;&NSQo@H{NX$D#X^^Dt|(QUaew9>9ynClPs(*9`b6nUd9nBVL9#4Nd%Pw+XpwW
zeQb`t>55zhZlUz1P>Z|W>&HCBUt}XANJ0IjvD!lNTVu;jsBoisX4<L=z(7pr?t2KN
zc`5I+Y#p*)Y$vke-U>Z!u$S?4%RYbGB<fpTKLmrotdk(#HyRpS<&~JB%@<j6x4)|g
z!o4G-E1+!>KsHLzE12R@WRfM}*hbrb?>rm(mWq?_E)%cY8EeXqE!MKXVBvTj;}`qE
zlv_2yZK6G*nnkzXi)<0^RhPStOJ?CV6DkV8w4*Zbj+rxy2*jc-CdQMDN3LewUPF{f
zBsCXl8aiYn(eN_g;_sU7#^^hwacgR+I*h=$ZM(~^&{CgnO2kAFMva==E=Em&RyrXY
z<m}~2V_M&Yw6S!4aemSwogy(tRE~yfdr=HOAX<~z*=%4pudxNJ!&KV2K&^E`Uzyq^
zP#+aihm5k+M7ngN$fOV!KuqPkBDHfNrbg-koI6gK<7M&VXz9#Bc5$Q@=b0|~4w}4y
zc5%ypL-EDs2F31JJ>sQED|AQPb)j4+OO35I{^C`Pa|+GEc+YL*<6mR%_nWc&Qs#@W
z`!%|MN!F|FBwnAd#hGHiB*6>Imn0tSUk32=5`)jD&W@`WhYMWpzsP6H0^oE&tXj{7
z1h>QxQ`i~JXa>V=V%!3>7cjIAE9sraGZ~1%{Q=}kT>!C-Xa3lA5M!e4viJR22B$4s
zOSFm7FX!3GfbcH#`sLYbvq+@O-J>Hr)ZtHl$giipC$N{-jySzZ5q?xe3!_<O@VA^L
z&T)welH$|2Z!GkNkCt1~LM>ReXUzHbK6o70W@oWRz|sK5F`)iHY<xPaJKgvogmJ!X
z-D0JZ>1O7Or3P58g9NQNK6C!U_c?;^mFNhnhU%(&IP7qt7MEuts|4>aqs^8Y71}?#
zw)N*RF$xqfxb>AJSu?`o;?w7-uW+Nl|LRKSM^$1$vz^EE-UsDDAnEjnE<}F&1e>)0
z(4aHDY8>N6Hst6knf@<pidPrx+gV%sX%&ZXOI}=;=u#puyhT3<w5Qz4fMEFGJF@I0
zF;MLB<Anm!{rN^|i5*6hfy+4&Tqq~wn&H&2jVUL*9SN5g=}aL0cq^7ZGzjHMlY3)4
zNAU5wVU1T79p?5b63fy@y-Au1ZF>hYy61%MznQC7Z|90ohU0!u>*$Qj2tS9x^-{=U
z-H}+(m~aimixL6YPJb!Hw4W^BuGW&G_prmo15BGge$q+?xe!}kh)d6aD*BJO7e3f1
zpi~@g6a$^JY;Cr@F75rS$W~{Xb7PfpmH3k3<;N#Zpb`xEqxjd6qn|=w0`qNZEzoA=
z<zR4$pijU}<5VPRJq^y@Qj(1(CjidWNe($0u!bR^CE>G|h~*ov$ib8FJ5wacmIiKU
zS`hMPtDL*VsOI{U%}3j~RvGmmQ01`xt&5!t|7vsB)ro9QWCS+phCRNg=7`?x7g;p~
zJ?R`G-_q4b`dJK@pWE<zqa(I0{xbQj_IBnf$oEP&UUs0Owi5N-JBfLmA#f3OP*K~9
zDa@QL^xN5)R{oGUyB%V|@R?s8g%Dv094$(Gdx5P~l_h|BGp6Hb#F(Cg-*lL&;_LK#
zPKFFmNAKB`wcdS#tI4hDWVB>AgUF5qs!$(tb>oRaok8!XRljtdOl-xQ#vQFfk=jRW
zqcG(W+c?BQor(!CipjwkHmK#blJPDc>BU3NbWaRexV!SUnv%_XpXxTW5HGIqm)mf3
zM1JHp65EVULzMJdz3~-l2@Y2pVeSi3;TT)*923~O4j|iswe+eWz%emv>58jMAE?L-
z`$gizg2pjT^hm!s)aN-TnLq?Kys;ViwInrT{nMG6!XWukt46Vw?AK76=P(y|Dsj^~
z@H!roG1r;nj7Zc_|8<WMM&X*;qp$-)pI#X3vy+l<6F-{7gur9%;mKrl%#J+oe32>C
zE>9S`C0ADp!Kz}s%I-I%pNMhUpxp1j0c~{~xd~kYtDlWNTZ$TIHJEVCS4RYEuMCSD
zi=||<>XKQ{O#;uDG{5*Io?OM6{<myZ`PZgXxl~--?|9h6hG+)R>Spou-dZ!n`1drk
znk-4=LLx(W^EGyNm<o_f3}eJUz%o#J<jS0k_|N(wGZw*P_y@kZI9?$GszDJD)9x!F
za7h*PZJ$HpzVCya%5JL_?$1=<&u~#&rm>lg7s}$lGHBKMUIlq<gi{A^jv@_^Yp$LF
zP+c2kN1e%##K=Bd4QhGb+T1HD%o+zU(h@^vfOvyrq<`GG|NTL({%@1^BcSl$P$Pe;
zmf38JFXxXSi-${<oUnlS)N~VQH$o-SH=LTkcA*4<3P_ldJd$^hrSSobG_#MM5jYuK
zov(6y{6(W(r1KntM}iS9J%(*&^W@|%FAMXQ!soob^4<p7mrzGWEGTB@HHR`!7E1Zk
zw^`688bfYnoI{THqAAP!Eav0QDn$@J08m2eOaxKK!6GN%)BEOx2YW7my$-oFKlT?h
z;MVK<jjl%t7(J+5t4;gAdLgkN@=y#CTpGh3rYaWMu$&zt=1H)Mj`M?x&^fcZ;5&2X
zoFzK4MkSsJf5wco=$e{uTtN>`$mUz$$XDrs>|4O70mJQK^?+QrU!pmwtXM7h4z4%{
zosn~^g-2yoT+~ou$}i)+;J(H*XO>vOg9Gev0eQGz1Y7}xGkY2QK_F!rCI6}Bn^utO
zV)|>8w>r~kPJaw9F>)ar@1q;4={tm>GDi0-lhI+FnFo}4PZu})L5R3_{eX2Xp`Y;h
zAJFxQ{|{UK)>WBZF+>SR(IYWDol=N7{+PtP8XicqKEB-;dbMl7N9BT2$lVUK@R2tW
z64Fouw+(JdQ06p-;ffba9EMiH@)U2jIuAr9j9(lKJAxu17y%X}qi_I^S-AWJtZFcb
zI!%t3Bbj4b&Xkh`1fmtCqu{*~x;#R75Jj&YN)wZaA*OFO{Y7axS<uZdE~_}~YSWin
zC{cHAWBoaSo`08v?OVk$guL{xCPYUrHKHa+=FN*4j8Pojma$KAU(qg~7iZe3<pV5t
z9n>6^h!iyd`oa&Z7E)n`=}7hZgp`B9TK?pQ{~A+8slRl0it>Fy&A*U3YYfsH(!#Ps
z>1iCh7m})03RN$;UJmqyo8&b;b!3>TF3-;Mcw{?*6=Oae-@wT{(+JM1+s>=4rP>vB
zePla|F=Qp3&UVb#w;XqwenKx%o*=Gn{!2mvTtmtOquBMP@~nIjX?8UeK3v`#ntFv<
z6D4O7HcqA}Ws9H!o@OAhAJirGgqpohusD>Yx0t^(|E3f@a_6jC*&km^knC?Nqv#o2
zYW!a{9rTT)BU^V9`u(ua{8ELs?v83V?94wf{laak!P{B<YC)gdS8X^R(1j9R>((ly
zzwxtNeg6*~mJ)@FNmxP{MkgC*p#)CL<Gr_>OawaEx{~F#n7=FW?<@xZf!G8@b`Sv1
zF`bb~srmSeVz^YoI*8RalpbJaBSYL0V4~H#d4najg1I58G3lMPdp~$QJHu|jxj(MI
z)89oXT%;cX5X2GfJU?V-pOPB)O(BqBf<r)MVF6uE<V;tu$O@5e@BbV>T~z|TP;6G(
zNkC~3wm)Z6c8xC!xSybdEG^bgu;ig)iBl0QRAe6G1uZUtA~oU^$hF3cqAAunb#)h8
zJyf-{!y;L4>462w-2gSE?6b}zs35;ts3(~VoA!-~)X;kKb+PYDc6Lur%(AXyW`n#B
zUYq418up$eie2L(`XPq6W)}|n^~egfuUA^!3Q%C+h?17>#QI|k6Yo_X&)xk#*(Fd#
zL?egpP8Q)eYs5DHeu($E4Y>|nvUMR6rtFtU&yfdJ8k;-}>5m)`mVelemrqd3vMx~T
zYq@y(RliLC{>x7^;p6R_$3~n_bVN-iSe*}q3dVo4^P6B0`2qz1DDRwt6U54(>eaAP
zoLDqiu*xUp_5{l!6*DqQ(j%DU!<y#SiGO$+Dks$ET;0Bz6P$!3r=vhm$FVNQ+GII_
z$pHy-%ZmNlbJ^**_X>6YJNlix@yA8luV2{O5F-Zf{&yWmL8Rr(4WlgBYmqO}eeavj
zfg}c~P~}1nAIX*SGe_>G2p)wjX;y~$+&5=M{jwrZi!ng!lSefR&++H!*ji|ddMdRR
zPSB(oN0IDS0t^NOpW^%qWD=|0p5Bqogt=1T_hp5rqlvYQ4g73z>oGb-os34`S((&>
z%3SWzx|k#duOL6-lgfQ1EZZSGk(%g$<<V<&fC)y%eg4hd!SA)7!xjdk8GVacrI!R~
z1o$+r3yoXd5@0@0XDdB_TRAeX%z#9`Y0kNej*vo(YgaiLzvnrSi8WH_+P;^E@#X6K
zM1S&{+wN%s_^R9-??jt&o7PGOGy2{NAPnY|pm%P-&vf1XC&(_`L9hn>k2(-OpWj43
zCEX+0Q>^K;%pzW_gdZi3+cnen(Ny9LzApb(Q||^=ts}aleN^wivzP+Sb0zP2FFh)a
z;3^Ex`ycJfcU+O3K<<&AKd@Fy2hW)_+%@weE9ZYFJGxG&s_zY-ltQ1=amS4~AWoDg
z!xcu<i0#wKj>l=ADTSyIR)A#-(dc3;non)MooXH1t(VL6=h2wq-#t+z8eVx#?hctq
zG5B2tP4=j{=W(L>T5A@}r>R0?>!#{GhW%Sr%Tm(QDRL<FN1aH>jbEPbY|4>STf&^e
z*%mxXHp-eq;td#Suzwl8gVqQ|=sYy@f!#aH0|$OA91d-F2?Xm1A_A53L6rMR?UFC~
zCeUs?6Z;cnfz_CES3=BBAs52`hsY&x(YID;wdZZM-2pqiVPRh-Dp&?~osR4Ap(|jB
zxK%fsPA)=2lpG9-3101x#uvUlIcj^FT4mPCTu2(73az*4`K5ivh_JKSj;qwA7xuzT
z8EXhdJ;MBPHvGz$7e<=Otwcc>$X~S~2Q^(1C+qPvcSVO>2?L<!G#F)IvB`Pjizf5b
z*M2s{#ZABTWU0QA%HE`hq9c~H@2+`(xKJ$)@!n{5m*(9SuoexL?Z?CSdU1ULVPzTH
z>Jkb9a*z2zMgXbWF7`8~HaTNNfGWO23)<iCg@k$@I|O|+QZc_30^=q`#`((>K}kLw
z1G;KvL<~-Gz)zEv0s(_|iY4-wNNzK8A_5<!sayi5V%RYM3O)pZTtQcXy{I!Hb2r~(
zPNl?vPEd<Xl&*|^$|}NA<<?yEmbi?pjr8#ymHTrpOi%&NF%%v8uD3Nn6M5V?G!|4m
ztspBq@+cz^)OKdr(-j(;M94awU9Kn>n>w=7JgogMmZJ;(4Th<L^%J@LVI3G;Wp3lF
zZNxFhSFmKJl&cvvu9bFCc~4SXS(XS_V+&RYT}<wi4+*&6<!S>Gf|?>#Lim@=2Wrg$
z9uCK-^H(oypp&XRx(Li{l23}#Go)~bai+3iUy`=C;GS6;O@8nz&k^=6OJIHYs4NX^
zA}^L!U!jAwMj~djaA(7KbZ6C8v+!!7<*NLfbjhN!1<YJX9i<D^A_xc>r0ya#g(EHH
zbVdwFhi+kEGPsyjcC{TmP$65lJX%7?`&cYD1ax*nUiY!CC06HeG2=C3NjQpsP^q*n
zx_<E$t7bdn>GFA@4Vmi92fNL$(F(5C8w7pI$jg@F(Tp2+aolZ2`F(03e@TSuf4i+X
z08Rr-csQ?!_9x<lbR=91D;6fEAu%Fizv;NJ^WiEAv2H*a%`CDgmD`D73I@V!cH>Bt
z`iOC31&6k>GRE7xJ8@K$vaH?sC0UR&q5Z5jjiEYr3pE2;3lwdWk;YCKrn$*nmNZRk
z_E5R=fzlOJ{0Le@-7lXtY~7-sm0XcM<<7vZN8EtganzfScQ<&y+#DrHgIjV}E`B-(
zuqU{`;t$I_$WwYVOMRT7<UYE>Ie3xi+`eFxK8mU@`b%2&I>1o(%he5+u+EsIUiC9e
zGy#$kN@PUsJ`>6iU_kU{1G<w0UJ$-F{H)$eaG=XBv34-m%l(kn=F0nCgszPIsYIQ%
zVdYr!-45#_{oM=1rSB!|P5$r~M+)SrT|A=T8N`s&od}uMfBToV_;r&d41M%p97f<3
z`ZW=a=Gc%f*LD&p>`MKS5WCr4K}KNcS4x+TCa5Kt8Nj=i+amr?`U}cxVbpxX_q(s)
z7pHC}mz3E6^75@^bE{by`6BV>kRDWItt}2bSQXOu`duc`1Yv8~pEpm;j8)qy>Cyz+
zsgb8pLMEft=F6G|9}yQJEof%(XhbFyX>cpC@NILI4^=DPtG=*uk_l+Hc+__EF1%W5
z5y#tc<M%7egDL!9#I>zE!!#@Gc21s6=i>3!bPtb=+6q{z4d<;V%oY;)K1071-(6ux
ziKt~gFg)R!tqZJqw>cOus->(&w6JnM(K*M@#VciV_-g4(1J9hEAp8B9nD6%P>-aS)
z>O-4;#5?&Dr7OY}RlNA`SX&+^Cz%hQ6@iFji+aERkXBI)FI4TM0CFsF8{VS$Q7L^P
zk@Cl(FLlqAXL*#+)3b>D-Pgb3Xv~oFx!v?U24Rj!`MhF2T5R)c_u6Ue9VdPI%WeGZ
zKI<<FjTN(+Q==g?kXz_g+gd?xPx-y)g_0Ir`$u5>-3X(MQ3k&%!utfecn!vH$|5-d
z!QciI;NgrH`jBFGtKgZ$@KlA?a48O}gk=xm?xR8q54Fm@?^ZO|P6!{i*ob|eUqq@$
zemNbw6eyYZNB$Ii5p1BKk+Y6crMNdR2!IX7TIO>n;MI5&=ItaXp^_tFm+PI@kbqlq
z#kQF6K#yD!_ojaj4Hxm16WCAV&E+vX$~Ba%FtLFZ0Snt)4R|mT(R&Ah6ry)9J;+BG
z=rQ!+jD3B<>oGD{bw?qc$Mm<(#Qi?Ls!(6Y+uT}`|NOf3@wLI+{a5JY_f2y)8vqvU
z1oLG^mH59Ac>p)Wq(1@BK|~N}CyX-#^GB|=(82MeapO9_oB>_xD;SN`%X!~BW01+8
zd6ifX_n%)kfY*aB7ksbZg72rGCf))mgA|kDZ%;r=JaQ4NjuJn>Aa;f19w8OEOy%F;
zlzA|z9#5Id`uWXMpbK$93%k1m(RN<n@9KRpmfQ}uc^_+!iwq7{9LbfdHy_I3TpMbM
zm6|EaEFOMGQh#7kKkIlKu_xrP`lWY;P62o&Hallle9Ws10IR`*$i``LBOP@W;S~LF
z_J2@qSg~3GqXiH?Ed58r#eXk=SQol|yk7sPHSqHPQElu>{0|0<herd(1D}SX5^<#r
zxMcqlOGGLIg$FQP?1uaYrN{qI<3%0851`U`cOV1(kA{o?qWrl3tNhrm@(ft_Q-2(@
z#$S^LD5?6Z^pJu6PX>(tv*P1RUkPxBbeL#1|3{_AyGNzRe=u<fKAJcLV}D@dAeMdr
zbNZhT_Pg=-e;g*w|C93LUrv+sAl}OV7P@#V*91KI;L%cLyTGZ}<n&ZL5>FgdTdnQw
zMSvt}M7^7vTchiK@|<@OEr->2KhVOj$_f-BYqh`UMkf=9l1pRD6%9pqaC4JTNx1zb
z8B6-O=LRB=fOp5s;oGNII`uY|2a*_19{~%DM_40a_Wcd&bKfkaq_dy>aR{#Q43-}h
zpND^Ime=yQ;u6V1q>!Cw@Ao<u^z~o+Iz#YH9%bpXhS(3-Yq>8V-|5Ked3X<3%KaWS
zBjzEXH@saUDd2i-ycBC!Vp8j;%jJ-2Bcrwv5M}77E4MiaZ`8rzGn;HwCCs|4<8KaS
zKKmVkA8fmnes%MuBFgsMAWj8(wAAx2?S^BXScy&nW=Opqpfo-VFqF3_W*g47_TeqK
zROq5`fL!Cu`uv!&B+utWtdd60ZBmWHxzI-?#_yRo`8;<YN&gMa7}EQ{LNioGA%J|-
zv|s5P{>6_(Jx87Ak*{-N>~Lfes5WHs5vp~S;?ou!{!(*eyy;8?p8<zS?6O{RY$U$<
zU+#{>zwVC7W6fqYdgWXPBUEaV;Y6mgH1yqTF^Qb@;ll+jT)Y@Gugl1lL@R39&L&yO
zbf`c%1mE`#&A;ob<IVwhpdAi9>P&f-G?b07@BQTj6)IY~6(5xG+-e%W4(!FtCSA2*
zaGUWyz7O=hzvcc1)UXrtYRbtWM<wP``Y!nXN~yNRd0U~@?XjQ_WTj3H8&>j^azz>)
z)<kMKb;Lokpwc+l2x}57lUYClkO0-FGGG^2T<8F__?>1w^Z0NgKeW$!T8kc{bn-zc
zzquX8{qzRSh9R*lKc%8-|5hAl<P=*3VV;tHS5%Mgwwro()Zj(>5wQTy+?1pb<^kV3
z81HQ+tQi2|WNE)6Ez8Ig-~GqGVas~6eyIE1?XoLDvtpv$>FH#&CK9hRdT_N_7jkh|
z)m}fKB8{N7F~VEYBW3~-c&`|xXHpda7cy-^O9?tv<lBW)atUv5+b;=+S|zQ@lO<Qj
zxip^u{RUTTC-!9c#g8xR6Os6{*IzAh?ztfvF%A;d$HoZU4IjClE`+NFStQW1+He1;
zgVRwjrz`KP%UX670}D;=U5Veqq9<2<vj1=!e@y?K+n`-y`G_I+^IfWsq)v-hIPh&S
ztnt{EX11NYJRLt)2IK}-5O82Hq+?v-pnSVAlij%b`7%%69JcxP;QWl==;kPS7{J-g
zJG}W;4_zWqp6Rma&~H*ukeFQ>^sn>Dk7wsx;_`(lliHFS{i4zTo3|7Km4;Ru&TKxD
zSRx?cdTM=ffP1Jjv3UM9=}V*Iv49F@W4rJCi`%#@FGu-fUsF(W+u;+<;CA;bm9w5_
zx<a=31eG_2STtUbyUH$;?1T7q8B5a2n)CK}w?|`%m3BT+`EqkKP!EvX*OwxF6qqZ4
z=wgrwUrw~=k?aT3UtiRSX6SIpe{s<Vl@;ZEv@5IIBWZBDy1FOEpib|(VXq$y+^<LE
z=Mp$wDIM2)2|y_+A3wi1i7r3rn2rhZoV|cM6VrEaU;*+3TEFOpAe;0_kY|k+8U(Dz
z1lXk$^SNUJ*UR%!ndDc`yu7@CQV1|=#F*2BHc2P^j6%(>`ys(7_z`ZPVX5%eNLt?=
zY9^4RVFLjJ)H_i<1?-X*2Pgf@$nnk({bf9yQI-{#>rsSt-*q?W%hu9s-sGRU%c0E8
z3t<1+iWL-FC=m*tUinPnt^CSsI`*P?2BDf!LLdLBNuPg@7GD7wgSb|k9P(0tG^C-s
z!r5z9jfpJ3BtWFWc)g!dYr`sbo!h5=_9#~HK}58I)m;iD-Jv30N|E;s+5HWqt!Sjz
zr@DHUbr`LQ?QNxd#WI806j};53TCyrU~)58j#H4U-0D19YU5kDTQ67f7AtjQoQYmn
z2xg-v+_Xn?F1&Y8znG&f{?wi4rxdgj0v>P9M+M>R5}JAh-g9FlttteVml`JT-{{tU
zQRkPKV0S(19C|rZ+5Z*J3}qAdkml8!=*}c-mampbL?3>@AE(Z^Ip97Syr+ke`pClp
z{BF5lR@_12+~u;@aWIS8IqKW^6xeC}qtV!A3W_4~XXuMSR)!BM?S;RA`UsKL(i*;`
zv07&%rhS&9v(JlcHZ&Y!dHdKN=dTZB0{B3xxXO-q7~Ccr5MwxC$pk<uc7Fc%&Pp{Q
za3MtPVl{sTXX22`{<Les&5(Pjfk8Xyb@UsefM>FStVV-RTuO9lC9c`s9J<40H7k8u
z$#z4!betDIm?3G^6FW;b<{9-NuP;Ay5y;+y#@i*1(1udm%gHJKv%Y$GhDcyzh=Pbf
zGkX^x&-f4cu@!#uD24^yKX5eAY?eCDL)`cQp%}6;5F1!VpSrlXxVo`HHC*I-pBL+A
z+!yieB}%=|_$xYq8btyxOhi%aU;%^o%{iCHX~7d}&?OGJJ)2RNv+~OzFwiK+(Zro?
zqtST%Wk|gKG9<<$>%GH|_J!7BjCRT~(nlAE4cV6A=4}nsUfC@O8gX{CvntT<DI4s2
ze~sups1s1e!Vv#;(EsZUCdlwU>YBND-Ecm<KZ`E3D=0|-Wr{~Vh&V($LBxbULbE$q
z64!kB`mri8J<5FB-?TQ2?Mq{I{`qf$9(qy9_@O)bH71=nE}xX2W*_Q6T4r4@`22Be
zSaOW?*WMbp=4=G$HJ>1!ULM2}!&4rT;$M56B>MQuoYzQ(FV@0st>NX@&ZY;HQ8SHZ
z$uwh~9eL_4^j(o>Jyu-1Uk)H{?#_~M4}zAGhfdbL&C0c2WQi|W-or79y~28gUe0Z&
z33{F({RlhO$7;v#bNVR~EOPDW=Ob&w=RKaah~4Jt_9LAlN^gLmlwk2QcjkNp>-2up
zV|`o<C!5m(f!xVuyjh@x;+s~H_;P;BwNymN9o07WArG12hdw#%6s(<@Ji?H7(eOl9
z%eZST%CDfi2rxyc0W1XT(@j)24OVXt*7pv1O9aMYIAoGKKg9P${r+2+T4}dwGlAFS
zGaPkSQw-@lJ^v|-V>Lrqc)Bfa(aB}fX1Uf|_|@WIHR`@h*H|oe@Y?TKznu!TPr73E
zcj%{#6y|yoo&booCV}v)sdiHau(qeMl(}GPb>MT|!vPUz8ox+j<yb%c`E{M~A!o?1
zj9~eL^t*N>c1O^*rn@=-QduYZaDSKYXnKEp-Oa!8Xt;W8=tUz>G(m&!%~jbV4Vbnn
zKwcV2cg-+pmOn~o2>%cQkR<G57w&;Ux1YpRk-T_R6apHN;n~(`fBm!pxF%d)`%F3r
z3gQF9KUXbJ^T*gM*qD$SKJxW^VkNDL0Fn>o#tJRO2lO(>7y$&lW8O!}hu|cl;JBTK
zP>S2E;}-1l!!=CbP<0+cAMce+A4OPF$HR}lsm<fLZssQs1IzFH)E(d3cXYg<sgjgu
zzc4U9Zo3R2sWOD|!iR^!;#G(5Gr+{bMbS`G!Z~QOK4`ln$`6-rKhA7AsK#fKy2om2
zIpT{wc>G#)j`2EfbsqC7-Jj_%a2LGMRk-NSD*oo+7NVFp^<{lE;v<`Rca#8s)!lb(
z0803GMu+s8kng@%Rzv0M<}}psh18as&I+%=%(=Ga-4WF0ktMzUbE$AnXw{rUowLsF
zNM4s4mqQv2F^n*t=)AE|D4%N}6YRSV4jD&R<@wCji$3Q&80FV>R~e0$ay-Ym(^7zS
zLLgP&bxGau@soMUCwZXT-38i^;W@OnbPj*7j%5ie3lZL>ccg+{eQ`m#d5ex7YV4U?
zh{*QHTg0mlF)O=J+2A~Jcsd%idh+)#X(rIGTa|kz(%mKsyUDH6mf;MQYk0QiA>I0g
z)>iyh;BvYCWYFP`5w5@+U1iOQjh7*cb-=85r2oF^VeJyHkZijGQ_PJL1QpNKYZ~HY
z0&T<umD;tGVIt`NJcvWy=%qp>8NTGd>tZrQ_f(SdpXqE@sreiWWDN@XO#yhOaBaE`
zLEEb^5}uY^?(j!^o<T3IHHqqEX(_N4SUk6g*W{JMTI*sbh<+Zn2m)(nbU<%f@hh|D
z-@S^0rd@j5%3)j%1joB~D)D>`>Emz9PFo~BVs-X;lyWsjy<yJYevl<2>w%@j=sP-`
ztrA6`UiW>E!1Ty|hx%l4J0qA46NHTvv>y~I7f4~jIE-ZTL%_WeFNFZp=o^}9urxQ+
zc0TCQF!FUI*T~j38l-v%T(>J@fBkY;vovz)ic+ivHjsQ0+YAq30wBl_f!dqC_?_(x
z>-cM!<Ce$udHdZKB;R^+D4JIBX@|I~&ik?Y!x-t!3lg#tcZJ9?D--$S58r8XjM0};
zBu)ZFh;*YR85t!mvpd2JUT+zT?QannO>|3<OatVD9QqZdrf98&{h93scQC9vO-{F(
zrBFTFJ43SSPZet|Mz6QT#EjCGFuxa&;i_EkfAm$di6ddaWeVcRmy{a)EMPUnc@Z}t
zi$Ufabzlg?JHMuuT%JAU;3tL2%$zM+e^Pe(p+wO4EWMR!y|p2cgy^{vt8XuPbu_z_
zo#4+qt1@e#u#h)UTcXeWx?Bx+P{u>_sn;qG@gm_+4+V{8LCVA>TJe^yw<lJFuRjhN
zEGbno;VQXaM>sJggnA@@bpLwBR*cT$@O$oMxSG4aPUmOZ&*LqocZmfsZo8z;f?%@E
zdhf9}$J0i&B~eTC!FBM)W(3`tkFDLL|D>@s(b*xYj^%JDtVFvk{2Kk8vpEA-!iBS*
z!whk`%${}lsb*M)JfTzGL4JR8vR{NgtzzCw|Hb^~cm8nk`3#Xi37`kOt_V=hptV2t
z*zM5w-0VRjVzU{>!^S2#*6beBv#uNt`utR+g_HVT457*U(c#-P4yCer9j-rP7(VX^
z1xF<QE|gE=$8|sX7R*nc+5sxzDE$ct3M#9syFn>jAIDav;ZgXN_>lF<?X~k<MnFxJ
z=_rw8>fovv*aBDi+<CIXe_UyHl|A47lUgj2o^p<QabYMVdU_N$KYCq4okO{I;DKt;
ziaKVilcyLsFJVlER|^||-edG2hHpx1A9nQ<?vCz&-J8@7OAG68%dfO|*ajK&EaA18
zuED23JS<nFjg9!QIo}Y9*HqIWxv>uXkF=Nf!t#3qWClswIyzAj6BvOo&TwlYk%2z)
zL<GAgzgqjkUaa>9E+@nVy7h0Qh^AEJEYxZTkiX7(!<;yh0coLUx7bRyZIqgOLOfsB
zZRoV%_NIo^pVtj5HkkiJYZFRTH13Br_{W6vz>UoOd-*gr;~avQFlfyVF=^4xBRh;?
z_}b~$6vpLAEJ?RXi+HHl#~d2w)jMp$-~`GE(nN3aU&Ln}3Y@)!<qX+?jW6NRsUH~U
zEQ?$8IT_I0XaZMqkZNE&Md($7!4gYnUQ#^I&7ZN(X;Dds%vM{cUQaUyUa3XA#s2K)
z8fg1#l=17ME4AWr%uJ4sLR6>K>6opkkzp^*U&k{iGwWz^!=JkB#oTgNn>^U~=DXEp
zTRbZX<9iS9O~-DocT7q!K6VAQ^tBhX;dV!&#rr0S?g{N>e%|o3LHGM-VLn<khqY<j
z5vq0wjjg^6AAB@}W|S|4pkQZvBb30?TpMbOdfat~eXeXB2!<_%tlf~d8Ghnz%TgH#
z6PI{CInx8ty&&oQWF~A1akNI?ZSJ-0+QxIW%0=0|UXRvIZLw=3-_qlmh~}eV*m!bs
z;9Br2H}ky3IJ*W;W<tVp<YeQQZaWda-Esjc#WaC1dAddfx|)S}0?{q8W`zOnEq3N-
zHCPHRj*?!{F0$*pKbMc4fe+R?gHq$;;|Jp?0^`LJ4dI;)Sav9q1c&r5d7p~Dc2-p@
zQG$^h91;Wi5z`=;h-`i@$`>!hY8?rXyi}qfP=%mqmYhd5T)eHA3(J`xxO2~%1n|?!
z`9JjrG$g5x8gUvMp7vz1Y);Z{Ew+G{7b*bUpIt<)f<UC<w+wt7t6VqntABF=oTGWH
z(5dRMX-$~>IKcWu!DFZ>2PWg?AFy_1V?Qs+Q41U$xt^7GTpuWIqLOWWhj59_L+f@~
z(Q%KQ7LF*%fT}SIKa$|V{K8maj9ewn9j&1I5}%aogG$nUl<h_xmSQRW0(tDSi_AEo
zr_%QC59A{!2<FuVxd+I!cb7;z2y8ac+Kbo+hZCJ!kZ=w;T$@L{;{ScBdBgj>OWQ%G
z9iDw16^4>j82U%8H<K^;weXqTJVL0q!xf@AV)(D{v+jk)2l5alnoycrOf<?A+wfFX
z>BgaNMj1oamW*scy>d|ZB!-U_k2fOZi&VpJ&&=mp$t3&=s<jj^a16WWsQm}ix!1e`
zdjz;{fwV;I#^Y;)-C_$_VDTs>%7o#}gcGkOxWP<+MU>oqCl|S=&N^UJP~<iOs;Ccm
zy%Ca`>}a|Ijy7m1(mRjeXoiqm7s*NRY+*|x|Iw0IBg-T){WHSl=hTzkMzHxal18kv
z#pPD(#K&+MSt0yS;QBk+^AqfyBTiNrL5TpwPo=_$3~EJ{%#O|YOiB?$S{J&&3h3_X
ziOiY`OP@+bnGlZu1lx>_f+ht#8j+ch9iRW91yWqf7eR^-6z^<fPMUom1e~_V7(E}Q
zx~H2%-CqJkrMU8u;0W~s0t1aqOsMwcYKJn3tmwexDHrgJ!ZVl(hCcODr;|l|;O3I$
z%`6fT<VvDHQ*fv%(NbtXL@G>vFV+HamBA4=n*ZTcn03~R>}8th;((pPeBJbQH~;y5
zMTi@CPFBP<$kv2s@5nCWm>BDqQ<KzE9YwtEHF9*ksP+Bb6YFZgH+}f9*Sf1!cS)|7
zQqkQ_aW`I4>VFXN@dN_%$xM<f7x^%`+=+mRU*m_Q?OeY%yBm?@GLHPvm+oJ8<n+a(
zSM*%ocQobjqqr2rDt`uI$nNh^#62NlUiPo_g^uB-jDm*_FRQlGrd&a`HRX6wRJ3Jc
zM{yZvWAKZJc4|ui_p5R&4F6AYtiHpjY|(6iQB=zb_jryglJ<1L7tH)O!`aWDr~I{z
zNQv)hCb8j^<+GRQJbq9wM83k<GO~;ng~og8a5t~w*k-=KyIJdCKyA<c!n#~UdxJgq
zS<Q!Pfo{1jr7{}sY{T902s`uxu0LgFa-s))(RmH)dTHE|=9w~BBvKD!YWc3RtjTv7
z;0{k3Z_;H_<}GDFdgMZ%_Psq#9sh<0hm#v-ZxL9kRa`!(Snw?rk68)bQtd$~t^c%c
zmwf)nb}lD;CGXbAC8t|z^hVlB)(^&iW3#*WlMweG#1!X5O|A8e9T0LOZ`pLaaEMb0
zW)plGYE?kn;H?_$508K|yT8Uk5q}~ZO~fIVjAggY0$SqazGn)g%H&KMdfil6+y}NI
z;`~6~oScjReR)xDh>pU613uM?UD@`@)S(h#l<va7KZEPr=k|s2rf~5*e5NeMpzER4
zsaAknPY+3`3BDsq@3>%O#82fkx8VY(OHcxoDtEMo^Ss(Vpyqq&UOu?dRP4yM2V_OA
z#u%bM`{YoR`azV$v;ygqzQ<-M$!!HmpEm<Pb*f)Y_Wld3=T4noc{@FG{Oew}nFYai
zlJ>smR$BNQ8+}bLKjs%T7uf{5n-8NC`==*TvV1p7EJdK{d$nv{d4NmtMoBG?zQ6)8
z7_F{CokTqhNs$3;afC^{@WH!U^sBvS_~_D+{<sWIMQU)VxGxc3#QK7h_GXqd!lgzU
zNLxNNsI#`PT3x_4YQ5{i1UtS!^KZ&#oh-vwCn(cOI<oXFlJ6_f=&i%hf~n+bp1)!I
z`$<^@<`>kVSz*z&d8!b{_0}sl*3?PSe;z@|1A5mi*2<6EP+?At`siVAgor3IBUPF(
zT{}K^q_0)joipp^4@xngE*{rTDPlo?WVeq><oU#{`Dng=Hd>&Y9b=QW4^2|$HQW}&
zE{8WptBcxT@DS>NGF;S(%U3tl861W2c%t&6lZi_r(<i8;o(9@sE1Pp<+*7{T?49g8
zt@&Xv;g4Krtz>d`yxhjCQL05DfD6h7N+HBLRc;_I*uRK9BHWcD7K)Cr8OO}>Aog}x
zm<d-wSVu7VNy0)wDJkg8+XbFZ1$L*7Yu&*+D=V011LW{<G(dZiGL=$Yj9~s-$<shg
zQZjNJL&162l}TkbjIWYV6RglHQwuR;cdB9rGe$8X%|AB@qx71ei)L{4hT%mgl%c8S
zl0oRva(k+Oz!o5pysg9~buc<7y$X`-uJ$x@*Xo-yttNXLLQ+>tV0I!yLE2K(NU@@b
zP|13`^DIiM7QRP^BT%1@nOK?{f=&|Xtt15-8+N_m)}4W*$vZ{)<BPdw{Ii138(OBc
zl?=wj*xKHVAq29f9xvUFB?kw)O2k|8!7qFb8hx)x#Yft?enk=SwO&D%M7;E#g}Qz^
z87#}srL@rd_%m4LLU-1n=xFC3*$vdN*)M1EWZUL{9W6kH4$b!nt*obj452zjgfEpg
z;F_{gY7IigTNfHgiCfi3@MoJoeksX3CsHND?sr;1l;u>!%dU83f)+Y0nn!*H_YXSF
z#XVW&)QaxKo|ASZ0mZ^QN*CgIn`Fj9Vx79jn_DS7eeXtRt9I=ai8aIv?eX2;1yNy{
zq%$ZQ#M#cCV;f5JvNM~;*_iBeHZtY>QeVe23{Y4$T|=cjkj7$hq5~maYb!4KT1!AG
z1xrzo9^7>rVCoh8LTf44AXw^|6_s_#5mXE-?XYPufE@`-Wkn-2>5&hl;~h_JIx`Cx
zV;R0>8<`>dK^J|9Ko%Iv9m~pVlSRIEFkkxYRsuCCMEy<~Jjg0UY`y)!l*oU7-FWUZ
ztT?bn1|Ta@9nY!;>luZuGNp_7J&=X^b#{hbOg!9GrKd*_W%%TUkB21hsa%*x%535W
zJ_3}hAn<h{JOV-<a5SH^ggMjPn2N~P;gkWF${=oo<g2+t?=MB}zb{DmIPEAXdtS}*
zc)n;?OpquEsqtXJG>ULnoy-E&(2RE_Hpfs1l+Mh^<R-vExt-lkz#}BB)<Ry9m=<e{
zDt-!{BA>k|Jw``2inO4VW$6yJAoaplckRcqefSgSK=P(2;^U~=6`z;iYuMj1)0Cnn
zghN+Ub|fGeZx-Fp;iJDMVSSRcSJBz@8(oM4@F6Dm7-3V58SW*5O-%3kFQo4@LV2&_
z3rLDx24s<Xtu)KnZf&BM0)LpIoNRyQULa@w#3U9qP>`BW$G(GmSfEIwQr!w~A?_jn
zV&O_5j6C&pHuen>1Gas;Hwefq7OjGERtp(=OWpXHQP<Dkw8#|dPud!x(878JyN)X-
zjg6*hzlgiuHzwk9Bu<kLj$_kZ^{nwoEQGbQ!nd%N9j{xV0hIMUj1J*gCq)C*NvSmy
z#JG{T!k08?j){#<8b^!4WY0zbL91yq?@TXOfZq0|c@lkhB2p7m%yExoZ(5@Bm#`H(
zT!Qm7k&@%;0k>AO{PTL&bT+=$_oDS!wPLgVV}6#VkdRA>@oA|j>Q!m!)?MK_fw!vl
zDG_~<$i{M8*+@%Rj5bup=};#u>Gk*3S<+n;BFQ7NSRFWDGw}0UG7v=9FF7uq!KMB~
zzi&v3jA2qOTb#XgvNvi^(BV+^gwc3wEYa4)@d~eTOy5wfb(gdjr)IiToO<}mM4nV#
za_0}di!P2&!AkN1?Cl_@4}9n|4l=t~>&v5j!ua1h-^+vdFORxnMI;HX<~i(XoCX4p
zw#xr(jwm8Be4wIk`(~chx!mRzJo8xX_j9{CC9tETWAMI<7^}#gZgWh{(ZwZEHG{3|
zr()HEWwAmQGVn8-X*S)5Ef#T!y`ZENvD?^2fQKj7J%~ka?-W9e{dN|I92)HI<@Gg9
ztia7#zzR4*v}+K9_dowORPvV<b*lR5QdoGp`F#7<9E(w+4JzIluA+Wnt0iftsR8OX
z-rtSY;HOr)C6I3?-e~5%!f2n)iXVXQY4|Q_D_O=Up?!ZK%o>7+VNY+)kH7VSK!INN
z>*lwYp#6-<@alS#8&xK6y}0jb_nOn6A=Rj25+|CaMC4+~@0vP1q0sOBpQO0ucVS`6
z8(HEWUGh<O_QFA4{hRHR{8oHclbnNr-SiIhbNybqANp~J!xIb5ka6PFYyI$uk8+I&
zrs}W}YHgV2xkpSEKi~$qsP1W{;T7E{)@z)OtzK+iB=jroD_aXa-S_9G%iLnj>+|p8
zOqK19QAti_)Kk)!;v3##HQPmQRN<Kvwnb}&d%&cifx|WE)u+NmU@SsE2wlHEm6Bgo
zE66NzIqDzHV-%e~o@jpS+Bm)r%?N*`ej3g2#R7buC$C|)EGP#ygQ@Vx20K65e8r=G
z1wH`2YX2d4uBbve)WG=$tV0`!^Rtp)NZJ&aCga`jehJ~k-U;j}&^x@tGO{)f{uAoe
zLhGijey9V-pmlX1yvAkXmT8NLRRnkUkx928tTdy^dd5V>kY&-v%Y?<l!qI3URsK^n
ze?ZDGh%EjhVMV1r-A-7r!=f8Az>^!JPx@RaV^|c(e~Pu8o&2~_l+Gaf^D5SI`-5-@
z@DL(1M|}HzvOHP->`V<OhwRfXj@-lW_Jh12)9jysKR!p-^xG$I_H^JGv`BCB%$JeI
ze#OVTajNFE<~~I`)7_*=S#qgrv7$f8{7$4A8L6BM!ZHz;BOfT*4q~$O2w!(C_24rH
zBZ@cAF0rXz-b)8*yxVE(qoA=g=5Lbwt!ka&X1hVQNTC!VTnHXUcQ1dpdR+37j`N1{
z)6Hg3R()9X316~5I(+>3Ter)g=smnLS}y#SMoJFqi|sdb`Ie&Ph5`$nvHkK}$Ni%v
zIbP5lUA`S!i=<Y$9Aq1}T&)~}F{J)+Awe|=e284;xWjTQ(r>ILC;`#SKHE<Pn5TsB
zC}-*21w&wlX^WqrtC76*GUzBg&Nf$!r}esc(c!heQe5OrQlgYlf8MnB{3_`AID^v3
zGx762^uix~JNRG56|cHn7p{W3zt1Y^JY`@nDpI@V0{>7EPbKmy(eOu({zU&nAO>Bn
zAbsaI;{J0f{bxHu;(Nm@nIFrUB}TP*Kk-7BI8`+7w{BfXN?6Pf3yv0DawuJY+K(yD
z_#-<{E9`xfM`TcWgLs4L@~j{N9(+^1w>%<rFH%{(gkGKI(}Kk3FnwH%AO6VyyoSU5
zMCqo^rv@H`xkYLj1^-X{=<+KCxuoqq40V6_`;W+5C5o)-FMg@dGee^dJ|pRgW5_35
zBjS!~eB9ek?1ZMV`Hl_jep88uZ@*zWNgQLiA-GXfm4X$7He6{^JsdwMUu(YG$#Q+R
z^PEK%T#jJv&wYF}g&jXfMKRuTp@7RET9`VN2zEJgI7T5;<NnC6)gsd5q!AfL#IWA-
zpn(Ha`*x-#spBS}kNZa?CRaubfNO>OlG&`d91fTM<r|Jz@VC{p!SI+qxON)tR;1wX
z@1<>tA6vlXXpQ<!`=5U_9PU;w;_J*{bhXr6l@U`J9wj512$mj8Fg8MlKDnX-INY~+
zNUyU(zyY6(&n<VKOIbe7BN<t(zKwklmrP2jR-FMuNvcSf1ViDlW;WaYFGKnEI242a
z8*G<nsfAz~b-(&yOqww1k9;;BNH`_}PELvbEgLmBIc)LNHFj_SYLYRHDmdV^a!{Ir
zC^$fk^`;g~!rI44SV&#Ee&U)V(l;zS_i0~9e0W%MG#?Bly)LEN`9BZk=ii|)o7_EX
zh96OZ1t*tm#TqNUD-`Up(}ilD3r?;C=XKf#aB|_4BMwC1fDjqh1bT2l8eO+sv5|&Q
zAL!q^dUzOZyHLLd_J{!Rc%{=|hX$e)piPf5-r9=q0~#3_Sx|8Bqco;O?bCCKC<1@C
z!}%fabxlyejEaIH$}|l!sQDma>Xbqy8Dlt{NDmsbvVaFIZML<&eJnZ&&!G2tgoo5B
zXbt>W7+r}$OH1qS;Xx?>s;S=bV3yU9dH?nY@bjyG#sT?&P=hwlwf%|?P9jwv>EVz9
z0V^IWK=EAc&~p+CMwfw@HRw(watHvGnNkY2qPuq<%}Y>m%7ejYK?@iX*`<PmR(HQH
z1-0rQSf<D85SicP$}KNi7}Vo5|0sENIUyz<2u!d8ipI7Znt`@Bj8XBUMC7XTwGT38
z-JCJmoir`Npc78y`(wl#10A<jsZ85Vut$@wR~A3Y501d|kFbs<HM(2dm~}d3Z_mAy
z$a)iDV*2In!#rnE=|T{PDV(m}K|HOlhW1kC5AUV;4XygiC*^|gqYlzu=V>>w5iFLn
zPI_OKEh--3f(l8^W5Le(J47s>9Xim-5W!V8B}lZmelU^A`@>%I<pH4{UTErp$y6;C
zQQUnK*x3&Gt9>sK2c%Gzmlk#nB;%3{vjei9#2h-YR2E0?Jz3vn)#84}SyZ7N8My6(
zt5d4njI*?W8|-xV%KCRK23aM$G4J%zd?4sEO{rTHRifO?PTcG&q0sk7yj{5PaYP`{
zB0L*IU^8E%*$UlL|BM6{XbF}O=vsp@E_yb<d1W+P;o4#g;+zDNcF$!tpMOu3_Gwe~
zWP?70{j;9*T)|%R+!I`&eZlkV0j2HONVNb#nr*NrYrmWR6};SF{|2o6X?F0RKZmup
z-iJR_{3sxvD-!%`YZT&mxY`w1V$jxH0?IOQ)W2xRJ77S6y|%Hnl{c7z2zJ0<4P+-J
z;etleRHSz1=7@rVg8AVu1~_MdhVzq&%SRVuE4lXML^SEk&xa)(IqScVk0)&Q<oNy^
zGV*AC2`aAe6+I7@rAy<**Fde#eJY%8`iXAq)(jO%hvG(p8%^?_Yy*$D3$#286pFGT
zoXqcH?!$Cmt9Cay=J~-|B!6ZaT@j%`1OzJ&_c1mmc-d`c3nc{Bkdz@#Cn6iFi<X}z
z&Eed>&)@<?(dt<}3Fag?uak4y5Z4IX(dKp}tpY!oLQExZ`HUcV^HpeI5nM6InXYh=
z`!LYa^;v_1&*L}3#P(Re+A^OOw-e?h%?#&Gw$E8$5dQ)3u~_{{K3L;4NSf%l!%zBN
zlB6dw2j<U|Z;VZCmnfGaC8O?!Rv-~ih)fVEokZL}a5^~k0DNb>&WEHrdS+JGP-7SN
zy0ZUAe7ov%#7@9E1^Y~yqtq2WEH|!fX6sK>xyd^+Hr;)<BLhn$gNfs)W>JY%`Z=-7
zqUcBFNsNR)ge@4^xNZAILE*!Gc#>#Gwxs0DvvsGI<~qm2BYx2P1y1~IQ}}$u@@mib
z0edFo`dfGNl9yPU$z3y$d?1%&J0$ye{`Pi$yITCpF@r8ILFNH0@7%>#sO$cqb*s*g
z>@DXJ&h?{+fz&!%Fp5cF1?^;?7a83Tx1B}q+IPfM={)Qup)VVb*AMEf>5`e5jkiWW
z*qSWlitg}Fh@P8xDdEL-!5Pjq=2lDpaIJx1pi#&SdxlMeWaPF#jRum7y|>qARqu`s
zCh&-eBAE1>S3zP4)@4<~z~-^2HD4kc7LEi}qLNnPmgEGKl6{TTZC8Azc7C)3kxhQJ
z_I4zl1EmS6iU_EV_?9`?Fxv{+;laDWOG-)xh5mnhy=7Eg&6c)}6WrZhf)kwJ5?liW
z*Wem7xVr@s2=4B|-7QFPg1ZIxpkMKvKK*w0_{RCk9!2e1wQ8+hHRm<&JM?ElI2t4M
z9Jke6MKs6`L^{qNYwda^iqtGN*i+fBw4Q%z{E~=5;G#YeKI?}#$5opulYuJw_&G<T
zT1*U!v*DzFqzJ!Jr{3RehL^RZclz>jROiiEhJS<a14A>te*_Qkpsr{k<M@>%U;Fb_
zUiLEAb(O^)A4%-qz;Jc=7%;?o2z*n$o9x}v54x|4HYK7%saJV3%bnvIZ+jTvS-7>(
zZ*Q@Ig>FuSn6<&>u`zRT$}=DG!<5K3H+v2_&{p1oa*^$c-RPP-ZV;vpI1~j{VCbXE
zg<eaKZb<eOX2`T8bJk0B{Ya%@vQAzZRF2sFox1wVAqVewKUvNP1oelDap5Ai&uNXW
zh7m*_YNk+u$0P-#y}xzb&}9wZeeH%zRgWp|Zw41%*h!<+<Vp5T;CHrb@fR_gCn9d6
zyJiRXoBeQ>s{`tif_<XybtO`6BHG3*s7G#vGU^5c<D1faJ!_HRo-z+`#*F@oHISp&
zR3nDs^LoyZ@bQ9#A6+j&i(Z?zX`?s)wbltc#(TLZ%Hu1&YQm?|o~mD#*xIv2Qjt@C
zEQE%?yH0#EZs~|c_G)DP5X1L}$M{`nJ-)cWB?uHjGaeR>OYGItmr-_>*!?{hlbre%
z+U@p%z95=7#BMZ&x}<*AHHO#c43qorbGFr?fVtHm;(3);xCoDVZJ8wm@87h=2Kmeg
za2}@P&%k9#Mp5q4M>$;X+-A<6-=EBfZrT081DnKd(%-qfOadH(`WqcLB^JZ6=m32Q
z`yyo1YO!5oJ;yR#s;M;ncO3lWPSjaz{!M!=o0TIP2)B^|c%_Xw0~8i5Vkt~?bn@eM
zWvKE)S9}CfNji|HlAOp1A&VQf902EC6Qb??{Iec3IP7Mlo{;&bPlfoCtE*(h$34N~
zu_@fPj0X?9Cfw9+>K`OQ47){GI4iAG0P!IaWziCn;VWLpV~iD+x3Z7{X&LFPrWLnG
zUL7<XY%n5glr}bQ)$=eHSd>59$P6bcye-~kVB5a_nlON0XUyEKl+ibw?XAM@OWLG2
zgM$LBc!VBg>er2`P^5!xf8EH}g{z^|i#E%ZoOU~*d#Fkzz(?D>tjWXWd#zeeVZucE
z5Lem7SJ8FR6yAf}=d@R^W^_UH?JQ%3C|^2SwChlqa(Gl`whO5ynsE$Exn0C3D4LM5
zA+@B+7Fi3Osg=zt;ps-N6`4l)>;Tj~4Ot3CY>oI2vZJ1(|Deoa^Zw&1pSyfj|6T|+
zXP76&@n0AJEE3)>u5!9dJipB;`R(pvbtS9Y&{LgW^%YTn)8NtBYww{{%7|7*7M2uA
zeZKIM3c3b^hqD>i3P75WKz@-do5vBRyZ&MxsGgC)qw!t;vVyLYb7@h}ikm;9(U|~O
z(S*IxTc`0l0ve!7GwdzO74M7?Pv{v$fHP44<z5U0$>OkyZqp~ctI*%MqWOqgJKq`~
zhj@yza)3#*ZLYF_95$`eig)DB(4_Cv9hdBf54o!08}o<4??E6T#-KH9)-{*Cw+6a@
z;rbivSzBq2YmQfSPLZe)x$b8rr-AywP)F|`LW15e_P@0HZ2TgCYT6;rnSggOUaVv&
zB_(B$Iqc80Hj)rz0w^LPA{cmhB(8_QyP5A2Xi-p!dHuBOtitO7KU|drlLRdIazPz8
z<yPQd79i|KweVG>FHa_c&F8^=VvGV(_)E)2zz+wROGV-`SGoMra8!6s_>9Txd0n=K
zVuVJxlNaX<0F8GQwhvNvAAqD+?@cXdMyT#lBO4mxMXm#%_g$?!>0E+|_>xle%gy;N
za5KSR2-!SS7JzW1Lr~n)ZBKeE<QtQqhJ5TSg@;4;8jWP2v2Oje#wzqv?Wu14a~Otl
z_8z0=iI6XYAY<ctZOiLNas?^_H5W;7kv@V5s^d4GvezQs84^8x8sgSp+uDl#-OnDS
z(?Fn~{$j3!u8XaL2uhnOJan&%)|?i+ktYlO&Z_gw)V)MkV?(anA*(9Xu(0?+#k!<5
zt1w1};{uOeywx<tHMR39MPs=(lD+lo2ieH5d>AbTf5hY2S@V#_`eD0Qj5v%CaIF0C
z(tXhbO4X6BOJBWk3o^35aWg~W6b^YdjJl&;TBwt$VI#@TN?ufBIi@<h`E-p)yjOE9
zdRy}xM*takXS{f(=C0JC`8sY_KKI=0tV3(gr=73q5z{+PmIb8T|6z*aJ$+c6{@mdI
z8h8gCEzP?&wn^8BZFLH`j(2oF>recq(qOw&bCfHVcwP4?SK6M%nZ%HGqBaZH?w@j^
zRar)&DZkE4v>4*C!M{!637+fxe-sI?r2ZrGAl&B$JA`ox=xB*mhf{|okK0$8v*jFC
zNs8YjZ30a?ZC=PCzZerdmJMc)a}8>TTylToVbua_G{ncDfTk^fEK$EcPi^r}9klOD
z@!Jd%Z;I;dxJ4wrAUPZ+@?^01E(1kFILwB_(vORZ=tV33rYO_0?2fAmGQ?9jon2mH
zM=Gvt1OGJ~{6oVH`RneuLGG_2unC+Tm3`lsb$TBs$xx}**`Tj$f5{!luA#<Hvf=lw
z<H@_G2z@J}7Xq(j^r7nL+sqL0x3XBG7@v|&$1_MC1b4(`Dp2~!l$dux>gZap8E#RM
z0)HV-D1@inJ})5SB5Cc{3=!`iKHOFBi|7fi{jL54bBi5LECt!;fZuIpY?eK<)c%NY
zQV&$Fh?PjBCLd$RETnqFQy2)L7=vtKzSzD|?B%YAw{>s)Vw(*2-A>Sh@s>Fykx{gM
zqR)^>A~_jfxvMkG*R;0UHgO`x7Tin2lhBnPc*gFLwD>C=W05h>WH-rtWZ*>8=K<W6
zQU^UZ`E4uSqzmFG{QTCR=F`T;U=t{lwXxB5k6&vM4k0w}83>8Uf@-U6Y?uI-QxW_E
z7+j}4;=C<T92mUDt+HP2fA?0etzf<LZ)77eFVX6E2=dGhk7z`3DS~CH^f%O5#!sjI
zrfQae7@2Id68bkqq~H+xLJ_&ty-}6hbxf$r9Bi$u{GeDLe=1-`7@YFATpL;wanZq`
zd1-HDV!4bh=aY0U_cp@GYy<vw!0X=aLS#ObYZVhc@N`#T(M`;_2ufkFmjt?KQn_d~
zNA<O<nLC)6;I|iYNj*@CiPK92wJ{Vhp>j71rX2QFlzz4FltO@zb=x;`*5kL-t>Xv|
zi;}q%kUJ<W$o=q-E|=v7*xCg%edja=^)ESNelXBjtyx|Y^2@r3*^rYPE+EAf&=F91
z5hKVd^!+9v5)<%Z0_BJP*;_(uLVXc9Jp~G>rYER&Q*sA#esAqCp&7qe6AdeMxvF&d
zc<Xlf=)IBCrT6-xOQaf8Sn!h6BiUs!KK=65q22;+v6(Asn$2e4%0|GG)N>$44Apos
z)__+haC<~#iE?r|9b_iB#G7NGa9*R5ijyCut$19EA)BwZvfKQb$zly{Opm=CSD9%F
z`KMRI)5-S^cFT!2J?N_p`^NZn_PKvN^^S(PIb=r9Rp$H4Bu$CNtEMbreoNi`t4qnX
z3~0nf3u+sV>b{Bxwy)|SMJF*4VEn6_#v!}UA~VD#`VHF~2L?*ujnw<v2w;Zp4L>$(
zKQzj;6tZvOP}opmWErEFMJ0;~GK?5?1*Kpn^}+nS-qSA(`RLjSI<pb*!F)6y>6))d
z{}t;x_SI}{q$w<GL|7WCfKu9qzWDr(g3_`6{8CbJ;Vg}>mP{5CW968$gVJ#Gqb|9V
zp!82ye5(n>p`$`#o${C5SA1w}7TUfWv6(SIgu36+JhnYnZLd+JX$g|?)qG@c?xzEg
z&>XYXj7XBye?daWShRrUnf=beO^pm|5|@)1OJ+RCQl82ka<ld%7(^TKf(T8vjZ&jU
zomfZulPnVK7go05)gKD@sr?Kb;;tdo+r$b7R!IK<LT16u?whzf6?&{;eB!iC+3XV(
z#93Un0}~a4e@(bYKDkOTENI1M+k8u7*y@f>bvT}ZrfSBAwh%1Pj{FU_H>(}eAXi|D
z2Jd<i8x<u1enW$z{>+xYZe`-tE8bE8302tN7ydFBzr}Ods!N^Ll_3>Pijk>Qpm2at
zJd8Qgdbbhzp-k5bUaP~lxkEiX!(!N8-m}bm1Yi{f4!1xS>Iof4?m%H#%TlLc4))Dy
zJrC7U99Q;(y}`!X*VMf_a(vfOA|vHoeyM}K77M;>bjO+Xv)uS#k+9o7VGg)YZpZyl
zi^oOJaw?90O-OMj@ejk-+u2p4gk!`M%NQ;tuwH%`Mb8WNf#Q08F_#gM|Ic@BnnT>g
z@qH4qe9yKMrbM1qodra{rK))s-*xATO$vJ&J20w|`s%iPGbJLUGfO<?+RX*CF22QX
zq>zD?%cO0nJQX5ke8S0t-eNiTP&5ZKRbNem`Gd;McwI#24ZRt8FXy(3<IV3+)0t~B
z-vc-dKW36jq<v8K%OS;<?forD>v~MyiI^K&dMN>_;yvZ7c7tFT>EBO!YC{++X7&y7
z`M@aCz;yg3x`1{3;Pp5&H(2Igc}QtkmUM#r{f4sXF>zeO8oXit^{<>qDQHwxDj&+|
zJQ3N}55I_*a#gc;8<7#eI3`g(BCq#*J@>cWv%4=KzbRHF=&H#5Djx9nwN0CsLn1^K
z?o6q1OwT)oqvRJ%Q#yO|+t|M#AzI42J;#S;D}tJjvW@@UU;X%blC2@MnGeAWA(VHY
zzd3+tZ@*K%7MC?rZEbQ)tY9eVhA0;~9!r6iHyHt{wF*QKcftnql<7US%k<l{!%~0O
z^35uJH+Jp{fbE{@9vxM<G^(Ot&bM2SgJgKi&@e;2qmFtrC>F-k@JR||MPV0{n3$=N
zt+CxYiJgzGVV~xTIu2OO6EE(~Rc0o8dBqunQf11SVr&6^vtexNfe?HNHEW>n?|3zV
zRePDv>^hRpoI+TfXVNK_M&tJIDZ>sykTe4*TM{N9_e$a73=iIrH2KJxS{EtoLnH0p
zVpPcFk-l}gC*{Y27rUZ_t#%e+^+0~F`36WiE+*qz6K%cEW+IWX@8%Zlr@dVt*k`ns
zKgU_dszY(wR9fIZ&f)YhRWIx-*02!=zX9(f@a&F{U$-*M|C{S!QQnhIanB|jAL1@)
zmVYx37r!7AJQXA4^%v2_ham>Y?+(nP+E%4a&c+zDu|VQGg?Ec;d;ASV;0<JuEXI9#
z{$KYx&dz%XdZ@jjsYKjd9^&4*_Px7P(ET77x<X|6rMwx<_c@r7J5b`8NDg<f7;Y2o
z1&ci4-2DXJNtoH&e)YKc<|c;$tHTqpg<)X=)xXf5-y5Bx=tZA#zn$o?wf<n%F+rH`
zKBqsJNhN?fl1bCBN@p+h8cLFvnc+fJe&5`r_XCBS`acH@8bq2(VZ)-+0>er~GfQ@3
zY(>5HfYj946lA0?93Jv}=8=#j8?EdsadaNlF?w;CVcux4%<3<Q(COUjpt%vm*s<+$
z^4@*l9xYB<GElvsz*j9%-YL}T@M$~TVIBIy$>|UR$C4IPBjOJQ3O<`obJpsCW_REZ
ze|opErnf#uD-lPF4M^wm?fncY9>gq0Mn+Y&Z@k#68(=*x_WA_>Yq<bXH`=K(_2Mt&
z^4m(=8yiq)XlS`;MI+?K&Z3Up+|Fs}@^!dieky%^V~01}F#TXpgdc)yObVz6;VAbH
zF^<%yzjG+?b9pc+!f38vLswtS$!WPAV%yNy<~enFIT=_Yqms-E%<9`|{<9hXv$~pn
z4s!xy*maLarmQiHo%_;HwA$EgwsWn_*Nwy>iX}Vr-~E!owp&T|@%`xaqU$vO5M284
zw(3rVp@cB+LXe5bOLx&~qE)XEe)zv5(W<QLSNx`^Kq|L27Ct(5eX2zk(>LJ>gWr`E
zq@HIESSX|Mv;X4c^;LF~Y67KlJ`Q2Na*5eYHB=qh@D3f+$0)$YRdC!B*fY4-o>9)X
zP-*%Jiu9F3YepR24Q3Mv0chI;0_TN(X}vpQmepR&!gZV~%P<`j8+-wJmVWb#a--)j
zXdFfPzYRw18{awe6Rc#sA)x2*2~zk@Zr60SM!__o2w@PpYQR^p@CWS6^e66eg3NfP
zX<1UZG8`pFY=~eNU1cX1jc7a;=KsQX&eY?DX!kpQ6(p}JF-9YrruNkNbL3BwNWpn<
z%I<8VtfXi(%<Yi6hhB1ZOeZF$7z9(i%(V446+|FjxF3?OaK~5Dph|B00tmn(u=s<}
zY$TPz+Ong*sZ-IbK&(TCGhiLt_2I=3`>%e*X}}jg_(ooS{)pN_WT_XS15={)>%Bb-
zj5{N1>(>WMwD}_2&HAbaP%@A>L)9od4QuFVik3fvZ9_y6%#7Fq)wXEoLK1IEiop>%
zV4Ee_{m_}zzx6kAb#|&!df?+Z8?v1)8dWMyX6=~z-T*G)&zSy*6FyLRDRe7&jLsle
z=*sR2{XXF>{^)ygk>IN6dGuHk#h!T9R0?iq&NH-mHLKrU(NAdg7_65jKlim3!*==D
zSwFM>?pLgdu1U7Sxq19ZZT&U<WfwgmM?pHm8P7AzU9YS?gdzHqJ+aYTs-9zq?wzb2
zz$0hL_)rJpzE<T(mU<>Bo*zwe^4bLTNY^TZ`&%WHhaTHDB^Y;7m>Cq&9d2(*-*kdz
zKS!9$U&~coe+7?fwACu2&Y+KNgvj&cfz7hjWX0S(U5aud)COKCv}8FoQs9AM`uuOe
zCtc4%9B~z2CMY>ZBFeHv(Blko+x8BD4Nwz!9B~6YNo(bcYt7`!w0oxH37lb7bdsHe
z*?U^6$>Iak^H#Pm91?$=nBe@qe;fG=hvaICm&>qSR(u}xMIiBLLCuc<1JY+Oc?`XT
z7`q+TWJfv7m`T(eAN&|`&!D~VJt4*V=gL3k%CM-@^isL}R|k!pS{7b^gjRQuLJb$3
zN>rwKf{58K)orSQK;O7AVMT=FmH*ny%LoMxJ<(9Pk1dRgiyNRkHSPXc=inVVFx%j(
z?_#j!gDuB~Gd)nVnXiJhU8H@0{F03FolqRb7R1z0_1eNSF2eJ|1c?q)czXZ1ove!z
zLn3S2)RQq4qM~Hi<|Z(dhB9m@$k-PE18iR(5ouZf;cS@E;Y4gN+!hvH42g6v18nAi
zi)RZh7`e@&>mv574Ro{XwL{i!?pIZxCF?<moq3iUZm3vX9F>@MF^o;7m0@3XUP>@)
zV>wiKh#QyCCXi!*EwirzDG64EZZ%0O1l>}eiv$EZi3`*Nm!Wqy&1GqT*%;qE^nmv=
z?N<KtPYf2+ULccyghp|`6fW`2@&!D~WXKA@BThR=<n*pBRYkaB@EoD|yfge5+GlGm
zjUwIz<w&YMsRif?6d)G3582|bh((H?%U_3MX-3Ct5Zx;L7)C#iaG8FduB>(%V-aN_
zYx7v$o7&Ol8#=qW<QOOxnWD}VJKNjq`#2#!qSZmL&%n&Tnkt~f4RSw(wiHikFC*sl
zMEz!$5SP$7I<efcMiU&bh^$QsB&6Zw#kDC%w=rwEFir57xG7gIvuwzIfXWa_sG4N_
zgeE$%p%4JiuwYEJ#z(%x+_ir-khg};4tJs2%i4FolfRqtKLDNaG*P<3>h2$1#f4n+
zKaB<bm65f3(W_{F_irequJgP31I*}tgC@D|BQv8)iHbGl*;}V4D6s~~b?G~w1>Ch*
z-OJ;3w(OmrLx<>Y_|%yqxX6V%hx7wt{_f5>7DSR^5~Q+}mg59Y;U5r;?h{2@*=$^n
z*8!(zXBbHUMGOI1z@ebjr9qJpAX6}z$4<gJXhb@iLf|TuXqw`60)qL$Nx@EM!z+Y>
zq@T3*`n;$+b*c7^RiqGFRmYA^>Z?J8`y0C@Ef2W>ese#|WquY{<%2ko9P*xao+bn|
zpE(+0LzO~r$#bEyq<91l*+Q+5>~8o^QIf`ch*lo^fjtd{iH3GZ+*dNb1%8O_u9>dl
zv}KC{dWo~jjArLM{fUaUr*bUNPAqk$cVIyVxO9<X+gbPE)T_wn{a{X~ODbbDBGQ@X
zPRX)w({^g90nGl|pBsbL-k>WRBF(MiZf<_<INJxNhT^syuB?Eot`!s$ji905yo8gA
zIE75i>8!D36_OH-f9i}l)95Q&$viB+GlG#E4`fqfX;u!nQm!W;LQ{}#8L0%~zSd>{
zPns4hU|VY48CEbS1d{&E^lae)`UnzZttm9bNIoeB|5r_u#V%W{BaA-Vet|lpT3Gxu
zgwAh)z{P|`B|`CX>2km$!e3|ME39y}I&5`IBwuTgsMNnRavbyB!B}Ja4iQ@2R>n@x
zJ$fWuyUw5FhZq}&<0K5n>;;b|arWRLsdE!fI`49x==Ij;AMj?tUSk`uYls?9p31yq
z$t31PFx-6TS?}xLVSJEI8#S5CA#c3ekM2rGCQY&-`tgGCXfwWGJV~uqvRkp9yGxYl
z&Le3a0cik1`r3N&k$-`TOcK$eI2l&?%om3q8Y!*XpVP$)FH-->VBjuQHTq2J@Z6xv
zP*k+@uP=#Q2kRBhDT6K5m9WC_h)ARetXzb_rCVl)1TIu9M*-KNm6sJldp616dsYJ~
zx+6bR*_+2gQlYDXDRSj5F|PT3qz94ucm~_yy(6wi3vUsmsWb_wbcXb<a-J)kyZw(@
zl34-yJ)|CP^tggZ`B|gyT2>fTRuVL4^<={{zPdB;rWenGv@zl=MhDL^`e_`O3EZ8c
zOfnxM!`t>3E=SPUf2me3<Ef?hh_UJM%ja)=22%i}IsdrW_;||xFVsf3>GN$WCe)J8
zW%3~-m6`pom3#6gr(cxH80JK=5+Skj`_Ids;`4C+7#}#RZB5^)CswXb-f!<?Z4G5W
z@2l<cDCD3$%j2n|sC&^8?8i>fWXT{{;1vDJs}Z^houpSjYw9cN+qDFr<WvaVm`?%}
zr)m5D=aZRTfDUMImHM*iL6OD#p{jdHh!~ukkpPFEy38$eKqpZ5T}T>C`$w>9Kg#&H
zlN7yE6*Rb%1PyX#o+r>Mp>fD?;#WkI{J3edpm7$a|Iqza=T|<H=`HFLb<Prt)P8)E
z32+dhXyQ8F7p_XBG;@b@U!<=vK378;FwW&x8qd1TFhZ1&pvy47_N|}bziF(6hsFVv
zArrA1*<J*VV^Dhs1Wx#s<MZ6x_aZ?9$<pUsGJVi3BV}743#6^A2s~qL@to3mv2)f&
zLYPWqAmBl8>+URt62K)9@>w}zlYptv5FRz3^p8-Yk}i+QfyU9EDSK*iM(~mVpv4&m
zr1wygOV)<mtk0KB0DyeK9>?<rjBLBb72V%;mn=$|Gp`9e&>&LdSz5RibgM4$8D0-+
zA+a-GW^CcX@UHM~9P^gnq~KXFL<mgBsa}QPe}ByV>D#|QR@fQ&?~e}_6J@BLGwBM@
z3~@0BRf`uoQU;#s=NjARt}7)9+-7MEGXOV(crhKxHzEtL5>ccbK6t>LD77W`lmYI9
zxYjV^)BkB8@Y29wd5?37CNAfNy1~Y&EP)58%llGRNjh-D7#Q{6qk-8i(J+Wm1e2($
z-daMc3m~ZScI-@WVR?;VSMY$kQF;M>JP!JZKjs7KCJXi=Ef8=gh592#8h|@N)n*&#
z`#%lRUm8@}U494Djmisk6A_^~69`b3l9{BO1hAO?(@>ONhN9bh2Mws3!WZgB@X8qV
z2Y_lm{R;3H17$ZOYOFhKuffH^Gbis7|L+EW|7oDfb2kF0o1z!$MzXK;pbJnpGY4`L
zLx8&Z4@2quXI5B@A0YvCqxM4GWPD~1{Q#Z}K8r5FU9hfqit#=re+3s8h&%EL^?x_;
z`lmrDk@rVLge9Q-zp}D2UvEpqV$dE{WA-!0<<IPkLJu&f*v{~Me&q4;@<PYO4SB6u
zk)@h1i_dNh^CFjV6K?Rk)q|6XiAmxDh#IO?8%s9*jHi-j1E+gpAuoJT1%NeP*U%vS
zvhf$PDz|vyXD$i2(*#2YFYwN;o}WUsB@vBGd-w-$y(c}Ig&!`^zL5yURBf7{0_VuY
zp>(WKSsdv(Mx3bWdo(li6^8?2vDl2>E4uMhwf;+sb2&%k5>2fAb_J7Z%~3i)5>~wR
z3AoB@C@&maORemXDmRuioXbJr$bWn?C?59S#4Y1<CQc;@rBIq>I&Zr%Xz!kX|7ZJ?
zS-#tHO3}R>yIF$OpO;=%T4L)wuc;o^jJy=;RVr;Pd9_?53Y_=9Oiuy5+qGKqK~u6t
zT!o1&uMdvVt3=i}hdq-=0*+TJ(5B<((Apa1QAS6L<jc}43bgP%Q&RuJS-Mh4*yn4_
zE8Xp<OVu$H-?mVFy1OKs=?+f)H`GFRH%qTZ$kOJSrCgy4#+M=3RYdS(3yja8h1){C
z=}V0a;Pe3-W53j0GH5$r#VIu}6=?N-ZL$N6!+bEVC}Y+pvb!W~P@>XYJ`+{+IHB)K
zSjbD{S97!$Nj1vc$%<q>nU6?$#P<6194H`tPTa${Y5~6-8|TrfT1_-iL^-bbHn~z<
zQ3SjY-#KaRh>Y@faZ($oOWNfx#}Ka1u;)&Myn^D@1m&+u=If9M=SqyuQwWK`f{oU`
z@7{U1Ju`viUCPIEc>t>f=WwwBZPn+#ym9(pv`zm>2rx3y($S%_@V&caK*V7T;;~-|
zvxY|_l>pw_l8>Oas0ifv0z4c2Gr{rB`aDIO5NtGCeV$2~p>Q{TFRmJWC??K$y2fQs
zs>m@N%dBoy;>lA;;EhA~I;C%=%#Dxsp`K>d$8TZL!`i&8P=OsAB^qW-@3<j<a61(J
zT+>iM6S+Qr)Y5qIKvRM@65FY-0Yw}yP}&G~J{w&AQ3`J#&!TL)OQg&MJsyd2eA~jl
zcsLnt|MGc9bpLdlJZ$_5;!g*?g!AG$KjPmXW?$`pJ03&9G3(QgP5GK5M@64l_+NjG
z7G?b__4R!%82IOV+^eIsv%@QEXKO7oCH*$BY2dP?@LV{j=peb^-mG5o`e0t>@+_St
zWzyFk*<GRf$Unx#I@0<Fk6nn{9-%`fE{rm9lRH8K0&nSuX6kRTj=ggR-uc8DbuM6k
z#OiyG@(;BFMbXk=5kkkRZ+M?gMX%P#2DkvsLDRBN`5UMi0-@J2CK76)a90k&?XSo5
zTSAQgo*U1#ez=YBb7qMTMa{mE=n0?_U#QJdxZ7lRhv4UlxqpgZm~jXD)3Yx=oEj&S
z&`LwJpKI$nO`w<?js*N_`XY=jTEB-c^r!urIYp3vW%qP_e<D`?7onG*6qoTJkXE59
zWsqLwWT}-Q=J_+^+$-LnA`l1bGvMuDy>t^xXe*ZTW7aQ1)0F5vzcX(A#1C&BBcga1
z^`zG-#Hn~A;&;yd&*L<FBl@I>Cx4Oh)&A1|mhxX}ax~u5o@jTOBh?a!!gZ;KH~W6D
z^{P~ZIZ>gc;-44xjhVa;aG^+MGYYt^0_IKPK<I+q_sQ#Uxka-!I3y%TE{O%O4j~XE
zjn#_j{Cle%!cx(MuyFjKLPQC9g<0(zKyFM%Q@ETGFpKt<TX?=PeW0uWe<L;RA(^gq
z`k%Yc?Ma8GM8427(HL5u8^{5#*ost&{6y_ru1z#Xgybz3iPIUsaTZtboIHy>T7HW2
zcjb1ABKCV@N_A*7G4D%C+U65T#X=Pq?i2T<(3121ZNcVIrmt~q54tIxX_}jCIc~@r
z)6o}}A4eg;o-V~JWZ~r@i2Bf`=q?I_R*R8=T^8$SJCWREOD9;y-&wOT;KrOenUi1L
zLbmdB7OHISm1VqhjSnMnEHXdnPcI#bQH~21OYSaf|8VlM*7`xvf|)F0odVh-L`T)t
zDS=@mOYNY1nY@AA<80YL!O*5ky9GtU@>7AEjOC)JyPU|uL=$IRU@OCI+l1?(L|VHm
zv=K~*I&(IPJrU^lddl1w_Q<dDIxVPq`zO-l-K6oqQI+G-l;mkXp8A?ky^c_MFRY3-
zL!jQ@pfYl_$gf(5J5k@btRp-NC;qBit@3*_GUBpk?73TYWN~E~2Nj}y3$^cBAn+;D
z>^ps2$HHe43EOAMHL{&x{LQ%OCb39C<*;{25H$WhoNz1L<!;jKP0fC2x5owL$016B
z+hksIp^q#&{_C^L>~;>%rougG0^l@^FZ7$_CwGX+<Kg!rX?<?pRy-!mXQ(AzBZW>4
zC!|HG)Tcnl(`g2q54>nxjQA_!LP*f-l37yf%H)h+8NM#9tN#Wy9O}jOtk#o<Go33a
zx+{~%n*3sDu_OX;*9B`FA4l*TTUty&g)BagU7Ce};|9!&CC~m;Vb9o@V(rmF9n#f7
z-{T$-&ZB8|Jz}ho@l6zw1X@*{H;GIiFgu>^O82^rs39RCbH<El4T|0A<UwTG(<z=w
zxDO4s#!PhUw2}1$ucJd8<pd&eH~qrrEj1Sr$@sEwSm$G?N{5zFEwiR}`%V=%aq4)Q
zw1t7S`d}(i<w~10S0w@c!&K}%M{Vqq{q^x<GC>=f5Q%oK0-vpy(Mx!0k$&?HB<zpp
zu%odMH^|o~upTSwE}x|TKK!lv*bDI?vw-nA7WW(UkWN4w8?UM9^LA+%ntIhsjc?jj
zhTloT=?Xhnd&<H~Fp}<9wbr-~{X2clmd7?TE<xW5qTw5&fCxz>lOEF^w+Js4mHj^g
z(2KF@o!j|HXO9i5j1|4_4Zh$h{caCbdE>@%n6|@U5GN9|FAkR_PSTU}zP)JjC7SLA
z^A6X>JiI%v;Sn$>gdU0+JT&EHD&elu4Yx{P7r%bp#A5}L7KGx=0)}O__J1)~TR5!f
zhVfoUq+r8!=igAHNstN#5fRN&@3&E*<^0p<DuVOKT-A374Ae>v_lauljCdZ6GhAEc
zaKB<(q+MDaHKe(+z{qFhM$|p{7Jaz!RWq1?C~7v-r8P(xS?7d-X6H>>E0>eter(w)
zr<B;Gik+8{uI{@TXYgOCP#Xvle`wIw_<51Us*>mUNu5QHa4`^X=!mS8NvjTSOs&x9
za80zT;fThqfs~6-$L*wRxveGc*dU~GIIt)W?DrW}rjrCmh4<j0JtZF$D;)bw+=%}R
zl?nb|sEo>^jIhYmFXQ!2f9Rt3rQa-&5D}p~WgMD7?Y3+pJ%yN1^2x>sz<>1+)a6s&
zAOKn#?}%9cd^1)!M<JEFn==<kInFn`lr|R3{-Xhq+vU`y>RhUgv8hdP;#Bt?E69^o
zf1}ZQiSo*XzeT#DJ$f)V;Ae65^?CP?o>m&(=QRqA%l#M;xrfz%YXL<3J%4rDZMCkt
z<aG@ta0o|^))!}${lbTM?vnD~j*H%C&#+~i5K&!e-H!E=OfEBw_u}PxiSKn$;WvDw
zYHe|aiEXf1&4v+?ymBPHWl)p4y{Zz!hSY@;q(V!Dqlw(~t+rc{Letz22b0dZHSue~
z1?n@GZO~Bt+vqowBbH2d!k+_>x-Oy@zS7~`p;5Jmk0kRsqt}xN#JB;bu`^l<Te@P}
zLoUgYSNiPm4{eO(_J(BFnxsyHOrz+@mq$+T_?yDa#GaD+7sd+P!;qV7-EXB_r`vi^
z1fU7{g2Zn0QV$2s@1>3=WnT5A2*8ctu3#fO6Sp~Fv^JW>h6gk`$u9R+JI{g9%i)f=
z5K8*NIvP!!q({I6yeZf28w`oEQ(b=<Jr*|9eC-LuysHH~8T{rd&eiAnjoCo>#wIGt
z58BP2|Dcw*)!}9hWSEKGDndFvOQss>0!;$OY#mDWk!7qlhP=+X34JS#tCw1E8N_kR
z>7Q`kOacMoY>D}bc-BifbpuClCx&+<{%G2-NX;mw!|qkPZ991tu8F>$&4YC^{TUK`
zoKO`E5$Sg6V}zdfAzeG=vwf8VIF+biO|T}H!r(VrOy-3X-*u6Tzc{PZTB=D%N+LLo
z&eeYE+6I9z`uD?CKackJ83uVg+-d<gZCDi;&iNZjoN`ee3WpT|(o8?{MO`O6pyyq8
zPfu`R@C58Xq49Yoq!=MNO%sbiZG7!jbUc>gT(?tM;vC6t%LbL(<5c^+j|l^uFz)iJ
zP4Ms)%h+?!&9%~Mum~G{p|R{yudu!+1+?+tXRR5p=8@jbRj?dr-{#U}8L#HQuKG?E
zWi(1?<j%S2ev<JCZ*%RdHSaDbyUJqY*;esdgN3XS<PY0sla1z67+_Fvep#}!W2Aa@
zg;10%e&hHq{+}G)Tl2B51rx?Y{`$alGf%23=kFWQ(7R)sR)dsYrCNgT(lb=Fw1S_+
z^VM>xpmC56Ln#yv?{@^5rS6ncDcl+Ug}*53F|+5{TIYJsc!7ku@mzSq-UdG@(5?y2
zt*hQOqf4rum(FYD;R*SEnfHA-n*y7%dj(q!7oMm%F`W0PSv#D2#h+DD5WYaxWP{_w
zAvfHr&z8W?>9(Eu0w621bE=}Xz}HzFi;{MC$&KlDZ{#}f`2cf#9Km5pB$d9O7rO{!
zvqTVR7&~O4*J1bYQ)(C4m8+V>Pmaf)FgOk0<zGuMSv+*YaqkuH)yeB8hM5W1HRVGZ
z`_udTo3;BBdCxV5`x{5czR%~K+8dj&ks(*xa^n`8<rWD$FW`M5_s1mF#_z=^OlHDd
zGvG*|urRrc2**%XR#xS>DMf*@6O}A5w`M%>!odKA#erPu*xsvB&B`2$iJY7<3UVJG
zAFW1*?6u0Z{vYP!8>sPE>?g2zfS&|XJL~=+ZB~O#Rg(waR6{Ey!`4<MFG+C6GsKXP
zik`iXD26&y$q+8QkVuQ;2H!krzD#16Uub!)g+Wj@X6kJ=S7o2IN9&n#z=ufpDt4&>
zpkzd|t1r5hmsdPYB94~u{e!feh$J>MH$1C8>Ml3)FFMjNE+%(a%JGK?Z>+TVz*dTl
zB(&Px8Owgbr5t3|2@`3G*VT5ZP>iSsZK!|v{0HOtunKMt1HL43eH`!mnXJ$Xyu)e-
z+s)LFt#nzRPD=#mFqNwx_Yf{=AdGBcS@y_cy==0cnQZc5!+T$27<>q|(5$<lR@%xN
zVf_(;CRz+Q`AFjtb9A|9Sm18vwjY#zgj_vX8g^?VcIx!+D+os5DNhCOIZu$lmV^m5
znOD~8ziqF_mk{|@bLn`~jZ3L0SSN@toJ#&Cv61<f6lvk5n3|mhT}#OA=(Feu0ml%E
z0=@GU#N*Q*+X4=s??{NpSPZ>FDmi<ihYg__Vv`8V6HD7?LkT>&?cDb|FW2BQE_CVa
z+Sh9o$WD#x`~}-&^C09j`7LjYCG-B3bn)-4v$G34`rpkYKGd-(KVUw~bQTnkA*;?e
z$Mm3{H}A_3!}}<r7Bm;vyeOODexAD_|MGK)D%2#5(liuj%Ci=UTXJB{tM}uBJVmd}
zSGw9K`jy)Js%QhM?r0km;b0<dWa22@+Sv~h1je#cDW<z!fv0-4_#KlebUw-NRL50%
zxIjH$;I~UYM1<BtJePk#F{t}tFHp?9x-tlD;OOI~Rj8jA0ioG|!@r$*X@?Xl$@ncz
zpctrYXh_Cg16VG8zCL8A33f0*g*H+`yl!vwd2BviSc{@it;aadtp|^Az+2k+PXYeH
zkS<pE#W}u%gooL|TcU;QgI``P)=Z!{I|bsmzHN|-yvGmPQ>37A8|o>je)ftdFl~M>
zAe!cp+AiNpX(Hhoe^#DK`_7!uSGO(=tZ2g*VH@C5borqX#*;<2KYplUP>jG}BWWK)
zfK7lA4(a|H##73H9ag<6X%-1l;XZ`dnu8(vo}g^+hoKBm+X2+p)QhANbT7lCSws>>
z5&3>jQWBZ5VtRjZ@Q?VfVV^efX8AsS@VdCtlqzO)OXrWw&~N8B=_8R9{$QO9U1K&J
z<l!m~>$p=c9m~!~t!|3vcru0bHU;1FuGjaQ_SnA!Y6#QQmgNIrm-`hYE+;m5l^$R|
z$W)$1LI-;@<(>jJCQPoM2JNjz<D|%!my%Nl@2i14%_}0x6D8WePZZZ~$Zj#TRXL0E
z;Rv_vTmI@=00OBF#f=~dStM|jeaE;jwgibxs~a&NWb>U<Zj?6mhq$KE!w4VkfXYf|
z2G3im*sk~=yT3~GNtn{!=&K3ryby(?Z$s(>LsDRn_!CACc^%L--6SagNOuRBV;Pk!
zUP2^nhTXsg)A?SE&Ltkdu?sZY^%t)q7UF;u4w?Kmt@Tn>XLW>>_JbiVfRB=c!G{{8
z=nrP#&QpBD7?MnazA{MRF=>$tG6Q|iAQ*yQ@8lvQ+!C9WWtE0)xx%AUd*0Td504(D
zsRVIGIv~)ZBJXss)x2;pg%;`)WXzB_nh0;K-X^H_f4PAMvN%YeG}%J?zB{7Um<OGI
zHoj7GJIO^dyIh;j?P?o>8(cKr*f~PzjFYR~vyc<S=R(5k+{l1STIuaqmumrcx3rh@
zSGQ;LzetXKHgA?O)rC$2hD)mUNUlN-vlRpu+=wW4Y5I}9iPE_uab0Mj?1@letHTib
zrsRjTl#Dd=b6>ut+MDW6FWVZ#M>6}ZHOhaHFHB)A0Y98{Q4sPZMJFjthVOYRT9w^&
zCY(9n;Qw^%?c{Qh31CCJZZ;&1;y06v#LgdPpVkKN1;_ns+i4;;b$7KY&ET3hWbBBA
zECyZ73tXB`i0{1f<VmsaejAemX~S(4|L>9luA)zwpVl0dyWa$<cA)t_Mz`XIDCgbl
z@K|lMWrHzcdbF@*Z^u>W4VD_m<#9XOOqxR|V$uz@EepsmgiL?OOa02+f-n~FY5mVB
z=NU>e<4ss*c@LXs{EIM7>!CEhqegPGw5=^z87z7o{)Fi*Kp*kCMEP6)TU&>X2UtPg
zs<|+GvEQM8Y>2)txO9(t-Z)S=aXNYRa!NNp_Zaw6NV|ydT})BIt1DcydeaIWhy<$=
zeqOer`IY*PEnhu*MCnEEEsu`J#;m%bA+)2z=q5nzD=xh<#LpyFJbmmXdmxAjykAs5
zqHnhi^IvEHzbL&pb0>j9iEYP5P|4UeIk^@=fQd;N%gj=87z^&|+?K7{%%>1!#&;#R
zf%;3^v`TV7C#HF9U{6l7`grRDh-m$$Z`(6jU@re7pc4dhNXnHgNSA{Ff?rUcu2SXQ
zu-g=Q=BBwMe;;#0hmNc&z((6$LBy11j-g1DfcP6~gpLFCHx!A<MR7PP+Rt)@w6Qc!
zk5LYxM)NLDn8x(jojIx=>a>P(jBZ194PDp<7(iC1HQ^sw9T2SPWmYX1H=JhD!+br^
zzrTxyxX)-sNff5)D4>)kb{Rfpq1i%PlE@Z>ckVJ27$7c&I{uwSkPa6Ua;1hnrbzDJ
z+{+LwXa2|cWZ*s0n&;e0V?psDRaG*?Loxp9JjN#1a8Xg_vp^8=T^8_NK%x2elr2$0
z_Z40#Gh6HhHxba<J@Tg?{)p>xi_gzpL|4eR-QK|9TxWIS15{{C-^Dq%{3AW7KMAK1
z|FK-9P*t)llVF#<N217s=#4@gN^jx@3;HYVLTUSTifRcXgW-0b;}vn84S~kzTbY1E
zvSA;qO7I?bm#kN*62+P>)+Hd?9sTnD;`otlP_IS5rj>*x4&I@hWjX9e9_g6^^#e+c
z_o|Q0Vhh^0(bU|}!A|F#cFQfXh_(V@adDq?c))F_1PO-)u3OlVOwsU{D%8wGabAws
zx(A@FCKME!n%o>OZw!*$U;Tl{!^6X1>|TTMloceW{kT)c>%12yh^rZskV<o*;Q(|Y
zuq~Acq6XusLI=6Kk0vH2C@*_vXEmmq6acB<!u7&LG5Ip|Qdw<5Y>gTZwpV}EZ8@5=
z>0Z0zVs8~CNwA8@N=$Gq<)MY(+c|mr>Y2oo-prE0UF~23rEsjv;}KU&gE4f-b|Wk*
z&)nhjl*h8b_kY4q06;nXM_vbYP!8!GOR7?azuq7tGB87>O5wq@9r|m+cxkeErskm4
z4)+xaM`Z7p&p8`X?oGG(Cu*ir%>e1$Mz`c8(O{gH0r~(H90NbrbF*g|3sbD7U#KX_
zkr*Tk#_E)xbsBCUq{cE>#rV2u8;4WUh}vN@ero0-F$;Oa%^NfK{a76R5N3z+r>C@|
zizrq=ZrpHVG;6~3{PCZqZus_pNzT}5I2=sq)%HDK1a-swbUtF}j2eUxHqA>s&<z;m
z*4-INLg4SoaWmRe7gndsvguK0^+^6;J&S-j21=|t?en-h?ZI%%=m9e0u0?;oJ51x;
zz`{uQIH1%^pQ`UbVV{yWT(GxXMIwM|7YJu45!-l~JNeev>(;M%mb*K__?lN!i_4x-
zZ*mEo$Y5VfBcAbA8!;np4KZKV+38^4Vfuzsd6+jLA7<vE@*IbSL|@=X5%J?wdEUtX
zavPm}hm6ky$u*obfGc^h<(L1HjlvMOY*CxMllfSHp$mf18f4JEG91dKv6yeg4RR`Y
z`-D@gHBMqg3_*xJbn9ayJ0vp>s~5_0jCOX4TplgXO*2<jRiOu^(6W}~0mY2IY@&wn
zLP~Xaktho-_(L;Lj^Od*$?vqQ-YH^YJ2ckhe3pdcjP|6=Ev*B4j<-d8$k?#cXl~m&
zz%Su_ledKLR&F1&r($jT4=vL>!_yp=qhDn09z><F>6nBDGnMee+w2d9D&Yv!{0ikj
zQ^z7S=O0a-pS12*_X6%VOA)P!O=f@gFluarlouvs5@&j_&kCrSfLn^rf{e8igR;G#
zPegyduW01CnS}T3wME|Zv4D*Wp}(#$HAy8?wEgi5A^^{jo;G93DjKnGID=8S@)RQ@
zr}+w4P*sMGEOnSJqBg<?5B8?Yhy9*3YaLvhsCAO8Ezu7?h-LFWf@3q<8M7oElssNK
z<eQitQn>u1T!>5f3-v9QBg-lQm3o`yxqBk3_TbV?M%iCWl%jbhf<As#chm$u{;S&l
z*XK3(9puV>xGfe9Z<rrfcWT_HK1O|S=?ruKH2nX7ls~wm4vD($n!k*<r9Y$Dpq)yy
zP)^-Px3;CId<(O##ad{Ua-m!)3%ACO*=jJR;ZW8(IR5)1PKT=48bo~$-}+!4g+}Ks
z|H*unxQBFI<B%&!8Hnqd1WQ5E2HnVnsDozSv5yeOQwST{`KgPN>E=v=^L#kMfcgp1
z&Rjp@Hs8G~0Dr1O>EYx13~O)+(#0i<$i$R_M7juJpG66B`tOvaL14W)b~36!&blf(
zxU_ri%?uCZS%JMFy5P>(0HUzLn@a1nz8IVbB5!FfYWuWO?2OqOeZ5-irFYZbxNwxv
z{yFd(p_EEYRVA{4VLX;3MPYR4kJGKxox~Wjq=;%iOjuum+I`1;f_U=lgBdy6r7bBq
zj@Guec%U<_))2`S`*AcS+*&p(fM{ntleLwJ8WqXT#2$q-mXB##7o<_DSms;0Y)$gg
zqH{&hC=)Acab@Ep+tr~MN(ZKG*&Qsj$-J%KV~wJPm04}<&_gP}dmL8YfxAwlKl|ib
zj1W6WN@xGupG2aQ9tTd0_QM<LXfa2Y=Si+QQZT_)r1OEshX*JxIypV6H1v9wREes7
za*@W@T>^qoih1Mh;qGhTIN;tYfW5<RbVMsUHngkDsDdA6?<Thuezn0?TXJ6svH`Pj
zo;<wFufF_nd{e9rNyRWFPH-L<Km0I?;b2gYY0|7?lqD%Q;gzaevy2=1YEq%tz-)u%
zJ9}blGd9wQG^@UHhgleP4p(v2O^BPX&UDVQbNP!FRT<uOmP4|Tjvu1em_#z_a!Zy?
zJf#=oFfov|u~b1{y1VR;Q-m8Y_N5>5;)cXI7L_ycoVfQBL0XL$Ka+cEJc$5?3GqpN
zf}&##E@j#Wcq2}=(n9A4)3TsKyX&(N8lvY(@ojXYbR*l^nuT@XIZZ_Przg%xjz;-p
zE_kdE<Zk5}qGIHXt(ckkMMu*aC+y)=X{&Fs=|?2!-g`w}q#dfo>M}MuygWWX7{^~G
z6cbEnUQ3}35i&0?M%Me|B+QzakHJg>jRc(Rj<;;ce+YKdxx!kVG;G5=CtR$Rc@6ZN
zI%=E}x&x%{ZxNjoi`%rDYLa;@q0V<_`$06M2>=;if_$bEVeqvYJ#Q*r&E2xN&TT&5
zK|a$uy&?U>+{cMWjh%|XTc`Y@45NPwPiejf2w10n-{N~7Y-#t*Mg*siV`1{u0+a>L
zqx$%62up)0EN>sDLf+B~7Xl>aH}@;$HDoe^gkP1axX<-ZA+8JGS1Ead$?|it>$P9M
z2-HXefg15naScSQkz3Yhr49<TbolWMDzu|7h4(8}KkZ~sPKH`GP(7AS^VJ)F%jflQ
zxx|84I2g~vZ*DuRtWE+Uj_-r0iHR{!w8r-BJV^UG-+xm*y{)uNx_p|V8%%u*KRIyR
z*ng6{^9dw)%g|`;Iv&?3YE*fh3XuC-Ev;tfcGFtGSckanFycMA&vS+o*^Pis3dQDJ
zZ@z2hE6t0CG%SKi>yrlhpYH%-5}dzhvWKah4O5E<)L(Hv@|cxF;e4dCz)^fxDiVzN
z-pEyLmQmTrH9%uM=>IhNst7tzFX8oGXoh(z1ysUDhpckT4al##y4)KGe@9h+&_uAh
z@d0c~h28TXx+(vNXGYPZ6#!{0%p4WongT9`A+IPlTTUeSg#*E1JmOUN0LGM%_5Kzg
zoXxW*g{Be#lfsFh9UKd2n*Z70?xjKT#--&S%-hNr4&;Ay?fdxBwE<1h@;wMIwKP9g
zX3E1ef+5y<b^u66vmtXM;RVu(%Ml7;fy8;iYt)Ns$KSkwLGs{2O~6VDmc5r(dwM?9
zgVzFJflop*KG(N-uIjmYPjLyRq9Q}QYX2};h5+ZPtgNE22tp!mCUV3aLs%7{A-}?P
zT~Yk(`_UoEb3K5DY}L)}WaMISOmXq|r~bB<le7y`NcD##nDWk_ud>AaW$#%PK0x3+
z(}=#l<bWztF52j=4TgCthk;Q(v!^Lqc><qR+C3koBV=u?$||=#!YXI$FF!2`U;(?Z
zuUVh(k+Q_vnje*xzC$oRVX0!9yh5N?hDs`gqj#7!9)3na*c#Ma>u@A+M1hqhSIV#D
zJw;4wPj=##B{yHs`OVvmuRVl$d!Ta_Y^6~nbZL2Puzf3)SwOXuV~#m^|NVs6;E{~x
zZ3{d*2?ZpDKWm&H1Y^611>B@01P)xz9&4ilq`H^?FXX&P2u5Uy2?K{zsG?h_Y=U=q
zkm~qhIUT3m0D21!z*-K1No0Y9RHxSq{LSMFscxES^Hrz@f-$k8>oBzgg0V)aUX~0@
zgY2B)^{4>^&Tl#$t|%ryL@o=JrNFpOymulHI0oczp!X^L5TR8r@s<ky^EljJ#v#@f
zZYKsMn*_%EAHF9)7JN^>HQW6Tt6#)nLOG!nu1GLpE&Z|RyEP<ga=!>x^b~(*43S`e
z`a2{$wf{Vh)|dInUX$RVfXtTzWBwo4^MAi*QW|{EBv-Qc1)hlH^^gV%6}Xcq+SoVb
z)TgkR=puc1uSP|hUuAWRU_Zh(F#P9nth~&JvO~_|vm#W3{i+neB+h`J&CBT#1gbJd
zfG$ongIa+hNGvvb{pC2At3(552;kBnY1hL6sGIKFvrWg_Q=^B|9yB&CE=fZ}@(4WE
zikX;nChgi+Ao$wv4-F6O!Vv(K(K9uL)dZ;gUm7y7Rsez#@``HArK{ebCIGRbISc(_
zD5-kuV6Ue3XQmk#+xdXH&{(6uQfOHmCi0udixb}}<5f|>*C5|yc8H8-`ig;?1*7F!
z|0O9D0xqC1b1W=!*wr)dz6Imtb-@)?`aU={n6Es#?3rxU`wqGNwZ<RyQd?`R+Onre
z-G-ZP$zC%4nCO9+T-6~=3(Z2@!^M;hAh`2ok^XHiu&6pO*9lvxC;8)6@N3}~juz#h
zXTTNWe8RqGVDj&uIgDm6oa=PK(NykIJ*;+DZu*-kB_~bXnYW*HC~+&5I&tnE88xcN
z`3ZSKtqoppJq_L^z^jNzMT_)FPTH$`LCxAOOIcIF%L6d|`4#-ucq)%tw1oXa)Zi5n
zNBOwiA4cN^b^YgY;b(FVBPv`;$<6cVKlB=nulO4*gH-~LPQ{OxzQ<(OB7*D2tJI@<
zTRG4?suNE&z++)Mjr=q=Hkj16VEEaDKX#!C5=m2Xouj<cSQ0V!(<1jNK0mex$HZS6
ztGSXSoc^XJV+XR=`NhIN|CRuF%KhtXe=~2d-AcEwnl=$pS7y89`R>n$CW`Xt!A4#t
zU4rnRbMp)IP)I-O9o+B>t^{u%V}+~eIS}I=|2Q7?D`4lWVsA>JtnY3_ed&udW3bPE
zkC-K9NyvHnw+7zp{`x3BIeCzV-Q(O8mGGT0fuK7ZJZ|2neXz8gF8|EMX4<W^671~k
zsDAYV%ZDDG3Y=i+lFYdE@BR#vU?-{o7q0Uo&)QUeB&C&B(aQd-v)gTJ>dcNXE8(xb
zCF}KrkIN02dFh}`)o5?>eXDIwA?GkQ3;m5w%{>HdpS@_dpogJ$Ifs^x>sz8t+S8*Y
zeY?WTs0F_WJp0w0(fM%q^8>E36rMg{?p2lES$2@`+i&G&u1&ORR#HQK2SLK&hEX|w
z;jLKi3aRn-SGkP1zU$$E%Vjb@Rv*$<=!a!(UfEr9`(=L@Bq|u~o9TnXEvz~~(dc)G
z{qVnbe|X@#b361~%@FFVe}q^0p(@!s{z|msgcF_*ElmjJXFREH`m%N^SbB@R-hUBG
z5*eZsB`?lq;Qg$2N@kK9EfCr)b~YgT{M8B_6Z|+go9i&%nqjunD!)gOu@&h93E+v&
z8Y0rE6#V(N*FGRSqoeAYea-s5+H#0;YY4_P<%bt+!0y=3tVxidJFlsMambv<AHT@1
zW$6zc6<ZN(nrL!)eMl8|(VyO8AxcK_XJ>rd&ojgyTPq6~gTa<Zf8I&IU8vfh2%POV
zu~})tsw;gAVE#!}14Ay3$0E^r`91GKkT`4JZHs>Y0ac!mr@#3$_%_7PdGvB`2&;B~
zDyaeC`nvZN68cRkPNpW2a#se?)uKyhE}fFmR4E<l<idPnD|B6{X3w|xuQ|N!*d!HG
zg~=eNKIT=RK+)eWkUK2q$(Zy`aPAU8O@63xyXieZDIQ0EEr&$R=Ygncx3u;cLuV&C
z(H-m|!1VxLyo9wDA~$Sq$GW_{yn}9K2>7~my-oigXKxu*$G`OX65QPh5Zv7*xCM82
z4+M92cXxLU?ixI}dvJG`Ak+NMGtWIUch*^R?<>}(_paUj>)PGbRiFBn=hJn^#L^PB
za4>vtsY1c!<(9Cn_t6YlO%@%b$XXs@P)DG<TqY+9p#Lybu2M!=42)n0YloBqoHrmY
z4rOw&LJg_9x;mA^hT#5uef002e4Q3hh#BWqH(`iZz(cp1oxz$N)eZSU#F7*jdn^0V
z$0XPMatSaGmrMVMH{LwX<27V4quF@B2Q<%vQ|oqlASHz5J^Jx!$9L*n(!J_4!bPa|
zvRtl4q;N7%;62%!y(!#GN1P~t0j~51MIrQ$3&^NAVu->#we}1PT9fZ<#@q&MXH>c|
zH8A2ui!q?5Or1e(j!I3;tbODC1#aIj;VO2aH~Q+0Qo5boC)R0ka~ZBCq^GXmj;}N~
zUI!5{YkjNOVn2&nnZ}JmcgQuVDA5lqt<wZLD;^ct=(Z11*t#R}`K!+-Jk#J@yC~d_
zi@BmvlsZo`%$S>lTyU^O8V%>6ljaLsW_O5iEb1|zkd+wQ-mr+28t*}6)-sKR2bE_+
z;9Dj>?VzCGg|t98Ovm#PYrtl6<Oqa5LE~{ig0)#_S(p}ecYnustg9dL1|`NGp03o@
z0mfpCYx#b{#)@ys=RC`<yPGNA5ctgFp=zBn-y&J21gtizJ3O(WVXe0UrzX41>nrrz
zotkv|D~+ifw7~oMx>NbSjk_7;Y$4Ur3j+PQw3yw>7b9*PE0ZWAvkBYSg72>lE=i3U
z>;}6_Ab+wED1BkG4CgC^#PxhcDx-Rziy}rqE2wg`E>D+JvDu;ODP(&<K${%NOi^^(
z1dXasq&yUN8>h?7Y(DeISOy40n;M_FT%U4byPQRbn~WMxK0ASj7j?Nrr=j}eY(;EZ
z@MC`>C~(vfiZcO%v%(d4hZ(hMZNVbRqy}qUv{C>n0|kKCz7qiU2?nOV83Hdp>+1*c
zz?{7SA|)U6>!09Oo0>OTU|d{y02b|gqO+X$%a!=;@jRU6LZyMI>+K;5ESk{Bpia{d
z9Gl5w07e@>NqQ8Q`4GN&7qRO8l1Qfry~;bI?Uy|br@!M%RVvJLFdZFGuZ(7(j@`u?
zuVsJ@%;owss+I?%oZ00-xJBimui41lHusY*hK-sT@@hzq#G+q+j^?IbyLvY=9YAJ`
zi8a=j(e}bIdhbE_HRvXFyT!a*eCDY1Fl)0(_O5SnOl5j2sV9PE1goWK8SeEuBD-b}
z^nJ^i2Jd7&1ZDWV5CaZqeG6J~Tv)#GH=$0>19{u`SC>SlW)X;$tv}7Q^A^EJyGIdN
zk40KGb7njT^=604v(q;R2Iq&c;uYE0RyGvP23`eC<oWbpDbg3pgARV`=1ZpNuKhM#
z+=j4k{|;^{O(eggMu_BSGpk9jW-kV;$Lhm{LY*CpGOZG%ID2Kn{B<C$4RvaR5Fo@I
z*W#I`{Z>2X$vk@xo9#a>8@;>06w2Wv)??a=NvDv+u8vr#MT5lT_692b>_o6H2QP9F
zjZ?+H7YzHm6v*s~TNb!>Lf+=7LyB`)B{p8(F0&-EFpKrAG{&N*wLOukc@OiJ90;cs
zi<N5Tfg%q6OsSxlg<S5}aH!G0CcOo2?I|p=zoMNd()L6j5b<jgwbLQwi6W#KSZuxv
zSGb<FeHP(tva07DqWEDobyH}NwX#HjPnKe7nqAvCT?13DTInmCfx25h;;{e4eE$b6
zd|KomOiXb9%AkS^b5N2s=){_oRh<@ljHuz?C01}o{edN~3&RNL>A)pZ2*b>L_6<-a
zoT@XCvL2TQdQAX~aX>T|MtNyv#SqYT>UcqV=6t$ewP~y*2H?eCg0QAmy{J6RwY6Jr
zJUl$Kx*e$pa@o8v&QY+p!uC;~$Qi8P{X;{cy{#biS#AD&4uZwlwn}>W@X4~(hbf~4
z(Cu*ZP&*wSi?X7dTelYB&DkrMF3r6oxqQUW1F1`{;19?CEH39LSOY|Kxx`)`&fW({
z4%Q02*AxLSu@MWIxbc7&CU98iS=v%QH~xse+AYsZ8v`rZWKVO*$&Q0nw^;c06io0&
z8P88>ig+Aj1+LDxSpdjtnd{WI{a7K)Za_m@95lE`#!FqSAaNRSu;(f}*pG<5J26at
z6=>BS!D0J^K|!x8!UKi1r0FbHa|2D+n7V>AR0V}(%f@#`qEg>`9Vla)LoirHg*|2W
zIObLpv-;fcrPyTrZM@i=Wh|~eus=jbm}Fbca1#QIt2#dHJuXQ~zT6e2>R$4z0-Ag;
zEv}}<Lx|2rcIy5~K@lp+%2tQd1HJXdYJp1j@`%Ybk&XFsQUHO+VzrnoLeFfV^Nd`)
z%0#k>)Knm!A-3yu)4PCns~Z{x5V}M{E`BrJp~=&h5rC-oWF+f?_OPT0eEe$}woxj@
zu~yh<cW^0KWj~&P`PF@UxAkVJ$({>$HW(L-LGz)OeD*biv(bv?_tZ^b5jHSj3-t@P
zzxLOOS@F`Mb^TAu=CF!LH)Gd%CJ)&S?9ckR8am&LO|#lJ$u%4{zIuz)tJ6%<lBEvx
zH<c!t3t@W0cbKowhPOLq%E}ft#<k(xV`=Es^m8T^HZZee_I1AMFP3l=Lq#TpWB8y8
z1Z}IBV{`OCGk11$JdQJe$#XuN!?%*j{WUfg2^2F^qEmKB24`9w4mhvKN96#%%<J!c
zQq>pMbzWRHi~cY+4W2=R>1v&J>DS=pN4!wzuul|{vKBzyR=XoyFe16HRz`|5<NJw8
z&x;ACfaj+Yif0nD=+E3L&acyG6E@Syp(qFNr%_jS8Fk>)*o@3xqt4b&y^xvn-B>I0
zmBkJ}$S})4rb_`lcJO!r(6@X0Ga#A!IS!+ruP&IAp9Y+(d%T4`JAPgitgdY;N&4G{
zL&)+LkGlf2Mvku@2Zh0a1QcsQmLt`xD0ycR{+fKZkXz-IZE`q<mol1soc%4OyW4ZG
zkpO=S(rHOi3c<PVlGh8Vwbh^8I|C{<Sfa()vR&d|l~m-k()EM-cYj3sk5(o%EyC*;
ztA9C<flo;F3Lrqr*X(jEVNTpCmL(UG=MuZUe{#gz2f5f1-un8ZG&!91G{kT*ug}%?
z5TtAJDN8l08chp{p>j1jbT5x6GeoF<9LN6K*#UR>jUwa8hc(t@i7RcW<;xD-H{i-9
zLEgMs9T3vv(Qo@0IR(i{_v0+q{_+a}0e^TVS0h&x>DO#>--et7xPwf6RUG(S{qLEp
z5-q5c>D3Jh3k4w5j^D((e>Yt$M^pzu_6>ape|4Bk*FN~fF2N;WxpNESZf#u09va(z
z0Zp;?MHhB|rPq~09rxfImc!m`lD5<B0kIf7mazg>CM98Pg{Dj!cuJm0_M1r3kdx>U
zadqW%kM&9EM*wbIH4<OoQ}qi|yI=3|Qj&|?p?6ZDVPFJ-K&}-I%97FfRGpV7KYw|b
zpPWprW4YEy9Gw(Xhl<JegHlv)rgw6Q%GxNzf;BbBoBLSBqcI3hWF$WhuSi6TxMMWR
zqX8;nT&>B>KI?7;%4B|$o$H)H>4(ftXpXQ;^Y%pv^cSKBaldetzcGMnTxZMcE>3r(
z)?fCQwhfe<=6|kMB6a@QlIM7Q>vV45h%&F7V|xB{w@hvPoFD_C;4EI;wnwm)!e$Qs
zV>P{CS5jp;H7BPKV=E09Si{GI>vbfbxf?_Q4pBWZ(O=zWyEYd~Zd}=WNg|P28=A_m
zfGq+eLk&&7)@_n+DH1=%uJ4qo!z_IiQ7KwS;0vnrS)3c$42|@5ll~qi`C!fY6yiZ>
z(d*(Nw(M9dGbM;sC`eS1L^$lGT=7d}i9d=(9f?%JaCqNBe!`EmJ~)hjF5H9oJku_P
zc%b5O9+SRrnwmI_zrpb0n?^fOHIt5H2~hKN_f)OqQ~yv*ppC3IAN5@C^{-s;m{1>-
z=>tMLTl>m-HcNM>aYw=5+C~pw%Yf^5)M|pk*>2<)ITudvn%_z2QyT*qc%i2{+c~kn
z*<xtS4^};9j3-2U*0{0tAf$*2zH@ZA*ko~I2?P~`-vM#tB!nfDIJlcf&v*Iqh!ob<
zH*ndil0!k%_dsPp-;4ka?4suz&f?(GH1A3T{kF-z^-Ru!(RTHE&DlB}3kA42V%cK{
z2sQdoA*T%xhb{dcP%s+q*qA?nzEW#rAboEB2f5nm!9mfMNJ~ADu&mu^QO2_lP}G@y
z+du|{k%?(*OUCJ&4O-f2qxHHb96|~w12GASo2%l2+^mzxBImPiF?p`xdlDXYi$0Y$
zFq7kQVNf%lu*00pdAj<kw>JARP8WQ(<Ved!|NI`Ewx&^RR8P^RkKa^*D5{s1Nu5%O
z{VkOqfBL6}aGB(^IB-WAGxXPxmB{rkHvC~WF8+J@h7%Vxl+Y<K-*~ru@{lY(sBQcw
z3VZaOffv~yxUf`~bmCCfQgz)f@Dn|Q78>d#%HS%a#_^#&G1yVyr@iE`4c-=Wy}u=*
zGaRYKqLF}f=?rV;!RO2dyFUqS=oY&w4&LfhbNJ=k&5ZB4(+Cd}EhV<844#pjK8Q7c
zOAMr!l|pK03Rcw3PGJTIFu^>v70%T$ZiGI%hNwme;hT(rD6EFGdi-7>c}ZYl0YSq~
zng~ycno_*NAxYp$JxOw(&x&K#4kMP|%6=ACXf3TVEX7iX7*CluQ66vGFe|^_(%p=+
zTEc#ALjm9}I>t=XX|xoBk&c6<j_qq-gAs+d&%d^Gxp2T9FAcYSTTpHsTd~Vx$YH{d
z<h;Q}ssAgJ{ktGIFd7Gery^2S6$rlv!_6?!#_SE@HHKPB>idsnRXO3MTfA)vVUM)&
zT;%Ijw9u)Pkx>j-xa`RF@W3r<ONsJ68L<Qwo2+4Z1@ml!TpiRRH%plYZu2Cye38Nh
zT#*#UZcYm3bfqyO0Cr|KwGmv3Ha;X#eOZ*b2v3r!w4k8Cjmb#CG;a%-QxCtt&^rTY
z=<C1xx$e_<eqqe@yE77i-06{!>({7MXL{nEaeX+1xG6#6E8yef<F$Y$)b{h416S65
zIzt&N87Ha;HZ@i;C@zXRugBcJJ!|J=v16Ul;syGOAZ3Q+_Re?~WsLstJD!op>`r&s
ziz-uUVtZqzvApNBIAL{~GKeI=?jbWN<MV<8w@7*=>|y6mz1V9D=v~Gtd1-CPE(28C
zH7$%hfeT_{i%8>5>29V$N+u%I757Q4v$gJ%pB}5UqaY9iri)b(T8}KZX-nB=@DRd2
zTQ+*&j#R7(_<aOTDZ|tgu2b^XAMrn{5)YIaLDJ5BvTGKDH!6;4PYn_FLVd>C9otpB
z^5GhSi6r_^9)?t{qcCVkDD?Q^1Sb8$cfv0Rq3^?Ue?9>TIO25Z+qu|}70`cC*74}E
z)As>yYqcl~u~TD2jMzXVoI1iJWiu5pS(n9JtJ>MVx1vm@H{Q%YY{bT3MKQ|E+7vqx
zmNa9~f!yh3B#ZcrnXmlemjgi+YSS(CWSKvph^I){cxwwu26cKlX$i78gD+THBnqEJ
z6)Lvay+H@t+InOHpyOIWn7rXI$%vzc5{u<POC=akUU^fX>9Qb~<5hx67D#biAa-h8
z9rp_-4#YT7&f63MQ)<zzEYQ6sC63^|N*KK(RK><!Llw(j=sQ;(3Cu^=g|Qh1ltEir
zxo8TVCHaAb*%7Yt(~FX#B3~Gszv!{P0)Mew&IH*np`>K8_iA87bG}};^2SbJAo%%A
zZzT($r>D(>>jTZj?mHZwItnEfGXmioXTol^f)30P-!vH;4-kFi6y_IT;}48C%ESU%
zF*|g_K76Ue^DhCyAcPqR954?T%i;;bG!)RKIcdiFssEW(hI`(vQi$;LRdrv@>#1lz
z0oNxjd%ExP^mHo`tYS>W+G}SA#SZXA7(iI$Do7aZ6gE|-ktC_UmA)_c@;1q@Fg_yO
z6h2i%g4sy&bgSX`U0H8b(I3S&{ZVd{p6Ktel}Pw`+#idb$40zEJ`+etMb_9_+-U(v
z9Vsdkz$bM(yn}uxe>Ko<W?w)pXiNN~<hsqgkBO7-CvkU*-DrZRT^#&t!y7rX(tSkb
zfl^3Wr{ayVTnVmrwpjnP10uDV9CKR9Uth7iYfZKdvc7>6uOI_L*Sa$H<DvDS-$7-e
zg-nyxA`}7cU=-I?JkC&()gqk;H*`&aqz@W7V`k`EiE6Pr)7PDg$c+a1F{12*CAaSU
z`4Hrk%63PDeR_Kn@%X{e-{b!ry=8%8f+=I(!w>?xg{tJm#(T8k-LV<4nDg}ogjZGL
zy10H$=t+4h^``bob16qJ$Jsjet%<<%7AedtU)=#D9Fv967bDMpMYlRyMd?~ioC3dL
z1j-$$WVHGe+JUx#E%Ws?iR$=gW~qpZzYo{fmK-*{9q%A(9+z6dhlKXxNygyvd8nf0
zckHQqf&Fkq>pMW|ee>$mKvP4*E<F*gI~35@?fs?2I2mnh+wV$)u^C~I%I^KmYnRBU
z=lQm7__uoLOkpAE=|(ppts%73!otGmHT@@G?7ZPHR6U>S#GuiZEEb*QtAQas@ff~n
z8Suk_nDyJ;j@#Yyp9xZI6-JfK^jj@&v^BT#k2{m**HCHG=4a351zSwAWbq}siGTRw
zD1}N(WqdUEM~D9j_jyeou#ix{yIt$x&o7BZH6}{v^N6jDDcVz3fTPWmaiT1~)=Ofm
zRYx2k+W%rTlKQ#*6EL1w@DhZkgAA*2FuOn@v8R08sDrDQ9B;~J9=DR1K4Fg}q_5Nh
zBWqD!GcVm2mfT}xVCOO%D7xo^tA*@#F_m|-@mfJ1Do>Lzw^mITAVIM-jc19jp_N&i
zL@W;VQT&LOo@zDKLj6n;lIt^s2yN#OHxyqzUHpxt5+0W!g@&tuJlFq7&>jG7m<UXY
zB;d80eoc%*WecBeoiOrBIaSF?{}O;@NW)<=HTDDz{u|TVbFRab;4EB(ezS#ZIyjE<
zl}DOd^;Q8mcBR1GZ9Dr_Oies~hxHmt`~ZoKY>}ShgThsRdiz&*_?xQ$gwBkK&-~F3
zMm~jIXVRKq+|Pghx7YAX(i4;nhnN2-Q}q1BwA*BTa*W78tba$6udPGHOphr1)k_~p
zs{R6<^+p3et(E@8y_fez_5x3aN5ft!96~9;Ky*XULKe6a);p`X+b~dS$IwT^nwl=>
z3WB9kD&5?tX+iCj>W68lI=&&70JFtLSuEj347c%X4^^wRaa<@f<)8b7G6CgDC5j`3
z=cZ@(Y9LG8GmnSO=tG5Kx=&Iat_t)M3MXtg=c4;z!dN5PA5QI|J3E4k-c5-DvNe)e
z!2EOP&GryF5C@j;Y6ZAg8p^*WZc?}uC{9uik0P0aW}(%KY7<?R@#JfBT&bT?<wWg>
z#~kYqp-oLtM7Bh5M)s1KbcgSHMK}zHtRuDXNq`|!#rVvl--uddxowo%$&tRg2lUJW
zS<$$IznOE3c>EaB5Cgy1t$X1$ZN`1d{B^}-Y;TX*XbY~|SS@^~1j|%)B(>p=4l3Dm
z4KIKO3ijV{WH3F3)7;tJ?&D7+sV9TgqBkba_XBo#n=B`4blc-SK@m(e)VOy(W#ON)
z#_SGHxhmHhf^HN@C*TU0B7g|30hc*b{P}RXiA{6XeMubrXXJ)|(YS+YuI_yK(Lm*}
zL*plmc0@uyh^M3!QVw~3aj2Sg#qP3MPV-s@Qv`dT_pghypv(skh3iwd{TWJF!6fGQ
zKSN<N{O)f*rSmb3!Wdz?$I`M_al44%k&v8n*@H_h4qg|3qamKkHBG0{cz%=Q22$;{
zf2W8X>u~xP2hFi4y4XGaOKhjMdxAN4;}-_YRW6}3DbZ}0M_~%A*If&dXd))eSASu9
zAQJqFXR~bOPAE{#^RCjwQKs<?hbNw11syb)DeFd%#AFDb?l=0CjmL*Z;V`u=@C$Nx
zBI$W8wcC)4cM$4#f5w>oui<<es4tbYboyeX<LzM--$#y>Q|@=!DyDOt>BclWu)TW;
zwUfhAh`pYJw3A<TW(2No?<9GEU}}byd_Q6lojF!RqNWh%E+DHOng9$6akntzG?NVT
zETHl4Jy<V180%mRVGNL7(k9_oPCi!X*aqgy|Na8OP{>c~4qe}*Pb5{;Ur7VZS#I$N
zRW9x?Sn-7|1~V08;x+~QGd1){s_L*{y4Ff+?vcx>Br%CjayeuKuemqDc?K$@Fip3P
zo9YOZT7A9KjDgX5UF@{O_L~LJ>IXwy(+=THr6EnP<Su3fTnVA-b1%sV!Z>d8hZQZi
z<89BE5ZOix&s}Tkg2H$hsZ76iv}@>xYS5?#YQ+#3{ZNLdSl@-X4GF?SXgnMBLoAC7
zB1Q<4>H)25(hvKDgMTs~WY#Q;{%s$sENwf+0*pFUDAg(8?`@hrE23E7k>Hl3rAj&J
z$%)!F8gwdQG?VZtW4?==?u54#wmb@Ymx%R{K!p55T&ZMrh+>=Ed0-c~{f~S~5=BFS
z;RXfzU1vo#YQ+}?V8@l9>#ecBWr8ZQB0_T3*cLgJzY?EVF4RFsB4+triR2#e+WKnq
zjrp+VZ*y#$dw!;lJt?hr%<+{&0_8#trInK$b2oz2P;dCLCh`AR^tUCF{X}IU4pnz}
zN3i9~Jzp{MoGz+u{swL>W9t%d6GDmn;Nt=P0O)K(qbM4x;u!3JwT${I7rQ0;#!-3m
zVXrj*G)>yR(JLd>OfM!*#R#l_S9h~YP57JAJPWOfH@|0U5P{j3BcV*;+SX@MgU`?{
zxAFNLT(>`gEjck&1+u=z{HgbA<;fS19~<@J<rB6))Jxc##4Gx;V%IZ4sF_RE(MttE
z$G!$?2qiM;>C(81KYJJ%r$@3X)lEt0F=TZU?fVQW^|~_HTh_cw-AVESrBQwN#}Gb(
zb6&4#(83bWR(sP33*Gp}!B;E>1!6tE-O;S@XtU9vH}Qav_vRa023$!oZhpB4(TS47
zxT2YP0%Lw)_~xDO#vJB1G58!1%5H<!(yJ{E%y!R^!`Edxn}b$n++vy9!fb`AgC?Xk
z-aH@`Yw|ql1$#+lV7Pvdh0Q-Xe$RHE(r6blURI*?`J^L*u2U?Q>rWMU^sv9~(LbjL
z@>B=o=qc4+)*M>d&L|3||2~%tm@TY|YQOb)7T+EH>*mY4Drgp`7yhD-9K@%-UnX;r
zW6uxN;&&Sb6?9=|97x_n#^>eYpe*}@qW|PKDx@wz?9egolKR35FLbrI05hpI{a^!B
zk9`jJ=V6s!Li&xS`bsfM8O@8{LacSG1O|L0cp<+={_k(P>;rIw%@ki`-#keGZU`=a
zirHueq2{9}5w;=%Y|p<8U1)(|5T?ZCH6aTG<ypM#Jka@u$BYigY5|{&ZDcrK&n5ff
z3w*UtG6#TL&<+?)C4mCpduQf$16n$)$P1}M^}lSs{Mh_R_61zO6ksC$-K6}7NqM&S
ztG}2614AaprF7u(2Bqomk6v)O+dIt6yO_Wyjn5)HILu*ycjnIL?2W_a5=&iSI~D=3
zisq}vA0SmwhaMxS2FR!X+h)&?&E7E3pRmgT2<P8T&V86v9`||a0;m={92^TcfO09{
z=l9+KXp@#m_|_oclNx`w{~&0Bs+mFJ-M&U-OlpI2NxdYx6_qlX!|c*4P2^tat$FUF
zJ~ruZjnRlk2}*5dXtyFfzYUC=(fj@E9*_HYt1FDBUgfUY$R<rV+nZ0$yf7;!Dl+Pn
z6mTR$4D<O|38(@=x}|~)6u`1~Do5x_OM+my=RtO627*xED$=<#QGHTA48py2Mg=XM
z(wYwqgMl&r2^>va=e5f9ArLIo-PgIC11qlkMD6AXa5)+t%RDXsm-EvziMI{lWhy&Q
zbJ~IB(Hq=`6#{jq0@$6yBF$SvMZg{$+u<H55U8eDOh<f!0d{CEHzff$IlASd4CG|M
z4#@}nkre`Vr~;RXiOBCX2>@{F)Vd@IbbwUfg6{nU@OPO;k1U4X7naPD!Q+4)0B@3h
z#)|{Di}=QrSBDQEW>j5UP(py=!(0B-0os2Ypj6}GKq0V0SQb;O-+&deQ6V8GCyng{
zJVx~Xx7tVnK-P?`jQ(i_&cDZA#qKn~P#K?@T&zL-FAL)Hu^`?!5j4;+heg0*{ig%e
z{pSG7FgsHdffW}*aOZ&mR;bFNzn_)N_TgLy92{I9C^dgn@;>nWF0a48mX~n=45!mn
zDck4mg$tL%IufYs^^T6h_4f8^S^>a+AfS!2bGg;`xD`UEZ($J*@Yv`Ky4n@%fK-m_
z1~74ZdmsV}m^Z|IdUnQSyD8v#GtQxDmE@cca4yF-F*WCxOh0(-V7a>9aK|f@{VQ5=
zuJ?Yoh}F%gZMK0|a@m68b!uNa^b$6v>vp{3?f+Ph4p6JUx*o(B?W<DaNu<-3sK|<!
z11>e%tsY30O7~y9-v!@%77JBnT-BY#yVhFkmFGK$<ThLN!zS3B@yGNvn=ya>4Iy^<
zx!wqcvKnu@H{pf;S_?9U$L8z60k^ww6*<F|3ko|ASZwn~tKhH^)K+Bf8o5G{#^dn6
znCcyt>qbZ`V$(uJY5cBaIzOC2fs`x@yL;#Jc87&2Hl#1=33~o^kL=`A20N-+Tyyq^
zZ1zpEQl3QK?&_FLq&h;FwkqcHZN|pR67(BA{csM0O)~ZKL5>eH4pvAI4T;^;iW54G
zA~>e0)z&#9Jij@wgZKLm5^Z>7e$&4&7ix9n!6@8clLI(p5m=+wxRT|{AI5)URBG2_
zGQr@*1!Ut@X*Kj<Be|dtr!Yv(*EH5zSixh8&<+(<sL5BFE2uZwAjz3gya-GpB&+_^
z3c;{6WX7k^`$Je`|JEUWlBApmoSa{Kqv|*^mPW$7J{#t%GvG!Yo#s}aFRi`L<9coI
zDdt{4!LO)*t3#}9YDL0B&A`&UcLusLRJU(64HvIKiHGI(Y#vN+w*6;%JP7q%p-j@B
zQK0ix9uPEHYjvRL!~Ylvgo1*ix%Vzk2oFq18%$@jbZxDupb-)l-eb?;unBH$ZS|x#
z37-M`X!`#QZeZeZf9l8dda#%@6H`_Z)s<2P%r?3@#~<@A-WoaKI9zWaBIxvt+O0oO
zcs<BL-s1&t?fQG3pj@|e3bDkXJ-BN9;3AHL0J1$be^Qg(=)34ttp>G7!1oKdiYU~&
zD*U*{4g1;se4J37cM&xQDBQT-K+=i3Z(WV1)L5^h#$<O3Y)|i$YIMOH4nC2nO)Ti0
zB>hh<fXuXV<JCB$nhfrM#e;89oZu@60x_85ZtJHluF}!kU<-pCcEX=|eLgjtdtuL)
z1}AxEKZ=ntAOZ0e5Z?z4c0O-2y-vW_oJNMo<rt2hcb4iDF>fD?3ua3TOz5dq4enkJ
z;4F-vG~2joEXR}Cu{yI&PDVurzmI89zU;)9FLvNGoi7jl<miyI0dM0p#TG7u_^>^D
zlkeS*=z6<L^~3$Hzi%j}mdXvvLhWZTU4`n@%5YLydGUBojPG|APW|~bkZ>>Y=<UI?
zRmSf#*mhEwBY61t=h^Bqge<fg8k(EKBT6myJCGMHymoNmnDm)PY>CQwz;hRlmG(Rv
zQ&Hm;c+-N{CEnK)4l=Sl*(ls4OyO=YTzzHtuR&wk0ksJwUoMc`I0b4CrVQ3voZ!gE
z(}}VdFjm1c8uf|%i{<1tFn%7s1{c*8N$s5eS;sj}`iK2ljz}prG9Jsp3NRPG>n#Xb
zYM?`LvRDwAd3I`GXZEp{&f5s9P4NG2^#USwgSg~ziCn$W5tck26<fot=xq(};xII$
z68Bgp0+ZTo6>yiqesdCabsZQ}5rLW_SnPl)AX=P{g7Hl32L$iG78a7_%$8~l4p$m!
zn!T4gdG3h3GQ3}W-k!{KeXh1eU0q$j@bTS+<X~9%!}?55U;^c^T=730ZcKLDA|DBi
z3e~Fkp&T9;`biF;-t6&kzUO8-t`M)wyQ}~zZ9R=7Ri;?v+KKvJicoqP7QUs5Jo@=m
zU%8c7?b}lF8T4v=;5V<f0<#@RLY3JawV%`6jNkyQlhrJPq<ovoghgS!M!ac6iJQnU
zx;nO&8K_}wz+@)R-%z3QTCgZD1O`0M5!_%BS%||DzjjV_n3hKaL+V1N8c!IVQt>OL
zWtde)BOC2fo5(S*{EUG1F^H_Qx8n7v<EFmL{a26AX;{IA#xlKt<k`#6)^5_tXZY{8
zQYKkmNvfsnxxY-djVqU8eV1yE7>VGplgUFEdeK3NOrPBgazuyZR8h2`F#ED>efikY
zpm)tROE7^XT9hWHajP&PnYfYaPP<JvM14)^Vinf;^w9WxzYL{7x2S~#;H00uUQq;j
zHcnFLgTL1oYm4^Qn;97{eICo^`~>EHJ5|=y{r-kmgvUBa11iCA_D#@k1>Arqx61u~
zuy)pr6M%IDy)t<{5C?VI3k;X*mV^lzTlswrjfw;H#U6=UR*=MehbaF^%dGf@qYz}P
z<2K^L#L?)l@Hz=w8Xh`=Vwr9(QYA3e#3adL)HYrzMWuhXZE@d44#%PyTojXvpyzbI
zCiVL~&1f;lIopNru3^BS0d6)gYi9P99>@<6`9b5UiRUGKJ6?f?hY^(@W*y7I1kLF3
za<mAjib7Q>pI&i|vZRR41J_WlJrIMtnc#Ha2KW11%Lv4E0pc-vCPNdS`*{WR=VP93
z{4`7vaJK^0>sDqvswd#6D&;{iV3ksdWL<s*!eFzQ!gt>dH54e6$`kbu4(0>?)e+fh
z!fG)Gtu`!O4(O8Mh!nyoYj?V1V9*qM_q)5h8v=4Y9bdsdlY(qhos}}pmVrXRUbd-L
zY1*ZrIWuP=TXS%5=ym}!gi_Pet~vn61QM$62RWr%Optrwm}2=hD-rAU95&NaHlW9e
zbWx2YA!cRdreQ3so?Okp7>QHjI<Xjp(Mt6}Ai$`D8>~M~PT=p>F0mOR5{Qn^@cXs;
zl@gVGnEXpv%Bs)!JBcz{hoyM<*iDk>s1Yhg;43KM0vdFj1}?7?dDD#b;a;e%XO2>{
z%7nwpUio*9&q?0YVY^eT94s)qsYjgX>%+#{|0K?}K$9gKe?-6*No~nHQmc<U-UiZI
zQ#W4(Lhc?nJ585lsIfdCUQFR!;<1BUv%j{s#Uz-FpC(o4n;HlH!Cx7X(jQ&|>Hi_~
zYabxON`X4UzfcRCjZX2a6(_Dx+aIf@8gz2Q*Tvd9rsn@V!ikUUrQ<ZM>J}TIDOag~
z3SlQ3R!KM*6Py}bR>x+>>7=8D2G@WS-<Sp$YeAtjU}$c)-J`}$a}ip_91Mk#Yurqr
z!AJ*yi>u^HjtJ%I@bJCSE#u#^8YD4C>$UJzX#oFhIP}cfs?BnfxE3!pUl~<?TkX!u
z^{qNx1VsGHC;SLg*$|axYx`DH(?8o}*lf<92i@Fz`o4WlRtIv{OAZC{t*{O3zjtoC
zSR+z~fTmLAMqG2{ZURO2Vyi-n;|HqO^B3S><*L<@JMGTHDuT1cB(@gNn3IUYIRxuW
z4u3#hW8iuyhfttzACgwd&ZGs+Xe@6@PJRX%l&R+07x}XQF?h{2yvZ?-^C<`zoH{HV
z+z!Y905T$DBt6GpX6v#$#2?)QdQhzq&<>0GndoA-hQsmX@_9!SwZ<c;OG`_a?7-}L
z^$yPY$OqEAm9hC<w!CyC0^ZHf*zp5^25~dIwZz#Y2<!`x>)gJrYCpu~#(PcY=xrfL
z)?7JcH6aHy;e!(rhQ242@Q1CrKo=A&8q_%<Wwv@@jk;Vcf>P(-6Z*d&JFTVXYflq%
zig}-1Ko3;w6elKoNIcsmxmE)yR1H?gYrF_QQ>z|rHr9l+5<+W~pCdsgX+H3CjV>Z_
zgf~V_31Cgg`d4qSgr#b&pqdFMlWMrteEWO_cF!v^m3aKP2+)Uyn?XT7Ak`Z_zFzeu
zdFW526(4TS>3j~lf><|{3uIoC_%PX&BD~pK+%EX6$!+FoCs=*<_UTy9*HZ!r+STZV
zW$QABY1i8xK%Cm|cITU2$jgKKM1bUMy{GwdC&lSVrO!&sTomfJoN;cKUYWYz9Ud>C
z%86UU{|&h){v-hKo3;`RmlMvc%ur^+N`d!$9pz-~_n<`88L=^28~&v@%c)ymJH^`k
z7{EnR_k<&4F|nC*`HP{7uBRk^fB&(7$T9N!q4&u_Q6acMAtaj9ZXZ5=p-OZX5}~&T
zPHB|B#r}+YVtU9bO|gjOwpCi2%1JZb-gZ}hn|=31L~Q{c?8v|mC~A;U$o^{S<O*Ja
z?~mLJ)10whDo3#X(-sw?MsJa1naygoN<eX_Mb5>CD1%qmcm+xhuBqGVjBtQ-c0kXs
z3vM4WuIIb7hjKX8)VTKg7O)}TCEE!v5V9tahXXw5Dcc3JTA3magfc95-vU`-Mm6N*
zRJdW_0cEN}jiH02pJx(Ekys|zzmZC&%ZrwY19fCPK*N~PP$n5WMAU<rT{0)NLLA|m
z-&2&QHgeKG>MqOQhZZP8of4fuWwb_Yt#u*1N_p6_;NRz<MZc!}+}0ij_XH;Gx;I|m
z0JCTvyx~~v;U4F!2|*3njX|hMIZ#byn8^67LZT3Qpn1eo(~duDg#`gi?3~3L(1ljg
zQzfp}axd+rD#2ZwjvUzu4Aeai7hNOOqfUvI)9n(%|BEtHwh;FT15TW4XBElvcr9wR
zh9bvtP^!0*16!aszS)T(vgWjKUTuWp!|G?=NCJB6%g?;fx&cb-aAfO_I9vYf#)cj)
zi_V_!Fq3XP?@S_ttze_%5P1pT;l5*6?I-|pSP~4WJV-^}o6L3N6B;e}-<?!@!hn-?
z=5e2YlG}S}hb#Er;PR6PsYdX(Ux2IYGq{Gv(S9?R*B0?}JQe#+k$yFPq>F!%-FdYw
z9&_M<)2o~C1^xd7VbFA}l9WHlg1^-|HHWK&UDYI82m9qkkT-w4Vudd9<f^rQds=1k
zAkq9K%1rUsFk$rdFS-(G;<N}1Sa6*g@!cW`ZD9FSfjJgn62clGTc$fA4is+VRRT6B
zIUY+KR*$C&u$*Tc_Lj#_(lpJoiEU@Yvw0%_+fo<brLC+N;<#1^dUcmKHs3I29@?xg
zv)C`LrRAXZz%^b6#StkXOW^r<3N?gtS{#N^7iN%*$@z!a%_+FMt;=cZbjTweN;;5a
zP3=|_7NP>s*Fl@4sHec;Skr`!vczNty=d>(=Wiu1!vbNz(6jB8kPtCrW75h>$G=}J
zoaT1WfZYu%nKXFJ-@B}34axdmE|*K{K14=S8^ovj5d9zu5CEe-sK^UO&)REWY7B?W
zk<dx?>~#c!`u%zb*?uaaeGR?YCiaR9rnuM!&xQ+u5B%O(K4bC^l~tRR-vf`B<~RNN
zS6_nS467qAuf8UXPnAqJ>{fDBuD`r<P)-EKa64yb+xK`^sNtsn`&ejH-&02O)^Z6{
zW}Et@b%o36ucaayPB{pYIb%-@S_nj3-#61L72$?*;ItY2wuZmF9&mO4^x0rN<3#G&
zXlEzJb(@VVqXuz+U&#D1cFf&}sd>{l&1~Dq<Wdq>ikm(xjD#arVy(p`2I~ol5EiP<
zT6F<SQIG610M3$<T7@(Qkob3e-DEY7O@92#)2jcvV8#3%sJa)Du*b9uiOv~zqg(^c
z82Qt`D7LnMDfJP~k?Dq|{_0J3LSn5Euc_0+U_a0osetM|7hs>V*SxDBk$Ope_&Jg0
zA+w$l@q;;u*%Kcr9KX~1x6tv1T|}Z7F$>9reQ|gWyuy}N#XVYtB(bAYYvv1&UA-~c
zZj9}*(=no{l?Dh9UQwuH6U&fqMnn3fUpLs42-}H5S6dYJbEYa2u18fxdyU4_CzN`j
z*>C{HXO;reAaoq0i=93W&cmtzGt-tOa6vjn7T?a7T~i!IeZm)Efq|w1;Yd@G3n-aW
zr8953F{i-qr}v`5!TqMC+>iZfW@t#vz~g>Pc^vn>$n-aSslHV-AwMD-8k#ju-m>^_
zoBUV@d{*R>jKCkvhB9G&LbF1`#|8ZWU;=B()Jsbt=JX?E%Sy|ltk3#Qu`shcv`?_$
zszA(@qHOwBW|h%w7110Nq0JZ8#~v<>_yHMH)VR}Q1#xw7hhnQPQX--J-5=r}tkB?J
zuJizZrYn<L2th6J8wZ&efk(oJqVFI#7g0!fQ0qDoTGat)TDtbBnKJakQJ?miQBHf<
zzAq3r-{*u4qM}{r<)C0K*TmtVgx?DcRRM^Y{$8+Yy*?48wl36<+lsT2ND6&4y=EqA
zysUe>`<L(UpR`xveT5*dr3ScT94JADQ)`yFho<NKTEia4QwN4}w$CAX>h2YU6+iG(
z^3=V4?B+OI!s6H7=`21)oK)M_O+NH|3Hl>62e`83ayl<{Oc9YKX~yj_OXIjBj_=Gd
zxTv^{$pIMYuh<WwIa|@30vVK9VFNxRk@8upy6Ikti2#HaS7*a82260-4L{`8|I&1}
z6qZ2|Q^5FX?Pzv<wOPI@jR^{0bu34!KP`%q_RPsO25DPC*ff?V?5iI}dRW@iUvS8y
zj%-t&qJ6-*PuDuJ@ZIl!an?m&;T}~M#nUgm*0OQoG*4#bHO5`F_7Zo$%#>0!hpM;Q
z@<mb#0VxKKO;JyDT8rVa&2OJ8^#dk!ktaSOjKeX$MciO95D|8cYLEP)lc|qEy#~T6
z|73X2=&$a#0`O<DKtYyPnF?;b@LT4Hwvbp1K^0k1CD4R@dA{DR{~3c;QlimfzNeC%
z^p~uul|r+%4xg_3Khvjp=gNw0+7^N^9P@$r3Dyg}DTg&nO9{Xh$LH7_5oI^p3TE#D
zf|#vNb1b-renm+hF+K(G<st)e)4dvb>L`ycXCiT5<Cz>Bh&}0e3}e4Llu_w+zvDY~
z4CN_r`7do<5dEtTy?veKVb1nD<6pM>TWGLD2Ies$jtT^twPH;@s3u>2k7|^(!LCJW
z1}A+RxkS)|{K@xqYpJMyE>cT}kpSL^SV~)zNOJxkq^83eZ2WM~F0c_pL&d!Pv7xpR
zisV;EGY^+k1Qetx+oAP973qXkq%hOU-Akh5<CsPRAus&ktvwEh*?x)R^j~(s2T6sb
zD42gDUN5|LkN&eeB+Ne-1~8Bba3DCYNeFo?NW~Cjz_=!+{zC3Fo14r<hEOJ<yQk3J
za3eMBofAc-7#^oiYi437@{kb%r(3(l6X!0>rpGPxD|yuYq9WW*wf<*Jxu3cVt?Za$
zv_lg7KH&1$-&}}=6K8PT7e2U}!9iY;GG##DgDt&z)0%iOnm~-no<~&+@Nv7h8L~M`
z16V9jj(}OaRaTpgIPnWt?~}HP##;UF;MyHt$eTL|a#$1^<0T_1r6^U+3*>Ykl#ajX
z`;tVm&Scn5q1!BZzuGjWD2=MvE4NdP*{Ik@c@FTL4%m4gutv+p!7`;1PKJJ9Fm~$^
z8c&^V9xan)#O0+eouDzGr&WtBuMj(RK8SuCQuGN7(zn&KhEx>Oz&QQxWO0bh{jz3v
zXQxj`{xJ;p1GaS)^zOX#8Z7t@Ov&Xltf|b}pu&}K!k-o>gzQGaHehv*cPzhAZ#1?e
zb#2o>%PY9lZNwzVS~W7aL~Er3V@;pMrrjQr9Ae#fZuJ9Y0Zxx@?1)p8V4s0<0dBsS
z$LNawRtNR{BsPMGwLse0knE+8P6pa2zn`jNJS}Ca)No!a3nL#fDjbLPproE$L#d9i
z#h`F-ttF#W#17o-+UPDM?AXU{%6bZ8tfYS+L<+9kIWjB8p^*7fIzS7C_)QnsRGA4J
zEga(SDdU^!&QM~SP6O3Ww-&{+UNGi^>OW;PlBi4<M+mk56&q)FdyWW4rcYIy0wjzE
z!^Ln>g?d%ww7@Q8;uYCw*s@fz;rh01gLSs#@%V93*VxSV@mpudC|g}M(*-}sLnt(Z
z*DcZ?0kRLYiP3N_$8yg9TfOO01GnM=@~q94qzbbLSR9`GAkZ2&rimSmK$BA76v0Z5
zSH|FQ(IS{fRpc1mQx$AAra#?<PmE<M`%K%Ywhgcv11#=@v>JO@4TbLy8H-}0$F2`=
zF6gvce8Q~At)EOt<HsILRm^9Z&+wIwwGy?FaUS|JnlE~K>VO`|0+CwQ&EuuASw?2d
z7?glBWYpBSS-Bfc$=^V2;oA!HRO`yW`YK+|aZ*Gkv%k9SMomr0>#|!e&~kDYr)}5&
z0<Jrde2f(^m?I=qR4_na8Whlu1`s;xfX4463swvci=yxgqa`9Hxe5!DH9XZ^nQ5!y
zHE_mL$H=gd23Zusb-^{_*O))AHvSq$v~pW6d70jOzDm^wNsmO_CX!!l<=PIpaJbG(
zzTgwc#5{3Ab@Tq+cv~CwfzarU3>aNhey5Zn45qbOaseSReG89Ur)4U4u_!gt&AXyV
z9^=$8ofI$7EB|7enWN3((kCXZ-HNL!637W8ycW(^z!tgS^w-<S$dSI?n59(rhH|91
ze-}@Rg;G)n8gU@dIsp!b)s*eGqN_%-AzE{v_bq1&Qk~yqta7ukZr;vh@NQO35pqHS
zez3u=Zx@bcrIhsG=Clz&70sqp32d%C9f}f39YoLnNg8Ji6@vXZ_i<7H9MfbYtO08<
zp$Pw!y4u#(X9+;-t>zidH;}g!|Ha1$8-Vt)@?isb%n=D`x&#W2`bt9rS#zN}BOA7A
z@(M~t;nkci0O$AK61BQ!uD3@JGbL_OYt|cp{RkD9&sZ2Re`sJlN`KZ8CHj7*Bi@^w
zKQfm6nO5za*Q!!rd#Z`l?zI!R{XHHxuT;KFYpu}7uP_ys6f4GI7gx1<ETj>onE))9
zt0x3neaQ8wsUvBa5$f(Nf@^k0sO;y{RI_l#LZ}YPr?7&2tpizodSY6pQ9Lb8j|!tj
z1BxJiE9qo+i*LZyCxTqXlW+{wUqj_klJ<EJfVM7;xcR36w-M`EZgog^Yuax))nv0=
z=qJ1dRY;wZ!rUUMM;B)xNrv^VmB*8}^9A4<6gg2q2Xk{}8lGXJOI%(X)MaGplnr&m
z=P#Wa863}VUud2FjQDCNKrzJH;stYTBio-_q}+VI5+yqR=rJ8kTs{=Kc6%*Lew(E0
zbmsBd`-9qv$)~#|;15eMY}0ZYlCpn-`SJ!0srdsbjg-ZfVLd%`IwEDXKO+*kKHveH
zpcjx8OLO_Lg1ku8u<J-HY8;q0GE1Ikye0G!P*7FEZ?o7Lgd%-12THQ7-RcFU=H$7l
zK1XCp$VS@u3Bx0rAY>2P%zAl~rJsP|Fztfh0rPkKz@KxK(cP)MEla~K(W}#0G@D@B
zu%5yvxY~F=)>XWcvuvq0Zz;>r);MiaJtNGmzR0n+=Ck#oFm8<u5=&rk^qiccgDBxV
zpp(Pxik$VlIyGU!6iM#mU~00(V#f?che-NE;9Psd!E0Qv7L{NJ%w$`piO1S_ItdI}
zH5rqUg=x^5_)Mpc+bM+2ZQO#jR0pm;)Mu2zm6|Z%O0iI`Te%wA2P@@vAe{Gu(TO1T
zaLk1!<WHjXV*;1trJ#Xhs7t1lQrJVJuqtSbi#Yktr?Jq2!j&)5F|r_*;C$v*h;(AT
zKGmcmbxJ<vc~!2`@j8KEXa3lGmx>{sjT3xDG+P6xm8Uk3v;a|S&^yqc8dqmVxbko~
zvN))2e`SElscST3H?=)HVf@s}<T8!g5{DNHSf`~(jesKQZy-;3aITW6wY>1A)vWcm
z<TOzN#hsUOl4>T(*MpSgTv;t3vI_k11$8nN;c5!QN@Qyk3~<OcNCe|IDk>^q!pA=S
zml-;|1cr@YL2wGd$c8crzPigopowSy;An&a=X%(cj+mHumy#ed(t%3DiZRx|2pHg4
zFfQ(mzP+<EU8Y3w=L1!RRA$6ygoE8Eb#fIhUZrL7m%^-T5G$L@QdGsv?!fECWA7c!
z2Rqd&`UlxDfmD7GwlwR#*Ma`FM9j9AJ0MbFT`J8`Z}AOCb*JhAEX~2ofIVw;)7{Ch
zMsc+{T0K?O)t5&ZXl)dTZf{lWh2_kYdfS4x2olbt;<*~ZBuQuo++amf#VQu{C$R7r
zM$-}dA8*L+@kvZyjG51dIeuzHWt9^HwJ?2215EVlgyKy$(Fnt^PlyElGV&p`-wRni
zOwb1>(gW<G5p9nb#i<7`eFa2p{)G2U$5HA%n*j+&hmf&nU|=<guVJ^g_Crc}>efjR
zZW8rx6Uj-SP@(^<uZleJ*8l6B$RfmzM#)uacm@D#Mvq~&8nE9IN(}u=c(jL4(~JIg
zze2izGHjzI>^hH82LNmisgHef8;}sY|LU>(e47^RWMSmtsQhdwnqBd+zkpp?-9Pqo
zh>)a@s81H_NEdOH<6~|&TX?J}g6O*TyO#!)&<}*XzN?2!OEo4m{ANDbJxpf5NgG%#
z=u>JVJ0oaR2L`w2ssUY<>JHT`P1%pL)yYT`igKO}n02Ucx+D>((5;%YfnP9v{&}-0
zwW*4HmDv&(gemo4Zq=gLUxtvuapQ0wqG2+Y#tl(SH?sf<r?=u$3U<&DyK;MK7&eWL
z$~F`ddvpx~I|-EOw_sTtj`%$vk&zDh?Z3O1Vo}O(>TU3m%+jh>F8LT&`g~1$zXk!Y
zmQ-lqK_-L`S0gZ{qv0eA|HuZ`VYFJow>s{<Z{nM?_JI#uF|Hphxl|LNp>x?o?72Ih
z)wXk2#_TQXo%fK#J1{8<JJNpI_T2UUinLZN-wZ*8ZcT*0W$SdOpqTdYNgvF%=Y`I{
zloH)EPs2jgJTq|HU)%m}5=o*8+I-Rsu#o!Li|D157Pk=BDsNifmz**VO#53*J42>q
zA034+b4`%U?Sz1g!}Ut81OWsb=Cgm}6=E}`kTlUYx8WLka5_*{m$2L!tXkFXe&WB;
z@%_r79+>(o2=?Ysux$Zy)zM4ff@RFVL#VZ`Exj~f8U&+UzMut$$Zs+QV0FSLQvwg;
zbU`g3sAo1xINv>C09xnK^IIsv5m~NkF7c~Z_|5<Ejm!WrvOT&>?hXS(sSEl~h+BUK
z32-1*`6@3x|M~U6$MzuH0U2l*&n^ImxO!q{NhAOW7<3t*H!s-S?HdzQ%C7(+Lz({e
z@)uoT;9zu2-u(m0VSP1u_z)~f$T%b;&2{~NR<5YWn(zP|qbW@F3JeID{=;jGkL?&1
z=p00(mrox;DF0^n>BH`1N?P9S2MlEXd~*Q^vg9zZ2p@g$N7J_{>m`5?inMipO04hp
z2RkxQ!MJJ-uu9A1ngd9H(93^#tpX2hS1DCk3ykeKklI|yjGeq7b;k|_?_$td_;Rka
zwhR3CFDk#6H^p=xAkw1qsSlyn92xeFgX8IL@x8eDu)+|=lWZY4yz%da4V~Qbbq?FG
z8hZ2HJ6}bJIW6fI(%h5}hUwohng5+4dFFz-Vk*yZpAOIfxEiFy+#x040|YeU(lQcX
zc!1*xKTWKz8v=x5>h4mq>H$v1SyFA;2w1P>=h1~_0B_M6sMziO7vA#zfw#OeW2*gM
zfJ3kUfI~_Q?u;}5#^Q&1>k13x`i%BM%K&hw1UUI|Su-m4OMpW(z12C~1DuTP5w*t;
zAfK$|v&`)QfI}6oNxUup-@&1r4{*r)SQN<=0EfQH`xD3s0^m^PXC^iP97_BEhm_iW
z697=z?*%>Q30>esQt6n)(D}leoG@sa0SMU-jGysP|3APXhYxT_uJf?B5&(UmB&T+$
z056S6GCEZ9_<zwkI3jf(57yE-eE1(#XeU6~1R5T`UylEkwAt(a6lX9RKO!*^UAx;G
z-|2YHFCzo5&GCr1*&t0g1o5g1m|E1|?sD-#Yy7F!YPQxqW0gZiMV)GOFw=FsJye*h
zP?M|I{CV>sr31h&wNNqoJGBYJf(&AV-O9bgvS+dUYSoi71A(as>h%}M?9Xj^%6b0w
z8$OiW4ySnq>a~`H)n8ph^Pg_=b+XcJ%@-lv?7b<P0ircZU?6GL1tlxfKk)0{%W)39
zzCvq!*ZZ?5PyXGf(l+|FmLQypMZ@<rhYqV*-1*J<ZlvEyv_ucDz@&%TA2;m%r@04X
zuTYeU420<mm544Ux|9knv1_tNA38lL)f+v>GFr$fsUns;c&Y5);WrF~WBD(T(#kFA
zj<}f(jEe8vZgzWTsL<SAv!J?r*(i4|uqr-V%;Q-_rW<od$5VfhMjh@LaVOiz_1{_S
zr&i3Zet^Hnktq1S`IsdES_y<Ag98Rz;VLbTXSm@QRG_2Irhr^cG@<=La{JrUqF!n<
zFDS}1Q;Wwt-|>897(M=qK}}=hnivKS1}KK7Re!bc*r3dCT)=|Z%|7<oe)vmH9s5ER
zprenPQa!Um`FlZ($2HPcfFP<dPWR%EpJ0RRg8q9kc;eI3!R>tbS2chI+JgPcVQ6^N
zS{s**$932$XlazVO7WEgxK$c%**CF&m`QJA&lEHN%3;0H4n;wzm&NT;(-@>7g_h+c
zNei??qc)m?IK1&ce*tC-aV%77^j$2>&tv4}<!QPQprH5xx=I#FwF%C*JsWi<a13Vp
z;;+wlc2T<MGbJ@OjGSCtSKECdNCgT7Vn-R5H$eZQ!Bnmw&M^VMcjWcn=+1nFT8H)f
z+pGDE2p2;p5Ef;3dqLG-DP8W~S>Cc+L;{L|L}`4q6)Dd+3e|maf7|82P}K?lx=FRj
zHpkqEX+*`0={1uXtptyQOYZK13>dhNw7fo2rK?tlnnd4!a5YANQQZ#r08B)B*OzUG
z=k&&2VRw2`0&f5Gy-|bpLYUzs8nfW{4aHtTO{8_tq3hXd^1&ASzlgGW?a`7A)$wK_
zAA(HVPO^FR$n6eTlP(-=y;l(_wr795UIe}@XS*3tUK@S-F7Z!*-jRFYQgE*7D(!pk
zTb=CsxXaXZx)QOXQvSueSNqxaQMaVaTL&j-1nw8hT&MTn<dme>GScY5s=X%}s`lxP
z|H0T>Ms*!@eZL9<(%lWxE#2KM-Q6JFCEX<<-5mmw(hUOA(%m54l4rQC`#$SAFP^oI
z?_BHWe`fZK6MKL5cdtb4u?v3E>c$vX-e0MOtXBDtV#&CEo7j`v@i~yMnZG&=35z2(
zQn^5yDbq*PA=4mL#CmgA|L>B8@dE}z&7tiq)<Y~of6P*ok;v(L08;FJ!I{22qL5u@
zWx)}L!xZtJPMQB<Le-gFP=!eO@1ELMy70FFMQ6+uB7e!+S1-GzqVF-Q^&CX}#SIB^
zHU&J5-($s2DrX0lJ?lA&i+}`9^$nrG*A|ZSsYT63Rek)ahIvQ$s@CiqQIE-A+aHpc
zR3z%OCq2PqXncOra)ray4h7}u43(d=aeA?|dv?J3UjCQQ7X9|zPaID6;A+IEo8y{q
z9rB--^Y<jCi|1>6(%LxC(9n(8O>yRUy$39dt+occd7=>2e>chufs+DO`(q8aewzm>
z5fM>%T->))K7OU{uD9mw-Lc}Zj;2`XgRz8=keHgrDOkT@SCEjA!`j>VnVi8JAU6c0
zJ|Zwa0uhto;Jq&~F^C|NGqChKn;)M-Hl?q|sP|Qc2T4Mg!j#qbP@IVoExzXv93A>1
zFDuTcYBtT7V!_iWIBI2mOhk=V_~xHw`U*SvCo9T6lgK!y#2K_pR5*5fTt1w(X`+|j
zWw;F;dPQ%zJ_Je>Xg>QGVqvX_m~UMDUIHkMW?tK_L*#F8@pZ^yM^1=XLS^@3i~c*a
z=>;338)TI*`Q8yPRKQNhqP${^sDsPx{NrZeV1ZGCfk$h6@?>g<7b4bub8nlKNoI!^
z;jtdSayC6ZnuT2d?OF*0v9PSh`rQ0A&SX2h56sQ)D?kN;*YyS(7cAZEAi3L(Tq@h=
zAvG4W4Pzvc(W_f=!4ZX=N}`+S8XO)77=_F}2?*}=nX2Cp3Wx@Q>)?%QC(U)3$R4Ym
z_{z+5_=RiMVd1AR1X$IX>)Iun|L*ClSx9ANL4owTnJF9o51(_$*#}@r2hY>b7$xo)
z=0=m{l1v2rzIZz18u?m5&>qhh6y*(;5pABAn{2*5ez(U>z&h-5I$Nut42<hGGboyj
ztM(!JEhc%Jua#Y;FmS`wvwf7&!>|9x?zl@o3X7EAFezKIc(+)pBj{>(w3gAx(Q?~0
zsZ!68ub!vXJF^$h)<wREQL$2vc-lMsPKi`nLNE?Ve|7nS!ms~hDjxe@VkVafWmOFG
zXc`|Z<iV1#hOy1o-lD6@+(3XYwQ?nn|L0V<V+ETnj7D+EsYNN@xGXUfsL52`+5TKo
zt%wS4aJ~7xsJ7m&_tOa~nYPH!)LKE1Uy0?vB2Q<OqfhxJgRulYz*~aQWx3MA-t;+D
zu@w&}S+|`4g7GfhkN)`RsK(>mc=c8wO&g0zpP;z7cplJ@<!Tk70FJ!i0s3~#74RwZ
zkipl<pHx*b?ynBWvo3&qL4Du30l%lD`7QghkMeg*qYp9CD?d%qJtUYS5!(jx6n=gT
z$K6TY$xOu@kN+q86I0@{Jh^tShr$v9bKI(=zGF{Qm0lS^=V^JT*4$2^FFIz4+0KyI
z#j2EGj`$z6i|K1ZrvD2s?bYF+aPW%h0!dMcsiR8W3&{+*5}n_nSefSEp*L{Qs$4F0
z!8!7RKVz?BRuy<FlIe0`kH0db1P73IK;9dR#j$<+G17FBTU0<N_jj&8vbN<n+m0~i
z*H`T2X2m<ndJ+y(=37r*>YpFb*#iCnGIqSVZ<pTc{7_<i(KILh3FA4<*pk!B+`NDk
zpTTMaXRhYxt?}`={;+W(9-ofuH3hCJ#<;=y74+iDZdRKeM*q=9vs4P}OE4pGk#6}P
zc*ae2gv~Oz9FuPIY&XV9joB{n-DH@p#}LL<V|`yOs|B;O5f@K9MM!ceU3u0Lwb&pP
zNrc-jKHX53YKO8OZp<x}-X9rSZ`tqN{nj%g{Z929U(t5T1dAHFuf_xj5=}l;1?&tX
zr&(Ot(&%*xA1=<fXnjYbd_!+3fzu;e0v65#qR}aZ?OvvqO}+K!;B9_yAfY2G|MJn+
z4x>sP9PHegBxlMpM?aN|^&#0le48e$W%*P)drqU}l|qS9VO<o-^@HI!jXVHtW4h$m
zIBW%}XoAr9NaXRXUsGO^e<9%b|09-DGHaDnyaGLdXk=?U%1sk3K=S7x01o;Sb4?(H
z`El1Bsb7iSS+OaRTAm10)}|5iBRY_f>gx-J#0FWs&~>YZR-mNiGHuY#?a@LIaFO)(
z^aNg-xa?27&ET*zR^wYCU#kHN^MYkwR}ppU7od2Xah|FC6%xcn=gN%s=kjqOyj=gJ
ziw;WXE%R^9)C*NzTv1ir5OnRA;>ew>;aeO)vXYrqV<~kn>d0kB)S2FQF50~V>>@n0
z{uN17<X>cB6N@i#SUKYN=gBSr&DreRq1)#ghJpOOWVBh+t!-_&#Ru2q?;RXfL0&&x
zl!&Q=zQJzswyBs}Qe9n=QMZrRYix#sxxx0=<|kIa$EYs3lvLu@B%IU@o=c4@d;3ts
zFx3&pGKI2NtYC0FTM{3i7vXRLQH6iHOR_iv%NKf`lK-!Labdfyc~Ko*pUG5n2__7`
zo8)()vD1#^3=NjQ;l`$mog~a}@KxM4KxD;KOBwPwI%A^(`Mao-36#aFzjq`oWyPzj
zqncf0u&BjPy4-5<7X;_&a(6rWU|~Lj<QAiz<K_|f2ekQ#;4Wxr{d&r%NIK5X>!Y#9
zX-){sE#BCFbQ(9ep4<)#y}mGDzQwe4Z>2bPTDm=sQu<goCnwMA)+6sF+3bE8Y+kFr
zI-d_;6;me_9V>$FByYYhUO~j~u)|XolSHU(W8!G~LHBXca5c%0K+qTZ@>?}{rlhc4
z{|&A}L?8KHb2^7TO%*+tuA7KNXl1uN@WfiShM=8HtdQ>B*cHKQkx=i(UKImvxGqlT
zg``L7*UsANmJf0~+swEj`fyHvZ`R;S&9}r{0-Zt)Y(njZPk-#;TD5?7s3yT?E-_lO
z{7b~`@e<6gdiQ&VOP{lL8Dv#v6k#VsqwmC{;-WIF=A&=wLZxz28~T%IR6Ned#l(`5
zl7eZs!$#4ze(cXx6LWl)TY56wi4F?X3)9lB>FYu=Z?E;dG*`&v2DJy%lEAZBSL`KG
zuyx!Z@ONg21BX34wlixL_Z56b+|#%3>&sWtL;viMs(22zX?-ix<x?T*7TKBS{74{X
z`wrgGj;;L++t?W4I{P2SrZt2+G$T!>m*%+?&;~nq(wcFI!5M0b(PYN5zh_1S-*_u#
zbze7BoMjD!70sA0mRkl(R0XVc`MuX}6rtUf9PdzfI9SoEkh|PoX<eJ_Ucvu%P^31!
zBUTrKb_v|=ZUkJxL<-~^R`xK}q;A@W`yZEKTO%~qPqMS_p3%ddj(r|cza>SRnJzAs
zB}eehCR&UuFO2F6%#EhvviJTdOKkqt38E>lKh-!r=8C-}eCFyFJPyN1C(V>~k1PhK
zWhs!49D5p3Ev3QZy8%&2NWgvjrfwLpn6g{TE6mpWO4)Od&cOl>l)(y;7puN)9{opJ
znLa9YG5MFY5VT*dSVx?48GQ6I*F_oo)5}ykpQRT3-^5v!@LHJLZ1GjaY#^1{6cAJa
z1w^2Q!va?@w4*8Wty+(Y2!T}-W$@SV&(0oSUGU!hu(5yO$on%(2dO5nVFO_;VR4O=
zu<BuQaXxMkd(7;9nalN=uQCjAuMGqE1>a)OL!rbASl>Bh`#)aM4A0KFA#Y+{mGEnY
zRi_JTuy@iNb%5jBN`v590m9y@iH9{e5Y_af0vwIjS6s7?X#>)IDfDnsb;trmpE9o2
zp|`5z$=vvgUhX(JI6mHyUK^=n<8#=?zm54%3VA$fTe_A%vtfuho{=<IKnP#~E$y2)
z-vyeT9W3Go=`>BG_lBRnx8-)kL#qx}r^tGg=G|BkHQyTOm0YIHClL=ALMRPi^~VXY
znRCvDlPINe)QTpji|rVYH#6?Pnp0Z*379INp<~VINIMWu^Q@#zoNgs`#%8<h{$?<R
zK9}&6n7zV7AE@3?WyPfTl-to|b~>V8&h|SSkA<_WTCU{!h5C)In4WE0%{yLk-8a}o
z{UZOAgNuttTO$M_fD&YagzFnI=U3e<`8kbrIWZ+no9;(_3-b6%ZBiTb?APIbg5`~W
zgL?#@!&x(Cx0VR3zU=F3Lt^zx<bHU2xFNiyT;N1uTY{Vxe@4M2`#ttxMeIjge6|LV
z50J`@i5BRUBpKR!S!hM7p^asDEJ-U>Hi>G-XLsw@NA>Prg%a;yeWM&nol9b@Q4^Iv
zuT-g7bE|KB+CI1{uW!7{YhlQAtIr6%w)bbnb?o-n$r$*P&3dx(Z!h!3BexSbtx<H%
zPgA}k749XNqE1XqyqnyxFr3rk2k&l$A?_Y0!WagJHG$0VP8~KwPvL@d-*$2w?!><A
z(bF1L!n^cp<%a$DrH0=g+}P3(u5QHq;V3w;1_gX;Y0b$Q`_C0|a#U`}!<TwY#0-0C
zH%{q(w4cozKC`uARXK#b`L4p-Nb1|-f>x@8QMze&RV;5gSAZ>nbS~m=VUd{4Gx1=G
ziTY#^xs}7rjqA>w)ANh(5fUvr=KR^ufszT42)`BfL)F@M$RD5P@7v-dUS)7ORMdOd
zf8}w>zbUJJ5K0gp`1GJnp9pH(SKWkM{qq$H>7nT^H@p}T@V#H({hcv{IT$>e+pB9l
z&4IPs=^;-HFW2_d>)P5eQsrw3#b$miAuk9*h$K1Uy!ZZ8)AY^)-YB1L?94Gkmp{1%
zO(A)h2=7RXGyu+o!9UygCe?5}BH-qlM$NKvsd6fjQKh%$^2n0__C|D(3z=|-z<#hg
zraLLMD)mnV{841zR|-%e=rg|`gw7gC;mf&XFb{9OZ3kcT^FE6NV;oi+R__uUwqc0l
zlJ?3R2sIL+A8~I;qfh!(Wn`rGb^8~-L01qT73Ps)w_zl>>E0mDB>Z4*T*-+wr&Z_8
z<Q0<^zPK|?vP_kY9x~42Fa9l|o6F|};t+jum(3m9=UX@x^4whd{;P1=9d-K6i3KXX
zC2JR=&ilTWdQZryr=;C>^YkBvETQsnwev{c8!UTJB}{UnofMI_MU6Vs{G<O^k}kEE
z5C5ld*cstIoO^-V=SJB}pq=D7$EYjl^5y_G^CLDAypf39*fuKaM`;ub{dPz6RbgQ=
zo1x%l*s_1FK0XoZO1SImH@GwV3L8)@D1;#C-BPVBPgD{Q|1;T2Wv#Ea%R!_(#;WVq
z5NV;Tt*vS`>A*lB4QZ)nF~axN=C`LpMEFb0MqKhzzjoiEQ<8AG(B_+ui>%-^ZemRp
z^k_~WF0cLcC&p`ZuYZrl1`_l#+>ZKUOeE<$IJxMQCaoK5O-!syNz~eVOoFDSoMz)A
z$RA-V9Z<4YMm@XB>Zgk%UhEd-w!WvS?7e%$Ih;|Q@}>xgEc`1o``Cx)L9AqiKwo1a
z4iZPiPPvk{Kt3IWk0DCW*G%#`T8gAsVQZiTB_%6JeH1g<Xs1J8oGO$8xDS_NOhhco
z#ceq<;L*bzM9}|Ga-~9$o$ul3fa~o@U8XE9j`=dF;x#pL>o2+TrFLIt6=T)BVpl%m
zwM15Ch7{wh1YMRbo`RY7*tCIWnPb{KOCL-aqd~uKx~}R|1IdNiGp?u(+d$9C0}H(q
z6f_4VbD;tsj??p)9vedX8_M-<j3O@-{<oNLd1m9qH#mzF+3WGgGY+{_u?8()E%yiC
z!9C!}ZV-34=()G(Cumf!<&!w#Y?G;<_|}Oe8!!9b;n;=VN7WaO%A!sbM8R5w<mHFD
zU%kRPUWCbu^;GteH`{7PGL1T|DjGnT70Lbfgl!{(nUfF_)hxZC$JGlta|I<v4tFX;
zqt;_|f$*b7^!2lshl64urdt$tS(}ogP`{`4Jhe_Isi%qyWi^~4`fpZuC}&MR9_Qiw
zK}c`O=KFi9_m^DqnVO^aMv|n06}|G<pQ7y@Qk(0Kv>Q;%<mNufi0FmKet~1*IGhC?
zV%%2SFf%4vGXE`p6Fay!ro?6RG11wF*?U8z8R@d1R@jKBeY2NO0sRH_Qis{deE!aH
zNHn;Lz6yWv<>ZLlMbk8>Oq}2|)a70;bq;BM?Ci@v4gUf6W*@Ci2_xtvMKzoXgx&6U
zL!>Bhuxk0)(`&x@me+v+vHcn1izAMfxEJ<<GNq`3a(e2Sz09HkT;w#<cipLedpN=9
zceH4A&GauvuS=@?%UehU`l$VaFRTs@_tiOm_tI}*ULhh%r|yf33pB9|-LVBhO$GF6
zw_4-=zK((da!M4Z-`i>QAVNAQa!+a$K{oeW-SJ>>erXf0%BAL8|3e{Lf;mfV36>Zz
zE65n3As=K`rH?0uzaJcYc@{oN6xT&Jhg3dte)$KlO7u~LyS|wri2;7r^Czi;INPr6
zQplOW%KI*A!_tc7Abtj<m<#qK8&65_W8fmI+#G~Xi_H{S^!EJb-{trViG2kU?2iDP
zB?hMvw`Te5bdrog{)<AI=^`pxOu9g`0Kd(ze?ir`9TdT3??*0S-z|=Yj%uphP40kc
z&*Q^<+K|)AbSz`$-#TzBzw{d<zP1sLp_XbDWkKRCsAKz}he~X^aU3s%$@jT~LVS8j
zak4QZC7+jnhE2)qfYMhgf7R0rihr4a#jSYIL~4=t1GX!$Ni6u@xi)w~C>n8>-w8ux
zsKEKpGIyyox}tcJ&BF91?N9&e0=21-5sh4XY^n{{yqQ+TOdSx0r`2s`I$ABmu<@=S
z2ibI}1-rQjNPp<myB48pvzu)RjMm8d(M%y(I5OSWrGiJ(qW&aZq)=r?QqNt?&*Qh_
zLDBZ-s2t+hM`6*1KmDD>!?toW0A^Dm0v@jE`O<LLs7=qR`3_uvh6{ar7^aKN_plj3
ze=d8K6T7HE*F0@?$rZCwkC$o#RtfDgI4I*XJ-);BlLv{4Fn$67JTVANui8SSoGo9W
zeo)#}xljuAd<Fr@0U8DReNs{pK}z=qF5yr}Yybk5f|_=S9}bSKW{1yD>aD+CUv(@f
zwQ<$nbEo|c6cuby(xpAEtC@oy3<am3$%gkwd#I6I;h<ouFo@4Mb1GXM*?@AaM%%2-
z`eDB<m!nYXb3D0)!|YCaKU)no7wVd53oV;ROov3+pZiaCqS(nZ+IDVgBE=~V4};@l
zMvvqbi5JL&A(9Cnd``<7O5;vsPC)C}m@1}#cC|E_v_;Mlko=`E1~EF%%!ngcEXQ~l
zQXSPDk81=SIQF9CwVa+LynVRhoqDv0&0wwCG@nfbcMXbz@h73g70?yL1L<d@{N#+r
zF3%xm1g8^-aiU_!fn5&WI#*sEZ=~)Cf%f&yZA(AAky(2&MQy!mp#%E4-;uvn`;#fh
z4c@=R(>Pcf$4LtmSNwp*o0JLwV^#l&w&`fSgax_ehar!|+lmluv9^k198jN8t<z>r
z(Sm*(fu0Z;_HF=jW4Phk)~?oe7J=TN6G;K%S*0C9-Xlg`W^l48a&7*c4b>`8%Vbk@
ztl92&B-oA`1JE|RA5mo}LrWXjIG~$*>I{ex935*d%lql9Y@3loRq*lf$srM4lWhJf
zrw)FEyRG@~@v8T$`iw?#ut#P-0;8wXE(W2lMB!uBL+ix+K0Gm}MpTx5y)je^GQqo&
zMmrQdwkajapD7U^3wB2bzN%HMAMq#!huY?kvP8<I3P6emNfwxZtTH@48JgKgbqLIK
z&OATjbzdPU!3LK1MwL)V-G%~iW6(~UeXvP|nX@Uuy@Ig>++-qLKrdz8R>G%1w>LOL
zuGC8UgJcLrl~48$$Uc?H01w)aDttdHeEHi*ZXdfaZQ{vAd2G+zBrlpPkuu$q0^ZB^
zWyp*(yu}1nufjiNITgnh@7NmZ6ruos(%M&kn0~X7m4`gjlX+r_BEqWA*MP1e&yG~@
zQ%ML>{{YQf|JGaU?spoM2xntRbT6`?50f0b`!V$0Xr_rs8@JP{h@4gjToL>;SvX6Y
zxAFOI)sRqa9{vCfxy`^;s_=Gt@7@@;9WztNPmH02tdphLHqFFAFG$)O0`5@C_ItQ-
z=+o?#^XN8uA4)lq6I-orD+!ekFT(RyH&Z)jIIN6s&v)l*9Nx+2M1*V&<mxxv{c-MZ
zuGa4i&>I|Uc1jHYR-qxDn9lB)c9%2&Qfi4+3cFT^LWYQ7vT5clT`M?qjj<Wz*gj;#
z>E{vb^1Nx&J``U?<745M`V#Vy!#sYZvGwIW<T+*a7xf?ZWFLK*=aovl*vYzh0fbbm
zpS4twk}ns5=5cw0tZKgsK_D{$LT|=LO+|mE2m?zK2fHE|G7>ny3HYg476Cz%MdQx2
zi5g*;!TH*a-M|tiOWSwv`eS1d|61Di1un7<;m@tuHwSpAM8`<nkWEW270W9Ra(uR>
zkHENH=pd7cMwI1D76MaSS{=<Tho=;Ze7;H&n_<DE-<3F|;=DH+Aj*P|U}AFL_Aih`
zjdXRpR=HM~JmH`~udcXM9-gT6cG}y-kshbkcgHEI=pO?5rTWe-yr(B;xgNYc{_G$o
zoC!iY0R-g<e?1K}H+5Fa|GSX|{UiP~5k?T@>Gg@xMBQ{Z6-UsIj~LF#SPq&nX#$DS
z^fT;Dx*-#SI9Fegr~uBWQZPT`Je|l!=K96wl@?MiE=>nb>g(tx0{u@-pO0kPNAHa)
z)5hz@R}ojE@(~uejv}$JXk?>yMnCUQR5I|gSpU)XV6zK8X`rw6(Se|Cev5>8ZqS03
zp^(W@KPdFxTT?YZqEcVXUI=O_gr6EZWUPzMtGb36m9m7MAzQGTYgcd@b{-Fv=q)i7
z%$4=3Skj9q!Mo}Ar8wMzv#e3@xb-+oP1ta|!=#5UXYhToCWHMQMS{A5UUH9c5k)-O
zG}EBkftLj`+_x@e5An2OO&kXtxh_}O%~ItLF5P5z3UHtpRK?NWygrQt)7pk+ivV=k
zH%T%k-*D}(Kv^Gch($f#nRajF8+ELeSb1uc$jB8LSkv>2M^KYFZ8k}jgosDh;cAng
z#G~*=IU+i^eI#NA-p2_$MChC~-#(n;NUe)s?fwq+LU5=F3t{*fLg$pxR-^0tgi>b`
z_URoyoID~f?ib?_INV{j&I0h(KL*wMp4xq*2SN$?V6K9G&F3CD2?%%NY;fZ+Uh)3|
zw`k!o_6)f}3F?Km7Oh4eN8x2+SXCSw(Uk|#r8OI=$N5q#7$zAF>yI2m_}=f|=DbbP
z8lqs#SYLU#H5r69!~7KdHg+OcXkI-Mrl%Tpo<DvSUv8{S3Til%%e#jwC@k*N_v@;6
zwDq5b7yKXP-+hdP5$BQFNJ@3Egt0gs68#yG_I~<nTY+kF=1NdqP+N6&QL1IN!vAUk
z*fgjYH%%amzwp&=BM@5A{I)zKHr5bLb|$uYNYQ;dRg&p(>67g~kh`YzdPh4iVQjnX
z|HY+DWpY@Q{(ZXYQad?PrjCo9_QkwRqKrR>VmZ;(d)4q-;hT2pHq?WuVqxohe>+4^
z;q7*JfB$d-t&ikpa3h_<v(2X^)+%vAP=90pRdXf6SU56|Eq}#m|1sD1o3|+;phN!7
zz__R4ySwGruk0%3#utiNn(W6Ze^E*eO{h(R>N*RH*FupKINznOwK>D!TIo96Pco@p
z^(h<KiW1?^9kh3wZ1t|;+aF|!ngsQvuHCL0W>fgtZ;z(Pd+g(`88AJdl}<!a>^Msy
z`s6}i!KwP>;+eX_<4w>h8Eq(=O~P0URSWgQlnbjj<-To)z{Da_!}2YKb^#xj;+Z}L
zzkZl-CT;fXrQj{B>Z71`;+z!Xz7Qn%)d1A0tM_Q7HD8TgCo133x)_Sl@dv)6tt`~!
zXQK;%<JX*|9VZEZt0-0DjFHI|;Ve!<CSyM{!iyK`4?FlPTh0&=$@FWH_@)xA^p4rr
zSGoZdUZ>D{fXq>Yz$7lMVJc~PN83T5^CGB73yN|{+Fan3y(P31g23cq&QB&1hQL(+
zREd-hb}OW4u=T|Yg(PECgqc$S27^v}2ls=L5oW_-u`;ac{y@@&a3QpS9O(4_*-&rx
zYeU7=Ol6Irp$|6x>vb}@n~<0{JF4G=`oEd{ec6)+U3#&U*C%Jsg+!Ff6@ihcpCXsa
z?U9N6BV70YF~Rk#39byqEBJzd3G&rf*k}XbR#HC+gwJ$^S*<TdOB1^VR6g}vu7@3Q
zccxk-Bi|e0-3d6SAh!z5J{z;e)7#xM?P~1=`Q<`CKLlKxT{B5Q67!%w8Do$Wt6HvC
z*mwLRk@vYa_=?;jqMm{mkEc`w{Xr>Drmi$!1vpYda8(yzVO2|~=*#z$-qETWLA$z%
zj1kOOVPjs&Kw#1`2S&Dn$-u;ybd$I4N(Yk=!roAE+z8BN_n=jG3+A!dtziXNqTWuh
z;zl1>SFJh){~PdCS6MuD$maIk^Q5@{|7sNi^RPY&&Wi%Hh9lgs2U?1ZA#bH*H<Sk^
z>`7nz<F*7$*Z5Sq;0>#)snWXmSqB1hu`x%@n+dFza*dG~*<6v4**d>93MC_7!Vz96
z#L`b-?v#qOR3~Y`7<&-PkAlG%t+3Qwz}U)}gLrs>GsbmM9IE{*C^Z+IyU7S9tA8Lt
zFA=Y%7?{aO{@A+J4p!B2$#3?k9ZXP}o?R0|0G!>@czHV*quQT}odIA9v%gxMr@#~)
zu{(r?(5hu%$^Rb~RdW*ot+7SX@_@0ar3z<dfwA!%=LhOb=ZZi{C^=$-2{GRCDbw@5
zzoPN+^{sW@Q_yX7Lj*DHV8HUEbJ$tuf8}*QA>rb}!RP$k2Sj+3+dLd!l>)M}v!#-0
zlS`M{z1^4FJg2vLwt|3)eOGU9uM!3pR_M@>6akmR8?7Iv!axj&#pBHIgJSlw(%wX#
z===BYySjs5&To!&91TtkKn-X_*ZP_Q$=uD0_6JSJGv--B?pXWIe|T!}*nv7*&{B4$
zg0hW2FSlvhu*I}_LdMuDdK-tTL!G_H4TP@p)@n}X?e8dTux1#v2v)4;y5<ag%}NWd
z3Hbr4^Lb_9M-?v$P`~T=caJ}x!WhwwbR2&_nDk=({c_IUu;;7Uy#HZzsZOmXst1po
zP`0fWTKlZ~tS<d(J(P|pC5hy24tiBd13K7a8TDIZhg|V%tS_;E{!mk?axFpV)ltAq
znV;MYpE5p&@%iF)M7Cn`N2nf2n25`!(<h|4u6f@}c&~b!AnjzjbZnao%{U;}OQ%ue
z(Jw<^a(;f?w3ch0Op9~48^{Jc=W`M-kC(_;)w&T{@K_t0$rVFa&Jt{8Ixs=^R}#Y*
zG@xs&Bq*2PB#d6}Ew_iW`6s>7dGkbbdzd+92jdWlHLxF(l4@&*ZEa`DAl>mml6g!_
z=kqiE^xio3*2Y-7H?>|HPWo&$jKw|UpTvFCQZDxs0x~T6t|_yT{q}Q)!<p|f8_&;o
z2PHYHHavdzav1`Im%mQ-m~@4z(%Fsd?c-u&WAE<&RwK?)He_!=AfAF{+dD9AGMB^e
z4ULbF4>Tj#ySL=C`EUWsgT4cj@=>louXSYQ>M#5-tF;&>`XHNvARdX)4W5ALGs<w<
z4b~w*F(p#e!oq@C$%qjllv%Ue2~=ZCqSF{_i{#q1X>~a;KF`F12X|~f|4ZlwAIZ)0
z5e-Y7A~K>5kBBNN#R93Zqi~ngI1Dx-v_u9fg}jG)&83pZ4evzjXFHvI&yXMaNAt-x
zmfYrOA77H7U1cx_m3ai5FF6)9Dx$yKRLOmxz6e+ag1Srw1=iyo9#@atJTp}>pq#eR
zWnM3J3KNrh4BQ8jshQn@MqZD5gmh0NO!4348og#-dztwWk^uw@wRVReqTc-36_uQ@
zx|4GJ-I1n}z-wc^MakY?&6&IT4_tcY+7O9Qg;r~|(D^(baadY!a>eoj!?U?#D3i}g
z8frI+8Fi!AaqD8D`kv{$kZZTcQZOYon6MxIx*vrWcpuq^pNj=6#@;wcW`tgg^H;r0
zf<j_P|KO9p>tQ2X$#FGU#lRpF8$C7JQA@93;*(>O_ItlMbDS>jwLkJGlu1Lod8c&5
z>+^2TensRu60^o@RTrYKL)!2p)oy9BTnAa%&v?mv`*$*(FyU{keS}gE8I#`P*qvI`
zI#bk79rm^pVr-MOs6>JsB70*Y*l#m&r%NQ;@fyPyIz*%UJF>D+*!pzpM7!Izz?IIU
z_FBVB@{F$t|2N&qT4&sTgN<^FD$UVyEhNoBR(z^ULI0l`Zs+(cp<xL`d}FA9tYxGi
z0s+xb97b7d{$41&)dZoC(3q0J?;w{5f2GA0J#Mzs-~X)ysL+hfbYSvzr@HeQZNE_P
zspR_d65Z_R8en0Nqp2*AfHlN2i^67-SZcI`s&R}GK#Ja(DN}(aF<q>;+Fz)nx;b77
z1Da$})?m$r0+FcV>9}93?cO2o(B5XuXouU|!Je195ng~$8%k%dXwEkH0RG;OsqH%%
zxeugvGCSYN-VzE0%QC4JOGA$oHn40O#GB~Um+6u!Ps{0J2SrS>Xl`soe)XjHCjgY*
znk5QKG|W}N58r0wkA(^$FKym1dlPB%&L<EY51yn3yK)h$qOw$1(5eWTd}<z?V$gT_
z*1yntFt)J7MIQgI;U9w{v@?7_J&DWfnM@r9Cf_#G;`cn1EVJLQPop<P(a_0qgMUOJ
zglXMRgEY47`pE(!#ndVy(IF+G`vU(=YO<JpEdLe<^+9qRLG)~NA(d?gA4&cwae3VR
z^jUa|sNHe>4z@Cboe)!|KemCTZr5-oT5F!oox^qrU$Q!%GdDl3gmafEO62O%VP5_F
zhfypx?sw!=A%<{oGYPHodcoy&Erg(Gczx&ZTywoY^2e7)Ru8C|@8Wa>{GM?5R%AM5
zwz!G1!~$NyXl@Pt>^|T)qC8Yy5hi9Ts8y!<Y#ZDc6O-$Yi(j-gFd$G+J2_=(n?w@?
z9&fo0e-1YvE@y74q;6K+4Uwbr8{L{^(bqC0<4Ek%Z@sTe6|5p$r0j)4AjoXV?Co#D
z4bO=MbRRR=ohe%=f8=_8X{)E3<lDCJGRWk0hPIk6?$7amj)=|TG15}SNV@r|&4lV|
z^Ia1-6j;+bct;H(y}6i~yEm|p4rdx{G)75-6LyGxcAAZ4YI(5NxI>QE+~Y_IpEyaz
z61??RsqygkCTC_=I>LYXm!W?}A(Monk9G8v>!DQtc?EA|NIYt1qc?0Qo)i+qWhjLr
z2)LcTjPH%6p%c*l2tonX-Qc$n+NCt15pdqz+!$^kW0>61E0<0Q0>9Jh^PV8}lt1%@
z>2P?}^Lgpzv_`ez)=AJ;PiK>U!*5~?-K!W!YL4a?mLC-RE{$J8WcQhk;CN<B;W{}O
z5bW%DU9rYg%=7Joc*sWk97K9~!EZj_Z7FWsEg*TqsxGs#&KM?BjT_`!hAGt0sJ@vr
zk;EO2agS9_RU~(3y0V%?5ar>;Q#fysZJHRi4tOjzWIKO6^?!jcK`jVwl3-6SJh?vx
zcNqk2m9?>qCVvviKX^lur#GT>o1&fB@fK@L4TlAC%G%t>iu>#d^NFL8y3pe+TP%g{
zip{PErlq@F4$QNs%P~5wP1CfG$e~W{#~`%hAu422oKF!isQCG@(JZlBRnfA6O(X4s
zT9&kIDP_>h1W#e$n9mnDK<tL|m7X8D+8o<Au1e#T-YH~8FKi9w$|q8WI{DexAFs-K
z*vzYyMcZLyQv#h&FV!aU0g2k?+FEWuTfXAjgjU<-`EVIi+jxx}BilZl7)0$mG!qlu
zqj@d~cx!;9N%*$nS=wOSEdOyONs*8=8JVJ>R*bU#PXxk#sNh5r?ukYz_stl-r?Vg#
z$%RFFt17ht(SzmNnXl0~%x_PEpu2<knu8<;yiA?i<uf=7^q=ncXKKlJr*x^yuIX1q
zqs+ivGXGCUyufALEl@pFZufG1t9$1E2#-<M-$PCA&2lE2XV^Xe=MoX0<NY|C!1yYX
z@BP(=9(tPWcNYXDW@FFiN6!FFrw~vE5SA$llm-r;XTB*kWUGVgFDRyJ;uQ}?ryYL8
zr6<tu`69735CbJC;p>%9X+ZqaTcBGoTb2DK5`E4-f1&i;p{6Qu1EbuC9uY!fYqnsJ
zi=Ab@dET`1h=ka*@K1!a9zkuy8+d2|ncZJ8pjy!rZLGKPO$s3nZUbE2O4h`eJ46gm
z36q-o3{JeoBoV2myI&Db`cXQ-pFPN=F9OMl%*9?AmeAgkky>DGps{@a^p=rP$MVy6
z0{ZZU;O@NX5KeI-ryW736Ta1n))Kb%DEbg*F(qH*a>2<WCI$VDNN$@saJ5!0hHL7~
z;ttc!YRQ$Y*u~jm87d6>v&geKu+rLGYf~ZZX$<r2fKau=4F9dyk$&47pf#D5XWhMs
z7$4y$X%3A<)n!bzisoT1N+PvVo{V^kEoz2%3YMMWILwkc!$g&+cQo;dg>iBu;<4k_
ztlcvIzYOW0=fZymemi7hv2siY{|J<~V)ihStl0e)fxL4yW=Hvm?mPtP@+FR`7`^0|
zeP0kOxpBZd+UVr6A5WkdWKW~#2=Hf}T1>S@#%vA@MBGNlP&%5BJF&zd;`33Qf%}?U
zYAoW`fIS+MP67~goIEX2Xyd#Zy5ng${R<R;<lu{UtcWICHJF0GhQ-t-6;8z2%vEo3
zztv6&7KVc+&7Z3j7QH~z*k*h}GNWS7!j@8;o(HGrj#rgEcow+AA2z?pIdOYkS)K<I
zR5zH7U_nwFJ<lWP&QSiqqqy4o@MOWLUYRP*els<sNJoI+AeZ(L3dkp7?ct(GkHQB^
zbI(o4_Rh|#&zK=0!oa{(>NJfN+95rJQzm5?e9%S(Q``zrsFGjPEV;^h_ZE1k$3prj
z4@3As@<!9=Wu*yr^fI`OaX5Z1grZEjlDYW$DAE)|k<aZ~TW+NW3SQT%0IjNr?t=5@
z71sVSbcT;-t*w%Ok>>R4;^B=Wlx#KXWr>%9hjFtsG5$6y>Qfu`rOal8T%IyTrpOVV
zh7Tl-`(zTJq7da_L@}T{w$$61QMWohd|&S_Rb<&W5{2%yxVHuFoce;XtYa9YJhQd8
zXZt77-7Br>E<b1-(~kt4Fx+oW`jFSCSh+0@aw|%Z)$JA{J=qp)O)YFnFH%JU;AS{{
zsc5MFDsgqUu@r<W(h$ukjafNXP~{rqGl;Q~qKtS88F(n;l-II3?T2SQAg@m@s9dey
zt==UWy<h~SAA4V;wqg9c+{StXm2-v9h5{K;s+J(DQ4LEJJpfYJHtJ~{Zt)od;KaFU
zS0ZaS#7qi0Luxm0csYo&xy4Uo#0H=lzEbdTc=g30?wrR>+#ZEHqSr8drts@dLLoD+
zs>lQ$aYayc>}j3X7UwRfb|#;Dxbb-DJhX$`|Bf`zVkHT9gW^`%eXSB)FAAkYW%ne-
zy2_j_YP-C0grW*(S=n;W3Ben4`HR<yfH&>gc1{RCNor@{g8lCh;Yd(?!w}R`-o$WL
zV7?9hiF2vV=Xue$F5lh932NxEs#-YY1N}Em=?@(AK0aFmh{`$DCfRUB2E*b<$K78-
zH&^nKDm-6}#VXI?t#lWv5k*M`8CJXMJ)Rnc<J7$-I82-t{%%?qNw+QfW=j-Gc-M4K
z;f`IB<A}$Zi1aV#CZD{(N(P(Q>3st#P6L{ej+=1^)w$+2$4>3g(liwJ$HKv}FPc;0
zm)@4gnu<c=qt8M6XgCN4PW`8oZ4nVPEl@GtE$t8IOKl7Fn}jb&O0+b~SU$D}MQDq&
zjlG`Q+&PWL4J5mnr+;I#F>Ic(&%d#eF-F<ApBlYXT1maASi`DP%c!2at;Fi>@1F#0
zFg{I&eW5aO#5)Svx8rp%_hoZLFl81<HhkIGqM}x9BK;VTy?StMbC!il(sDb*!gjI%
zqxFw7nvXVe%D!JceLFUbAI5^wKmmpFYpx?ACfI*8WpND`ua9Dc?2)fZ&QweskEW3;
zj5+Y`sG`Sd9#H%2Hdx4%92A)IC@<A&qAzcYDiM$SHs3pcUTCn4p#%HDOl*~u;u<M%
zHL#VgR^i~cTiSY15a1)Raj2tnb{BCy!^$e63j07}4Ti2UCrtMGY}nr9i(^2eQ3^4A
z9v@#p^!>$p_aN4z%CMsH+YDS4)F=50J)^L2M58JpY4CGv>+?}AcIedCIUHA6I<tP(
z400tpTx6P%d8*gv$^|~$oQA<W?mC)_GFsS2g9T-8P%#LOxAL8iFMbBaaa_AO>q_uY
z!Rs@*aL7;<>v4k5LL(^*h(t(o;kfANLB#%S@^lsm63ly0K}3;{Vaty(8se!L`4~Sf
zSxBkSU4J+Xy@$jgq>-QxoRG&tf;3W$Gzw04N<s6Ba3H|5z@H3!-NfTyZ!(pHpiG|J
zfzDCZ_NK3k?VG9e82ImlMC^)InZBYv)K<}-g3j4}s(QThP@EZy5Xj6f_SlyLtH<X?
zFgs0u1;=#ghdMF59trc_n;*0h&(ROW9`GHbYJ3SEA!=eMzm{N+iMFtnp`}Lm3UECF
zZ>?=6+pL4%^>_Y#b}v5bZ*)<fy=}}q#w?U*f&mb^4&n#OMoQnT-Q9=<B8%Jawco)n
zUb*+C_&zvVjX)PZd`ogt!J;3iiAZE<>^%*m+P)btW0;<>4<^%zxNCCtp92KPuqVT3
z5I8&{V=g20RJcQO3GqJFr`)xi?8nV;JL!obhe?R-qH+EyoE8wN-h{q@hlL_-BTgpS
z=CwuHMiT^SftV(g_hAg<6B@G-S)gbMne~m_OqCH`I(S|E<oM&>mPi>FL%`b~i|BOD
znS!NfGB|ME3zHyFTWf^R%RweWRq*vAhXimSG@mMLxp}@!HQ20QHSpaGpq5T%wRvCv
zCrWA($WH|!5&fm<+rh12uS85uz%CVXI6`vo0K=~jo2}05kX)&An+WH6h0=-8oUk*d
z($@UST3i0W@8k&S2fMQ8(<dVpQc^+{7#P@Rq60ybN>0`gLNF_r^eZ@({^39}^e1&R
zg-Wp;*@xhf)T|6oST06-okrXIbnJEqiHRtXNX!)+%o@oY-;G8@6g#$^(*MI`5UIP2
z6iM~@HR@mFeXBg@kCACJ_l46_4M$dG^E;Px#rmG;AlX6_tf*l0U%b;7@xD^12Luf9
zZzb|V+u4vfB6)9Ey?G1N&+|jetKZYpooq(@_;;y{H{<s|tEAcElEc>fR#H)hpS!Yx
zCQJ&lshdlIh<z?XYVzyD(_OzTi`xd;ovW+Jt$7S0rSJ7U16=*V7u}?tkO;0Q-oEFT
zy{n=~0xn<ZTk5JjhV!&Xk>IxH7306udkrmr08InG?PgHs>U~jcsi==x{NiroeiUe8
zF}`uKs)yAZi1EOJqFihxtJ~>}ZNXV7UL1X%DIr5Bt8>%yOSiV1>-ubBRje18L9b%=
zBREg@tnvzNSD?4$Cqvq3`Q%l{mN7?-&hM73qTtc%uo(mYG7HvT@YiT4_BND^8@%}+
zq@;F8<$FHYTuW_x-dMJ1n7DeFwpv9l$y0IkMFdqChw9Ykn192()rc>aNrC?I{Mko*
z{NG>=71Wh5c=6S^2OHVO-&T_u+oE)a5Hd6Z(ZjxN=JUpd23v-y<?k`6IhyS9$*)%(
z*)JlKoBbi2P~K`d@SsX&Sig=o4y!%^`}f|5%s)Zxjh+EOsHmJw-U=_>JBdQ+F9`*%
z(ucC^q<ifZ;H9rfnYQZ0Md9+gDg}|3SK1^;z-~Rm!Nmo`^qcM&5fVsY*)3UDis`#R
zXN~Xr0^!ZymRqm5`w7${PB04|;T{cQ^}$*D){Ux=QJ$N7WL4|1Au=h4@$<YPQdVVP
z6>HQe4{8!59%Q~}kVVZiD+=s146xygI3(WI)@fcN3DO9rXmyy4wG%U(t<Q{!D0zqO
zpni)>Dk5^DJRkmbrFYq8tEpmc()dcuCEu2$!<_CW<)kF!bza5|ItHqb36zV(Sm+V2
zI7?r~1z&>r7#1mqpp8p~coUKqdR>jFLtUK2a@2n#l$=b@Qy<SDCWqUyC#mbo@^a&k
zX)XRs771w#Rj6^1aem#uv(fi6n<NNT8BBtJ^e<}<^Mct8ZKL#s8<%8ZncAY85c$$!
zss*X{XfgjojnyqteYpnq4h?!V8Rz?X>XpKf_psaz0vxu=+$Dcr-w75;p*%1}36%<&
ztTxzvitpFZn4g>zHvhxSMDtUL?2Z<}?h!yxl;bGS%$dvO5P279<OvmN<_;@$+m=ul
zEv$Ajay<SyO1eREeW%J-RGTnO`PmjH0IH`$d}|<7nFGbd#4~X(7zcj?YXDkr#ANHR
z`$@CY6(5VyAXY$+2fiA<DCVKB_C~gdc1Q;I1LM&`5r&NyxK#vphg{*Z_QZaC_c_m&
zFtV+PUWCT#*(e)PjC)+?hD1>Ekz#?G9(Wt+LscYyjkMbSblP95&Up_DHXu<*yfv^1
z4j`5`ow$QUg{b$A<{PR-nXW;ibScyD86iKZQiB48BX%)5i{4)<*61XWWd_cG%P=>a
z>9wJY)7<x9rdzE#^E{9en=cTAf{-eg$u$|@k;Ko=RS{OZ*U#a!u|0u2M%ME{FEby`
zrSy*&%yy+UMW4ywd*ba;oWJVW084`o{w>)V>bh>d)|D@=PRIw*^b;P<Lu_=u9<iHl
zHrKTX4(CrT!>Ura(!Xxeb5=8$1?Eu|6kDetfv6NvCbm7?;UHxA%BTzmtj_KmB@sR(
z6n`-VxJe`B9!}i|6z6zc!GKaBe<CzgW7t7Ph|%ygX6RR5Md7zz>s!&{@gGtXWx8~t
zf*A6p-W9<f1bPhwKkEhu5UZD)p~gf*jpLoMJ#LO}R$(;j%mAC>Wn#Iu>OeZB=By>5
z%gJx$+Ai`7O_S5RW#el5AN;zYCmccgyvdZ3z39)BSH7->FbM^DH*QE?UzuLnW-kBo
z4X4M=-xyNH6cv4@;?u;FKHtrmVs;S;=<vVM)m4&4L?hJ8y<dkWkY%-%4bonjmez%N
zhrC+h)4<!<7-8^yny|H<Xt>^QO&%O@BC~bJTTkzDHeS9uIK$`7{*=PeU0G`~Q<C~p
zAPN2_+?^+*#EtaPbvwUHp-4!uRJ_c{6A(DN1rEbqe~gm|b&N5hpQaI9zlpqKF`PQW
z`I@<_Xu<+MG-P`|X!EBCg{U)>O#9_<IYLm-2>ztlIEy3S=1AuAbYd%Nn}V|sDQfvH
zCIIq9JRBoMxjX*t;@6HFzJny$?XjdH&uXG+oYBQuUXMqj<O1@xL3MR?o|ulKVmWf9
zWthNq`&tZ&2Srib92A4HSw=ZBLzOxZOWXcvo(l7oN|sWN)&Jr1oj4;WihW1^pJ_^A
z6UXD*uu}1glT5EGo+@oQ{U%fz|GVt(*J6z>wT?rHbNz<KE(qn1+9*|Y8eNlg8Z2>(
zHrn422HYn@spLNmlmP#>?{@LZ)DpIqWy5f9En#*i*-6HNv-tkN%|t|B*HgRFNap_a
zSsKeyu!pm$$2*Y-sXw6~+qq^cf<%*y%+HG%hJ?EI2O>=3DUdK&=PKUOj<V;EZSnUh
zPko3zn#!1(6YxGq6F{dV<t!>#X*VS;dh;mk;^X!Kbv*|6+ZPXKT}>_tg^Yj@;H>!%
zk+NfD(C!Dx3y2hvch-pIfJo71w|c>nK<8eK>x-!4bVB_x7+^8XuDx=I2+-ek5<C|N
zjEcG5W$1MpPZKYwcd!$iBq9F_bL~;F6sU&Z1c|i$qWhbS$BvaI;31+l*ofz*5}Ni?
zmQ4KVm@Xv`fuUFv4MgvzBJYRY65s`#Q)?`OaPYUyHpH{p5G)CG?fE#!)=va`gxY8Z
zLZ7?`1}^4n!AnZILM0qEEX^S_&dco&YMosP$)TxT=6nmTr}NII9OLIWq65%9h0Bn1
zv7zw=xUgw5T5l}`7kBL3erdQBY1F|GESUwE2V@*Wk+uUN{VfEUW+m>+^K(86nvm}q
z7O2wJ?JvCq<*fjZD`$;3LMg#9tA>re{uJC!K#2m+Xz^kg`(Bn0Lq=~EDIeUGtW_wR
zN2R`N(whuK2k^Et)Bif{d|_;+<glGL<obP^CAZCSU=>*K9+Gfb;8qkB2_6;+iNh34
zdH7G;AHZ+4m?Oj4Zzg!iuS3epZ+_iht6_}XiPS^f`k|H4L~i-d+JnPB`o#69`8_AG
zK;Y@uoj?~Aj0s`|PM!{Dn71y}W|@&LN97Hv(yLhX2&QcGdT>D*oFY8%Vp+qk+Dl-f
z44>*?`g7y0Jj98=(8~pL*ZA6CjOQp4T;?3GF@}z3h2>@O=4(V1=RXo_Po~NU^$&T%
zBV6PBmpw^0^Jh`b1uxS7LKwmuB8kx&?>_%vUT1FB(MY;$h|k-~LycPJrFrL<^tHxd
z5GnLxwWAmH=VwTyYR$+t?yWV}P`G;MryD(wXd=2H?&OOLib#`12ZL=gAu%T4&kj89
zA;NfS55xQ6##U1owD-l2TCG03+cq&gbBW55O~L~y5Z)KQX1U-L7MgI@Hq!lNSK5}^
zQ&Y8Cb<&~gU+jNY{i+EI$IzwBuYIxs=yqZm%$U6z;6hYgo_FBD!+(Yyl#p6~Kd)YH
z>ao7mmpI^q#lm*3)>rJoaxn!fRx5ITO1YD%-t>yTARP%$2JNy8^L1y3vn}v07rR&m
zr47X5hjkMXy(eOa3)<YJkQ-f#-6b3~>+T`KwWF!XBc{N-n+-Q%D7!}BoIV2`VzcFI
zcYk_YWz9MiPo+o%M54;FzioA<mXNuhEJJTkKdzpJTPCzKHJ_B6<aio9ubF_bXeE5M
z=Eu%=kT7MN>Y|C|1>fvnx_m`C>xvb_k|MT+_8Ol>Z#u=-p~F&ru=lDGXS^-*vWWuV
zW?OOa0p`s^wk)6gu^%RFbEVba;qNVsl&oX1)u*DzT$^iEEky#%0XL)Z)(rO(<<K}b
zsjNfEEfr$Bm;MorW*{r$G(l@S+{~OGH`@${H$|@0ZM{?5oyNx%C2D>D@<Q4}w*}JP
zge7G7hYut>H78LeLuwI|Yr7W=qU-K)=A>;6aPe_1b<aBcwsAc#mPvaYZdRpa^GdwX
z!LV$}0bxR|0`I(p8&>?1@x-;f1<G=6{1bnE{D)qZJ>wO@k(+=H9;o4Yrkq940*(LS
zOKkalBaRP%s0^CjzuFuvK$i^8PJf%v)(5!9WD4<9nk!&ST=;zh5D&pe5b{>ZlHhny
zo1w)|##8EiWg7hOeZLa{6vNp{|LGR+9rt!uKfS1dbWM>b;<5$=CLZ(D-a-C5T7kIL
z1}6>Raq0i`Bj*z&vDPc#F$DKV*%|aHfkp75Kq_~WoK98pH;B(m4m{4sfq+h2mGVkG
z)hnAZMT<=KA3TMFmOa<+74LZBxYy-R0x~gEZTF`DVYyz~cfMAFz|4`o#A~hwi^H&R
zd|Dh<)rY9vX6HL-B(lg<5DfeW==FI5W_iIb=smfK-?n6eP`{*lX>2-3L5Yq2S4%7o
zNE4lc7Ar*v%odg+H6pM-sVi65s#*&@y`mWZ#|W?2zz7eUCif2WzzDzXvO5@n5q3%C
zlth8i@p;V+>j94>rtB|28AKmbMBQwZy9Ax2-v{E52EGqj`b6RagOamCKdx{EouYnl
zw_B2E-6ME;V*Dcj=2<INxcuLb{a=D!KMuoWi*I!KiEMpMH@rmaIEnlzt&*NSSK-wh
zS#HXr)nG)>bftC3z$sFqH#0#8h=^{u!y`bs0Jenvl`XNZ3G{jZY{~Va#EqPFSNZFJ
z08nx83RGBKYBgK}prYK1eWe)~&`zMj?Z0eE@he+W{M+Js46r4Kv?-i`Eh%}OeTCN2
zJPpuV5a!GR3}|hd(Rx1_v}Oq9dIO*zz?R^>vL)=A!tK7GB`-U2Z@`wQy|N|chksnQ
zz_ir=t6T)p8BMkJ^v}8=CdHAX#`|BkWcrmYncl7Q+5>EfE9MA3U`te9*^>YJ*mz#Y
z2G|nBSGEMNGIvz~n5Mlkfgi9X<)FhxYS-2+j$n=!ebkTJ09#V7FV6|wkn$Ph<yrq_
zOa9js?XRY2iQGXfgr4~iTk?M&Th{B?09z9J%9bFiE7=pP!mBQ~xWd0i`$xVpv3OpX
zUj3aL&+T_VT{XJepA3(T>;Yj|LlcuAASId$LUf@#ZO;1>qzJ?U1YyX;1HfAp4u}#G
z5|TG*tQH()gD^%$M&Z%XeLy!Po<bI@-hPb;REClOr76&7lA&@GAwj%Y^xwsf<9|!6
z7|xU`Q)WpY&T~0!hd1A>cL#YqKmNqA0TE@<5``?F3bU44Uq(==*NSy>bF+E2KUqMn
z*HZ5!lc)ps5)D89@Z>Q6-h1?tv*S5~0;g_+b?s`bPbGIXd@BJJvnC7O1)6_Xu@|OG
z*ynFgruWXYT815L+qP7z$jYCzyPBoy9so1){qgw?9Wr5m%bG%Dt#Xml+h&f+sF`1a
zwzlso!v}smh1HIYU@lAp;+0*}uh$8WDMGrO*iXn(Bdkxsrd$`$B0H_OH9oicV#Hk0
z_WSM1RUXO+)_<Z`@o83VGI-;1x}4pb`+4*Z|4783_18F^`iUK{TGS$8KTECQutHxc
zT(zYr0MMh^<1a^w-9jikulttHJxA$h6};>$9un7K0K%j@0}$phU+PHEQ)Z@0vkj*$
zlOUecMm^CcQG0xwEQatu|Na=7%!I@E&+M_W?F_X6mi|gB8RBnFv_vy}PI4zvIpdN9
zS~Iv&L;}*Wmsfq7R%7;*&-39GP4?tZih_Ag2Vc(|P6BNOE#&GEtFk75zRdZdE4@}H
zQ3Z!x1R*{s#MNqnTqvDIt9&VzkcBN?Eq}$=`TtOMmSI6Y>w~6KK)PGH8>FSATN>%^
zZlqg85b2hZ?(PtzyBnmt%N>5_{I5N`AI@I;8F(k&VP@W$`?(+IuKu1;&k_Bmz{=|G
zia&E~j`G+k@vrtKk?)*#-q)ZoWhepQ4SY6d>9=~#wRl#KSvojWK%ij3^7Hc}8;J6K
zr~}EN92~-*@RlkJp$RxGveMXXUh?ojN^T9r_bVl8dhgtD>5{n%MFEO!^>2=RDz|2x
zO>#p!paVc&PWy@PJvNpC+}9wu9YnFG=oS!ZTE&k7#WDgQ1F$>rNl!q!9&CEGHND|T
zu*t@?U&$FMjPQ8e=UPys4GLq?H(Z>*piL8GNW65EJU@x28u+j{sw;9+fuQUjRZr+-
z`rf?3?)RSaE|+;WufpBaO{mk#ne7U~@L(c4-Q@m1V2Zt^O*EdY@h0|y8oiY9CRJS=
zQ`FY4P%3CI3eT#%&oR!s+?2XWt_KyJoZJ&pPkf8+#uN8*s|?1e?avpAj!8j%W7mcx
zeFdD&|IjE0JQc1tUB(2MN7icnVo+r~r2L<AJe|m`3Taf5o`iY0m-2J_*9H8lXl0}g
z5-MSMT}7gbzp+ILfr+}5TZroV<KMHext%=3{tU!U#1ZRC5qptdXRnWHZpR@~qZzqk
zPfZ@Tmvr33yun6y7lv1JWO=OBjg`aKnL;sU$16F7d@(;|VLZ~Bd|+WMFe;5DY1^Ln
z86265uA&!bHrhZhn%9JDXO~ivj3+tR7{$WJk{WMj_|ocULCh$iNxRs{>9t_xcJENL
zt^-wwxE3>1<!4DIoQKv>cmplD!xNbUFIR`lAwJz~2|)CU2sXHov;T<t%Pl>Y6^aB{
z3jyG&sbbPzACE8CohymJBm6gwqsea#r;=aM0wHADX#_Kxl-%JoIQJ`^iSTo&7Wv2t
z|1}|j>jB-h&P4OxMC}2u<1-Y}#FE>|gv4zMgnMf^U_QYdmhFCWiw$Sov9?faZPfJ(
zZf(Hq=6LxfWu1V>sYt?w48NiUet3gCf=RJj5v$YId$vm58jH9J9WZxw-Wbf++mq63
zlrdg=hNRIHPZlWl13aa-7G#0yQ4BVcxoaV4a9D?eLm>#>-L(*t8WIi3i$=LlEL8as
zS;4}yb#fA0a@pOXL&Cynb3w!>hdwY<szV5YQAP<iZ-Grc{7yek0})QflLhF`BSz#`
z8i>gW>y1oO%`DVcc0Tey?rt+o5%56{!b}nsB4l4vt9mPQHZsLAJhaypOe29kYYUDP
zB1`xkjHWsT3t{3H6dhK}ZZnu#`-l(NgU>&UJZz?jgcex2qXUp+aoZ_7mdQ=1Q9m|@
z_HybE?nJ@&GfmIRB!d^+S>07>($CCz4)T8IgoNNzkJ0Z0Z~tU#O2u4Q_#ivQiK$UW
z{@Mup!^1<C+H*_942N*1ajyKD1<_moxQ^E>2@F{L)WZjsN1A{DS?qbum=m!vk+oj<
zp*WAVUo%DSwB3>UX)K_{3?n|2ImjV_8ue#?%)2{^%1tYm9*XFX4KU6K5Y|eKUmG}!
zt}vQoKMVrA>=gn*Ovv~_h0lbC8VlirE!$g0-A}JETj9Dp+YG<Tcb^1N1J^@GM0|J#
zL0}|R)MigeRN;Ih;rV#|?zLw%N=Mk=DSQO23WO)(w+5Og$I@+KDGcD7XjhoxHS&kj
z&cUMWLVcm@MWf51c|0y-9BMRTsIdH)c$?4vrg19%)^BP`kx5CM7aA5FOksy9ruW^?
zb0}x4Au4lQ-OEL1V264d2O8R&GYnpyO1Xly;rI8m-z@pU3w<KJ;pmjCHgl}m55`-^
zD#dDa;7m#x;+1X#I1V=%%^<$J_=D@p>l0LNzCKXEj_-TEg*cHfkGzSv3mjW<<YI6R
z%>cy2yt?xlN#pCiIv@Qr{^<u>ryv_VJ-7#uNo2Hy$T$Sv8Ia@YObL@(?o(=N>fCCB
zBjx^75#{yW=vOM)u`)gWZZ?1fc8L>bKCK=3KfiNS^xqmtB1!#4^)arXd?jnCB91nh
z0X`9BHycZ5iM?Z<!zTN*t5BCr_*%c^m2*}OZu;uGp9C~gcN6rF?l_C%V%Zs=B84q%
zuv~9MGcq|0sz=F!JTuz-Vyg7JmD$}D#2c^J5_A^UE60sz1lB`3*TubAbi3Liu`k?@
zyB$&vQEk-FTKA_arb?)PgF~s7r%`{U3TMTwfiy(^epvj&vtW^;uYwP`mn?S`gZAOs
zOFsRcJ_y{zPbj!M3W`-4sP*Uy#~s}}OkHa;!{hbRlow`P-X$OekjYbQ+j0WwuFAA`
zrD6{*RlxHMDny6BBlLsRtUQr1Ezb&{*RudY(<{l<55wz|(*q8X<$6_?3^Eh^c|aBp
zWAdgnBO4Os<<7}NY(<IhXdmhIy1^DykUB{`&xg+Y7(=m+sXndBsO-@AllkOY8`u_V
zxvnoH%WDgCGYmeE0c6ZDp|1{>gG3^(Lw~Z24SH^)rYl9gLrjb&v;{GJpFzLz*#8x|
zrk{?>+=&VM(C6h}ZJVJq=k=W8s+{<|YX1sNwyM#LSqtzv#_M9_#CCdVJ+4v;8ItKE
zdgJZ!l#ll}Ts6Hnn&O-JYU^EvHo0gg`hL9Xkl6lzpLlF+ZF{ZU&o+7;&$pxvA&j$f
zod1j<prPSz|ILn#K52Ux>0vMenbo24lyo2N<^~3&r%pgNyq%$B%4@|mUdT47HlI6(
zt9|wLK4Jf7A4hvQR*z{x-+Rq^eaC>ui+N6m{V6&_hB`WD6<QM39T5qYKDgKrjja*S
zzt6y(W|#WPs?x*DivWVj)W+d%x!L_CnHl=Ip#U`%FvTdxrZu_357Wqrg$-`6&r&2x
ziSMO9%_%K;J!16-h0;sl)JH|Q8_ZQrBiJnx71*uz1`5JsKwx8s!je<=;(d0vh#4*z
zSx1W`XOhmq=0d{l(Qqtl!6BU0d>M|aJa*ah4NAOfr3mdG<mDO1X+0?H1ib<=jYCrt
zQb`$CykCn^YLF!z`rYr?iXSfA=z}DsK~ja7tdgH74+Qnjmg`qjc#7s<0zYYJKhOE?
zI=GaWhJ6~T#DwW(b!`n@r=CC4om2Zk+gYbp4taZ5z=^Q8h)Ebr1Px94V>dPDL(xV=
z8(P^)vtl+ih_IT+5`bDgu(C0EpG8@ULqv13<n^??Zn6rId*9Qf$uO#ttKq-Y^p~Hx
zJX$SMt`7Zx$7pPet}B&-w9%SW$Q@N6fKGl*GNVN6l`GirIRyL@9!-?{W#a9K;MfmO
z)o8cak9dX`YTyov@aA~^J`qK_YR2^5w|Hzs^b<)l&QR|SXMysT{l=!Tp&gb4PI;7Q
zdj}b>^83y?(aI?6K|T;62c!1rw!>)Ub{Jh&s%;Sc#{e^4&2|xz=Xj}iczIEN5R<<_
zj)-Sly9Ot#|ClQ3^yvnKyRSs5JN#hlSi!n;-tG}S@9~sf)3V%f9ZFU8&uA+KCUUZP
zL<}vDD$N}668<PQrA~(BA-zs=VitsSGd}O@5;C!^r>rb8AS3ErgEb`DQ7+Tv6D=9I
zO6tx5Ay^T8XATe6GbQL9h_m0%?>IYpiivW%SD5VSW&})$BEIn{#U)gBehO}MD3lt{
zk$}bPB%=0dH^HhN`B@0qEG*-Y?!dWtDRLX|#ove{d~%j?@qOIWjQ4)JQtYpn8+E#4
z+FN*d5b3^WAbgKdAz;|jhbg;JU#JRj7#BOVzu4B85ZH?04><ym*oi&Yvw=x6v%WXB
zkMJQsyg;}Wrc!0t(m{HDXtw{8_GNip1R{}`xuLM<NE$I|xJiT@9`;x^DmtSAkhut-
zp*#{Qu^Ak{6J6l@@sn~tk=Dvdv6S@XKHGKw6_I32kZcsSgY^nX(Q7O9xl`yoqX|o>
z+vGe;%}b7L|A!Z<5~_S1*8sMAs4Queak2X^mlCRspk!uW<#HR#_=6h1ESlIzVl3#D
znMK@V)T16@<HefG%g&5V8b@DwEWa#!SZC!fvAI-=PhF7Fy}8El4R!XEkzch(Z@o&7
z!6o0E-zlqhW0SGc?8xcvzKPLSvnSokhh4U%mCE^zIo2XMc)hTD!>gGi1X4bzm=#R3
zzS&9|sUv1VhxL2c_%E0j+_i3C(lvT`4zd`p7ZzyZ?+y|$iT)uyDg>+$2*<~ZF{EER
zl4qtT2^o0o<zEk?%aOn7#FFV+!Sah2i?N41(HC4(F!||)F%5xzD3}d_2|Q_%FDL@@
zeV+)dIh3J6AWZ@g&^1?tI9fm`>H`sARF&!P$k(W4YX=8W{o*c|1O)a<)EZmT7H=up
z3E*hJm1GDoU`4v!-S)*0QizLV{Swa9gSHQMpk>RVpfm1H^NANlyxuS@CrAWg6S=mF
zbw>Wcff)!Lf;RUv=zt!k6r=Dpy~;4@wcW0KyqMy{{jN4;qO;_lZu@C(IG-n+w~yc#
zI{9~f+wISOVTtkPYkl4QbKE^Bdwz13fZX@EBOtQqN~M#xl5?>M>YA@In7xxts`BI?
zS#3q*NrAa3*3)Y&&94V{A>8pt-oqJa<@qsV(`CgGdiSABBCkxt=W$tKgbNgGoj#*^
zNc`-*rE5?SnQ<c!HnMp{R_fHn!48cU@iOvT<?mWF;bQDW;nd6m?|{<OdXJkNMu>PJ
z%R8uvdS;i+lAfFBZD4oyW*nXEyNqIJbCxVu1J<fM*(jy+LRvWn9sU6-_ld!2UMYQ^
z#ICm_g8l&$t$JTFTB=Z$n^*Bm6H=CRbKzg=c_{p8<e74Pu@u>>mi4M<pMVwVAe{H?
zw#&gpA(J_v7RwG<$naw+(!z9UgtLad!NU2sz$6Z%Tcs&x4IJsx?`v=bjAP&*CnFr4
z-wQRszkOwQk{QQEMQ+0Lmy)>sYKW?JBBgBTjW?bkSygXWObP|Gr(>oz@s<84KO9}t
zEBsI<PW0os9+FMLrEfY`elPga@^!j{3u!buGxS(Ln~+IZ%ogV_OzS$^{&|#xFUjwe
zS834ba@9KDUd09YeH<zIC_4^)7G;A35BG7k=7YS8#RQ&t1ULB`qX4o~U3N!-{nv5T
z`r_Ckuwf3Y6&(f=AWovvZu#vxQ}!240%+{%V)bs2phsSSek4vu&oFYp&`?EO|Lz$C
ziYNh6R4ftBIjFRth7IIGc%zYWf>MArf}By}<fVeMIfgDK(Fj(~Q=u%1B4e>VfgmNK
zjoi~jJZ}qDhfYILMk2ee457Yc6L4l_p-j98Tvs`pHGDXofn^+jFtZ%c!$Q3&k7DUC
zTs$^HOQCF%Bz|t!VRdyH4dez2+GMDNLMV8rEQHs3&Nj;K$~?mEJmMkR<z+*GRqT+h
zGXpcRfuczvGbo*NU4V%5l_gUiVOoV9WxmZ)sFwJccJ6y}!%qK;LWIRSLeZZy+AW!(
zp&~hY)8K8L40+ZN^DR&mj#*xc+t7Sp*qo%H)GH3&gS+!R4eml{f4V2k%T5T4JmhsG
zAeM?%?C|dVW3KXEq@(M7)QxJ{>^Z>TdP&arZTHv`CL-P%i7bAgHnS9-B3(o!?VbOD
z{AC2HV^6`56#3Uo8nKD<E=+grPq*WDqgj=OsvyMq;f@R(r=wVSyZ|H2NEcQstJA@%
z@7UxQ1A<_a91Ob&@)YAG>FOHNt9UWm$W@u@jC~-TKk}kp_mNX5+Gw`Yo1xrDu;;!;
z-)z!e0t%eU)Q%$%sGZ~>L(6TsJPNCGebm2QN*H(i@hhiXgl2FyCXJR&*uO}kaGQ_3
zA1z53xa~r#>(Tbnd7CV{c*PoL+|?k}4i{==KOsf3&+7z+aCp*onWo)kOU06CHn|kh
z?r`Q4;rf9{83#@H-$Th9<E1(!&BN*Z?l5B=vus~FiSTyB(~{Xu*_Wg&V?7b8ly%9Y
zzJLGzi+}=kD|56g;06*q4G>Mn-9&i~j*jR>3fLI|pFTmnA}084*^$9DKsPHGmfrHl
z{UZ+ZPqiWpBO@cBW`*Zf)EAS;_5+%-|K%H(+R|5}eOK~o6FyxoV8cadPJ2n2j7~rN
zjilWt2B}Rnr_FZ{BlG}OIX`sO@~WCXE@S(50=ifVH)|Tls$pz&SCFs7Sx6-%Z5ku@
zQJSY96ERpT8Xg~@r;v$gTIl9}c4;Ox2l6qFDDQ^x#ljS@Go1*&Q>(9!FkRSz9@%jG
zJMRn>G7vE_nd_5FD`RgI^^YW@aawR6pnYI6Bi8d2++I8{IUegNLB7HN047mS73;i?
z+i#hNQ}09tF#O|i71};mu9D5-2IEgCozE5S??|`cqB)uj!gSgi`UndizSPL!0;kyh
zgz{fC+P@+V-^68Em%Ma}G8EmUt?tK5vAA_T3C!p*&iW;Lj_~xuQ)i3fd?skU`pcBp
z;Fb0Ya1SXVFg?^*%j#pd$_=SBTcbU?9Sa;EE*Ux6(0;q~RmxZQUdp=b+uOz7N;Xc$
zJV6}}O1W{yw3JT%Zj`VHvFy3G_fn550{S{D*%d6}Uq5r&jqEB*x99NtX(`rL+63X+
z5aW>?;RU#DQffL}Q@S&vw8G@@<y%?$l+0qu22a_#reS?)IpyQNV`ZfMY$A@HOrrl&
z)1nTm1cLrX-Z+Xn<fD!pcHk3e@)DbZjr$7*!^_))VOXly{2|z-!W|A8n`l9~&Bs%@
z9r#JtzMv(7p@>*D6bTHOz)PAFO;et>zR9`W{sI=$8jm2$w!m%VJzflOfe9(F+U<?0
z4Qp~fFz51qV~V0;9pnvqZ-h3`f(@P`e^|5s8*C9ls&pJ~ApkAVK~Z}3`>Q$ig&E;g
z1<>|2{*CTHkm0)%qD$c7$XR|cf-h~cFYte5kuZ?@+hM?#V!uQb(-0MLe$!ee!=x~;
zlK2I$K{Tj2I~9`{+`<^=5i+|RZGV0j7l2qDK$~xrReU}svOTs@_d4Wn$&~|JTJwAH
z2$Vo-k@afUw6XD*kEcId<mx5fAJyp384^AE&4cfPS_F_a0h(jeSK6N5Gqb9YrL~Pj
zEBh&*0$i59!ydftASZ_x>!a&!aCktqnndzlX6H`YzJF%q2#w;b%YD(t_|jn6%#*0o
zs+&v|LIhDIv2rPHCce-#^kXANgZmqA{n&k)T;8qDFag|0&?{O6HC;Kv!}<eEten#e
zwzBd9B1PkroX^?@7jyrpWPh__9LmwVRj5oO%Kci_j9==LySfz3IyoB)t)CD6Y^&r+
zG_^1M8goGE&OBh<EPY>;E+BDST!AE$8j}v(&jLlZq@5#De+r##tA8qjca+xb1N&{U
zhGqmqXNVNn#)aC=eLSUh_dpn`?djeK!qbP&={t^TBzHwYH0cj?LFW{elDks+Pe_2m
z^dQHIIUl^r60Iafl~3VBCnry<3=oCg!7?x$Ma(c^&x8%LJ*B@9G+H!8h0X|f!Z&xF
zt1^vxPcxuJuE|>x)QN&)OajIH=bCrfQd2XDca)rh=re@`@xT049<BB^4&m^NNg@5O
zf-w5JmZ-|<T(hAJ=>Fg(tetgr8OL{j)2?NAMO5FnGJIi#u1bSFYzWz3^Gy_BQ)|k`
zBhH5Z*i~(Y)7_tytI}c&@hcJXB05ISMacUV)9ag#VmnNs@ps&sCr90rFxqBvNU3c5
zWgywWQ}qOSQaknZCY1BLK|y!nX4|)>I9R^U{CvB5c-=M@i_)){y_yE=KvR~GQEU6R
zlukb5#e@b2pd2?v1j({Y4y4qQY~IthY!23}WI?#Pnn!=H-jyeZ<hRJ%NZ2A%V;*03
zEUkISEY8?#sEk_1m(#?3dfuG<j|;&2(flbpcbCr+NnoK)oOJL_w$wk+kMcW#xrcyO
zGR=fj6zU!mBRSdgFB330){DxY@Y%>W<LD)jlx^)U-+IU=8<OqHSqaMCjA<vo_;FeR
zU&Cp|=43idKU8US!R>N$)!#9azGk`;Vr*B=wdj@;HOl&m>bx7$Ocze~d%&d?jFld_
zT@77#XqJ3y-e1Y&RoSC{uxHbp1)`kFX$By+DRFPZNMtM2(eSuBeAbUIS*b!v7i?iI
zu_tYCIZnzd>-yM9r&KQ)Oo@F~Tsfpq5YpLc%!uJhZ6PiOTMR+ZxOc$UYofJL`1)AI
zbPz9`J*IrS0(GYlj2$HJ2aoT%n_h>u*&cEg{Qdz@u&)GQ`>uG2cR+*{#_%g6U5#UZ
z0+bfC!uNx720{t1#2xa29W?i^z@dG|T2kZt&q&TOg$K6~XKK6{im=|?4a%Wme-cpb
zw)U@}YBYHYg}>4~D7f$jPJBi!C?QD<=lMoc1tuhF@s|1Eq6W#l)LIMJI=_J&BVm_G
z?z}f;saHV{l-3KJGMFhV;Ea#gVGoJuof!qkkFPGaYPc-=;P!mbV(ZrzR6>E}@N_{t
z8>IzhI0{B|dwMuuAkOl^8M0=pZpJ)}d@k0_`B}R1De@`7ssfyFu0yV`6ywkRHo6U@
z`X!y!YbHaQBA~@?*nTRn!)CMc4*G1znxfvCwTE<;R^F62RmDQHEqX4q!3ae~W&eOF
z7y8R^xP{|+u|>3A9flz^d{&)uQgQ}d7$~9jvUD!+T~L+Dd&R6^=(*or?q*34Om0I6
z66d_1tNCiW_5@w?5zovz(mWCLnuxfuq>e?zOT$Jpx^t3-e~FxA$=4uda*d?(7hTl|
zDS(soL!o=Z6!bqLAG{PjT%F+n_>xXUFA}w!V8#jC3ax1-RT})~HUcr6r$0oBES#N(
zk%&0BNu8dGwHyounxyYtx=1?%&?m=w!%<wGCBQo~x}IyXRLuhx^p}7!fgi8F330;l
zzA;wZqR4ws!q06c!5q}TTlw<Dk&K|YNi&2D#GTZNH_zm%taLs?gE$P43d5=E5RUtd
znzfQ&?CoNc!fYHnihsPwG_<n<moGePQ+t!-;$!)Oq`(~@%pNsq^(j5y>;v;>gHW1M
za1`4Acz1z<PdukCEFiE1q0*y|7$+Fq%H%;&jNq*ymm#1P97b#E^l-=3(V-IAFpX$@
zF8jm$FE@9c-7-CUGwl_VEilE87sgpK^3N{TSjNA%{QdA%F1|KP$Pf)F^T*G#6kS%W
zLnK^`J((zzSiQ5gs`<qmGTygvBr*G)^UQIikjQ(|cMCdLJL~lV+FzW{*`nk#bnzD3
zsH*xs9eWb39?DmMnF-EY$%9271mq&TUvv2(;oMW^;gCMB<8C;$?|N!6@p{?n!)6Z5
zxlmS@AO*%xRMPIm?4UUQ-0h@I7!<1#aAO1eGgFXOz-$yc2#v8;_B+;#YUVTASxO}{
zTtHM}SF<m}r48PJsb`R0RW~luguEm96P@ZBuH4}=3g7TXq+b4TAJQOJrL*oAvIVvM
z152O{3bgGe!8*n)Si|=92I86gW-%QA|9k}SPZ1|Rv5+@&sGI9MfU-*5316bT4fzz=
z(Rk6z_SbOCD9u_JYw+8oQsR_XC^BbLE_l{(2MLy4P2f{xgVc*^X6grr%-8SVD6*p{
z)^Xor`}ulh+lS3XJNcB|oQg2U%m<6bA;<AZx&3G|TwE9?UPLA0CQ3b-!=j6hslHra
z0T*9^w!I`+%#f5Q;Jz6iEfR`WbTuzBSdy^^Q26V@S)}*quZ!Q88~TOo)<cGANRodX
zA(E*aNaVw&8P)l;o_)4X^-5dr@~p4??jm_=`aZx4$Q5Z5HG27s#a3E8<*VG2KK?dI
zkxMD^ut>_(_&mRy=}Dh-^Dg-n!=J4WIt1_c=f-AKeV11DnJ&e~M}+@A;?~n0X=od5
zC}M}{GW-#mxu){8UZOz_vPr08mB2VR^e=hvD|Q3YmWpE!6$3m%M+W^&nF6oISU}={
zy;M6)!8du+glQT&H*aa6?9C9OLW{iIl1I;!W~7_lFZv9At$U7a6o2G2Zh^L2R>kJ#
zGc^`ZZ*9?+(7q2wUjYrHSAOmELIXKxu&%tZ%W+9qr*ut2Zd<U;u6y1?FI4L5i{ZZk
z-|2-aI=_gn*bYJJSm6fIyfL3x&V+02*c?lcHU=(k^bOZ(5oeZ0)`sey;^@sdgHpD6
zs&BFRB!kjf(PhD(hh6N#vFc%=>FO8AM(uv`!WU>=cIVA9&*uS#LRZUlLdBIu@d9v2
z^eJg+fX`F*pu$3a06E05sm)*mq+*DSejl(-Y9_C~xdJkUo+Es)30!G?!xwjxvRYHM
z1df$VnaPFbSYQJ&uU4Ek2FMG&y!D9?U@J0)h16rgEpZWNY3l<h!<+jd0q~u@1ygk`
z-={uBa=utb@Wo8^01`a-Dktaozt`j7r5<Ll=ZT8~6n_BS#(yhE?VoZcYOaq#Wsl|$
zRj)z7ai+@RxxNZC{lusLqd}1`4f-$jD0%6RWKk1$Acpw{#~gF^SFQf*&3F=A+wUZ4
zW5LAbCpCii$v58>T^T${V=ULgO6Iu$q_C{`Bj9A>@v_K{>Liy9#pmjZhv1;{@VH>A
z<7SV;XY8o$o@D@DkDNgk<^OFhp?|TKsHaF^rvtKtekf}}0rXXEejG6%OUhoz61^v@
zMpr<V%zMooH3PEb=SQY`K$bA+j5hfKvc&c3=l0D1x3%Qki?xJ)I44p8kR{k=O13m$
zglJFx`Yes2sR2-!iZZ|2C7|A^u@OAD)`P;HnJ!P%0i^*C%<_u|rs;m#=>QCbs;iP!
zcL3RZ>_10Ufi9kU>Hq(2Wck0_Hu%!EZ)VC81)ww}j>0;?jVYB{n)K(vmHY(nT~ni7
z+YXebU6<kd0NQx4ukpL|Umh5{7Z1#Tbj8U_SCkuj!WTiRTY;haA4Zn{yKSZ~ZTk;J
z&f<$AXNI%NxR0R0`44JfP*A1grlc-NVFJz+rE(=>*7o)y)QVK_i`%?!P;;eXB|*9e
zX1yjD;Np0N#|i;(2CgZ#Rjp<>ro*EniL>!sDdi>?OR;aj=1LC0nwJbsi}m)szROEX
zV=bP}V#KA#FSN(`8u|xf!GJ3o#m&_6cFAua&pUsV5v$PrT@M<<YM_Qw4vRI6v9{lO
zkDK}TsoedqL1$Z#rrR#wv7q;7qxtG={WA)SkCj94wdL1?FXoih)-Y_7=Gw5&8#)Ap
z(~&r#Ivn143dtL-I}H!Fh%H^X+9i`e>WGWupR}Iy-A7xP7SS8MS&oJLLNPp@vi*`(
z94da=ooSci?7yHao79PROVQJdZflG7Z2`88?5F$t!BfJ|NrlOYAR{3aArF<8ka{Fm
z635c4gWsPxV@-*p@|8AdSm!_Qx~<g5nr*Fpo~AWI-)gUp0}y3>5SvlI5ecL?39nSH
zwlckKXdsi{zdb>fb$j@e>0jY7O+Tbvf%m;kA4J;Vk2l!aHryPCkXqW%p3koO8%v7A
z?6AairGrSLCQUZZqK~*EM~igoE|t?S&)%S7)NR62{y7Wk+AhJgxR1B97mzuT=UG1N
zVKbD*kA_S^>3DW-I#u`qC1!s{B8<EAl<SEb|94$_b47ID>N%J7sdZ<d#Znfe?!%>w
z(&#Ng>Cpk`1(Ayc*f>t^U1G96$rysui|f1_NtM1nU2#T$%sb;X?@x~x>I)JOUg{Wf
zb7S#4w+_}GkQvM=UG7du(9H}3mm&cB{7AQei3iG|!S}%}FbqUiF}{#4CIeq1oPmEE
z0U23Vi6u}7hKPs=BSH9I&`U3Xxq2Hx8iU+-AxK7lPuII?HOh1Yts6d_j7w~?z_dbQ
zv#dM@G#S4;y}h!oVYUyFdZAz%k!jPI7;vukqp=3ssx4$Mx{l0Qa-?o4lv_L<{I>?b
zj3}8NA44NVeipq?pi|CufOODn%T%34I;|@=FD$qs2G1QGkmPE8JWG1ctp9<y(T&Se
zadj(=HT(@)RuG=z4utYrRSowmWO@H`aTMA{%l|a%5XNnx&v)&MUgwAmmB<L<0u-zh
z86}T0F>VgD3#fe-YUOHt0gVJ?Dv#R?YAz04x#pv57OSt(G6eeiTH%!rzkhs9{1%dK
z$fj)0`mH>p)M$D+5kXz~N(=f!W0gtgIu$zTf@BVhId6!n36okOc^9<ww?V3xj(bx*
zB)Q9QcxBV~pTXYSeDq^SzMZdt&m*2fsm?m2FH6a49WhlTmgLYz$opgg&m3w(VPm+*
zJ_Ql_`_hVXRl=84OjkPfO6hGZA40;`388v4^M_EvW`8OFN)i&>pRSO21*zrJE|kts
z{%et8{JPfd9pG?OwF_yrimLE1^>!D}g?tOjR%;NcqHwztr+>zs3qp9X;PM2sXb0P9
zRcArUvuc#<&@7x$ed(SYo;Fy3zC_W^&2BB6ZSeCwEZE$nQOwpUP)HJ>o>Njh;0N?a
zhM<4w#x_IWXA~)^M+IYJVy3FZJlGjq>)g05ghI}GJw+(dZd^w3>k=*Hc2wY2c)xw~
zIrBTN0DM!jMu9V$a{7w$tld%vp0?W2Y_(M2TWuCFwa+l!!d|Yfu9Eus`E5vp*(eq+
zn07QP_7k|(jjH<h-ARMnQ3?ccLj|~Y*?ktiZi8xx-1L4ZRYH=8Ql({<h-`*+M?OYW
z7~_3S28Y-QMJ_`2{!>opG9t+md4o5dO3QURhat}mH4ph?`>L%wk8=i%J5Uapn~x?h
zH9w5-o$M_Wf&p)k71W7v-J?W;+7og4qQMRh3u9<zg{24N1MAB*H6svV&F@9!+OM`*
z`OjMXkQg=M%<3}keY?KLTCSm?M)yS{$!z~xFsaFxr?18?lzZD)z;vT}vAn%qa@kS!
z^!^Ecya%h$<L;W+>Q??8y_e%WmkaCH@gQn%%_#zY{Mg-q>!ewwJZZ~k3c^*_8hv~4
zc;Dl9jH~Xik@etnt>U`gJ*m#vb!>4Fq8qHj+Wyq|Jo`q}nuo$+7_Nk5FZ8SDg{IBT
z`4yp>+u7?3kOb?F0>8AZGEBmC7Tx3YkWT?tQAFFzkS!1oB#<KFL5$+Idw1L8Sg6c>
z&u`>2_b$2sdsKwS+{J2%b=>SB>Vu39s+;7SR=JW?g7C=8iSy%b_^Fzc7^(KB(C(-|
zl&bfaw<14x(?h)sM#ndKD;!9W9+No6XUCkxav`yyL%j_|Z)HkSh0(abF(6LIrW3qs
z&oY2{h>@J-PK11aefU@@=lQ4rv9}HF9mnNtc1rJ6I&<W(ai|69q{gfR$D;rInPS>D
zSYtO?Z}CjN$^@8THn<Mfp1Z>ud=C*yM+(NP1~3J=L0L$16>L6yrCu7iUU(dSP?D3Y
z(H+ti2UFuYcAvk@+Qo#%#PJzRroHum*qi*(>+Q9&yV5TFp;QO$M>_ygbA5)jJ#Kf=
zM@WR;2sjD(+(Or-zcv1oA;>F%>=J^sQ}2P&s!o7XsMHZE&!B-2i%{2}<hZ#myRt$a
zPt#rIOcO=@*69$hn8$*4rw_l%v#Dn9G{8^z@ZqXk=6r$eD3)Kd&I%ijmv8e%qg>n{
zqcHr#0q)-~;<(#jBi5b^d2MBI0+%>@**$8p#daTNW{;Ez3^K+*YIJ&a)mx~XE500o
zNu%_F_2jd_O7&X=zonpn;`$XM69*XD95Hz38yVHC9O_1^Grkw#)>9kZc%AhtxcpY$
z35&bctrUlj@y7$G$wNOW?K&G=BZp}R_iRA%PUbkW3G9g@?VT|yBk7oGX}#K-eVw17
zY%s1QHWEIc!#06jKxDN$slj!|Q=wJ^nRWtQw%dA(3Dr!dK-7;X?;MvhBCFO6WJ#c|
zY4wlIyhjzyU`(#GE~&RlG~d!w_WD97v;8|ropNdFelBE1lzh(b97KZ1_0<nBdF!XO
zIwEuM*h?K@^p01_z}7~QbNn%~-BK>ObP(Npyqoe8#Ek~0Fh3gOe(D=<{f>hU!wD%e
zyF2Pd#<H71GL3u;9_Gj|zRIK@(r<+8-lKB!C?~<2;JdFk{TrcL;p!rawuo~|Dj;%X
z^pM>RRpPL}fG_4fS9ImY{L&X<9WFDOvK0QuOT3l7QC5isqZ#CicQUjZRWNR$EUE|c
z$fFj|Tl6}RA$$JMzjk8wvp=m_;&GVLzoUW4(!1E<^*kn`4jTa?jy#LioW_N+uz2LI
zS^JJ_Q(2{K7rI*gQCLbyZ2OfKiO?laC9;n~X?!jsT))d<BzG8fVYcbEJYpl3L1ykG
zc1jpA!PYf)2M8aj&q`=VbHoApM+><ejkjS6C|wy(@M9fy*!NevpQWGuteS@x-8vEl
zcta<gOaHLC|GN|-iVUGYu|{@jf<#3r+jPS*q)0gL0Gw3m{@bi}rH0k?{#C;ye>4zf
zQ$&mL)fwN|aavB|=vjzzbMoHbgo{SnwLXw>h0xSl&SN+aSOW-soB+fEusd&Ef1K>_
z_DV7-59irZ(Fr%Y)a15bVH99!7+OJnLX4@aub0x)#M3~;V#hC4AQJF+tzN8#?h05k
zXm9C?rFMT(kUs^7oOH<Dac2l$*&a#l_V%`8a#D55*+W|LT}LXHHMIZ-!B@hSeEHNK
zwpKszW_X?d2x%*(OX#9+uT57~CQGNlg|0C_y-&L&w);TpZEm^c7_D7PV!T+_(b#+w
z5w#JHuY}$#c(VF*)OcFBcD~0(@?O+=1i|P{*2Yjws>LzpCuT0|jsk0MjtfpAE&}%q
zf!;>^0JE!nepAGuUkS`8`ImdBsL-Bb3`9Q$ssp?Ezd*Ei2s+J{?7vlU`S$vkp%;^2
zLJW*rT4YnOm+x+UkUj=9kuiiqT@VncF6FBq9i+}u4KivBl(svWdqaAO2ZvDH^`AhY
zqT_Qh!Bn?OW@`=ae$zNU<%2YZO|21kPWhg#KYsB>8F#{g5{!|<I|JiIxYoC>9pdG?
ze;_2TzNK>ZGa*T|y6-orV4LfdhA=5)wtuqyjgw1prqAY~oGL(Hw$c(&-Rw?=8(^Hc
z#eL?8U0uY4Dk$KLL?;~oaX=+gyO0Az$?<WDPOWqn!uRlqmCv9g+3WZGR9ER@{n_ok
zdbO9S`7SMs93o<8@kc-M*=LZUgJjHIULUFt370WE{^6$hQ(w-Q(ws_o5=Fam_yQU%
za<2M?*)5ezqDtvOY22qsuth*>L)eK-VjmF@C?H}=Sa~CqN5f;US%Vvd_3A^3eia_d
z!HoK%fXC%)&qy3xA}SiRL)@$18s&XOljf|yvRQ!k?p^MOQt*AQZ2S_{@R{*ZgTP=d
zhxrMUA)E9SI~EO8u@}~8E!dx~OWu7o8q;FdZTOTU5fxe0-ri2OYEqB|@C)RMpa_n6
zWHItZPFVVkNi?VnZJWGXQB^PnULDLLD<V&NwSEKd@37qkW%&<d&!@NCcxt14Ls)v|
zBT`$nguDklPy+*0t6!J0zN_!l7wTNn$Q{g}3R!bgA*ivkVl<c*oHngJ=et=(-S<Xm
z?rVQ{1ry$Ndh@3;%mO2ai$1)GoQPz>w=t>FK|RJ!mNQsR&Ch*@cqfmNW%H(RI@fiD
z5-XVG&|XojXp@+VAKN1$e$E)K-bLkjN&a225XnoCL<hqF9m{KcrkA+PO>f<5b$Up=
z^cS)bsi)Y|N*m&;-<Alw^=s>b@84O_O^-VTKC*}=6cJq`r$-I6GxkMFZz_YEMS-=k
ztV1B+@~O<3W3`Q((4Ex*k8QS)Xb$m3dqp@!+6|Wyq$%G#XQ*iMh9r}pxc$4j8rECB
zS6D4rhu=COV57cAVW!<*;+RgxZe9{?@>{aI5%ba(`y--KoDX~D%e&}tV<=^N2zxX%
z7zC$ACF>C^)JeiH*$6iKBCl$%2_YqOpndM)dA+D=gpST~O~m`Y;c2zW0X4(;k<D%p
z%SIbr!6bEh%KA|{TePV9j|kN{=SnTPBU!OmmE_ABf^`yxZdb<1Gn7e8P*WoT6H?ON
z;Ep@M<Y6BA`eym{P4=#ou6Ka(le#q%#l$qp6MT51BR~Cp<2%9kA$nLyZvrCmV%}#_
zNa9vql3IKcjdVL&Fl36uu4FauiN@y;PliN<qXz2tUCPJ<<3^e2LD+Dtm=G}$YWb94
zrFVtN?Sb2jr726<-&l8A4cK7m{c_bkt~(5ry3~*`Hd+CuG2PsKnUpaIYU-9271$m4
z18*Tus7a&T#4I!bInkJ*wdDB1K{BzXX!!Hl2<c_l7_|qg-8j;%!VUSYkoq8qriwx%
z?oMlkclfi%F`lU!^me0Z)#ph)?fFX6@C^_PnFj1(5<$hf)$PucnSBd9nqcw3sUs4O
z=#GDk<MWks!|gSTQ~o|qPWF0!S5v8-g!U^3{B>IEr>v{g*RFp^bal9b#4w#vgFd<)
zbpmVnFV#(r@fho$JG&AWL7oiJWT58UNBj`Y=ozQ^>P3D>Lw9gZvFClEf)5U6)9fZx
zIo-iqh#}Bew&QU4lRvumzR3>T48JJnDqYQ3W#Vu%i%iOt;q&uS^ZUU<fT2|B*stKS
zJ4<RD+GuFNxN*n~4QI$?>Z5#1!#Hn6Zc0M<cH!fx+P@4oa%7_^8N>_yh=l2_9*BWv
zqu3pA^%qW#Z{Ep!zfpvF-*;5Y4C*&yzYtyLc6~~tm`a||+pG50<s^bj{F6s|i(!@N
zu$9+)kSF%NCF1$H>Gvl@alg4h1Ru&+qLAO=aSiWU%ymas@Qx`3(R*}lba-+ZL)cPf
zB8Rl%Xf&90dA;UpwChd5f5gGB$tK%bJA~7-J_C4oj#QVdzkjB&CR{fkwM>3vxZCMw
z-+bG^W{BWp9UnzwO6Be(Pazz^S}7YskzK*VC}dUT0Eb;=XpJ{4R%_rZ1!U>0-Cyq@
zCkAE`QTlr$^CAVhjJe-|li%n`u)$@JnjmRXLcHLca{yrgFPQQA@v$9_q!E&u%h3XM
z8dGpcx5!+4U@J?RYB5_IocSx|s+e%ew-2mf{@&e}cS*&D>%XrZFLxW-hfdA=lO{3e
zy@!PA-9+9BOMTo?+RSE5)2h4R9z3iF8-gvot(={dBFM)3jqXOcSi;z)Ojm&~?`5_|
zddd5QD4P}dlxHBW1Q&`ay7?vJxnL8)^W&4G7J1wKzAOj(P^$}w_T}L|3E8`wrJK$=
z`HG$6Z$F4SQCk<YXSkdQCeez17;l9nCmGt%y)_{se#%%ft7RFVzY#7$9Eqi${#?F}
zdZO(~I|!o5eRpOgb7L^t#>nle9InrM&6JcobI@o2#yN|p94GlGqT(NNhkRIcRm<sI
zp1PCeC_*Vza_G3+KAeB&VyZOQ$6|Hdado=8J|$(S3Y9y*j^=sV#ioEY{}l9Ku9WL8
zkQZH9UUcRAGJ8H;=aM%rc%zZR)sqJetF7jUN!ctnBD?1>lWpFtrV^{V1)7I+efxx{
zYN#I-^_`hqK4q%GYyS<F(MbBiY>rb1l9lT7%KK!hR04_|k}=25_ad;~aut7qW5eK=
zh{BSze(*WU*-$}Tu58QxdcC@o#D~o6QdY!T-YaoFCX-5yQkKDI3x+2+{VM~p=1B))
z$4{~Z6)-BSQsM;n{p!JjOo^%r);MN!&w(5L@~Y7zDO|E1+R;S#PtctPVn{M9eOo*-
zUMgijbsMW7#3m-85oVnw(MK4&FmQ0F8(15L#8dOP(sT=G*ucoR8pq^J;f-k_ppVxG
zX>7LnS(MEy`*Zcrqa;OLe>c!ZDi4^qu<A^z^r~MFH~Pt%oEOTJEZni12TN7M?N`o)
zsMeok+d9zFW6*5|3N0Iv&TO}VC7t1hBx?nMbbXq&MUR2QoAU-gibFiulh37ip1whg
z5}E(7?qk*;2*<7arM->jzIPmHEpEhhx&684iXj!hh99$gRlEhK@BytNPPbg_dL+7n
zWeaGP*yQ`<7nJAtaIWNBK8fqLp_>JDo8P6k6dujNZQ99Xz~I@b%HT<|K`CW0#4lI5
zT}Gl7S;07^-jE{>KbRvJPZWF!i0ie6o+qRm8n}C(7d!B9p#9^EiN7#s{6{$xPh-kJ
zS&mR3#CEYy)Eds-E>TMVjZR`uw^~Tv{d30Km<8K~2(|nJ+|Xo_3ETPiA`(+Se$%R#
zz7194hVzF?mkViRNb26WOJCet`5UuGUd?X)cdo&dfp^$)S_V6!JcpV6&u}a|m8{X<
zI;N!RPw%w!bSs_Kp*YzQA-$wW^R&*fMZN*MuCZQ?d8JnW+a>Ux&?WwEQvFn;QY3_r
ze#yI3^sdMvxqD;#$s3W`$>};4#mG)TN_~)fDyeIM1H;oA|GWf5&8J#^&tVKea{dN_
zDRfDlPCiaRgc;Bly-UtC;zA$r!DU#^jE~2Jg3cwq<yE(|i$vA~K}4rHYle1Y?gArl
zIVNxs_Pawmm9~rAq8S6Wyj1iz-Bp20eBefsa`4c$lZ3zv8~n?#thR`0l~+1;1iJe_
zMq~;~_7A}2%pHzLtt#6NiJQ)D)G5`KXr9dB@{fM(DmE@KP|T(>y?89FQ@{W9&T{M8
zllOnVr9_!$so)!WAdy!v>CD!Jf-o;5=X~!O-7?-r;e7j@YZLHTEPWz$hdsR{8TsW)
z5EggU<`#a*oIir#uiSz(>A{A65IGh&$y%Gf5b*hBC!qhOUM_%|NvYIDy5v<_mNr$J
z4Ve{md{-|ak8*bz4S{-jAnV5qcvZW6lbi6PTF1vO3C=^F*Md5=!K7zo|BM!af`m!o
zL?%*rMi1GHbgjt#VK^hJ_H{pFbODxE);q(ZrN!eWD?Yk>-vyb<BuF}_wLL%9IAPyo
z;&ticMhd(+KMhnbrsNMn6$e>Vi(Ol}FqAsi-nk8~8K~CMbC+vpFKjcJM&1c&9P`eL
zOu?xE%HkKZUSpumrEVOPEY8)KG=*e|981-c_f=0YTW<D070u4$aowGV#(e54{PWLT
zxN#Tt=a-DgSNU42xhk)3Ryg`L^4}@V(_WfO@6h$B@b~vPL2qsuOPjYm3b`srZ+BOl
zap#vtFR_$C7<!}3|Exq{yMw5sqjM!g)D<_=gIzBkfl*Oe*-1i?u+Ah~uHVWUjS$7F
z7Tk$=o!}wDpg*LAF3p^t@09k%cBj<9(bW~(QV~D;*E?Z~G}~a)*)lzf%Uu56Vy9#Y
z=>U2+ms_wq37jqu_BeDPjV9#~Z{D=ybwyQ((&)%`LwQy7kz@Qr71n*_*(Dz@vo<>X
zE5!L)()jTBEWRI%#H(edIpx{gq2R4*jsjX_1p-KL(xeOhp4N@=u-M_DQ@H|Ff9K;2
zSBA2;^M;OKu63Uqj##B8r`8$T+*;L?e!z!ZZZ_y%-^9aX=SRh3_wB}s{@939_l?28
zh=u>k=bux87vD^5t}HJ2ASu&nb>_LhjSg_GXLdNrsQ5m0AKtpVz88ev>TRS{aP8BS
z+>#AHWyG{df!uh1oGhH$(v;IEvqUW~I=66zkjab6HJHfFFICPDsyqh=stk^w;`q%K
z3=_YJm)Q#U;2%TZcLq&-)A>qeJ(CrCpfp!&8<fS?W`()E1jo%)A>cy&Ax@)k*`R>e
z;MbcC>Qf4qv}>jm!<k#h{kwk-9}M_u$w_cO6G>()H3nODX_Sl33i+}{;|xopaM7r!
z*%Uaa&2d{tN>t}&^3OB;&bU?L-F{QRwaxk(j`JMrFTU0u-{o8ef_8u+bras!{^zl~
zi%M|*Wi?$`=JNBO)t);TV*}mw5zk50f)v?&Z+GD*PiQmm<PskJzL7sI5q8?RDLT4!
zRe0lgJ!xW@F5N_m6W)897df2d{~l5tPPALeiOdCGOwNT}wC-ulAjs<~aABc|5_>qO
zi|C|!iSBcDr4O4E^FZulpwi?7Tk8})N?~}58>XIlD7v8;!A5am2yRW&db=O86NW`)
z=YXg@anl!lAz!+mVN@IPy>5x0BJ2Gh13rjWcNkJ%MPZW*ML~r(cu2f<J@;H(h9lRI
zbgsAmA>3*k1E&T~IU+yzsCMQhjnoaFrnN9ivgkzs%GD_K1mRnw|MTbNQ|%gEsudr3
zLqqx2{*Aue{z9E%7=rH%F$dyPgf(uMZ4cKvHiUv0^8?d=iQ^u*FNmYSikAav>Q*R^
zFY5M{2M%Zl#iOqz%NUcdxKS8C&svD|`fU_dP-R3OCbJt_pn1n}yG+&KL)Fa5cD##>
zJv?;&P}*BTr@HytUO~G8!8l?-*v%rW=$v}!FYM+{Xtrb{`|eaB`R6qL*m(wxT-VmO
zNymnF+0&OktqGt>hcN<j0@%yJ=H2i6MGaV@47Zp%vn00quB`UQlG_;rf7X}Fv<zfm
zs;AVwP8PzmDU@PKcnCi+Au)9`n6EYB8%(^#x8LO%?5o4(9m?ZtyqPUftJR@%eg)c*
zwor-U>D=pa5+RfB2M&Das{cX|d^z&VnzmOQoH~vEFtIG<iS$(#4o4+lj+~Jz2tg%1
z{MC4Z$7ES~5Cjz*Mv?dY#E%NQ3$qg4X4J~+@LTyLgjL5)<<tr71$2#pY)UCsAZ2#R
zf^BG=403&oxq-R}x{GA+UZq_^cI#ILaYl{7eKb2llkzV<%&d&LcE#YdY8<nn43z%t
z?xAp=BZOTeB_o4XAx<6{W5IxAhM5u|XLPI%r%g!^3CW4r1?h8!uE=jnN+5T_S+}z*
zT==d7@pzcMrq}l-3wCEpQ)L<kj_`jWARvfTnT&_K918Ic<@!C{=PY0qu0<x-RCPWv
z5aH<duMjMeI&1D~MZ>98FwF%SZ4J75JUs`o$}?@i;VI3+^*WiT%5#~Iio)0|!PWO&
zja5sUf@3oS#KN`Bo6Ocvv->gO;Y}snEEyN@(fNmH!lto~)2e9uH3ppjLRGrEaMrn6
z#Ve+m?>Is^?SqX-HM$#^T`t^inLdUXf;<H7-CnvOAYR{Kisd&9U4CI!EIaJEA-m`M
zEwU`JxCcf5?q4CYl~E8#5`H7`$dGR7%D4SQGT)BtC4ni1>`-)Fj$v+yu(L}Sqs(pj
z)VUMNC{s9}1>6TkC!ZcJ5<c<Qs2@B$z>@hKxQR2T#J2GHDS-pbA<GS^48Bg;#K?U$
zI@KIcdBXFq-GEnn6Di!&uJaZmu!KRaWN@C*D%EbB#p;-1@TejKM&p*Fjq<OVtfKMw
zN!pH?@g5x=Hz6TYm|^rwR@;J75ez>W(|c-8ktsk)9IyC`_~7WzVN^;Ly|a|57n&Z$
z?KL)yP$t~1c<CB>K=C}K>zzLQ)aas!370hp{)sGuj_~9CTFoBb@lg<4jphz#hp5_W
zgD0|{*A2QZj&3JQg{_6CU0yRo+w-nt?^Rml)bCMJ%%Fm^vR`oH#abM<(U-5qOLHb5
zNME|<4Up)pj!UN##_SOXb%v^JL6-g6vYcd1c)r2!aUyy>?CBcs5&!n;kg9>Pfp|2g
zu8zslt|4_8<p<gdeaEji{{Fm5yI;oNc!nnZDd|~C1^F#=spfZtXCa`G-6K3xIb1ad
zH6Hn(AEQXv8_Q>FkWztV2OH%nO{ivWCLE+my0bqoX?$38&ddECz)AO2N8*ablIjq$
zw9J%}eU_81y>^i6`L{w0z<7k_4<aW+^A)d%RVE*AiSE+%jYwbr5l21GdM~|#bv7XD
zH1B(Qh+p;fMsfjU4?RoIE%2fQc#i+`N`w4*06uNWmq}@DF`==jekL!rVfmjGlF}O1
z#Wdh|eEj7`hLZ)_3VI`Iuq5yKy7V#YPnN~<PbT|+UyeStdPt8lqLHq_%jhJ1Zh?xS
zmVC(=CBS2+BKiH*WpjrXJ_f_1PLJ*z``sIgk1GO*8Q1IGqy`R@ERd^bObt|X0exr$
z=!FK~qE2EK$DJwV_eWC+V>84@V_Ggp;-&zSBkc?K>p`)KfR$b;&IILNxWzFS3j41Z
zHr0GtG?LmIt)OQ#`=vsW-oHu`(sc~rXVNoSf4d2J=#|cd)s(*;11*d6!sGc){EM0<
zE}=B@v{g2X!tm+Mb}j~BI%gDbSE!WYD*V2lD<i7CF+HI10cmgEYYIz06~fSey?^!P
zCewtAEFkiY^}XT>5Vr^w<-A!0tcCQ<Wo8SIo%pDLa)F`yYssFl=Oz%-<VAjUfd-GV
zy!f4}I0zIl5-N3mT{p}Dk-=B-39&LDhD%3y-TS+UMAyCapcE+lKPq+gQmK6okrn^1
z(*Ps+&xhK)JXCAa{~Xw4&ZI&6;lQs}<^SCRBA1PLdYK6n(7wE37JDH&>zDe?-y^O9
zJ_KV%QAG$S1oCX2f=>Wef_OkfNBZsmsMOR;rHV!&JpW36fYyNSe>3m>ohPFLP6eAj
z#R1xrbHIx1O0hTou=O{gq9!!m#g=?SfIx}~SI3_JkM}5=6CIiUe@%<DXQWXOP~QBd
zpEtMMKpuQzXtx!THLa?g`os<T56N~x0y!7ZJvb#<!)$<nNp&0VDg;alEQ5vfD*(~t
z>(#K*1Hz{hX@M9hb!w~$`Phpff4*QXApcSsKj3c4hRvrt0e1uBHm-lbpVZ!!y!H4;
zZqsxO?iHH2GpFHS<TgJw^+l{iQeW&l+($Vf%7E@c{xG(K2TGG~wlGu!e;SBg!v_aS
zn`G9;14^A51K6X_K&i7(8$*;l^-2Au!XW?BY&zg>W_POh*T9#z`qh4uGsvL@<Tk|r
zlH2IH13X7Bb#y-nRBl?Gk%f#a>m{?(e`_1jOWQ1QnWDkC)UF70>jxzrEl7U;4_(l~
z2q2lPFSJ}w|Ir1xE;oXdVn7#!`Y&D3|8&LGOIHA05bhU(v6swF|D|oV|Fo?p3P%#?
zf|xW#n~g!&xY<%l;l#p$h>Rd`>b-HZ>My0F^coJ8sIczwpuC;cZi%-<vl0p*7@{EB
zhZW>ms<9Y<XWJb@DfPLdzaJiiS4aTWgi^Jcd^Cw50nk=*S@-ih?+kT<_{P`x_z^bq
zRoNh*!@=2EEE0=uqh?w)1U(?qIyS@LYCL|<<({$a`CL{Fq>A{AvQH*IXfOPm(|E?_
z-R=73+!{Ls&~V4zEcMhy)kDXSuu>>F-d*dJ%+(SeTob?KVG1GmA=6bVE0rgIwM<j$
zaJIt)!;ILUUHwOVQKmP_&|+5M*MnG{$0#w#4W4MT7?9o>e`Y*0bXGUH2nnV&WsP#f
zfns&dMn}xH=X>j^vJcpl=|pkN@+mOG7oaPQ&-SMg^coPpm+Ofo4keGb_z5<k?#6<p
zuFt!y`NV=zQ{lpL5^ifGnPbJxi{HQ`YXjT|6e_pEop1jRGyVOYYLJuP?XaWj$L|WC
zJEyaui5yephK7bU*?ZfnH_FN&sJsp8vH!liv$Ip>f3f%1Z*c})lqi~D!QC}LaCd^c
z6Wrb12^!qpCAb6+?jD@r8r+?r2^RDe-#6#X%zf^e=l%hgUqUzO>h7v~>)m^;z1PB6
z`-O*By4h-^(igffp-*3AG0;CeLBxC1>P*vn<edl0Klz8Pygte$(4|m0B=X|#t)yU>
zZ$xXb{W9+B>y%cCvH#4hYIe9v7ueR>9DJfTXd<NR)7UH_6QAl3cj4yY9pL3^QPHr#
z2_DZ5E2N4gch6bXHNyolxslvgcKcuwL;`k8|I?M`C<0_ySk$}#=Uaa78_XYpb=9^w
zjJn~VG&^c-9GFfh6-tbde$M<#%nDMvB&s-V90R}F>WZAa!oX?&$TT2Qv%dJ#;~t3A
zsL@AJF&P*wgivGtOdyhdxD|`s-S{xV(>`e+a{duPe1)hlJDzUm7JE|GmN$yZreg*K
zcz-tx^0jl{-dztMxLPZs#O3n$-SkN+Wf2qqg1RF$i`>1`{_tnjv%!^wG<IcKbtr|`
z-RWleGv?S=$aV{;tx=|~aF??ta>?oO6@@tx#OwgRr5%Vor%yA|A>iX#uv5t_l!Z|#
z<n~ti@bdZofdYEhBGO)-i!w~;8%5D1@j1*sFhC7K?D)J(boTz*Dc=7)6YASSsVdxW
z?BFdrh<@WybBNL9s}qWHh4b}@FRji4_5~|G;I2a=@I`2WQ4e}^s=-R-yI%865+{$x
z#rtygvPfXk5}u~GF6gukb$@djb;MRY^zjAM%atm(!dDq|$4UnzF`Ev@bK70%8mZ<5
z9!NA-y^izE3gf%h!%?eK_`XPE`F#KCX4(``rP}&19wXrMV7Tl$>Qab5PLV@^K_%b2
zNg8y`hqWEORw@KNiS%Ia2H|MA`i(`sN{i@V-9$r-m<KA;n&Uz=mSpO?rwd_0tJCqW
z^wse!fl3MVkUirKm)$Dt%07emzb|v*yQ8_2#=M>CKm)ltRkmO!hs7jxNhXNK&=H97
z?~Z3`SQZ0!t;4l;uB`0r%ezYxCBJ`v%pU(v3WD^?`<79;<P(yhpdeuZQz)phiTZm-
z8d%-ai-P@1-|o#6$@Wc8gZ>>-ZpTf3?pt7-B$dXP&0RHwQur3DFRc<=AJxd`<YyAu
zeH4%7Z+p45HVofW?E?7_)?D`4>MIeQAtu!7jcy#f9Y|XAm9r$AIZH_J%1<iAaOa_B
zCLM~Mrf~V!a6rj+d%Gx|yG4-aR|Q5jMFw~Kj>nwYcOovBy(nz7)4`WIsH9Z-Awm=`
z_Hx~yC#$b8kqpzj4zCCGIdHJb@n@_!;qu6NaD6x6CgBkD-FT3PgLsiA_#I|%x1vqR
z=6$|Lt%ct`8@ZGs`Ys-zGR*P%vrQbaxgUe<MpN^gTb<1h1fH)ol1sI8vijbE%(s|W
z{)~{<4bknY&S|R`nx(7%4c7U3r|3^~ip$L&NZl@HJS|K63t8D&O8Eh@(U2${#TG}S
zYu_|_t-vmydw3?LDv-OB<ICg3&aT!p*J~U|82iKL5ERL#qPvhE|DpJ7&rbfvcIbwP
z+kLBJX;rh$l;(cgg~l7T9^8{=RYZtZBX)+S`?`1;^;@Wq(IHhYR;e}G5Qzmm!v8Aa
z#Q)p5l^8W=s7dOm|CGxcB@%*Awy@c20>K@H%~&vj0;l@MU@B@|&|Eu_R~hmp5vEGN
zGZF$CK3#7dv-E!ylk_|3w^FN>V^S*Q(7%DHiVhD)g>?fOiQ)vv8=HT%oD&}yf^g`&
zpKb_dN)+OnuKe+di5ZV`rf78rqwxkJhe3;kxVOObPMl!mj@KigDK2mNNbWpKxqxet
zzg-`pnhT%zHO!vmzkJiGELf6N$=9-y>ZUFiY&fQ9TIjz!KlUnWpj1CJWf$2T7EMSA
z4Xn7ICp4>h?>><7-b`i`XKWrtrBVN?B^beE3`fE!?0z>FM1n9>$e17TSMkbW9-X|+
zT@B@L>nQM5=N-pDhExjHKsx>M6w)kltxQpKyK4oeays^=$pKbwM7M$aPZG{rS@yKP
z7vD(9u2WKl+{fg?i@Y^D4Nby3hsoTXp&2u!bYF#7yOn~bOO%XAmZTEHn{RNI4(QIq
zz=aDWChPc(<?20EPhf}STgzvLWO6x>IpiD;p!n)<*35t{0=&m0PPH3Z41c_Vl1EZ@
zuqUtl!m7z)+z)$qcOUKrL&Nj=<O8<gGAM7Gno<N+z4){C0S6M#9n%P8RrXc5g7$o1
zsl`rWg|e3$r*nJziWLv*$TF!<qI=-u(1<UJYfQ1hAnuVl1gFC*Hg1Q&-Gmx`_TmOR
zBocds<f&@=<Tx;5hw42GNWi@$%M{jqp6+?yJC2xMBXc<{L&4C6dLo9EG^c4#cGFbq
zEF15H#+2%n#J&Mk)~gp~;BaquMF40^z~JQM?9JQ)g|CBn+O@`j1qGGEXn=q?_Pizo
zc8=!yXs^W`L6`tW?tO4`b1PUaltdZJ=G916$Q3~9f*C5PtI!*W#HuyyfpD^eVJ=s%
zj6}p^4R7*#er2?7CioX&CWK08u{P(+%f4!5e1aX!E}3*3@%yIbbCOLF7Hh0}rw!H6
zJh0S$dpY_n6(uBYyfScRpzr|DxKDarfuXVXH9$4_8M$+OOtInxb=C6<S3_OQTlFi^
zx9kv|rXIUv#4Y)RgD?`u6JyNvi%89U5$wK?*tYBNx0|SPZiL}%8dXMTq4J;%t5Ox|
zl%#M2Efc%xaK04-!lz?gLcLZAW3_-e_ML@7=6vRvs@*bS$wcl@?1fpW)E6m4{W<G-
z7>%Fp=c_qu=D-K&FvPWHNGdoQ<%je(&(~H%AcHBFQr5%jEziUI(WHME%{bx1yn7is
zw5lB0?H8O#JPXDsV6IZ?J{a{LkIfV_>b)$@_i!^{s<M0Ihb~GOw#heM<n{SCh==FX
z-4OV=bcapSgi9V9{8K5_j>X<$1tdXi$?#E(nN7FJ+g!tV+M7<K!`Ur2^`K{9(2qGd
z18FDtYurGD1ExIRPA^bZ!BM={o4w*59216d*ndvAQ6im2oo6hwY1-1>W`yRX)c^>*
z&K?VPt~#@cNOg7tY=#I=^{@PNn2?0`<gOF8wc$J_%dUU=<MT;o3PrMc>Mk6t{WVxu
z*VYCo@T91f$d-LpFiT4%4YvO)zhcmZX}6@86v3tS7!h2Gkv|)W6Ks_(38WdJYbl#e
zkfZJ~9SBLbux`5nrT#X{(YrGeFi%fP8b*S2h>*YMd-Gr#$K+<r?sdiVJ7Znm>PzLE
z*wmYhOvDUz!}~^g4MZ7c_(*zGFB_tjO4;%j8FbnMUQ#TJI|P}$b8EGhNSCLPi%mLn
ztFR_FT*KkJcC14Z6&vp$F9x=f<?yx{uF(co;Q<3P@7b?bazftzj$mC1#|rJ-XG_gi
zvVE_XJ`)L$RgSS2cV=fl+~j+5c_WhW#XpbjbP>282l8WL-~Ar=%g&XkL->dXQN?p}
zO65VbNEh@L9@{}%+~sURgZ}_jVD<+o;fx=0Svw88a(jD%6lFeE03K9>2^$AQq7jpe
zX&&7Wtte%xPhxFBr#U40kc-INo^F(=R_IV}yxu{O*DyWoKVX;QO8*G$&J}E$uD7mS
zW|^er<LY{%{79>Ex3uo#y|c=j<N)%*SZ#KL9vAXjp^$@NCD;p+sPWx=jr!Dot5Vl?
zGOFdec<r|m;oe<ej#zyewGqd|cTE39I&vcuL%^wuDFD?{%jb<=4@lE<IOz0rz&2<%
z+gCb^rbA#MN-;A7xK&PWz!;ygmk<Lee+hkzB-o!q#a2*I;G;lq+}y-X#HU=hU2S3M
zdU^Jq4i&`BDiy6#tBBarTk8J&I~5iU4U6aXE>Zh*BF;Ug6PzzkP#`&OsgE}B0kSXE
zaP;fn#q*<BdMg#W`Qw{7!55L=d0$(ucWK-_xwjrvH?%-@yz=Q(bLh32E)#`F;&$3(
zYpD;}$1XEdtEgmy+m=sA%p76=y-jHPi+fQ*uU*fB{7=1Z{<lU-T=ph|<s5<OE&*xp
zj#KHPQ2ZXHNy*MyoL=4{k0T2Yx>|wroLZ@G<@%~_Dqle`8czT-C?b4Gm1kCFK7&C=
z?HO*?M8@-N2u#~UG<Ft-T<Om*So9d3{L@iFPB86)kC*SP(HsUioUsID^|A4e+yN94
z33FZlM3@)Y$qWGriRQ_T-T`Y&Yv6lXv^m!1by{xKNDYvUSQ%HP%a4FxHj*n&`74?b
zrpWkf_3nPOy5Qejm41ZF1~{7v(e+fnAS-U|Z%4j|Cs<X;k~BNwA5aBd*aW*jGvDDv
zECllpR%n!k+F&C4T{>g3nvZ-4fX6VC1_Eq&b(TIz7lI!k5fIhcZ5L4qcYdy;10#1D
z#aF|*lR_+3mAFV?m018=bZc~ZbAwHYO%);B3_1yD|H+-SFN$3ncEBgDnqtXsb!>Vl
ze^MAR#^*tAN8vvq0QGsUdpvCu=?EpEpQo$sk=U+p(;MG-M<8B?Pda{6NSOhJPjc%W
z7_&|15|)#UH8jdngw4B335#w{jCp<VU=<$}a)mRua>%j|H{DpOnru@)<#a86K7pEG
z$caO=+9@t@Evkt#p#G214njt$w)6P9&mj&o+-JJvzCfiuv>HbiN`QR=qaD#BrTlW)
z`Vjsw<N~LXs*7)P4po>qwzN$*{55uy#H&2Mn0VB?Oihk%amF0hWEdfDpIPn7-%oT%
zY+hfm_y&fNO)cp7V|8J|prY~-(GBxA3(FHs$3W2<+o(J|<bvR<K9tLI{9=SVERwdD
zWzS%Glv*$;i`VZ{nR+ugTGjF^dJo=U39JiT<o~O+I44$(;NVL1xo%7+un1>oX#&Ma
zO%hkNFCT>lEJ+M5HW(oqmg*(YK$$@T{l_BOCpfCftkC8XoW~<~^XoPa%R82!{Hs#M
z28xfg#_XiBFOe`eXKQpq(0j%w3_ZPH`7pQIWYZY)!JU@O2X}$(;T|WM^Mbl4N=2RB
zd^{rr$e>2d0{s{&e;9!{68yzeMou&;w$F46O84!4F9N=Knx9jR`a<DuKh+lYp@5ap
zAQ2Gmb5fb=D~1o{w6QctTKR#RRg|1~Ky$T|shLlr;O7?;ne$xWGdnZACD!4xyNtv~
z*4u9#0{`A1RqjxyU7}#wv%%8T&93tdRBpDoJ}}zeBZ+OKj&Ci^PK<p(BGPk;lu~i1
z(vRKU=tp`=Z}IpT;zu8#f#Q8tYge4}@bJ5tda;QdG@=Jyi}n9=DLM50=u<`(HjzCP
zWRTliEJuTxhZ!Q!*-jVc+R35pH51i9rdFj7iFmvO>Dw3fb*Tu(NyG6bwxqu+=P}b^
zEcWu#VS%_K;Sn4YjztUil}cQ0Or!|KcC%sc*vDjZR)tphZOs*P`FYNVIKqLaFchT{
zFAmI+G?cgf0fta4)?Ug@<6uD_zxQbIamUakIna_}Yt0m6@M%33;Ol%)MAIR^Uwk3V
zBTM#x=8k$-!eaJEUfjd}OKvRpRJbUEu|lwNr9D7~%0)CnCg0NTqiR{d_#%`2XQW;i
z^1ruu&^3*&|CD#fazqKO7f30SKMOL<thalke5UEBxljmU@!f{nb6s;V^HN^RoLc0n
z2~%%)(8tMq^9DXbT1;5g*49?QGf7UYUrTUtEiptTWq%@@AnMSl4#;>E*!P7Zk$ns5
zWWz1poQj3VDj*?iS0=Va{%80vMR}M-%e+V?1%N&@$J}E<tqcG!2-_ZrisIStz~yl*
zrT%@{2V(J2E(ay^eq7bDTpR=<V|~~SCC>QmR~e2Que+=tu(?hnRReZgCt5#O3Tz6N
zE8X!7Yf(UPJSeFCL}TG+y#cKziz(TX8)qHqelGYv&aVBx?6_u|4;3NRyS~0E1ek_e
zH5C3l=KL8qex-j01?dtMmql&Yig8-BkIB3^Zt_t^mrZjLOs_?jIh`H>Sw$mxFg^<o
zx|mN-lWrce!DU|~F{6@@`sXD2EX8e(vsyKI{fMpoK3H<{11=xgRx>Ox#aMk%Zc<}p
z0CdUk79)*RRe{SjoHI9Z&EzV58du;;i?xbxPN{AgE5OpE@JNbFuVnzV7)g262o7(N
zpJ!XVUhJV?{R_ja>{ZKjp&?<Af9%pY9fU&BUU5(*Px~S(0z&_yI9lke&v>07mQa9R
zgrAUFB|55t?$7>6rK^L}=sC5d0&%m4TwDskG7IMur_z@Sg||W!?KA&Mx6cUD$$~&y
zTng6Wd^79~^c*P8y74d+KtNvEbVQx7dL|k`OCxo2s~Q!q$a*w%42PZNHi1P5`^?<Z
z(`(i1bsIZ@{^NR;q=Yw{%_5e2;#Df6Km$~q^l-k)PIz*YTZCF_oFY+8{&3oIzN*&2
z5XJxXsi6$WUTE@stUaaAuGr%NC%|_LihlCMJ8%V#lBre)J8(BSAT%=)(P!*j)*nz$
zFX{W^WkOQDzjmh)Yj6F{)kFSaj!d{@CIRtDkv;#k5`DYp5zUiYo<sI7^ty&*H#{Hm
z!34^QKr3;eLL<MK%`7RuA)v?CWR7yAm2kgji#Sy*)EC%rH2uB{A+I&fsE(-k;N5gG
zoXS8jk;Nb6AmFvjJ!NerB?XH{V~>%gQF{)0W@|YL;-0|O<YB)%{2Y`{P%<22@Ri_+
zh>)4hl(NZwMWT#yN1y`ad?YTUH`Idf0NR$oI}|sZ!9W+A%TqQH6Y%uzz3V=`?Q+{!
zSk0XYq^@Gbr|{{H-O}*s5c(%cd=KFY!&Gis?$`<dhtet)A6)=7k{t=H#robkqS*!_
zZyjo442O+GZ}*-+0G?D?VJPimmH=((OLLeAmp~XgKrD)(D~RK4mko>PLViN}y$N#K
z3!Qdpe{2H1cccT73(q0RZgXLEUYca<s$<ETZ^&v-lYOu2IPevnHpjFYh&kbxSk3*t
z(_%e@^|5p64<e>w)@F;}4>bP_vBG@QTQ7-txu5QdfYxD*^_mq=ARTWFhfvcmH9_J5
zcjI3)81ein5>e(rj8MGMvdWn$VVUE25qhcKe1O_QvL<byX4;pm@i2iQGoDqPof}Jp
zrd+S%i|V%gO<U<)OWE+%biNtFTw_^)kJu{DxruepT7`O^?$1Q*b0F`JJzsD%66_C8
zxkJqEh&rf%i()}0YkGNk8Gtj8xKOEsv*ztO)C2jB<@2%X)>f<G7DUu7Z2)|f_4F4r
z5ut$w&^Ezmi8>fVf<pDD%jA-R7{Y;xX%6_>ueIO)01b$!d>pvhJnp?;?sIBC066^{
z*69KTl&V}VC()<mN|Te8H;7J=F#SV!v7t<t>2s8SeA~}%xLq&a7tazNPnD7HkE2B0
zhEgb^72?CG_8*F*K9eJLcwNhQNL}p7|77>fW%F?T{YyUH{*M5H#lxoC&qVQ|Jhr?Z
z6f}gxcU$+@zYF9+`UR5Q;y}!TL;-GZSZ^K25oPhkb~0*eDWLf9*=rSa{}>X~yc-DL
zv$?!~@-|A;7Ke{|m0mE_kZ1S4^@aMr0dY%-G*z#z2AJdc|17ZF!!OZSmi2cQKecX<
z`6kxec;Je1w3^Q#gE`D}^Uq{(gyZ5XFA4c+dk-*eReIs_F_1$rK<fU7Fz*KB25=Ak
zdogFwazPX!Fm73$1Griwf_(E+OED|RFl6H3nSsc%plmr}H}XeFX0LSK(D)(ZQJ;Gs
z$IGih9&Ko~4_uyRP!DmTNUcsoRN(kiU|X*All-ANf=LsCb8yTtz0{pN?aax-rNIR?
zg%GxV`m;kLt2kMuqP|AM0+^_89h`^B_0Kp+yPdDcEH_$5)u1Ayuq0mGmMVoDNR%gU
z<ZJyk*Suz7%W|&9pppx2&m<U}VJk%_Vldxo?Xi*>iX&jU@w9KST7fZn+|DIHYbRF>
zQ=k1vAKWJz{lV|~DJ{W%=tSSc{+nzHjC@2P^_O{>dXoSQDx>rV#k-j6FbpT6+Kbgq
z_9BcSNf)_`Rm=He4({madhh<%uQMGD;xt!MS^Qsb!oq5(#DEUNc%6GcF>8_)t5xxK
zKH5V|-6W&dm`YCv4vk8&>T3-b8Ia}q_i*m#c-w3t^`a;9?bBstmEDyA(t5a1NIJn)
z&6kHQ@)4UH7%NNPFR_o}P@T;r0uuLgW%04kiRHKvg}rm3a_L`^eA&4BB(=S`9|=80
zHy0ST`A5V$B(r?k%OVp#(mq#n?v0ssyibgiQb`#|e6ca`5||tY?B_hAv%Q$j#Otq<
zt1V7XFn{((Grx6nY5FA=ZolwE?RqLh@+|l(1;A%#ievNvdNdzy@AwO<1T?LyJ+?fe
z0WgPP4x)Sq5F7anaf~3q)KQM*EeV68uf8||@_+W>AGd;5_e0Q!PxRkDe15=e!t;YZ
zd=o%|fj;~LK&R$g{MPb20he1>>>k!P81`3(2g@1y4BTX3d|?D5j|}YEGuWdjVE`Q^
zpDvsf1n4Nr@q!3pfJ|VRPo2C6xs%rHaKQiU!@phy?{)?H@MHhmho1xZ(~um{hhO{O
zK71EI+D_G9e;0K7Zy!FqGGxYUA3nPk_-=q|`~ULYe!hOUB=hP1Jn(LCY?f}QV2JNl
zyFdPCAHLTacsDQ5hd=b+KKw~Q9g9r<sy|!&PappOGZiGSQvv$$q08RNTW_jshEonv
zyu048d9RjF_VV<87nZ#&Ko#0|X18TG@7Wva!)W?tH%TyI042x8aUX$vtSs_z_rj0!
z^S#x(^UAz6w8wa!Sqr4IC_gEI--t_^)_~1SdSx^JmpR&fog?XbOJhawse|#@Kf?ZR
zQ#}5kDdvbFOrP`r{K{qm6@mY^Pyhe1koT_(dHtEb8nBttuWaW3GDps@bM#G%orM~_
zTQ6b;Auw$JU#8gnb^DBGNFW0?v+eZ*|1bN&{dGT7`ToBx<WsF5qvGYun>TM>UP!#S
zY5#A5s*`MJU96>t7s2+n_Nq1T!>~xUNc1g`EHE(<0tWXzr7@M8dz7&|_&GVdeelca
zX<hejt+{v_o#gHNSe*t03@s-3|MKl*x1Rs)XL>1uPzr_$hQeeD;Qeb({fyra{Vf`b
zHI*ip6*5W*izy(wXoTi}JnK99mCXzWyO35N;=J2e^^qeSK?)D9<ALlfCOP3dj|4+J
zjYb{gF3wxpL<**9EvX-t6z_#XrpxzB6y*FPbE_Z<v;E&-NmOLy3b4GT^=*TXc7uRW
z#jUjVz3+!Ay*r|1K8Ax;1iCtCNf_u-AHnYl&UK*v6+)F-FNlWA?=7wJrzRN^Er0kT
z8|J-zCL!^WpXx{C2%rTJsrcj(x>QQ*U*xo3JQOjXhkpXOq%o+i1ipHBKsPTGi2L{b
z{0Rr{JyEwb)dt-X**u?LMX^0RJPc13Yk7QPiTNXc{1AHOBk<VF#p=z+Q3(m7J3Rj$
zU-9}r0$D9E;KlwpfoiGZTL8r#ZgdOIe3LGm)v)5VhQeAP5$G*nBwzHnf|_~0r^DBv
zkJ}<zA$JMAiYPzWib}i4XkIiVslcYR)NT!QJvsM#?&-+(uA$$5Pu%4ZLpu<eXE$zr
zXfo5k*(zhFN?zLH^&2_WZY{L2{pLNx(}taT33dm};(LUr7lqRAi%pQDO}6rf%&gNs
z9PX;|u8*Szenw}<pEZFmyZw519HCZyf$(+tMNOkb!0JynJ-G|Wm`#6t;Q=hKPxRVd
zgmep4qRS0d(;ZqWcix_4Hv9AuGLM2U|4_^)vcp0~Q@4&AZJ4cQaLp@q3f-IS?^3$_
z5V6h{^33R<9`23v8dLHaBkfe!O7AYVATv1a1Ggz;443|xNzY7IW%HsDbt2Lou5Y`C
zArtW$wp7>z-VOrwe5GbLqG&u`7~~)riX*n<8R>Cgz_dnCDX)|7acP|1Y-*IKT4!-f
z{9V5by+Wf(r1j69k@+<7Cq_|@+rdA8H8#!Paz}sm2m9AZ*tK^ki5-so=$pCX<>ii~
ztG!(;*+8W6;G@>h#JiY^g{dYhx@g!daX+0ki-C=+E*2_h>;fG6o}dR5#YPE^hTl`f
zPqy?)*LX6A^g<!%4ap-1cgOQ|s#Uspw?}&h-B+h8I0)GEQ&#)Tw4m!`2<)J5Za6qN
zuS);37C_C|a;2%#+@NX~B!s{~C-psSGZDArn;3kKM3mpQ*F$q3OXG<e10uPu>I}Cz
z(3t?K6*q`<d2*_A!sCOD6@}RgU%hqrH%<_JZY);C!Vm`yr=C2B_zwPfmM9y4E@dLS
z(T*yxP=i#mSdO_;J7Q3f$|uK;PUY_EFmdxvhBuE>@iOBqqK*F^C>^F<72))jFzFkv
z1Zb)<>fsYu$VqtdXOG@zG`W5hv6xJ8=UBPD0<t1f&yU=-&Sk3Zu!w_^mAv1)ntw4k
zZTC{Fwz#9<&6W%$>_sI|dAl8@&%Bf(sdjjY{-^~y3O>(-zpj8GIq(^=TL~=(mI{qV
z{H*cM=(INzjOooDEbucvQ^jTo-&b0s@u~dZhaJ=yU4HVuf5gjZu#eJlKQq*IL=8nG
z#I24?B$$Jz?ecw!^!0g={?YT@$NRfZ_nE;wCILZ|1QLFMVNYNUa0v~wd;yj*xRwra
zR<k7oye~hKs4O+R-`ayV%m^b4mbs;m`Xm%wrC6#Loh(x$ss4S|4OR=-(-mni6&bNW
zA30TCKA~IaZTi>Dt>G<lZkJ>B@9!4LY@J(NpOdANSST%3J8IXvy_p)ZiU!))(k2IZ
ztNLLY10%Z+*B$YhaS1Hn7K&%8r?=Bvp+<eadt7o!&ur>hTX9Ea=7enua?Qn30!#KS
zjl_9(Bx3)ntJdYWTSuPD3E}CMAdg~1vv8mbb{?7VbU5T7Spe{^=^3GorCgpB?E<wQ
ziPxfXa?$Jq-d8661~4tUt<KQ)_V$Z4MnMgeehvA(8-6bg0kEOOUk``&flHDTFlnOK
zsuMe&+yOY0UO5-Q7lDvW^0DoBLax4qCmm!GV8aR&^F?NyD4vxFN-xsu<LQZvYlrQq
z@l%=T%07HqlL)R}3r4NzI$Uq@4YUSpg3<fSzF*tGUA0IJO?2-xEUxt6IA+YRxbJz&
z@G+GWX|cB;ArpnT(<_EeWe{jMBZhub)6HBK8kl0q*X%IDP?ygLr);#Ax`)l?R|rJi
z(my+#?b1v9e1%e3po2&p*=I3f+}H54RHKn~LbnxOg^o8l?>vaV!I~^6E@768#d8{+
z`}zo}TNpC&5pQr+$u3VM6e&}qDw&>4^QLexMpW^TdkhvOh(hZOk5*D4OK9hpU3?~l
zRL)1jC|j+%ZG_HrZC=FQ^6TIE{KUE4w%69&$nFE}w@!lWP^HWt)OKu4Dr732Q(HVP
z3)ow~`A1IX3KnXolzUtqqE+d(M}ocV?>E)NWfPap>$cfj6h*DWd4@L-1S*{29|CSX
zB!yC<-e4u-Mn6yf1o5#0+Zzo=z0~~-OvTHPvzU91-`kfvL)@P)={*9X&tvR~+6*VF
z*0|knKFFle*j+5Y<liFIr`n;)#`}y`otADeZ@J?KLE>5!g7bGNsbtGm5K4o|AmLjM
zp<-=nURqcZoxm4w^~0dZW>74m-daAKMZsn~NjTup{es+7Q>xL5P0a5Rj^JKRD*LOy
z@@>qOIx{!JTUx|Oad!M9DB$M3d2m1_e*^>>_J$K6D~^h)0X(Hl&~7$YrAM$(Z6H~u
zT(m8(N1zI#U`Ptt)a3h?_IC0QAH>Sp9OK{i1C1GqzwO^m+r|g_`^B6;Zh3(o^H3ih
zniYu(dj_4RU2}144q&in(4BW8WPv%FMBqIbJ9oH4(Rrul?kw4eK2S3_q&Hh-U}OW|
zRNg{}7wg(h(A2>#Sp}J(<MyLLhQifWQIf5HYWSn3`yH;jXM2IfPxK5o3XM5XJ2(?%
zWR#?iF2-GFn;^l!G@Mc)N8mD7sz|(2u)X<h-;gY&6suwjixX}g@^o{iJ8sSeO&HZ8
zkkq%~cx$dCZU2O>*}hQt{Mk~!8o7Wf*m^ldR|%u^?(PVq4%lrgn@;$hU696T>vwoX
zKopG@xQ*j4Dqwqrj(mVvCiZ=H{ESc5>NM=*cD97T=KOTHQpj6CsgRn1r+igHQt)+n
zyp%5B<|6_Qd=$Kvp+rZg&jY6nCLQDWRLnZgU`Qw#O`h?24nH#o%YdPzq?lanl<wBP
zeC7wut<#;LA9*cm3Za;t-q)$vpW1E@1GJQsAXF_sn0KVKn_{Vzxn{|h{&mC&R)CdF
z6c-=sdV(TYHumomiblxIYyDxjYdl=jJ3b02@U|<%?NnyB0ngFhDa0U8Fx0!nibUB}
z&n|CUfFb8sC2I3~*5M_z+1`>5O9g?XA%%_ntW)*91+tR#Uz?e8#GyswkI+;oWFsf|
z+pJyBEr0trj%paKO~{ujwWk*A9bvttO|I%uWq#qmnzGRRK|w|)0)YwC8L2iVEz4pw
zn4aI)KZ6Y=%}91q)x$yqjJ@6yEx=$cpAmv*LyC%u=7t6bVL+8z!m-6fR>GjC0((*!
z*U*o622MVHehx>`Gpg)wKLo8Iuq=+=<$D^!-gDXn=K1owHcSsP;kxH`{s=iT;yGRB
z<$yKcoyfpTg3&g4_{nxBMn^agXP=Ime7Bco(9nK7caFhrbBKMboPfJK^-=mQFBp-E
zNnb*CC7|YP?rnY*BhQS(%mTi<<^129Pkn+CpLu2{u6eH@X6oah_-~jpq6B>(<Yz-F
zZCV^35nAcj8n8qqVgk%05u)9r&f(wRs?4a%=WX{NsaQ@Gq+rq+&v02X{4Ow0DsB-~
zcbT+bOU`s{LZrb}|E^VsYp2~XMd*FC%Mz*fJ=)o9WOFWnyP|u~=GW%cQoW;d&Cr0X
z##ECmh=keE+1BB8<dI1@2?e?YX2_(95%H3sXnTj}=Tg2~aHoo=Rc-i5U64st5q_Lb
z5mLXZYq?D`yCQb^vrEI>&b_l8f?&B+Q1k|C&|B8hd{9tAvc<F4E|`kJH$`aOwiOJu
zSk$+&CL3usUF#w_?oqAZB{KabWU5S-YD}*~XqHi<N~t3-Bc(jwv@9{4-$~5tASI5*
zrvd~J@$^lQ!wh``KHQP1)UnE*Q6KPBzw0!@9DK?hcq94lr*cV&XPQS|Z+utd)^OvH
z`-R25Akt?Q)66$mk*Ye!8SI(uPMfmNB?gOifqKF%H3+Z|A#R0f{t6Assau(NU7V$x
z0zi=>_1>o4vql`|-LKtV7J6+JA@-+UCI&1z_2e<OCEd88`)s+YWNmO5+~jtL`(jY`
zEfo-D@unY@e$%kzHa;5ang5D*r}sOoX!U4Mr>+gxdT}{WSp3_L(9dzvv&j`8YGU$u
zd>x+84W(O*LhR3psj9*tE)Nt=6HE?eDirNG)h}vl=aiI&NEyRFI-%d*p1qgN@O$aD
z-68P*j2Z2+e)v9}!|pp<>NB#Ab3+YrI9&s6#i?__hJw`t*kg6qK`5;V_btDx6r0ZG
z@VrfoFYcfDzmcO>8G!BzNDGJs<R(s70yYU3kLkL-nxYg}H@H?=%IAACuF6t)#e62L
zosEM$4{7LE<_cHTzKGZD%s-;6Y=3+4`YLY2Hw|0q#xF=SBS>{?GZP#TvSN7G3a$<x
zuvDS$WBP;Roq$O@c?P>pd8<$tm$T_`WZU&`<CUE347XO}`Sx7QcP3kP6wK#_j9eAQ
zU{&)glNCq=DG*dGa|!C*1)q^rvjm*r^Mwm*{cZ)0=DtSl=T)|z@z&g=%X|lklUQX@
z-N(N;+(Q6qx{Y(+BjB<ZYj?YR8vR$)i(0x#ecEU}pBSipX~?&a0RNrKYy@+B5#c9&
zvqCO+l6`AJzSwNBe36jGYE$wUhj;wf;>4&7A!r?8#B@H$^)=p}s_WZ%`CoB;$zK;m
z4E80dVujCaozD1{y?DR;qxA|7CM6+?a;y;!5rM9~T@{yGufa<@<M-FGa6#m>DfEHI
zo)#r_{{3mSa8q1&l~-r#fRidOLA@kb*&S>b&T~P3-<);akEW<Fw<lGF=yVPSwu|*7
z2fwOC1n!N#YI@4h>F<s6ytinw<!-h&D`+#9GCDmC%f@7{B!NE9I^4=woQmWrrc|u;
z{fq5di1^7w66S{%)2N67oz3_BgVD;r770uW>mEF95>=ro$Mb2cA1R}WLy%9$9q$fV
z5J|RTY``gPPaOK41*$ZhN=BUh!#mX)ED7$`2x1;*O=sEpt{?2(k1|W7k+b~HdhJ@}
z2#RP5A0jQKkV_5eqRY@!Y94;*&y}jF9NgDECZL4|nhF%X=`MoDlC08gbv*i|_GoU{
zBX03N<P>DZnnu!Zu@KBB`=X^)it;k~A}##6U=ZDYocldK^hRwdaCE7^rHxjgGM4Z{
zH%vox8{h1;5?%^42Bu+)!op=OS$TQp^A#Ft$A5Bzg`i0UKObXeuv-<t=~Cp9J8(Iy
zM|0YBy)bu*c7+pas>B-Q+vSty7WP-ZE~i}0UNC8?;YTO<fG`AZJhaFYOd+*y$JBI<
z^L3TBC4<j_MrVaC_p`0{PD~Ax-Tw|*AkwOm2T{JAynm9*v?fuv)dSb#%VpBx?rs5w
ziio;g+}0VoTuYr9zq6?{-`$+549<a|XGV|H?xn|QEz^Bl+>dFOgXt=1a<K%#T2fi!
zQ<r2_4UAI5D7dC9*el|<?w#}q*!*6`1Vw$mj@PWtrla<X;wt77!E}{5HaM|1P7x5L
zW<Rs=7ACWP34EA`2Fru~pXGs4o;po<OJ2)l-hFlU-r&8U&CGKK%pMKVUMs@Ep82@C
zKYR=|rkXTzDJ}tDMxAH$;IB1a#cE;x@y~xc6FBrJlW8=tB^5{(8eGhrJ)pkuNt7~j
zhI~nYP#sR3TBC$k9ky8QaLZP<elVWA(Zl61qQ76!8V$qj#>x}9q*Z-^b|v*&SF2E$
z?kNV{#Q1;SE+A+9WF+lMPSS7x07Kid0Sa1wu+VbL!gjOQ%!d-zB&md}RbX2TR-@2l
z9hs%7WK&`{3waX{>VoM2POE6zcTh6wNb74mf!{~!xKIeA>M>#eYR~P8Y4q$p|4B7L
zPHy;|?B+23H8pQSVXY-1wr5ANTNjVs$vss;;|kpIM35~%wpgIll{-#N%OYe3aEqg@
zkesZPVK|7CV4PmanvPd>Iv#9^W^L5qd(z}p=l}6n@8Utiqb#D>Yr!-LLz<7!GCCwI
zYAl0O)h#}MDMuoZ{)K6)mam83U>kw~)wsde0`goZgzXa&f@b@HiiPUw8h!qTqBo<h
z)Nf3Xyg~_AyX3v4${2;j`4XrLNI&M0MZUqdxZDJ`8(&ly9caurEyA|AwY_hLzFLnC
zdC&=kG_fbEC?J=n^G4|o!thF4$$gX!*IiFQu<p_Q_f3vCYg&}?@uW<<iq(FjEu_M|
zid<p+?w6jkL6JRlDf9Q%U4MAut+`7KONSX4B+CHPrBJodcWQ<eZ?NE1wXHLqQ)ty3
zQy~(ZbYVZ;UW3Yi8J$l!BO#Rxfc7sUPwf|ijvL4$^S(JLRVj&e)$jIw`oTz|yE{fk
zC|3`vI$FH0%jeGa_9$BOq<CrX3MmyY_xs+dI=RNYL+E<E#xjFJl%JzDp8V>v=y^}b
zGglp>jae$gc=Bs{cum6@?xUDJIj=(YKqO?C;mQbRqm1AAZL)IGFXH{8BdXl$U2sJX
z*o-_X*QMa$&zHt>Bz3=2eY)C1fakEmV<HGA?bK^?LWsH7mcd5<I|M~=9H?_k@}t*@
znpnUGo9Q8}2Lp4t6nv!PahqK_EqwW-u$^D?8wMu=3BNxziG=K!K~AeLy>n*TolE-n
zcTaSE)ssE!Q#OB)S1|+g;so*udVv8{=~P-c>rE0Q?d}P2PhsE|hjH*e1PX~jG|VpJ
zF1INxrMTQo!zc(WO{J-AG6@w)EpDeKSDj9VmDn9@0|SCi(C|6+$^D~n7z^~Tmn|KP
zV#P<(ESKk1(eiq0I58lwR%k@W{)kUwI?fU|{+^%DdfdIln4{K%`v<=}R4aQ~`H!6l
zOC2pw#0XwCX11}et{1>`-((Lo(e-E|IZLq2MqwC}XrQymp_yhGBLd(<QEWMY@wuDw
zML7^-4G;`^ZPKm*s8iVlBk|VOmNGv^E23kD>S=E+%dTq4@~KQ&1)OTlm>Eu7db|+k
zNVcqUUnuzyi|L>(_t)lun%E7EriRZAoHx{2h5IrWMj;E1<N3qmD=g*%_^uABB&5H5
zYPW{r@NLxja9Qnk)Pt+E!#-XAHY~_4+W+#OyhjtIE@~(uMOJB-U{kl#gbU^_uHUiZ
z`Qjdj?dLUSQvdQ0N>{S7z2%1frRqb7b2`_V35Axj-1T3H+g}Vj*GjTM;9UMK=62Zv
zR4ya2X~@bV>Rqo0m{G~8+mmxk!i494ve5EmW|~}{a4Sw!<f<bFp~_?XKQ!A5+j;#u
z1aavVMM3n_u74y7)C9urXxta5+KDXQ3b;1@@Uxg<JhmF2A-8l+2jcVI|9N(P`Q}}y
ziZ+5Sl8P4giFkgMfKfDy#bTfS`&!-Gak&huD(}<d#>0(z6o^2{-htDHhlt`Jcv=AP
zsvC>s8S}4U1ku0iug^+nbwVG6i55A?(PN=;F5eQyTBH>Ufk;VRE*`^1wN*1Jtx0*c
z+f0aoShY$6SKGTy+iJ7eG9O|;bx>1rkusyQ|83Lj+>(Pczs~JcTT@f>gX`kq$~+7$
zvQk!L4rWPUkTLSPY3#z42r6MGe2DX2f2<+N$T2Do=v$uPzcA>~#qjtGX%@~x@DaN?
zhfh2T2-Q}pe=Zm7`Sv+8AwYTd4E9F+nQ-ay-*21-Dy~Eu6yiep7;EL@nKjdxo&cWK
z69Qgz@jttqUY%5Cf!2^%EZ+)augKDK-=wBxGc1nura@$|G=%4~7amDZ>Y7*TLQY0(
zT|zi~N^eFrIizrQI>c?T))dTv-Mhp3;=iMOn8rE~Y1HrE!p(a>l-yL!35=S4ylpsM
zgo8fPzqtLAtjoRX^Q0J^HvkvO68}8e!tO9@F&>JbHE;E9y`jN9KCeGM08**mi^Dc=
zGmCDaGAN&(tS$$-G@c^=yPa{KF)c$LH<D9t%jFJp^d@%NduM5+3lt$289f^llbE1)
zCM+S?YF;XNXV3^ZxE&s^*uuae0R|)%TZv@vxF>g@sDw#)eUd8!X>y&H>n1fj8;7s~
z#Ga%v3aRrlqU-rQB-_EU_PaO&jKEF*JdY|e38rLIIc9*Ud9qpb4b3C?7D6!l2m1U@
z1CfUXy46AhMU^uBw<c_J=At)$+MCXP?0+UGB1O*nNCs^-Pohxv01$sQmonS+hnv%&
zq@<)>2r>hn2Tuuc@qEO+iUp>u9Cn}kE9H9M3t9c^?H24;sMhpy(=f}nu_r!olo7t*
z*XobRFxQKfTwovgV{A;WU0UgLV*ot1fR3WagibWdE8NjwZPudMAU;swL|3%R=`xBO
zt>1-D-uAiQpVNtM<91kg!+n~ShMMwrOSxVZE;u0sDhRoi@5?2+077ApzX)SW6qazf
z8A&pouA;s2qq<#QAXYCnW*;@fsyFM>LGO>A@nv|m(bQC6*_uo-ipp$;4?%6+WO7cN
zaU*=C+zQ%<3H6$A2WaS`eUCWDu-Z|Einx9W4nA<uCJ!~09)%*)RLQ>%`U4v?h(@K4
z*ZFp5rb>-YM&mfrI;9)(PfgkECKjsybTW-~`i^1Qh8=vv>WaNT=4c=RuDxp^Py-@9
zlgbo=d5;$@N63aBWNTOCH23F#EAYXZA@}HO;@0F9Gw5RFuvs|N-4DLp**e>gjh{ko
zQ7+eEB)pBBO^!uCO1W90t*0ycL?Z8XaDo&%vd-^qXl+c}8dBpOo-y)J?X=Nu-A4IO
zyKAa5fmilZL*ba9th&VL_zWkRE&3Ol->UCh5s`_oarz?9W8TZC;0ut-9VfA<NVp!)
z;5`eIC#d}P2|__`XcE2JF5>pwLX=6SC%x8KA>jy$WXkQ%6FU>JoUh_AXPSpjPC%PQ
z-Nks5Yv{MgJHW5f@R@+X<;~jiXOXFv=^FgfhwmO9F9IF9d^I*Yy2@__s==m@iAoO#
zcXLaW!n-z*v}za~x4ro^dj&dlFd21mL4)4YOP2?7@mDH^91_-FFSn-8aqkq#OAXOj
z!?*9yL6L}1u|o}QS%HtFpfQQkSVW+yFllui0naS}O+BOn^p?E-1CO>*x5>x6uKrQP
zxpHyp2@v;ZTO%p>U;qJ_A$sU8V7=KHb#mn=C|f)xjg9EH!RL8{Npi%S&#g7_ZNC6;
z7~RJym29A3IRc$Rrj)VL)Y%j~n?U%{@^;UA=caOnTD?QFyo+lNk+$JF8~qv}h1;Y9
zL)$HwT6N~q5pj1%Ch&@vvuf`t-+#Dp`H-isc<J)3tV%(Ru2eBC)pueZVC9d5R^`7{
zpurOYe!KIqikIX?WmUCM|9O1%`nZsSb`S$yF&qj!7hd4o%MM+72PdL2ED4fWRPm=^
zEASQ=!Bz2bn0X?kk@s-3n0eb&uzJEIG(sVP$rQ!3A1=rN-!~AKT--K@o+qMr|Cpdb
z{(pQt{hz<5mf|W%36Y|s{%_-wzK$z`d5uv_BQ&6Z+9o2P><=G8eM}{%0=UHYuFyW;
zK)j}$nqD6NBQ6>6ih{}+$N0d+?eo!JN&T4r^J9b8ziSs5^O3#{krMjf#tr%MI<C^3
zLV7XyKf;Ib|D@j1ViuI<GRp(bGH?p(3IzMqQd-94A`pVg5X}dlUK08uYE?f3jA7AM
z99s7mJxT%Q^1svj{PTnIbGdAx;F-0+<Mq)H5~YN43Y5Ozb6)vxG@QRC6pE}m0j5ZI
z2z!Vx4s{c#*&%?6jaGhTMT@kfjg`T_A^6eG=>O-(Zm)l@wC?W@hEi4sul@G@O9~&@
z@G`&jM<(?ABa>6A6D4s#rQNdZQY(UDLfs#=KZoE;XnE5Jx&u;Ge{dV)|NplCzfLj;
z_+xlJA8#JdS6p0N`~V_zJ8%?~lrTm{M%*43d9L4q|0panvP1yH#^19puWR_{=jTOW
zHV=GoLx4w;F(7*mr}Bd)JV3v2$^^gjF06pheeg&Mo$M1B_S>w2x5dt2jO9jG=bY<y
zKb&f{zTQKP(!x9}ZI$4c;Q3m~n#)D$Z%@}6>{W`$eLPK)`-n#v^8-MmeT%~{qDSBt
zLq@)I5&TST_shR`f8EY{{-kU2efbBk7KtUEnK3_AqGb|vK-;Jk1FVuOfmpH`-LJFN
z5O%AXJgw|yTqB1tdOSAD(qb%~W^%9DRH!(Mf(PsMMJ1Rx?=W%0>HC<)ZcBkk%wda~
zICKK=p%`b`%$2TKfouu3)zP}8{S4w;a*6jq`#qxk@V}Ju*C=S&wC(>;%F9rvI?cl8
z#A}yyJ}<){$YWCO9vDsAx{t{m{>ny$&t>^WkVye^EZ5+y_^vWTcmR;AQw3Tsm`qB9
zQK^id602@bmSgrtQ%&Ya)Tj-*2*-Fee|V-xO>{b)pYbEQ;hH+~4UxuLF14lfn8?_u
z{)eI_AJb_NpWYr|_MTofE!$sCv9VlQgz6H0TSIJ!alY!)err5FGOyWejWh!K7Mk|W
zaZmWf4u~V&6MON&i7Vjy7_NWHQ|MSr7M{*Vu9ea1bjrh%nb9-8fzWAp|2u1RGKXVS
z-T3n4UyJ88jPt>GOscuvCi5yB9;@lpQN<O}E5a_EGV#*=^2F5UejW?3PbrPV?d?Dy
zG<~dl8VHRr)!lvOr++q8u106O)~0qmS_2Fx@LN3p7EiQxV4$G|kcx&%odT;|(bMI|
zo$Ia8rFx6L<z=4r+Jnj5LXXRBkK40s*ORGy(Ndje`wrj1<yVF{RR4p#B-A$aQK94x
zjK|FlgIl&hSfn_-QR@No<G&#ixN_s6GB#Z1kIFnbq}le}Ki2uD%7lrI7EeywUnA#_
ztY(4IDL`FpzvIf2lR<uSwoo>3hwjuLaDg^$RL8ETAqP+l51*NbW`RKf$Nu~BWSSVH
zgxUD5Nmm#(cDtXf!D8dF?kD`6UmR()-wS^Fu1|b^*92L6$g!$tE!f41KLC#vy&zeJ
z1Y+pwLp-Ig{&%w$lSXURBsqLOk@8oMrRqhjZg$JTV26ihL1u><uNR1;+ggfFW`8E&
zlG<V3y>KR~QmReqgiNK6Ygh1cKMyS&QrKLMAs7~mKY6?~8P4QwF0M|bvxdep==KeX
zDdJGC)Qo5{Kdo^dFZWZM-4YEmnrWed$E5ea+27xMnl1U%<K|C9R{ZH#RyQabbN#)l
zwmc~{iFJxDKttGhfAh;;*;cPIFYr7@nDYi*%5uJm1G`c;!<2}>=scroTzhMxas?Ki
z2+3RWUA9Xcu|T97Wo3L^4x8Odb05pHp!Yo@y<H_UqsXm~=7Ctq>FbU8`kJYQhui3H
z1`@N?8bpF@B64kxpik&oC4=Mbjh;u`O&A43xn&yORuT&-GZfw--b}d<0imF)*s)I9
zy3awSHW|a9<*kOZo<BT=jY5%2xAPwS>gsBZQ6J1W)^QMgC?rUKS5~hQhp;g~q?4Qn
zk=vh&4Fco-?^^YS7C5&gtH3lq5IZ(D7Qf|U!N8ByZn>eRp`jl%pB7DKvYNsFnWatZ
z?Bu@_?q%MF=~O*V1813)5IhM+o``|SOY;M<3yyRuGJ;<ARLvKyqduz2m0-tv9OI>T
zYxoNajv~MYoz(V}^82NesG2qwi|YDJxwH?LgX!~Mg%bq0UI(jLe+GK|_J{51iUn?d
zPr|y=VABdDRYW2V^*Vb^{*Q$6)(gpV1gtiUB5)!=m{N?yg-w)}Yw-r9(lnhHvB${E
zXqDT9_E@c=VD|iIG_7>L^_^)tsZdC)N3^{p;FcG@hgv03&O8Q+ilAYl2M&iz*PP4_
zZDz$03dRmH=#aWsWpT@@do0zNL+gBEPS$L+C+f@^jB!66)0(sUg;*q${A2p*AwH)|
zuq7H6Hv$f7R4)v9fZ9(mC^x@Bf+H|8$&|**#w=<yjZyko3cmF2@gLi<YITTY9LdgO
z5yEgb71!N6JF2MIMR{z!lF3}*BUZC-mxEAoB2&ZfPk3>Iv>R<`<oBd=ssTrQlvJ{5
zdEif%Rwd;OkYdfwFIb@{PJ<8b=S42p!UG4B22%~6MEUZ)4~JVZX1p0UL_3d`>f9HI
z`*V0AmCa-*w4MQ}4o>&gvU*1ncFcvJ#-Xy#LIa`mzc+uM1fZPnoFVxrUZQlm|DskG
z=JDO!hI{RCvNf76GV{*j^@Ne-suUUba*DDU{C@jwLf${}n~coWgJ8lBAn2e}uKLJi
z;G@XmbMK0Xk7>d9^9%<ZNlBZK?cvNnm^nC7z7vp<lh<ac*Wp?c3VhLIO{)jecv&A^
zzWw$D{QIB%@hI~vvR3zVeb!0(I0PI<siDvrgbzA;j$2GHb}H+Khn80-ODa5+F96?3
z?SFZ?`MbbGZE+rGd?nK2E$43zQ7v^oALf;(9bv3_dRlC?P+h|Tt)r%!ffnl8{aagg
z*k^LBD`=R3*GMK6ljygfA1t@z#6TPQP>ppkU3nTkqx*kg&u#K2OX|6AA7wBZgA3`p
zs@*z0o?wb}8b!x}s-&G;7KglYGPXEVdJabK<|#93AN|8|R&T1I&nh2<O-%7sp~?BQ
z2?$sv#UvX4Cg?uaVNp{H2mc+4wcfwUqPK@nrj1$Vupu*l;FNE7Gn;9!a=g8ad57<I
zvIJQ_p*PiRfijlCqgK~qh}+8?m>;amh!$V1T`i!^;ShVhi(U{~z^UkTFhP_|hxZOM
zG$CZH{}Ln7RH@eQT%ZAn9Nz>HGCL`!OEl_mIV2c{9KbT&#ayK=FJ%N)(&lt~MqEW`
zo?F5wS&9Ra_$<4<REZH;nHQNLk_Ll{v@9=>bU;W}$8;<iji}vqu($Q^j+QFnB2G}O
z-I$Rm-H{1ZsC7e^$#1u-<2j-}KE18IgGwt6=hv|WT3t9Qv=x*i))e1~$!Fx4D)z)1
zr=J@BRPOy=|1mW|woahbLmt7TQASlv8bVD6`E<I}_fHG6SoBx_%LKHV!;G5Iwtc7&
z)&Haz%A@R)*}PN(p_X%{37AO*Z~t97Prt)@<yak!Y~ID9^i*hFAJ2=zX}7Yf-bwZY
z9kS_Q^>JL?WKiT}+u1|G%&b^9vUwi>`R)UWu?y?M?j0^Txq9}2<8ZtxvA~ybpt~Yt
z;s`Kti%FSN2-PnbQwob&6tmJ%d5Tv>nrHz&-iKp(F)!4s<n?ENXS=$Yk6rV!GoaW&
zi&V5U<o6GTmkH{O<w+Ds?e33%Mw#x{I37@Px`jmRN;eY$3!Rl09|_RdpHXR3y(7rK
z^mvT2R+x#9*w5BT+^MU6X7jInUdC8%{lrxAx$QbJPjV~~`fjIr!?kTfryjX)D7FvN
zz#*&a3tqkYcaSehiVQZoWXW9;q;n1l1umfNbiLqiYW=dE!)-naJO115j`%5q6uK{x
zV_J5)$xK#0H>?3d`}-H@<U*{!vth<XH{CDKI?Hv}Il9=4TJSn`XZ7`Uy~%Jpd*<Q}
z02|}>4GzoX?da%KEHIVc9ZTew&LboHg3h<b_e~Q!`!K9jS3jXqEr9RebgK;xy>6Y9
zHKTGK>Yv@8QU5SU&HLJ}@9r)!tW_SfI8T=;?@tnjR7U{hvHjfnaPjwIkeP`qQb!p=
z+<9MtwN$g-m}4SdJm)E1xJ6{LgwdR6Cm_-aO=au+h<u=f`TUAM2Y*PHPA`v}p2xla
zdx#T)y-e#n^o$Y^SM)ugFfUttAk@oN3da6Pi$k4a3Y4$My>#Ex@zI67ZE-tdrRTkl
zd`GJpOO(-=?|XpSX@+DyR|Xx5v!?xZ=ht=Sq7N--)W`fJwHj#yk{%~omD}L+wf3;Z
zMa>!==ywgtLA{6IrU+YS1KaLf6BVl4+t=6g3-ulV{34<|`Vs(43J2!i1!G))Wn;~z
z!{okjB`DOn88xFk6E-z$_SOVday8j5kwH&f{rx)&wFlB+9p{(k>vV*)DTiKD#70X5
z3k1FYi@mpsilgcGMhO}`xI=Jvhu{vu-QC>@8r&^daJK{qF2Mo>_u%d>fuKRZ;@NwD
z>pbtpUgzRmp4^a`TGLbAU0qZ4{~7z!>J}Ag>U;KY;tJiry@eP)q%yB{h#^~|24gsA
zw2+Yz!O1!hFA|L{x5dJ5dk*9do8P_VuP@2Vu%QL0v(Lb{rr`-=r>2Im@N9>Qbd=!i
zH?9v9#6ORz<TBQt)&00u{Q-8(y{if#UuWU$0QpCT?I(-vBJPElWRI!uX9%oXrx-VS
zU7=gA=AN`1)Wu>f7~R!YAy`LZ0dYR4b9;-CjM)6sQ>W@W34m7)ga*4TzLB;}OYm6}
zZuWh@>Ys;8jU+w)MbrZ=F`o9rKfp2~N>rMf659Gv{6r1ue49ODhKi9!3rqFTgQev3
zS3}g+>ys{5$o<d@f;dB9`b{AIO)G3I>8zb1-f=`16yNN%+4W>m$|eNUf<Y+^s}M5i
z4KW|uSFTD4(@IO^HL<^Jd!j^aCu_~NU$2#-D!~fCie409Bo|33-|w`m{T>4vD{b8H
z=emERie8k7+2HWUpy;oi)UYV-)5MbJ?qHYxP4vnDq7#<_nvO@9s=p{9Iy4jp=qVVr
zd7TI>UzHmga#IBgF0bEWx%9=Q)&J^prZc-GjUU#)Ihy-62N7FVMgx-Eg!x8hNsu&n
zre1?GIR)!Ove42Xv*UWQw3p{^=p~I&_uX|CP6S=WtnNhk!bE;ujcn64*V{kpmq^G`
zf_&J<j<J6*Z=Kd!<Ra#q@zQ<+IGfrPiOsgsb+tg?p4Ih8VNfL)wK*{|hsf{LQHQ>S
zkDA6#3gDv{=@ZwkH==n-<gltnY9}TK2eHUL*Bg-SNV~=Fks`6;1eD|6JG)v8hg}fN
z?eE{w_kOpwXMe+Om2&bkV`o6-909sa`h7;9v)xL`=>BXIvuF_H#yhX-u_Euwrl0sh
z(@jhU!u~F()6ANK@-@KSRz-Lu(zGux_=68&!H9B?Ks!eu8?v@(bt`;)d#rE^GE8s|
zc1cd27o^(H6-wf&)6ef{A@5C1mFhqwT;yeEu~>~suhYgM<<H|K#VR4j;*XgZIE>=v
z2<zWXmpo$dIAQk=9?9NXQ7j9%zsh*>D@*nRm1SExQl$;KS$uXX#h%7Te&u!x<m@EZ
z;_)!R-`%_oRpmR8U3r0lcG01*=y9aT=jnx`RJ&er?s#E8<#+9yuPFAbubk}<Spz_o
z_q(h+yF8NG04t>y4dH_eOS>7MdE<aop2Y2+6UM;Ei;r#V7AMOj2FkIj(8yAchtitS
zJ8@rXaus+u(KOT$yw+8zZh*E#928G%=I!YRQEQwIlv#8sj2!c|q8|}t?1ZjR{|ElY
z;==M7*Z(mnLpo4`qn=GYs=@Y+CQm(sqw^5DXF1>r@=h@epZPTOI&{_d5?W-EzW7|~
z`ZUbHM7{x)zOjl*2~DirhM$KIFNSt<WdVzy7XNw1J~M&bHdXwJGsOVufvg0V(9&(2
z;r(ZJR5|JxvEeZ1j&evf3Oa>Cp5|}{DxIVq@w|A{cQp1z9<0A-^@HG1tMnzt2zl#K
ztq)Z##7%h2Zzq@t=Qhz>9?byw%{`VoB?ukoH(9J`NLa9*iJdH9g4X5IQ1SU96hR5C
z^mJ0B>op2e-&lLAa%a~K42J)#+3lmEEW0)e^?1&w90BG5KNkB%jsaN+H6|o_hLMqC
zFMUg<!&NaCl4AQ8B()|)SYp5IO-$k22?7rXk(E1lPU;JRWPULZ0F%SQDG<)q)3=ZT
zPpuP5Xu8ux#4j=pcLO3CK1q9H36Penr1Wd79f9-h?r@TEB#d1MJ%x1N)ITEZ95Bp`
z@USZ7BV*6k7U(qa)cJVqtT&@0k>HBr(xuUOHysacfH21ObtALFH0U^8U>$|ZppTE^
z1S+T>s>z;>nS5?eQ`jPJ@A`Vljl9mOB^)j5m;~byn`*Gav+&hzI5vfBWEH(*H<9Wu
z;mN+js>bZEYD*nri;(j89HCT=#Y||!%pI5+g|mAn*G9`3`nX<CLqCQB{5({lurFV*
zorl3A`nQXjkyW9i3c%q-QP1uK?h`mA6l=ds=yN(cScj`#`hnt5j@LO=eacVfa87>D
z{u4M<XXh!t?ZI?0*IT^5NNM&f28+L!zl4@NPLxl1Nz?YdKb)03D3D+s>XmVQKZwOy
zOq~LyQ~R>KwMx6&&TtMg(Q2cdix)y__8;)$z3-QVoc%__V@u9<;3#J;>x#`3gn#)y
zYNbK-G|UH;I8Q!2?o$IyfAMQnJbLr2Uv5ew5+9>@D91>f-b#gcso<-Qp_8R~CbRJ?
z#w}Y-RKEhNQ%dgsB^Rz*hJ!7Yl#b^=%2;0u!Q-!5H=XdNOiOs(r@1gX`7}A$ZD{9Y
z$&)6riRF;1EF77?qhBE@p57Ti^Tw6nR;P|=Lj=sB;hyfj^4V+lR3qMCYawfLoQ6cs
z;4Hu_UV{oJAlB!t1SLo*&2onl0MWw2BH=c_Fr9~fbRB%C{WQoK9E{DVV*~)8vp;`6
zLE5|UTRyM5JUx6+`=TcE<%Y6ut-6|p){Bb!@^A(bxGSW_RqC~%>$iHO9NO7CAI&lj
z4vE@GuPcHDWbwG%dbKhqfOOkP<<h^1EpK)OF$efbECh~4>PQ^(`VhA&<cfuRHz?Jq
z$;8H;COtcmqY4dDQlu_RdgKU3r@*1~loZ3;q&%(uriEes!tNVVl4}70^Fm-Xn7R>(
z+_j%5vv9A-#!u@FSHFl1`i*U8hyQ}bHvlXi1KH;)m@q)JbsPj9DkTQxQ)<v9GXy?H
z?@`Z6u=c+kL)osNtyeD3dP{P?(W6olE|*62{p<tGCcxs|@(}vdn|*iaifhNheLwuM
zLdh<A`{C;Sdls*Ch-$glX$0Jk`INot-xUKtU)2RzDX9I|Jsw&RxYXy4Bj$}NK_=)i
zK70HAb?)oaru5}_@5{q-(+|$~*Y?TG>KZQaEgnZ<2&YJQ&wu8q)%C*jqopHpv0Oaj
z(Oz{pIX@Fa-`!4bSxwc$*wM~!euiH&-NMaCQ&|K=>x%La;a=Re#Lr?(qpliElH^Ih
zYifBIU5XzlDdnPjG!+Pl)dFAcv66MU`A}rwKOPvOp$MO7a8aCK-;6zwmNJ+(A$g1g
z<FqDdwr28DI{W$Rd}soVN*&7V;k|{WCDrMZcNrhE2#<pFg(@m5i<@zl6DzrR1ZYcn
zW|$t*37dkVGcz;I21$F6PyG9|UKm1uhnR@(`{Ts(ms=<j9eG>`6%t)piu?$Wj^<bM
z@MrsoLx(Fqp!;f_{(TI6>oV*SqhEu)f<Ge_p-y7=&IMA8%(6e2bc)Nqw^{vYGBQY4
zzWT`Vj6Hc4a3;EH)AZjd0E?Rfm<zc>t#&`0W19W!ud!G_nM3iV;Hvey+a?6n7jB`a
zB_LP)eh4n~D4YR)YZde;O)*E9wbpl|*7wThvZ0~pHMiz1#xa-LHZE2+t>CXuEzXlS
z3xE1t@&pRtU4E~1AiEDBhtw(0Sj|h<7JU{Q&s<$;#lu&?vIh@id7}RNXe_!YU(BWL
z`2!668{*O~F&0}3OfLJC7>g3B2!l4v*;I{l1_mDFFY#&Ice>gpcO!UTnz>(YT3-kQ
z9SGfvi0U1Fi@G9qA5S#BEasrl!{RurS5d?xBmX`FpIFTp+&5eeEdbk()?zt%I*Hso
zwZ9?6{=%Ei9@adMBs!H^5)q}*-~HM!3jzxtD>|x1<}IsIm+MT}n?+Yk9Hcm@t_9(-
zEZ$&H@U|hDonCm{;z>WLMeILbs57>;{mNUSzwr?;L#C9_Sm}^tcJ}It3i3X;cfj-#
zu1*qu6Y>{!x}?J-6Y2n=7RfUksMaPI2U3<lHg__9WReK_N#6gcd9kh0QTrO?QUAyP
zVh}^TVl4*g;3?15FHuO!!}sY9W;c+u`TC4iXRZuZb?9|%bOkGq5_MX;DWnpGqC<Jr
zr4T4O!qL=)!<gR=C_>mmSGv`ugerPLM_~`3DzIk=>hsB%XDKAV3ie+gJ$KzTeQ$<|
z9giw<B#Hc~$N)&(C`xiytsO^R)sxLDu>|--E44*xIvVthE=dJpQ=<|KdwUByr4w@^
zjzRxufO5PhVNnVKmQ%;d(I5YM>kt{rq~a}Vi+7hQgoc01<$&!ko?zago#70q!j}cb
zO7;@@{_1=tTns*JG5st`^*DIq(7Z$u7HbCtIY^Xn6IA27Y3qF%Cab!=-rjL<#WgYH
z!|DD8+c_i2E-ik~Q}L@KT=_kVqMOecrHTbg8=^MNoGO(Py%l)MXZX8uA6Z3k?cNfI
ziRJ~R2s*gYhz9rPm0Po4QVIKSPoRxt2x92_c=XgSBz|dTz9mzkFVn*1#0ezsI4kme
zpV<Yqb-+%l)Rl^{8>=guF36Yg)pZM-ipTpc_T)u}cCh2xM>@J8QEFj{HeE3e+-PW?
zC$YQBgW`kzQtBPa>#c2E3=C@j_>8d{T3o(?Dxzg(Dk{m^3?q7^mg;D@R$rEp1VmlE
zYV{C8*Px}7<Ks7?<$F9~q50jXl$8V2>Cpps#?qkbXm2M101s9{-zPG^YLFV@#N`Nz
z+laPQ=n`FFlFWus->QgM^W^p32l`;j{fJ+Ofm=zIi&dd~<FG^m1MfDl^CHXB#zpqP
zNtD|$k$7XWKwyrDm7Iy$sZLO46j}`vI{f)f8+DQ&6B6OFU4?RrN%VmEP(kro?mMhk
zVz8#txj8QEg!^#)e@2&_>?Am%a1=5C=VBsae4pM<gmqv6=J#r6+U{bNyX~#g;UuU|
zTI~``iew5rKCoJtL4+YkULbb3-*b5{&CAv>G?VL^xgAZT`CsbE-ZMfaXs1=pi)eVm
zW1)25iOu5J(AdCYJ#4-8DXBnL((14Yjr-nB9cCO7jw2aMgq*hFtnndB^3zmutvfUh
zENXVEo8&~9(e|`=Nwr*gbP{``<D);S)7`Iyi@gGx6-BVcY%IHd|C=DRc29z!u2HM{
z-D!V8MH4M3F}sA2JV?cc6ape391Xp?)DRVC#xl?GK(<)xnE(gfTU=Etg-;pm7DKP2
z$A~sC_Dh{LXHUOPf6ows(VbQw(S$6q*EQ)Y;2GxER;()-5solqS(ftdafk?Bu2>+B
z<BjORUfIAwkLd6&pCJ+QexJ|-$Is<3bIJVvcZ-NIY1vv)Vu?I5AdgMw^{V+JKbSM=
zDw&Pv2#8p}^Se_UTJ0+Dnvd#M`Wp^O<Klrj=*FJtA2z10lewrTWcIi2@0CClb0VWD
ztl1sx_ifYX#{Y!w_ZZX71q<FreV{G2PDR2)a#wcC#20~~580YuF8=X#f!0Fa;=7Qz
zOb7HdW})c);osF}zdaNer7+a7`NZk&HSYL>g+GZM7_ykmsnb(x3yPz8n*r+cKxgBe
zX(Z0-Lj8Esw1!T&dy>iRCHzVg5sN7%2H<J)isf(sOH$FH_C;L*;g%B7IP#aovIifE
zrf<QWrKM#5pl2}Q=X4`jJIQYwm$eq`JKR504K_K*I+$|+)fbW$t_0uoCX`1)5fV%g
z-f6TR&v5WB_yKCco6>z5fMN>-M(D=^_<kZnRPB-iNN;n5e^$l4ynz-zkA^NS03dd<
zt9`x}O*&x-7s^!cI{*fIyJauaW95;xpvwt7!jwr1d{;P4K~PH6i!82s0$4JWU-VZj
z^obXgJeEcrd^x1rKD_v`&CBs6F$)T)UjZ^1G?@qI3w}?Ipgfrbuy}7sv{t^CH>3zn
zq@>?oflo(G7anaJltW+*rf3}=0PXJKq`S*EwU1HTvJ6+3IREO{_m_@+zhtb^kQOEf
z$LA<`gCzh!^?d3#HD43K@$r=-qH<nN3?pKG=0Cf3`0@ska|97-;PlI<RpP6Xe2T$F
zO4Fpgv=aiWTxxExT?NeG^fl8{hX3x^;Y-JUH8tyyzKVrD9my>(kB&<C*a*$0UQy9b
ze<%ux4{t`Nt)Ys8Mf%Df{vji#zG`tV^7|d7)BTm{m0?kH_p=P-b8o;?>BUc(axqBC
zI;{7zp--Z`J<pjH?BbTBuSj1NzOWS}%drbTCxgHFu!UJ6|NHCgm-esttgNJg$tmEo
zwDg9Q@l3*@pBmC?UBQ(z-}$;d378$V*D4;T|Azm^U*P|=np^1q|7-tWUF3{u{u<41
z23;T{8*Dv#DnTlEgN-^80T&VxpW6i55TIwjK}Qb)5dQ|i|I74R*hWT1*1=}<eL9<r
z9~=_yN1(?%%qnf4s?cT!+H$K5i}9RTb0Db(>Fon)%p~4dhcG~z|L}J&H$(8nG2F?C
zC616c2*^8Sa)&RDrpuE`;?e2;k(3K`9|ng5CaLp(q5WE~diXQRe`?$a{f`%b>m87n
zZ*L6aoMp8BUwL^!m#K(cD!KQwh#m5^M1B@8^0l(bi}-Lxx2eW%3cF&Z2E+PSkwl$$
z!-l=k8zAX_uOva=WY_a6HWTAr4y~B?2qF<VQRnkMyq;w5%#|YUd>wxVcUkFL#eg5c
zy5uygOq?%OD)j2GK@yFGYm&w5vunv&25t12$$+N|67jK|;7|bgBM1b)&)|}{Z?vB%
zl|p@xT@!No`(mT+zWaVexB1P@sgQ8&;mqVhHzbsO#SYV#`7d~CzPD$u<TE)WBGG%%
z<bS`Gp#@8sf}2RI3cU_UkQ$$`Y8=*zGS|Z0;rllTZ_3hWvOuEQ{{-J<cPNxfKJ$mr
zTZm8u?Ds?cGzIa1JWv`>GFhlkjY+Ekjpj<0R2-i<S5;VO&EE{?mEY7*yt{lwuW35-
z3oFC#QC8C1K|UL&_@8qOj*544ytJ9a3oZ6Bm8`vV-C9I;<Khg??4<Tyx}4)p%N4Lq
zt^B#Ufar8_h`c?PNx(R&(_`F>!Dcp)H>G*N4>mpe!E~9=psWb|!I78SKCrK*NQjFY
z4J44N+)tG%7W?1)UW=dm2DUoD^%=td`O#A?FD)4CWBZQCxnHsh0W~7c!`|M$D^IkO
z1<6>eYX=Zb%Jf?s{c)^w#~T_o#-d-!<(cs$Mw<umIF4)iQb}Q6*Sjwme>7MInTDp(
zKRs-r277Py5dmW=CX)=ecVge&_#T7quEk4X-Q5?xEV*Oti3HVc)^PAc$XZ<cj|!(@
zUqtJ_SMxnePrVf0)Ei16zVkbW1Qc@Nlv?v@<6Sp1>1QHwn<Kl$&EnUQS;Z?9Giy`B
zaA^fFf3|*pS6A`7SjD|`cTYRSyZWJ37Eb@Y$(Ec*^^OD_R`YVCT<t4Yj-U^0=F{W(
z?H~s5h{BrrqSkfFn0c@&jq8F!xEay{O@gpH9^Y80YkU$G`-=yOSF*XqMoqwak)t{G
zOw!>FZLtxMB&eFla=G0m-o_9J$WAF9U;(ZvFm)&h==9eT0mAZjyxA(<n{QvDVq+zM
z`>s-gQSb*iM8YV65LIeL6Ns)!Yd4{R(0=_k8kA2r2TS4D!f~7UBFqMMEnYipe|ARc
zJ=HHY!0#>dcWynRtZM5~*w6J2f$4I)l-i2SIf7zyv%Aec_e^b4a6g7t6<kk`trH_~
z`IYOKH3i!OnAH)dd`3@`!hv+waR!0z>FzGg&C$-FF7Y&WH$sn%d(hka>5}(*Q{%0N
z<89BcRgJx6ybV>B7jU1=Lj3D>rSrpta=GJ5-xVt`VAhENE)#}>FM~?khc4^>zd?KR
zlkIJauGdmhQf-AK_<COEQJQU%afFc&I?n6e8mM4~k}xx)FflPHYAmkro(a}yz_nX$
z^;EP;dd}kaRDcpKQOrg0@$os6lL&@IE@GOoZW!+Eg<-cCd9jHq#(`}d8pz<JXJBMx
z4S4b`UrVM{O~^G+`s)iz4NT1YV+pvo<5}-27llLnvtYC&XOW|qvnQ*4d1an9j=0`t
z5u=mNK2EedXZa)3TKxJR`??S(wgI@n>9l>$XX3MGUhNPu^%U~GebBZ6AdS>J$tHFV
zD-P_*_G)h%=#1%d%28&wUAvHxtWcQ_@`?TezfXG)<3i7Ye}9PZ_}(FLNsJ1w*r*q|
z_DhU*%@5Gn<?<tP(y2@T@sd3%<5D8+39Gc7`^ZSv3>}M{A7F~c%L}RDcQ0#y7Z69t
zA1BGEBYg(kYYPV?$Kec!nh34p)otfQiGN>Za?>d1lhvAy#SE7!%0Oi2nwo!6d+{zj
z-@ax%(0e>jY5pb&vYv09wX}6Mel@|wzv#;^^~y9F@QIT`*NVStCU7efvmCQHt`YMO
z792hFBGTwKGAN)om+9AG%cd~J0uIL8M{b%vjr=XK{;ts;BGW$H#$PInkNM!hKw;R7
z>e9zqJFxi)=);|_biDX|gke$dfDF_B`R^XdCF}1f)9^T>gA(;Jb>=6?sQinVcECP;
zLHmETJ3kI_$~+9d!XnW47W}QQbhbSok?vNoOu3@K?cqo7)<6<BDv<Zf$+>0~N^o~@
z+kEOR(}{w>vY9NBtqL}V(&b_KY;=RjmD}*&pgp~>IO<bdefJLyWV@9gq4I2hUyU<k
z+R1mB|BOJx<)nL(odK2wv2^t+eHz$yk8gFAfcqCRy~fY<1%bkpsw}g<ab`3mN(3xA
zXh8#D-d_E60F>yJJA6OrH9LviRpg6>2UQ9*pW#F_4t|@qDhdGgFu^G~qlH&uN(_n)
z$MEpKq#tJPJ<E3YqiiUnjAOr*mgskOzX*(+KkS+nk;`TM913{8H=I|<pwhPG_@YG2
zio+!OG3qD9wQIcJ!zErQKBpM`-LsF|m1ojPTKy-3FCPe|DQ@!YFE(}MDL9VG%<0#8
z9mv|?7EC{1dAg2t^sLl;Fhn}-Jr=nWa<6nj$Cryd0f-#QpgXf|#{-RiEyWl~yiZQG
zLQYbz{1ZB*a;b*=&*OPxCHW22((aWdIES$@T&(qP2X!F&z5Zw#&(G)j=kdXm)8;ho
z`-smm9%eF=tx}%yo&M0<g_;#V1#7FyG^L1`Q$RhU$#G3`aFdcEyXAYU%-LI@FCWio
zw=%Yg5{V1u{0;kV03^2?i&UG0#B&43Th{R9FxUw{mJFj1ei8VVvwNAHsFVrdRBg9h
zFXNzb`GU`Ot@v1}aH3!$;qtv^KgfRj0{@5Bofuhjwh6S9NRAt#j~8?&)Z)BBLcKie
zbuvWdY39K@EEwPdGd7@{6l%}#XezemqeNtI2n=Eaa6W8-PxdAZZ-rpE$VUuEt<C=m
zAHe;hgKWjsI};AEW7P48Vn07e;*#*fW9z5vL{+uCh61}eq}LK0c;V2ua4&IUlSMKZ
z@OsH5>f!X7RnkdYDfEpdM$g~a%!j1yL9lNk1HD&xB@rwtF++pxb2`6g6*P@YQu@=2
zD1=d$>%a-nq$%j5zq=oqbOphDqJ$x_ov$W!*&fKp3o>Nl@rT9nU^dP(c5q<o9k7}z
zLFRH?tvIkf#^MZ&s%vuS@!iI~<g^AF^maG#wLb1Q|7g(hlH3*>JZ*Sd$UIX=BAlvw
z8!<}HBY#M_|B>J-SAp+*_!I4+$*|B$LcYt`=cOx`)#?s+;duf`D*xd2huxGMza5cn
zy`ADOoTk$Cwut?l!!;UyAFmZp<xGsZvrSe`6}LhQn4~gwlLS1J9O#rt=x*o#j!G|t
zgx5OmDIGUd3Vtj7RT6n~MJyu;Qwz8l@F=i+?}(&5wzq%7>faW}Wy4_=vE+HW-s`6y
z{jLQ=3?U55mexRINrQ36;vLWdNerioeQ=@YldoP;YLUnGE~f9--fZ)~O!$#%JV!3J
zhwlnZJYaNHzN3(!IFgVg)2V|DaSPc`M^f`YS(;nEo6xQhfCBnt*)gDG4kWSTeD^qt
zDxREF;b+cqGL}<r8Oh});i^w4_)SGdqPh7py3l$v;IH9-ywSwLEDlYGf{~>nQmfDo
zN3<O4S~P~JGWZ_zl<oaQU)C&9!=N*59b`foZK^uL^zbCLiAX2=U1}PZj`&wQ>mv1=
zxGFK_kki;97+GpOH9NgJgYVoGgvU-Nzp%7C4kd2Fn97V+JgjEJ?y{vWQ#s3&OQ~=T
z+-%JQb>|#SZpyVV=~Sd;nuH5n!A@5BJR(>~6_Rk9je|oi1M>a@00LE^C@=SV*9&0M
zH-@T6EXQ*sfRxDXdrgX@j1I5q57ra|7P!O!793bIcx{pD+<jnFIC+^V!_q&oKUIoa
z8M9yIQoYn4hD<;qhnS7Zxk&`Z(&r1DNzVrg9#59SfbSL$?V>$ze9qabB;~t)cltdW
z(|+BhT)~+M_r0M`Tlz4ZN9GbC;D3LO{vpXf#ECFQgY%2b$rEBBs2E{?Mw`7M6pUhu
z6Wd_@fqe>P=VmeAwTi|HsEl1*e$r_nI6?%9Bo)OFA1-J=mZZz5j%qRQQ|7xN_OR0E
zaFxaX-Rk=^81Ueu$o?^i4$M_Rv;M6V&UbLxptYW(>Bs8h{dwxsc&Xe?_%&&{pnwf_
z*!LFW2?+j>03U_(K#5DJ>BUtM00jgvj#20d{+*A+I71{3)%UrUmLJ9*k&=R30Tm-C
ztVQn)iNvBH1QJLBQ>pkauG&6UPR>cB9woAs-vN1oE$OH63*W5gs;Wb+R`}d0HIpir
znhHO-s-E=xH=4i6u5CdH2c+pf3D|<4AnC#u=jEJPN=D;Fhp+7$!j*i1tA(g8smhN>
zvyTWTuBa-@UjfEo?!8B}JgyKW*L4>43I<0Lp^ewc>On&1#5qL+tR1ZJ<s>f5<zSx9
z$3q$4^7u>muw_m&BhkJvZQa)(^_)ju#|h*c)^F*w6{R2pj#OO?s3+-9Wp9WBQ`j1d
zQT+1Qo8J>d_&0kOV70?}@k!Cd78Mr1);)aLVMG_)=o4y1Q{kU(z<dd5X?9JMTl)z`
zm8@pxR)!E6Rm9;B`5bfjplm5z`Y<3SW1$5fE9E<h91HlMCCxehEcQWNpY4SV9$nmI
z_8vUOB@EJy&n2_aW2v3;0}RCuj#$S4jP}>pu2;f&br`TW2j%P{a-Pg~^X)h|T#mx4
z%e?M!2fyF>oTHlqa+<;&F;C|QFpN&_5%xvCcaEIEkqZSVCQ3+1+zHOR@3ZucX9Oe8
zed~9{m?Y7adGRkeg6Hu(Sb-z$5^>7cl3pzK>3q@>TRUiCHWc-TdWHN=DGU~+J3TTe
zT^<RK{#Cdb=4)r3SMgtqTpi|``qq(1jgzRis9G?c;Qw3%U#yFmrDKqUNE2aRO93b`
z6q%YnM#gv}Lco{C;OwNnvqXedXTI4(V9Zlrw--t5yYk21mAZ}HsSvpRgDP?_xIR@9
zBpuJbMRu)vBDtml;X6gVQ6z?DTw;B^7sz2&6{yvAHm#t2Vv{%3oP_0hXCs9Gg+qdM
z0bR$J^FgL>1!x7GkEqqhPx;!9&krG6bq3x9sRj=@(`fM!)_(zx-S~)bC=o3wWQ~?Z
z&&`Vx1d>i8h+)Jo8*eoinWG3Z0ibNN4lt#%B*fMjmb`r_wC^}7$(~Hdu-&Pc{+G3b
z+OoJ-?*g9m5K^h!S^m5jm(-XEF3^XJ*msJ+*iY)pXT=Cuj&DsTpASfuwBCg>+88KP
zoN!qCOQc@nafIJww|;!WAmeamrb_s|zI~O+I@gOfI`At9cnaY=<JnX0&cnMoIdQy3
z{LYWuqY%{>V84fL#tl(Z&unuDs>_J+EIcS{V$6n}q!%X~1EOnCE(=&bxGPzDo4x%B
z0A&3NkSJ^nJ6^Q?BgFBI9=GYq9Df#v!XM$Nj(SoGj5k6j3P}gy+fItiCsedmy<lK$
zuBUU;S{3AXC-kIj(wyHW^~DAUXFG^{itW+l1AZqDBTO8U_*<BV)z*OAZ9%%DxK3*S
z!s&q>n!cHqi@j|N>-(5hB0kUK5G{oDm3&h;hWs1UF};%17ieD|h~7tX_@GREgVk^{
zMN=aH^@zf)2|h5&$MdwSNXHLSlb7X#LlGv=#n|YQTRgPM&1^O<uYWQ$y_=NkX$}O|
z(2V|<^uNV&X&g*ggvh#aLH4gzoMIwIE`!Ppd6cN&er~$}8!RUVgp*I<1uk`RuW{mX
zhMnPwKmGO&goG*LVrFKBhJlgMz&aM~#*+XNfOKw0;);rjB0jjq?a%nKG~gD_Noz7n
z#)J?R!(E)7uTX!!GD72lwcM9`Sga_=$B8T2-*ZHW(fLI+Ca~`%PGiH@3&USmrmO3E
zryO<t7%}pcsgxT2>F=NJCe3Aml7qa7sEl7p1}z^DuUfCjY@-a!)LF%)$Qkdnx3+ub
zyu6$`724pl73zD0SZqA@gO*T<H#bvb2gH~`MI+$xiu=#3Erq+E$7LR!1}|9fG8uFP
zeYs>XdNEJ}1di4qQ>`|iKU#2Rwl^Dm|Ky^xgIx5&JLDpcVqOGnQTZWatXBSwd1{y0
zgpybS)BC#sMbGl*mcC|Cz0A@mu#oHuWZ<7mNU`*hwWLeqc3dNq(une#DMPzHU83if
zOCQu}w4(h-zfYK@%Wn}{QW!-40{E?V1|s-hf1WL4PQNAj?uO7pW7NC|wg+LH836tl
z#XEh_Z)aT|hq@kHV|>M|`mX9aR;NIuPEsXG<^OUw-p{aGymbnC@Z!ay`ESTxzAdsN
znJz9^-^Caaj#r(gztl)G774H8TZCM8$D?t=58=Q{;?-ZnLH^~M-*S@8LzWgsgV}wp
z0+@Qx6f%dp*juWLdx3j;@f}df&>CrImXFP16ZVM01Dlu4(SFo2HY?o2H0Ef^QzrcL
z08-m@HrU!gD?TN2RG5av4|fbeV;`(jENg?ZQixS0dC6jw_C`Thr(a?&Tz~3Zw^%P9
zavpvAzsg&n`T>m{&21Yg$!TkJ5<`pc=Tto$gq%q=xVVA-H-PJSlE6Yf)9C58CWCc*
z=o+eKp4b&aU$;p#+wnm5?>rGC!3-mx924mt*VnE7G9c3K2?hFM5fW@)GP!n!4;Q_|
zuw+M>O(X;FpV?YscS<Wr|I!F#=_#l{?0=Wf>`L@^QYgYKC7>O+c<7a*z=?;w%u0+V
zbgO$?+^jJ0NA&b-awP<obH=ASA7~i39^0Ru(F9{=vk6AC>!fj?IcS-h*>&T%sA)W&
zpB}vygpvzxibhmFBJ`--aVvGb!dl{B5s|B#{oH8OxFLeM3Z_zH7%Jc(<YF>5O*5k1
z@;a90W1F7Wd85jc%BSMq4f@g@i(W@iS#Cp^aevkBbJO>UQm!a^Q>{45Jy@Uq1*mUu
zK8BAI=~60CE&YAq$@3(h%An2By^dMr0`cA<xz3xTASLF}?DVT)K|uivNNg%kCxwPe
zIy-Zczf)<PUauftOvP!XMJ8(Xcgj$$a!p*3EFvO*2BryJ1*!V)c>Kll^;#$n0FaL)
zRx%!xB*Bk#WW{5(vN%ufl*0?xKr=Iiz^oZNOUCWk^Lgj%WV<s|NWyq-KAD~nl1%UI
zq8Uy+hOK74RoBBW=sCM3cwI-s<^`Resa2*)nQv<?a2h$}>qk7V$5Q>auJlE2qS_51
z4mB!+<m)=_Q=}NQLK4wbC;JNosQ$)9c;=uJfQMD<2}t*Mrb?CCtdwOahczoDNeBqM
zRAprYTqarm0rdIZe*F62TFlgTw~(7dp5>7|mEqz&h4odlu&F`*9WJ_PI;roVUxI4t
zn7RxD<SV+(Q%nzS#?PG)z@a#t-E!PYkB8^u%?Ms%La>>OZ{-*DFM!GJN{i*a)-j~D
z&2ss?vG&5hV8{=E!qT0y4=J1xM)<T3bDzJaIgT7(G6H;Hkd7Ehm1-;&WSjY$^L(BS
zUZWsRW{u#9>Dj>+TFYUGON`Ie)3<}^`xj?f?cZEpS6JXl!s(^HGx+V|_I&F$Nu|X-
zFHMZsAvAxCiHYemk8^=rgg!4YJSCsOlVpLIWF|~cgEIN^CCuNrxr>R2Fw5flc%iz1
z^H^~tP>?sTL?sFoCrR11PI<YQXm-!Wh|a<cu!B>p-dZJM@Js$xt-o5MoN?k)hDCB&
zA4Sa->KX~)a1i(qg+252M}-FRvhN@0q*({iFt>wh(|VFWmfUs#nF(b(y@tX({<W!F
zJ&cx&etHFb-{CVuK<$y7%A2(~{5`e)0E73dGhA*`gY{APx;^8|OKFB29+XM~?ikO>
z-#|VmV@SW;?1N*U$q^*ss`_P3%xc=s?0qgVTpFWDm+zY9$`*1Sh(rpE@?&MSnq1BD
z*V>i(7~izry}{M3`-1ED+Ngvpkh}U@dU|I6$b1|aipvj43Wfq{@PY1_S+0~KZYK<6
zBnJyBo!acxnedjk>uM#LP4;P!?zM}|Iqw2LLAT8)0YLpTpE+F^A1`V0W-QV@_7MdQ
z%WHBd$d_<REwr+zSb>Q0q|!Xk+||#|qjYYYA(2j{BdmHnOrid?hWSC5h;p6!k@w|T
zY79jmhsam_Hn6r4GrO+O)ovW~Ob$bwLSpg5LA6pPYB=?LOjAq@0EUQ#yJQnRs5v5n
zZjMMXr9&ZLE2!|9+kw*jZhxX31HXx-OS$$iCZ|ap-*o5ts!XL$r|mp>5uki3oTZx|
zT%(j5GhQ4Ocj*>}NEsO34?T6Uk|FixPq>vt5ePi&OqUR@v&}VOT{~ZrZ5-bD&FI}{
zQD1H)>x(xglvnB9x-J-Ugln*H!V<j`92a9c#zsd+FBqgCYa+M+JINsPQEbc{SDXzf
zzeHEoN*z2VqEV$9X*BEHXL0+LIOWN&EI}RXaP`)d4QoEvNdC~wJo_bjHlGNj=Y{Dp
z?{-hgn{2^EHIW+TJhu?k{b3sSe~|kVJEdYh?a`m540@2yGD&Fb+YzLX-nNTyf8k6P
zN*H+>y?LW>n2Nx*Wx3<|4RQWf@p_hvPc~f&tH1<_#OsK%V&H{ZZ7?6yZM?74R+#r)
zZ?VCFu`BFQXTq1v{OIiRs^{~ML|g?S*%pwEB6vxjY^v>K93A73&EFNz@TcAsX_*p2
zFoaFSj#QWwC(f9a+ytFYvx0`3*8i)8QkM`4n@Y90E23)!6>hOURZK1fYLJ%c0nv{c
z#?!|j)kK$!U+4K-MODWhi^aN{G57*HviifZ_Jgvnt+N980#tKHN)O4w&^*&h0A8MF
zD-rG3v|4S%vS7$4EUeO2EitVyWO*m)z4ct<iS4A$;7Ibka^`(v>*=WvRRh)9%fxUD
z4G$v@jVZ!V-O5sp!C&2bdV1Q?H$(9I0_k*vkmvP-;rS^Odv1Kz$^!Vehc~|PIEEnr
z8`9s#=J2NR8G?_)I@b7!e4<=Rb4$!*sU@ChmPt1>Tk3|?(!dX5bb!0u5)gw5wRU~W
z7V=O=kyYoifeU6&z`QilHL<8`p`uyMTe~$8w|WOL*B$~Q^3hl+R1&o9vme(9jA0kR
zVl@!W%viZbXSx?tj2ziPS}9+om@=8v)d?7rwz%$LYhbP&bu8E=ZK-V+gpU=~<J(j{
z$OmFC+yyQ9|2|JA7=KnNl~U?*F}kpYMJ-pQkcy(%y~4?ETlM#fm%=1uw_W6r&fxJ)
z5%}KdT{Wi~gJ3F9<35vpk4oDkMORex7mZ|RbV=y!<F7&U(&W^^Pn41Iau20`hiGcm
z!XF%#i+=l!ops^yo9N!&@1kj&wioj7vT94Vc|YRcoUTb})UHYsiKV8`8yL!;Tq4mu
zY4W;iu#O@0otA<k)}3MN<iiJVSgZ`qu>fBv@Sk%=okrNsfIVWBDbO>wUB-YdAEfh@
zPH50#3?c+R%2MWOD&?y<+uCS(!(e5o1j)jE{hv3`)vRRo*W9bo)qFLbZ4XWU>$Ts@
zYtO`CL|OPUF-UZ^GBH#e!cb@|o9QUNJ_?agzRSEmWpG&~E6YsZ|Et;irP<q!REmu9
zOrP?tNUtYWQwbB5NNCCQl|CH(|N466pLU#<w!Gwzd=zj0x3BrnURb{LLJG%)LIrY7
z9d!8rc{2Zba{u}I|ErUA^7}LY+gsoR>xuMwDaD=K*K(qRuRcYc7K2r%uZAWcEzxf|
zT~nWr7yoo0rv4bGHOc*>x#CGCbyG=s)}tuocf@2K!1qbGR`0`>8@G_s*jd1qTbLaK
z<y*=;S$J@<WgE(XQN3E3DDoFz8IScvEt(FNQX~|RUWP>e-Awe-tPXtZlZ78-g@dAQ
zQ@*A8q~(bYFGjD`$SI+9{+V(44eqqI&pE#bJl&>dht8>f5CWqu^HV>Qh{VINmVt<@
za0+@to@k1Va&I0*nNlde8gR#_Q!B?-N0JRfP%jfn3I2C8|4Z{%d|npXz}u9MVDQl!
zGTtzWgr+v&beg8+k@@d@-C3n9o2b3s1UB|+Kfn1lfII>$omqp2czw{vw3@b{<d1Y<
z%!Ja-6hw*0DCHw?mI1STwK5gPFCg^*>x)t_9USSunnB)xTA2o?i;)WCIsL1Dor?cI
zr!u5D+%Bh-Z+_DId!Di^!tk#Rh+d$puV}voc>`GI%ph-o_LVxgNC@g*B(Q=%<%we1
zDDAujXI!kK1|0h7)be4~QAGdMeDYQehVFE&6V=ht@p!of1K{uypk8QfY6`{A&;M|D
z^i4VB#Tq=BUK0f*e+NcKBLZc%`LEr9L~;;q#Pebs56r3y0j_^`elAk-KK=b75x>X#
zET7vm<2L_Ce2HjmiFjgxi56GO2a1dPjDf?>)kvAWfagbU$#~+}6nf1~z$B=yuKoxV
zwi#UZHf)#A5_=#H*lM}CW`7T?#%T1v*URMUEKLGi_@`UeSwg|MSZc+sJ(2+N6p)%*
zZLDAP{u715;kkA@F+B=#mn658nOtU{6O$#Ffwy_EPxvDU;&a}LeZef#E#SGEtqd)S
z3}CIFx(g!~>1_y)ufCfw4k6?X%sudFx0w`ms&@!U9{l95u78u;`6D6EsLtNbR=ewq
zm$LKm6!4i>-Z!X#=a0&a&wY#hxSPzZ1%Wb)oWLt@Q@3YZqY|IDIkeKM)xwT>baRU1
zTBviNg1bBjTmFeMT3G_eaYa)2jE#`bN1?t_sSQ_;-%~t?Asu;dwR8_}FH#lhzK>v~
zlAzE64{?ib)ZqwCO%Lp`yGRLYJdQjb9xfEi4D#PC-(O39!K5vinTnFvtu_;ruJ2d<
z)uzKTOHyNxV=slzmnQ|X(eK=$zZpcUXL3ciDA&1ABDv#6tf`bde6e@}AR6>H{b=pz
z)b*h&f`QMZ0u@Kofv%l`(m5QPH~Z|5CGSxYL?`~JH$R_|%03$q${)>%fmr5_#m-q2
zFzxGomvl9qvB@CF+~?l0oUTy8BUV7E$smx^_|{bs8g1>MSK5;JYS#V8XyT(kl`DB|
zoWA7kTdM^G!o@bUmRiebU#+S8FR!qe4Lg4R?tG2|S_KI-E1>O16Mxo@MeJm$2RZ8W
z8WnG5P*6~Ch5Xy{2Z5q-GEW4mr=vD8Fqs$x#J+t!ce2(=0s^F!Q8IlcPp7u?mj9lj
zN675G%LAEorhs~@+}G%|A?mh2Au|2U%ohM+5P+617ywLBf+$3MA%Av;rCQ=r=`LaE
z3_71b@{vn!{Ur&=lP`Ahy1N4;g4T}(m&NUFMkEw}DLvkjCXXGkn&v3&C@A7=zfT*>
zo3&o@FkTKDl}_bhJxpbYE4)l_zF9z2qe(zTyu11l4=r`6^v|Jv!ZXDD&a$4K8!J`N
z6xZ5%$EGZm87w^*NZ!4Xk<Oh=IVl~>+uKgxbgDI!UqW_VgB_($#p)-tWPXzn<e8De
z9Ibj8)bk@~9G-|5=|Hs@{iOa$$}w*f%g<2lU;$^`pgl~!ozF{joNNh|MB*IiKRjYc
zK4oZAD7)c$oDyaLdS~nCSIwRo5R9JMfq}3+5I13+bhd>m6k)2{jnd=M{B2%=7(N38
zkw<E9+S2IT+^PO^cttHP+dxZZg96v+60e6#-p1pVaP&|F<E`a%X>6Ias6QnWi2G#+
z?8*8)dnCVCqfhj->o&~>bbdBw=R+Yo?gImT-$z(%_rr~Yi@p6{C7d~LVwUUaF)5?5
zyHbng3bF|*x}7<=+xp_95Fj;Tk7oP23j3X-0WcS2bhJCp$&jFs!%gBq{+J+WuQUDC
zA(Sz{wfE|7$s;hgH8adI_+a7++`3;uo(CE3-FuQtTpO;YdrZj;8ko9ij1sj)lgwGM
z*?h<brhSnulSKylgn6OYx|gjgm7*{pz<Z5_JBG43eOLdhgMj$V!3uvOx23{XPsW-C
za@l9006{x@`%qypGGl?~A^cIe-~Dyu_twi?9^FPKSvL@Fj)c$gnt;oWh2{q?-Gc<?
zr%F~_@1nPdCr3w!{xy2FW|8^NfE*Ng0tz-;KLVjlGAns&%?8OT_%MxJfUX%7;8&c8
zTF%#`-%@2?lmTadS|dnDcHhH=I_j*fth4Pw4CV1uZadP8&iyv`qghy*zDGHwE)^wB
zXG8<iinl>`H{!iPe|y)d>{r9!GaGxp`O(*ZdGjRtw?SDb;2zG#E55r`=oxb~Mg-<t
zP%{3z_k{fWTOzZVv|VQvf171^0C^(_K1}P^a4d1us&MG=L$4NC{bTc8OYM+_hD1?S
ztc3{Q?X4}qR(@5B(6GngwiEsFU0#d*Cm!X+HrvuE;X&v5>wxXC&#yAy>7O6r&~Vx8
z=#0$QLbV^wg~=h>*6rC;syOC#J9nEwPucusGjvpA)K)1oJ>D$FZQ{Y*g1wfy=W8fb
zS0?Wl;qgB}n2o&>TOgAVZ)Lsw#OFWAHiCB;1&h_QH^Z|?B6mdqC0Xd!6*PHWdIjYT
zh2_!XSM4;)SCK9Vqp{N+AoO54LiU;!14BSyqQ*K&>+7-O-J{iVI}S?rJBb8SY`Rp0
zT-!wc2>aH7y>dT8$Gn2vO#UE^il1S5AF97-DMze1{-U`3bu)-5MB-*MGgKivf5`1)
zE!Rfr<$tv<Xjagx>fcy4S^E;@9$hJiQ)rUT=5@7;9Hmx+{+q>8%yT_WJn{!Nc5j8v
zW>=w9v+Dy5SiMHPTv!Q19PZj6?Lg#c>^$#cSy73OKn!b#_dhWM4Bbj@;9WtqRU>+F
z&z|JGh*`-Vd=9}(W<ybnGwf0-Twy_R@nE^46<P!ID145h9z_|1e;(XLfPB$qtcPR_
zZXgKPj9m4);$uYn34Cn}!S8HA+zQ)JDr2<mToq}+(^=Y^EjfbVs3S9`BxXZFXRovM
zE?{zuvxG#5330yJi&%5_cge9c(v;I?`VA9x8^)VA5P(gi41#nurb&|+w4eCle@gDX
z<J;nW@!@%aO9KM~*IT;GZ%$WeWKav7Xa4>wmYb~7=bsG!BNc=ofqr=VaC^WW#fvO*
zigZxD($mXQmUg*ge{dN3sl~;lST#Vby#@Kn=7`g^qq@6HuMFaP3NeDU%<J(<fI;tF
zBD1TcU4EKIF-UYJ3e0RY)+_a>Zk%r9PjFH61_T5lKhcejI7qT%vSHZbHVPW`#V)Mk
zKihqWqzba`$%>67Mqi_%Rr?7b#J44fZ-|11gL<LKGu|Xe+_pF0t&<)i5zsD+?JnFz
z`esnwTmhcNn}m_63eG<kqd|{#-8jrzv@f8d)lyt_-tWMKbJLN-gWKX^t8E_KM;)&I
ziK=X5``cynCC>tiu3refQIU5{<i0g2%W)1B+E407L}JwVD-#%HUeD*`wHjqXzPzsM
z`-|$ZvG1tUwtQ!7dp_y;Hcraf*bT=N4{sa_!4f~-ch~6N7G$-!nl6nkx7buoy?lCu
zoDG{f(6_~PWBa-iwnm8Bwn8s;$5^`-+M`m>p^STVedd}F+gv$fRXNUK!HS2&=8stn
zQdY>qmSkaU1E)d){X&R#opNUw)*^ljlc%dww~Gt?VvR5DP-1ijaa4|Q?>#C>LcX+f
z20@Fn&74QDH;6i<5H^?j$mVt>E7pGAhgf?!tULr6`e(1F#$FdG{DJCyK@01vI;g&k
z5g309`>8@4uEYjOWEcL$hG(!irfBej!phIjH`4lHzWFl}Qt8Zwr<20vue1<;<lws-
zAbIJQ2+<tjrIILSt{=ix!_B-N&*Vnc|L%t7_rjI|KKfWorHZ-Oj}Iaix$zMSE=Wkd
zCOtDVGZ5U#9-9<@_k<FK?cBzoOrr@KM>hUM8YrNn1quSMDdRXAS5hXvfV1^i2#M*`
zt-jT^zwin&z_aqkL}`?y(aMU;gN!dhyHoSXf@;f#!=}w?oJU}`zew<p!r2px7lSU$
zGm5>_)2RUT39k_(U32@@KK$l9TeyF9-i&(~4&z|K=5CVZ{K<|5`Z$@(v(Dlipe49o
za8*dfiS!?;vn-dyM&cj({Qb4;73Z4NpFU0SJK5QZyeSs*^F&YT$6o8U(%-4Spt)@x
z43LC;Sx@$^115*yaN=SMlGWk5*WWp!*;UZ>l#1yV>rCZ>F<x3_AmQg@>1I6*;qT{@
zzF#b9=(Ak>nOjpcR4Di}A;_H1Y%)13D(}u9L)A7RZgqqIE%*=#zQDzD%<fm4*S&)D
zv#!m1SNHDS;PCTA2$_R!7^O^&{+PXlK^gqzNzi-eCrE(F#5maNm{iz8KUg%VIjo>G
z9W1P$J_*$P`o$S#Y9jNs07>9_>WkGTGqz@;V%*EbX>Dw%m>0xIQjyUlj+%Lm`}@S2
z><J+@W1UMt=pBz=chRa>X_PyAR>9u}KW&yF-DKDv#Ky8_$<v^{0XLyNoFnHgSFd}N
z-g9~##s`6e^MxttjP1Drd5)HE)IdsuI#ZEZC<R9V9dpJtDfRa**2-bIx5u?q{xH^)
zj=Qn1+;y+UbcZd20Ncn*Ie2%GvldsV$+Jo3A(B@v$oThZ;DPCb^QRxPF?pfrY6&b`
zpky_O2-mS4kcg<OQBD6E$K%yTnj%;4v+y?ELYk3gUtZAC_CTUoy(Kq#?`SY18&5SA
zC{8JVGZ3h;e+btXh?=B(-TB$&9pdRxnw7s=%y`n$Id$Ote%80KROY27N1PHDM=SN{
z;ZQ`(!jD0PF6S2)P-0~RlziFjm3BbJ_nDrMCyCKNIWG%cO+0lopmlr}Rlj5;h$wx2
zi8DfLa#z_sivudWO0OprLg?Yo#kd8WckpuXVGM3C-{l|P1}RG<AiZ(T+x+ziw=Y)n
znuiHS*O4V}eRH|!mG@kgL!%?3#v#1gu|NP?HdM)v4jDfryI&LHL|mrS8*eLP3^TAl
z{)FZtPs7<RblBL(ZqYf`ENx+Hcf7IM!~8bO{<h_AJuz}Pa$$@^t(;n^=6+kI-t{IZ
zNnV#{>9fvg1O8^<qnV7W>xpb_Q6wLCA25q(iKylb9bbl_!Y5pwghe^&9`(tcl9R6S
z$bKJ3&)+bVN{WNlWVM&@OM(7nD7OwkmPo8UIUTHERJD75F3Xb{7o7LJ#3d#cd{dc{
zat^N#*J?a^P4v28=1(7I!E<(mJ^xlmLv1A(4)k-g`rl0=^aGj~kXe*P3gfbC_LOjQ
za)g2n3nTs9Qu8eC1s^5!qQEQ(FWi;wh3pcd%B*TMbk)DV<N320;+W4V!L!C{hyu+>
z`FMXl9!z=)2%1JKgV<una7F{dJ{Tt)c58{deWdSN-2@j~oOj7aV^{se^$;3|jD)*-
zeX7~B?k>45J$L%#qk@$Q<Y^{$KOLxUY#%U+^x_=+Bq#%NY(ly2si|azKkmFskew`&
zOuwx;rwGf8a*5@1%8f1pn3nfk5xm&b-+xUuA=FbY-@-AWrw7G%XE8MxIJiQ4UB8MT
z+MBYg@qM?kn_l6dE@-Hd{(AJj-g*0<xE7JYmwUE+xtzAC5w2bK3txhl=w9himMKw`
z#f_g>j^&S6z&P2?;;z`JapI{x^NP&795N&~qf^0I?=c4zG4{##RZ=UW$!efkf1-}Y
zR;$R1K@p^%i{!x~R8oyJ-<bJ=XGb#@XrLhleg_+~-vt|}T9~{(D3e;rpgR1`?#|Vi
z#S_X>+c<dJi#*XRGQacHirWH`t@H^Q!)LKTI?it1^%{~Y%&rg6J6Ixibq$B;Fj}fx
zWpb@utM89L)PL21@7TsJN-F?ED-_ap3FRi((o^@+!65_hOY1iwu2Z21)#zPP(+m#f
z>C&H#>rk;@)kK&08k{04JWG^+dZ3KpZJ&r>W0*T7`19*DBT4MKS+lOp;7QQZxYC%%
z;&*!SGOd1>z!T;B(GmM0;F<<U{R2?@^!7~%?62>~pv6H==Ke@>J~%!Ox-xU{GhU)H
zQ^;MtRZ2dgPUb8#s{Af3l^(!kw-O>g`Qy)gW3<bwSfJ`r3wh&aGgnF?`Mu>wm98cR
zvfDm4#8IOI`_Eh!-dl4^QuAV0QcspR`X8@2Q*I%*+QK4Zh!cZd#!FHz;Oll@S9j@q
z@$wf0Xf9bXx{m0pj=F>AfS}P{s@1@6{pb{dAK}zdk8dJNyVab&%0E)b*!TScN&z$)
z)2g8IF0AgU8#O(04neM90JaA9+#uxM@v73DgABPyD4FnG3;-~h@QyROLZ^aiVR``@
z`6mMJT)G_G--fi=q<R&VN*zwIRM^v=X1ju9R^U{{t+vwPrwgsEW}@}kr<{``mEbuY
zx})R*C{lxhzqvrD_ZDmdOqu2n<p3U>ocd<o8M3eZ9@1CfP(^>5q#wicSm{iK2T%7@
zM{9K5ZEVIm8OT7Lg+C{i%ePUIDBI(3+1<R?O-V?!6FP0kP@Qc0fLHB|SYo#jsomaM
z;62&BnZO$z<#YMNdS@rRKH0-Xr6~@Rhn?F&^&QdL3@KSvsOQlxqz3Ly<&3>RAVTA3
zqhWYgr7n+dj#n58&@rNin1h97(Uo6#QhODJ9<4roaX~c?J3!~*lwC$V{kU}V_9$ly
z$Qc~U(Lc`*YjD%=`UZfjeXp1+LeGs_SN)^UmB&Mw<LN>Uhb%VTEjW1K#1yS1z{w-Q
zJ_%Bbqo87?71d8NR^r4Z_4OY@I>=L(WdxM%2LeA&8uPhxjOz2VICK&*-l|?jfxxJC
zGgf1HAonzptv_^(C#wJM$LPlYE8|sG-}lV-*02J7a2Y3i0oInjajA{qftoi7Vx)dY
zyHZp)NymLu2xD$I-)PC~K!hx|I9*;?w$Jr{*gMOpD&MxvE7IK^(v5U?D%~wz(%p@K
zG)PK^z?PEk?k<sT5Rj5adM^I+zVp8GtToT)nYHGVOW538-22{FoX77x4w#$Wz_iRE
z(~WHe3dfz8B@fo#IVCd`1pH$hyW6SK+UDc^Eyi0*$W)?%{-yH8e_j!R24#P4PEu&h
zuEluiSg6r&6SC0c6r~>)sZodNVmdYR4qVO6n}<Z4f0q|KXj`_s(xkWX^toY^ad#Yd
z!RRl=bUuan%qc8`ZoO>;kUS$&<rOuCMfUqkHx4m3H#RWXFc)tZ<rsNdl^*qpQv*4q
zPevH@?C9Q<$W}_(<K2Y1t#<}d{QL$cjvLZT)%GG6MXeTJFV7d0^(Dp+Ri$Vx_l{rq
zTxh&6;CVKp-|Y$u3y0nGuTvrvlACH#QVY?~X?%S<0T9=zGONp^?2E;M0SJ$CStZ!I
zBW`t9G4h7>NjX1!YE8ckHknCsL%OE4wN)8*BrGQJlPt~GK*W<=l_y}W^}=E*3XI4e
z(UJ)wPaPupx&e9N_+tDfDPJ8;N-0+y!D^wv9;Ld(%08bI<bdGgrWV8XBhdKLFlIuv
zb&v6XpNM=badXlqH}5!#DJwVZMBlpDzzt#?oSkBh!8D*xqoq{3`s(Ae@dSSA?W-)u
z$QOI%Zj58iF!WypTfJSSzFS}rykGrXXc?4p6wje1{ZR#RWN&!4<54=6X5;+yvA-@%
zy=ba#PP`3FO6Kh4ENl5(w{H6{$l%nl>|@_|u`!V*9LTty(r6nZ^ULwrhv{7~c{|-%
zn91TL>@RBPRM~-NY4-V9Vo^~J81Y6KO7Bi7V~}5o;B$u=sPuH-C|hXin#DlvY5l12
zQSA>rPn-+%3}3rcj4V!-eOIg1PoJbsDkniCMRUUH$(dhFi;3#~qDr}&n;PjvN%gZ8
zK0MVWtZqcV=5dI7HgA3*?d<mF_u=ntykiknbUY@)@XdH1%Ao9vgqp@j>nP})N>9tV
z*!-@y=J=6PMv6O4SEDr7sJ->%8o$K3e8Atc<eidkz9a$$B!29QOxTxhRPS%%k5Ff0
zn<!w^nX$YuXQ0csM;;Q%X@;p*q2H(~;I<F#ezTr$hP%-jiHlwNQBBL)$;AbWh0a9g
zQ6&q^Q!e8(-2{4#jwRC|BhVNeSD!s&A!_=cObT4KkSR9JI0AU>Vf1dT>cAV;>i-nP
z4hV@*sGCYh(cZYH95V{788&NfbScX?!w#{+Jj$f^H94Wx7Sf+eDShW`JD1=4z(gC-
z<zfFKwEf^T|EA<1eOgiOdEfGVsI~rU8xjL9!>7J+jK|)x25~>)QC%szW<((uRDs`y
zYPuwE5=EA~BjZ;5Zjm)sT0hDScCl@U={h7HptnQ-t62uwE3`rpAz!dRYt3JK>Mpla
zZrc8%y+L#;)L9|Wlu>_MQrDx({^Smy2JNw=xVOe2C_r#<O%7wpyz-5aK@~Ysqd?k3
zpnUWXuP-*UwK~UF)?e-(gF;oAc1jzV&J<QGS|8e<|Lpv~oK5tO#yBJF+9EFLVm!n?
zG;%k?D%C;wg!p#)RHY@6<%{_$Zj4OCBK>=xep}cseaS8?7XmX{>cw(=Pd7Uv(_c}s
zCl2hWbd+9gH3?rC<LPBDZJvM%&r|hS`rYcnzL*}kKE&Hijnb*_Hh9Kvd9^;0r?qEV
zWx-5e*f*S+LYf$MOD@&G(co2q#hVXeE(K8BEIL-`d<Q&!8z%pZWHO9MM^QeV1Mh$?
zLs>x<AKY{OY$7=E*#gnflceI|)4`lRx|gE!JMn`*(^s@mAgtr_omEu2DySxkjQsxh
zp5)8#l5!dYo*rp}AHm$z16QBEE>9}peu%C^_?J+BvB3dke|lvAS|*el&wzRtPaRAp
zY)R_H{g=*n9SNOtuI-i+q}nRc7%aAYU6T>aZl0u-_5{98@`>|%_atr09}}Lcos8+a
zoERHHUGHtL*oIfhPq20A;#bxe<Q<p1s@)L&MMVD?_|V$7XZRf#Ha&tGJ?nV1$-j)x
znK%TOMJhw~7i+bhT+g>*u6etUE6>GWK+2FsMhzH<yfITEYcFXEy7<83LJG@S0Vi`H
zZSk{yXHtcCT<68e{Y~Yvd2ZfVH1iT$q)BpZh5pOO_qHbyWtaP2w}^6)rz`w<I-!n?
zEIkPPi=e(>R7b}`YWvWsiLQ@*jS}u|$J%J>qk?xcp(d+#<8wC-Wnr7mic0^P21jAX
zZvG?rk3p0pxxn${7I)Lm`4>ryn$R{fcLdE}s-5fLyB8|#?V=la{OZ{_r{}}6MPZ^0
zoKATOs&SjDEpQgKrB30RTbfOkCyw!_X`v!B)P6RT2uzvBGYTHvn&#SBx+qA#w_TE2
z3W7xik7H#c4qjYMo&X(|gnM34GPcr03R9InJxsaJSJBAG$l$p$F{N~@_lvdtUlTC?
z5Dhn7?h&~69TI5QIZ-yx3rGi%Zxu}h&dr}D6-^V?^v7y8|GX#$V`3BsV``zrZgTlJ
z5rYHr3}(k)R=m13h7^S8_%Y}8VhCly7RW7erycT4PfGJO7`QQR92@f*)snv#q4<d5
zP(fz<vP%<Z2T@N)pW;XAOu~Iz`_=St>23^>Oj;lQ^~fB9L2Kh%<1exDr`Rt3TinA}
zi*+`}3Vbo<D&fyl5qA!gT2VClr;^i83%|lm)g2e7pEP#ar9-PEe>V7~$sgO&jEfen
zsdnY52(^+kMkSQaQTjA<&L8gBep>E`pN{ob(?oL#;z@2{hhy-B$yUp9E{ZEk!L4MF
zok_1~y67}^T4X4GNteJFJ{?*l0_xhRDw=6m+fcn?Y+32t-HhxL*E;p-JJPzgM922v
zl16i+p3FMN@U1tonqq`;_{=XP?R4E7l#7z)vm1>$K0l=6>$R;UB<IeTl?!aNn8Zx-
z4HSOTKTFg=HPk|r0`>hDLTI(Fm*^=dELpZEw?||rnOs_;Q9v1p-<I2cY$D?B_FI%s
z?98Ctg)u&h)Tn%oREm0eunFJSjj-BG@_SFf>Y(>@P<#R}Ab!M1NI*uP7O$!qXE=}T
z%b(TPHWR0EDdc=j*vHwz2s)<lgOFse0v-_RvFF73dx1!Y-6Bxni%Ey~9qci57QQaA
zb`$nH`f{PvFC!^E<}+z@K|BNF*-;5<MdY5{o->q*hkLT%Df4K@-3PbkDvU(B2Q}-X
zc@L|Mk1X3QERYDGYk6Dgd*k_mo2QiH6)CteL#10d^f1)L6z22F1Cb`BDu(ANVJ*zz
z6}qwP7c3W#Ju>PxvrvZ?CJJ9j_J3A(;|6B~B6{R^)>1<F^vZr7kS`7kd2vwa6k+t*
zkPCQezOS~1F~TT~Nlk7JrYLaoe1@-6Fhqy8{Js&^nIXu-z-h(A?pJFwi(LoA7U5xG
z&NrUltjL-zaG2zz{o2<<FxBBPB1FK>tI@*%qoJk-i{<q&b!q$!(svU)CT-<!?7q&U
zfnN<Z*(l&Two^4@Z7{I0%?3BSif+$$C-CBf1s0lIXsv&inD0$2_rvBJ#Ss49dii7d
z;Y0bc4gaps#vu!Fv>WA=RpH69(LttUlK;t5!8vGx%mY@%`FaHMY6%t1!VAsDgP)Vb
zY>Bz7a1zy0a7PlxSSJ?*u8n3E(HkcjyyJ9#B473s?SOnVOD&8)zicXxM)@RMV9DD7
zf|6(CFOfCN15_<-GGIM|TMPY1_>q1_twz#GR!f(xFPikq!hYpt2M%<Vu5N*4+hRUR
zix)DbXBUBBl8Kmb?n`WCjjHkWi{eaJu4YvRCHpecP3#q8g`WqYSaSlB+9p5JLou8P
z!*#pTM15L2|F!jArKnstWW!~rCq%yLt{zz_^$|_TQeLNuu>CwF$pT6@x{fSRT>5;U
zyKmB%5eaqtTT(SNKdnk<9Wg;qId76TbHF~hHp_gl$@-^+zgsIld4#a2nboys8{)7U
z3W&NNjbCD|3r(WBX9<8RUSh{hb-V&^y*<~Nzm5(UG3O#ENffAYHhcqTFGM3oc!6u<
zurd-9y34ZCl^012nlrgM0J1aMgG}LX@Wa3AFbnd0Yj24BW>zf>zOYgQR!>`7qbyf_
zV>Kk4BD*hTr3J+ew*zm0%8(43_T0Y>yDbQD7D-QRz6m8Jjfl&pGp3zP7KhP7c?sIP
z!L9gERX9n=!f1jt|MBI6Ca;f|=>y*DzGP(H`R?w>%}psSD#)jJ`PN{>U+hYQa0kEy
z4oLEF{!!%l)z0H{!hC5K(%$%gasB*`_|MY3sX8^;GrOqK3WMc{6<BO8qpvy$B3AW9
zu<6;qw#pIktE#0>VH;|;CYi47pKldUG+uAQ6tXL@On>n&_5V2?M=Az0l48j82gCEN
zg11}(r>_QOJ$ry0E<bSq1yRtquLyqyq~dbLzYuxsktcBYewD{P?#EbaI^}_J*h$0s
zHq<xCTO+f5zBV~>+_O6oA5$io*!ROjZQI6w!cQm|F@+3nxBX!~Xz(QAbGv|9L<{r<
zJcBl(iTz}a1!47HMX9H!E!BDJ&G82xiZ-g^wCIY~{4%jZD65wL^a8jh6UJn`_@-7E
zUGc@@;1c{afgq3l)bje_8>bv1GRM1Bzu_03rAN`m7_Nzs^|{y>+Pm5YS-wJlh2DJq
zvMo50_me1hj5HLWil&w;%3?#HFAy0vUqdZ$5+dy3s7t!ERP&=^PBKD1g}|Hru%ZGO
z62{ok@ILP|l){TB&z*`n83j!RnT(?8c<_6xe0pSFl1d5~k$?05;^*%ta{p?3i_j|u
zNS|IYZG^IK&^QS48%~Yy0Ri&540={QI1;+(gm<|D8pjD;6Uv4`ObSZPlh{G)|LtEp
z2PNH~S7)0ZPZi&4l<?8D<;-B~b&%Q3ujNl6jhN~`zTTYCLhh1zh<p(4&;N*2IWXzb
z&>{HV-hGF5>o~L6q6spK@Q?X{AaXB9t!O#euL`9KRgwhch=0Qp{R?We_>3Cq{u~T?
zhtT^SymkMbs3CbKYW~mEPrx(v(-Hj(=PR^2Jz#bI4NLSds8QWBYE)N}@G24WlOaH%
z{tdwNuhh@eGxZZdFv9p20iya$vi+Y~qJKe+te;UMYYj>`8fx?ofI|H{fGPGFVEQk}
z>ggG>dSXw}ipNwg1UKp5utfiY8vT4mjeeF$qmF7r0lSCrjt-G}`;|!0^16P#79ax>
z9@h8wBeCgK@zWn4uGjE|yg4;1^dm~OzIS(bLtR~6SuNIn%Tw5niH}F;v|rX%Clm1}
z25mCjoO~cO#Mjr?5g<muF+)s$ZfXi+EQ5!qc545b>A4(Gs@mCmXUp%0EAsT0k^yHF
z4Y(V|vwv7VV~x{qL108BllkNl03e~o+)cPQhNgRGbzy#6F)SL4xz-y{{Tk^jvw$^n
z-X+yMUW~cCLtWp^@fWXCrDkh175FNf%_J@KzSRxxW!H$)-l5l2z4&Rq<B?g2pbm$O
z&vE6KbM#g_ICn)<(O7wce7oYhSKh$57vzwiq}OS;c}0P#zEr(i`7Y>fGW%vjUuO1y
z5ji1Fm;ETuIJUz6Oqk2sGm-OcBS}QWuRC+y$hrlU$9_e6k@JIcp{-8i5}Ig={1@b-
z+V(t4<<sL80d0*M@n`=}*M(~BZ`Ql9S=#ls^qNeDK@?I^k-O-$mbCY8I}~<?!5vi2
z)A#y&dy|JYMlOUS6oQyd#8p;8sg&IcZ-7h8Sa-De&c*aMh%~ACyd#aF{ez>VAhBR*
z`PtRKNIpB*%Vl?Sb;YNWP7M~&nxfxV+f3Y0$~mVwAf8Gt1&T4c!0#Uo7xqnTvaGnr
zakuR4xOSa04k8|XG|lX6r3bMUJ5OW5`R=&!%v+JewFadNy(U>4Phf7b>U(42MpDiR
zz%|Bn+0HHBv+al%s6cIwqJWW;lRE^&&vPF#?`)fo$0&$Pk!=C-%K0GDP-Q<y$VXa)
z#p~qiNYCjI#DIWol-7A+?+d!&>7K7m-E(`3b)`)b>EC`3K|IeNU+qUD_MVHZ<|*8;
zd*1G#9X2~6NL8D6P5ZATP&xf2j(8`QxBI4GH#0PUA(lLL@C!@KMiR*`Oa8?230a0&
z1QyZ0S5J)>C1(wjxoYuGk~ZM(0UStVzdw3j-E!IP|Ljjp{a*QSqJmwV8e8{BnZOzG
zjV0z1*Zo*9y~*=a$&RLmQ!*+3gh59T)Itrp>mv01-yXF7vA(N%%7Mv+B`sUBOfH<J
zn!R0fb+B3gnZZ*D(IZpJ5s^uqEkF6_kHvk2D23qdHD7JU_L=$}rc{S)Un2p>x)93?
z`p?u7rcl^$aU=ufEgmW{{t~m}86i3FpPYVg2;z^-e#cv~E6-S;|IN|pevrcZ2Z+pr
z@hn-qMVBIA<;#KRbUU7T_aa<6hRFD+*^RAaf3hnCqS}NAtmLKN<jsPFA9TfRUUCEW
zV)-n>U-tuXWCgN?!;NB{Hp_ocE6J?L3S&|j!OH1r@A`WtG_VJe^J`xX*THNrgeDtF
zQ=^1}aV&=B!Vg_~B8yfjQ*y#Uh|OysyXOWAiq<GTkz?9&Fc5SZ8*TL~c*;)nxO4LK
z#}e6C6<?yX1%t<QrNy<+8VdCiWOqbzF`BCX+>kJa=#=wUTZ~2a8}9Ujrh&;eOEhT3
zY%AWU&h`h0UQPYH!%96$g?>A-y%xmLn3&It32}xs6Vio(z`zNq{m5+w$VX2vuZSi4
zwRRy8?;c2S5!m<#Nea0rxuo81X%oO_Q2dTP43fAY@)UuVmX>wT2)`=@e>kLIFZ!|8
zeua>64^EoCKQ|vVUustx1@Urvotc>peTD%ILqJ2y(%h)k2fOAlCOyis*E`qMAd9|L
zoC~WV%w&2t>%{H{a`~`MFQmfK;YpNv?M3U|xzZFjJ0wl=LE-D8=Hj(<MCO9Yp;9Rd
zxCSw;JkBi2h_rXU^$?~wvnk%2o<{16iS{>(bKh{vO9=UzHvbkfYV&wg4dXI1Eyn27
zVs8y~o5bE3aYFD>xsy@xgVpz^&;sINaPbfru!kV$HBaas&{HAX%{S-DZ6+{mgDMw(
ze*~P^Y3^=w)kab*;KpZt_=c1E^mN%;ssrAzPmMt9Y0p^wgryzNrXH+<$N2zradC4F
znJ$Al`!yW;a4?IBjnr^V$nA{`WjPTf5qEq-x@~(!s9QQi3E}lW#J6pk-|P-W5+|v8
z36Ktd$={y~Pfj)@^qZXt2skXDJ8C(}N5)8&Jl2;(&*{`5@nUUqA*uOjLV9#aG??o6
zk_G!QrqDDk3yYhZp;0E8;3|SVOtQ)S1>tdy8)s5I%a!)FF<Aoc>xVZkblQ;D25sJ<
ztxadIfsaX}?`5@iv?)>))D7agF!Q32{}uE%H5qN65?y6BWW~7LO%OA&w@@d*@*X*d
z=$|VCA-k_YCeCrEo6l@8P0ZJ!)^?G&Wsv`%cR`I#xiUB2;*#N~<HZSvE!s*1VlqQy
zb3%_y=fnV>T*@0Mtl$D~dQ9~_sYL#Ew0di!16USYlhh=6>$s_&S9)rWARh_-*|G+M
zQrZZlV&xx0m+SurX5;ASi0;<n@kbiukN0vv=`_32gPMfp{4R>AvPzq`+X)|V`R?-a
zp5N}ar^2EQQ&aF)jv4=`#;JKj2FiPAIl@~WS`OQaIk-#9-IrsV0XG9aNhCW_pZRJ`
zL;b#gx84S}B~pL*qC#<`3!!ct*N3?zVR8KS{>Gl;Iawspe!l;_SNibbCKuGN!{Y)d
zl%m`RGq{khCNgc6N6zOQRLcA;f$2bCyi>vRiE-e~dud8qo(r2PWQi7cPU20M)Ial~
zpE;H0Q6%Y~CW-giO_C~SA-W~dSJ{HhK+qz_@o#@R!T2JZgpIz@ThAPZAsldn*)*aN
zNG(>LH3AYWI;ajZGgE#k(-|5NFVs#sRy-xq<MSC~TEtw+WYEk)i)rRR#pgj&X2Q!}
zu-3M?9`O%zTYXvt0b@T8zl3=+KNE<{6s4)YX5$m)lj~ym5{~rTxh5Wa_A@0qSP!??
zJs;mpAT1Bj=weuEZwSwjtoDSv;NYveR#suKl-XICyIz$oOy`Tgm0k(3PejssY~7%_
zQiLWPh#??ijEWSxkk`r3?7q7=kaIB&-k{-eScDG4u|JluviJPKaqJXLCJ=jT`+|tl
zW?hkle<~B9|Jct*<rGPq%Qb%r1uPf>4GslwA05$uuOEI2tlBa)SE=&2Cgp^vp|uSi
z+1RdohHy97FGk}+GwO#mcK3{^y+DM;S-yr}O9*qH$PpUI&kfzCFbf*iD8=8eYX{rA
zS+2Af{ZF*z_B9&4ch`SZPLLFU@m5V`+4_>DO}PKVZCA?R6^JwnmGr!%P|24xv-d&=
zNza&Wzy;uy-aALHll36&sdXIWSP!S2Q34eQWQMRGAs>s2iy@ZRpIyzemw;=D@fVd2
ze?QxNGF)an@SN2EhZL_)&UtkPxbL_dr_$IfoTLH-9yuMo^de}5!-tk9c?J0OCM5Su
z+ye_fXq8q0+Stk}{%K^>iEFoiQOm0y4yAm*;>3P7(@|-AD|T<x57T)V%Bc*H1gHIB
zjTzv)n;LexKG#qjaba`e(z!CA<mmRxB+=X4awEkKU+_b7WznEQ?$$i$I#yZ-j3AW7
z3STg{L&(VXZ+O?eI1VibBl|%bFx45CoFoEzMYmQw?&^p&mh?r8oRs&6Mg_*yYb8>i
z3hsr9=`ubYdHv4%LOJDZ6C$=&$U9t|!&xWyIn-^cANDK(7&ANFRVqo<p1{J`i6q$m
zXpy3GN$%V1Me(X=9|+7?m)HCP_99a4_csabUXj{Ck%6Z#@wX3|Omu2(af}nr0dnVj
z{w_{)+XP!4iCUjmv1=%icJQa^YnDm<620PBXdJ@7hK^dJF=F`Qlk~uJ>MyfY3AjvW
zpeV9C=|^hpk^I7hI^2mE`QIG*=B2=%c#U=^l8xBw@~Td|mSaxQ#tp!c9zzck$;%J=
zD=U(%pO8BWV{jm8*t{6_A@3!bqAZxxiDv$u^~sq{B*Bd7)r+F*?2l2(wZ8PbL$X19
zG~g%3rNMP#9?_*xT6L_n=GB2C0`r$>1i}$6zWz+b`=#~UuJ}BVw+4|AIeDgF7_l4%
z|D+*h*x(kv*3`eJ6UBjB+fF_Y+kVqu8S=`q8Yc|X_6NRt<!_RKy7@*nle*|TW1i0-
zdkbC;X?4yT07>%!zX@$E#|HxWxs0^FhegQpD`rJi+VD7zuOUTXJ=i+SFErh3fBEE~
zQtXK#UuB2(=O?*}XdhCfpGvG~Xp@OX<LjbnuL%EGPYkv>MaE~zy+tWgTp(`4(RvMb
zoZC)bebV|9?Uma4&y3R4jk(?k`PkFgO;YxmdP?6NW==lgMhOAlS{rjni?n0ZmeCBY
zR(#Vo=BBV+Jv0vNZwR1@A75F`))6hkUK9kpl80SrRKq*WgX^TVRQj>}_IZ4Ka$RV4
zw<zdN^z(Hgz@g)f?r&$Rxt_gY0cWI=)qLvtlJ5CmRLxhq-{y!QtSJI-l6rB~J<;b+
z&M$koy-B~RZ~*T9d&gt<_YNv)DP6$@ImXQdB)GMtT#9P-nT`n;%KF@HQwZGsgS7F%
zRXN0<$JL%nA@k#owAA5h%fNO~95ElFQk-!&*GG^8P$iG|awR!qh6tj393|pq|NOhq
z&U@2T3NWh8vC6E~d0czeh&rehg3ipufJYO{-`JD905d7YS!~knW-I+L3`a8g6g+PR
z@Xo)>Kv*}xSA8b(589z?Hq$VE6e(bNj00Rn67~#dr&C?O;(d#Btw6`T1z!9q_E+oK
zG93zk7_IC=9Im1q;_KijHi%L87%o0Cb+jCCE2#8;@D6bcKV@UKI{=D-o5Y$|)W%|?
zaI*$lL#~P|n~^_jeI{SrLpIA`8bhe6-QWBBxiu?3Cs=zCzu5Q3v2P`GUXKPv_RQJm
z_ssCk$jCyw+lEl+aG3rnEKREx!cHX>3^w&+-z_8A&^2oegyjJ`3^y5nbcOKa$>A(P
zTSmsMo%=OONDLfZyw0SpnQR74B&eF>`sO<QinNk@eK<WPkXG-V1rGoeF6cVuk@X+D
z9fMN6I6P#6y?F~i;*T4W0MM0Cbju*V*H`Jc=8ylIAO95vjLb1_C+dH&B0RUDrJCJ8
z2b6lhtp}zPe-9qfRzh>7Z4h^<2s*Uy_H$Tk!K=5^HSPYivC}+jmIaNoVQtEYY``ai
z?GB%^-E6Jz|9Dz_lBP3PL8ujFhrp2kNfHak=_Ss%;&|FyG4^XR{<mF=%nHYUQgbj>
z+&?X2CvHZ*dx-wc!Ro)vyWHxeHWP>cJ0uA8RRS+zptW-~tUDD1UhDHxZdaP5eTWb0
zVF-+n7Jlk>2bEaGa+A~X8O+7OPdKEVF}(1FvwXGG@uZjAf;7<3%9THhwd>ruK*)iE
zZ*x%ts8-e9V$QDfO(JIu)8nEZPFI<a;8H1N>%-?W+}t_`Dky4|Xshdg73C&24Mu|d
zWrh^dYAFAl<p_g^hi9x~jH>RMPq&uI{1K@osFE5+&(Klbz8%&QS*1GWlQiL70hsqc
zjUEapfC&ZHHG@D>bOSLKnJjo_h*A}nVIOh1Rjo5jXGNepQlGam?G=t~#QE8ZPr?<a
z`83t=?|Gk7hUPI{bZX(Syr6&H`l}q_5KW0zNq&_(Zf5yf<E`Hz?*|mump{Y2wShH3
zp=gMc+J5X>5UW>+{#4!W{>T5~lq_!X7ZV2OD9R&J2u7nT47OtzUIH!-O}^$Y)aNLa
zURK$M9r?+n#@fAAwa$+j;b`RLUvk|JaaA*?#|xD*aK*4*Nv)3(nV}vlmKJ7mnYA_)
z2jcYmIUh#3``wa9o6vDpyhl2RdUb--M7LiE3P2S@8>>BRnb|y7lf#~c!^tT7zt-X<
zMIM;4-+@ee8;BM+sJc+)l}|JVMq*%}I6{xbO$xPqu$N>iIaz*tfBuGo<k#<-jf%m9
zLdRccIJ|uP#*9MOifNoGJoL8I5cs)TGM#tPR5l1(FTVJG+?9^(eJ3RyXIiY(8M`dJ
z^Z8EZoorQmj(<*4H@!lOGIHWP^s)N*RCh7xXPf*?OgSos7>kj>ZY~?*IzMf4bN0(5
zr{KHG=!-4v0uIY@>=ay5(v2!ad~T||85goaWUYw$F*lI#iOu?vlEFpD5_@BmLZ25F
zcA$H`JBT|b#3fP|<pIq5jaPg0`*GQU_L|A-i@ixyJZNdLU^}rP*yMkYIdr*o1M)Tg
z{HCp)ZFKeIhF|4#exM=k@DE{tIj3~!zi@OQw0AO9Y_m;JF>`DTxcgN_X@zqM=Q75r
zQ4F4;n{grS%PNUK7PBXZs|%87mn5)T*f0uhbruAe83?ib_CwCjPuhsz?cYz9dSUf6
zIjs4K2F-F0exax2R(?IcX4l<;#q0M?6?F=6KmyU;+*}3mhF-JlBzwayX-oHEM$KE5
zI`>y#MZKBEhDko=KSW1%wt$4o7G9!hD@TSu7O_y<#_#PH#RhH20~0Fgys-`{A@YrL
z;~6%P4keXGB9CK=WeHxEzBFS}8a75`6s}fsF{wttqGwW9dpZ)Tp|*d+HV}Pxu4k=Y
zRA$z4eW+Q2lJk82$@>=57>J0Pve@83R#wDW6hoKwP1V!>t6Wyfj<osVB1wt5%ndS<
zKy*n`|7>J%o5NBS^RN@M=JSKbMSTTb%w|5Ho7BL`!(Ke{DH6KAUgfYrC2652oWnQz
zY9KJkU6zCH2zvyn=VgooD33b9&?IftAccKqNZL{Z)|;?HgEO;@y!@)J@7et}yT8f0
zfKwkZ#6)65tUy9Qcxm}cg+0VEtEt<G5geXrf-TRS6eETo9ChAdEbFOMQnJ|Eb>R}~
zGJ|E>VKpGIZ!&={=M5U})seOGkjyZw>asjHdSO?A7Bpp8oTmGjKko2n1ftA4)9cU?
z_`(2W&f)E$4^}>LP;Q!Je2R@953h-BA#-Oyy6$5PRta5lm;8m<SJgeYl$#P4;4gl>
zV^?7Iij6Zjrf|uli`<cYxy4oTNplQ2ob+>s@^2O)<<sl@H1Rhjh5Q~o#2gJOyjqHf
z>6nizX2*>w`(W)bn0ocP7{6SzU631kj0dvuO6QOHy$}FPBwj7zi>F{E4&A$tE%QM>
z)Uuakj-=qup^=~$FE{$Zq42wRzmgTe<GTxY%F$g*$)(T_kp-zD!orS3n-<E9aBZca
zedHExFRl{-gMcgv7E_(>^W?0hKCrc3F>RcHZ)}$8#Z-PFX*i6H#Y?W-NDMcImjAl+
z3d(>Eb3^o`sd`sZGk6Vn+o+dtJ<x+^=Qin()FA1y@5?eqa`%U~d?Rp{kpx(*s8P7k
zc^+{F_=+r|u}KQD^q>?g)3tm9>bM%VMfi08bwUlp9LtcA>@>%VRZr5>rKgrn3QSJM
z0lpTL!cFaPg+VR=(5aw6rkz&}c1d>`jb!!KW@P~dAUwcL*iYt)Q5@0tz>oWlFGx2Y
zF4oC4`nyt#Sgh{ke-*_MAiM`td)KCxzMy-P0J+cNj5sAZaOE}LaK0#gPx9(uF1jw|
znWqr&M;wpR!u&cIy8ejqrl`jKsAn&}+)85{s@;ylz{1pz4TpOMKoF-4ETqQRA{3T8
z(c+ttcVQAsn)u68oC;O>pK0G1=1GQE01g5bKLmTI`@R2;{XFvZ@0wBAJ@xVA3bIJ5
znTKzUo|y|xSq3kvqq-{cUkulyDmwn2gF8<8yr_?0(1P0r+merD?wI!W4T-GEc)6tp
z%82E7XHJfAo_GOG_h*wG{D4|uLY%&TtQH*UnCwh=X{%FB;j%Nz>$X$dB~@#<*1qof
zO78>tSBr8;hYaXXKJSp!7loOKA=as(RNIl~^}0<mw!bLW=Hsv&?ZuT%)DKZzs&;b>
zcjs1NqP>^7>FM!<yw%}%=n}L;WSWM6c^q%hC!NU4d0QGZ**b1-v-K?F&#$4@49VK`
z?8HD6yS#Fgi>d{oOL?~j+9mE1HlxgMMnC-6u=*27PI`RdU`0i5<DnIdc(l*b6`jf9
zOxMLRwo;2pmH5y&oJ3FgLVVlZR;nwoN1sj6&6-%=1@utvtqN_1&iq~OPeRIiWo_LA
zj?^DjG9zQLi-SYn^Ur<{ox`pj_gJBM$;^#fE%EtH(E}3w(VpY*zA?*5QN9wO*GUQs
zZE;y~cs_8oX-;)R46D=Tvs>-(KC38~Duf)xQ@cTns@+a+J|CfiI4q~8#}Y?re{_fD
z_S#fepJWOtHQIkvM3DS!h=s&8wo)1KqSy8rN}yjF*iN=FQh~hSpD7KY#A6}%TtfXy
zsom_>jc@iYXS^(u8p6tm`%~js$QM6`-(4EloA=^1hi-kf<2ea+u9Ws5ES17pDgJr1
zR1~XKV;uPjjh>>q^|bnnPxZ43%Hf(-S5w1tt>zoY;VpFR0R+K&i96$=0#eSq-A?or
zsogMVrdFJ+RL**Je`wW}+04(d=a&|YFVff?U7fM5H?^Tx4GbVs{C{M>n4^*k1`Z|C
z{6H!~!G(tTqEQHqW6_s?JN!K;@|#+bNp6<V{XleBNI^&=9$BOW>+(p3kp}a;dre>0
zD>$~~9c3RPqR}Ulg+4z`IxSMXH~Nwsx)2+XRW+|_iBib5<9vEXE$jD1%hu*WN&GoB
zMKR=usLbEnxZo@aUUaQxerxo>L)#@7V>mQp!m+&iBypdsdw8vGW9ZWUI0Cp4XY;9Y
zA0Fa-cVZ(Bzp#sWJa_bk!A<EmQo)FAR;tC<z~dx(OF6AYp*|R2i2q*f<OVczE;rSX
zuhTSG#&7)j6DK(Z&1}jO2h2z#D`Lc8v_{j|B(!zt*q9n)%efjwVvX~D<pce^*$62z
zZ)9$R#5{aMwcsszLPf1rJ(Ee!(<tf++7pW2`ZR>Jc@AO=8k|_+82<i!?|gouTPFs+
ztG=kWJsweYq(`xY$B0^JFp>ifxn)T8x%iw;gpavtocg@zMQSaxbO|Dx#tw@mZur6;
zF9mG{@*GBr@>fKlMT^U{U#-DJ^$I^3Td}!|8e$J8_bB6eNd!j@VygTR2KqY+iN)aJ
zRG?~4(`PULp*P>ky|#fpE7~Pl2u4Vj@e_=Z$k#*F@eA>0<2%%zu_}#z$()VK5@oR&
zt^?5Pe*K4sIIi`d1}zpt&}fl(2Yf7uX&Jqy&8)<gt+{l(2veO*2fEBpjH2^*p?1Z_
zH_?l+w>b+<rQ<N}Y=169mN`h@-ctD8Ui23e)q8{=1AAr#%La6Jv?;Zl-L-%VR{@&q
zZWl`PYHX|JuLzpuI_A!{_l>8HB!^HU-UM#Ws60Q=a)?Ord1wShIVNIK%5}TLrxge%
zVp=?ob43b8EIcp@lk#lQf9y5YN=B?DGmHi76R3l|V=6lr;q>NCwZ;azp33~k(;!C=
zw~)A;H?W_P=<%|NGK)Bk4n3=KGIyk-Qkd5jG<|+Y<4W<Ok~N%ub#0IZx6}Mq9h>cT
zMK$)rjoP#4f>NxIE&{7|qm0S|pW46^Pv{R&W@NrKNo-qABK`Er5r8$oH^cxaUWUuS
z((zj&wN&Jr(!4cYLx&;VEex2Y(ezs$Dg|P$$<>DT)$3!WIN*#kIJq%iFz{BQ=rjEX
z|K7rT1vFR>QXw&GZ^ysPp&xuR8!rkj>%AjYjLVSxPqySqKfsF?Q;-Z4Iu1_>Y?EcO
zC|KX7(y$comy~CV^*xn9l(uhszI5|0X}d;IKiRD5@+(b%WRah*CQual(rF#CzmLa&
z2!st580d)<=F%O!!O<bviQMkxhyJ42-G1iCy3~wS<Mykzu0OO54lCm6oF7h!gyQzA
zz-~#VeAwqR=BLnScEH5xp!yy1Kg7UB{jUw}x1!&3DR3KDGJ0PF!Po>{8A_N5Nco!n
z$PK`!0vSqnJ)9cyb{$J})xZ1Ma{@u@nr)>C8i(y2-3BS}oY>eGE)oF$(jZVTZ(*ua
z>8}j9?gAB>D(|D8esJW+@&K=E1Z^M-QyKjla6ACtd7TUGs}1OZvU_}cAnM{nCk3L(
zDJKLbll7DXQ8y$I^RF=i1Lj}o_=X%u;8h{j{nJn00}MtUQ?_vc45qO;?)Ny*oZpEf
zTsQu2BQhofBQZWOT=j!Wc^<3w4cl@v7%M#8OER$6dC4derUzaD`;vOS=YJoO|MQ51
zUv3}K>I3yV!O@NEM-~`N;z!J5Coq_bW7B3AaC<&0cME}${I?O!KaXhsHq|31klNAa
zxE9*?`fRp?CP<xHF5swAFeQ*WzS*_uKfikCkmLV9zj^{bLe%RmsSS@@2)>Up<1ycd
zX!FPz(`bA$B~N-f)HnaXG0DHs0{@p7lYmoix%GBueq!eeP%>++R9gM+aIt6=djns-
zLRNTsymN>q6(R&U!E^t!v9a+>;O5V1w>UEy#`Bygve6U1wKrApHd~OdMC&^$85x<`
zaMI9Ml0QH?h8sy?meAJ5XSW=WzB*bm1+CF<KU2L+s@E-<1j_%_I=Ln&8pTu6o}4R*
z<Xca5JK8Sd(<f3tlvtAr2E1&@rM6g_pDjTx-IVI9nh5ag@1AVacG-is7xoY498$~m
z&AWfL5t09(njvHul?(s?E&Ju}X@!g`_a)SHB9T1rP-pz<7ChBLdD8MoP5aeIY9elF
zA3^hKvow+Z3CH{Hp9lB?KB!kYy!87FsVp$p{(kX1GRtRyMEvR-VPGBu+R$?{%l23X
z9*D|_OTO?poDTxhe&p4C%M8d~;S~_r8Xybc<P)hsl2@Fbj|D#iRDr2{1FY@QETkWJ
zqp^t=6^2cbu$pdcW{q(C9t~W4*WV{{*gX1enF`l(?yipuzDm(^eqAe5Txm`Nb}7%7
zfJ-N`BjS{ZUFKu^usX{7Z69_lrihEkq;d}3b#J!M@%R>}w35Ly)L7(9`V5<%)x4_=
zP~FRO9FX-U;~x-e;Aa)l+4N)cYYx$c;8ckwB`=DL)SZ2n!uZ2(P5`=~2l*_^`v@Yf
z?|Jze<}(m2qFFm#>6;@qK9vvwu!&awfZ#QFpHl-wz4>;(7W9ygj*dXsNO|CO%+eWL
z{oR*EzY!fI)u6Xz@Hj|=T!$oyunA-Wc6j^*0S|kL_pT38?G+o)D0a{G6h*1g>Bl{%
znJ+Y#N|J$(8PTDjA8wzs#eg%O4Ar|#Ufm;G5jR31+A;Kj#0Tp|`$h#l&hOfa#4ed!
zWH#NgpN@7e@_o+w6<#v^%~Upg^HnLCVbR9wcOcly9`HCAFXVG&w|Pb=j+LEm-?-QU
z>vRwUAURm}`)$gMplfC|9sVOnzA*Bm7#f*A2wacEI?#$Z3ZYfZQ;AzOX)%A`Z}dLr
zRy1sm4!-bnHo7rc5flU*n(yre0`S+t?#y%A>eue@Z=3uz_ed=0`7Gs#gII28<lP7G
z8Oindvzo@uyqU*Yf7I^I%uM`)5d@yO^i)`i*lM?-)*a0CwVETDmd9Eu<>b8^yKQti
z;BJ+U5xs72lONCGGUsny2_v_=b%khrM|HPd2-|g4jC%wX4T0sa<tZNj==;2vq=7Lu
z+_^MubmPbd=r&wJK4;kF``j2VrjQ&wTc2yrOaaS%Wcd>!%XuyC)rZsY`E9(l$;9v^
zYlVP)@RvMZ5QN;#o1QPCtAE!*`T>NEy6nFKxpr+ujUa_~**7fDCFhuC7qyP;V{%jq
zxmwC-Wr-fvk_7jU>wcGcG$&~?T7krR-L-^V@dHA6qpjWWj&{F0!sA7Jd?0*bd7W)z
z43wyU3(gku=^h$FP|6m>xC9nPT_7hO2^IrjB@&1f)9vl;ysmrbDNG243OxRu>ZB}9
zJ;2qVr>pBF$f+3!dIi_p<Z-;*<<Rk9fgd%?4MceT9p>({2e_*E_OFb1^i(r!#t+ia
z6-)3>EF_c7vVB$>oC%9C$}L>SA<FDZ&=7Xvjr$`3D^6c*XUow*1q1uPm#L1qY}UUB
zN9S8f+J66<DJ=Z<EB5q8cX5^oQc1KCC1o>bIyUnTqB*V#F}WD!!w2Df`QZZmlZY0!
zBVa=nLeqA;IXR>@|2Dor{P*Y0ndbM+TYC#G^PE1g!>J79`_c+Ip;I+GMqOztR{A}%
zGanuRzu8x1I`Hhm^c*|^q2<oq+!~0ZQ^|)W1^qf@*X$Of@L?n|gj|@fAD-I+)j<pW
zlH$R6@W6K&Wv8$g+oIkWZQ_#&a{8iui^-)MCcDVLezCJdJSA9HsvX~bl~2ZmQz8?~
zH}rq0r>*{X1rzO$Nau}!R>D4yU#EjmaAXZI5mz?!(Qk8=8U+=sNR-mqPQTnJV|$=G
z=l8q~m^Ya(a*`vaE}bgO(Cn!ezj@1C+f)jE_whDC<CRNi-H2AG>LwI}IQ%DX{zlMn
zPdgri%%Dgn5W($Mj$mKZw^O<D_T3sr&f`5*?jWvrY*vH!vx!&P*pQLM45oS-Mr4_4
zF*J}X!hi^xfjo|{9*xfi)f0w-HQ=RDs{TzC9vK-sFo+R+a+o#Sfj<!KV&xrd&IC2U
zKA;Rvu0S|ZJinXuKfs6P$Bb1Wzgz6z(}h^2=190q=tno6VA1)Dt$+(;(YTyP$qixD
z|7BHi5IKFps?6X3kZ1O{-(t^({>krf(hYnmDrsNqyC&8+YADItot`WCzGtI!+g^3R
z^rIu%7oN(TJcAJ;P$~n~os#v#nu9V=T5)9&th)iH`#5Jm%iu;f`zqc14;7j$S>C^#
zW7}d)(&r~`3Cl1g6>vdyvu)|AaFOv`kQ#m24%-r&#GneDJor`bp9X;0ay=-68vDOI
zLGR&AUonVFNIWMsUHn-iOQca?hq!O`$3SU<&@b%!4D2QMFjUUgJRW7IxMlefygGEk
z-vX5)MX-vopqKXTRELcNm0ULQEOUnO(0!;169ay*d<L(SwrZ`_(s1t0<I0`U(V2#J
zgDEA`a9D^&k64WTvo_!1f~O((QBU`(_D|FotfKzK{9y9F&f|yPWvk_GLODDpX<N}g
zsNjR1_k!!&8^P_dSA<yzD&gf|7*FFuGfX(`tg|Z>JQhlsq&88AVc6qBu#?Mg!@|Zg
zjJ%W`v7;hy)GUp$g<RYl{=C{XwucQOeciBa&n%Fu(~@$MA-Jmi{SqKRwG~~^?2jFf
zw@8|rn%(IefJ_|t!eQB)MHGUlr>8fXBVssnKCGE98DV6L!{)Fm$okdD28pG0txyiH
zYNcF{XEck*KE>_!;=>8oywXj73=u%j1cQTvd+P{{)GPD}fDI7N?uVP_9`r964Ms;C
zge0X}eJ7}P3Nxx}HdM!-309iuU(#Im3z)-Oe0^f3rn#u>bJwNzQaUeoT@{3!`mo)f
z^q_?m1tcC|q~`eFPboK82jFM!!gTeQAo}vxbIjOyNhsxRZr?;f7KU(Fbn80twbZmV
z3hm&Qi;_nK?%exi-_H#q*Dy83vtG<MxUyl=DpHN>ReCcMOUGi)V&6FLbQ(MJ-JYDj
zl2scG7UZk$D{%lkA4mZm;RTK`AjS<IJv(|cwii}CnoPt%`_PFgO0%58fSthg{LiZp
z+gLmBi0Do|&GiFP{xp#3P1_)Ik8vfI^VA=)M|nO|6o%QUk-Y^q%gLGmGW~W>groG@
zXefr!p=tbBeLq*Ccll0o93B<v2Vim~RTfN0I5xm%9el|Ls%P3MtyQo%<QG0p+5VKx
zSHB||Q{NP*{itUPj?BOg&(&Ng8O(Zv#(lIFVc5PoT(aY3WN!=V189GQ0@susF5F1p
zt`RjUv+H$fheXEM%x*!A#jyB!uM_I*&vQGF!Kj0GQ=5&_leFaLw-4yQ6J_G)Su&{4
za7N?eLj+JRb=Lr^3)Ys`Te})8K)`ZpK*pTkP63)GM6EcMwaGj+md9cB)0XY<$jkA@
zzc)8s{r&w$Fvf>FD)qKH7}|+TPRP$OEz$>S;}11Y)i^;||6mhs7wn5(_f+#d9|D80
z=cgOzqq71-@ZM~lU5Eni1`qg%-of;}sdR+T(Mv$nq*Z1sFjS(tz1bZM?|lpxd7={C
zj4MSW{nD73W>=Oc3nm<8_C&j>HBuI#mY%}YZ#l(oe;)twS|DDIGQ^U}B1+Jh9s5aQ
zQ~xJ=b9h6k>*U^YoW>^d@g$vhVY`;x&%29H^@UI(EaB1=5U6oQ;N+v3A&wp%coiYU
zR5cc3pTecW_K}D9-1{CM?l6|z`?n_d>w#@l6{&FR6FRN3vF~yFijOHYPH}8bua&dP
zQj1L-D1_!WSxxp{G>kSXmD_<P5B!m*o^UiLD4hOX()k)5&D`z^n>QG6rq+|TGj_yW
z{pp}kz66#))|4libRr;kg4Zq9tT92f1$|yh$D79}#EqZiHuA{owAfPX-|-`+#=lBc
zWcZo>l$0xe&M@<YQhE6iism_RFoju<&_n`11Q8Y!nTD5c2P}1=M$s!$y#2i(M$Y)d
z2YR3%1{D|6W~&*s4JA?<u<)K(fTbXTMu9NIkw9^#L<7lYwhY6qH2?&KZ%~+6eXT+P
z_u0-2X3FLa8TrEsvC#f3`;;UZ#f07-Ije2i8}_1DLN%(xGn`r?l24<qwkF>z=)@V<
zeZ~!Xd*c-vU9W{<6K>wGg<Z<uZj-q4{01fq?m0qn?i!3e4K8<dcD1^Bz$_tQlw5!x
zt^ZSy``+A?y3BjnCgX<+W&L^LV0nURKaKZF^c?bC{3!9DsFAr=8)P6&xt@&qDn!6a
zw-na4EMvX9?jWt!F#&$PiPMpIU;W#~&&N7vWl*A4sKSvJ6@7t9CX5Wb(jQu0$!jou
zc`z4RCvCe(kn{Z~P?<+<Sh#a3tj2xib6BOIHMb4)+m@#imq+{~U_`kBG~9m5DjOS+
z0W1#qvFmqXQmpTHoe!LH1St#QJpV8Uzp~T$BFfAgOX_8b<%d?~Vke1AL1$#jl~%`t
zTNIUm`zxvQEbB_mU_=xKW^$A-?|Jc=Sj!-W9m4ZZspZs3uTy|4%a7rsr3NMFW_2b8
z-dr7wGql~!qa$V$?My*0%%3G1Sicp<hMWO}U=qqymGB`8^PGa0SNkjNuk+~lGNYFT
zSN#9YOMu%kG7y0l>LDThh1z!aOHIS}hgTvh{6EyquF8{ycE=0kI+N&}-u&eqXy0S=
zqKW-6V)Y)eh&SSejH@P|Y=G`9P#WfCMAm2hZZmq5lwGI117Eol3x2c_Xn3uF9OU$D
zsT|iCVR2{Nfad<R&P0(HMVa6J9W=<TgnQ<a29;62G)*1>hI-)sU!MMnNKH-sJ7(-5
zT6l7eP)ze{Eeo`EMXhDc*Q$-rodLOZrw)%uIWKeQ8?4ZZAbPVMt#m9==(tcbLpUc;
zctX7{`(V{ai$+=fCBhF_xI-y00N3;`&0iXhp;2S<g73ubnwu|A@{4Nsdn&2nq>E9X
z`R%k6573fQeTCUM4>r7vxxvn*w#;3j9A0#x2P}y>hTjd^B(3=>b~%e$OWZE@RC=uE
z!0{OL5}`RQKHOcySgoJ`4f;IhMhUmMO?N!(mh?y}=owg+^f~@Hd7ky*Ka`z3=-NY-
z1{xiWTGlDp7K_Y0^#m;o`PXUacgdeR=(^n>vtLOX&RHsT#TlAt2vU)`W>jHG>8i%c
zZP@+jr?Lng>f>sD*8Xq$71XVM#+K3B4wg{p=S1pSyVdqZAmN>!tP4xDBK%4_rS0(5
z)o$ozzFlo>q=qJ-PtJ8B;ILu2FPi9uhx55OK*uQFW|le{*C{W0N2s=SUfakFw6WR0
z*B=91=27BJb?HLMy%@kcR~7&Fnz8;U>Add#`Q9G&!Kgc;(Z-P!Gl^ZQeAC5YTB;oO
zEha2Y&h2jPHi5#qUs5Y@l`{T-<$g*vZ8>b!PKh%2{DJT?e1+o+3sNeY%!yW8y<^yM
zM)JI~bSnpS@cZZw<|9dnMm<WpbpI!8%(*QD!q6CSq2XA!;16s~Mnct+cZQRZz}`|i
z9F;`!{oA*n9Df@fAj9GuE~-@M^Es8N6)PI0qOpJkXsoVD26aeaWhJZ1fIVsE#@2F^
z3mxcOg>0qaRa8`%=tTuQE0!HT;h)_@l&c)YnB41mAX^g?Im(c0(Hcz**#hO^`O3s#
zJT7L32=<$E`k#&07X&4Zs8}rIa6@(<M~()RChg^4leYWfP~U}bNRrq-cbOOAQ#F;&
zNk4a)^9XhK9rO%{B-E+a(JhFMe)~i5MOV}M2Wd=M3AvTNXVL2|ce&Z{+>Qn`LAZ+$
zztq?;2{fyAY@5lC?EXppVPDk1qPhzDPxO6&7@9ySV*(OEVUy1sV4vKP@mXJhlPk7n
zU}iOE(LY;GKs9>(l7eHXw_6SV6_ujeIkrk?lVp9y2GdtVr%e2%#-eK~su<kgDsX>C
z8JTF5osyxdW=pkSxe@*xs10=)^~gW{=Uc4&%BMjl^zS=-Q3z_x#BZZFq8gTazz%UL
z-$KIm&>YFbP|XJETx(Lg92#eFQZ1N-T91>?i5#1}mAd9mETp^O8tev<Qqjj(yU;$#
z2FlfE8b!gyT6WnJ5vv8CuejuLA|WBEq=I-h$Jez00}SE_bNsN@-WEvIDr7UubaA+l
z$Rj0mJ@8v`cNF2N$_Nj`U1sW;e={Nh{oFn>UX(t!7vjuBsAM54qfPjejl#qk(q-O+
z2ewCfl#XdaWGOIb#!XQL8<WvvORT_b5j2WpJl2z(+<c#a2-tqD{EEL;&XJDMHEZ+F
zMd?{cX=lsDD{MD#RU-BJbDvEA2zKVbO&5Ob5SSny&vX%V=`MTCz`zh0X(EoHo|G&3
zQspH^O>S^x;Oj`pCzI|^e7mkY;AQ74ZH8LkTUaXTR?j!aN8Lo?T7-m1tV{dNcX@tl
zNZ78M7oXM2PGsBE+l60RIYhhQ2dT_zerW!-rKQXrzul)Y*rOVy5}{p%Nvc+KfV}<1
z0`m(eymB7<3=ymhc<#ravOxTTPEAR06<C~z!IZcglto{mB7Ha1dvAyX(mPi6-=V3O
znJ@K8BNL|gyHJ?zFv(jilz3lMb(U2suOtqaX@D2O-r+*#Yb}Hh7q~WsSCQPm2|~F|
z&~<<?2-hVhA>};ap`T|%3;iZ@04{MirX>q&_Pc(_uZ+3C`XIVOFdl5V$8g~RP)l>`
zhvYs%0HQbpJv^g{V0Vx!)TcgJBfg}e)k5Z_2N9y7`|JX$Eso)ZbaL+p%RP3-vwmB^
zzFRSj9FTp51E<YU+&;P#6l~J$&e0Rq;DBB!__7cQr#l6~G+xMt+dfQc2=rvThSHqu
zWPpNPUjREC`qBPu(1)Je#>YK!i|-2J6(CEZFMvrFn<?;QYze*51ScnCQ}ruLGQo;F
z7mwTu(}-yyaHWxn?HU~?rJm=mVxtV(;5)BA`9d(-V0QSPG%Ay?+C?C=2C`64tf++L
z>EbPk4YeD3%8P~VAg*<q!GTwkZ)&7mN(1ZuCoH5`(e&M>E~&4}z@}A_`lpfO033DY
zPV=+Rxq+i#V!6izwvoFpzbw_+z{xtbIjjkTB_iDC^qbHH#8mq3cXP$|%#|Sw&J+^G
z#@0@#6P6#_jFTi`Vj&y@UE*6>N-X_mM~osSJ&g?1qcp~AO{%I4H3lCg67i<9Uq41^
z2g05hAfJqvpdJK$JtN=g`Lu8rf%g*r3u$z2gj&^Wmh|^zG#~mI^ENtwsM1rw7UXpl
zdvzVeHNukG{1uJ?lC#7rgGvpH+91Y!<-_UKV__?AmYr1~)77;#@~UCRW%yJ(5Rp&!
zNQC7)C*W~Ni0UoMVi)J{G<Hv9V&3?crD-;t;VZERI&)$iD8h>#HX0h(xr+B&c3^uX
z<LX)qt9l}RCB7grxD>3KQiA05K3>iN#4i3+sP@$&guJGVhYQt`XIf=#@Mo~wpXsKn
zQH1DJAd3{G!W@RLfBpOOq?&a=`Kl*=_-G)Gjl~@Xt$B!OUM@ry2g6nXy-;|75+5Hs
zc*Sz!n^LjY_W|c`-_JC?Zol%;*T5DAA*zaaDMurweH8h!M1=!|S`a>;uXt&FpJpJA
zJ7A)JLi{(z^<#mCh{D~8lfQPmF=cF7tV|z!As0wcjx^=)nZo=V?z^xlHc2r*K-8gC
zlDncY>qZ?Cd5x?K47^`${}1ZkDyYsNT^GjP-GYYTl3)QsumDN0g#-y6Jh*Fc3GNbH
zgS)#+a1HM6?)Epc&#s!8s+o)b;#8emKGs@q_h;SjV|j7$@$v04aP+-VVe<L~0=M+l
z*x3}>+>GmWQw7RwDJTuch9#`uhm8bxnYJ?Yz%%qgI!`5wbG8Bv5@Ge4VE~WYh4t0-
zbvvE*yZxkng``aH2baqX<($KKb{4F^9i|FNEj{Euj%DZ5fA;S_X#gUjzj1}(>ebi$
ziQQd$-WDce#gQtxCP$}AF0-)G>0CSm6wF`#e{|`N6Xi6p_LdiaY)^H;to@d1ZB6H9
z=pOT&v!pB3tj3uOI~1D<?7QL5co2?3V|-tVcWL)oQJho(*M~K9<Z)W1_syjA3qkC|
z=EYJgDbzBIgPAbT1?ClwKbQ~x`Hjt!xbw|csI1kOZ#&*B$}tSOttFJB*~ttrUB@x2
zPAuS^fOvW80s8kJzN3#^Vx9V=;aSbj@XKFiYA4`vDkO`&yl}dBU3Vm(gc9fy!C@$4
zS5deWgT&ZN`NWPTc0zl)^~d)eZ}YHH$x>6-gCQFv9|FBT@Y}hM)r96ras~Y7byXYS
z#Wq~Y9oM+_CemHCObku=KRoahS%sBEumKR#A$CO-oGEt`j6NB$k%n(wfh3g0CdI**
z<6KG@W}gx8e-%9`vuUj?CO5oe6?=dAkW~pzP&%jD!}f5d9wg#deU^W5bp7Q)Vhz1o
zy1D^t_Ea5w?nuFH*QyBY?YM`$u<s*heo{;f3S+b`)x!@QXvXs#m%I{YA>Rp>EWsPN
z+>zA7?B;SPeEFJiw+&p7!+lFwfQr5?4GW{VEqxKG1@5Xpi61RsP$20%lag*a(2OrF
zsGE@Kg?twk*=~H{bHf`0&Kc97@SVT3sHhtWxsza}iMZFt-S)vKeq0c_jgs|1dDzk1
zWkQ8e*`e;pzW<jBw4N&{dF<L1fps4D0AHfev`$EnCUW{}EYah?R)7L3(41r=AS4+{
zMfjItJg$Rb{O1akpDQSEFRLH%SmXr3FaI=*SI@)vj}??W&w=tqP?s;ld5$OliR5`r
zt%~XxNw39-)YvKV3ixB{=a`A5)o=QrOqT!l`$xvgBIO98zjMBmat{iMp)K;Hv(Wtf
z^*vRR8`nrv!iod(F>e3dZOah}6(1@(68cAZFzFx1m?N=1d!T%Z7mgG`f>3>`_$WdT
zCS3>N6AFk@d^t#soDP>8?nC^N$p;EQk}CvD%81g2i&98zb60t&0?e}Eo__H@jG|t#
z+s3;FD17T`&CNd6e>vRze7HHZ3q=GrasteHBxle|ADlE19E0#Itp8TRpXU<vq-o%A
zNqW`MksuLuw=rkn%X(*=e=&jI`c<ICI}C2Bq@uXGa@2o0%=Ub^M7PXq#N#EX_MZpB
z@H~+JSVH;pEU1nnwfP{tQT`-hbo9So0ARBI%NYNC3i_X?U{9rxl9TcisQkao>%Wy#
z_&g(jIYrpb(C3?62;JP=KFY{+gI>dPzVrFs6sC-fOmB)ngT1n*`^hRi36FU&kO=CW
zZ;!^mbFvP6?~h602Sm}&U?o_}X9AyZBqSuEvTt4T=lnprO5p-x{~BFyaDYK`YdDoC
zyXCUb{b@fN!)@PzPyomoNOn=Fb7A{?APBteRB{OBSzM?shLW_nhMVYQSFo!gh7{m=
zSXr#>pPIQp@LH{!%592Vy~%}w#bolsoZp4E&NPnT!+F%uiM6RBb#ATY2IDG@5*3v(
zZ25g8yxG_4RuyH!`&gbMW$AMeJ+8fz{{=~lEJ#whB*Q3zdV986VE)BHgxX$x{f{GZ
zvZhA6A+GjWl2_tOaj5EBA8?Em0XlHDi7xfEM$9)5zw|9Dx9IF*MB|H-eq~A>eVBaZ
zrxykb_206BINTm@3<t00KsK??HPT?2eb?eB^s5)MCOm(ti@{6h@IdYS$kg-AMn5&Z
z^&yYh`ALTabI{jdE+(aw&8j_mNG>G_mjz7EC@cNf49CC|MEe7=vE8ca_*(Lq{4c@{
zG6y<lg3Mi9(ce7KFr(2J7h8THN(8mht5$QmZpl3SwtKwYV=D~&>UYtvw082~pR1I^
z7c4cGz6TX#+p}124cjqrs~ew#Td#WYxh9oNmY!I#(fx^B_l`e9Whc@S{q({7?1MCl
zur;_%3Il{jBWZ0zTU;JqiL0SWxKE{TkK`l{y|*^UOA{ITdl%OGcz<I9v^0PMJpbt|
z01=JI1H6Rs4s1DQ8XPP-dwS074Gj$kl6V!y4M7*4or`Odtbj>u8od|f((}TlR|8pT
zhJJtS?l{Au!tk%vEGdj=;DleEh?W^a?s&S3e_L%F(!-|tZLe%C_e(k%&b@0mjas!W
zOT|X->uD)q^=7m65xMyl8u`x@KbC9WtD6Xw>K}B0g!CTO=({>==`^kaSBnBG6PYIU
zXZ;60V?tdv2*i6e#{NCBso%o&E#7@A<p@~N{#&F9n;6F?QJlm(#x;6gcec!L#&^2j
z2hU+IS{K$fNV?xWUTUmRsL}WlmU+rz0i{3P-j#f}K*QkrF2myLa8|m!hzY=e_t)6f
z-Uu{QZnRST4kGuvJ{GgvBc9&u=K4O7*`G6lei37ouSL<xwAycD4WJ}v61TV=@SPu~
z*CYQ)rVIO>%qU#pHR>SLf@fwe0Ab9%K0m<~4<qUl7TLovd+qRPok#k^!&I@#;GNyU
z<cplp<kpaasR$+qR#U!4RNp|n%`F+S_kPX47vzH5g1FHF$4~0U4RwqcFxPV6-E3ae
z**<^g-Z&jxFp2kzz3L371|_86qzmb&PX8Wiy>{DmHbp4u5Ve)o%LT{Bbz<k4OaF(r
zQ=Dt56^INp_2`{VY7Q%Jhh7Mn-TmI7*+R(n3Y10rIB1{x^C8hbO=r*GIN|QcQ)<}Z
zeAuUsFPMTN+-$-pZ?ebYZ@R_}j}LXj{A-RnX8WO&i=4sduMnUa*Uj6WJnlzFM@tQ4
zU*=8E%(TtVC%Fg$n{EFZVEIX!{W<RuR;$qw8w6RY)R?~zlwg~Mcz)z|(#1OO?Qmm9
zKtNapkpwD0QhFqN2AsIVrqn8pJVC_437?ZqG`*aci(RhgpCYvyNWHDGn`S5**wuXh
ziM6#BKu~3383or>(minfCEmagR#G?9b`Wpic2N7_uk^XtLLa`}CBM}U<AAHH+)n||
zC0-N8)3U@-0Ee~rhTo{TFJo0sP4apMlf)n}iU(hQ7zlJMR4Yd+N-RiI&^~5{8%hWn
zVTfWcjXR`Md=7~DJelV|h32L4zLugZhydP6rIP!|69^Y{`vc!{au{{8@COWXMGV$?
zFD#Qx6fx15xTofRhQsd(d(nYqqNe`VJ%x#eCe14)nyc8t0}+#adEiD6l4XRAwZA<&
zNj6tQy9Q*ux$;%{yR%5~KcQNXr|T>*(MX70Q`_|?)W9Ql|IhewxkFn_P+T4D8yH3;
z&U5xdA8Y)6-HV}+-V{-Ik(@hOk@fwX(igmB#kv9~D;<coCX?i06z|(NX&U58Evc~Z
z%Jxh`9)QPEhvz|V_|Os!u?B&<BCS_oP|mPU#+k}|qicwJcd$pGpjMNgSX5|l3>{DG
zfrdYG%OlFI#`l><j;rEnO9Mjdt-IBYxJCoq-!AaW2dNg<B;e(`*4J{{1MlM~(|*9j
zQ`fqL%7`TNw(=;<!D8|Bq+X~i1^o{asi5e%ga^uG)d{Z4*9So-^;aUFvyHUdeUOQG
z%*meK0$f}e>}SdX>%LuWk9yaPRtE#U&I(Ab$OYDm31LO(jKy!J4nD^)p1da~Cy#%l
zk5Ynb34#3yQpBy|`j_19LQ*-nxi{5hwkhf9kw9Ex;}0MyWq<v8#g4a`9yE{)&8uS&
zr_)?dzD*05By^Jj-vjX%iP*VX+0=jGuD{PJD4YJ`=`z^-V&!D@vfQvg;g(YnL#qY*
z@wMdZ3=>1gi@l<qin|Hb^TfBl7EkfUf{Np;TY-^6U2}j0ljSU}_|4;V{nCu2;+=lV
zSN%O6AK|9@>9WsP<7bAZsH(r5(IG|Fv}6nAsvJt_wA5Y(t>uY*lVjG~?1fA9=wU<2
zVnf3`uM(h9^63FA377+uOnDw&L5WNTGN}<%VSx+$4(YlLm!+hy$v6z)jhP!6jA{Jw
zQx-Le_IOfiqIlq)zPxk0LF28eMm0uY$jab^SY7>nQCYN<q}J2@CsfoAoZOhQes=qH
zquNkXbhR8dH8&)CTjNE7qFE9u(-~^ASr;hpdew~71EFiF%PDpEhHBHT()OWAY?`Kd
z&I9XWP}e){IVl&Oy-w+|DRZpYp|GKF3HY{<+EOD<4sM@Mn3IkPdR|dH)wJdxw(~)z
zWA5zt&*AM$qo};U2t&(MT?)18KRYV+E(^A0x?H_(l%`-c=1F}2F*x{+H4LSGFvV05
zLBe5QB6$<t>id#h76LvTgV(|<O7L(u()k`-bh76w(Y0kF>VZOhPbZh~6PPbTwZSk}
z7!GfGv`<dr13J~3*|{DQsm-3C%_iCswa6S7{VTDv&3p=?*)$OsehEcIJOp%-&aKk2
zvbJ{Ld?NT9ndH^8`<t!Qdt>6RR)~wKqqFn(WxslgR3SgM&%g@5L|uaJ$co5li~xFH
zBGvx2)m8U_M3|MET&=xLptFFQ3*JyFCY8+PwCy@QlIui?JhIvD)MRH0<wxOC>e=y_
zngTk<^Luy_G@B3ln~zOD4Ej{)ci&sPDC6W(4kL<QM!S4`azjcu-Z1bm9m~?Co7W>(
zy&6uDnfky|AHT9bBUoy-Va;hgf(6GG+;G(yvo~dBe<c%rxBuk}*l6Ris1u<YBI-VD
zvN-lY1qeSlZ}&DgMB}x5Fi!JYm2j+gX|)L^WPI~e<E@q_nr9&IfJ^uI56;+96@pEH
zFC$5;8Cz(!ag1MK1el$v4R&zcG-8-kpTn|5InTCLYYbQx%LEP(LP*nf=@i5?NWmlc
zYG!bIz3h?bkT23nB3iU*Y%&}hA}s!tC_tNYDjCaspRB3G7UW;!ooJvYaXxP;MNH_C
z=4&(Bw%;$kCwa+}{b_@5d%B3jK-}khcYhtYOizvvVSUOENMV!xG8Av#u;<Nkil&Lg
zp;x8%#0DXTADmr|ADHm0jr~I1=E|Zd)@nqFbF&9qFZs02S^C3|=j(N)M6aQ`ROcg`
zFJ|2dbEnH)S=wC<+uvJq7C%@alj<txK;yeaMOqz@!KQjMTi%`8U8CFMrmddYfn|Q@
zqv$<hC)Je+itDE*dBW4ev?5AHBh+31F^&e+S&f4>*zjFvl`#ATgTimLqmrgU?{{zL
zOJCs!>Wrp~B5F>#r5BNNnf&cExr|O(RUHBOL%VLb#R4+<cC?--Rm$FyvNmt8J`<z1
zM%K+80y3SlE+I9OO@)+3${Xc@`f9BdXX8{l2=*a2PD?pOVi325udE&#f}N2+vUd^Z
zf>ODV(NMaMt7I>-?|rT!PVPqowa)sl=w4SJ=^VpI^2$iR@Le2)X_)R!MWJrR(}f%o
zy~>%f_h`27a8gG(?V}VD?i%huFYfR^yT!G)`C9C09`}gB3^^Jrb>b@#c&}pc{9c{i
zb?*m|C7$AS$cr%GUZM@89PDq*i+=gd*Pd<khP)a~pmv(Vc;|Evr!N^jmNZpt%YN{)
z_IjiI5wt#>z{0OmaL(m2an(i0_fjQafqh8xVBne{(ia)n->;IxOD6@w3#b45T7@V5
zHIKXyqUA-#74+r9LpM5hgK$j^;YE~!97*oT-v@t(qbGc@2RLPJ&+%Q|PVsi-d%79d
zF`5;3`7Zr1ogxaOXjDm++UI{o(Tu7%-(-a<^P*^^)=biI;Frfw4^=*4-)aOIinkzB
zIaUO0y5;?HABoUMFa-l?U%NH-g($g9f__@2LJpfO^~BaTVh$@r_^uxv4bAfY+G;Uo
z)3py~-`B?{*Z<qI*Y8qG%Vs<y9BpuLu;sxl*CII~A)=&YKi-dZ`?Qx3;W=)jyKa?&
z_e8V2`e_q790oK2@J;UsxDmxp3#!kI=60dxB&Yi=s4>Hd`TEGY`eNE-s@ZtoQekgd
zEc!`MpuSB=Tp_X9;vn0AMycN6H-h5hdfh6w*~cF$X5ZrW1a0w@Fy(idAYa0StXMc#
z4*$asU4qi(+o7IGqR7RA{~V3g_$%rA06aQDiq6iGR-+au@*FQOJ^4lyMvezpo&H8n
z`i2g20-qY)R5$vzas-wH+~BX1Cfa+&8u4%V;SAZ-TOF&jTNgBW(C!+8O&8&EA;0>@
z2Vreg)FU<SuF|OP5;HWc9}<##MEG2G-d*m`h5){ZW9y)pBtfQq^6YfqJM&jS0A4YG
zI^y6(F)tutf*EI~0lMJ7X?kCe&0;jv9DFG8{ISBLi*xjGktAqS>|0lCRqhw9jl+_Z
zl`9c_xr7InS!+f7Ajt*RDF<lAv9IQXtB%a5YMtJCV>49bq1ytLf^L&1P*NU&mA6r%
z{Z}3+D9t-&yku7v^Ih{rk`Zwan)qojSZ$memf24|`dKW*m0aE^+3>WOfg>XjQ+>J1
zJThI+k=?11;l16sb0PR-!M2QYQW6sDVI({EgR88pm$v)Ua^oLd;u%VR^ZEH!`}_Tl
zLSq7t{`J?wDY)Nr)66gmK8=^HbuuJ<W7t5+3apiVFcMs@m~t<VjuAYA`n6jI$AkbU
zBZ+-Q{l=KXHS^2i{H`0`)9TnkLvIuf9mepJeW%66TZR^J8u$51Q=MecMvzhK)iApW
z2uzkYPcrF2)E7zAytYTV0TT_Lft6M40J@GR2fAg<4+_VM<)6`9FXI>VX5Zv~n!@S=
zNuFIdXP{$U5wnn$fLShsOCdTg?1vA{s3?w_gyj+N2t8eG!=J!y@w@D$25Mc!rcl+A
zyCJl)Y;G~gD~zD+XS<f(BcV|lEvg`9EUW#TGn70U9A_g2X83Prn&YLCsO9~LT&2FT
zgrT2*IjLNXq1JXKrH>S{`2KB7?r>{O{Ro$0lO?ZW{#W9?OEU$Y{#y-?!1F<eyIu5w
zlhjaA{!5(+IJS69DbjgWaNvS&gJTJnan(TL+eTy8af%=^I$Gjs7_E>m=;<{#`<kY5
zjZ_%QzI^%enE6F?ezZA4C9L6CY&hTv{vMf{5`wpDbh%=s7l+qJ&eLq-3#%{0nEtd#
zaIrhNc9!jj2UOjwc``AjTk4<ER^PzFcNeG3Cwet9R!SNYG_2wU=~!`b2i7gQ&#)CP
zNGLzBRd3|FrV8Ir6m7gtXj+ec(Cr`9b^Md@nx|MZ241be|2wRInoRbo3PrrVOJs3f
z_TulC5Ua;ie4_YD!$myqfr55^-(3cK_^wh%=aYBkJC1?)WqQcsuL<3?9C&KW(gJp^
z{hU5=>YuO#6SrpJW$)lSi$u1RGeXu13gYUn#GHR@jDZGJpFAoJ^-AwMYx)odePp?~
zDP{rdGB2@_LNOcDg@{6PnX|`$Y_5Bj9L6s@dzcpZR%W1?H8y~GSRU=UaCcmp6>UCY
z80j7ukIzKV^{ughN7mtU8Qa8$EW!|a-;|K|?~qbGjmCP_zeg~Nt_!YPp{Z@h=1RFs
z^H9Q8sAIMSY1AQ~^+v<xASb6YHfZL>v)zm3XK_bfHWIQcJKjCHbL~*sjL{ob^z!bO
zWfwHr;+=oPqHnPz1chMjb|>15?Ky<4s6b%nu=~g;e>Q5i$RYtYHa5e{8<O0#IwVCr
zdI(eqDbMCwVPWBQEG8eskRV+<0iA@i6_CRnDcIQ9n&EvZ=$FO7Nu#ytDfy#rk~mcu
zs=wCA`S+%E3|?tBm7DbEZ`gvD6oLWkx^y~=<-}<DUq+KMpppj3)URW)PNN-r<o{?G
zv`q#Q4urL*a<oIXIHt^7Cv2Dz95_8wFQ5h;d6lE#7*kqY1IFz3IzSV^^qOow-1ICI
zeud@UC8Wfe-|_Wu0B;0p*{fG1W-8&Dc5-2~vO#+in7X*A*9{R)Dk}CIqT_yADZ%*y
zZ;T{+vtjQhI`ki&PoL}VK6ze^IoW$#q9V1*cFXEXL+4{DNJ|K5r1ngWEXr^YDUW%Y
z_{Mke=FZ+z*8d@$>r0p>QiQzx_kxsYdJ+e7I<{?MMsT8OVn!h8$NX#CXzzOBoX`{x
zeSh<9K|QQ)snhYw{yGp2-{*W+ec1l{nya+*g~x1&B4+3Iz_@?d=t3);ZxCTupJ?J(
z{8x`aPR0l^QE}lej!PGtpXpu7f(kSF`0N~V_~%*;nNaw%vrurkAM-G+&S5#V&CEi!
zw~d-{x*|d1>GCfggQ289bDIOdU=jV<+}HC?OwzoTVV$HQufl+L?+O&^ZwV8~&Rh-K
zH(gz)<Z4GaM8q>^@@jpLv8?Zefg$NKcKHhc1&b7d-%)Ss($(sfie`|HPt-YRhAmCy
zBFuEQ^)@+Ti@2#WtNcFv9;iMkLflFM;RGoL^PEhkXe|F&tB{cDBqWEt5*OS09rAiu
z)vhTbs2G<tvDQKGFT!;O`5Z!qPX>79UP3HR-gbDA#y*ir@whGUsqlw*<z&LTswdec
zm@%OK<)4^*;mzzqqbHyCJIt9GzE8c59i|@#S7&d(ug1?*HN8*#L$dd#zs`PiUg@sB
zXPrWH1hzQXmg*n-wT+@=_oowiLnLI#$Kg83jE{c)gkMo<VL&dLBhpnhB{QAAOr0Pn
z5N1Zt51S%Ft0ecSL)|nfX5m!^Z%)-CntqbWsu<*}toU~puj;>UKhB9lbE_#?{A?Es
z(mqHjN?@UKV^)|f&sE9wHt)MhfPjv#?`K^8zh<5#58Iq6xRN3S)ULZ^@wP|7uiF^h
zO~yV#GfpT+HZF3YFpk|Re%te(zKvL{qMD`6f<E=2EJ4xmZDeL;=h?si>f)Za1Rj;}
z%ll*5LB%_@TjE7utBxZC0@xIDA@x?wMwZkKygR^saL8$WB$pFX_O$PGeu=qGj%6Mz
za2#khc&uAo1;-L;C}p7fLXr4u29H_SwD0SL)<g@H&co0F8ZVe{)jUS6UV7ZC7ilpC
zP99PuY8en=z!9D~dmCNKb>LAS!=ydFqO0QWA-486!t4Xal#ufqMqprVz&;kOe@!{;
zXH`7p*fxJAKqvK~?oGCp<GA?xK!kU}x5o^k+M8Qr7>mfQ4+`T$@5Uu4&diObX0cr2
zn=)4w*}oy$-0|e9#UW0c&SWzkP1R|r+3rnXEC0$F%$l(gf_{r>G2=6qD$qJMUZ+0$
zRFFn(dibt3*tR<>FKT7|U0|XK&RH$;aU#@OwHf<QXn)u{Ol{3=^>d)K#vYYx98P7H
zR6Oe*1g;hOw%mJOhXVB#xA<`7Wp%_*g3hOJKUeHQkT;%DUz!Z;WnOY}H(hNrK|Hy1
zRCc@j59acLk`eWa-%?z_F4^&Hey1&-gBNKq_-ls5)8gB<Z>r45VScJ?Hd4O|oFS3U
zjbve<z;AZv)^K5oXf70l=Olbk(NuaLx7=!-Zb*iYM<;6WF-(_2G?*7&#$-24W$4va
zE+K*@%Sk?BGXf+10lg;@Q`pM(_XV{rM9|CiKuIR_Gm1_@urEWp1)YAfm$}&{f7Hu5
zIy&U4^1ox&)+aAA2p9tywUff`a@;vy((2dF&Q7CpM+m#j=`7f$((>{Wo6Wh+&~=k4
zG!^Q~>hU`qCgp#5?+-QxSx%>EL`~XMk9vX#xs@gmiXno{=WZ^*l}qhDA*qo0zkXoR
zx#D$rVA-_a!may>xS;5eWky*+why_ja6qV1Xu)o?aU4M9dxbPs<)l!1xjUqr14+aQ
z920_{@oA(?n#MJ?`-`D)SveP!%~aGQk5SOieEH+eE6X=9jpDi!Bk7Gdi{6N2nuYpp
zn3KLx61`ag?B6eGvzP5+o2Ts>*)WIl4ySyaEX3djh3dwP-5vAqdJi=Iq^%0TD!`xJ
zcYC&<`b3vO8w{d(T^X@SC6WD<D`uTHjgAN$iyqQj#8yOlcfLIX`-lq*$+e_f6la@K
z{j5f~*;JuFZXivX%@(4L=WD&uXFR*EDfcG#y0!Xol0_B1`^6lUtyN#qZ&cBC_CX%3
z!)8sQfky+h9WE%BnL$J6Y?%&cm1>5F)ZdC(!pufC>!vZv(!k_qq)g4Q_S%u!JsoC8
znySH`)*IzC%~-ka_1AbJoo^o?D09r1L2dH^!bFDxD6#giH+B9F6qLPmScs8VMz=}@
z3b5n~-Ra*h7!$Y;`T`y#*!!&M#cx9l$h~4`bM&;_PdBso1x1}HJjk6d^K@Zg*EWyQ
zzO+f&Epeg7(HP9WL$j<9<sn_*9z@E0>v9d(jcMyQNJJNZc~qRD`TB@@&;Og$&C)d`
zNXl-9wO@ny)mc3K#;03ea&t!cty*a``V?39ScG;<lJfx~T>lbFOvv+%>-wKOXZaMl
z7cFjg7+0#%m-4=-)P|S)eEy^NvMTf5Jj{ajb>GD7E+bqrafHE1AH!X$wedH+?(HcK
zJ7TaPzHfBeV(o{Lhw@c%O+4?Dyo7sT{UH&<95A1%V+@u{)6d|G#euM(xCJ|rT(b!L
za~$}N%vs<M3yAB>+q)PhheO-DKNmic!eRz<>*GDLwLi`X`l6YFn3u56c`G(<pAxjd
z1+lcdJ*-@Evb`vZ$Dj#Ucee3RGv4c#6e;YxA421a33>r=!IU4cNJjh-qEQ&n(<QTu
z@)QA-&A+pD2ADaRMg6+cpzp0i_v0gjknj6S)-WyrF8e2+(`G~A-;On^C>se4KZDD|
z2;s-40F#@3>r5c+fg(UE)ZPzZPo1@GRZalynnEG7u?hM5gwQ~b0-)3b+Xo3i;UfU%
zyd9~3_ZQsL<o09!(V)X2x_7Dqm`6_2pD5%3wEIsLd;%3TbF%%#CmE@D2A3<KUp6*E
z;p1?JricM>`9D_hQ3zD<QX7s6pq%fY!R3D%2G#R0{$mAN&lRu@2H62{xe)rFhmmOr
zhVh>(z`+7@fJ`L(laezH6MbH_OogI9kV`+!)AfSnkI-kTjQ5=3A=%4#Vn#x72!J}C
zS)f{pjJ~{Ca3_K)0?WsBd~(!cTOA~x4n5}K6r;41{WJBkr_Uh-E7=#p2jOKNsO6<G
z!6ziJp?En!`H2clX_o3ss%QY&vU|Vu1?MBuAi@U%&PO|1BtCdv{z(u=dc_%D2Tm2W
z%>~oe3^<Dw7jKm9p&8#Ow^*lu4J@x3n~gr<zZ}+jKCIRA4L%+E({~{Ne<z6Hh#*6#
zkU2ieBmK7$^qxy7|Bda1jILJ<&Q-7aL!T4)vUSs@ff%rJ8kj6eG6YM*p}+m=pp<_;
z9QS;9s!T=LNGS68!uqFy;DLes=Mq$(XQ9y8M_UB;R{@xy|1z$B8}`}ru+Qw6m9R*{
zvp}`~WiJ1%1f}O$Fd?Cu25h>KS}R@kdRt`RS=zn+Cu*Et9}q{8P*B=|GVYpJK|uiy
z4lWIN(<U?zrwaC5pRARcOtGrBxV-@2vu{ukDiACD-Vu!fJpHpWKuB$WmYFu#n=O`r
zENq5bV~Rqp7IF~Wx*`qo+C?93FRElE>x(}?tTqk>3g@c`_b|xX*;?*lI%cbu&1Ybp
zY&P%nSq=r9P{QEl`0l1{IfeI}t8VJtRqQuo8m_1f`nlEXY$(J|pAg2y(N`uG(0D5h
zr+76(Lja0HSfVL5zx$zZwia1+x@z>dzRh(onXjwUnd{_-r~5O^RUBMwa#H{Psp52_
zm3DRxW5gQlj%PR;2w7;T*H%@QxN7a!UZD`sd&Gv2=nQ<6h^ANCFEHud$%+*20{YOA
z?p`8%My1v<eJkQO{g>-{%v#Mb$R|uEE*HDovqenm>Keyq!-6K=?m%;yPL=*MG_XB+
z&S4}?N7VLc^hL+MpYbhy`ZFsE0Muxldm(Q&`o1}T=;ax_2>3z492VF$d;O)>?f~JG
zkQvH*Q(F6IB{+k&*_A@Ca*2m9+7S`ZdoV4QIx>eX@z~T*QYz?N$8p@BE_nX31op&U
z+c~;EVdqagz8K`M^fMN;8Jtcwsit(Yi`;x`M=NotevI)ezFsx92T*}17MptF-7x5t
z>hb0cZro~qWWb1m?ll5jQOJh~d0P2k!KNqrOY`Z_AEXXxwj0()W7YWevns1OsqUXg
zWe=YhISXDWF;DLMex*SE_A@MOD|KXMh8XyJNu3z$e)|Tf2d#K!wj<3yTuf&x18Q*h
zjYiU-i_1uZC-i|qkfp8d`k+K8nJ|sLLVCdmaq(|JP;D$D;B*RyhCH&t>|2aAZ2
z_9^O>@$IK7VPmlOZ1}@Y!bKvh*(9>WE$(=~N?T3N@A(zKkGgFNk+)o5atco^l-z%?
zQrqplGUGCqwytkV(br=es(?LqT2}Ijp2{+4jN}#%wJ`Ebr@`HyFV;M@D$QlaG^7yd
zp5gFPlMLazP!L?tfN)XXN^|MXV|<4(ktg>eF}9mpIh1VYtG>7j(Y*m2m29#4b~{wp
zV`h)#+NBv$`O{v2Tm;$A(Pb)gauuMRP3<W!AP!C83t{3hKenQ)HW!Z&@g36;m7xPK
ztM}!kl6#)srIFD7GRgcpUsiW55`3G_LcWq@=;cMS@6F;PUQx6L;L@?{O+$Qq-0FTM
z<G({CH$S9T&q9*o|3z&qibF2w43{HE^V;mT(xR9q4&yWM;RZVLxF%HYk{PJXOEY#u
zt7{%<k%y@sx>Gj|=U;0BWl^<O7kt)bqyy-PHJREG?f2^9cRy@|104Pbt=5WP*$fjP
zjU3IDwh2Z}yp@(LRIMdj@vJyeYrAJRS|F3K-|qkb<mlimPPMLL%O_l#I4XO4y@a~O
zCa3<nz!+A~pD*&4dW`x06bk31c@>AK9zv77<TPDCTRfxt5vLz|I2|U$&-UKnFjfUm
zmr_cDm0S?D<ozYRN+CN*jd1`f-SF}(Mcn9OIg{T_U2X%zDtNey#mlKuJcmvKX;BY&
z(r{8RbLCRL71G2#*YtU~rU?rG+!^mQ82nSP;K_ierlw}s>&05!Twm`@_x1MnMqnL@
zDrQzK*9K-&DwRgqM}#;yUO2R$TZe`)!luJMd0{Khj89Kw1NRP+aFH#r>n=*CaM^z^
zh|_PsFOoEDRGIt5n~fZ=g@i-7xSNxoRHd3*N;z#gCLq2o#kB~PC=6_+cK5G%T*@^&
zW-%-lTY5%sD&(S_6vF*|e}%EhXw(hqe9T-b*d}AD5eMu{#G}_gReyPKjmjA<6f*Gi
z=v_X&v$RJNfq~VYtjLkUeE_ir^y8)2njA>>#z*FOx=UQ^Iy$DKq&>q)I^nv=31vBJ
zIgi({EQ2m-@^#kJ4X?0yZE_n;x}}r-mVbVHi&^HI+K@QJwf;93Ec+HMx&L}wJ<dCs
zhXO?LYTqSI=K;ad@(KE}))E6CNAPW-<^~Jljb@}WsRG{lllflSPT8mU5j<L&>b17m
zsuc$C4-0u;>rf6C>w*x&D5%{Z@2wlqZ2Jm6Ku!=Fpo!MD0}BXCj)#-5LF4V5VtcY0
zweJga*!96)!~+KsdICE!>K3y{$T)lOH}{-3v$8qm`p<<~-3-9P)ycLNG4a%L0hD~P
z@fO$nYXXgO$~+mT-VGOOZ%2D~E?vqyN1u%zZYt&X3z}|E_YatjxBSatG&$3-QFXaG
z5D5ciPjf54j4V!R@|eklwYuw*eoSv6RBUuSMZ0|UkcOZD(i%Yf#ge<C`>baes}HK%
z!WYFOt+!Jr^BJ@pm?83x+=ot<4}`-1T$UyBz9)uB8B%Ax!I}DsD>t6Uf?Pb9sO@g_
zGDs$w&+1x8?E{iFFgEpb;qfWUNoP_jT;2j^O}z_NW~Qd4mMbFfF98xo-#uThR$~qf
z#T_#EY!)887i=NKyw)#!_q<RRN{t#$S=Fl1fOF5v)&v`jVlLOo+R{=5+hLzlHN93N
zkv*cjQ^rZKXCYtpW$y5D2MGez7*qAQfewd@yc_Q;;Qg;ZIdjmJY60mtc*_{a?0LY^
zVk#;x8mfxXG18=OldQY(H}@svB(_eIpg<u`)MrgiF-1u)EXPz*1xRIdAT=0~%FI*7
z8Cz^xAPz@Yu|N^qKZ@JvRtg!tt5ekm>-`TD=R`YwEInGX#veq%miiD8c=5b5Unb?z
z-b&ors_(u&Kj9Nj{(&&h>&@BbE6P6%TIsVJcUSHZpXN??J!-~Ra<y6BVI!qvpLSC>
zyrQLTOKL+YdA)diaRx6O{%hQjT{ci=d#WY1`y3WgMMri1&Hj7^s&r!h@~_P-DW+%O
za+*8&68)={37S1wAC;)MP*;9-|7*8s!lWK&?b6KT?u03#{q5N?IF?zWZ<^|O;L76g
z41WG(*!17wHZ)eq4sVvAk{{cje_-BUuqAc0C&;=t54Z@D4_Ez@O=`4f18=UI+*qU=
z?DaJUKKtAtw)N=~Ifs;vy{Fx)2Lz_IhO5^D(~)yoiDncp#XDDAgy5Z`Wl0XvPjhp}
zlLU}-j)h4TlXxA;))4tBibNK4_|3DrFMI6CwM*M^2|9{K45LGSYaD`J|GK%b?;m$R
zf$XelEEcuu_16puJjx5#+0TeMk`jc<0`d0sHK2h!dY60?TafMC5qttJ&pJj%y=`JZ
zG$6D{s(AnKP^XMA`J8JZG9W!SFc93+vpro#^K|lQD|f!Z0Tbxl)@;HHb7WID4`386
zxwbca-;wZz5r=ucG80zgstgL~A)0r-CL$!rcF$C?_z8=$HSCYogFW5p0X#k^<XS$9
zRpx0CK6CpF_!LUY-r5|zQo0Kh>&TB0K5ifA!JL{=n0%n(fFyLWK}6*Kfrn?36A+En
zU>aQi_W3ecZ`(D<?_hb=S!O%<cdU{BEdH%OOMh$za*(j-aR&MsfM#A8R$GY9$TK<&
zv=9wsiJY)a(ArNjqFtT)NmEF|l_e_C;sJ@mGo^1~5Pk8zE+kK$c76Cx%}+?o62dOt
z;6fSORlW^4OWl=Vg(`YN-8C|vLHBJf_WNuV)2!wCO#xwV9{%2khSd38a3x?K&UZ{$
zL6_RtefWj4p$(}P_p5OmQLtug(YrbQQED*r`TDI>+EiLI5kHqlD&VUxs&+r)t6@h1
z>vKG}(`uO?>c+O^`rkeS+{jhw679bZdShwS63iV+7TVdP-qWi#bBb^?cbBNTOOHzw
zql3@NPFG=bG2jtgD$&bTb29HGxIRPNrYxIbsn9*2Qfi$qaU#DdgT0$crV^#IHT}HT
zkI_P1laQGw*Ao(@5dKVF6C3@lXnD}145Y<B<puc?AwW~-UHt_j)UR%;^)_ZA&5P2@
z*#yb#A&rG(7l({&powatXV>AhI-c*#MP(CSL)~=uyiI{pQJ-v-i}};zLzzxTT+VM>
zuj(HoeCx)-zS@XR7N+yH5r{)%JmyKS=yRa()y15hW`684-@?oIK11MYuE-z7+Ev~-
z%>6JNUfGTOsQ18iKyj5*qM3P!<&tcTn~UUN*Ir`kf)!)KW3Jm9tW6&0)yRVcft>8m
zp<Zh6pVi}Nf_8r7)uH!|HmM`;Y=wLNL(6wkyD}0Vje+sq(O(J!QLhfdM0XuF+u_eE
z9M-KEj7$)rQ5c)eSuKhAqNnVd8g-Vmid@duHSuTFWNa^D6cWdTe5((a$~^*z;qlkH
zLp!2BMU@3O?NoAe|CKtM(sC~&;^rN#ROQ&8Z&DbS!4LH1blZ1q=JE+$i>H$Xn~|21
zT#aHe<1~>ujH8*Sts`jsS=~IDwzqecN8L5yK0R#WxS|V-4#Wp>&Te@WOz4V6dv_fT
zm`^B*>U?$>LEZ$*or^TCd?=wah29aD6A8D`5o?ZQXh$PLoF=J{+)9H`#9yA_^)F8m
z8l(V5JJe`__s4*JhP;C@(1m=S3OUoL?G4`Iw8yscIKTSNW0s~G`mTi~pEUF9LjqDT
z>SSeq695tBS#q^+b|iG2)4X8x<fTyTcKTp`nJqOZyYNCt^`VWs-RQr^O;~!bD(7<8
zk0`JQDx~{S>{_kcmBqsMD!_&uA6ue5xY~#;Qot$Ek0XIc(8SlflcU5iGXH~f?cf(9
zh@$)sQdF&_zih&7w|~AW{ty_ozuZbeIMOeO)ukHiHxfYu$y6ua*Sm}KR;FFOADm-O
zaFBg#&#~4Kdo&$#GAikqgo2X$>4Y&C4z0Q!DvJABwg1j5HGC%sP^@mv{%rHNlj8~q
zEXOm_A3{mc70xt@;kt{&)e+DY`WUvp1kg9k_h;yP9Ehx0<{q<~Xr%;FsuM@%)f|re
z?2a_!x!SaTe7*#DSgzFekeBX|0kE(ppGJg*^~SRwjHPAjQ>Gu*l{ZR7N~G|kB*449
zt=emx5!8ke=M597wx#@aslqz}qzh)WUSvbw651B0tml>Go!2{_eEbHLsY7iz7I<mY
zMV{bhJTs%jG+$byL#&@oC+(jNpH=f(#Xq+g^F>@zue6XxVN0&8=qnNPK#3WoAM!D@
z;Gb`?B0Q_^qO$N@vh_ka{i{OQ1f#IJmHDQhC{v?end`&oSl7(8{_J3RF=!;2oH3|f
zmw2MsNg<Cx!M9Y_)bu>lB!Sky7|#nsju}76KK+_7+AS2uqFA-UFEt}N>zro1uMY+6
z%s0&{(S6=A^s0H4`+}W0V)V)yh7Go|1yj0W-g>%l3O*oMn5YU~fSZ(KIN%dQn%7sH
zf<GLk&+vC3k{Gl>|AcR&UP{wrRNekluxqM-V=iV}AavAk<5kUhw|gQ0&dJeRXbw17
zeaQU&#d2+hM(U?(UqukyEJmk?y_vi$TfZ*g#hk`d4hLAVW-fQbtbdOquNLK%s&(6j
zLfJ(!`Zy=@ow!D9#S0#rgFhZ|sIj}*u)CCQCz?y|_mU$9Q{`6HG~o}wxiw1IJdN2Z
zF-6O88Cmj!*Vg%{ko5Aua8Jlc+E4cTvz`X2HS}Y|x9|TvnsCSFpF1SI`|&x)m`$S*
zjz^it)L<sh%W$~eGIm!9`5F6Gay{ASO)B(T?Of3{8vg?~-oBYthn+14?p%9#r%Hgn
zHYXdYNnCfTzOCP*^b2zk%Yj}{u+@A~h87XEMGu6~x1yj!Hugc?^5yDQm$uZj9w)ne
z7t7d&T-i4n&RE|MRF*qriY5@XBJszX90@L(=wd~J3hqv$*$qwXG?7CB#nO8q;+@s@
ze8;pqS<u5JoPrt0s<C?PN$FE;{dn&*sDvRaD+@X&$GLma!kuGdI966xt}3>+oP|Y2
zPRTH4@~<KQXnv~eMaZl2(qc9xLq_(q*?L#HOh~?o8ABBVgTRh{b=>syWR#0SxU#Q(
z`ZPXX$LemR@4la0m9OZXtFv7oFQmDo?~x~tMP$GF;5bypXY>d2@<>sT0g;mige*9=
z%H$h^q+I?p7?+M=wDWd4!Rbq|j1GCAhA>DIPZbC;Rjv5_Rss=wzoAvXk)peSufuMd
zeekA&xf;EzhTVKIIGg?p{APBP!;DfID{~jE8D@Gd-gtM2G<Jo^^Lh*1p239J<j{93
zG~umd@%9EgQj;6_lD=xSLR6fFsyWq1^ThxicLSn?%I}Lf;>_V^2C>cmIET?nuDxEn
zGnf0r<B{^}C`Uqq$+8_Bvuqptr+heRt9zIAj;olpU(v)~Z1xFSl`;P051~Bf?W`s2
z-J>>m`ie&{f4qnL=eQ6Gzg03e<!`+zk9m_)^4#~r>z+{s$J^!CyVa&XW6V+hRW-2H
ztXlp~Yri{OG$~0)+-F2C4=>ctO{TFYN&kuq?UN0XS(g9}hXX33$|JZ_VG!Vma+x*i
zqYanSDm_~sE=ds)4`!=6fI-Ca#zq&cnLNM#Q=0YVzACVM2%35(<EN!jlD~^0xxG9H
znx0m1Gp7w&x6sjP+gmrYdbqVa)NdmlbIKd`I*`+r<;9}~QQ89vzc-gxj5I6wVnZ$_
za-U!&2~~`RW=$y*FbX4G?_WL{E@lv;#mD*7=L*mRFnh(R?Kmtz^x7}v=f$N^0Uy`o
zLYk)cI~Exqe{e~vgY}qWn>iUnSFTRfD-}ZAqSyWW)n++H2bD8IoG(<m5}jmxK8WdF
zw12ELPQUP8K2tfZtnE{O%2RJ}LjBDg)zO5AIi~lt`~vUv8N&_-c)6RYT3F6h+z}a<
z2hoal80DsPh53Rrvq4^oL@3Fh72n%8wGKz``{Eda0ONjj7JX6)>w>qg85MHUWnELU
z)Tw>;-qG?%IANbc%Nd&ZAV)wv)DF;Il=v&n*s6;@i}36%GK>Yi2e^jPU_%C^jQZzd
z!&lu^wYXv(pB*SpuGgLMb)E_Kv|r$Ip;F2`j;f0kRrSUy%m7Y~RmqJ4Dtt)tPxIGs
zm%fsud(u{u5KmKhA}=N0%QB900Z;2XHAvg3JGx>LzXJvk!z`z!EJNu-Q3<8VsD7S%
zW8@;<;`Z>iH!U<ezY^Z1PfU#u2M6a`g~YIDzAcD=B_Fx>QyHt#UXONlYVxjPuZj0%
zhC-mifryFxJPIRV$<IfLqVrVVeJU#kK=<tzi<4;{Lxes&hJi25_D{mo!wErh3k~g6
zS8=`fvzIDWh7{s{KIx-JUm}+I#cjSX&Y~j)Yhd*M^#hc6Z_w6k=e32tt$y7eo$k%`
zFku2&9^4*fO|bt5C!!Z)mxVkhswP8yXKbDmnc1?qs)9*;4zq_SHc&-5KvJrc9a9z!
z;NvsQDIWE?J@)KxIs@T#$dtGaOuGdb2&58WBndbq@}6H|`o^R>GxGY7VE9P^w^O)s
zx659uQU@W&X&BS_M(l28>B~U;6QYqCEt25?20$%L8df>iXOPUyP%u}B-m9Vk7l(B!
z5#^EjbcBmMoS%#YVNi7O{r5ZYPOWcAT7n1Ay2Y@c9z=U!A_e#4j6ioZ_=f%PFEs1;
zmy`z1Z%f@T;@7vmh0Qxg7508B4o!)C2VL}!MG<U0_0?{!+OJCycz7fp+u^Yq-LT7D
zFYz!)1#uJOiaaeQ&?e0P9{0a|Qv%xfHn5DU_ux*wou9=LQNyf+_g<9)!f{}G@Elz{
zo5N+-w{8WTDVlw0-n_x7uC7k7nZ-w`{RGWrhmV~p5~p-NUi}nywtXNNfY@bQvG1wO
zY?n(BL;*CfPPZ>(Cxtg=DVm&^x>?l=ksCijzvg!iT_b)s%VX*xBaLpEEC7%C`J>+G
zU4`yl@F#k?T*?+=v#phmy9=X9vZB4eo1SlVqa2Pg8(FpA?J5=LreZ!lHRgjIrTM18
zl2fY?Xep!VO7MC%GB?7|*%(<_KJWo(J=uia^bbz$9ikC{)~Cd5D$L1*RP4FD19X`7
zd2Na0`oAoy&aK5|>Ll~US6EVYOQrN}rPbo)^&fp<?4Wx=6j@&~@ej1xd|Ul(7@6-M
zg`CzIU?0VxEdurG`X*C)u9~Q`n&5>talxjaPljwu^G{8@!Ml;AG6U&^)%&_Lc0=O#
zeC5miq*0Nj&M~`rJ9VgAa%GWknt2`pNY6@*;JMgrd3Mp=ie0V3$pbU~<BMzy1FP7s
zd_Z=!{ju$!Wy{3chT}aDb?@oourIm4GJW?#$J_+D4{O!*JyA{Z{4()-5@N27mE^lJ
z_i-6;HrF@kHI-sc6G&qHSyz7vcl%0j?8rLN`8M4v3wL$X7GS;CAwUQv_bm2y*{jS4
z<j)t%KFsaqyr^<HPNJ0uGsuLY$z6W5$n2aPZN0`?<h46ViUuK|F+HIDL~F(H=*`#S
zx_h3L<u9B1-t(K(fS%mMq%VvvjxEIEAk99IMHu*6`lhp1c6nF3VhunDPirYlkn9GK
zzf*vaHDH+DuB(!JXWTM=843J8&t64bh^lei=0!PpOH7MMbBEfa@3#HQW-j`Yo+O_3
z4}iTKP4`x<y*P-$qUB=ywJSmQaa!VTDEds;pP5j5dJUD0WZ?r$741qZxuCL>V>vq>
z43XbxRl-4EC%Me5O8{d(T%Z@V{f}YND--`bD-%aPzO+NbVdh<q#2*gVQosC=$<2vw
zh}9R}ud&RTjaKW6=5kTl)?;4tw^E2pe}OI;K%Ap?I?}w@;XFdH+oN>qIt5AqQwY%1
z4Yw*b&pVBF6{0E?%R4RPnQ_{5OF4#Iepp`rWNBx!F&G^f4IuV-?qmwwmq$9IxX=J%
zSJ`t}yDXZsw6$FK5E0M<UPrGj+FU1!A83gZZj;oPo<-Dd*B%Jj?*3Li)$vtE!YH_6
z!{|L|OP`oiLg)$){M(DKDED=VGsc*zNdJnO%8U5jW%Gn3%|3tf$2HO!NztfJcJ%o#
zL0(@~CEp&Mm1rz9a<i~Q(c4oSunq5=KN+{u>v5CT>RVjq9L3#mFUc~_?31cN2ATE9
zsMRbI0oGbj;(;=61i>KFOfnq~?9tv-d2G!GFfdoWvL+^wPDW&Mh&|}y);Hy{>j8|?
zZ0c;z>;P=5Mw3u=-qA)~lXHg`eHFgBJxnX0+f1u+BKSzW-IFovodFd@7q01azKuP+
z_^i!56iY9lc-YF>Ctv@2SLIgU-B%=StR^^d`{WOwT0htdtAE`a#o=GiD|%G2)ZFoq
zGYrYM6kgX`#M_Cv+7BBBJ}D4N3vxWYr)Z^Up!yca>+yTzgr`mX{<Lgw%>^Z!tjX?*
z6$QU{_%ZuQ;7q`#udD=MPAyeE5}UiS3=&L=g&tb&4_phznvITaPtDQHs&6!|lMl6t
zlfc-+J#T4QGM@kc%YCA<`|6(uf1vO#c3rx<+FmMV=(75U_}k*M@$K=Y1|E|_B>e7R
z<V^pLz8e6CGwjQ9M?4<6(g1+&KG>%PlkJ6aqbB~83Xs!>IiY+UusHhCzpcdz{?`IF
z?=wK66<KJ|>j2>B_reEH1XfTTsAumjWBLt*p&9jb^C?(!q3{LOH_BBZ9w;;MyZ)$*
zLS2~3b*2OWFX#R}7L*3?a<PMNa_P_yCjae6GTp(CjI^L<F?s_2X;m=iI?xr9*kj2f
zq2F5q-R()o7uH00011cWxz&O%{m(UgX7d6Ie!{9CF#w5|K>zbd{{2TDH^7fPafj!_
z0T_Dn%~-gk2a55u@JA}n;|`!T{-=T5u7EH7&owYMApvT;<^(GNK>k}04m;UKTd+i6
zK7FUu(t!QcN9!}zf>5qRU*b;X0~a~b8gWPXk|7T3^Am~V*-7%FFBT4vaEC3ui_20M
zp*J>4b1%YJqV1J^(%onf|2ZTA`~RHW8eAm*S0&czo&%GBsPSK9<o~8Jzj;=f-|!JI
z{r^<Y54tOtZVjjE-d~?gSD6qNYqf*|$f~`o3x1*APBJ|jAmiUaZpL(@69=nCy$?v|
z%(U4WIzB)Dkn+ySaVcHYe-(IaGISeLJUfO0JpM1I7yw2=eiF#gr3@rw3k8sTdq)Q>
z2(t#}U9Q*cFfcHd&x&uCtI!h3Q@f)@jd2MKe4rErG#j0b!zPuQCrY=Q4ML*7dGHSX
zDZPmtTguYbM}HI?eOM-Ddb%gziuNW~w&?k724c;AE>$5aA1zAsf8`pj))7!4s_v8(
ze8{qCBqIeF3#(>RVC`gpN|hCEd8tXJbpPftF)zx^X?`=)SjD*D)4g|X=Lesj?v>Lj
z6Z)^U>;qD>ZDyU8>woKu-@D%b?5%zK*8#nFp*Fw^9wkjbQ=Eun44XC(U(&*PrV3bk
zG&-Fjm<0pjR~L#(y{WOEX@!6j|8o?z&vnc-NH4WL_=`VOJai4zU*j*14tM>weMjF~
z-_!TSu*I1R)+Il`<(@8IkU4+N{4gVboXYc%`1@wBq$RwR9b+%9q&?FGQ?5t`y^`C^
z-(0C_ELfm^3oCNUtn<=N4blvn-;A(xM*r&tV7i3x<Dl?(T)8-%GwNfbFyJG-XyBf|
zn@)H96-mSaj7DOw6E#Q!f>z6D-B?<<^CyZ!V_$@f)@jWyg-@|*c8!I9Oyafm8dfW?
z5<s(l5gNJi+5I27U_eScJ`{i{T!3ULBEOZndNhw>{zc-qP{5=6t^FMys~l(7^_;Rf
zrPZUn`deqe8f6m|R00`qNTE~!-ov^Zc=CeYAo~rF>Usic+%ic6)kh6rUWg7XHy7`>
zM`;$1hLZX78roW0p#b|r3?%D4TeN~b5UVtWowu(qyi%bG2p%*u6HcSHqaqS1_38tT
zS|dLfT(=oH?EwN`FY~Ef`hT(Z9Z$Lv&2)>zzyAko4+U5|Ron3YVC@)cp=93wz}g)`
z_Ze=biQZuepsO8o|F1T@B5~y3wc&wQ*6$%CV5?djfN;RSdNQ6vG|>+e2E?RemoIV^
zGWob!Lc~~Euzt;&bF{ZF^UxqUS#O9CBG6w_2>6lKSag(r!UbuE)|BG9ezi{8H?vi)
zwff2&WCC_1z$<-uO~!N~nA#U5JLM~&IKbmm5F3?~8x4Aj0@Xx#c<pZDC9mT$RPa}l
z^k<x1ms_wEYUj`Y!0ZFa$(c5;V}37fkG>BLKUl4hF)HQfR-}R}ABFJ|a5-?roo&KL
z8k4DBu_Zl7pA{l$dGS7uhqpkWIZftJ?rILY&*+9n=Io)!x*LqUQ+b_HXa<TPS&niD
z^ubn_)1TDe*^p}>s<g6<NQ}!K;)6GAJ@@bW+izEXdYs1NFwLmV=w(VQ>VELJ-p_cu
z(R@8T#sOgG$fkD8*JJwK1W&}@4y;6xc|g1)ejy*KHv}*lvSpZVoW`f(6%d7ID?(0o
z#<k*)xX}G;_QeG{URnO)(A1p^R+QO)@AC_zxpD6tJ%ax0EviSY<v!Z0uLXya3BRhl
zn@DRc*XF-O7pfq5BA*e{D-U^d00xqE)z9~WQm{ZIKm?Y;TEl<-1au%FA|f`rJtWlp
z_~wpRuJ;E<P*Cvt_V$$f)EW2<h!HiUPgfXXS_J9Ja<j0o@J`nbnlo1R17BQDO1<Zd
z`HG5;XPI83lg(lgNS3v<x9<j~%4NVB>M&VYllZyM0xoGE07{>@QBhGn+e}l)E@z4O
zqSW@K%=Tr2<#8^RNKzQx*NNh`L9Ay)eoYzh(9xMgLdLkH+4p$7FVuKO3GJBnnyudc
zA4NInZtjCv^qc9BJ&8+yBfVbNLP1NU*}dNl;Zic-8{ayH2@mwa6$XTg>={Vc;lHYQ
zYVoWP#lj(iDo7Eq`?`75@+AJtFXT8uxKz@`AyXxSn)3hS?k&6OXtuV|-~@Mf39xW?
zx8Uv$f#4e4-7Ud_yE_C3?(QBWxVt;N&Ap%JJ$s*V#{L24Q$}T_JF}~6)tWWuCCKn5
zk$<_y+a)>Z^#aTg@i%9QeX|SPkySw&NS+H6WP4v1*=-NmASK1R-NWdgS2|YG_jP4I
zz2lPrH77+2n?S(G-ih`L<UfiK&^P#-T`w>s>;EE|GjSe;Y}*WRIp4CCs+Xm9m&Ota
zh(ue?vHMN{*n}J+DI#4yZzQmB6Z@_2hZ|BrV>AnB%1CbA4rTxx@UvyVcMkYv_5SK8
zM(n9zZ-1R<9It`C*Yi18pe)__^%Q#ViGC<}FnoZm7e6%j`rv6`*lK(jOX9GMGUFO;
z0-A82DRe?%%hT5G&XF!5E*Pe7`y)Dpb_ywW3rDW&r*o@7K00VTmw_KJu_(S?w3pi|
z?hnz27Lo8&<HnDdOaP1c@=%w6AZC#}9*5VJCAE?BQJ?j5Z3l4U8>eJc4l|xpeKq%Q
zzKq3g57$sDyvY46oM%mA%7JhlfE=#lA-ETooaCHG=~_$KE<?ZNuF(d@Hbfvt=@YIL
z-ZO77P#NUK{M7ul5*n5xE)>H5<C2f?X&na#hh~%FPLl82t2c&;?d<lP&|gH=K|M|?
zr!E0N73Holn*(rcmrdu2FQtKd(FBxuk?v|q&R~AQhy!YtD8$4QPXa(aJa}<t0)Ue^
zQ7Zu|29pmgro(;>5yvaP(dT|fo)I7K1`Q9!lMDYPQr++0wPNUK{UP?=<N}UkVZ#vC
zitTR9$C>PMc^hAkc}h)K!Eb)@o}_*-kn=o@puZ|y9Bl<LFvf`8T5G9f?G9`ladr!u
z(MWtdL8$U+WA}E+;)(P@FFHRVW<3eD{GXEEh%RH~T*(M&_XT|#o0<D?LrS9E3dX;V
zc8);fdgoyznc8X+XKqpDtVar;t*9_4#CWru8#YS-s%@;91-2Fq>8}8SL=y{j4tT}v
zLw91C`In`SC)&S6M0&yhq1-@&Y-??J)M(W<J~^1)rZL+<185AFla=6G8#$&GAFcqi
zlGYmY@6l5D+~wzZTfrAT?OysGIW{KzxT8zeJ`hXwHa$imA29K5KG$BZ-|}m+9Ss6>
z`W3vItK4_4vAxN`Gc}u)N!TqvkCi}LM;=wfC)?hYIp*R%TfW#c!GQQSn<*1T;;7X1
zk^@%~cjQn^fLh!=zpDSv*9VFwfxLIjgNi%2rp(_yY+}>>i^J}=Ya^P8VKb_>fc3|@
z_KNFRw<VZg^P}X=<1hP6Fu1SKAamQaDT7M?<Ou`AqhZAC6S7}_I8grSFArFkCCh{g
zudrp5(^r#%UR(G;`*z}SKLq8EdBRfVjy8_{(I=rXHRQ8G4ScaDSCYmJTAK{`eS`U}
z8goU)K=*CJ^pv`I&#VB<7)J$k7C7lU|AR`QdvY=^FcPFzx(<Mqo&$Xh703o7HvnPU
zVr{jXSxZ2bWu-2FC$2HD?IoGf^_NR-ZtneU6xs36elR?CoS?6dPbr|+wK9_X(P=Lx
zJbWV)<69-L7gB3hXM1n~?SJ=Y1k3CbN=UZR(NVXks2D<CG8!7G8I40spq>n5DtSNd
zxDePZB0ntq)2P~Qo<=Xn5^X)_o@1OW!Q5D%C~^4;1abW_nTgLMIS0D^lt8y%1Kl%#
z1ga~-TtVY+CDB{hi@iD1C~BfiV(;zGA9G{1KL4V<|37X1Z*A7|1+=!cCnl~61TqWy
z^kXfovEfdO-NsmKMt{{I8JC!1;g;qd%$_(B=+z=(Um}I2K^Si$dd3<R-S!H0i`O+`
zar1IzkF5l2fSiXdAf@2S>FW06mZw}GO&!PS8zR(Ko~?y*a_X<?q6Z-TMNNkHCNgu}
z;y3q!nnaC5P3kSc^0CL+@H-#0N9x)O9^cBu0jM?-;@`{oTAx0UT0ix7#`h>Td*Rks
zOusko7htABh?W@$ML2eyf2FUkgvh3ho9Ne{uE?_<voALQ8pxPYEh(LLr)+X9>F@Xv
z4A-CrKm;5o3XM)*tT9yr7aX(Mx)_lkZQ@kS#l?oAkJ7kd;>)R=QiPu8UP{@UCl-2z
z_9`Bqd_<-D_EI6hkl*ey>6O>};MCGiJ-jKt$Z>e9mu>9ng_iqiv@7l-gEj8}rggMV
z8n~*p!EaQh*Sg=F;x)CD4iDShUSE*EfaWWcj6K72t3qcTfzyaK`KBfdUN%WGP~6<P
zOfcqzSZ=VH5elCbL2EK!sLU`s8aS9KQYurI&i$;9cP*OmL6X{&jK{baRsaz!{<;;A
z*Vxkr+AxEIVRr>McmS4QAOz7MvvT_5(ru0HD$l7!7w_;pvrpt?Zhd-&V7#rlXtKTF
zjpF$KvfsPp0QNiQYI8%W73mE(IOc{e`33E=ZN2%G`n_1cp<<{@3e%$WjPp)qn>`ZZ
zmX3(LSkV9MV4wfCAnyj+tnZjlymA*Z$zYcWFZS^@5@m4r@mbUsa1{w~_4t_ydP)ND
zfd&_pY@qM63yzId&e?Vu@=|QQnn!h4I{DY}yT0%5`hVK-8J(^GYwo^gi^+5v!}^Op
zPertjRUv6r+sYrO9E&=$#Tri-yN+-1P@a`a@Md(AyAg@B>!Sfpz}a8vCmjd_<7~|@
z0?5?Jyp{;s69WbIgQ{_vSZqcFuL5YCs<|k@yBy#rv&BuKiC$li>~IpRVzr^2nO*0|
z{%3V8HMmVwM*Bj57&3W6#aZ{Z?*I09@nlU(nNJDd=+%BvhfErc=`=)!p-achZ6hd8
z4`miI&d8M;hXIz>Qp5fEYmcjc#1rRPXWj@38<TB_QkMxTtA#$EVhzwAE6>D^{5zUv
z>>f9~tlMU$07LtYa7og;I1FH0V;D)8`oLbQW~cdrw!wriXq&$seBbRs%imvZ;RN#h
zo(ZMVj}iRw&E^BY-1;*;O4?|sM?QmL5h&@w%GcX0W0h%C?aF=gy4scdo7JzB4);s<
zka_z=SV;6_HODsjvIQUn+AL?E;G0xD8k&Ed!LTIeFyZ*FIXPlt<fKUPW=AtV)#We9
zke$3HMnuB;ErH)Mfi^IMN`d@8Ir2+wPfY*8k)Mi8W@fNtuB`JuoPA}lie`hCX%d#o
zHs+7So^%c3|K#D($*fkr3>G7=S?3=4={1Pq2c5j;#|b|vK6xmp*?c!l)xua}_+<g_
zZzA$bwjxe;t8Mu6ZJtK+kiL2<BeeiwA@L7i3U>eT`kzHlLq@#X593Reo=Mi!2047=
z2F;yY>Ok)iPNPcKXkbq%%rqM4-|FaG7Qg8z#^cn1I~YaUpCy6L?<S|@tG}E+chnlL
zk^0Qk@EJ2>l}GlSIa?Jfij7P=E9T155N(n5ef&uTw3p}Yk4!X-OvUJkR+>i?kR0*-
zi8#C$e_hZ9@I%yun?mJGPtW3<c&7TZ_)&<_ZTNG(keg*IS()~dqGSi8;bM5r_;ynB
zwYnqE{K$<<c7Heo$3)!<tcf%Q&zT;~r$iW&1C%ciDa5JP=jyQS5pP6SlbQox%hbOw
zlzqUwtX=SxUZOn?CG5+}RxPlE6)q8`DGO~@6spUlL&;p~@dr1yU8?{1+i6eTb>nP_
zDZp4C<ysLN&M!&s$O6<?SgcV+L`^~kb(k-rBLS<ZsikEEC@8c>H~7a<^))$c-8Z0u
z<0)uzfDLnyg}yU6iO{#Xb3)*j9vf5H2zlkxyGsUtQ+HY?G{;Gf0o;0)<d-afWO(Bq
zfC&L!R1oHg`m-LleM)9l@1D1>qv_id!{zp1c+b_>0xqfri2pzokQBNc81W|b1RaGU
zWv}nq7%uHu=zON%YM>r%@a-E#+Vy9xs_ASt`6RciC2IB<y;m*biO|=+&${yZw%7vK
zMBQ-q=KXT~)z#INs$p?8co9(<I-3L*I*gDSIsy)QadmaIV#24t&ft0C_Yqx7_5Bt9
zTQ%#|>4Vo|8&G>0U3EfgVO{eazgs8qj%BM<!M}olpp&>vA<8RgfCM4TUlMI0o-yk$
zwp;OnyvdAr`JcVN?}uiUs9Ff8b9tlX@$+r)&SRI6Y2^7=kW%S^V`^Wz_2|CQE9Q7j
zFE7{{5AR=aea0jT@j#S}w6$T*QlHs_8ttqPL&2cM9^>p3P^H)TxILH*AK8G5C7W<%
zegoXXLFaV*W;sCu&5xWHIlE(ziS2X+PMG|;TEH6f5@RT~#40z>(nZ3itBEx4)j3sa
zrLOuf(MMIBZ^Q!5r1PWtme6dP;GkWlr2!=Aw?QRp&erbSJR2n2m0*kUtyiVg@SF12
z9gQTRzT_k6nELO~fB}}FY>B<Ib8uBvRZ2KzTmU!OcNMjely0$~vSCAxe$vCt*uf?F
z3R(L3LH5LTkG@x9oK3!O0)Q17UC8g>zq>|8WW?0$;XZ0$7?A{0Qcysyw%~W4yPU4j
zaIyCyC3ft8EN&7J5|)$HK$YuK!YrH)Yoe7$4ek3i`EcEN-*!+r(eTrW<m;2I@#u*u
ze6%j6?u!X)VzJl7BjPajaO@JG=_a(0NiBbTY~_7j<5)?REkasPV7`!%3(_669$&#6
zHM&Rvu|0nQGfbCx+d?AB+t}d3h-vf0kL8!q<sP+Ds&k|SDd7=%xW|%N;kllCnifq-
zHg0{QW*vvy`pC8tCluV}*5$ODD+s2n+n+GRiRms?U_VnJ9XZ@<hta@?pv8*ICA;)p
zkh(UxRAsfr6WO_V#l}AXipgj5jlrUrplsK*Es4rB!<SyMYmdwIneCD7BuY7P#K>`x
zKrBSUu=NN>=`=x#2h;uPko^#|G-z{2#>n#Ct3YSw46XRS^#S8@bQ5!=)9ykw2zsn1
zcc^a4>E004G>72j@ovFfs}+mo%ScolA*ys^;TokPSZns@Ffew6yGmVK)p+<`xy$7q
zDr)T#Hh@nOAwS+GZi-xaKINmSu;>yl@9gvRgnwN+i*``^rBf_oa5D09wg_X=?9iT}
z&^k_H#Flcl?n~efpav(=9uCxx;A>@0_h4ZPRH?62>`Nuk;Kmv#5Ga_kJC%^V$Z=Ib
z>gCj>QTBpG?)JgRGe<03-KHu(`F;eG(*uq`;=JiNZvgt4eu==QivUX-g&z!)k@~Xm
z^PNDkZazx)%4*c1ufi0IJ5OIFv@wBDw9SBmG5%boo&GPhVJxQVw=17d>*Z{n!oW()
z@70lJZg#vAU{OA~s^89vNdN7F-cXrmxZoEy(d??;%>DwbgiY?34yW*`Lr8fEdIaXB
z9eQz-0!FMByfB9k>>(=Ky|WLbn(T}?ze>eI|9}P@^ZR~5JoS<S;({SIdkjr)>%!%S
z#D#ma9y;Kd(D0x+ehC%r*hn3=4=(qUr1qtf9bhj^qeCA7@9gLDp`S7bgW-8ugn5Y>
zXvIvLmS?*ei`B-6ON*{phJnT%RLI16?mw44Co}VtA=!l}ujVCR2}xttX@uZ{MW@UO
zMM1DFzOOWMn8wqt-Nd8GR!`n8;oOu<8vZDk@>y65mi(Sg@AyT6cB~(|twxe+220oB
z?N#e&fMOx1a1C6+Ix&wPx9<Cj`H;!)6Vdfc;O#h$-9Y|6NMWFIE{%DC|AS4)VopuQ
z#-BjKb=*X5BHb2NxCHtT)GnXY+mACtGTGg#__a39h=7g?Dj)!bdbO@xpz9o{LQ6)5
zFv#qrzyt#oh(@n1Mjk#Y7*8e+xApuRvP8shC_`E;wp6Xmm~$t3Ac5OyH+zA~m=Bs1
zhv_2%0$UQ}&S%8RLnA!*8t*5U_{T0&`QKx?`O&?69e9m5kgC-_i5RioDpaI8&GjNX
z@lVtVj+fsMEdC(G*yR0ukUObyoDe|BWI^A7+m-CykMGxGC0pqJdcjg(rUkL}bj{?b
z%2ujL#2SKxvc)ClibB}papoiD;h9TO;J+_?4cwnU0V8&1xq$>G5#KDFL}cYulyF02
zhf-28+(@SO+l}S5i;H+8M+NHki77!Yflh~nGhG%xJVKb7^{kkf@+i?+sEb@0-oRl6
zsXttxI5$1BWYY1V5M_L92A{3$1ODgUGAFaK{zo}{#X5Dl$lc@;VywB`!*O3Ur5gJ0
z%8*aI_~cXx$PMO}OlD6|;ol3$AqF;A(;CgSo3WIOWCDYA$j@Jp1;cXCLp)8!axq~w
zS@2CuC4N|g_NF#lfS(!l<zFteUNEsiXxurAEY|%ZL9!_^+GBW~7P&A!o|gzGBg<s0
zYR|CR{KQh<@vt^>v4Txf_aMLFeTkJ1%<H1x;nVg?77|}kuS<Bm*rX9RSge-}A^6E`
zCWV4VDMu$?O-Tm_?_HSZz7}IXb$695xuT)E2K;0cPkeeiz|G)sh69}2tBV7HV%x^M
z|78L-YAU;x*>*)Wo7?_mP70gF_r<;vf;I2E40BeTt`DDO-DMD7WW(H(9j8s;0`b$Q
zyAp*10t1cg>>dXE!v%gSs?g?gW*fi#fj8&vmlP91uv$Q4q+vI?4p0Qswoc=UDdl;l
zmPN01fR`B4F{k+JCD$8@NKF>-k@+Z*UXJ4Dju<bAS0c&awh3zib3!p84x6YS+HJ#)
z5}6%?HJ=xP6*56UfhD>21%%AiEWRRu9siB*d>SE(%VIbiC%jG#&za=_UeDFU0T&()
zn`k<}*=J973Kr}JNc?~}Ek1n+1KxMG?TzK4(>~KKBdeIFjX@29DJ(_?%RA-c3VY8`
zKO#k$$v{6U3IZXVTm5ADO)cA)ClTE_+mdkW`GqOyUS6}`BRY6tpSf7A1*=)fa?1bZ
ziP`(`Tm9K0*cEm!p$9FXDCX&Y{NRmL9F{^HBIIgtO?(jM($*5jhWaFN;&658thAA5
zJZ8yN?ak>@xdxIaX!uIcq9P@e6z8V}o5@CKTBat{(?D;(JNQv7h)#SJ3z6BfHWnu@
zH2Dpri29p}U?!aHSJ5&F_$aSp_>?PPVaRK%_nQ>t#YDQhLHJbdx`kx4>%QC*y(78z
zpfGT$1+SF-1$D8(D&$I10X|^NfV$LaI29$oV32@+&=<3Ky*3X)tlqUg)J9_j-Xh5l
zuHm7!(_NF-4(bwvQD|oYe|<RoD!`D{z0`ooObbQ1h?8#qpi2-y7s3D>DAwbgXT6wI
zF5lPIiysaNqC!G`#jjlis7Y?rQGq2JVx*1I7Al{bWMyQJ=zuEQK($ei81L=~z#D~H
z=nX-{k7~JZ78br%P$2yq!8F;mx93jXZ9xhsB=<{`Nq3~K-9W2WS8@k*o8Iz0%X31|
zIZG#ZPtK1iv1uUHj4{^b&i8muDM#(kB6+9cIF8t<qz(+OLj`<O!5y?9`2lk+Jg+c?
zyE3r_VBAsDv0KOD@#SbWg2)ra)H<0?7n=7Giw!;PF?zG(Py0&=8&s92o!37kQ0p$5
zSCW8}Nj^r0CSNfjyh46{m0pAI31efnjNBj%gmF@ph`Ym?%}!uW+I6{IY;dhI*YTjy
z$>nOGH!!nE-hI4AP-QxsVw6(JcKFe+S;Mk2$^l?2)^|7IvK-p&v#0CnbR!Z*666U4
zm8_jCjYj4x*7@gURPRtSu=FVujf81HXOBW9zP~OLMCUx%*I5_R+1w9Cp;81~&>oRo
zg+kl)`l#I9&cHs!oMRmj4olK%wlbx^@W&S^3KYQWMtqBT!w4E@`k)hTvD0d{)x3Yg
zg7Yj?iao`uc(L&U!$zZuh<T(MI3NpQSg}a&B~QH@lNLb405R39AvyK3|0*i$e24uZ
zn1#WhCIDxXmEbqru3GasCw(n_RvXUMfMk&ylX=%xin$tN?$_)9?>xyrh18}hsG?LY
zX+N!317L&X(j#4v_$RA%XzRR(B>*Q#0K^dOe5GOdux&1sE)35bOFEcJ)#BL1@Rw3C
z2cGrtN|evz`m^fP;7`_~u-wnZ3PYrAqbfj`3W-AA8nz_D9YAfF$LBG+S&K|C?&`jt
zG!Xg2%|jKL00|1Fz;{ad>)6?=2oVQg??(i!=|YLkEX1;7W`)i@-^)!XeHHIx0^IAG
zT+}PpL)7B+iNPr~-63*JwfoOTIpDIg{3*6hLsQFlr=)VF3D?QP-xhpJE4~791bE+R
zC0Cn#AbvaUbt7kW-@TpuuJ=mM<OaP~==u0QzyZZ}lvWHWmEKQ}>f=uX1F=oMM+_`V
z`F(&nVAZ#yUA+mRz7F>3Ge+NmEdydW{fI9##u^kV<4+4&z8hc{CX`Q<Py(FtxK+Pg
z`5`bbY~b6A+-0+=eH$sHGTGW0zb0M*Kiwe9Wb8z|>UQXBI8{x9x}_|CeSf$Uo&Lux
zA#lw3Mt|+EB*31d-T!#?T`2g*CVL(iNc1X_lm=Sg0l>V2TAvXqnxH8Z<JUn8qfo$f
z<El{Ji&6f!v6g8rT5)y6(vElmba@rnM^()=Xv++LNYJb$?$LzI|F8dB|D%~tn!ad`
z(517Tu@*O4E^3Lx^NaatrgIw6F3}|hb2D-Y;*TMvh+oErUS5*fs~D;(j1j$_wiG~_
z8R@CN*w39pWZ%r;)}G}qV`Jh13!w9%RZD<5ES{z-O#wOwsz%Ui@*?1vrEHO)Pr$KQ
zEk!uv2aq80oa6>*0VO#o3B?Nx;MEy#4VFkD_7(xJ4mE3O?)EqE>TI6+_Kqq4V|?^J
zt~#8%90EQ!J?eW~0mg4UNg8o@iUq*6Ins5-#>!~Liov+5+#mlV4CnVS4(lV~%z!X3
zafJI+fG{GW$%{U*qh#U535k1IYAo+10sNa2?5sK<)%dq@)%&=$RAYoH84z-;z<zTA
z#?MEZ`ofk%iNLkNpt0NtDd2H1%@lVi{v(Xpf5Mny0Hq`XvtbB{sUQrF3F3%JPn{L=
zvIG|OMTwqG7Lb`QH5hn}>;K2N^`CL6K7E!haO!T*f1Uu2&KFfC?ocIQYVX(n+pH$O
z&+5O0vG*Q^d`q#RIxrjlsH%KWWe}Kvx`8ABwQzX2G;L~XGF)kLsG0rsb%F>0@f)tS
zdmCp}RM5A!wZ(HgnQbis62^#tvhh32!*->~|D90`*#C~Dva`l)^aD2Heg8-yEH~OI
zm1{CHzgP0jwq!ZyEA=7)yU)l<lYtn3!=YT*V#*7~e%|rC1Bm4Z0lNMGxWi#*7&C!E
z4=)e~Ic5h&GL{Ilz2E12vkxAFK^F(G0uuv_W-eA;*R-C+Jgy-4!7&$z1iFVsC2LOa
zX}sP}fPMp$U<g}jC`LG%R=tI8hCXV%X3ZPZJff@6{A@{7&ui}CC@nH^&*tir!%G)=
zzDzvAjWmXMhsUq@?IPmnt@^){<cbbAf4zgwmLiKGLVMrbZj8k@W-BSbQ^`MTIj#C$
zVvN`A=@8813F|E;(0#hCu?sr;8yTF|xOup05YMo~SWT}19jMJFyqV?O;MR)8djqSg
z3s|R&aM*Sq+VGz9d%rCwFv2(L^T&}{OmoTA8_!??)@jV+FGJrc`k!m`jo$_YUpvz=
zX;JZhA>9%2iwp%oO)eHfA8WHkU%Anrz6W@4s1_6=Nn(7$<MsC9TCDa9w2~3Bk-R-5
zXqEeJ%__6s^d}N)<8sdGbCv*M>U<UQo<Br<f>)2~xL#|J!w)Kxi7wIH7R%tv^KUL9
zr|H~sp%yI_qS@W+__U}sF<x6OXG&#w5B*G`j91ZNiQD**i0$z)-g!h1{U2BXO`JCY
z=q7|l^Sf96<~-ZzL##WC3YA!)K5>s%SUsYcuwrV54y6_kXSXIE-*~%ohdL}elC`FY
z>uvn8{hte_gCv*H6cRI+cO%Df!J4hc!8l(<*JPp(=fwv&D$eOwpAMzU;Z&dHI9&iu
zw>~&!wvovkQD%#23f32(TBFFvm+Cw%(dKbe?U1+e$)8yN!T<X4=7>3z6j0NKI0*IM
z0UDLmfN^y>^9m{f0Rk^?i{=x6F$w_Gxi{v@G>q2(lWN5rkzmcOFOttz>oU)MfB)()
zvg}%8O^t~FGRtCjf7?8j5?@Q`!zqck9Xzff+Q2X;)>_3^nP1%=pU%v6e)AD^xCNhl
zoyfDFr-Q{`!VdR+W+Cy9J>Z@>H*6l8!Q`IK=V%_j9$RK+c7*Up6a476Ir!_S>1rDn
zv^x?A1>v#DoAE3Jq+M<okL;ER4qZQz8K-j85&3*x!F6IXgr;==pl)!Zg%4&r4DIF(
zOqqCPFJ@3cudlD>!E39Pk=@Ga5khqo&~}<w9|+$~21ho%>@$O~X@VwE$D1z@-{U=K
zY!hi2cN2*u%t+(t&nr@>u{iU=7)eI9`YIoe{w1~j8~1ad34~@xhdcQ*sb`@q7goD!
z{nwz1&f@Hn&p%iw0r+;<*b`FN(T&Xlw0_`YB(sOx6u#mGKD}{5xe|Kp5LI)dU1(@5
zvB}H44Yg7}EJrA#<o5}`bo4^`z|c20ioDRsLc~Lpvkmel_a}~0jnbgvN%4ND__lgY
z<tk?#qt^zxw9V;XR$T74ba2~ak>olY2YWf9Uxk9t5!05iyz-bhsx)ui*8pIymr1~R
z^e0Hg<Gimw(i+d=>{P{OH-jbCG+Rt*mzM6(+Pi$dfY93{@=QjWur=idO4}+p-!n3?
zL`yfZiC7mx-c2z7nWIK);qYAX8t0qgiN_G%Nes997*Q7Rp|mBA&UVpIhpl<~*<xi}
ztDYo0@4TuWrXV`Kh*4bD?gn|Aa;*+w-HFvdxVEA&Wvkn7=055`A4IPil8TB-40S30
z^Ju6TGz^zzz}gIIX)h}JKrAt*K$v6xJBOLc^;EY8Z+s7z%{=Y{Jv0K2AtW}?asT}J
z{%(K10v`)Sx{t;AQ1weLez<`5<2ougY9Q*uJ`7nQz_#y)%|93TsM<TL*lq0_-eFIH
zxEvqsAEw{t(FHgfm>a|_ZJ2+&#iiu=3b>?nBj3NAuC{D0E`MW<XSY(HQrExUhw*>_
z=_Z$>D51c^+=}cxy9XZx%-i*E-{`C_*RU_C)*~o`ICk%-s(d8nCLG*eUfcFLpg^w_
zkS+N?S{569kE!z&;t5(K{u*~<r2lr7^dmKO!hfE)PS>_RLM*mV#f_>aY^na14_}Hw
zPbZ63ZH)OTxT^bJfPZrQ(`jN!=lNX9=dul@zeLpWoQ>j6wRRY%e_;Tdr=F>w!k-nU
zFplx%Bs?}}=kUQ1Xf&9z`b>V!mjI{d>Z*>gZ(%8XALmAruy)Upkx)s*veQ_3*lq9o
zJ{b#|FZnVd0U9I42P%p+V$7{1>-BDR^Pe->KE_mPMiBengAo`hHLLNiP>~!R7XG@Y
z)T(7{4@reNL@eIl+YW#lNisV5-dCOT1dWyDClpoCaqzk|`Ad&Ca(8`jd{jJQ0~0J?
zBbGp<|N5YdHk&<_qlftt5t<w1tIbwtu|yE6klvXThFPrIP|lTg*DH0NK@db)_cekV
zArgB^yJ*}m!e_j48-JvR<6BO+ooxSN=TOS&o=m&Zhb-e%se6ejH0U)hFOntB)L%^Z
z{Si!gcK6WGU1?r6d#Q=kGD@2sn7~&UF09&C3&&D90WtC}ND7D7fy_)c-OrYANr#Q{
zNunP-_&magwK9v(_Bz@U5r1oO=*MEMC1t5%{alX8fKr~4NxsYvXsWwY34odd^xj|=
z5plv2m8^_B^dhmRHH*~zBFZqvzb8*_rl6r0r!bp91G^|yh{K{c0CtDE@1!9^Fa$_m
zGGd&gsqFB8(I55`p!YzHvQNbCVF-YlHWz`@3??qi7r*FeM4;Rq{$4;?`R!y(Tm)r5
z3kA;`ZZRmUsfn}H$mt5W8o;Vi?vErtMkXg?udJ^2t>8?8v}!59At1!_kz8v}xGDFO
z4SY~dEa%I^fo(sWqX^5P6lJ7PE=@66q!?qWj2Nh+y8&Fg2rdN4@oyH@bF1Ragg$xr
zeJl)_)bT&m#|dF@p6J=RjEfe^QBZ@G3WNlX+uU#q0XG(H8v2uCe?Ht9lbJB1eihk2
z)lmLN945vKx8~{%2{i^Ih(MwC?60rTUxwSkpUe<0Fpv0Smr)<iH*a5*B059aAw_yA
zZ?~vSW~NM<YV8?(V#wR}9?q(i>Lm@f$I?G8Q;8Qbf=C9o!P=&BEq9t2a!P!FJKDi&
z4y)G@IifRpoBuJ+Bg~wR(0qlKQ*5>;wN7R2S$yljOaHrp#e_@lao0Op83Nmmj?G|n
z_`Lu_N(r!0lzgkazP%QKEcjTF#f`WVf%#xiG~fHrjj7qWY+eHff6!9NpR5?ozWw+*
z5!WV0laTimNob{x`y_`yK|RcARf9$b+FWd)@7HU;MmgfA`Ox(PVzQDO0%O2vrXDKf
z_5ks0!?xeSD|!-hgIcW>r}U6AKtmGPext#I<3p95<WJaEL~AcH`JNE}$Ru&x_aDOM
z@yp?Nb4DbStqlg6=y2k@(q#9pbcUNNw0Ct+VGyWY+;4JIyoMf>^`l#5=THHAFu8Lj
z-*sC&{MXwPX3MO%qB<;w2*&~$qlKk?D37fVmeqD&7&LL9s8i2+EBDXRYtSKJ_f!1b
zRRSm5O=V;=x$!IOn+_K{1Y0E~ilA*)f5S&Fy9yO?R4{+7C54;4e%7|pfhy*5+KpNd
zSy!{$%`evdV-JB1_=Ls<birZ8xET6`-PKQP)fkI!kK4GLMiO(#qg|?IT>5jNkrU&l
zYiw!tN8ys^vNVltyjj3TTTbVPuMfPdHO*HUOtb{86s=T)L&1ePF~#-)U<2_ENRR*x
zHP~AFtU<HuSxj6U3UeKD5W}kwt;W;c8Rz2yfa?=i9XktB7jQfOAgB`Nl0>J~>!zWh
z0oa{~-<GHp1^HfvWWER~2=!S+n41d-z-E-Hb?<Y85W5@6dRXl9O67k|&)l#0rsZW&
zdq*M>EZ$k=q?6v_jScU5!U_Sp&;I1|!{KyXkIrd7mgTpjUst3$hLXe96#6m2iCO<w
zqYE;;gIRRNE>y&53Ab#k)unY+M3s^wKJZ3jf&M<II=PlHphb)%w3I-@<ZLKtP0_iz
z+Ja1-$jE7#2=cdUf9U6$pSQsn*X;;aGm*$a5Wi+}oBFbCzH)y9cB_yPR&FtaH(>c2
zc)6SR50S-IYiUhnsa?K{imY|2XV#%Q^@9#hN6>YzO&pceu8P688Ib!mo)=!vVjY4G
zLpGP;%Jj<-tBs9z5v*+#m0NR5Rlq7CCoW~T4ba!)A@5usk=@xjnj4^poAb5rs$Ms3
zxSEkLU6vpVHaQx`EY>V6cZ035m?zMvTI+Q8@Eej}Uu>PE#M$T26;s(RfJqDN&A8b;
z!Pn+z4A<p$)a0pfdHM#a3cF@LjnKy9O16e$V)o<m#@gWs>7oCD)$FAZKhYxidHavk
zB3@0pSKcVqnt6B`2Bw$o8N>EH##CCKs#bo{TJ(d;Clh-5>^Ao&q#fx*u|RG1F&|Ia
ziHg34OuvY{>u0TB!lKuw^O*ka0%p6^I&}@_(UKYn6ZvMmf;Ot<I>b~5xbB|Yma6%%
zw9t&DKRR^Vd<e0T2!&#-|EzCv;|bT9nNTW`vlXk1xTP8p3y3j*E17^3_JaX(&rrop
zqHn#=ABHxrWzBzXtDLIIW(NpEQnClB2y%&wqUzJ^nTMrxPhrUx4t68w01YT{z%r|k
z!%2%tp^JyCof%Ued;Q2h9|}H@kf04v#DEq~A1b?sqbY&}$+9OioiN^D#{?{jxEl^p
zN8M8H<kqDNDiA=4B@AsI9l=9W7{e8LVC1B$Q1*pY-EGAR9{xoJ`VPmx?QvHN$GS+C
zd2p=p+bo9~PBGZvVHgbh9zGa&xZMjBKJ?wPduUc1?Zh_sMH)&>RN}N5{}RvM>|TA^
z=XLe}Ai(7j2nLsABxgO<SQ%}8v>^_BCr$y2;i&;)q>5A%b1Ns5vWx|;V{-ZLR*`|?
zpM7MP`Mn?DC_Qdt|Ijz!7N=}+!3rvBla4&3xlTG6XRjBm?;}D}YwGgW3%?aci|HUU
zdH{ev0-k_*(a^5&umfF>Z>+2eSN@_kp(562rz-(j2Y2hfQn5;znsqiXB3`YN#S-k1
zJ+WCGAF}>9)m)t`)npBE;4f<uSzSPa&VX-Kjm@1c+rcbUPbfk^EQ}M%NP`~CajxfL
z(RJsA6TvgbR|Z|7mdrLNMkq;BCZR5t{=T2;B2VGBnh}-f8$e}VBPzf3n~DSRE^M+e
zv=94?&sc*qq^fmZ{ne+8=I?e0-C;SRqq4@!?c@*rV0>*}8&~a9WwF466(ax-*5Aa{
zRbyZ<<s(ab&MlpUdXmC;W3^;RQvl_F_mfCWK`0n)j;VVJjQqfNQ5CP=HZa5UZlf`6
zVe2}2=6ZB`d|dxr*<KYI0)x(kdUH5@P+iMx9KLH3m3%T3>nns;F7`SX+=$PlVLY1S
z(I^eGIx?d=7)TcLE<~MT3mlX}@<a3<(?VKI6gb*rBPXm3@IfSor3|VX2jGty<ftCI
zNxa<yWDnK=;$a5@XH;BV3rIFVtDF2D(M_;w_bQN91J5X4C|EIYPG4Y;5#civQ&;x9
zs0fyp?2LplxKV4CjSc|VCr3R}CM&YIqd8MO^U0>lHoiKj+voKJTS?^%@ut7Re|vSp
zHr^UyRdl0VJT1J8S8msqPl-rNU>sLMEul{4W5_ms@Fzb<G9Y&Yr6{Uw)Sl;4$Hb`7
zZtDENbeXX-uc!d-ITOECorMynl(C$rkq2#7xX*6^H$T%;+D&WJ@Ph*>y(Nsp#4C<j
z4Fq@tAO|~r>5;!I=u9kg@K>MASZ?g@G?VK!0z}e6BnOSVRJwvvM>V=OZ5E(1j^?MM
z?SM>0v%{0Ixhba8JR<2}?Jvp(Nt6WRs$`T1#-D51FOV$C*E@ULsKH*?mb0>PrkPsk
zwvbiEM67l@c(OWZAvzc}LoBrljMp}6yLD68%o91gHb6e1R39)V6v!B?j!f20t8%c|
z!l*tYlGH6|)U05^NMQ^Ab%Hq{(k~q4XH@{D-)EE)URNxOemEHDyGC>KNCul_KUzP?
zX-gV(H;JH8QEzFbx!`@+;;^OGoga2hMks2Ltcfw+kMVZay>klB=!H)Sw<4Pj_CzO`
z%bfjg-|fDkwbz7BFCI0X2z?31MG-;8?1RJX$11htvc1GeZ*xP<l#j8;GsG1G;FyW7
z@8PO$=g8d=ofklzl6rfl{mkYsxGXOWb`19Iw%#j>hLY)7-##UMe@8zaK$_tFG2&IW
zdO>!&g$RM0V)H{!RBqA2tdFN$ZrjuZlE2{%1D^!3e_b3Xr@E`KE9TfsS9AP)t`*$b
zIzMy;Bo%`LaKEkF`>1Td%q(07cJ`)O&6lILG*MV+!Q~uG7r-|?LckaK+fzVE%Gm!x
z(GT7mMv^Tq&QG-0hLbe6{}K!d3R)_Ez2wf$)&6B^7@#&276D&hnj<#MWK`H~)J43F
z#eBe0Qz(*a0r#a^VSn{~3$*Wrl$7V<uoWs08M8Y+E`%|`4t68Hxe^;zn9?bX;j=iA
zkX>#<bb4IMG1~|*PNvM>9H04Gys;5Edri(X*Umb;J06~<+B{7~CVj3QWw9*chgrBc
zZ>a<9gY9+owFf&^fR47y0gEk}OFCDuic=9O<_mN$MogvW?V&4(|BhZc<sK;zGsAlT
z-<|Q4&nHS6f*?Lb8f*L;PMBk_gX0hB9S?e4veL-=MOX2!KTyU}7N(}(f3Q|nrwaPA
zbIj7wBIuX6c}!>%YuoBc(MrP0kDXX-4p`h|f7)K~CB<y9#m5V)^gg^0gl0?1Tzw{%
z88FXL0K%($c`{tCB<Dv_?j0*il<k8aYx&l*o5AZ4341n;5{9e7b={%3Q~EiLhaGDo
zona8QYOVF72BV!4J4Kwbl!vnPkdOxFDETW|C0VWAi}sd<`ee6OBUqrJP79X$C_Kll
zRdWvDM3-k_O*1xvra9Sa<$4*d*W|p3^B^&-`Kd*!U8za>MxmV<G4bHf_R^S+{T0#E
z5NCfjl|Sb5a!+DdlP=2-N>I0<cpby4$%P5^)318~FJU}D^!PX18cab0y9t5li&=~r
zA+HHKeZv~JYyajQv<4JNvpqK~Oq0(uiDbN0Vhx{xC{KJYZU_T&+z@JHmfHy`+sFfK
zx1-7afaUv4+vwa@NHPD+i?&S}UNI9C7KWpkI$M#WJroQyF-}l5MImxA!Rgt_NpylL
zUR2MMdtbW7xRyxRjNflWO_yn8WWoIyJa%d8D+oI>vg(a%41t*7C$0!lnrINuj!b~X
zx|0x8a<i$j8kX7O?z6+p_j<rUj6*#%{G&1gE{j+~znbItAA{>t7~of~Qot?D<1hMT
zU@lFFifV8P8~G_*<*)<kB(|Ur+>FMp6U~fcWnP~dP}oVdC202`M9%CGnhSV{=N09N
zvit*?<B8Pi{YRRMgOn-XmJP@8;;;8+7wiXgd&h8P{xD$4&?Z!>%uK0?sn`Q|XL5xC
zymxf?V!O@hi=ckSXe{|EV#tppg{(#E7{Q}7JM)I9NXN-M&ErhcExmCa2DmeoqG@fS
zfs{&NrqF=`X1|>3>0)9o&61L8FzL2-jZy|tn?r!~=-=gEH+87U&q7Lt&M>Hy4jh)0
zER#J4$%9JL+@)(}jHT0KJEb&W299Be1Mk2pw;ed?g;H|$QE$m;rWt-G4It&ID@(rk
z5nP|m4UcU!IH-hkavWszsqF99p{$g(T(dclYVJ2?4978tZ?FEJXs;L#Txm>l$jFFa
z2x=aWM1WjTx787|z-obVtr{DZv+%Y=Vg<9Cvr@PI7(WsV*eZY6A@o!$&<J_)NlGzw
z0JSOrTa|3zmu=v<hu&ha+GMHzfuz!8_AijvZi4ftC6(F+c8SIDj`ys}-l*ZRVa)Mn
zt~DD?ahiqF^%`<=Mir_u?FmCf4>;m!ac?#ji$~U2CF5r5xl?JpX*OE0W_Gy6fG}yZ
zg--x%4X2>A%9LLl{wNJn6xEEO=$sIgAoV2#`N(%l88Ij%pAS2whzJC;B`Pq0UT+9K
zZc;eMZv%Hlei`TDNaZo@q;U+h0X4!Dz8?jmp-8ZZh?pmUTo%B$)UM}V3XsuFt!$1Y
zWY!0)3n?qH^K@)K`9TZ7sM^mVHL$`jGXsLP-Q%M&-MOkUMl5pjw8qtu!7l>?1CsTL
z*fVfs(gvfh6;J-aQUP3}l*N%;RY#LyB4KVgQV$6eKQZvJxv-;{b_QZID!B(G*IHb(
z3GGH{?(O>3(B?7OJ=q3bpGkcP*^ux@R;=ub#|j;A*W?SG=K&Bjt=X_GWG>!Hzdw@(
zMMvxwZ#e3^^9%q8D$6neKo#(os!<YD3n@mEE2d~KJ-C7Ek5gw)vs=FGH@PuhEWt+=
zLA|j4ITGEe5VV@=vw*I6k$y^kIctRhPv<6+zp7<(*k1~5JY<huxhga_zB*a$p+<Ke
zJ&vv3Z<~+VP@uZijvRdB^jlfnrvP?5S5BKurMaG~jYs!j{<;Nt*tKH7OfI)iDFdr;
zK9v3)gH`aYU`T^RogD=@-P&*WVrXAP<-^GPG%1R4Cy~?JPDebENrUZgZ6h#hdpqCv
z%5|EYp@v%tXlw065aTC@(u7()>HTvGH>Moo1R1|5_tZh+OD=Ny=1fTNHhDz%CH(H%
z#)nsogoC5bC7|`%x<|EMX@|gXuoYe2m5VmDaxX`V@1h}1Mn2U*T6hl<?lxK$3NA+?
zad@%1yV`!Z-{`4u_$MzAqDl`9#ZM)f<ZPGd!+yQt8r_(L-&FeOrr;1IKUu!yqZJ-R
zZN;ceg%01ClSY^7%SQ=cS`y@Ug_QcksgQ~JP;bMLAbh5#l;NfioMGj0Ii~hQm={b2
z?b!Q3;{$rMK~nckKuwc`f38*?miy;XfQsPp@iF8X6!La4B7?#(rMz5l)sPny9pDE+
z_FWW=Q+8m;1*pk83H33+g`2d0Ov<e1>G~iBDEbBIaifKd%(4)}0d03&TKGFwY9o+r
z{_ugQ#~lQaZdeOa_L;z3$bONrfgRBEJf?u2K<@K{{>5Bx#IM5Y+h9X;W3sbhVy}%8
z(vS!MFPc7LC{-GXT97-@c#9$D0*BC(oP4+AG#1o9`(1IAj&H)(S$u?|+HAol%SpM6
zyCc#bg9LoeSi?$R<bu9lmmWq9I-h^k3vuC?V{TVK4nkk(nzX2UFXG?dMBIV_nOrOG
z<|fM3b?VAIa2khJROX8bW)#1b{TU>uZu=)jAH()&v5j`cLt=U6dly;bSpZ>0TuiRl
zc2@>(FJ5g#u8l`?Yz$NgBm+Y5-RK{4QA(Mj7Re{|a&+@zQ3WBWGCiq_^<rqV<*!Q9
zEV>qbPO1pCe9V6ONkNj?MS<kaD*5B89p>L<cQki13}3?~A=P*2)Fk|fJd3{=IfA!n
znK5em<>c|vp}9wZX?snfDs~-eDD#b<{s~V1QwtYa9;QvJ?4k>U*hx*MQcsbCN;@@T
zl+wl7|9}%pJ;0)5*86Nor}qo)R+NCorkD<>)SD4tGdW?QRz2p>f@RIT<av*92?f4a
z*2;Y-`?mPNq__o@Fw03m0Svtcn-be)rx+HdQWz|<ydH%a99?T%V%!a21pyVh^(b(X
z;y|YmMVf|;j^NKi+nW#_dB-2AHOd_tK$R`mGCLsA8crkyltIk&Gd3U`{dfA8k8sX4
z6r&3E3DN=%aFX`+OvfiD^oZy|X|lx@QWTQGlogsqXHG)Fuw4bp3Wbp6!*sY!#xZaV
zI>Yho(xBMdwQFy{rps`1J|&k^a1vk9A<hlNgQg%JVxVkjzV+z#@JKH%EJkLPs=CPJ
zg@g8TAIL<LOlV5djdoFJ>?9)uB`MFAt6Zdekf-%~x>%{{1ClbV`Ql&E&FU~C2&I5Q
ztQ!)b41b%|;@4o}1x2%4?LvR?T{<-8(<>}AeS_RNCG;tA@E;Klo33K_$f({l*|0yI
zb9$=h#Ttcdc<OYK_;<u4B*yG1OioW?24AFq;1O^u4Y=pyEYxb7E=~?}qdSDyE|ZSq
z@0|FfxjP+ov1bD%^obgDa{>FXFl+lfMcbHK985MfKP=DUQFG&3){&KSHTw(<oJcn(
z<3X}}Wy)AZUxV4a!L*di5U=7GJv-fIcNNw9VwD=S27*P#Fdp~g_#K%zR+-(DPzy&L
zJ3!E<RwYm&DC9II#_jbIO1Iw)esXgV3q&h(mq=G9g4O8{dycUwrw>-4*x_G%J(VNw
zG+R^R&kutHCjdv(;WP$HpttzUP9Q!f@M$b1+_BzfA%`DH@#8j>Snm++k>`Rq=?K+%
zRP0RsK0@)L_xcAsl+cfo98KudM(5Er+xS`zU#=va)<`C2T=V_iX4df$#S3E1*SLh*
zQ9q5gIE_hz6m&#TY}73l#iFcKi#Sp_YcXH9Wxk}!j(dDL`t)Tk+zx2JE&fh!=cHB^
zbn1^fw|9Y-)M|3`fScUhkFk+hOJTMXAdrY+L$j;3OUV1iT6sO?kEL}qSKD>!4TI9^
zR&yS$cQhYyS>HNUvGxH>8X;T!Pi;L4niOOuYP?dls*M;y`35%7TOWOk<8m<05m8|g
z6)z$_*zn{2^hqu?|66z%G&EttEYjbu6*L0&E+w1@`v{mKaHf<TSV>)b)u4kwP*wZW
z!^1};c+>O)-lF8$vag!aiE4tf>_5&=-gX!j!f9Hp7Anms&Hq#_whKO=Lp0bdhb$!w
z+;DFw|BA+Ak6;(G^8uDZ0Al|XVo!1qewo8;zP&GlmNuIXRv!PJHRbN{oYls3IjYB8
z3{n*<Qg#UCM%Smd|J4G>4!CnF9o*k3tNtmi59$_zmDE%n&eAxTes1~e2gd;`$;ma5
z`n9}Yspy*&Lc#X}ai<-oB`ft=4>v}no-p~7$)cKy{SLV~Ly2)6>d%~s{-%TT!Vpg+
zv~x`w+hA%w_E{aU_(;TR&5$UY3uQ1s2kFc4jEAV55Y%!YIW@s^|CTFUiK$U%*H9&|
zbV~k{tX?fbrb<yyov#7H{-S);R<e&tzwtx=7*{JD#_w7Q-w7NT#VrQ497jCCk2-@e
zm^50|AHa1pl*Fh$VEHn%fnh%X<bpHKj!dhughAIuDpH&Jo~0b=KDw<{$Lv*(+^_tx
zi!>o^-0`go!g%9Oh(ZlnDJYMn@ZkY4NCQbHug}1dWOuJJdO#%#M_Ro4P$vjxIi&C6
z^FV+Wi3p%jM>vbqZH98iqjpneSIm0`V#wF*`{Mq#iM@Gm&N@;U(tf{(!Z7kP!4ub<
zE!NdK=mu)p>rBIXaZaEN%#Tc2_*@^kYw>cq5&&TZpt)wKV~-*BW;Fhe$rDp!GERYz
z#*CDIgHI7a@1e={JRXd<&tAjCdi{&T<3$06jNi-AVXxX>fALyPYKt#!tH|s(j*;VV
zye&1=XQDj=enedgedUe7z_Ei<(XK;Se6QU1A`HnQ4Ji&9hL4fq`W0B_x}Cq&OCW9}
z^-4j;R(ajI@sfrA^+5Aa5h5ZJN*~AWb!Jv^RDQxD9)LpV%DQBP^WTCaq$wFSzf>s8
zsS$ixxM_VkN4+avaR9;1?Kl>CpaU2UYw`_zNIv`E*e~JqZvwrhBO1Mdm$VORN%bYs
zWyeYV?VfL7u0(>urQ1Vssjt_cJRm`f5~IG(PYW=g#Sxx{whnwBp)SZ*J<nl(P8ant
zZU_Ez+Xy>*O62xC*$d>8+YqcR+nKh{mOM#$6q{)6j5}6L2Q3zfp-uf(l?I`}a`Nlo
zwEYWYJ<rMQ4#*`mYV0RpGp+O|Uyk`7ZHJS%S-*c`raQJAf6e+?4It|B>`)ea-=1h*
zH`+e<+MVAC<2{at9eD=k4H8ejjHWf(#iemQT!T^pB^}ET55M!F%L~BT065rmQD$YC
zMz)9oNA3LADOyD%dhf%7W)CRP^%wFoZ>$V(O!b+f7>07-pGbbHJ(L8BVQO=Xj126C
z{D_~kyFHpUo)Q80k_)_+oezLK%RHU)F$JJXt0L;@S&*ReVlQU{Z2+p&5c}&Zl|P)7
zj*z~AWvBEz%qS6~%6~*UTLeO)b{d0H(TK9oYP}W>P&SG$XBP*6Ycf}*9hCsg$d0T`
zUJ(dGt)sPR*6)T5z|0*T=$`<DnBXP)FKrJ}{}F}5dlb2sbKVv}6w3nhnHfM7Hel}F
zC1A7`0Ln;RxfPlLfchfh3`wgb{6`e??@`c?mAy6tD5JLUavotI3bmKZO=XDr89(4Q
zMV`M5w7@Yf8{=+vfrt6GDEi)`h#1zmD*)!g_DR#z1&E>nYWoI2;pO|MITdLi3}4n-
zE(m>Zg_;u(=N6>3AaUOyQ*W+qEni|k-(#ei{ny{FD}c6W#4S6&LuYn8ttvMj|G-1R
z8%*U}6`bznRBgOD^Zgb?K*vtPo-GYbzeu8)QeQrRje=t>c0>cBF3?hCrU4$j8=*8k
z2$(wyEHzocZMBps(2@$k%Fm@r$je%i_^^}sN8Ha<B~38+!_n(7`s^|M*YWE=pD)z3
z2F&__fNSB@QpGWU0GLJ4X!fwwe-9($Jq#;6ZsrpI`#E3|H#Iu61po|vy>;7t2Jq*9
z8)v<LZZL2Orwma#3tanej{|ytoc|Jr%lm9pSZw#^LvLz8pcRK1yjVUQ1FNg{X4Ccb
zzmI+2KlddZq5X_ltPEWHUuO0H9mdl8Z2T&WM`xYuZ1cQZ-`fk7OXJwM+!>)(FUP@S
zw}b?`Y7{a_qg>bjp9nIEI<v7T6Jw751)iP$5Adv?G!&UQq_L3`iI69#(QYl`h=+?S
z8$hY`Gi%%IqZT(k9zm4z+2dHn5)9m}c}H3X!*}OckW(n6@7I|%-(BN|Fv8Vw6?&fF
z6)WW{mU}PkYs-0m>MRgf`PNW^XVsC!d;O02a)uuPya`hYd51XLMQ>_N*XQ$Sl_{cM
zU&Acw!swS#B-Xecq-rUonC$999quag2C7rXCl&^?$YJo*D*}8@w6~V++Sy~KJVaxK
z`ub!vP@28CyBEYZpUyfYPw?h8Hg+QnlqufIf4@E+F^*<-e27e<@7bZ%P^!~rXDc;8
zCS3kL*1_KRaI4o+<27d~HpvdRI}uxmXv19ZyQaA%;3=GVHVYu3A8)K?f0ab*{&q5&
znx15=?Y*^GMs2r-BI_nstX33evzf;TBn(OU^L%^4i?i6+(RX!&zes#Dm~~C!0S#K@
zJX|P^1fW$$UEjqGzElz}yOJ0`z?EaPE5Symadc(p1V*>lSRb&^Y1MO$J5efR5=3^l
zk0NjJg-g5a;}*MJ?ILO~*acYsb~Kb2T=C7nC`+!&u95R@iY5wYxLqBKX>+|}0L~$-
zM=Bi0kGDZ`8QQ~zy8sO=#~uCf4dNXy{Q=4KfS9!~fnEm-5dP_l6?~<3`Ln!C&c(&G
z%S5ML4-1eyBIe$<htMy!E)VBuYtB0TA&M1q0?diI9U*sy6C<4wT+i8olPTTljC9do
zzX<HAwd{FnMn3Nw-X*mPKpfq`c)6sG`a3^u5-*}eZkA8P44aO8rbLy6Q|~K<U|KBx
zYCEE~I?G)k6{CJ`Uy~F7^`epZWdqi-#Nm*s6UloGt;$#Qb|#(CvNd$Ix4%+MN+jSJ
zG4_O<YyOunEEUbKS5ODK){G8$;64tjM)v+GtudF;vp<TfcGlj+V|#_0?N|`!=X9a)
z3rNj=`&cVICv?G94zFj;$iCdk{1=ci_1R4rWV`hZyNPu`xn%HekiPsaU#`ccjKJ(`
z82n5jW&DS8(Z@T4i-h9a$J#H$VbIQp#$(OSn|wr-4E9b0mTVWokMt!*%bHPEE7@R3
zlea@NUnlFVG-Q9Se<dio3DNhDxFZ(G{>sTKRvzX@@9kTziTNrh=X~BNJX>lOII6{x
z=kVhb*XKJds{g~@TSes+bjzX%!JXhPA-D#2w*UbG!5xCTy9NlZ!QI^<xLc6m?oM!b
zxy?T3j<NR{<NPo8^}g}3SpBsudi9)Dvq~=Yhi654A}{@b%j3cTRjuW`xCJGfn!|d8
z6d)i}*-LDy(sKYBw+G4U-t@Be8)PI{56ybJ-WOK%2k~XRx+rRv2XO-eUKiAY0S>pz
zYKaa2Mcx+0`mb%WvClMm6+Ga_6L8sYT=v#fU7J^lR0#G;oQHR|J{TMgN={kHV_$T&
zA@=Cw^Lt(5j2y7`9HsnT<F`UQe7I(3Ioff=*Ims@*^`c8Et==A2<A7LE-zEdi01%1
z|M!C@i5(!CV&dZF79zKpB?2?Iu%HhL%z?U3<eo;812vE>3j%(*uw%YFASV&>zj#<^
zhz?8>Bhfgk<DZL*0BH-FR$26=G7$n3fMMN!P=P^l0QM(S%$M1lEQmbw0322pzF#{F
zuf!}Yy3X@fn92dYH^mskjEBrzW_%DII65k%VQP!inZMveiCGE?Zn>4(*^2@=dxM~#
zhYW?V`?Od3?0(su`3nSQ#<v6-CuBkaw5-eSHa{Zxk_2k{9aerrQeRXAw6(3D5lHwR
zXS^?u2Xd^$8$bOEM#*9XBjCkCH<p8LDyt6Y-$aRIAw;o%r}4Pm{J`B5(E&E1D(iLL
zt&#Yn(2A@bU(id8N<Gh8yQxxb*}|1YZ-|zDxsG8UslAyZe=&Q4{JmzgD||AoWL8c`
zUE;6LF%T!K-acCG&p$JR<hDId_S~~A!joN2Pf7n0@&CMpH1xbZMH}I9=&ILhwlQ1P
z-WpBl-(ahqDU!(Cn5){{5W3s|`z?VEgi?#=4Kn8EU)_KVY;)hG21;;|5uIwy79bXZ
zOU79ZWpqZinW{&t=NjJv0?*Bn_`KbBu?!*|u=x^DuI^3dP%>yYP{~|>6zt_W5C8m~
zCd&FTBzAX{1o*LCdY-;5OR4KY4(Z^syNA3J=MQD*K<h?2VDETteW<iuG*T-5I={hL
z<_HQUI6XHo2<{O(wnGyFxSrwUt0?q8ib->>U!6e955AX2+v9i}>(OU0a*af##?1|{
zX<q*lbN4xOL%No{U-jENg6WQNBsv291P}xg@VQ|S$aa46xU~r*<iXO`)&|y2*q(qb
zDDfxeBN`44fPax_HGr?FD9A_jdU?SiAc#C%AB8V2F+tH-SXgxQW6&tU?wZua1x!l%
z`5~5&KIWjYw5T9X41|JY<nK!nox=7HcKLFlM=Q|8x-5_4B`A3WOY)yozLYxH|D5~;
zzFh%xw?I}jn;2=FD;}CflG()ymUBPbc76hOu|`K+N%d=7$o)#2chKP#9;tIY9cLwH
z4`+=rV|tF@q%xH(={$bE9P{-{Mc>k|5++^~yuigpy@7(Dxz<{|8T~z`IX3G+TYnfF
zxvBu=zuZmXKi-vvG+pmm9nRW;v{f&DNSM?wKFaf*zu_z}H@G9`Tl3ZfG3_LS3j1rv
z;Rj()`Qc#W>FVu9?}kS9`TZcdSzgBDl&z5Bw6|1`v?GJmRnGSyUm+%ad88NQW6R%X
zi_dN?b`g=bw!;)RA)^`gq;3TQ`v$Rp`T^${s1&%|!*AcBQ+O(f_LiqL>uMD6-(Mbt
z2FFt3$~M_PLD!O3c71Q4T@uI(vt@;n_{QsYh9R}LB3=P1_%_(@#G^d|<Hkra_%Jz{
z-+)K*Fdw5*9FqO=coAmv9VOmKt8KS<Eoo&}QX7J}oA_!s2tN&WE^%%0S8;EcFIzV^
z44b4UEkWGrY_%%BogKIv+a_{vAih@17y$@M`k7ifHgTep$|IHJhE=^k;UAE-s$7@F
zHQj8`gWvZOUKN=3-?F;GDeZNJaK9j)thQq-Af_JVl?q$TRSJnJpGxeS1OZ*K9PrkI
zg@Z#|(EV{AMC{c8ex=Y@{njyEz?+}*v)}fsFOz)c8_sS2JBBYA{Pg#-z9Gy8eI4E1
zQQm+5eKa-ME`<xQu`?8Z2fwP-?$ydEUh+zu_@d~dIa!4csnU~(9LS{J%YY>Q5P}h2
zqewxeRkbpNniw5_K2CXa7)Vd~WfSR6jv9i)42w4GzZgXP`=`vQd8r#jar?GOoHX2W
z$uuCWa+;dwbp1!Re@*0bJd)gDJwQ?;HB)&IuvlB|=;;}!=B<gZa<T->*%93iQw8t^
zo^;>Taf<c$6KU?cMF^vBaL5Cnn}mVc2B_o(rGA1)h1Y^`fDjOT@F}uezTX4l7!(hY
zEH%<e`)szMR-DAE4Q4YH77Y#V`sZOus+dhUNc%I&O|~zcB3m@-sV-FK>pd&W@^8Y&
z8twN;r#k|A{4<`e36jn+GrwI^sPa13pSgfH6|@qQ_m7lV7ESR6Qs;DD$po@1?6;Ug
zzCsSEp=;G9<HZ5vxudXehLZWw)$6T-1EjG+p9zv`6ney<hbd7VkCLfQJ-;-bZ}*5)
z{IiZcBgeCReL|(%p{%}?+fa;AJEt!VM148}ZKh5zFU`x^sIgj`9^-R;G7<_^rl(G`
z(4(W(p=k5_BqmKFx6;CCbBOA7FGFKq>i=ye3uJfhKJ+2pbm&sTYz@aE+_7xk!U*=#
zr1Ci8@!el_{sN5DEK~eYL9su)0nrg;b@{_-zOoqfg9L7QRO+?LPfbQQr8FE**s^jE
zm^!%>T#~YQx@+0M^Q&(P1sXTx>#ZYrja7Xg!V)UKi@AkU{hJ{W*%bgp8-QQ}$?79G
zj*eIAi7?G|_9PJmWJOsfLtu_lXQa8(&nT=^71`iPDJjMMtYtcyRe!~`k1w#t*mSv}
zIjnq0Wi3Wz#%(t+4hv43LnkT6{kKt!9$YqYeZS=q2KMjoBBx{rFxTkFJ>Isu4x*kc
zy06DT(x{@*B&111WFsxhb2}c8J<Aj<PUzuW69@z^rp&JI5|1=W$@EhnrRTK%q_W4}
zi98eRHXDa5=C|J^wK;qLL+(<7EtY9m;Q8@glG(IGBUwO|Q!(j{Dp!K?>ytz^j`ATb
zP%pQJi&^antE|#~RGYWm9zmdgtxRum1Tj65wA`wS>?0PV2J*vOf6>namhcZZI0p#r
z9e?Ift034Z_%Hg2y-BF~5|wg)b`l<t)$Jo2UCiLi>)o$wqx+oZ2?p#^p@b3dM%Jaw
zbm!-XpRp4E*=Z;L90>o5=Ig?!6R+1JB-f|!Y{wjyQ@<^JKGJrbP8yRv%Ji4KQrf$e
zRuLIIspXji-~5I1+C-CzR%f#?!;$M=g(-^3MQy8c?N>HvpV*tJ3SH||ZLxq$Mx`!E
z7qu1)D6+&6yrmQj_*dml{b}gE{8?PX_~)Gn+0(!MGo>o{_E@9+DBO1|Yop|#pwJIv
z#KcD^1Y{HSK~<0b-(g&^T_BDd3HtfM{k?OSyz8I?o`GW8!kKEEP=*t^Qi&|a5o;A|
zZNLC?4ViRv*u7I9UWwQJT1Hft3BWX<vPgtHx|DjHF#n-;3cw*%NfYdDiuZk|Gb3X)
zR`e_^muYBW;g?KqHZ9l_FXy52{41Q2VJ}CNkfa8KI;f&(m;u$_JIiaZQEQ#vF|4$r
z6zqhLjn-?IZi1>X>5s*Ss_n+aP2>Lll+g-TIcA9Y`n$|{=FUf*|9&zVN~ZNWsFYrB
zuBK<%T(C=u@H^0WP<!3-<6YvhSwb73jj!Y<DJsN})yaI+3SVIQxXij-@L#k(N%&st
z$vU1sS2tbBmo}pv6FErNl0venE0%&NY7w^@&lcOeK{kvMCEPz$qRtzt)~x1BurNiR
z<2HXPGzdS6Esc)j{M~XFVlmb`$w#76EY6*G_4<<X7MQm72jm0|-`6$0*4%Gv25}h-
zZc)$Gd7})*(Hj{3B^MxnFZy$rAp@r1Eo-5c9I90yo%T=t-cY@ve0m&-wHdW0j<ZWV
zBuW+In$7>+2q(OO`WS}AYBO!THTes5uvm=Dj@nQx8|6g4Y-lJ)`A-wQvU}e=S5QhB
zqin)Vhn%_b#x}0jat;F6miA1!*2p)QpdHRN5ehxW+N>YCayB>X`D~&NQBLbtK+>?9
z)V}P;CH*M;R-z1uZ(sh+HQ0WLnLr|yW}`vshfL8dR|+m{5QJ16X723DO(h_WPC1WO
z1La;Y*x1-;YI<;mdlPw~g;-q%Tu47YP;=gI0J8Z8o+h(s5qp<GEd_YpaO(SgprrGK
zU#1u(SzG6gkUJL}G~78HuwaR(ybG5MZF{)p$(4+mGZE(xj12$do`neVUfFPt?I&Db
z5cGtp!<--EaDO}7cGrtY*x1T)e$D%dq))wh>&g8K_cE1vXu}ml|4TW^*YxaW487IQ
z)`~E9|MVP2{d8YtNM3n@$19=t^cs4XHXIG|rh<y53+3<F(HfVRrLm(ZzI~q5>bss&
zvuCo%b^VNTp$;4(;izLMyQdW?Gg0lWbef@m4JL394Yfs6X^9(z{Im@U#0N4NIFTi6
zVT7CE^gO?_zHWaO53L@FeNM!Ig2(Eqn(PNL8@f8-c1!~`9F>Y8%eOSsmBJ#}3jxRH
z+KIA%&Op{?xPPmtZHqXi-dd;^r!9J8H+Ksk%I0>9nMFe`ODP-eQX`MU3VvGzr2fW#
z+_`HCLU~8>y5GxqSm%<wHx_exuV9@JPZ$;YHQI@2vBJUpSqlO)nPc61^PMULb>as<
zb1B-cXslOqe~RX6`UQ`yblBf?J`GXzFud;#RfdB8QYM_N($sQ;o}iHBy{;rsa269#
z!B`(8qa*F{?bO7f<8e-owGa7%)cQ)tuzOLNx;o7=2}#EIHoi0rKdc3GP!fzF<>C8p
zj2`%ZpG6ORy|`k|oR~F&S=T@>hv$C{VJ6evuC<yR(Z4k><S>dUhD9iBlra24=8;1A
z<y>FNaW1Qx%(aRWcQ6L^+v^F_m@J+Y$Y~jMV~Lk_Gm$B3Y;6X(Va${blyFo;FV<7j
zV9@#vWD5T8Rb@c!P^&g$LnNK(w#^to!rc5X>Pkz4d&+sIw^EZqtNm4E9X`A7P^xl~
z>f8FOeKO0xOH^9bkk^(gKi8l_$Gj8K$*|}}MFxqLw?3jh<q!RW`9&MoUr#0SBePnr
z1jvyvsamZp=^`HT2*xpQ(~yRoLVWI<`X^QwNRQR^@XMB%-%E6`C(u1b<wVCkxmM#&
z2Hawz&z}c}d@LXz$Nc?VR!qCiBY+M=ulE;kLv|3^<Dz1VuEJ7ou~UMzmPjBXZk$$=
zE2uC1uGj~qq)LSJD71>-IAMs^Z2f#)!qCQX+bs!9Dnf_6zL|E^z6#frs@H|=FH$n6
z<oLg<vV(#A$<OdD85EKK2n-CNf<M-j)@#v35-md1cdGmYeW7fz(xMh+Y{!uxx_wdk
zBPb}x(Ol&AHd`z-Y!{1%?HXX?8@&e{RLnh4zu>n-3O5CFKCX;oJ9m1CnqcJom)49^
zDp!zY!DzNx<0q=vSyapJhZ9~eKeKL$(733lXYKr;pFmJbzew~K;b^cwxz6TJp?WbS
z8HE^nao;zjo{69a!BxuX=9?du(}S>CHiwDXN;gbpkX;553N-5eUjAb_V)nPl`@|Pa
zvQ`Ihg}OGR1}l$+3U%=8<%k>$n@5Yzl1cOurDi03Z>L<I?&%q{8pFbHS;#&_CsW(`
z{Tu_jf}ziRN6h2>_@5mk6BY13yH0vt^D+H#F12fTl@!ur%J{nc!Dzp4T_i|PF^~KH
z`XmTW>CCs^QuX&+OP*Sm(3S?*3kvvMdaAF&4E;ho#cUvX-%GiAs|0RyfCQ2jX6)Ht
z!@LDAPp0ndcZ;Sh)mSMemdCaOp;*f1pS?#^ATZ<EFtFvTJSVX%a@vh7)wAi|E{E8B
zOs44_433Ku*_8wI6mPJ~JF<l@C>@!ip;+UG1F2m=h{mBo5lEE1idi2n)JeD0h`U`M
z!f|kLMALMwK}vjn{9KYXtY&+<Cd86Qn1ji@Q>JTcXZQZQ9BvpW|7<N}?|OPA>=qF_
zIXPvIcz%XcvNBfy^u@|&piHC1Pc#re)4|d4jT?FduCqh@YJH5=?fcM_b_p_(ugIxz
z+{Y;W#u`#Tznjqo$;K|UXcNUevd1PTCO*+xP+|>UzDKXr20ATC545BnUKPtl-xUnM
zgSk9(&BG>7r(*>k=bWHjoUp^`cmCY9k!;r^&A{y}8)>58bGR0%J(XR5ht4{$=_ldB
z%e4?VuR`s7htkd3x!2l}tBPC~O-?&lE_*|43bi&nwx-Kt|MduDn@Il;g6oAQ^SR8z
z{z&b_E%)=S*4{r9g1H#X2Te&3O}41MV&LxGY|R~~#W9$ihWmDFG8uP5l%nWFBu|%^
zj$`VN0O$ewmksWfW)F2o$!d@s5!-ux@c#&FZ#*i5aVI{a&Q`_hKz-Oe-y2f7_Nnm0
zvUn!#x11#Y#g0x)>3O^ZP!?Wmy)}{^>ha+NGLe9V3^5V64HGbG>rF;7AAwa>QRF&g
zIO6G?bVnpeC15kUVoU+}3*7-VpeJviW8zHMzZv{S6M2d>E;`IYAs0~5jJ@FW&*v;I
zuoxS_LfUjio1>kWTo~sv(!`3Sf3{M3fFdvK8`2%lh-_V-?wG`QZnlq;h{(u+t*xzj
zBCkI7LWQQb1>)R5DukfH0hf?M1`Q1rSr&gCDqz{2Q753(^sB+--n!&vFqCWOwbrR7
zp4F@N%o1gI>yz!~y1^8+0%Coh^hRG!5Nyc8Px7AY_CNNVp9;QU4i$qOe%||Or^7td
zXDlUee)PAh<xb0Ishm<v!Ea)v7@W~7qxK3idYAlF$^!A9=K9H3QfsL&HVX$uhNqAx
zQFwiYAD?y^Nd&VoxZiV~WYz4V%5Wr=6*_D?(C8IlgR0W1&;jLxI+I|!q)%Pl)4#rQ
zrlaE~1(7rw>XO>(i-h0fVpQ`@SvKIF8U5yef}~=ubY_gBR(r3YBt_#PORleshRfqc
z*7De&qYS+0XR6*IqyF1*_>8hAm@0i?Br_dqzSa(}G@Q!+E&^yniF~wz@!sIpV}Ljr
z*Dh3Rj(<Y{mfi<<GC#+&|2h%>liXaY;+K-Rim(!u@=Ub1+M4AtiyjtV)it?<HKFFK
z)ym<s*$VC|ATVnRe^gDPN`zfq^mfQ?S0&L+2XV?+z?SY$w9+CU3BX=wIbo==xVLd7
zM7LKEx4@C>)Y}D6c^9)ad;jrxDG?MKNY!mX!H<YG;2Sd+Y*#G~K`3;Qy<tQuneDwQ
znU(*o=gDfZg2Pd+EwR=REGeAosey8oZ9*pkFIgIERw)93iO0I&Z94cUVl^nD_pint
z0~FG?&s|;qQ*=05n3in#lZI#r3XgjK#0{GgUG3u*bAz;`$6={jjc8l|;5B;^ly&YJ
zAS2L+0zkhWN<zMYUOi;?WCdYzibh*Bj*dQ=FJ)Y*hQrd|nv*Z8-Yi60X)t)3J<qj)
zQH}H!(a$S-cJ$FQHp~mskj{SdA^k`_%e-tqKG39|5iWr6K$g?5%XWkO@p-50*2Iza
z8|wDwP(@5)v3x~SsZrdT_3;Ai``_j{4ms_koTYOum@wEuBq{_PZ!|-ujE_BJw3=iH
z65@z#QWmB<2GaSWl4%0=#6Ub=sm1A+-M-1xl8rAIAK1gvsVgE?+?6T$hR?8R{GESf
z5Dx+WveF94amtrgHv|R*qJB)?1y<`o1%@wvdoo<{(kOOG6TylF!3^cF6EVV#t>WRL
z>Ifu-cBwNfSBOe29|d`2tK%T#Rk8Hey1pKwb5hGk5k?U1`jbY8h;by45z1ofaB}+v
z_y)z7sq0^=G8V6(KBaV-79;xy>R<H9>Jzlv+)b=OU5MTnS1E2H0a=sbtiC*R{IA;?
zdFz2E-o2VaZ)2G!964L4TFoo{N%dpfQ5s}SNzU-9$UnxMU~S>2Ya2xM^>Dc8So64}
zx!ON2Q3Dsupk@b30J^NiT5ri_XuW~APoQI}0aoghOio)kh&Of;#0W)M4@JCA&El77
z%wBX&H`N?G*I0Q$jVSir5%i1UPv2?cMAi<A2E^M%+}?xC(x2q>8XUHcj;`fqXR)R}
z;CW$q_`(q`5UdnE+Pj_#)Xp#<Q(ty?&3MEk1)&aZ8AD3-yn>Z3H#5QpzP<#vkm*nB
zc)Lf?U7kkW(mw5EXsTEm0Lg>Oh?n~Z#wCz0Q;Oq`=ao8yXL=!ax;^ceSR%8VC8!m)
zR`0re*<3Q?3<7xj3@tj-YKtR&Q83jnS|^Vp8}e0uiO91+FJimh!MpixeveyNXb!vW
zVIoSK=Xvx(kAigH5bu(E07$@+^`t7X9rhC=nhM1Ky#i7Zz!5r<jH()!Hc1VyV45FH
z{mTpm@c;*qs*t)V;&Qz6Jk4`^l>o})zWu$ajV5$badZ3uK}`E&MCam-^=MH&2r9GK
zLkI4FVocPl+zffty@Mw%0Qj5O)ge4N!4Gh`{8~EVufI4^@#KV4^7sY*q7stE!E&YI
z*#>ADnqdy2OCp&l0>pDHfBC)s%=<z~SbFmdy#M_9=Jk5{(bjMtblYce?=8*Mzk6M<
zObabKSL?vp{M-KIRVVnHI@k97ZmG<TlBt3Ne}ILVUwB;w#R~SSl*p$GnhB=7ast?o
z;!$hj1;vC-)KX^u^XKN*>rR%G#tdwy-@v`SDn)X$Fw#ImdgrMah0-^q;%i1Z3LpuT
zk34)M24{AiJbo==5UgpX+>{8ULejLU2b@EGeYfz6EZ3U;{*hP*N%LNKXrU$WKYwn0
zy>8CKWnbi5G0~BhchSD@;#%p&7S&=x{p7`Y_XkXa6aw~B@#c2t{dC7KW9O@f^)1Q=
z8l=bP^$`_9MwFQf=;Ic*+*K4xfq514OxHHEmpy`2`H|E1mvJ<^$|;}!A7=lb<c0q$
z%pQyPQwQ)M$h@vfwrjxJ56y(GHcJ1;&o8gnpB?Ec{y%Ui=opYd)i?}Lg6{(|&8Qd{
zKY%_5UeGfzyE(nNk#KS0EZ1!Go5+(k02VDKGo?wkh#bho{9zy^wFZ<vB$HXG0Wh)#
zsw_ZJL}K`6_}ZE-okl$(3<{AbDD52wC>|#d&j*EU(W*YPqE|3|`k|dnf0SR8kkjv^
z?Fnl-1k+bBWk)id^UPS*{^TD^!(X^6&c1Rl!nruAkZ%vjWF9yCp#}{s)OX#bq)!`5
z6?ue!qr{-q?ps+XS-Q{wwd#FCXa?jm(B9pD5UVz{O*Xn~x>9YT`1D_@E}dOI!TK+t
zSUzBFo3`hcmcuIBE#TZlSMl8uK1bK@txz{Kut`<uw2O!Dvqb^BnjhoN&j|zdWs7?^
zq=>Ww*8zLZ!QSQsL0rl6k3hsck;{Mri%~nQ<gz)A-BMktLV=JdJ$)eN<4}U8IJyB4
zU2E~YfKJ1!6R%I5M?>X(@?O~Nen5duX@@nBujrw_KbHDM!8Z7<+{c#zSu%q<XZ{Sv
z>8SVqTl8F|8~r)PKoB?5L6-Z=iV?q|lMgh<|7sA6FU46no<NP+N_p+2_HRE5F=`tL
z;z8H!+TU;u$s}&f&nh&b+TGBko_&`_{W`5Sxc2V~HX)ZMD}liZ){|BsnR)r4(PnK+
zmT~6B)1ouZxb2%yh9iD@v3xI8NjncRy)&ndus;#So9L2;BLrGssIJQwBRuh)NX%CV
z3gw&elCMpItlOUYEK+A)v06uj=l-2hly_GLv;DxGwukcO;sQO>HyhgB-Tf^c)#Bg-
z2w=yG6e+73LB%V;acP>vPCz9Xx~}NoRIYGO+cd@<$8Z>vLXbg!4Q~tA_W}zTb+SZ8
z_FWzyq3S_Gnasfecl|g-RNx7tz>%Gp2ks$QNZ&gq!<!v{cexc^9gxzw4mkAQFRS*%
zfiqKZxy8Q;ed|n};bp-221+T9+tP8SONesmd?K^)^rxqP6fKtO5PA`?dhVevqR5fQ
zY!|x3a5y}T=<wUJVbtRZE~8xSy4A;tw$_6KXjMKa-d`5#w9=6Mw!)spXRZ`Tb-Tha
zxIE2P$=rCy$Lnx3A@&A299C1kmE!uvP3D1cuATT>i4vx+$fS{MmG{frR8B8~)`!c!
z+JECHH6ANty;&QlUjQ}WG^@M8<L*-onxxbEgjnbs*I{#0Jq>`OgGF7Ru>Sexy~X})
z-(_#-%On9Wzug@TbGc~>7N_GOq?LBFFS%5#?&i9dq)0n99VIfc2+ShZfZ&=K{bG~;
z!{fgiliAh}ynPQpU)5r0<<HJGB^pp1`ep{g3)N?#V}-L{PByFYBUe$;K00xjOhfKQ
zWb_>!a6~717;LYEOQtb|&pAJ?DO_5OtJQ*l;75u|`Q}8@#Xu4xM_0YXKJ>r@Xtcjy
zfNB1Z#v8cr7BqUdGOG=mUHUKMgb(YJ{j!HCZCn_*)e`;-2@x3q8V}EsX{7Xnv&A8y
zl%s3+jkJZc<<xGGPL(eFWlkV#RucaZ`4<o^aQ9{z-KG~Xn1BR0wB7dLM^?o;vu~IC
z(+ClO;e5Fly|;_s-Tv~7k0`p->aMaxet&zr252Oz)rP^G<-lZf&AjrkAZ2Xu7j39h
z(bqgChdue>R4#M?-lF%fw0YvUKc0uqRrF#5Fz_!h*{QeZh({z2q!ELMi-j!J^nU|^
z{pju}(u_B~!K%16C<#HTY%r1-O_kKYCSr@sK7U5}*4PpRYPTETe>68|Y5KNMxYsQL
z`OhpL*pl60VWbcTU0ey;B}8G!@avwJDrYPk1^Sbhm!<24<>lF9WDDjF2s8};N+^ZF
zTp0{`CR7D^G_flADzU2O=H|`)IxCNti{YjqE!75>7l9@F2$qV3W_wV)>w4`v^Zmv%
zz49pk#P(PG_P|csJ#aLC5W*WJkr26_x49fvtF8Ly-_mHmsk#KrT+<1O=TTOD(+#Su
z7M=EvQ)U)Ea~6op+dj@QU!KeoV>4*3QAnZ`-gdnCUWUhZcDgR2*<^<cg_B7(r#I8c
z;$*SvYmfamN540OKy#{05qo<mp}z{fKl-l5IiVm3=CR<Rdt@0Yw!mW^TeY!GZVHy>
zZyNWz(JY1rr#l)IcQ-*O-@s#fo@~RUuc|4ikun)Vdx#m-uo-;B*I)dZ&01gvCiA6h
zoLug2;p&N&LwWDc{W1qg4xTxqqJGN4IA=LDezIe`!Tys6`n-P0<-+B<2Goi*vH!ir
zOu#YOn=I!ENni*rJTjkm7qK@WcbPz>OF~Cp)Vs#vH^R`d7Br?!<@3VRJII#L(Wd9e
z+9wVR@U>_5T(_v*8`}xBAesGR28lU4s?}w2^QXc6h+X9&!7oH*R9n|X1HZ+XW3BL?
zUx+}`?-|LO=U11Y9VVY>7Hcb1j3m}E!h#!O5u3;N7z)w-;cqY>=}Cy<GJOF9JWG@7
ziP*0xvuk!18=XRCjd2_D0ZpOCNEQ+b%C<w$9}W)g@vq8!_4hjh_|?pVB1~H4ux^C?
zc3o#J`|Uv}X=&-#jA7s@2phLXQm|{S3=PRM<aR@`8UK#bo(ai<{pP_}zHOBxjz;y3
zJ48&|WxLA-78`VgApP}s>$ICWr4d5`7M#U7!U|fni|Bv58H#BMkD@&@go&t)1Xg^_
zdWo(DTLqZzr4;gK5l@+Pn!n!;##8wk;Kv@vw7Xov=cOcPTGbWL5!JCS*Q;0Z;#n!?
z>$ObUgjN6EoQ>Y?ReedasXstrG^R8y(>g?U|LyCqXSsrF|KyQp`_Xv{*r_Zx1ytt^
z*~B(9HQKpE5y?ka^1Ln6sOyr);%5yFATe7s!eS7u)IV&fIyG7k2<^h|1da~fuzv3s
z#N~6<e-)cpFA(8#SWY0*-m6(=Zak;Cn`lYf*K}F+kRanuyrWT;DAUbAImTh@B)t9*
zV^xZJxVO~6mR!d!v=<^tu;PsR)TG+k*T&c<dlhZbZoJ5VObZ>3hfFy-KG6`vWA+Xc
z<#;8?^=W2_yk6vp(-8azsJ8QBdFAxm;t0tLFTy&hCOZh{#LF_9&qE+n!77a{boW!V
z!f3a;1c%ekX1_;}DC_MKoEigTO<(c;=}TYMVA?cy)72C(e*0cth(oCWk?7rdVc|*x
zau7;W=Eh+bdg7cjIrp4{|I?4$6a0R3<WH*WZ$mrl_qI##tg-`dg5F@7Rc>&c;=S?*
z6B83{tOL!ai`R#fSRTI}_=Nz{zy~rizsSk7vJ9_#sZm;ekb@+V6k5TW+H25h_iC{=
zHV%3<EPDpBC_?UW)QSMpT@v(%MyfRY^S+JaZ5SwWAdySw^(c=ao`R(LqSFo>Ydm!q
z^FLB4iTtj+Nc7>6OJCo}p3?ecj%+9VoXUmD>w(%_;|Osw|4?8w|H(wF2CwbmuT9Hp
zcu=Hj;U64iiF&!4-cf<)!sfE<2Qvsv%D-t6L)z?>HPt=CRR))b6AjH!$4lNm%|X`(
z;RQ}Mzn%)qhJ+<y-41nX;M+X{)eVe?dr}ATekP%Z)sL`dFxK{cfaavFx9|_4+wIJ9
zH2<ohtgs0dYYUen*>xoxp9A?jF6?MJ8$NgfAl^Z&bGxyQejo474l)#hSiZa1@ejy@
z%2p{|+q}F9U5Mn)K#N9;uEb{|5le*4C>(>S^9>2QA=0IJX#V69hkg-36`b5lL&lfs
zH+*wrobr-sa8XCAtT$Xa{#8|?XNgHBWi3eX`gc*Qn#7;|3Y|7#f4gbDg*<c!tiREH
zzm^p63tf7=!l2z`0|<wtzojm>TB+w7HHiqk+O=2>5_>%geKIBRN8$g_pV@3F=OS~}
zweX!e@sK^*T`}sWciw>VEMmK>u&XT=gEnso-*5t9=3gNafN4*0LJNj{d*wBN2P2{~
z+kzKb;at7`yB)dI;B`e_o2MmAiwN}`V2G_}i%6FLw{wq#k@b@$sp<Jq2}fnwDqQ&d
z9F@}-dSFIUr}}lf!vDQtQ*-l$iWEtf+tq$c1p>`Nz2%U-iu}^a2^~cm-f~@bPs&t2
z(~UYlKK>sBVUFP(z@y`>q8P~`z&ZjMZno#hnbk_YcQBN!Iz_UwnffP57khlamdB5+
zkg>1jeyhoz_xoO8+p>MaXlHWy)xu{irDl#SlReS2t1(>~F%~U?B>a<fIKX)`>w_wj
z9nQk+bi?<3?UJpwWWj)$l1_sG5*I|GTw^R29*M*6!H&d)Jbp6mkIj^_FXL9K&5ro-
z)sV?)8oy&^;5Dk=m&fLJj4!}X^6}-K?KOns@EQ@Iz%|wzC$N@pMJ#}jn0}?|NAN!=
z%uU?6#80m9^;I5H^cr<>@uXB>C)64H8Gv*wyF?p);6!C=+<lL9yIN4TSfBOlue+3U
z`oukW+M4cPPM@E!0rY8JB=?7telhV3HAbvT!DOxl4uVp)->-v9wZ(`Fk9E?;YE09Q
z;2V6rP}#jBY8`caAjT@#5gd@teLu=PzL(E(r@x}cHC{!=;{9RxH$<#(wv-fW7*<HN
zgJ4IN8NM@?6)vT27Rk<D-$(StI_Wy~ea1An-SYI`Q$HgFCW_TcXXUl0e7mD!!{}MJ
zaE2PSpqP>%j=o4jCoS2VX}p>E`W$@-tY7Nc`eihU1ZBt_QjA}G;Q#bwe^5b+y7_@6
zL#Nq*%I9_&Whb)d2M_Tcl7fnQ2MAu@4UHpVXAz*Y7!3;oI*BVRjBFyOEg4`ay-Fzk
z+g98dd3E*T2<4b%_d_q!_}vGXmUpOxt8F9IY%C}UdF*VyA(n?${+@zNee;(;J`5$6
zFG53)h&@IdaB@?=fwIdRrncMb`mTB}E0VR;h}y+VLz6%i0g2_#ZGPmYX;|JK*u|aR
z`b<~{&GSL-+Jdud<|+7Fw7jAsdf{BHIfq56_$Ox#Y{Uce5@U+R=p5CFp|l2&nSihU
zjA&X{aA=>MDn*M-$Z)(AnBj07XU0cg2tR;<!jV`t8j^!p*i?fWZGLF)*Ee}k7afmi
z#|fwweehcWXc#y@{DY9Q8Qv{79rd4hk8O!H<^M6ybdS*enHK<6-(&6TpYv{~szt)g
z6haB7o?HmI;Mu>@SptIYLA~2OpMp2Kg^g@C;Dga3v{G4K<6XAa`tO#H@}-8h7CiBV
zgkLXf-e3lfNJMon>p>zPeiofwiN|4CPLaz!MTJMtnklyDNz}ONs0&S~vUnzI(Y-@}
zNEnugof)}v%@Y77ZdD}PNvC^Uuqf8c{Vjy!1L-^kLh?c@c(!QFiS=gugWn!xM<17I
zSS5V*1Lm&qtod7G;rUQAg|h-5lzZ|~ks%NuX=P+(tAcyaV}Ac&56)vK1R*-^dvtWy
zZ0RzI-ri7bg`yaWs%${FAJwxx-;!drUP(>hV9V_vN#V%B4CQ+kEBO3_eOJuEft6A2
z^X$LC2pn~ZV*{|e!~E6p!))gH4oh>HM)YHuj&z}DY<?h(-W<M0o_8(ux3!P}gPq|Y
zx-?2vJsx@zu@!{mO5I82Td^|MhKyPtKOWG=7PC+~dK1^j+WddaE>up3i;?)ja05?_
z!L}k~3A#&RZ~PC&+%9tBSrV52E#%#?Yy-!hC+O;`_XF5Y7SlWhQ}5o=u*P4UUHhUu
zq*NQ95V0Dq`z(lOPzpSqes}>V<R!HuCU39nL)<3Eqri7`r1lBrT9rV9{O%6HZex$0
zq8l{u6>l4p){}2)=Iv{|WDY(4u4`wlAcHO4)Bf=t+9!Hg1$>npW&d1{cb7!PaTVl)
z%2YuOPdr~4iaXF=?+!ng4LcS<EKqAG3N|&DNguUx^SHjxtwe!;DU`2!A8#ppUOeAq
z#nOj_`|Fq~Hm-TlTGR(VTsGUk>(yB+3@I&Sfdc6+lQc3UQ8%8G-;kMt5k<UrVVc~3
zVpseogn~-B9ugpuWZ|@}9|Qv?=nL)cZjP6Sviz>U$NYw5E8fboWOV}4z=#B#sLagF
z9*KjAU#)zBN3&lScOkuM<r`$WBHTKle`Y@>IEyww;=H^S%t;;E>_mLzhC;+E2r$fB
zy!7<+%wp2dmS9y>)Y5&G%QqW1pj^N0u@7nqanY62tLZZR5OFTIdXd`^SILjud9tIW
zAz1bP`%TCjF*)K=*Of7SV{S<>eNp&^o9%KMk_Hxob+0QX?Ybsll?t2hLjD+jQ19&a
z7L9uK$I6dU7{iNXLhenh5-bPTS!4{|`8y=G;%BssO8kn%e%Tyu$FYd*5~`U@X0vZa
zVOrw~feZ>uiNMP-Hh><sTUYsG2pHoR1j`SS={%G}-+SyxKORbrA#VbGO_SMtdPeEb
z+tSo;3#|Uan`Zm*084lL$a9>_lbO(jk9l@EoB6kb9L8cYh8Pspyb?;sadtW;iyHBe
zO;$yNh0B#h@x7++-ONX+uhe|tJ%{+bPGLpp9xkeL;}W{2t$E$8$z6>Cp@zS&6L;FA
z?;)r7KIMk~1KNVZS{QnbC^Ljh6ydau9|WOJ@9(59t#ga`XG#?(j63fP3eFzK6{k$p
zQF>Jw;+_ox^&SQ}hf|o|8SKc4r^QQ=8l0@Q_{$P1Dite+FH0gQpKA!qIe{v+DN^LE
zd|x22oJ)%h`H?B7nAq3X_wl2A(L~HgwY!2ss>|atsd5k+ixW)<t>8k^P}SymdCC?E
zYbfug3-cF_YcYO~p9eHR0&a(&kqU`0-)=dbj|qyE%Le<Yb^~B&nG2@!!P!6gmre0L
z6Jj{cOCY9!*2mafWhBw$4sLJ|?EH&fFkUD1ZtA;pW$h7=$uZg3>Jt%04kGXUsomyG
zY`N4|(}Gc_<`t5)@UPfS8NJY@*NZdWVhM2sr*a9kO|W{>T^X-ZKJA{m*jEzWfg4+`
zH!D!fJrjLMtdfpOa5pUf0mlBQ&2Ezdp2egXf%%J818i)1D^uZbw)}l156LPYKWNCp
zF&t@)<?h*0lyn2uy5oPtde<B|wmE$`>>fCNMk5=s)R0w<L&`1H7{AD-%bv5;WC<f7
zl*s4L{*GwunOg-&pb+I3K4+!nl^rwNrP30l1(^ofCI@^{uRHNuL4IO#3ZcLd<SrVE
zc!Mbw*gSNOig>IS3bHN*uQ%1{^{U@Cg-O|_m;X~*gsj7#?tYw(UicT{g_Y^|4d3Gt
z<9fs`*R=mV=I0MK-TEda?sH)df;U3Rs~isNzZ7@X_6ATL4wng?HYIW!<72)6-#>D5
zPygx|34eCRAJ^OMdVf%~wAcj1M@B|mC1JmvkQD0b>vt7I??Srr%JU<@FJ`8`S32QG
z2*s?>YGx;<Rj&m*=A19!-}})7%GcD_@7Va?>*?v)I5^}o5Eon(E}4StEO8Dh8oY#p
z8F-PB;G2l>zW2}167`a8^F@M*)Kxw8;B-6+Q^3+fN;Vs5^S3dYpFQ|S7ded{(=pi+
zewJA6fmte(tk+~9@NZ!xDAHi8l*`7LIY(rKTXNHEzYtC-N~@NXs9=L5oBY9Bj^1fV
zd9Jak+cFAJUJ1MUzq+fod&1l|h4qQ<qT!fwko2-zMuY&ZD-!*D0RcH}oQQOTN;5@X
zM(@vhBxWWMN+zX}aLl1t41U5utaK`A@+)lr7^w&<w*bZhc@i-$YKdAa^iA$h-MljQ
z8>xH!qQD#fV{`Dn%L$hw7U*nI(>Ru5cGP||Oy6`+EVZxbH<JHrpG3#^aW1Ms3m)#w
ziO?T2G$&KGiCQaj4J<O==F^|9q%!qndpY=%`N^@Ypd_IZe(!q%aB|ke6#Go}$qTdE
z3t2;}&V?&K@+!c8NS-s|i=PHGw!%Q>8_Xj7LHWIYiTGJV!OijkpwQ^YF22#9!HT&n
zObM-f5OQ^@&Wk>cH!bC<5Re9}{q&&GH$Gt(%~l}o6lM}bJ0>=>`37%=cX3lmK(U>d
z?hWrR;hSw)W?dz^j2_3tGwP(TLP_%{d`_hxC(l*KCBO6FA}T>rA~1BNajWLVjKi?6
z{m#*1BtY&FUoL11P485Bo|VMk?<Zlk7<`7N@O5KEfZszfh<T;qZjX6kraU-;PWhIC
zmJhGi=pCpr`auXvq+=+ltM(5aZ4=RIu-0?Z#wgSvSh*JN+6Qvk<)eYN7xyApCKJLg
z9*+l=HVb1Y^Q5tjiLLIDnW2$Wem#jB)Dnf9Y_!W{M&q3ve0ukWuyGdOkhMV}my3%X
z6>~!*k{L@yi7b!v89ZrVaX3zsHnqVjO<^MXCzvlE#C4n61vL4CQ19+<yB3EK$`)(;
zeBL^h5?p)zfDG!$|BXbZCS`8+mgU{rHEyY*cF0zEjG+6&Ejgfio&AQV$;J}z7&RbU
zYU$5@k(Z!LuX!^``DKGWw*}*mh8lEl8n48~dLxS;DlZ#qxJ+`k`$;<IA3HTVgixQP
z?<z7W_;HV4dx^YDGRce-FdqBwI$iznEugO?rXG7?&y)ThNxD+U{GPxZ)MqN$7ovAL
zm!X4G`&nF9l7oO?%4dJbDOZ`qV{Jt@|2`BV0D+=iGrAv)?59pWv|d}y*sLe)Fw9;M
zojH;zNES3EMoE^!YX8^|Kge{9jA(FpBw(ix6|=9Yw>c*+Y1PCWg#dM|VXHHtE<^8$
zV}c;rmJO2~WH5Q}uaAaettOb+im!z(YNbM8O>Qe01EuG%|9~o|(}aY9hyPa#fUC}I
zT3A%{2PE|^iF@Wg>6WF?N9nro76zl5TYY#G1v^FjLK2NAm;j!K7>QF~^%QkBmp>E5
zd7n=W++de$p<=W3nfewW{JBke^{r|=(9v;PGILWFl!F3%A(3na&kXNiQ+FA9l09K6
zIdtJaW6@=%l@}Y=`NDrfc9rLJzgt6kr#c18i7HyCKuvA#WFt!6H;VXUv@jZHyn-=9
z0>!^CqBjI7#l~Y2I!=#NHxO^T0;hwQm1-9}`Ad6N3&`oi8k-WB-vSg^K=P5FquS^%
z1dBaO>7C}fl=(pti&59|2$JIbYRq_fGI3Je;?Kdjd%0Pc@v+s92+{~L`i-IIp5<hd
zzOKub1|KaI&9CrTJG`JdK}H6VW`HGMJo?<kbOG8vo?(h*HaklG)?GHRB!Lnd5g!s}
zh=1<4dBqCBvj4uLnSO7)qsPzB(a>M6B{*rFW$C47=$MWs;21V}qe7oZzDX;B{`IWj
zhf7ZjUR={N8;le1#nPwzhOO~<V%A?Wxy02ELYqP6Ostf%jyQfR6f9<&9D)>wZ}~6P
z=7)?FJV)+@!IP&#zCPFT5XQ0!Xe`!M<*IZB`bwS6w_g*fWeU&S^A=w8O9qU_tk9nR
zsx(jOO)6et=GR=Me23*O6aE*Kc-XcoQ-n*R?SYbjJ^JiZaE8UO5+rTYLy~tH;Jfb5
za`-plHq8?=ns1mK$Ev6yMt<jd#N2rIH64D?{naDls4_ca8kS~&<b?^<F=0DlV1$O=
zaOm*>dwvh8#Q6DiTN>j#Dvf=<PTQV3o2>GOLXw9u?Dj>vGczLPe0Cmp??)XDzf1s}
zz-*UNX|>F~T%A{|%8g`hw9_OOE23R8DCUPj_PiXZe{TCSl1Y|xbiP|4V0&{-h{32P
zY`6V)kFR~_-V7QOx2)fLE^^|*`S=4RtqR}>UWct5msC_3$w!Y5=Emelo~%f8ZirpJ
zzcRXP)3Nt_OVgHL->WVB?$d;ix==uvQmLxK6g&-vIVvt3gJ3{d7%7VaWMNd2kRdtP
z-9LQ_92N!Jt`T%}5+{Vxz%Yq0L6&bt-doU2eEzTBk#8^uYvyNTRDD7!@=Ujnz}foT
z;<}C;D|5r#RNeIf#9zEAp0dGEg}2EISnhC01CsARGXprE(8YY<lW;}FH(=#SKNt+i
zV7#R<G(yD<1}*%zK2W^&f#oNvgvpw@so;P768hIKQBPK0;fGM78a2{U)c@~8{U1Y#
zejUpHwGT<JeHcb0>p{c2RmVg9A0zoczeM`=Oa9wL#Jx^Lk!4lFm`@n%scu=m^6xOw
z_t^uY@3;=w;)BVB5gSd{Mq3)UC}N@{DDXJX_Nryb(ewvo-?e+YF>*xz;Qch-G2~qF
zoh%qtBm!?wrF9cK_=>Ou{iU6;NmvF8RQE^afkRwWo|++P+#AelCV#pB@bZo~iVlzm
zgX%)8#t`;_S4$Sd5{8o}MPM0Fh6NLAjz^j}CfH{NW-x5JB1Q!}Q~1x!km@{C;ehHB
zjjQ8ZnmCKruwPpL<Fd=^Wf#Iw!XMCvMPR`VO|jHqKMDrW4U<Td{>Lt0f-cM_i^Ec|
zMpc0cBr~`w*_wtbl&`+}qzumDpOo7_Yis$yf7D<!_>TQQE^EJD*6!Db$$F~>di&o8
z^7VBf|JN>9yv{;>KAImKl3^*Bp#Lzg|8v+0ufv|LniDb+j0e5_4|Dl{bV1{F7RpS2
z=r-ZK+NA>Xm@50-FT9@j7<r$6`2opz@h}`;nWRtuzHC2%Vv;Pcr~3xGZFry!&kW2E
zTDgGQoNr_#N(2#K2w<xLEEnta;zFd;59(@%kjE)Z$NlzHuf^*L?-#8~puhh+@FEK(
z_PQ0aE}uXKm{9pjbL6*X^s2KCp+{gpXri5ir&&fH{Xu%in{702(HX7Q3<){Cy<?ZX
zR1?l>hEJiX^4VRud92PIWo+D&4#@rov>h#)1${d!1vt>%0-I==diY#J`0ZIg@p!SC
zqKt#RSj6G{WbM4b%cK8xiHd>H)>q9&FC?gQY@bF`caSHHC{?RIHCF+yH{Y2{6tyVb
z>w%^gYVyA8$257CLYJF<p2T{qps#t-q-17NO~Wyj<{bJ-N3(t9LcObABF6SCh{RkF
ztKKiI4t%Xa**V#0M0kO;35+>!9(W99dJ%J$m!m$G?C_DxD%(hao$;yp#-`puaQ(d)
zvu(ul4V(zY!$C!RrPJAGiwLzKN))0T{i{I}qXqaKPq#f;xf9;jPz;w$BY@C8!MLcS
zh-Gbvt#J?S>Xcn@xLaFjz7HiV;n<i5#;Pi1WO#MvzSlEam*r2y4@*CF+K`)PdN-f1
zcnVhvk@xG&!mzX!HhI!UvHy3ILMP$W@0Oz5O-K>XZf^At=x$I%HkvF?)iC`$0uUr;
zUoJ*pD&40k4kH(XgE&sIzCI-vntnwI=dRQDc5jQ_DarzS3|?vB`RwWWwzN`-G7`u}
zNS}Rvxcuk;Q5pz~KA(8Mh>WK5RhdoG@Oy6!M8m?uMwN$0MoI)B6XqINQhGl>aysmx
z29dDVTd(r7S}rKLtDkV)CA(2#+GVl>&4WmRF^fcm*L)ygP;C4unVs{x<SdS72xg0I
ziMmVB`C2!eb&)XU*}@^PnrCXDX{>vA7_LF3QVZ)eat>4>{&}AYd><QJGJvoW@Pep#
zTW_;xn7qI6nKuix9x`7dZja9Ec}?(C=DyDCp9U;T1jCEJRnj}LRU3XGG#r6N?(8w0
zj1GUwWaVJ%ZR?h>IrvM+YP|$&JCws&iKt!qCKduhG4Xz6QQ%hf&qlB9b4MG-?k~<v
zW%;vzlaz=AYd&=)vmLcL)Y%3G&(pjT$b{k=u`^Vfxv<<xj$L|A9`{?+h&GiXf;LeO
zo*kD-r%7u8rHHCYNhzD4JhZ{_0xLO*wSPhO028IPj!~&BbE87wrDrR8GrH0i2CvQv
zzCD2YrNZ1X(^I?EhHK{@ibN%S$z-gW8u{pR&(JR8SodFOk-o^OFCuQcQrI9Hpezqo
zokT_8aIpo!QG>l}?r!pVS{NUvL!I>_B-i<tFk!4XXS~guij4LjYVGMbOh$<go&$-d
z1V&rbiIF4bVIqq+r>^XOuPbpTRFVrWBh-a}Ti$a(WfhC9p$1toM+wUA{AT-rQo%J*
zXDJ%qDH|IDB2)-wOu5b>AHMsnl}I^+t3r+%AHiZHv9)%K_-t0I-j43a5k(ORA9yxZ
zh3yJbGBOB2pV_Uj8_N{hTd1SG@sgC0*)niGSrHr07IS_1)U2_+zaP@jz$r!BB=38y
z9mN4H6lpPEt#`ilhtuVh1Vl^>WdhbKyerldxp3DtjB!%~DLFRlU5{!AGRKv~w7nsi
zo4dbm!6U}(_7_6*WGQ?v*kHWW4bv*d=T}u?qaB+OqN8YqGW}OJMdQ&kPTM=YnJ?$U
zt*bPrt}NLqA8fwSbuEc!i}<@u)E&IP>GpgUZuy>@n*0Vc#>{XLmwN#djaFITzyU+u
zBQP=+SCyoJY1SK5D|~tkdOB%;5sx1HCfKolfA)b&HIroTxIxO;o<P78Z*itnc+>3)
zsm-csW-6QVn&qUdb_cgbwa*`5(Ug%H9V8FF4IXFjXFc5hiv%)OXeGkybqPy3njy{)
z-2~@!d1&Ul%;UU1@Ne_gS$@w`K3i7-u#B)0th9wXg#&Kg3mt3XIc*O)H=M1+M4(&2
zu^5(yA*1nUQ4UUAn_FxO6<_AY(TVj~jh=+z$Y0)~>+=3cfhWlOW4*~KM7epw%c}xs
zQjLg1$rE0-7LL~)JgxPI+HtJS%>unu_N7mVfR{JI!_IOvmj>34W6eLS_*;7Ga})1J
ziTQe~b5f$&B-k~%9Eq&r{W*sdYd(fVKHUXp{$#xFKM8aeCAq1T?{*gn&)nDvFjwXD
zq9D?2ACkSy%iOrSP&s9??+6lDxj1kX>aD9uU@jV^G8{^Kr#KTphVYP@bptIFowInO
z=TJyYGh2}r_#4_A2?SGpar>U6ZEbCdOnMOBzF;pB0Txr0Mk9C*Co5@@3aYOLRW{*`
zP6@Os3;|>gLcM^eq)>06#@|0Of;5?L3Pb~7=zUzyHlUmrN0L}5GiIy5OB2}%!+^w_
zjjiqa=BteVV*Q}woeD^Gy_}&BUhjua97+goq>`T`VOy_cn(0VP70YAUDta_7#|WTi
zlE^dXN*jmO)y03AtfO^45(=;WK2~{d?U72-JJx|}_{4@joWd$Rb*%-VB#9Smyu18x
zGoVrqF&NJfKIx85PMQIfW;dqIvbD>S=UVkzS<4q){|FC+C>I5W9NKT+9;ZzdQTqy=
zrr`RV&I?uU&&cA<9u4c%;^a`s{J=(FwEeC}W@ZZDEKut%R0sd7(KS_^%V1_W)4^4V
z{CGa}?-6&G?Wv#)N-AlRv-zVkG_705^dyo2WkmlF5QQzau~oV)BSX&Mr5Q<KH>JtH
z{UW@#!E`AD6(<#oIq?d9I-HP}ra0^@{KlKZrWO7$xvd~%W3cTf$!al=Xxa49)%uGa
zUQpV>ZxT)?G@9A+z{|giKkp_n6fHA1{yYWQSm^!Hu~%_7Fa1u$3fLTw95VqDATJZk
za73O4)o`nO(sz{Dq|ZPzQyg*?s;qxDh3a5m>05R{V!Be~DKY09p<psTjqzo&Pjd6~
z@&5u&A<GG&ZDJFz4<c@V&M}@B-Uhh_j5?hgtg0aA*!crH*gbNv^fP(pRr*Gp+?OYB
z5emFw{*4mx`ucRDk2ToS&OK1LT1uf~EPyZqU@GxFz<P`W7E3;b&z&6xBS$>ED+H7F
zb`HkL_yBun#{2qEjfhNm9WO36+jg_>v4x><3~5)j#f2GEQ}*x9&ClzBjjY8xd6_y-
zJ{CwDZJ;%4h;uR365#{CzV}OGe>btIPha^Qz;B6H2XZ?k@v!i$Z9F;mO451B^BgiE
z2g^L@GCjd^74F6rp^-!EUsr(5;l%frhg&qZ`N+wy0Wtaz|FW+hkk<~cG;CN8e59R^
zvl4E|K@Pc=y8Yd`hsjJ83xTC28t1&6T*tlT!us_xkBh^<?3IRNA%jU|PRDBkr_yk-
z?j}c})2^OUg!1JEUj&$&EYYfsrb*Wqns?c3$-mcZwgw_BZ?^%DWLRO}XF;%+Zzr0g
zZzR?i${D(9C{z9z;vWR2y%Cf_=>tysP`30<c??&bZnk-(m1+xJOeBZ(TwKr(i{)0r
zD}45~(`?6!_y(^lye~T3LGM3GOU}|Z=787qR_BM|D<r`TG-Rr;)i~UbGvr#CT~SDm
zS^Ybq4^hFLRwDGR7l>N4yUYN`H$H4d<L83p3%dI5Djm{U?Uv%;3opVx5kSOT@O#tv
zdPQ|uSY!sEfVK$vwuM=($Gx!yIAi}0b#EEfRn+zgOCycaDIg63($Yvs|3OlaM!LH@
zq(Qp7q`SMjyFpqyrDk(K&&-<lU2Eq1d}JLsT>G4}&)NI>RSscrEaT7h5viK4U=L;R
z2tS?DW*IX0C1ztI#n6Nbp*DH~ti9zEiPXbR`)D72U4minC^q4hpeUO!))HQ^6<S)*
zfy|*~ttX%YX)MlXStaTwVDZQisJMWyTCVyjVPv|7A?+FEqtt4Dm5;DcfjnYApwDU>
z8~?mH`d|___Vd_I2yTRSbhD>W9`7f|urKdNnhL=F)R|~?cU_%x&wxbGDJ2kcHBHIh
zF&LGkV?V%%0K|Q)khT0e5gK>s7|$R#y?EFri}X63FM^OhejRtmC%Jh9B$`37R4ga!
zPQH;rjC2TBXOiMld;f?y5k7UXI<*Tr=}JM;_dGYp-ih|4q4@iu71?a7kZ<xlm(`tV
zj|is^|CID4DFX)<ka4vQPWmqtB30m_kWBbV0L8|vz=5{KaH-?7)8yzMolM>`|5XWp
zQZVE8lC~b39QWa|Ti>>@*e;?JheY^FAip)nw>cY2X2(SUaC1Q_pDm8N%eRYWEQ7(=
zKVCk))c;)ca(+L#M)$@pzF_5lPrd#BJ>o*Fe>R*3j-`Zb{S3Ub(Y(m3%1KHhWNJLj
zcT78GmplM{(7l7Fx2~2C;8(AP;Y8p9Hm0BS+_-PFwb;xIJMWX@OFE#_1z$SuXm3+;
z|2mYdbau(mw25wap#C@Kr?K|-c4G?{ut4fg^g{0hr*-dS0}w(xDhn^ZdIhJ_bLuX{
z+!-0nyl&x(ZZ^NRT>k051?~K$|LD7Xqb^M&6VNx0+?XTEX+6-ycX$7M`?Yx;a8j~>
zj~Q+6S_M-|fFN8?{G5TKs9XwHM_DF&`hUUc#$mZq@mXM5Gs$9)C<&-N>%F_Av>-38
zyz(Q_T&ZJbC^{hI)DrO{H5o(Ut(9@YC+@eA5<U8s@2~5mAf|^vH`wHs2XWNFr2?la
zsN!#l>*T%)7jqS%%VnN@(G?a(N=-k44`B<wWWG^D>#o3Hq~}49#uq@Nfd6zbV6?@B
zamdjpbw_<E>%p(uX`^26?0g2g$&jzf?^wsjaIb6KFN=7_Ddp1nL<b0JqL?g6H255_
z1S*gyOiW%{^b(qQwuXV)hPu!ub0sB)n<<Hvnfis%T=r)Sq*^!)SR~miPH9Mz1rm33
z1$PJ|eyQ2+!8aHJh3yD0XsP+*<V?_O_259q<BMO{rCr(^+F|L@E8AaAnqzoq^hCUZ
zV;mMc>0F8pblydr@UK(f*K>86d0~S)?T5f=srRL6^)^<Cp^9|ZPs}`dYjeOBF`W(h
z#&Y$~)&zB3o`#|~1t>C9Y=HC8Onl=k6(OP4nyhknPzOWNNJlJ>p{;Xq1hYnsGQpH#
z+3c<w&S_W>A#7}^P15@Wwu>AYqNB>Bt0+d05s88{k|AawG~lZX2+8xU-)-v-ZqK%W
z!agpoyU-gc$?m_=a#yjv@0WMl7ds=&1`Cfhf3N>8WppPk65%wG5G-;_x&bWgUBv72
zl+*J4pBpPpdx_a~Yivir2-%PV_Z_EHMpCo<Jc7R`#6FUdHSbG4?Xcb#LFUDBQZmf6
z>|ASe@FFRp+J0;fr0o7XUKQV=f%*M@UU%sjcA4AujkC?J#F;P+Lykfh711XK<kY^m
zhO71VZ%Oz)noYi7AX8dvlTkLBJM2L_{riW%Ea#Y}a1X8y1Luq-Qr<tA-nj2e;~Daw
z2T~O6!Rl!tHwCNCaz*SaSSgZ8i(f>H>CaDAON};f>*KVbHLQrlDj4qKNF0cjxL5FW
znBz^a`S6(z_NzB&+I|r{jq~5|Qc_l(;hEyj{)3GKW^@bVh}r0lk#Wgt4>Y+tZvEOK
zS7BjhQ9tQCXQ$gZo>Aw;H@sbCciD|`c?b9yHl{lapEc%@S|ZUtlVG#CE}f$WrL_u<
zZ5tFRts9tm8gME?*NW|>em(bog)LdT%1Q1TLBfYYNI3M{4nUzV?FA-lDu2IF(lV`U
zYDS2VNz>S%oI*HK(Hn(A1<JH2_2lwj&5S0q)5}6~XtXJ*sm_H{C(*IL6|-o;gezTc
ziNKM~W{GtEDy^-F-B^-+uL?m6nHCm+R-5lb!Fdvzo48uM4)8};s>b(v19!gF-mJE$
zvkx$03GB*ajYb#j8ujW<MDZOZ7NKWb9~%|$*SMUe_`?*Ky^^Fn5%>s}j+~(+{L(I|
zyB{=R|I`@`0E3$fN%BQ80fpae7K2?P7Aai8(05n1DMq`rci_ZfSLB_zUCw)mn!Pba
zenv}#%4eCXPn|?xAfgecaL6ns-Cv|n&wN6bX#TRL=sC+Jl^2mQeyiE0l+1mLbc_gz
zsy+LV!W*LV{XY9gc4I;V?-kzp<*1Y^r*kTH2D!Pb(Qh|JQ&nXCD2X*rqX%YszPsxy
zLd8-Q;;V0LK1w4FH0mYfKZ?<$T;=^!urr`<Q)6-LO^mx3XWOSmDwqGf-90@&V^!2S
z2@%c>=~$c*`XoLhAWKQq*|hd7c()j<)*9@BH#rZTTNKmfXYi~ktoH584l!tjS-c}7
zfwZ{T0|8sWuD{dmDVgK1Tthls$*^WdoDUiW`9;-&a3!J{<c`P71zK(VZKH83*twDD
zCX0jQG165Ie-~exQKUDQm)m4C4}x&$fVEKed<zr%Z$8_4W-#cCgj#JEh8|b7m(GA4
z!x;Locsce}d?X}ve+v0?Q<6kJNoCTFJyAfGPOPNr-|T0Ycq-6wER>v0RVmY|dXud*
zkrL~*+^q1+D<0NkEc$eZQJr6u9b*M|YvXUodO5S1YAaSr5_`O?aarzZxO%><<Q6X8
zZShhO>hNOS=SyLGx1TYZ%eyZSqbLA^LvPZ8<c}ptRQke+;9^OLx%4se;BGJcl4G1~
zM|$mz78+x7M$u9HaE4>kUB79x{2p*6PgOJmQ$K72&1@}%@i%9C=P10=A*DYmzvlxM
z&Xr758N{QQw;q2#HGjO$H*Frw>S=4cUH&7Dx9C+*aRrL`jX4zN(ZjrO7v8*-{FTkP
ziq~v%9nAoyEMq(Q*C2&AGXj<R@6zkhiP~6W0NfO>c)7H$T=O-y5!GrpiQ8Vk)0<x3
z<eT|>a&()WA<FNzhnwt9H#TCXrmXYjkr*{>P;}F}64-6w|4l`06CR`l=yM0XB`mDb
zAOs!(L2tf1rzw?<1x&?LK!`7h?gJz;D<Fg)Cz&oTDZ#|fZTKunMj|96<i<;gjGytb
zurbU=&qyluAe=t8j0z(3X)eGi@&?9P2r?C5$)#@RYs%DBS}V7JzCiGZa5kBjY$z>U
ztL6D;PORIqYreb({;l04EEHXR64qG;>KT{kJ50(DQ#yv?)p98JKosA=Da24mnSYsu
z_daoD-%taiKI~bpAd^kyOXOG2)fzf>=}}PRoYf?AWZtxQ7*j3AP|;U|R#&gp$&*vy
zIpt7>V22Nv(?fZT>ViQ%D~`W^)iO1q_GBeoR(70T`HJ8r@i=<b4!o3dM3@>X&(f2T
z;UXISTxlF2hl2fsUdxL0(gx2mtN(8IIX9;29;pw<cb-nxaYAqpw{QGjy31@y^L575
zKSD2sZN`4i-$_-lX+ud5FLf+<ro?1t0nn#@bn<;Pbwo?Md~0*){$;`)jaGK0a?1+`
zf!zKAAL(&?r=Vad?{&bf>uE?~j`4g#A{SP=SA~>eme~waAyZK~D?k{Awb!!hx1oeI
zu>%N{*6Qu{-`G$}MJM1CWWc7R@|c=rQ)~UYF8WqO$6vv7=6tau!yW<mz0P9gQ$lhw
zwU#hTAJ|6T15Ug%otr$3oJGBw`sU1%z<P@lZ6FSh@59+4lYs3KL-<;-wGO7sPflv4
zu-=p!Ldb7nwM&aBBylE9q07;g{$vWCO+#t14PM#{T!6JC)P1_HG!e{;Q>IZUz@VxR
z?*w|YjpMDM3{h*Ml?LKOfv&>w9!x8I0U^m|iL|$<i?zG4{KZX<pVhCsY)`y>Rl7ah
z6r_UGBO24Yy7!zGix*DM(!G^J)WR+}%#FU-|5b;>M&9x7G~YJ5l}Yu}8KtQIo-dOW
zOxya)=~gV=qn69<6hnA-RD4WR8S#7ZSpnJD&)zG7Gf7fq6sH=CIr#f)Dj#9-g1^$s
zBhl8g8}7LRZoe~h&Gk`ysAc;yDn`rg_E3v3KF$}TTWGZm(7R1rPGAK(QtMhie6ZNe
zeQoO8Fa`F!|L%RZpOuAr@^UK>FHnU&Z!($ds-Tq+@n=@NU8UIcUw=F-hlJ}jp|7vk
z@+}Wv)QV?Aer7e3u5Wf_itM(=(WpFf5-mgpxhFezn5cTHhT*mEg3u~3I3Cr72^!^@
z?EDbo#U%%JBgxMhK2!lNqwA2YurO{(6~>5PO=uhawIT`Vm12OYD+4IO>}p?o$_zk*
z1dl}*79DD$bvTcKpEtC@K&2ounn=NU5)jTW3I~2^y@}0h#*tEeXs8WFpxk<2hU$Yg
z{SqrXTcUp9VS;XLZM_GAZA|hF1WGv|LP*r;NOjISPD8CIkZh3z#mee$i3$%1Bs(Q*
zh;98ep@*hn9XkZtqHHd!ji?FDY_x1%8UD{1-UYXJQohygyWu#Yw~IGDUTCyK3smW4
zIa?`L1oRTib_0@{7+uTDxkbdpi`Bh&@lgeLch9_xA5Hm@q0W>2B=q{)oy+r%=DNhu
zH$GZGbC^jCmdkqSjb0Wq>qt1*C;R?ljq5AzNbH7<p;h{J6JzoMLz3br&_%M6esVYt
zDo~P0htqFfZ&$-R;YQ<U@IFAq4I5%t%E|heTlK?)_oN_8Tm`<G>YuaicnSNzE(CP0
z?I3m1eBw<dA)kame+%QU`#Hiq;H2sN9>VuXVdDvp^_Sn7zm5sBAjj!EZNEdgv=bil
zcE4=^J%2KzWksUJ8o4C(3Kz=Iq)#LU9`w{<xsGXe-v2p=XXQ<R=!|l~T+!>^VJXRe
znY?dx%mkQIyIEyR+IBT_4_<D)tArOV&{hl^8TvAV+$_UmsFd_nEu17(%j!?V_nV7}
zQf``n96C|0M}KKkxz(_k6N0@8F!qeGFz>6T%sdI0P((>2DXL#R;-x~;>*T88N9a?n
zE2!UC*ufT@-xa+<u4}|r<<9;t7)RvMVPxDOD6D9e@NyHjfcbV715n`Ge^JYw?oCi&
z846(8><r&MGg47bF+eifp9j7@uXVcpfdlQrFaEH^AOX#1d7+Bz-cU7GbLMGeaBfw{
zy1SvuP&AxDZPGRIV5bmMF*2%vmqqD31BrA2RnbdgDDnjFq1pC?1UORqH#<k`223@I
zh3x`R|LJ#2Kg`MOh&qi@BbLX%{d~oE=dr;bYpw1G&T7Nl&PRnMh4_jOD(Wo;14`+<
zPQw=p`g$ZTg*9OP^Vg*z;`htJmFKg2bzaxogg=@65yjk<_!<Eg#Vsz^M5L?kk-Us3
zvWlk}NkXDxN&c;ePfthKT-r>^G!%6o4;BF%Sm{yMHWO;gSg<6c(}_T7Y}5n}`=BE7
zO!Ma}?B1!CWk;M0;bWYSX>Q<m<!)@&z<RDhy}$naHAF|_F=WLbJ~R&?lc9Mo3ziIm
z{zo$UY*26o%t;3ZZ503<<&2tu#meY3DvE#X1>oqah!{4+3n{xu%j^T2HZLk7M2B}}
z$lVZ%Zrg%vYXI<>&+M3PQsD|BoBTtm)Bisel)hA;@~rEa36%|iXr$~y&1(=)MCSSy
zUq<l%R)IVmsG#5gHyIffPYz(;|JyK}UWW01u7Liff|<7Y??&xL0GIsVhw=7h82`r#
z6ko1E(Z8M@VVK^j_Ldp>-X)DAK%?0%kQbjlf4vb};Jw)sTHi4LZIpoPVZAw}=WQjv
zJWSbY8~f(5t|_<a`UL6NHbYwENIwCda^Ggi``hrD%f~g`?_^ZSsEDZj3NIM`Bts>J
zBtU2rgwliohA-FDFGvTLrP{EG!C)sMjY<Ji0pL+@Onn9)0KRjCW5^i2qhNn0C@N;6
zvS5k~$uzq+D7b`H)Gu&}ZLWXWjcE1`eh?JxJy03=4G!xc8Z;k)!_DD6Xu>d+(_Y|)
zvV}1Cy~z;9`4O3q0ZN$q@G%mUfR87XM-EE(+SM<}@ShU!LqG|kVH6^73HrZ)`y3Uu
zsB{gUH<~36e7crb*!V@7luUr_5M2^qQHczRs`#gLegF<HxZpE2fx~5b6~5zMz&9VD
z-6Q14nP4FP_}jF8udvUnLr`)+3GiZ(g@~YpY37d@QvWHT_oW2AEyM{w_>V6aNI%CR
zwxt&EBWkq*B$)(71Bz4zLjG%9#V_M3_K0n6{I6jTy$t(M_2?bjJ1I~tnN(H3Fbx=p
z4!koGnV>)KUvikj|GJiRFV~Vi6s7yWN~m}#VV-NP(Wp$bMfmaGmGz%N?E0oAy@TmO
zTE*yugrN3z!K1ad^z_5=Oqhp<2T0BrOygr<hQ?yODRQ(>1-b#NA|OU(eRI?2!}rE7
zwgtA^{g@tqH@X7Po*rERFc~&>I9rmu%DdwG(wDK_9d+CL?=AeXvDyt_z?81Idd;}L
z!2~fM9=98=Y-O6LrOJGfd{R4X=4a~*w)Or2geiJ+nZ)0wi$}-g?RO}b9JG~$$xDHU
za-P!f44IX0dlSvHt@p<~zH{`}5CCDEUmXT%HldkvSaw7RJa{R~5bC8=vD)a5#pV43
zqIpu0GWEc6gNb^VEqJ8uA%rRib7q%*ZT*py%hrDvWo;P1#X7FLxc4zI0`l8LDIvMm
zx5d7UZBAub0^2uO;OQ3TuX>Fr5K3b<xEVJ}R{?0PySKPAX{O?~M1j(dgR?6rO7`~Y
z{^ah8K3hfiZqlHzG?vfRf#Ex5?El2JpO5*(uIxlI0T#`#KiHP^hw0k6`~x|>y6)`O
zfNviNgm{ybSS!4{x-!-5kS6zTbAdhcY)HO9b%Sk}Za*hUsHg9Sl({wHEfNkrbbR}3
zEwi|wLfZ;@2iAu<|4hLs;mIq{$2;m;v9i82)TOh%Yj^#zRG8SqS+75*9{pe6rL)QH
z6SMmUN1O<d_gh1s<Io~D6;eFUC^C`qeZI_rgWpZOJn)hXGdZ>0Pc^h6^G5|-S!Q2%
z`prr7&NMz(-I*e#2g(Q{?l(|SP%ccKz?*q*sjh4lkGR@&4o$t*Y-0<S$7HTFjPM9S
z?3}~(+6;x1KLwo>xH|*eW+{Gu(!jt#y>>4s+EKu%4)x4*2QK#lj$mWLW;Fh;hqnO@
zG&2FO@}sm^{pP|+8|a231Fw04rHE9)nMq2_LspWur*o;Iym^O9E|4pFexc?$lEXPR
zSIUHd$+q{&l1%wXQV_^oCK_dBx=B9`-q`+KfT3{N^JQug#d3H-xDT#Q3RXt3<kAJi
z1*DL9b)FqLt4I@O=v6x7_Gt9)uI3aOu`mdb%J9AW<0z3o)tURk^o4KD0(Sf8Q(0LE
zqM_gsg2&&K9?a7eUhKQ`ZJ~P{s`*MD?-R~yPc3Qut;B<W!91A?|AC{quIqN&JF4{%
ziZ!zDmVU*#qY?A^)l!u}61>kwf23OPjgzJDJ0m%SUn8QV^)R6(vJ?Jtr_NQ~0mkfZ
z#rlN`T(<if!55N55PHB?d(=+Z>9lY#TlR)8N$%t{+i6Rp=HMl`c!Z8(mHWVEw15@p
zK)E?{5x>XLPT<?eL)iQ@KI)EVdD1y1dZg(~P8mXwlHV;<1LQ{v9TvZ=wWXj<lG*(F
zmSdjhrYh&o_z+m^PgVIToemYyc&aZ9o8*LammNIjhl?3YQyaVx>W(*59JUM`9^PyZ
zC#&-)O^kuhuIKX|E;+T|`gS->!DKZWJbeA*@6^#F?tt=%sk>(B#H+S=)%t}@&AuNG
z8ZNt!hXF_l;PnU{dRg+*2?!_Z8ym?#e2{h79}t4;fI3gg*ab21wh=$yQp<W}K(n7$
z8v#5S^d%4x5D@q|bh{DJ7z0oVd&{zg{z0FE$n7j3xC{yn-M$bO7KYSY>7Wp>Ap&XT
z2J_~pCc@-qwQt`f-}#TehD2$6*1Aze#?0z-&621Ybh~IzU`JG~foFwZ$~Khxr3i=g
ztp<lxPZyJOfslPLmWAtNJJyt$@X){c2+gR|%yU~?KtrHHKt#6VqWo-KXYbh53JMOj
z2vre<kQGNtxkvZ&wr&EONk1bCI~VLP!@zg?m852jE_l_WfT$9-S#!97>Z`4CeIhD!
zt@fD&htc)2`)8FQ_qGv8;L?14f{#r~d<UivSCuJ`$J0J_WT5B_PRZH&1jRD911zw4
z<E#(dgjYhOlO+=H7IHwVw>x{oDGo4c5ZEzZAo~*bfRX<p<&S3|(97EGhrdA5dx^h5
zltZ)7#pHdFp88j!`8rZ{2aC_yRAH#2Ul%h7gnIt4;%*2mB7^z6y#sW&PDA|Y#f0`^
zaYt$u`eWZ7y7|%f5X{qmd_O(fcw5X}^LD{z&()^I?Hbx$rg7tu^yC(B=K7ykJRctn
z{G4QaT1@L2%C(T_G+C|Ko85tXFHqa=^!&Cu<j3&GFFw~I3`iGPGg9NQg_;d46U4pO
zEVrI;tBY;Rn~ZyTeUJJRsvZ#gh;tsF;ihXsFx#xyIRbmNr#A;^)N;*=f~8KH6>%Zs
zuL0#!zt~b}`akmS1{+#U6B`H%pdJ8|6Th+S(-6?<u(=f^BZp-MfyF&7gu)9e;|U3P
z9^uChQ9Pxosl+&p-@40y**+N(4nq+5;T;(nRBXcG@!iGl9XB;Kb>tizJ7Bom|H<6~
zdhiUu!J3YJAsW!Ny6krK$<fTYzLLbI3u>t{{Bqx>{qFZauZ{wxR)$%*^XT4Rjz@`{
zJ<2;u*7ghJ`u{+fb^e|8e6Q23h?q{0v!T=VG405L>pupwhdf{hOA8%<7V{!t1xR+^
zvJJBGZ|_P<sm*SOuzc)=9d6{;^h#x92eSp?slSy8*ye`j%H*?T-4z+s;l(#OC2aHj
zhdXlAIuMgtQ29nitk0LZVg3EPVw@FJ?OEb?78*i(i|WJXTR#$9na;%YVz0>K7u4I{
za{wh(x6CH5$$Ot4@IZ5`dy>|&*R9>v-r>7W8e<peF7<$;3MA1x`{CA_Z&8w5o|c`h
z2)PN~x-~N|uFR|xQKEt8p11J^!#&C5NkAQ~T2y*38erKN%c|J5SXb(7qRAF{(X`Y&
z5q-y3>X_9oWB_xf3j2ky58F4vRZW5U;_!UdO#w)A3K0xEawNQ+<Fm6G9JW04Xy~o5
zijgDvsKkL=uMy-+<jqsKt%w>kbg7Zy5(PZq12JJKtN*TEE#WOR2$*pEj$pZX=7W`R
zO-*@`Yija31^?Xn+%TxVl%&@eeYJmGpvt^RYIsA`Gu)kf%l-90vwc66+OR2Kg#(Ii
z@;5EZ$#0`|u%6-N6q(ACah4744P$pqiuOhF!GfhPh^mA66L@=jMnS+~7WB~oWeqbQ
zXw76(g#qBeT~DLc%G>Yin*^wMH-i~Zt?u`coR*piiHT<qczJnw^UcnzshfX0d=Uy%
zE6BBc&sASKt`W$PGc_SGr%$$j;Xk>^3a&YnY#6S|$@$b~^I6{veAUpXgjj0aWaO=2
zY!Ai4kjZwHU-h#z8?I+7-vQZo@?-r&imT5%xQ^g2V-rSdQg5lhnDXifIGOUGi8o}4
zmeX4$9ajeb{SDM1yS@^f$XxT6ozi7LT{w)V2Z-uUR=OU)_FeVbqbE7+2TbiUX)g`_
zF>1FN$7nX{;RQ>wM*pfN#|#nquHyyA<27+?92~*F6Nz8@Qy6l-IHHSQDZ$enS1^;v
zsi4<~oeAQ@=OFD2#(#hakrC@H^E!VBDP3ujpmICgq?E*=3%1~Eq#!r>$yWLogy3M?
z7k#wq^?K;o3Oth{ATwSxjX5s{U*m*FJXC`XLXNJ#YItHScBRt{FHm!fU8eZ5e@lPP
zg>$*_-8a~<RG*2bw^mn2l*L+aKwprIa?t2#A)7iV<s&X%z@-q`&XxApsml;yf!e-q
z9dDI)0kRHVSGFn@{w)Xq<!zbvoJaj=vgV1#l;hFa$e6(T<J00bn{Ss$7nul~oP>;d
zhR?Zp@oNpAYloGnGAE%>lSS&4jLxc5zRKN!pB}BFTvfY>{O-3w3Q9xSHov~PIFC>A
z$Vr^|PV0kaKKn?Jb+*y^hx<vV^>!$TDja3?aOd)2AteGfEM|2k8P-1`GJ-`MEG*db
zfG?~4OS=E;WR6tiueWqTS9X}a4mw?|fx+eGI7}uv`Z#IwwPcalePliyyASbp3nnS)
z*jq!{1ZE-0L0UmLl_+_VYE9G+I4jJPANR#!UhDng!@nQ<-hTBbq(REV1}dGEbA`ac
z_ZRxbmh#aDr-a{cJ#;sOqSWj3mOH;(ny%rrI@C_ONv?8#d=H2KDJbdmKrok01#Bi8
z<{bAe5ymh-Z-AFz*eplt{bd))j`7v@vhj|D-tBSEf>gXVt3KD5l#nJqEKPxPn1lC_
zpg2IvxklS_Ed?<g{tC1Q#`_Qd7~otwkd=4PG5{`VcqgkZQk(@ZEIa(EhYFn`ssv^^
z0&@!7=VdjU3@Bul#a=<>^VzZ9xZMub-uC#!@Ee(PXGvZ_2^g>GK-fvV(h}^+o!Z4@
zu_d{Q&baCwOYMy|sf~<lb=~5CudWo_a-cd*5+EjfYY28g#^U&?az|7P@m|4TwbEYr
zSzy}mPF8H}TC85HTnG~NF!Oa%HX_Z}xnRK0%2Ux?mFEsi^hMaSN8l~^*+r;lDZZ_%
zs-)%kk3yTx);FtD(lAnwf0*E%@xAyIKnh5l8A(0)Okn_ol#G<%rmY@HY0x@ZtO;@D
z9>-IHGM+Aox@Pl~MdPIL^sm+J12!Q5j%9op*ZiW1OUPjs=_RJBibq7uE+E@~@7s=~
zM36}(=&x+5^_<xJ?&#5%d3BZ`JeB==T$06V$IOi14z>>$mcp}C17KZu>vtjLmr31k
z^+&Bq0tRz~DK@6@chZ`0a4pyTn`+<!?AiOm?$IZf7qDZ@rkXrS?TjGkeIK-X{6wX!
zeknO;oK-h-<e*}YgKy1zwH~z#DoL<Jngw1O1Fc264n?`gAqVZVAK4Vc_Z9*YkFWm=
zMjp|&c)V^Yz7*~>a@#mJ8rG~2@<si0O~Ci&^ZiX9lfbid;GiY6q7`8@Zg0v$$9#<?
z`oVNbw&C1So4$AE`$X93Asl*tw_=;&++-E!W9SxSY!9%TmxSqM3;{Uv(CO)@yN8X}
zA;iwG^g*C%3}!Iu&$Rig<CW$RO4m7Z!($C-#T>=VBXRIy!00E^V~<feLtG%}p?A(f
zP#h;=O=-5WInk-E*n<_f#9cU~Y=H(lmWk<^x46u%8Mrn${b3%zQsk>OBs9332-G`O
zHacc__IPt}7q3r(K|iYO=?}l$OLu6GFph~4k~u;vbdb3n4?@6uQh6L9St74XStP?7
zoX&Ll{>ncg(+P;@O3syOjg84mOg7pdcFxY?NU0eMnP9;Sr(ta~3e5=92$3k=*7s?2
z*XU3x(#7(!^;ZF2dnrdYe`Fu5v#e33PbqWlug8k}ZQ~S8HuQ!>#;<HUlou%m>(6I_
zC(b_7f1Q1>-Kk{ehFmd6CDmORHS<zC(`lc3Vw-Lv|IQ6_z4@emlA`cJRJi^a@l$r#
zR(F%eFjV)ojlH@fk2vtT$K{M55+Q-X2<a52A)`_{SM4m~f@}^G)}3e{#S{W`+UurU
zaVSF5AUE>0)%ZVHb|Q1Ov*E^j`bs82IL;-kwt<AsB4;y$fv<!dvOb&J_VE;7l@%XK
z$iv?w(;}fIg;gA<6%EN`x|4#w#Ei(G;dx5J31JY$YXs)uCDff-zJz>Hnk?bY4P26-
ze~j!prJdR2xyRf5=ad<`Jx8KJsck4E7gX5}wlcBxo-o*!nytN;8(UWU-Ok7U8$`@$
z)ZXz;nv*YmECQK{wQvE=mW@pQ#46L~fqj&YU}p*{GS8pFcx^5?H%GE#&6fvS#}}Z@
z(d6H%b2kZ`C$+tK=>gLGz9<_KPOnmGbt{O`32AaV%fcGm*w}y)5D?hb6;LSf35t!y
z&dScdGr+{e+#5UgQ;_=dWj$7;H-dC5;<e_(pd^8UQ*bRWZCDg;U@aS6I?WaWdn|Q}
z%MJgx#(G;zr1PS2^HkO2;3<Z{o~u8Y43}HtD_@PTpLNeNbBq6-b35wBNuGHtKI#$D
zyGs6n96l?1|EVbO53ao~(5z+SkUf*ImB~#}d|Oa&_xIC5qJ#b_)?=cIe^c6P8b`Q4
z<xVb7p+XS|=iyd~dm}C68t`Z_rF?xhOAwEcxFdvv#vsv2r}NQ?ulW;$S=3Ah1a)lW
zcg6-J$dHb|wF%B6T&TpOLkSA!GUoTG{?XVYDv>JZ8NnorVp_t#pOvxe@Y)+~?mx+G
z7W3uDfmY^Z?Y94~-FgJkFfn^(hwJyM)5d*FMmnX=dA?QRvgd>E?3369&pzfdJ9YL~
z<0|#5)x=R#UghH|HhVlFUCXd%7Rr38jb?D%xW#XFy2P4Eo)(>$q#Pg93$hEh(YZy#
z8ySjL&_rso?z*y3{_++Zz;fi~TaS-(YgQHo5(S^`PbJ-M9v$JC0L|4GcgP8JD)9+-
z)o~dCg4yo%3Z@3QU0om%DRM9yj;0V1y<~|k)tdX}=Tpm7OKd4V`Yv+EWwrsEp60cD
zIZ{}7`19>VHf?kBuz~^_4-0nNyV~;db@%hy`hiyM=y=g@B{)*G;y?Lf$H6p0Bv9Pv
z#0dMX*ctp&@BNjh{vYU}#hhYzavAN^@6@t7eP_S+1|?x<A4{6;g5Owi5PXUb^oz{z
zcHMDtzFLLB8U)!g^Y;=<qnd60Xe3+A?bXE12$vHthDm@>ICHor-z?jLRld$g&!pxR
zO;FkVwsA(#4wduAxuPFKcza{dhEd^HVFg!4=WiMU)uhR4+=B)4?0AFPh|b@QmMC@(
zv|6oMv3|t*f1so?3XFYZ5QM8suWb}RA0!q>BNaOQ!N_dXuPu!(T_kAdO{s4V`TgNj
zaxxj67))2}qu3W((77Z?C7MqQGOw`S<8LPbU^b<u$Mr3~3;Ui|v;Vo?by82c#XL*y
z8+$QH6^4-U+drQu2LB>Kpqib|QD9^krr30UBIUB^l~A4CP&mN+(AC04V=2HYw7803
z!<C<x0O%<^PuuhRQA!eV;wdVcuPs^nJ-avQ?Z1bZN#1NWS@VO{(l@~k0CfYk9D7JQ
zPC>oZ1~i>Y>97`m2UO83VJ|`T%9zfNG`wBCy#c-`Nndg$li7?rbv~P!F|@^%5_T_l
zAY;+IqukEXz{UE<;?-02HJ!lO9OA4%XI->pBsZuoG%_<2>uO`P5pc}QeGN<yzO*f3
zL_FF;LsBSJb8B^;g-}qFV0MqcGY=LakV-w3|2XmBf*bqHw?mA1n0=Oz$$c?v*}ZK*
zuRSvf`{esKmk2wRV78Apej~|X{`=%c)vnG;E6hCe05ZE8UJyZ2k|5l|XTnYEfQJ2e
z2IbIXnmEeQzbCv%$6fGx#opUZY_u*bpHTE05dW!t)4qPM<w4A6RAz2DNyMU)soGTp
zePwGS0reSr-Y|SFR8YBc8U^_wUuurN5ttWnlKNxD(aR?}i(z$Uz7=;Gh5E!|Q~$OT
zm!bRLZJ5zSrN91xz3FUct%{}7-CcW+eGFS^-V5Qul*(*5T%xPbhnM;xJNgZS_*hss
z`7^iCN)601OfyQ7rk@9%Vn{K<)S-OTVhA(Vzcbt+t&fAt;jRiO$p_v$Kg_>2X`F2V
zLW8su8$YHL6>PS2*xEYL4&y@XU~(yXxbWwTxN;IsM6e)Y%=ljmA~|Hm@xxhvj7FCX
z43t4}p&3Dtr3Jdf(Z@!6quG)qV3oT?Mg-oy<#ly)e87iigNkyRZCWH8>GL<1(Rtu%
zH!-FD3u~%I1)U^mgBY_XvuD(+u(+seOrsp+fim+0N{7=0dYr`4v^$Yp&_bz&xt*CR
zI;WaiqhOr$uQ&R~C<y_b&KIYqfn!NSnSQ{kyr4svua<<*yB;P`yI?WMy86_!>NjA^
zu6_<wOABsYuF`qv$9%_xEVsibG`=~W$5m)&v{y+}?{Y8slXJi}%X;@i^CUt?K<!8}
zSrp}u@68HZsWqndC<lsV0ggv}`jaI*G{7)R>DFj2i@WxCwd<{Yw5aUg`G85v;O8~G
zzWLv7*%{<^t8Vol%h`<=u}~aII!c)BC$Xfj&pw0bDxIY^CbX(CACQR9F}R3?oPZl{
zk<4#E@X+k0;1|3%D(~_PP~}5%6`k;S0ir&xj?NBvMKb*aXRYN{m$x!%{t^EelQvI}
zf!6nAhbnx&B_NiEU1L_&3+c}z(-&k#$bvjHX03(qctg65CDLaQf<X>1l{dCKm~rrK
zKz*W;Qkz{@@LWgqMTD(uIgA6kGkzaN-Ny&>Soxb>(LL4Cc^e)vl#=H}OJ-5eZm(g?
z)anTmKRySu&>NDgbTsd$fdEQhs7!zuWni(qM@NM`1p>I*Rwp{1I#*~gL57<O8XEe&
zH!Ta55Q4c8Lh6g2MDy*of2KLsrVtq^ENgWb?}vVR;bh<pL`+1)Y`(~r)+Nj%cazvD
zwOBLN9Uojo+L**5o6bwK{JHBa&RsrdHcyr@^k@QAX((p9?-GNc?zM+h7E7%h6UxV_
z`qfpP5C0ThVxlcf)K`N4u$bOzV-2Ot@xUf=zGwE^ZO#xnUuL#k#>jSY=tBQgGn$Kx
zwFsE=?^q*oyMrp;<^WWCe#IhUqYIK9+{+rWGyEf+cq{K;*PJ_B3cv4AU<9cin=h{Q
z(l1GwH|vN$NN`37O`<a=YHmn)_3s#(%PDoxiO-co{1f2hu0>~pB`i`FZG+vFS%9Lt
zUGa&?8H9UMi<D^=8fGncS22(3p}6Hs`}_)F6%faND3mrH9~SgTVOLkSJDecaY~}Ay
zW-42~f<c(4_(VrQJ(@1IP<e3LJn8CvBsh|>xz#7Pr&#ftpvD;f1WtmCFUL0lP98D&
zBQhEZg*JCNr^=8Xe3NgVT-V0;`#Tms#RARO6#1c|iED!rdIP|b<^5dHL&UQ_S>7!B
zV)h5ApaY!fZD;XlOV#E#Qjeb}TrUL^(D#f_d+?yKLDP(@<)onFj!m`npJf6OAN9<I
z<flv^j+@IDV5zJ?ML-W{)wmk2v{fUT9r=cIf!Q+A7=bS!u0z5y)n&cWE@5n8j03NG
z$cN$_{Qgl>;)K^26V4H~08)PDw?}|F9xqygAbPyq@Kp&pHX!?e7)T&DHL(Jyo<`o#
zDA=Rh9LkucWtzrv<kgO&mpsuLuMo#+k#pWpME+&nn@qc}+vO~Nf84dpr1r6yw?BpU
z*T%ltV}6;|Rs=e!e5E#2mn{~5kr+gXDwCH(ae#tTDlOU9S<_vDqU<Nn%?Sl5Jy`;E
z*jVBmL*izOIJ$g}pwRYk)T2}_q*nuAKF=mzaz}xKBgu8D{o1rMu|$t=QVZ}E-F}kT
z?Y0`EBgm2RZaCAnNuU({PcMMVKev@*L@V|&t17nPNV!YB^XLDCcDH)oqm_}g2_6eO
zpGoZ~wuV&pO!1tw4Uz={ws52`wjT;eC?9{3R%0p_HZsm2(J30z=rz9s7;&b(=n<`;
zKl!je78#gt!Hd`xg|D!KnSV|A{RgGSB?K6;$_qxU@@%sT1hU-fef^aHBi4uMcXS0P
zwJD*V6xe50Fuq%R1SoZx`S!cSSJ*b?K9NF3?T9ZJF`}eOe;fcZyCJ<8U%im@jJ{*K
zf^8HcE57I#P(hZ1s2SaVDqwr5AnBl|7huFQ09pk=bBZI71&_|MRGNVb7G9mNXnG;t
zE%wewg9^-$`yD<1QvvrEPytc#JADiS<`+8|W}ivy%3QFcW{F|x2E)MnrqZ1TD(I9J
z!&Cq$b-{Pc<o~Kb=B0u>mx_vUFY6a%)%uEQcLfZi%084K`4zSphnHI&sGzl$rB)wQ
zumpX+qV-aN7#gU641pdI-w!@C!~4EsD6IVVyuxdOezkn>H{Dnt34~zeY=3Zcmg-7T
z8m$k8EJ<Q~?Kgr&<#oDPMr;aZjLq;ymMf(bk|xWJVq<QpnZo`1u=1>WpGDuTp9%H<
zl+suj2LCr8Jp5l2)c-$$_125Pddr@{;r}7w_|6jc5!fZXxaVCTE%+vLT4srb5dg`U
zQ2dAQmoYZaPwvvm9H>A()&r!`kdklgb_dh1f&8aGj*&3^aBnXNq|5Go&vzZq5=91R
zxYTE`WKnIfp?pb02d+3Bi;Dyn78bWxb6UCo5n-pNlfKxk-<+&nxJ$GGqg4spm~nZE
zf_j$|DCHB0?p~O{)5n{&t{gG;(ArADaE8R^nfLJ)Yog-^HC%QZ<mpQpla^LhwIch%
za95==ytX8VH>B&XF-*!>e-Gz+-c^O)J~f?O?$F)|zM$JRhpHq^@D(8Fy^qvG<aeG7
zvqv?u&5yCPyuufBn?b7zUPmg+>d!xWtp0S;oxe*R_P3D#pxcf2>rer%4+7Vv(51n-
zA<t{9t5v|<xT)f8MMpcVnUJus5C&K?NS8BXAj6<AzZf4kxj&||)(^E<on@xq9+$d$
z2%L<LrX;5F88$E9jlJgd)k8g4LKu-Iz%%>$EjP(K82w}|TWZLmU#sBV4|oLkD3j9f
zt<Y6sCF@6j;D<ciH?LZpj-m79&igXm5k%C1qIrG$*vCf{sc%ck#Q#5kFEG9q4b>kj
zfG#$I_gqHz?{G|@;)4@*ma_lW*`qj(d?wogu)XHsyY!^CT4Lku+NwD;_co!bdAd@Q
z)P{iAiu=F_yfs7E%H5GLp<mxyRf#iy?daYt(m0hR{VaC2>3@8_yC*$bDktVqHf#4K
zbc|v#{h?^AL6|p-b4z(u_Az}D*#w^M>GqZ<Zb44GS3^yEXZ60S=u_Jk-l!O{Y~*e{
zTU+Na#g65WmgmFIx0v@<7EAKY%{O?3A9F-okwoR|4C!-*;>bE!V&*fTuqCIHf_EQY
zblQaqaG+-taT5nXbG%P>1qGfDw-xJ6t~VCEtzgTl1A3%i5<gOc2sz)2-Lbx{D7sIM
z$D!aM4OXY8r)P#>#^a&rl>6)hQ~v^B2&#c&J?0MVvrWrK@aSjY6`S2|(5SkI&Ms$6
z?Mx>T<%}53`CN$pAmNH6)FCK5pG*0ea5+7Ze{yyTxpufZSSRq-HY{Besc3dCUs)4}
zCkxkX^l_lzi=vnMQC*;kEza~E$1QGzK+h-4#x6bM9Y1>kYJt<)0X7|{Nig+TT4tR;
zH;I6=kIa%|hVH`0pl=P(#tMDVQPu{m&O2sKvPq$K#*-P0P+0eSJnK7ud5j=UIGynf
z!j<|1BJp7Qb#yki(Xf_%kU6^+;q-?}Y`mCb{Ec03yLGe1()<iD(;y7*WlYx9+|yl|
zdosJ*-=f}|9|r1(RiArUrb}X@>^@JYXQ+g_;DwANdy5Fu__EETLRK2(N-px76ReCP
zO$7hd0&u>I2!VCIlb<Vub=g0*8c&mW?zGskI6S$1dSyg=84@Ac^52OTD{z_8TLc4J
zzfX9^lq^5D&#s&vkzU-BD-j90m&d<NaxkL3plirb&hX(36#|&K(-4WG83d*libN|X
z?`spf-T{PZqR+64SAQ&C>bTANNwOGC)lX|GhukX*?E|Sm2(=?=mR%T<RRXIr`x>DM
z9Np8u3nsIadaQVdR6($}oS0aWoGr=hj4C%e(rV_`oH{x2d~1)7cvP--^kI<q`0lT`
zXoKCaA}6ae9L;5SpO`{Vp*H{QNDkX!9rNZ6EY(aXY$U~`q<mfgfvT#jho}&7m?gZT
z0O5E(fTa`ED6og{8K|^3{``THlarJ0Q${cORwJyf{SLe&DGr1`e+JBPGOsZ3?hE>~
zzXcZYA2B|@@HX(6Ujg4j@zhWDuu^{jA`X(d!9j!<+xA&}v)CvWJ+aH<6~Yi4#y4&+
z=A~c}C+Z0=i-h|j)YNXX2upzwvccv0A<i;FtRRr^AeM<@dcDpD^+7p6=UmWKm5oCJ
z!fw7Iw#8*mGV2r}cBRk*w-$q~bE;JXFC^<=B&z(jZDP?>_k{daWDDy<B>QLh2ig1|
zEmYFIB#U+;a;bh<c3D~Q;J>i+FTjPU6bp;=>#{vuKD#|k8{-MEzhZT#%7}Ny^)-2M
zdx)%aqiiO_I2z1^>5rx0neWWfX$t3Z_{UaT{4IPDHuR%R0*;sU(-cO_2Nb0NB<YeI
zv5d{jpI@zrxKLC+XyTaMzsVpcH)GT=7hhjls>>=P%gFjX#ldC0ji)SDDqfSsB3SqA
zCxLi+)|EneF|k}7OBWYH;2k_<_(8jJ3vam*xW3Y`2=*+^Sx#ijs^>_=<AgZ)lQ{=t
zX(NZEUGc2%clD{d>(Wme1TB2=gJo#nEEGzp{lPD(9D3K38{C7jOF50GxXkMbXDcq#
z@o37@#?ppW;PiMznIcnidbWZ<#`rzM=Xn&RbV;=O&hooY=mM)RBSSM|;8yPfy%p-U
z=$Yh!Dw7E;9f?Mx@5nFV)1%qXnM>WTu&tklf|lAOc87?6tgkMZmY)&^xcx!e+K6pZ
z{b=;@<DZcLP1}^n&G;A}P8SQ<@Z#n0gB_Xi_M))N4J@^MDC}UxWEbiYZ5VYfX6BA#
zT(j1-GA#iH)pEh+OJI)|$!aL8Gt)kcDt%(~HY!QF9LR={YV)*hY;C)MX`+bQ&6eE1
z3P`3foQ^@qEP6DYDEL;F1M`ZGe}1y+RX;|8fkiGdgj}oDZT%WBLwvuBf|jj(qn&XI
zkE87A(&C~|315PfUYD&hbm8lQ+tZ~Jn%Nd~q^RWHwEeI8X9D^5imhX>6hCNUZEWeu
zGH&<E!NJqu72p}o!c#Cd4UQ~3{ux~<faD;W#M1tBHyrC)wk7&kZ3chh(W2k_w@((a
zyt7u12RQXH0BvjrRmLV?gP{SF5{@V`cIQCql70;@1#T5|Y*E&?+~D~J4(ZZ4MqcXQ
zDG%7cGxRI6xEk3dEusZ~I)BY?-~1&-p#HU7sb>q>FzQ>MlJs#-w9lefu&X}t*E%;8
zr|~rl4Cwq($!bwJUo7B;ESywrtg|?QGKA~jT~)wkeTnyp%@~GcsfTrkEi}F}#Bi*_
zWWh$UKm(KgU|PB700MF~PLE+Oi`F#v@~XlpmEjmAV!*iwfBVECNd;5=)ng>5LL&`J
zJ<MLOGx;#6NK4&oV2V^*r0V&Bpe;`!g4=T$u7o3FbK$Yi%4|Wr`Nwbm)N<pE1E#8i
z+g(!Ws;l0C?}3oKACxIPPSA~lJxwZ>%sH)aHn;<U)}}lCn;N8e!NBXF^G7p`NsYz(
zm+J-2Hq*6>SV=^os8AxM2Swt>2(dO>AvsFG4`_5>%21x8(jA_PLcnA<;66}K%nESU
zQ@fJ0<m(jv{hCIx1nW~+M8$CoA-2Z27ZM!3+~2Ryfvx?3-t!Y4l>l))3z!4|1x2*e
z-!+eWRI{GbG`C=>7#gwz4$D;r2Kw885@L9C5{3hN0YD(4S!S*Lm3{|occW;(QcY<1
zabzD^D1amY2F+$wRRt?`V7?qhDTU)41mbgoZt*objww-$s?C>_yZen6Dk(Y47vEnH
zxC+S#_7wh}n^^22Zb{<o;W}J($+A3H_u<h`a*vYzfGXcVOKgRf!c<I)v^z?>%)L7G
zuSg_$N|;;kQPh{5LkGoNWQPmoGw^`h&eR;2FlktQ)cMv#^<xP=_Apih@)pt&hYsWw
zfi(t>x2}B;PLXzBt3*wg$wPi4?8-_hot4@zRrd^3?UtKgAx#&5!$#3$Gg*7BV!7PD
zz}Ezc+>BwyE>a-ot~BWK@hY6hsDT3^tAgy6qb3UlWF89g4{vIquy0OQeL10GyTs<d
zHU|mQr2e+r^bTe}^g|BBZgA1aYm?y{9^Qh&&J2lb4`cW+pOnSilg;I@huFj65`m;d
zm#w`ad^VdLO+O8<X!Q^zXtTD*pTlH>JB(2Ek?JQj9m+lg_i`MLa`<<R$c~xXI<Gwn
zn%P3w8c2H`kTiI`U65ULf(ptQBjpv^+ioy2ox<iu+7^2zAZ|r02-0l94{0{cNWZaK
z=5@qgiWlF5!fp=WWenJu^*6OrXM5d47YFZ)tH(%udOFJ|y;v>Cl;)qwo*(lGoU)9x
zt$mdH5c1pAw$i0PxX@he{ooZvX=~bwb10m9AM(&oexcDXapVod=QmoOA?ITQy69qK
z7TnUxL_?5F8Dh37rM^u3wj6lHev>(*UMeUwoBhK>`n*`c>@ZuZm4T<+9F6r3$&*PQ
zEG5l1wpA$A82;(sJ)}$kT$r$5^??s03*a$MbbEafR>mNTVddo|qN1YmiPtl_+?#+Q
zq<xqEp<+oKm<5(skC$-nR3>=^f8TbQSaBsk;&Jq9aTe#RNOleDYh~TFVr0W>i+pXN
zaZZ7YE?{$JMPV9zCMA58luCn<Z=Rp<u9SaBS@&Pk6(X@rDditsnGetJ>63hR_~gSL
zM&`naOXjo+IZdGHYJc%0BpO&QGNAb`ovN-`&B`2F@Rf&bBJj4@k+e}^bZrm&BkwJG
zW&}xfDC46*n4QC{{JKC~(8J}OEmpCHOw5)?^}7sRwRN)`w({%EbGi*pbKvbh%*}Nk
z{|dX&{pRnYIYvRkC+m-SGAYowW%3DJF2xqOT%iQsWZ_*`2QhBh92vqYxTLh&n{%(Q
z<7HFDPh+^bT5rnnET)HF7tB>=(zLlez4=~LJMJE;Q7S9gv$ycpe<?_#a2>oKk-jTE
zJe}1sLDS(GS(%%Dw*F<JSMdCWA(grB9mINf5>>j6lzvlTn;}yC71qP@Xl=_xQJD)z
zmI(}<-CQrJ{@?o=LDAcJQSw&*L~$*wG8Ik7c_#z3#RmPLbSw7#Bi0~~i0*pkK0QTk
ze|SY2h_S$6%z}b9=d-jKRL9wih4)qqzc1F#&W>uEM~l%`!doI&@(=sHHBPdG$OB0}
zRiXN$DQZ6qt+FJ3QK>dLloV{;gDvK3kK;aTx*TVT)cHkUDAa+*&qbU&zrpS9?-JMf
zbBKPUxiY?1U6VF%P9@is=No8kc8s!pt1py2^sc9N{ZnlWv*q+F+yNq9X18p_;fDSh
zOn^`M7@jH&FO}mHQiTfj=!)6}3a-ko$a`(#9wqOWsgz9<vO{5Gs@G=y9(ff?x*x1F
ztL#Fz&tk<qYaSl6CAY`!(WoX}YBZ{;Cz^tU7CmrAm+;Wct0SsRfMRn@##s}Gvl5lO
zJc%=s5MZ-SP#eop%0HF2#h_*p=3wVF6^W;PIaMCqVkGFVGeZfhSdUWG7u>`0%ILR4
z-ri&vbUaNJWE{l8TyN9j6lc`a>c7r|pY#g8{kB|ghpIe++|jjkBceyzC$wiYgH5ZD
z*Iww`M_V=hPJbkkxD;xYMxl`_{P>fX!4&TLzn<TFf0;49BlI=m_mY0+W+#APX49j!
z?wcD&h}WHTIc~Y-48@QM0XK$5M%5j{_nV4Vf-<ymqUdwpM$@_M9{=vB|1fxs4J*RX
zZ6fckgm5Oz^bi-a=Jj|%nBGgJG4N026Tp9-b!F@hqrio<+B34%vC2iN{6r;yWQvqL
zzO!w0xhe`0=qQw=#PIp*D``!mib6UdUHLU%w$dL4p*u7*ROH(^{w(EpW*<FG<~_2B
z6Rf|FxT#Z$;WF|-@N6Y0i#9#b{ec1na(T4yRw|AG)BXs)GY$)M8#>MXpu+Oy(u2(?
zd^-9CrePJ2_-sjVG`H5J_eBC7n5TX<|EZUlciwz2%ar0foReMOZ9#hU)UhDMaUcFG
zdG0GgN5>QEc(sWEgPnCoMhc5Jw>^x-M^^Ri?Zf5I`iKkM?7h%mNJKK>z|+t~1F<-?
zh=cF&L2J3!mAd?}{K*<i4aG~9^JH0c!38xkY`HCNG>r_}P?LIma>g~KpWx%nQb>C+
zi7u+uF!JcD=$}5tlHJ;(_nPjTJ$;dju}(8yNL}Bg5DV~(cl``tZQ@EGXqZj4{iziF
z=K88@-aj2!qj(6cg<$C3D31cm8BDHOQt_<)li+-c#p|Q@t(=-|PX6ipuAh-g2Pi<N
z6ocY^o=h(DLABi7pwpMGKoo{fH>Sp6=Zzl%W8eykoMHj4p1)y#*5-bTxRuEa?mnww
z`#P-!xz$cK4|=)VIWOj1r_J^|C}kR>*YCNMPz!>Xk|=&Vl7F&l(KHLb)o8z0IVpFz
zbXyj1B<?wg3EVHxOowAf3DY^UCxGZ25lrp`BI~=1bkHYiXlO9&bi&GWz$#dU23_t?
zg*dFBqs0tBu_U4qalO-(->cp2kNRBiXGJWo{v-Vy?2ahFTEqtckJziLtDQwY-@kBW
zBf{WIcXV{@O;J-7yg^vpP9Ttc2W~|C$@1sy4GQhgvsfhhN|{nbO+I?68pz*8N=YmD
zJ>EnJKw*5PVGR;5JDzTfRSe_Qhu0jOl&p=3)Kz0P>R9&|d82iuKuI&&6Q4`<tCzX<
z<yC^LQkwN`YDZsYBBGdX`BG%0f}Sg&r)miIRBABB#oUe6azJ6eAtE6E7X=YQU%j&x
zpSpyVTZkA|7nR#SdFjV5o{-a3X;G=5+PS&1_j|fO%B!N3O~CZ-c@L`ydn@bxd^>>0
zZNXLyj~>a>mfJ=F;+e&teBjCtw}l!s2jEZ(Zkw+^q;MfOg)0}RHqp7ojedztWc912
z(^RPz*IbdK-mUQ1d+qS?93Hjcm8O6v+)@Bbo1954TNJy)&&lvsKol@ARS`Pwyc?ex
zAmCB9=#I9o8aGyDsy@cOSc>IYZgG2ioQe?gDka?eU#b4N7ZN>q`?PlM9U<GgI&aPR
z8sgQvp-lex*_OXSVwu+59gN8;`b{BRYC`{uI5c1E^Y=_9R7NpT4QHd9=L%Rn3@(SG
zgfDP|3jztFY5#+@w+hRn+17S(f+n~VB)CIxcX!vI!5xCTy9PpV2<{r(-2wy)5Fog_
z1^tU}?tkqy=e4i3PWI7zQg3%xcXf5u829rGe!9W*>iT-jZpP*;210-s5oQPKvrorc
zHj)~X1VF+zdV+%Ku6!u~B95RZU+%Ia&iEsG(~KPJu&9QbHQbkiO-f3d*XDU;<#J58
z!8A07P1q}f@C|GcDAG1kkIaI2FnNt(`{Uzx$+br@kFW&^!e=Jtv3T9OjXu878-C}-
zoc2-n(m(H9^FT0})i=3^_M9oT)~l~!F}^nR((+eEZNO!63*B8QIAVX9=8$GCEB;Jn
zNX%%;i05CSIjvtZDSyiwf({lOzX;ev&M_fK03);YD>K<Bf<aVrr$Ggql@4g^qj9Au
zC_9;V+NRaALt8=j->k$xu;=tt-=Ra%YJ|`ahIjW4`&hh#TR=_V6>NKkXpqsA7;kAn
zYax}Z)N}%Gv2ned;S#Y8%2N2X4}(&rj!o&hc|G2dMp=x*)vI4`V|#h8|ByUd&s1`c
zXjG7tJ#}Z^@BYpS8l&Q*ZURBDuF=6C%x!x+e&m}B25(l%J|d1r6jNCLVICwfv+gI3
zu1@Qezq;<3HeQ@CLo`6EQJwdX)Y5j?8;%Kk)tE+2|8CLade;8I<z{_FmEP@Z>~}?j
z{?R9+>YzY6_NbRVL5wPhp7EwIMEyPAQY*-C4brFU=`r>lay&$c74FUv1HOl*Xbuk%
z$UKzu8G&ku{=;%A8gZWWzZTlPzAr1%j%D)VaBy&}rwG4-lPgrnq%C4HlSP@>&$afb
zF&RYtbJuOD&^-38IVPNd{P|^lo|mG>$E5%>7-g8a%z4Pu5SA}arHpg4L1Sx5rxGcw
zVB0e6MnCN%!+=NFjFrC)I||9ejUi=LCOnkFLf&|PPhxhCdw@Kj1FKbQ#w)^4J@oPK
z0!g}KcK$anFi+6C4fk)19a~_IWGfaMtM|cO;#nc3=87_pbUO(3npw|v4XhxvGmNpA
zth;N6sC+<8ZuacvqyO+7RpS$C54-7T=@x7DbB0ip;-$Fa#l)8_HsyakM`UXz(wub~
zGf;Y<jSmrrA^M7UnBgqx{+BUSmjrKYFoU+muVyZMVl|_Nm#=O0F3J+K(L%9%3dX28
z!$8k)@>8QeUG(Wi*R^ZHX~T_}HWXW7dAPiAGphs5_WhVp6r(MRw=w-`W%X7Lr#?#Y
zBu3au4C#E_Bia&+Tk>0c7n^_;Vo|dv(S%m!!C$G%5~WG^Ll*y<MkeQ13Vs*8Ic|S*
zb(fY`C~op7(Xzosg=Fg;Od(FULrnei-L=Cz;yOgy_c<c4GHO5RGI(4OvFHY}gmya!
zTKx!tyr{&2{8yzuFSlI?W1JeXfHxPAt@SaqI#r)=VFaNe`}a}AUQa->fWboW9Rb;{
zS{5FDJYCRFpuD_%{mcOt{%+I%s|;xaB-Z^zR#@{6*XBqfUPi?RmbSKgf<0Fd_R@oQ
z{C;Y(2s;v|eZc*LxMu+8Ad`Nq_5qnvv%9j3{o*T0MuUO#qp6{<r0oz)PJS}Vbj=Yn
z<bD^Gm@XGX{d8JQ+=xW`^Wt6ATJsPE<pIIlB^)`%oXuVh`-`G5t(Q6UNK7BvLy`K^
zsHJlH{}hi)JtAZv>eb_-=C^NlrQ5hFmzfbH?B!eEf3jGthP)=^3J%F-F%-LOVOA?R
zp+l|Ku8K)pv;J9+u-IT1VLfkeEYjuT05Q?4OP;{wb{yPSQGE9nt61y38)P#?Oz@J{
zYpvH2&wl)*If0)KHn_2!3n#=1tkfqP++NElduqWfj3qMAk>%yb)5Y=34a6a;1v44M
zq-7-;9q}M%mbV751tVL}!+)<_7SbO%RsQ`A6;<-2cV(Qn|M@C}SCiZ=pv@hq-9qb+
zV!Sx*@-=?m6|dH^9IJ4f-g$qMNx~Oa&IL7fIK&(CI;hv>t|eh<xsIrz(Xde;C)>;q
z|9q`<M~1|*;r=t_5k7RO+$v9=T&9ba8k-^PvhZ<g)~DnxVrrBl-3*az#1`lkSBLNG
z#viYOr2W{`4lt7t!mr#&Op&hP>_zTbG^lmTZ1_IQoY6G}Y^d}V(8D_C8l0p!mSK5S
zf%uhrrYBWL*fc`zY#$JSY^9pg!Tb67B|HY1h~Y+xlCr6G4-ZQ#*p5Il)|rh`ex;KC
z3L`1mTcimhS?D#C9QLt)MZ1V@n?Y!Q=-e`Y#1+})^p@{+!~#R#;GpEhJF;1V3w2u|
z*wL>H)EPTty}Ea~Lwz;xLRCkm&&3fVyq>;@{^A>8Gzd*dj&;e=CQyFn<c4KcVqq~2
z85_*${{}fnogi4HH&`OYEx&hoMIffXsMeV$fArPi$S#0>@8__$3=@dY8~RjZ^)cgc
za$8H54aBTjnMcWN8T-AGL;4z(ut8;9UdDEKH>joc+wb;OY(764af7%99W)^uWpoe%
z?8)a{II~E{Q(T5XXBk)aGL3FNKS9hfoYv5990dlm$Z8J~U24M_A(Qp4&M+Y`2PM=N
zcl2@&H=ze#l&kSLw5nq4Q4fDd+1c`#yw^6nYTPTDpD^?=?2^0n9MIWfwqP+@G)<<~
zSBcXc<^%~A-=dg&%aS`NrBmd~S=FDV&7@yAjd;rSLi6h6-KMT@pUCBIPO*-O(4EiD
z3z)qF2@q3hDb@dUA9+D-u92jpf3DOaCNFd+(-d%p(0VWcM||fNEknu9V)M22n}lPG
zUOgP$!*>4YX@|uxT|w8DK8shyYaE}jv_(h;&xr0RG)za+F?=Lmi<j(&zP>b-fW?{t
zUHp5WeQJLcp4Tv%+n)Ng8q!<#$yjsJbLP8U6uv(GF#ghR9p=t=Wy;ny<)LJ%GCd|N
zjpm8&@qC<uCHHx~0>nH?fBiPk0u8W0QDMJ<9=ku=7$l35$Q20*#_GTE+;Vf_8F8e2
zQ5*rU1_JNH5A{Z72T0qGD;I2BxmCq#<VxMfhLe9d(sa!gQnB|iCO?R*-$ij?E^}gB
zjeikp!#KX@h2?F1JY_-L90|b8E_X%8SB<y=5nZj<ZAP0-XxgmiBB6?uw-K{HylPuo
zTyKcYAcmvMdG?|=uKmOzw%g%fCkWaTe|zk?!f~TFY13p=N|-s{?j&%t`z=AKBZ$X3
z@G(q!f5*4#3_No03gp!e-zeae5aEu|lE%LtdviR_+nq{o&-hIylh&?o{RFgn*Wl#)
zd`kf8F3Oe2{fu%clzwbG;qL(Hyb}glb^%3b+L>bYqs;dR??j+L>I403AAht{N~l7p
zzq74zF5?w~g^)N|@MTb~g;4+N(p#~%MmV*1B2t3XQE+MxIgyH+*4Cf_Y(b4Bx>7m}
znEY+=A3vSsLt?Eeq*xJ1gToh2+207@E1eygmNX{(M+3r_2LE+_e5Hg}q@cnkXdFZ<
zfL2uji52l?`t?X2B$i<DI>y=Jzc)zurvYa2K%umdEjoxlHdtORwa3A!dGl(Q+P*_6
zR!W!X{Cy8D{CiTtqQvySH*kDukgw6;HvKOCf9+-8KfU~Kx1r<ZHmE4!r&B^UNDKWh
zz5LJHFz|94VsvI#q?3fm-Z?n0T#7kZ(hKInsC*p#OWx6VJrNNvv=0@6(OppU5RNXD
z#&92ZyST_pB?2W#b<d5ahd&xe9bjrX{TN<V(e6w}5l^OnC+0Lz{doC$3g>F_3p;`Z
zI<pLTbRo*6{nV5NkXRDAaQPX*aB8>(I?=`|U|WT0#XKVY9}O~J8dO--M_8gu>AXDn
z=@HH0d~2YlZ%D0o2Ft#0pQ{oj=YhYwHIwB|B_x(K-3N*|@GCQCF#SUxnl{m3U=iaz
z0&W2q2tCxZ#+XUqrspdKDJzIT(?+W>NU+eL6f+~T<8HnC_Xbn{Gyvrr`@le~0RJYl
z+$!6gVh3*ai?WN&V2J$>m$LWIr7)QsA$*02R)GSYOSWQ(l(q!DFYczM0@*i-672jh
z$)Ix~_|Z=2|K7mjp9W?4w#Hv!5;efT6Y9^^&v!wX!SsmYXqo+gyp+p-?n-LSHH<uz
z1PvtUoJ<35|F@UU%@`&pfian{7NsmF19~rlBEgOD?+xmcZh!bk;xHK)g3#kagEfxb
za#H~COzl}&AqKT1e`3tFd)=&UYy<&9TCc+!51<p0=^VB%l75#xW2ckFg@rX>sOS0U
zVh{9huguNOo2{N6{%X}2!=e)Ng#%4jE{Jozc-N>D$WUAm3V7oJ`^ElT(Xi7$z3^vx
zSsz}O-ozEBj}$Lv<uk>~qUEr2d%&#mit=p!gI_l&$qQ_T23}Z<0vRk&hkQU+Q!<Vi
z%SXHO#g-tA)$E1e2KjDM?OIb$6B$mRpz$v$DQV*WbchSsVS09&^HPbN_5GkQE$206
z4nppL&E)UxzG*7eoYpayB__}I1S)gw=0E;4nug?3URq8=P@2gOTDM-Wp^XhFhC0Ku
zX>pVjROt_6fmyV2xj9Uo*UhN6<8l4jJtz{3Ij@y_x=8w>s<g%Zf}^k!u{WS@2gbgl
z)~wiG6LTU{_4t12t)Jo9Hp8nZP!P2qweFi@n2y<KPmL}PSUhTPt9lB@2=$xYp`f=I
zk<W?Sii0fdWVMETG~xR<cmj_D%-`zN)5&V+$$FHMiZ@&vENYq1M^o2?5UrHRl^pl>
z)q~4*VyeSY>Nyhg9Unb$`FjxXri-4-KR!L(+tcT-k_tzqterQM4JGiykLfgag&T<`
zT>o^Nh-|Q~aoO638I;auWDp62!m!a)2?Dvus7nI2;7c5dRcN5vmrQ~~VO}(YVV!n+
z-U*+FyFt>cf0bHgkl&C%bfnV|T$jmE5i{d7-*-MtgsJm#L1)tx^e8C(`|Q^JHxfw_
zF>8AQh<I$Kx8*5XI{_ElCd0L6O=4av1NDBkqSpD6^Od)Mcd{`K4|dlhL!xjt76KlD
z^|nx;w~Wm#5ZtWToWq?1Z{9Og>^E=x!Jvt}8;pC4)Y0m8GO$smQGtJb{5uMi&W)7c
z2CK4-Gbt<}#~A=M#QQ6NYy-DAToyT$S*zOx*iNWb8SpbkHSGWe<~935p*m#+%nJ_#
z46{stTfw?;Z`kXw?Ck6nQH<%6L<-r-e970{qX&gxV0k`%BM>!lTKZX}s0_5@Z5|gA
z)x=y55bV}-$t_@Ty`-;NZ!8W4uz#$yg^0H=x}V>%H)iuh)xw?|6(ljJJSMUV^V{-!
zz;UqcL|(t|e99Z#nQdU>nVWkSaKGC};gP%S%`Ez{X14<Alm2D*O8G7ZWc)PkS96~X
zbzgi9ey6i{Z{RT1Tn#BF)9Jmkri#vO$gOhLe<b2_BPNpcj4b_hb+Eqp+l$Nj5iW9T
zJc{UN(b`V7FS@Phqq*UD<?p=Zsc!-bdL4lP9U@_XT=O!Q7j2Zo6HlKO1nHT!ZzmB}
zN4$UbE_QZjYlw*XJwk_mdx6PE+D4BV$I=Cr*~OL9+42?TL_}wVx9qB@9PGtrcLd5o
zf|kJVn$J2KAg7p!%0kP*+>LRUb@H=<t|EqNq285%Hia&V!Kf^O()F;AwQ_<|F*{&N
zphGH^0|gS3q2^}NX!#p-1DvZBxv_RQglrK!tWid`-*Tn9=&B|-#m->!qt`|QU5$vX
zP(RY0u1bxa4`1PGs86d~Z|`6mN8|J&b(rnJ+~lIvtwSHD|J*=uL_NoJPc%pF{chLc
zK*bVsi7q@4Y$d%OMISBdyUO7;2Rk<=i#Xj%8FjwGlPKSIuRl}ygA3IjY_#gd{zS?N
z*^eu`f~Lg~gy-ACF&YdyhWhToxP#6!)J<qYR^c4t5_$SK&QmUbHW4s$+atg33PRFu
zkEc^9RB6ZehN55?_QjKmZpyE{bz$uvYDi7R;p68IY5TRGt6rw@3K_W%cw>m^Q|GE<
zV`D=tG&%3Y7AFY+^HOqX(mL}WptcrtwcoQZSouj-pIUO+%j}G$1%cs;aDd!6GW3Oo
z{6+mK9_+$8{)Gj)*?9;15s&N7_<n=+yjc46+2cEhh)HQ6Oc&eDFzkoLT3`*k>g^MP
z(Ou-?;u4xB(A}(V5CiGUkcqUodEA54Ds+;80}_xjU#3?D>2y>7U^?)v!;YE4%)kjT
z-dcgyG8V*jmHqtY;wyFyo@y^=Z;`pCONl03cQf3ZY{9b%*9OV{9$1XcjnGrk!L>#g
z?iHU0`BO`we)E1a%$QiVZ4#FyRQenI5KpX;DDJ-uA3|s@?a$*OcNf1Y2VT5)C63rg
ztu#DxXHsL*mpPR;XheT<A>)|;1zBM=+m&WLKh@J6LQn5x6xCUU>>aI(8K`YNZ^Eqo
zyXopMYmF^=2IP&67jW(ANr@^l*^nsNjUl9g6F(Gb;2Y*eqLiaC^op#`-S=ZNrGls#
zT%<y=i=S!n4%4*+f-+;8RKSojl%#@T`VfGUOKNeu=U~DIiG<8J_H{GLK%W8GDu{vi
zBAJE`BFq|u$;@Lj){;~(RM`l5T@iIbF@Vf{cJ#xg+B)v*1oe}hTjWn1>oQ<yK_6M#
zP7<4LL@K=}qa!G+NqS_qi+uZ0F)ern#s-hffS_3>CAZ-WdtQ-Pw33j!Z?SlF5pz%>
zt7opks93iS4t>;o7f+^4l|YF!043pIK3`cBBNx>ks<4epPG~K9Z}(?ikuVlfq3C%_
zOgf1dFoJMCq-LG+z5EU;p4cyr23P3A|33Q$Nj%k2@6s=0%<q^9rv@Q7RdOwu=-+WY
z^1@%7?!9mQP|Ypd>HAo1*bT+9`S1M2O1r3)NYyXX><XGM%gf8mcFSDKbC0(dKLnKn
z;^`V|4G-Xl14Z2G{szZag1R#6z^(@>c`b(K`wkUM`hUYNa7^|`kD+ajy8AwmWV3Zo
zWkzW{JySS*mSc*-qQkb&X%Y$nC2jfm_+Z{1G@w69fly5;#J8qI*AYeuWC<2_GS%{<
zrSDO-ot>Qy{Obgt*sSKt(~5WE!1^PfE=_+g5l(GaW}}nI@AlCxnfNeVguB*gP|M9j
zglVNs)XYm$jqKD2CEyJL+CMPG-?XFzTC<Vh1sEwKUVF5K{hoRqEc(^D4|T;-N;(5m
zrvXosIPBjsNqUHDZQ^&iwfmC~W?z4n#S{%zeCQ+}b9<OJ`@$2~lXLwM_ZJ<u#aaiQ
zn?%0I6xrsAvW`Cqa%hwGr@^(@8iFM{x8okuVt#y$lHh{l%ISP8A9W0+v!@No%@TDS
zaiq;bG#=Q`yLg%5Shfo=v%4-Xqw66mSDgmXmZ}HqYzW7qaJ?NLvSI#WfNwm6#NxkL
zl829U8c^bUryDcJ7TW7SvIIq+&Oa-)J5d}We_)zFz`hk@xBqocE#0XbdldaQruzuv
zp~#rt)^rD6E<_y4uFn~pJ~(L5!hL$L1fw~kI0R&q+MZ9*v=MQztT)CwaOrsFegd6;
ze3cxxT9pc3D@QPa+V6|hs`w%`ykvR<LaI+k@g4*6XH+>Rh@c#{5J()yYYBKjz~X=-
zo!&@DKv72FFhtf3#trLu+#TXM;m}6o*Zcjh^GVmM()}U>zd^n%(PP;}G%)q2L~QBP
zp-|bUBO__}>x-SSl+x~{vsi5XkOsKcaGTX;RcKl%o>f4*7s$b4Uk)cxP5FDb;x<t$
zJbV1T%!o*MCxGJj{KPMl9L`PpTW*`pM!UOj4iyYyY_s2SAxJog{$#v=ee~Ph(ZJFW
zeOx>e6HNo#rnd8ox5q+a;L>d{KghG4zcCqzMmu9`3j7U&J87}hSP>pInJ9Pr558d)
z@+}oY7tk%}jfrbtFca0~^m6hPvjtwEqGDs*WpY%~sC=8O%lqTnJ;!Q~FzgE~LVO>u
zG&d<OY$;<sdX5F<igx>gvIkuNN}T)-!_XjI&+YEgQW=DiM35ye9PhRnzQm-H8H-2f
zet~G2nYPYznBwB~NwjM)XfAChs5O&{vz%+MzUs4VE4ormTZY2_%oLO@kaq1H7T!DP
zczsQDX>A-hiW$~5ZC?mp1L^5oI|YO0$T<bO-Pv01ft!;e&Th)a*rtnH1jdj7t;s$1
z>G5fXr8Pb}DJ@m7CWQy=W*>a*w-T*3T*R%&7{%_#r*{zPG~C*@()CV~??d6o0?nd6
ze&OnpDb=`Cmlx`HbULtH&ZoLdbL%m^Bgm0;ZFT9dxW92Qw?C8+`_6Com(~Yf-Fj8o
zpV&*2agYfCA}eAminjy(cos&jdJ8(+X=!q===rwBbG>S+p4;wsb4(Zx)9&oS%8cbN
zM5-Sd{Tw``RpRLwa7=QGjlJql9s+)bOu&7sYLszAb4cgAaZso+w72_G3e3DxTP$KR
zh_E{*)4$zsu!(sxofC8o6d2O4P*&9;a67#n>4#}hDbtqKAuz8d_pZ<)K$dx*(=cGY
z(L)-^A_QM37qKOKDvW6Pa*SwHY3sE2eGt}kFmh>mMFF%8)*F<MneGyPn#gEDn8+IC
z9~#gZ(m7MLkAMF0=|-ne{(4PD_4;k%!47&c_re6~#m65#XBbp0QF_Dgqaxoy&~lNG
z!3&zM%WpK=E}1Hc%ncMlLF34$b9~kpbpNRptH9?H!I><MFl_8^vOSiD``#kn;-k<z
zQo2{DBY4Ebs2CU+-J>k;xw5(kVhCKru<c+EJ-bq{@qGjls&!wt9#!`v!E?x8(7aLC
z%L%L?X-teGIk;f|OT<>Ajsibo`c>$oCbCo?#iuK3S>Y4+Bj%?59~%o)Z69^M+o8Y>
zE~tlBuzxeG0-<}&$mgTS;|rXrQ9o=OdEKr`TjY3}@#6bryam5AR>q0*UM8AE+1c|e
z?*95>5#Xg^rB#W%ja(}-vRRX^7-4@BB8#s?iqIQg)w(Nb#`(jsn)3u1K9Vy}R-bRc
zaCNV)se?9nP6F{arE(T}3!*QbhS9rb+h|?Fym^7VbZ(ngmzlDk?MAY(DX5iAA}lE`
z`U)-{$yyp1N;Ml@!Y+jGVJ4t$)}~h_6p3tY;f!Bvy9ngO^j0DGqqY#;#X5BBM1H9L
zGS(qaz&>L;O-GfYSd}DV2WBIi)pjJ?R_&e`1x`txUEPfa*6&@6h$Huhi&zg|g}l?*
zE|+?HMkM+Q49k#Lf>~o69YdkDmvQs5py4BOGDo-JBAc*7-IH~SD07T;FB!jlI%1sb
zr<Qzd=(gjX^1AucKYmcpfvjtuCEy2%?Q<W|gz0JBJC3CwYBDcj{5QFU@|#B)LUDZg
z+hu+Iwc}EI@n0E%XD8pdG^*YTqQe(V-^<Sb5_UE^*bNun+-GrhI_$=W-#T3K^LIdK
zmJRSoV^k%Xuf>GVCyHriHKjQml9va`wReBV8E6+&gd=&o(#2vwkeX?Pdzg+<1z{3O
zIr9H~V0Iish~-C1b=lD2D_YY^WQR4!8_wXa8=FY~MJfN)kU?Dk<NE)_O{h+$+rBA)
z53_%$>2K0m>-iHZ$i_<PSH*@xfdL2xU~A2fo;2-B5P@XF3>}1ytRx+vU(iIg%;9#d
zhqe<qYBSs2mdFkwT-9pPVT~DlF;8qe-4)KfTAbG3IBNpxa7fN?r3o`OV+irsb{o#d
zg(C$gUC&)M^9;ivO_h~-{0t6xydWV7$Q;j(eYhIzgM=%-_8$O5^i0e+87l#^uW~hb
z_;lAc;^|24YTIICBP^y~o4<qP4L9qc*2*5MR1HJZM7;uo)_c2fB+N^ji53U6FV1Jw
zIPWWUw7*ADvq>2p9fV~LD&$DkQJ&&`>qLm17Z%0>j1x!Vy~1lRN%y5Cqi{31YBOo9
zc0x%K?|amY)mpsfA@f`3%P+NXpDm`5wf8s&{uawiCGZK5j67nD-ZY!zIj4hM`YR{M
zhF$X*gyVc>derdQ--Uv6wu{I#Pr;;_^pu=AXjxfg3b61q$xx<uaaW=0ilgrE=89PY
z!rj2IpTQbikK6NIH@oSswoI`qh7y`^H&W|mO%Kd#w*{2LDypYS7=?<ZCh1tg-1*zR
zkIK7FTpp*3?sQOA=bwlDmbDfxk7=r6`p$juHEM9!A+i1>6IH8zKRzYZM}1Dl6;X+9
zE})pJd_5>%J2obdN41d%Bj6CPF8JYXJtteQFk-!xU{6|YuO60lNCnG+aT{@eZIcYP
z7LH<e-br*hh&7Rq*`unRN+fP5I+Us)1h38Hs1PFhUQ3>nAI+2`+5G7$d``F&Pe@5F
zk!>-A8EiA06eZI*Wa1h6j@j$aSx8u%B<+N<D_!WDK@k}7TZl`DJiGAXV+th71VlI0
zF}{x<f;Vb0FpKY~Zk%d(k#+~#K=zWPVD<)@Pjq3nK1vC{cMU+EV{b)dscA*fecEjy
z0`apqF;m{v{V=);KxgQwm@eAY>p^&v?k~4D-Iva$JJFUyeK73%goii%EoBL>e3#$$
zQ(F@bdJvqNR3h^+ovvK<RxnZl2GL@3`--WTyW$(eo;2}`1a48Dc8(6C@2@{SuN{&k
z__9<Q>2>=45J3LQiXva8E`B<MrbmG>ShdSLg(Eq%UT8MH|7FWU5}P}ev(kwQ<N^SX
zLm7p@R-3_$shW2YZ?qs$w5{o8Cz_(@7=y0zGnzv7&oSrh8dr-C*m^EWN}GWP);h%A
z^w~o*sD^A&_qq=os@X1EAb>v2<aa2AevPh_Wu#9}PVaQrFF>tarE{*aek=!^&1XI7
z@(q|7q*us+Wj9(uKavL2&tE>t3U^QT;@a4J!#o4OJ{4!_EV_Odn~BYAay~|eOg-zi
zpLkFym9RA}8sD1E5kkz+CYrZf3BK56A+sK;N7#VX0(<xNFuF?#c~C1yTkbtMT^LKf
zxr?LA<j-)+L4|O#vXgtxO7b#=CP@9lJr{_RwQ~Ev<BkjyKMg3Mo2fn&mF+Cl;GXbG
z{}30eD-Qp>&IwQZE!UMZ*(U49$2+-DA;eg;gcTuFYX#lmV@SDBjzn(i7RJ_KW=EKh
z*Ze!UFdoz~xJh(rdk#VpjXj2(5EIlrLU5`M4$NF|P^vC2_2DI?cJ*;5v;jXrg3pn>
zAoufSS-KTR_``SLOyBRl5s3L|bEm&Vp}-x+WG|}gH$NpcIrQ5SYH_00%+nUb^_Im=
z`vLzn6>0fB=_)1sp^y1g@$BNFwWX7*(N2emu||%TjjK4exX(FXp!?yGarWD>-^(kA
z((LI%)4r3&y-`QB__aEQN$f*^MY*&%j73$YCp&r7>(_53hpHbj<>T2iP#&{<!{CFH
zyt{}5>ts6k)P?8t=p$odp^)>ch+?Y=)1=~lx4%3d59@{4b=<o{nK@j*3-Y?|(qcWE
zr-;?>W}zoeJdhMQqx_N`Ffmei<Z!XVueX37kx>uHA{Md5Hls=73MMYbL`&Dtp)o9D
zq2;u@n|i5Yp>UB#XP^R5khKY8zfhes0W8xFngbz^*s*5{2Oi;S9$NoWWR4se`q?72
zZc&y4Mzin3E8uWS%3iYl0*XKtWL3)5h}pnj4)#smS?4qMSFRlrG1>plX-FW;dI}80
z>7AQJG1$asHr6^^<Z}K4>IYf{4!Eo}8uhcjOJM?T7FxM4$LSX@S85NfE;KAd)Gw8<
zp^H^Pj^b1#J|N0CICn^^^AnpCNZnYR$q({SQ2iQWY^qLybLooNNoJprmlq|zqoq05
zet+}lxc%N@v57@SS#EF`!{mC>aZqFZ(JwJ888QIGiX#q@rU%Y}{hCu7f-Gy?AH!6+
z!$8sk#I0M*!&1_;r$MYHOgZHnG5ypcjS3yI(O2_l5}(<;cLh?r(N>0>PUR>Y>t7*6
z{57e4fpDJcsTURjRAq4q0?ynyFJbPC_MiyW&)D=@O1p~Fvv91#>ww;rtCRUmOU6Ze
zaqdYd=*x#=Ha$*4ra3_4u#9LhC_@3>=Bkx;NpW7B8AfeFQq&s12SJt64V555^!iA{
z-$#7Ts7s33;;sAY$_-l4SSa(W9_PqczuSUkhkRFA^a>=wd`ksV_8#JMtOZ_|!kOo0
zHBQlCd_Uq$%{0Hs#<~9zGKHfpU+BQN{%Jlqx_#y^_gHpKK*H)<PJBSqvYfM4nknfK
zxU~N9`3*AdUogJT5{>b&tR`Pw?e@{~QO|u&)^~H7FUMda2q(odX!1m97-njh7sa4I
zOScIZpP@)$>W0LeeA!-Z(Tz+9;Su7`l*Gu>rHoEL3t@L?M`6dMqKJLW35-hREKEAE
zxUHqAKeHj>l=k^Gy}mt+;q>T%Nb;e=QMKN7iZJ(Ld*sTBwiw|>|HbZ<N{^D%;#%!7
zi>NJ6Xu<8AOLkTpFodk;a7_r^m}Qhx8WC~47```}g8h9WL+*X{@q!EkSTh+qkV-y5
zSuErT<WU#qig{0_bqjI4Daoul8EVK(lHMfy9<P`DS0xW4*&z?kCk{C`9v<~mBehy>
z@{H-JPNfYVVSbaZRqiuP@$NsUk1nO@P>Ia1hb;N?-ku&YqQR^+Tufvcmr3bAeTDaU
ztbKQ1oDo%GnMe|nXM^fQ4_DfCOH-;^Sm1Gk*HCDSs*<NuYYX7auO=JX7KAO07OsMR
zW;mruI}s$n&mpeLLuEtLf-)x*Rq${bTAhdBaK@*RKUY|X`WcDK-6$)~l|)i;#|+)x
zDP)$(BFmiO8#_5Up&v`5yBCZWB?F`zF{OEPy~er?{@gqYl7L%wu)4V$cd?NBa9oE#
zZG16E(ooP3p%hK3#woaB3<I|r1*5lTs=$un_Hv(gUKU_=@$ZZtG>7|5o-^>M<Jnrj
zRBv_|%@>eoP%{^jdY-Ri(O%bJ8xCyKU?il_mwgH36gM)R^yU`Yv4;tFghOlm_Ntm7
zFqZNP1*IsG2aM<PH-IVX3%#Pg9d2Qzw?Zn{TV69Yf&Cr;El~FTYN;{*dlH+(&%I*(
z>=lG_%KsWaf&C24?iov+VXQ2`5LZjyal}&@LIY>X$idC&eeq|rGL2r(CjL8@gGjth
zYsQ3`@8TO0uXHi#)lC>+?M|lr*36-8N5&8t!00i=l42y@d3`KNDq}xZA8EXMMaYa>
zX_~pk(sR1_D!0LieGK&__&YY-k(X_^nj(*HGM*?dMW4;*ABY6zNiCGbs6mRzx60wD
za%mcssG_eIC1c;wl}(XLMz%D)Rf&#_Jz64lnIfASo6~47FR#hqgS)m{4c&(+B_JEW
zBG;f@?E_C)P@`On<&#<_y7>&3=VdW-!wxc%$}%Dmc5^X-s=xeW5``?~q7Ah%Ei{Q^
z1R4WsI8Fb%Nn3M=AblP#wpY+N8X6ic<4$SNK2AdNF;4_9tDd#zNe}_X>JnT2#qwrA
zs6WqJ?*DoL;0)3lMd1yHkTbqrt<wFD`Vq5_lF^cdc3q~g>G-vh(wJR#pfM};S>)ti
z4c$E1+e`y-k7hFUk!0hZs85HX=DSwhr`x<duq;FeQ3P>WIhOrS7U~7)cJWbKLSpZx
zAMTLy`1BK~WNk<c_9{StH!=9^!;R|Ku8Cul_^3;+yjEC)4iEUMkf`8;fop#nsVf@a
zsUG<RTr41&INf$1xn^-5_f%t4mV+7CT)@a(`b0waH_9$+J!rYU18QE}Q0^3+^i`}Z
zT59CZsN@fJ<j}q?_G_;ONGz{dLUG-6$RT+<K5`n_g;CBb7N^>52!`tlgMgXjfv+?c
z{W4sthY3vqoK!#3;~d${$z8q*>daK7=G?txxF8TMfLN&}U4cUPQ;iTY&!0;Nr>@b|
zsx`g=-EVPxwLWwzeo&0iIB>lyzeQ2ohEp)u(;MET3ADH#`hQG@{dn^Pt@Q@oSqO)y
zhIp1%J&}E%jRC@hQhuN`<YFq4K5SMB!2fwS(~G;y;^i?@<Qb=d^bQ&P?JyRgOb@CK
z0m~{u9Zkr$M=3Y%Q%YTZHL3%=38<eHs*>-EAjVs7h`JsMSmu^mIV5sCw`9mrJ{jN6
zRBM22%Hd)=y!=wV@Csk^A8xB;hd&NvZrMFBI)s8QN>3|m^hC(ayKpOqzkbO0qxbIG
zD>s0`##!{;npN7ecw+13Xj8N8aB6)r8^E=IZy6*Ef@fjOE#t#02p3$k>o`s&rj-a0
zBT}opOBo6{wjfe}35aiJy|+Xsr0I_$UAK92NY<0C5b-b4C=X*fH~^LSgPZ7R(WQWZ
zfD<KJN$00WUv$H28rS_V{$VXbpWg?W1F<e}uXS2euQV5!(~ZQWsrI@5lyD@z&grsc
z!(_WFOUY>as}^=#aEpTj6Pkjtvu3qyJTGu-92>JzR-}6kT6F`_OnhY8DO-WBiILh0
zp0eBkeqP~YwdKl}GKc$NRd;$_hCsVW#JggZdgh0F9kLINx82iUB%vhu7<h6uO<Xf`
zipH?5KT!{h?rApW;0kxMaCg99!1vU1o`j!^M-5eRgh9aDLlH_`?FR%LEk)jSB0yw<
zMer>JOFD9;>7?;_4kWcQN%q>_F+1^8@*p3n@zbkpM+A1dQXoTtMapKNKBSKSqw7R!
zV%!y=nxa9EWo^vsbEe{cs~Cclwt{+KMss^>0%5D9X|oWVe=wgX_4MV6gmWJgtloc$
zJBowxTn^C~h%2IeQ&3J+@s%SW{n0^<R#Rc_M?H6d0|77UhD3`pb~r9l2K?){UB1ci
zJ>>bO9f5x@ObSoLobZb2<{i5i=TJv`=GHE=EHG)*w5sG8IKc?iVzLotSxA^4(9NZU
zOOxPP%y;^`(C|ml8g+TM)oi&qq53VK(kURa-t^LhO5biT;F{ZfW^qnr!k>%MCy3a>
z2%^0e1$`_FWT1vaC7`T|;V`ZEVJJ$GDe5V>=++WV_GZ)znb5|h+{0eUa2Bk!!nLsZ
zP=g5cUrnAnIE$YDfZ3V@A0rK9AGRD3{P-YU)*+>0B~l}C(pjpj&+_-&3b2DL@f;nF
z*?)0hf13P@MvCIaIeHp>*9C!b5c~U+OI^G7FY5hm4S*-%Z^Ud7K@qbi=_<A;7U4(C
zZl=F}d*-i#w^NXGGsB}Dh`#iJ!TSYB;%wuv6ZDRzPyR#xo2rYghUY%2{Mt^?lYUMe
zPKNU~KM_9wagIXQY$b1PG2;)pPe!z{U}<INW&7+awIS;uRu6~JxXVkoE!kau$o%hn
z-(Q*g4}GOLNOe)issex2c;jck+~yNDC-Ko#>bbyrgWOJe(Q5)CVcdVVupVLsRF>;I
zm41+EEk!FfBnod3zLyh#`C&)`DJJ4+d~h1(QapjZDQ@xlBLAl!dj7g3PRsQZfIEa=
z5T$70Mw#p&odCpwgMQrYDh=RFVp?{|4fNznEe6p>Pyf+GYa7IV2l5bXiNC^h)B&_)
zofk<@IPNEqE7BbBDyl=%cGPuYU2*{$D89DiLXG|38VG(V1)LMS$UJe0bQkVBfJ+bL
zz;0xKEiP^mIGF}uNsx7zC%6Gg<GA0C`w^fv|Gk0PO9T3^liRt{YrL|66Z)Ud^`95>
z6jWj*)bB^)a+L5--~X3${pZDK{c|z@KXu%}>rBt&ODG3Cd9u*gb&41Vjm2c}I4q++
zvxZt)I5UeNcuU<!0XNL_L>8&Far?K?M)-?_(MnLSSNPd_v@KOxu@TgMT$y!p`{q4V
zKI4vVHh5T|Prf_70^n9;Rchv<7mzh9vOip%fN<0YCf<gd8Nh2<-yW<2M6JW%lhsKH
zB$n0u>GO>*z{8%06%Q(;g=$`?ul`cTVX7AxiP5-U0Ni5CvX*z*O#sho4#&EO0FSkN
zKhb*~a6Ox38kf+3yqenoNm(Vmc0d81=KpY}`Oa*BlC>Ystbnx0Oy!^FlSeRko|CfY
zbd&szU;Z4auAiu=2e2o-zDOT`AWhS7l@@SBDVB0Vqq~L#y9}*aiobn;AQ~1g--QQ5
zByYAz-XN)K{-2TX|MuxW&s60n2!tD+ze?JR;M9usd!JYDL1y=vO0eQPC1k(M|I)|9
zmp;~%%AQ96Y$`EIYw9()N#bRS>1~t&RjJ@I|68B_^GqL}U+(Tzt*VzIxN)ta&z(0v
z{Ue_heRWPw-UWEw9Cr^6!YeB)H+lbM9Z6-1138<n{(e|caU;q6|C<=f({KI6s<_+(
zN&*;KS<#lp5%GosMr4#8*y0Z?)R?>!Sn$3*73P}<yFnrzmw1ole^{2QZs_16e*bV$
z$pk)a))^*Ud{m<Gcv9E>AEkRMb><HGO*15l*&k!3s=c*?Y)wQo4F4YcgcI(>K4{nB
zZ7LfVyh!^w?To}tG3RWTNarMa@n_c-R}t~13+0u>%kmnH`wPbr8jEC;;E)ErqOJv>
z9x$9WD}<$P;g-D~a6ij@7F&`)nJNm>4t)H)kRy?^j{YdG-C|6k0ZNo?4kzVH_lBOj
zI17hf;t7=Hbv{242qWPb51(T-$@$sivs?IcFzDp8df+@fT>OB$XZ?^_IL<uROY{f;
zn4$a`8Fpx_lht;~GRkq~Vh1C7WbI^XEb)_t2zI*OY7QF|nH1U(j*o@7Jl<bc7T4J8
z`QBk(K<})d7mN-iuu&~GS|h=mQ+<<8r&Ru-43z|6PT+8p?;O=Q^r4C5Bm9qhGFQEJ
zZ`eW<-L6?{Oi!JwzcwG3G~MVwv>_|syOH<>KxJ>KtK@_Kfhr?ih3ypQ*kfU50Z-4R
zDT2PwL`G35CO`KbmUCC>(`rpcJ}=H19dTj)a^8CLm_KLJ6{>!KP8ik6NjZ_3V%R#3
z4~Cm1{ypT*{TJU$wl#;F<KOP~AAony;qO))8r4EfTd*kqBIxJK*Fhnhk^_R=XZzU#
zK9N0_y&L1{oOwrG0no+Tb%oS#xt(BU%QWNW!{~1De6XI#RRJh4>UJ_Y)DQi`pi@{g
z$<zIOpS>}YE2I|o!sK&025?S^64rOxO4*<?;<rt)P`o&(^7LNeZ_P8w)bVunu6x|H
zyu8XL-FK76j|%)%H@Kl}6$0>{)XV4ALXX#cK4(xV_1f-oU1~EckHt!PTx8p0Li=1i
zsh1pdE)?E74Dohb2fBAgBWfgWc7#Z}j3afaRl)c5ctc-lFuu-K#4x-U5VX$`$8ldm
zMdP!&eG&Md&&noODI>-0*$aP=mF3Ip<Rn0NQzd118;gP_^@tbm?4L;#m>NpLR1uUi
z{?&*-V1+NXsEkgJ@NlE#{_H1}#bg_W-EvEaG>rdiqDevGIH2N2RC`cJ4}<ivt^Ra{
zUvKjpeY8j8q3kQ_TfX3JO8Erf&tGr1gzxPa`9yrxa2!VS(}a`$sY8`{pcl#VXF*7b
zw(d)52~PWEF`pzjtvW}dM6|U^I2AgjZUWh*r=S`md9JVZHleVisqb|36^R9f?+Ys&
z@3$G;<p`n60ucP(+Qcmf3T&qsAO5C#onx5W6X6?M!&ds@2m>5kxM%Q|ddQWl(hw-&
z2OkC=G6W<r{7kii4K06_Fia2$#sEtVGWLMiMqZrc&e!Ey*iEmTi~1g}XNV3Sm)zDl
z6a(6{oDHMwlJZ8uoN00Oh?{hCejZp<ROJ2(ST_9|zhhxRO;1nnurYuF$>U(w?s;Ws
zVgd~ck1$Vm8^Y)s_dVvX7Rch1>omwj_r7fr5(i?E8VlvI;o)dJw)k}4XjEKgA!1+$
zZtWyUfekhc(O)`o={}u^4~73J)-6m{ig<2$C8tjSneEGOq}*v2X!W&40P4w_tlF*~
ziFQioFQ@0-9o9Z?^TzMNxInOWc#=1MwrxFfe;X`jBew9~?|rd>xZHr7Z#4vIVKaAr
ztL1^1;wcjkBs;--WO&6)iM~U;V)Yt6gLa=N#E+TrS-x_F`t5`?s^1`Vwbb@3V(%|a
zF85PnhKf!8e%=kkBh3f$Y6P1F%tjq8vFf40zY2kz+S}u4JXq~sE}X?7y^?Wxz-)LZ
zi=9s4EsuXR9%~?Hy$>9!*utH|ZtNg*xmF#V=poT*=p14aoZ2fE+{eLT6DsDeQb9)j
zChG04xH;>bcdbfAI<|bCw{Hf2WQuV>)p*!y)t^LXf=6>&l20u`LZj=CJ(l*`ezmPX
zgdjDZO_Q-YMEvJnjKjmOqs=05gpR8fL3=bhn=m^RRuO`G?OSG;R3-y#vRm{VV}9*l
zO~}qYt%|GgAZCL*S^S}-aI6e)-P(@N3_n6tch<}f0tr%0t`Q<2X&E!Q<Fdwi5k@m8
zbm!OR)mXwlvJJ?0C#GFYIfrAxwf4hz{gr<%JV^}5^xW9YHF>4e3WH_U_b~C-zTnh0
z3#<WFC1Mw;rKuqstqc#~3f)|+CaClz_aw=5RhgTcn~j#698a&WLqUO~VqV_|E?V`{
z;F3#G=iAdid5k<f_$Wi~HS=B|7f`okx}s?x3JYcUA@x3)Q6GP2A`|22Py+qU8<LR+
za&poOgLdJVmjHf0{2iLswC5|tt+4=$xAuS#S?v%m=teD8t7o2TZXLREMA9&oulZa~
z%Q%r4phja-?!103b@Tji@%l@41^fPIh8TYHAEF@cy@$Jc#czv$&S?`$_V@hH<j5P3
zz#o9JjleD}Rw;a+w>_S4@LbV#OjPNs%HrgY5_%I^GtJ}p2mNC(y=WbetD!=X75dc;
zVNi9k?E)qj(kzC<+eG)zPJn^wKK4#K-;%5$6L;926xN0X6pLimI)zfZmHJ`q`@=gn
z+c_JqpQ{9eM!mrVVKW{}6PXr2n~~@d__BFTT8cl$=cUT~eIw`0pEz1Ffz-YQsiAi)
z8|^C{uIc5K#>-DOM2F0_BQs*!YKOlY2nxrSx;%4GydSAXnQ$ApW&E*XE6JIiE~(qx
zpP)jVafA?@FnHb9tH*YD?Z_zI<0RL5ns=vX^<GqPV8+i}`mS80H)cN>@F|GJYky2k
zSB+VUrT#?7=|~!>PT{DU-rX_~8|%R<|HFLNLZb)LKD&)SKd&25LPp>F^#t+WOjb&$
zvPh41Kf(;f<K~cgYvT@Zw;(YG3L`||9#%86h#yH@t#!UvDxGVs%y=6}bG*Sk`3tq(
z*7kBS*%wF`WaigiGd}~z5_v6_>bHgw=oEbf_A71LS{kP)y1dB5e7HV$m%<JX)fPKH
zqcB}cn_s}e+;QliBIgtz=@1Hm>^R?aII(9dXhT0kz(;510168*FWtLS`QrSosip-<
zb%0Pn9F0z4&@~2CP4eVR-hvRC!tbVt#;gsaUkflMUY~xdN+aE{G(FzZOu!F7$a%(O
z+tI#u6}pbbd&As?s642+Mqcr@vD`wgXiM<%GRYt{KC|_Ygdjbo?#%$+IjLT~Em%D6
zN)I*J#b$Sge|)r={BGiP%QN7gGL1~2b=_TY|Jor*fe}Mg({e-QXI>Zt|EDmR4V=4J
z>F{Gd_i!1amhkN*-tX^r4HA|7Oe!=%7Ui%H0gWlpL|pFTY6`=H9jd`Tu_JrAEmxE2
zH?vf?VgKT!nZ>X7+mbZj`Q0zygp4GM(%k8~8m}63cQ_sCWV}PlFbaZO<I5cTzP|v3
zAMb?m&#sO$TXDI2uoPhEF==!#o7r}xFqK%6^tvRtTO+ivk9NHz$q>F+td>Ay)1zR|
zQa0=(q{d6##TF}<6+$q5<*<mh)~sCL>}R7^QX;B(1!nYRa?MQ^yL_Vq(>M{AH!5W2
z-AoX)bL)gYZ!hytg6MFV^3t_aVFDrxkZ`)k?O-T>WQEqbaG?{{gJt!%XC(<wANLc;
zLQe%T!B*iR%_azZ%#sX?`MA!f2iZ3D+Rfq3?@LX_L<7ifqG4Iv4q3Q$R0#wn4hM@U
zE+z9iTE_HCHK;UCTh;R4tI$Wl=M09y(s?Ec0&pmMVY!=k-6W#TPFs`F-oc<^Fm0f9
zhwr1#CAZ%bA8?i<AHkrMd(+K{mkYjn?6`+(U1>HUq_9gfu(Spp-ZbkvHp@-QCx5{#
zgoZ{+&v1#4`6(Ze5}exXS_)qgTd!@IGoTXoR5afT9u|%7Z+Wnx*wJUJJ_O2$61ubw
zZAoB_kUA^~eUr=5o6#p%U6Gg|wlF9_4=i3WkuC;yD$}eJJrkmmlfNb)6&~-pxD~2v
zuSE~5cNQF%e>b3XQm)5&bt>oAWXXLGqKXzLNV<djaC_T~g!}eA&Qw@j<R{cdOBpI7
zD^d{7PQ2<ZMpM9LHxAB<)Tux5w{T+ec0FPAWqGsu5w)MD*7;MnP-N7mpkv@Nr)fXp
zB>|sUQ}A+!yKrSHBJZaoAR3XzMQriS$#IW>rEQap3&{RqTE0XW3x^`V`TZejxx2Pt
zoE`!JjuME(1)yawj>#Cs6O6@Sg}SeZSF&&w(hVEpUwld0tIg*A<$xk_BJ-x$u)5S}
zmdC<q5m8tcr>A!qe7{{niu}(9U%%}HzBczVgwb_wWsE%`rg!Imiw!z8^ssA>>v0^J
zy|-bzzNsg<AIVgKy;OnqDSW!%e;JOrJICU&06RA2j{xF`INW@F2kN~lyIt+8W728J
zCI5o$`|;y7D6fbG)Q#uBe&z)|w#m#zQsbk#_|Vv82yzub0}^|B>hP;Y^t=2&*=prM
zg&s;nYzfyRm;>yZ!kh9q$e%lgY=7^Gv$mrE+%cd!6%dtb$YO-(r2MAOzgvSkN$@S;
z<a#epW11Z988e37JHL8Vy3O=8Z3N}j30}W7IoWg^l4F4f(wZ!;m`dZHmHfMVtmp=!
z@FotNK5Y8}cE{l)s*81K*6~U7g#was!*Z=I)@*3>7jo{nD&A04>(|;%ANiXDf)fh{
ze5T$<j&;H({=MEQXIhUn8oL40SI;nQrR)!bQ@jn>CE=jUzLn4Pmva&}T`|t)@pO_3
zAm!gI;-@<@TTZdeT^Ri~?z+&{VeJ%+E1qs0EAm619dT$m%gfbKV=13e2*K(ajUj%C
zIP&_G=fv*w;Y_Zxut+Ez)^S}V8f#}-Ty|}Lm;N75kyy>{_m=ynmkl*4^<E|J35svQ
zTSphO;3Ogh3%_SG{|&41r{&)j)vyE#Yi!^>ft7A7^ZZ(=+eg2`w#ILexc+1ckFmqx
zY~{W`$=pIYmzdRjJUZNDN-B$NTZw@<KadXWZ@NeBrwX4EyvKQ6_hE*60`z&v$jK8@
zeBZFnR(<#Y)bK4T!+GmHAxO1b(C}NEV{gTW-lkcu_eD5-`h=Z=MVON$jZ?h)tB#6G
z_Z3EKKs5!d?gzj;=xf<J47{OP3O7_)2m^?Vk15Mk3_aC5C1Fjh_97U=oxM6P7H34(
zq8NEIy0hw#aU?{G{xb<yl@{rUyb?vGeY*bkFKr)*3aeIwL#{=;Q?TU#7$!aHUgh=b
zo0Z^<0#jk|dtD?iDjQyhSE*#=@f5u~s>&03jZpbTKi+f2zRx=T{98;yKAmyk#t}Ex
zH`7?Y%k^)v1|Y$@u`z78Sw3z`MdR8P6(O=kvY<8C@*eAV1k<On9W+RDvOxu{N%^=&
zZ0P8b0PbP$=f?h?YKwec`3p^y7aqw3N$WkJ&?R>F-9r-7YA%)^a;uX)P1P*kL}fY8
z<~5dVis+opuWD+SnpYVf8;h=gIBGpMKFXn<iV8x}%?N>DmsS)4BvulQg0z2?V4x<W
zc>Xp^rP){U5F<Q%=c9Qjtg2nZzLFnrGI*SzC>hcX4>M?bGWm~N8PhSMEls@D@zO;+
zHD5Ayx%x3WQ2&A=vV4(cfGq^5IfD6}kUQN3X}1s;1rZTF1^f8;I4}${1{i?`j9-7d
z{HCYb`pFhD)HDy{Q{_%HS%!8n4HuVIU(cG8OTDjyLZvD?FtckCDVmqp;~)N-N29Io
zGN&r4TXn|e`bb$hmQB&>u*>q!;Q}63mO%!x>Psw~oQQhl<hZFuSxeLT;GZbXQ-2jD
z4r)y}ap$dINw-G~uQX*NSoQ*{cCj<reU}62IZSL|L*i$(QeTCVX=BjW{(DK#`mBo}
zx-_!|kuJiSV2(^Og+5|>SJ_G0%7`E0s#I-Y5l<Ckc5opLAToMwE(ll$Ga*FUs&emM
z5P_fdc))w);QmGcNy_;;4kbYu%(sEAma2<i_1@G0N|_dO%wu&9_rmwLBgj>0;*Zey
zAt<5o`H_acZp5;b<CYB<v!{0b^mOO}L(+}MzYRa0Z&-ePipz%IE7{lbHjCF8+m*&z
zs&@c|M%*&`s`!1V3ZNa0w46izBa0NX@|>n{Q_booh&E%xZr*l5NBT|r&xuc=_cMD2
zeqS!!4Al9VRIAVdSM2WcOd9I4M>n15q=z_Ilb=ISCo;|c%($o3%6<I1B`SvM6RCBq
zjY?8!C3w|oT}yAw7GOnXutv^k=2RSN-}4l$K5SoKU!UH@4J%HR$RGhlZ+!e4Bk}Gd
z0_s72bLa%tAcsuS^(HJ(&JnGftvORQ@0?2xDBUD>CRhlJ8XFCfPzn;k`<R-HQrMI8
zr&zz`ok*t1qbE1@M+E3!LN2b28#8z#YmWFw`)ZO`igqH)zV~|=GtRg)dLmr5mMFaD
zzwORO3eI=Lzq!fHrMbr-mi<EsbPeQ<>kL983B(g<3nUeS)I6@rEG%nh#e6=FPWnu5
z9>T_Yjo9(8FeNAj_%~W3domQBQW~0O^1LK&*EU@30&@Qk6FjQPlu#$d@<oZ~V5q^`
zw4Iqbi^aa<U*Lj+!%kH4Ik2bI8%pC3TXtEWp_#E-h6%DQ?`9-*1naJK88N(@4^V1S
zzxbEi`3z4EsXNz{olvZFI$3PsuEOG0-x+at2XOXsl)qG>H0_9UaZjXEMK!W?+?rtj
zmmLIiIlrh-KQxbfiE?S;AJl9sS>=J6Vjo_?(fniyFv-r&08dw%aSJ9s-&1OX>o~2-
zFVn6()CY@0a$0(~W3R)P%D;Mn2xAQG>^&La0(Rd-(bgeJ!V$3@A!5;X_4UEDQcK}|
zNCUXhpZ$GWJ#pL&L)i%U*TnuN8iahf>7lV6AdpD8uHo<tNdLd_n=z9~#uAb(y_!E+
zs1a@Qy)4*0)%%#Jk`qY)>-&=3K9gl6_M-L`^JOhCLlks}5jFqO&s;a>uxm)UzwTT9
z+waw<fD7dq1!|4fel2<C9~trqU#g8!#t!B~>^rj@TO+*2uX=N|qAOLL&bS&qfg9d1
z!}j-&2cH()-Me$`?a!f)?tgLrANJlVsE(*@7YxB&H}3B464*E-1b5$faM$2YZ~_E^
zLvVKw?(Ul44#6F!Ij7F4|4h~QU(C%^P0bxu6y0leFIK<neJt!OT>4KusRP*}S%XOH
zz?OciEqvLU$W{P_Djr+k;u3gYoZ+K|=eNiO#fUdnq}B@nn)jK=C|8Mn3WXh?o|;*P
zvx`Cd=itauM9Uy8B~#mgkn=n3lTY`Y#cwfYbYyHRg(XyKRx2?ny$JfPmyiBH<BwiK
zyDN7v{?hL_16~V9Zf4-seJ?{`j~RdBr?YflFhm+98zGk*DI5kfj+v317DGuA3KmBS
z2b(@Jwbo)hl_OJN?dw{5;|MEwXWc&bN6w??>d65&kNQ^4V|vLUqpXmp<VL)SNDo$N
zkOXF<36s~&X$UH&a;iBu2yUBe&`)X?Jz8O^I+fFrvku<UL_+TyKh6~igFw-sHdr7a
z@~2FKl4|BBF1|U01`#$=5I0+duf6`R+y>U)XecUm>>i8u!R_F+D!w1ET;3l){WShr
zugf_=tR~x^G~JHTLKP<LY5rN0K`~)ywRQ+k0turA_fQH9CG%Ozvs8757?iU;vWJr}
zB~l2uj`m=E*`1|J<^{svcJfo_slqlv=QR#d-@s#$psIlxSgF^gIf`#jMJ@)7;CPSA
zv9MeG<72r5(+|>r=2<wJz7nlcU(@JfDYeOBaxM_eIXhnOWs4KLdmj$XO!8z62@@U5
zjq+XBq&Auoe9<fo4Z<{zESHdg@b%bL`!)2YM=b>RL^WB-FkgkbEsQU*K9G36|Kpy3
zSh3nM=61LLv3uYqt~}l<_p?rnj0`x>{MzQScafY&DPFuGbAFyAlyKX?fz}~C)M1oj
zBY+S_=cl~LU^jGehDK=c@9A*^n)6>9YN~KF=Bb~hbT=a!qdn$&?Uv--Fors!!dK^s
z)dqPeDsJrqB8}ct?P-mNrZ>WmT8tUt?MgVIcr<&~{EI#h#df^<hgqhB8O%XlZTC0L
zh&R;hvy1JYkdrHp(BNO!Q>S4P@MwXdF_Sg7Mx4uaBWSH!g@Xo2j711kM#EMO(8MA?
zjUg3;Ua|^<VA!SU`xCDCwJ}lF(?&6=(L-5gCzpXwg#wd&Ji)?$VDvL~3kG$#31@?f
z%R_QKqy5O=e|=v?Zv(sXqBccQjRX(E;wqYD4ciS@8kdNlxmIRFAR{B2zdl~#!pFy_
z$FiH2M&bmhVR0sugv*LO!gclaR_ZiAXhqPFkRS%Q7sR-A(O%Y**Oq9=9C*Mh|AKr7
zHf}U0Sx+E~sk^e8dtd7UpQlZ-l&G@Y!03o4%xe=Ew2ttJMzPGYIXxb#@E?7$OCnEP
zO2c++;GbE!B6W(}CQ&rT?PaVNq3i6b3xjaJUb8G*B;x(#0u~}3HH1!P2((^uxqs9>
zcWNwAsb$vbVa$H-8h--^RvL9LU7=I#Z<h3s4j3h34VT7;cFd>ay=;ahHzh`?FWG_1
zAzn(U+BzFNawQ)}$S-dFyF)d4brlVsQrN;WYLVOYWIsSTJJ0((j+1;#hm1ODPr@Pb
zNu!g6dQ!_d=jgeG#0Oy-*6823Z2bfS5u*@qKf~OrMadUqPtk-<2K8aJZm|q-czA@$
zkH%THcb{)!QWYC08>-TV9`-fzPfgROX<&S&#oe#)c_I8iSM_m>3+ggj?kB42z}@qs
zYkh~7v&N*j!@B9y)eu${IMCI4kzq6M1L|RH++aPUITCOR7a`W)5bG9KU>Q|=*at6n
zsqLeZ2HYcyupbCTs5Z+;@m?c#Y+xgDocx+XT6?_h@17e`+m6<1hJ&(0=IC+c?N`kD
z_T!<SzveY=7=I_o+*XI&RCm`RHY$V!%VY~PJuN&f?Z+R-?|ZU2<KPgSvcXD<bU1pg
zCigQ^<OO=YJHN+^tMAn6`PS_;fKwtjH;&?BO@^8&stOE13HHOhJ#u+ZI-I~3S`djl
zlBoXT^NJRm*(vE-GpBmqEp@@IDIZjjlqbH#$~|<dpHNhy_hXt~J-5ke;Z^q;bYJbA
zWn-)xP2IpKAwHh3k&nPw6usZ>2&7RZu^FNj$R|G-*D5P^3=k-atv&M${Rs=y%ST~+
zDc2XpbUziM&ao#^h}I)Zo~$n(=+}SWF^rA=8~Bnvt;`_0WhQ|`jJ~sCb>$x`Q($2u
z=zKzBgs~-MC0_7<;3ijB%J~ot`uV*8i4iFVcFw&(1r~HTqt&JTBPcS^<fzSn0UqQz
zr`1I;0ha2jzV2*RL1TQ0p1&imfI_tN4?;r3S5`>*4Gu}eVG1x4D2nsPoO3}WRx6UL
z#?nguKYktm_Umwpdou^rZFOj3wQY41SPNlz5bVIbXFG7!i<0U<uFU^0-t`tTzvqfX
zW+=w3)S`X#-l^b;^Rgts@MvM=2<JnGzvbVnyi(Y0`Fpcnb!b0duk-~5A0Mcx-_M$g
zNQ2)mMxOWxQ&&~!6lZ)Xy+dC!3JHAJ7v3%Slk)(NoqUWEA&0*RBbWe&0R|ov$Q?x<
zyqPVIVUCfHL9B)_%^Zjk8H5B*1y_kXC{bw5ICM3^&6Yx;G0v76a#RBAJhi;gU`e1z
zsnWNvO%NUgX~^_41HL-#51`9KVzuxkufvp#Af)RffTnCM7DxCuTRhGjGgt|@b~j2O
zP9SjYG${;mM<ogbE(8?>U}ah1f)V<FfsK-DQ2+xgvuZNZgFc*l2M;=&t4!4du01-h
zT6qjC5zS7B0dQ>&UB&hqXQdp2=SWXiG{#;Vk?Rp)U=OaN6Tf-LWl@1~%hn=@(*xHw
zh65vY{dbctdz<t;w;p>1)b$r&bzUE8j+QzrQJ5bUYr6e+lYV%c^t0fu#a}{<d^lj-
z`PwiPIKTsC4<ZlwZzrwsHfd`@RxLY1Sw%&eL|TP^57*W(Ffc~_-v}aefb{tgAOIR-
zV&ZtR%=4B?$Yn7eTv1U0K`AE|azg=r;s>w*`6T)Pz;B>yZH+{|L`|7M1|9I-uXfy$
zCI(PRfIk@0(eVKgjRoaOMVS*Z{eoi%j6Av}CBG44Y$zb<V(WYgBxOnKlD4Oo2Ql3!
z%m{ltpg0F=?D6+o8i`(gnG3w0TKm!CekS#47`)o_im{f)BbC)q&R!zJ_jEO*C@_v^
zl7|Dty{GeG*1IxoV!7u|vV~*=Mg_zy%t|e$L-uL=m7On;%Rnl=zsu#iMS9hgE)UlM
zW3$Ed@grYdcXnB>NJZdS=abn<g>KT1qRLf=vo`?|@BWM`a+)g-W;Mk{*r&vwN#9bV
zrxtOrqy7-_^<%8%R8hOV0v-^~8KMJTyxkgM8;ix*MS03}3yzSZIL@Lsd$3=z>|)o;
zJR77<cdftfuMV&`=cP^dc0Ka{v_x_4jO4l&x}`#FL*><(n099-QhFC{7l}Kd+$;Ww
z-^+t0oyExTwNkUS&h1~<RG29PBa^^=@J{xl^ITGMI&&QEKla?q&#y=DY!IWmPE$RE
zJ^$gO>T*jjytH$8JUM)CCdi-oL$P=5f_gn!VL|sD$an>Yb$9myjf=mO2Z=68-Q}X2
zppDeQ37lo|W)~HF2P$FkvwMpE$|2<7q033S-Vyd^rBSjp^JL1(!TzFAM(~eRaW{X_
z;H7O3-F6||KH2rl^P|Z`rpTvnu*kUVmgFf`Kr0r7c`$b8>}bBc2hdnA8ABkHaA?Hz
zXDV%)C2A2}2&ky2Qo43WW+Ii4z;H$tXi()~?6*v=y}t)pe&U9uc$@|u-I<Anlb>qQ
zc*oo&r@BL&>&H(4kh*R%>pF#AN7C%)iYYXZl=i)T2__UGap9}RqKWo(xlVj@YU|jC
z*F?G-(yR2{6Y?RBu*gI1G-4ha?#&^BotOtJHtU1bX2-K7*jMXRk1S^MkAF;*W_h<y
zCk?%J8^6oL4S0Ddu_?nBT}063ck(30`(8D_xDTE;C|~;zYdO|$8d5(v=BC<**wlOk
zsZEk4C!*4F{AG9eM{cuRBd}6$VaxAy$L{5N6miH?Vlp^M!T;&q!H=0jW8pa%sF4(N
zlJOYq#<So5a(c9$yLY0BbSv#*wt5%o)s@cgFD;sM7OAXOSX~ZQpph4tA1gfdES637
ze!=ioyvmY1IUW*E+pmMGvHGgd#oj|>)p7Y)A-u<9Ha-!7x7--5R`qb$1Ck@G&|e4t
z+GMf)5vdk~mj$W$P~3*ben&>LQ52UcuW&##xY9?qL0j`zCw)ONaNS=6$t0?tUo0V`
zqzmJ!l2|bAlC3+xyDS{`UBw-HUp~6Kl0EScDzX|<@pi5ICs+#SuZ}*7j5;p%=utE=
zo}4pFL39{K8^gOE{qQ+XV<nOI#+NCZ<WTr#Oer!^b|;RU0;rW)oq?xUj*}dudH8f8
zK<TPd1%YY_1)Omp4_60~Od4=-je|3v6%-Wa7s_?{Qd3iZ16f3X_pI>=K<|Y8O8FVw
z3z+#RB?!x1UtRSYUzl-ms@z<S&d%ao5!dAx6y$tNVJ%y4akbXc(V=8##{ispAkJs&
zG>US=Nyg6*pLoKeIEi3-86g+j_23`9Y_w<{9O>1Qvj|@8-n(CD{W$G72pY$FU|Ej#
zo_aQ}=7{h&_XCj%<c(jk$dYJ9^+e-ECAm^yDL4Kp(`WH5U`OOje97)!btLWPv+bXs
zqu8I5yTKW@zIXCq(G4&=tw`mENX8`JKU}lT9!_FbBEqyL)S#;)j^<a@-KJLayKcM>
zBF>0dNN(%3`4gi(e!1ka+z$@X<LdSmmHIoABq!bEa*l<4B_q}c5Pc>)Ty+6}83Bi1
ztwawI#|?!nH!8nf4iL8x6Y_p3a@u&~9Lz{Z|KKA(0rq++kwD=lmmBmZ?eRX_i+jb9
zSpP_-JvQTM|EZ#4Z6a&;zT834f8HTsWb>7J(TFqA>|@5b`+HGtiQ^u(yDXcEw0Yt?
zk;j*P9)tXPg3eG(eC1M6XyvfQDQ!qJQc8}|i=I<9nybxjQN>%p0MkYP7>TD)&>Pgi
zbgS^@OjdRVdTHUiki`_nW|Hq-ktQ*-TwX*WXhplel>Y4$z=_rw?wHwDKZD@20T+AR
zbPXQ8?CD8A7=`hK1yyFY2lq@C-~GE0Nv}j<wENllej<XGUb})@cuON!s~GF<>3~a|
z_}L*)4D(2gkNcGT@;z?Qb0-}YJm}91#u?r>xC+D07{GU@bTAKv5wL;yyS?4}pqL>T
z0w`>{{`|>;f?IBS100K#p|20;OiV2A;4&0Hj-~Msv}IrKZ5LZF)tGU3U0L?__D<58
znwn+<!C2Wx75c5o(S^_TU*;fhs|gDT;yA}XRAdj7o@3;%GR^5Go{;lULe4v|T+3!{
zXlbQiuGRR3VIQgATe`X2qJ+cnq&sitM*K4lVd0<bCo)0&n=Q_WYd~@eBqc&2zy9Ol
z8gi^yBrJeoT#qM9QrD>mw+p&DFgmt&<4hQ|`AhFr06Cnn2~Lieen3vq7x&|D(ym9F
zTH<YxirYxgKfM;>t`F<@z!83#A)h@>B+S#`8$SO#V`?0rhzJ>m(QS5qL?fKD{=Hq>
zP~E>75_L|MO=;$b^l*C+W@SF}w^edCS_*HenF_N9p{y#)8oltI)kgn8oZ@~ENKU6R
z7OH!&<VXcd7jcomGT~2t{+JncKWw%N70lx{fF;mSH1@B?v7Z}gK(MEmH8tqMxP3b+
zkBZr5XtBSOf0Ao^dEh&V6x=>jHNC*?Ynt;7K+tX@{`|3R(hqRnZcSwZz5%gkBGeAx
zT>_qA)AtaK@<)nTBqToI2l(s!Ny6j<%<A9M1dk1;l;|3PQ%wq7=3fpK!0n6;FV$or
zwH{uP_XdNEt+Qf%Gw_N=LY7Faqfnte@%Rk_ilm?``@U&yQhx8h_=N5@AyG1)B?#1x
z4LV_o@GATL<*3-FyTx+GMPq&joN?2+%ufZzTmQ0%f%wZZ0rlgo1FXU^TQL9a@lv8E
z7q|U7F+gQ7VN`+x0fmw{kacfesMz33ldrSH1Oe6%ii(mwvd(^WP7XyW5dnem^%w1!
zK)@d-Ff)(!-q9(sx8D7D5feyVJ6^>xayeNB0dxtA%ibqS8YRb=-WxP0hd`(ylD{8l
zE`!pS3$vo3r?X7|PA~t}8=LzQNx+!Q5^aWSzUcV`Lw^S>G}1bqMz!tC?6|=0NOmFX
zc~-;Yp{Nu~E?2li?AtR_LwnEKqCdcrD%z8nP&P3ts|@SA+$~-#s6Az0ZFVQSRU}rm
z()_T`3&9yTXbWG%JesO@Wm59UDJYCRYP8>4&0H&zIR5<cIEKXL=Z^p=R?H$nmkS&;
z#v~BKq}Rim%jgeVXm}ZTtWah2osZw2DU_;%gQ1s}Mva@9Lt{s;20g)I?)CEO9D%|3
z<*|`UdanB=MyZN?10|D2KWTq^?_7Le%@fZdG1eeW6qbal_`v?tDl(0*eyY{CmF%J@
zTk~>fMAJ<<1nD`qsp(`&cf)uGVGS{lW8mYBwxkGK5xlgK9)DV+b>Cmu>!NI9%4#bi
z<>+mZIB{UJ&%UP$l)Ve>xHna+RK=D^zj~rjice(uo)gBIG-=KE&WtHJETfZY+KueD
z%=<N>`Y-b2GI)Kr2|wqtb<=@mR2xPBLmixefg++-q7Rx8iXO%;l3l99-Z*7q_k8)Z
z+Tj8{M1-X#)(7{V;RZvC!?_qc&E2+?{dVNrUe&2Zcu5*{?D(&pNVjTDpcrq3MGk-B
z2LCEAXKB?z!qSN=%&wykiu8Scs9pte=Wi)uC4L@}x_}O%UC-|u8A0Cak5=^n(}#K1
z+5gF;na|$>dNj7SCwhrFQ`cKtTLk<$TYWnDFpS#<s2WsZT~1dHpv3)VuZ_u&s3y#6
z!cI(&@AblumpnS3hfwHLP7AXsJ#Icd=@el&ZmdBMOgiA-oFO+3{qTf`sHzw@3x|gU
z|3r)LCxd4Qh|HI;!sqS7ciWxWFf#vTW3Z3^S$cRX&%<dK=RAK%AZ+NKNt4|U;JOKb
z+d1j8v-|qK;Ff)h))qM$`GEDgA1tL&j_`W7*6J>b!l<_^U>vaU{&=w+8wizG(IXBy
zq=~|jDICv;_c0=~?)2JW)Zw=3$FjBi79Bb_s!gm$&rKUM44;6*#+FTaq&{W(Q#xp%
z1|xw+xyy2)oQlZlWD~SVGy(Bsuq;A=#i{#Ln;wF=D_zDK^47pIOP>smc!g8b6Y$2g
z#)IEfD?v#TV!ah#fU22D(3~)Yd|G)KE>xaf!B*O+n@$gjrYDrr1J;TXZyx|*UjoTd
z>&@sgYgU$XrP!liPcW;E)Oi6rLq{RX_Mk~!d-nb%bFcGXG}KfsnWD&u=ZZRo%%Md`
zz$UTm11sTiC_({`O+i6{FW{6<$rsF71X#fZBBtS70ye3i1co;#xd(cI)6XPe;f&i2
zhUXU&+9HtiZM4xgcVbTSaGuNt)5~Dd4kL$Pzp-QV^oXr<2i#9rjVUNEI3V6BSilM=
z;`T9F@2zGh5LW8LQN@Edf|v91<g{d9{63bcy8VwVg~O`@{$pITPclK;Y;nl5#dw$B
z46a^_L}o(_NeDqt=-=I-uze0|G|L(VydFgS*=mx{dd+Z!JVy>uy~Q&(_MWyy2sHno
zfn^Y!Pkk{v@}AV$+yw5tMTK>12)+Mq%^T;QF6nXm+BKc8XM84oCnFn?$EpKK2X`zz
ziowfE;Jw0I{||e?+dwRY<-8l=ANudEo?^?7FTdzhazl_LBvhgCDh<p%nY>&MVu*T2
zb~oof7Kyn<Z)A&W>uwgkvSkO3yQY4LprW?goIIy8J~}CD+7Cu`{O7Ly`$BC}GM(EH
zmPO;#nZsvupIFooCs9gmBb&0d8f)HO+C~<Jbgg|t5Y<9)Ae_PE{K&p@^Eh6$YA!1V
zi1g|D@Eg^Yi0^kqQct*63t=OxVOY*J_x_J!uUK=@AbuVGqPV39+CNv^Rb5-H=zrT;
z@M!=WdQ7!JW9j%!DUSJmeA@??{_ENl%$-`K*fZgGwuYH4%EbMzP(Y{t4vOZS;=T}y
zup8X<J_G~}hw|GE3;uIE&9)r#cd!(|=ym+}7o5DWa;ofjFipcv`{UW_2jI*-V(ge^
zYIZi27e<+*Jzu&4)@!P-t5ecCKr9vBlTuT|S;<TqS4JZlY6-=UdE3VaV6K10Nx+&t
zD_-dYe=VHYwAn{WqVi|3&N=s=Fzlqz)p!}jG97+oC`<j@tVDArwI8GJfT+tx*1c}^
z5><L|t6XErL5!@IJ54tayk(?A4zLK_Pi6}UuUu8Bo^)y|1pR)r>3eeI1$7ydb+baZ
zc-rkr7!r(5h3+PN8viAnT&|FN0Qw3~?}8_35J-E^Q7K-XYLkB)x#*vRYglV3QG!as
z)O}X|$Q9$ko?NwIR9v~d-$1dm#oxo@_iX5Fy?ypzzl7FcTr|d1Ldok3dvM>!3)9u{
z!S{PHiDx9Hn&=B4WNj_R_B;4(_`|{RXXOTQ0S}mmn%*C`c7?SLi4xu_>?_W|y>nI6
zSi7B+;-et4m+k59nA@jeTaV~Hqh`D=v@xbxRDK;m2*(ib(ZzO}O9(cD%wK*h+!E_q
zaZ44K)2PUzupp!#)tefU<P;ux^0G3YNkJ}GnS&lSTKKsTv$0*&^S}N2I4sI2QEnB=
z2iTWTZ=EFrsJLf<Y>mP=$oAdq<D|IzMI7F;TS$`yP+fwirfSgb(tf-aX8A%kh`Gyx
zlGRPq!CQWM^=E%NC&ZvLWWaE)3u9^FwN5+3k(YxD-v9nWm1w5)eOq2xsnwU*b_zey
zm(SiLgo14^KS||-y)IE=4U#*Jtfda?iw@_ZzRHVpTHre}?C=GAktBF`Px~FDKGCl|
zo7_eudR*U-2m+=eAE@oYRL~}MMTG${ic1<QfAq9qGF0A!QtVd6!n!2F`9dhpORAKo
zK8)#uowZDVibQvJKL45qnl*s&=$sE9KlY$;IgG$Kw&n{fb*EJ2ct+KC8|AcmhyVSW
zwMdBH*IJp|5UHm5s2b2ySL#(zw#4a4D^C$AmFl3*^O%=q`XHzv61OUnYi0R<J%2ol
z{#$$Zs7uI5i`+yxcOq9j{0f9^KK;dHzWP<=fR>ihJv;_AEWpGYCSwvGMD)ql0<wvs
zeIepiag<U4f&9U=TxiEmmaNEC$Ymo|^H~W_Q8fHrhN(JP<E-mZIdS!GOfc#cgR=;%
zIsel`1Xc9;$$6e4S7<l;{avCB%a>xFfTfBae^MkO0})p!Hd0ZEna}0QQnhgX<Ks_1
zvs?XsF8QIH4SwcCUFN1(NookvUf`ItR3VEw!eg4p@D2$=s@7H7yeQ1ie^O#aXi<e<
zyY88oh_wo~Q`af{Od=^MY4mh=UdBQ}5fI{{bcTY&XlW?}oIbVw06wr_i4T^Z4_6Ey
zlb0fFOgsQ9Pe4c^ypKkPHyE2{K4wbr!)hE^NJwa&tsf8AbTxZPIuEE-U96VziGCh~
zcJE|`oerZXI*7s{?~1821cUMuE!fL+E$XbPM_v>kt=^B1?`kkp2Ybo4z20FioQjCe
zU6?5=Tj?%e^4XhYuL*x5okYK+8+w_fuVm|QNfHD8*?Ouq!anbVUn=d96KO^Zcs&&%
zGE9wMGHm%U%)A9KCL+v?tugViP|8^|K>8QWvoo8!IYE(bp1^}>rtQ7X#8aa9v)0o$
z25Pved6K*O5{rpWN_fbTu`OBMPz_#NCj6r&u6l91eRqKUhnOn)Ga4f&i|g5qerjym
zH#&4Oi<M`I4~#}H;x-6qVTO_zf>(o2J~@sj?T7VdnYb$x`Ga9m4?t7($9>GPNcdWM
zgUOw#2)FHmit&s^Y!*bXu#0)t<g1Qw3=LVg@<nB11#ep2_Z`!`AhP%jOB8Pu&2OsA
z<eNZ);dd0>1iP*-4>wP#oHch*&^-~fm~*ahn=85*<9C@KNIx>O-DNiwG{1hdjGha4
z`T6tG!c1Qk1wc;2yX0ZDqz?rsCXgvKd#r1A@=@>K%Z^OuNNCF<thEP;hh&;sVCWR>
z!CZS}-!oe-!i_PU|J#tjq2t)K4S(dd&C~sU3TQXN<Tiy`Ob}Qe9v)EaCcOZAkWVk3
zk@71CUM{UOlaorzsDzZ_J<7drg<KKpHU()|@_nvGLF6d&d005pP6B9KE`+sgz|?$K
zvtbGNaEF)blP|xnW2Em2F}7&*Cw>|^;uEiQS7heqQQ0oSUoD2#&`GOxoE=*U99>ID
z3-xfvtD`g~SD^<sfLYQDjM&;%cW~aXV?@5S0+X70)ZI^fAzR-F1kzZ(9BF*2clM`P
z>Z17V+5!3IQ{fhS8jh$}Y?%U7uW{DmdS{+cAbUjOxgupE^}*ypI$6&7KQHHl)$Hj3
zf3wvWJD4!r>%I1h-jP1U=jp(#rQ*dR5!MLiOgI2Q_4ZlB3ze%=TLaMBbV%Rvr`VGI
zZ5I#)8O<yg+ORPX8rNB?wmflqI|c$6Y*|V|6`lcZ%#tu2ZyAEjVlHTMn&cgkp#`<=
zQbdRbD~dVuGJX;JSC>hzGJ`6VXTa)~*&hCX{_(b5`%iJvZ2`vRo0CYZ56+9G5Bl65
z6>KrIzkXBr0I7-AsgJpoM?ke<3b(cSzH;!!Utp&w`&D_R!M0R3skn@Za31WeHYqN`
z<l^G=vMJWivQ3H&?B6m$aHtMv>moY^S{ZhZEkOG~nXV;)ut>Jm0ntQH<Oh7OO*`gY
zVzBwBAyHSh)HKAtrZi}@UesofbX1q5LbmNbdGY|Nmnx99ch+tplzPZ!;?TF+kr_;z
zp<5nkBeYBa#YB*l%2_3<Gr!O~ZbBFDa7XX7Y)ieOK$Qzu91saD6Kh<xL9Ir$p?7IM
z{_eV_>h=aq@}4E8*Io*srKh?EhQlXEw-!>K(_a7F=d|HpIgqdqM|*HP3!OC?sHPPR
zjaFR84{0!E+A0ePiYz0<95`<jgI)Wa^d62a3pQ2C%_paCW(?ZyQa@)-201j5Zo@%`
zP=i@FpnB`7+ROHoqZ|0g*z#3MzR=C4bW_0b+4Jo75vV0e{$E}I>o)s}JYuGkI?T?A
zA(xYFINDLt&n@gfxPol>?lG|+qm9IZy1#uEY2BEOH(6}?kgR~XjvGN+o@SQ8I=mH#
z#JJgGQr&Ha`R#;-y<00w1hsK8BUos`uA1b-^6hb;$s;-ik0V*_(c#zXB8^tK^~5u_
zT?rJ&*Li)H!xfUX!LO1>m>(sS>pVEhmO&wrbBs|JKu5p@3=5JoU73=tDIKsZ9h%I{
zPFH6+=BHBv3uy>2n=9o`G*L|2EWayEjQx9;sfO}H5LZG$y(i0APfIcynDL;Np4tz%
z^)}BQVe0*OCr$;gPwxNN+1ZWc_zpN&TpG~@PZtc$bX8Td0iI1Hz(HMY^GuAk0{F+>
z-Q75GfjkL#E#3&%4cWTM!^qba2nYy98x$A3933A~)c~~<I?{@I>3QgHc%6p^E7TF?
zp0}2_&@VRdireq6`Z&8W3qc1M+BWz4Si2keEy*-%N$B~;<R3>BlrPE7P?kRrDBKzj
zI~h!x95!>*eWcThC5<tZon|V=d4u!u4q-WFhNP;k2mB30jAa^_Z097CZBk+o0Z~iL
zhp4~iCec3<>1Jq!J)U4{*Vf{z_##MV@R0b6!lWi*NI<s3AOZYyM;CvFB`j_EorQ<%
zd=~-6g$uy?Jc&h_FbFXza*6q|nx5=$<03j*gWJD<H-U3DO!J?diKcAj@!0f6V~Y3I
z5jMYW?QZnD-NsFfJ&XgV!)V}iNQL-(q~6HVVs+acIQb3~Kn2}XHTsofbXUh@m0Ln9
zCMz=UaYn75o{Zaejkt7^N=vmrj}FBtpW58FW0I@{AbQy@pbgIewmATp@pO*u;(Ipk
zALtwx8<_zKqQcm$$B}m9Vjq^gX(Zq3GGTVTFy0`!=t50<jnOthn|x~TXhTFlTepY{
zqFqW#>9<Wc8HeDh6>BT3Q$M&f1R;6Zr@9eGB#Q_^LbFQXN5}v1_uiFv6={d=+p`PH
z2<^f#a-NDx$CaboJv&B^m1^a2E?c_~Oj<o8Jg~~M#RNqX+oP`2yP;10!#G6D0sP!+
zyk+K(a)-FBrav`@NzeP<bGTj>crse9M?v}`htj2<S*4V~sN!H8SR|LQ*o3~w-6849
zA%k1=ED@RL$Q_X4QZ1|4f}ebw*Lp&sv1^I!R)qAtbrNM!_JVBU<~r@Y)o=<!)HKaU
z)AnO~(oQN-$XQ%7Xe61c)!(!~#Me0iMyTKoY;P_qeJxLK%+}Uah3b7h(Sc;r0SutS
z2IT8S57`9q6b3^yGdWV~Vh}@6q@Q&uA2lKbZpc`?kz9R!iR#G9-mtSzm9xSrx`aMq
z;EY>)0c*1wz~%+76*{9jylxUa57a8O)iVl*7wQ4_lIHbgqBH7t7F<3O<Aq}0v_P#I
zIK+iH$xpKzEcJ3=uy3)OExwOCEP4;XNuq1W&!YhJxh8(kL<SGKFZJ_vs|fI!0Z`Zb
zUtV2VsX<6x>GXeKwzDb!sIlE)1CXc(_D;G#fWoIA!umk~2-7~-2NV|+>7y<xDzG5-
zV&xwc`83l$IWY<jnPf@wy8w<Vel2(pKLm;}T0$-qKLCKe;;pzS7d%M3QR!uP02tI^
zR#t{J`5*4zV5yE`gMW0u0RPbr^FaZ#;hRH#=>-P3E_qK&{(lV05EdAe;oOAcI8U4(
zfG<<Ny0Bew0RwbF-pTR-2AFjk;%kn^7;KmGlo<Pe465^OP@NBZ7JGz)d;m@yZ(oA<
z6afsdE#g8!3>cuob)YB*0OIl~cOVY_AA{0-8`S@P#H2PWNq%&D7PxhA!*zCSmiJ8#
z_k{s`W|s}+)-Q6y6HkWLf0Z7ZUmud5d?=@W*WOl2QZnFOcFzA!Y@B#KQoXp0kcCFm
zN4cavQ8fKC-+9R$guYAo{}@WfU-0*O1NXhInRe%Z>C|4&G70^6`1$i2e(p<h$>o5G
zpaM`U{tNCO_lEobXZ)P$jWoc6iucW0to;q#|1Y@z_cz@CKjP=UZ=`|Fn0taIIGAF9
zPw-!Gf7v(O|3BmBAb>Q`l@^NJ&y#HcytMy{`ws)S|9_rz=NoCjaNr3=4?1ubSlR!X
z?C^h^bk`ecz(}D7R(1aO^W!at--{154Gjeq6*M6sAwHiSF`(&G%9q95$timQf+$?}
zC!qk;EClE_wzapb_y0FAz58Y_BJV9Atn#=%1f_9Xy*Dv20mx&2Qw)8T378t7-(dQK
zTa1jKfx)xfkgTk!JoS&G1chNLG?9J_!YTHD0$%$S_<c6ec^gz`Xsa^VaS7*27<YZ|
zFF>W(ZsbmiSfn4mhT>iyK^#&(r}B&Ga!4bAfQvFMR8mpW;-)vyWCPLYlZWf5<IXlp
zEo#N~X~zIiFK%kXtWmBXR?1hA=TtC^FPJU5t2HVXv03x@#YB&IUS?po<#TZY4MsI1
z{emxtt1O9{UaJ@CbE{R?)EGhHr*9XgX)GM+9CHpx39-atiRKEmV_$D~NkYG%i<68A
zA{aE%>UJ&?0Su%MK6md19J!PV%w0!s+=pt5HN06QRF2W^`onUau17l=hLP7gUE!Uj
zKli{`V_z*SsGnke)d$D{Gmq$6My9dyJSC8liJxc7hxa`w!L8+kj(S;+f|kn#^|@!$
zQ?>jJm*k(1<)rFc>L*JyWh@nmL$iEe<T#{{-}YF=Gf~RLRid2|^<J&U15wkG0lw*Y
z;s(^laXs@b9vxnB(ZmgUL$1r)p@j)U2WnOV3pbMf+AA4)jbGH<x;)}!dB*hW#mDFw
zGR#51l8q`rs`|-h&?a`dJLU)|cWrc1*^S?K_w=YQzXE|8fP@#0gM*`NZF(B3qoX5|
zBO)RKpWh*SQ_G-Otr#nYSfHC6!S<tqf)t>w+FoNk(_T<Jz!?evy5Xe@_ETS5U^B6@
zxho9Ggej`NOjKiA{wfaOXLHA4(c#w|A#QiT>>>H7^;$)`CKfPopWdj{X^u+GcG)u_
zI@Ey!V=w1Fa>%YmuTS`OxxQ<Ci*D)uQz%+!ZM<;>z_tLe)J>XZI-Q&S2$c6Jv<I<$
zChvvZkC&p7w+FUQ6{_hC%CstIb?RIQe&XF_QwQivz@vyAPMI`)y=4VjiQjDFF;TQw
z_3M#HJA9YsJ)U=2tV>l(abILVjsZt&IN(u#qa(nd)qP8X3O#y{{)s2+riWJ0cN-th
z`r2a4y^uB!HXwg^=W;-ior||`UO{)#-pH>kDnjivSyI0wd-F1d4Wa7%cTVqD%au|t
zVhyj|Ap^Rb!mgRwfHCb3Z;_Jul6c#f5eqh>N<Na<88S#hyMPOdv^f#gE?jXS(nAo3
zX$2WHB1=nS*nL9tAD)>X&jVGf(?QWpDs4r>9$$s9T?kjx>(}_b3D!d!=yjWgb+E)7
zw~lF6+g-3lq;Cf9nnhoh@}1s8kpd|Eq&HPR3;teWY>skDa%z>)u6w=T<0uG@cmFr;
zS0T!+Q!3#mC!+7%C0&s6*7r(%O%>fg*20#&Sn7qg)(eO{yly#=@R;6@(Ay_58$Pt|
zVU4^4cuSDt_skXmq6OIQ_HqMe6OqO}p&VynfIWFl!_}3`Y!Ss{kKfKPXmN4T2skhy
zMKef*ux%s5U-xHEzUejp0l@r5PZ%Zv!{fB<f?=~0P5Mf`wI;EkOZZ$dp9}z<rfP-}
zr>@e7Y5<1##r(00Z`6<4lnP0lbC<=xhrxC%>0Hit(o!ZI_l=hQ+}}=0zn4b1*c>|^
z4)fTYyGgY6ch)*aQSx@%o1g@qSeO_U#@r=7?b}$GMkZ{_oNTC%oF7$&h>0)@5-JY#
zSWGx@Kv?8co;voVE5s3s-tc;x2Gnj|8%c3B7_Vn&G7&_rYzN~$aWedGb0f-+0Mkk8
znpOcE&=Z|Fpj6-lQbLc)6qInhIMzO1Ck|pg5!x1X|6RnvFWJ`E!NWQ*^xiIsu_!!h
zJ$Q+W`FwYb=+`qDEQo9fyOt*ExoUAl#<;#LdvmmSCKddFt^%O6^aCFYrSE^47G9eI
z3mP(IJAK23(lnL8P{G=rjvlW!B<We$Mf^=7hykCYKqkOH^pkBDOxyE-Ynj`{00595
z-^qZbx=W%LTR5@MHjs0s%D^#rk2_lyP2Z}2mlm@9t>(cf7*2tD-XJpC2#t~%|IK0t
zTQXamxusXlBaf-J+UbK_O-kY6bOgl($nPV67oW<$Zoz#^S;_m1ywo0#Lm0Nrb3S>?
zE|W-Vi{GSW$4v(Mq8@txMe|8#o6jvKgDKCEof30x05$lgP8rgQ>hwJ&C{j<oM<_TK
zijR+vUtlQHP4w#n4ghKn0MQ~GkX{5@O4Jd{KOG_!*bAosC~twSOP~hG$p0tw{zeD`
zSVL8UuxL*2&Y$j`-`qavRezxz9j&$UAq(Wd`}+D;)zm;vTHQ{>fz$^r{cmhQH-qeh
zkL23aR<>L>HyRwPdg|7F>4GJ%F_sQrS*$H`JI=}QcU8>_@qvD*nXn^B#fFCzUItM{
z9XboqtdtBEoYT#+D@=bMmtrJlyBB@`4>p6qrlg?7mfs|{e)jp6c+OHl9~NNX7HM@-
z99n(ZJPvq9sulKrL8(t`6n~sAuVV8p&DC$d2=v&QwOl5S9^4xq`YIR6$|ma9#C9WP
z=`VT}imqA5r1@U6GN3+@OHbA#0u>QEUOpbE*yFlg5;%~dXGwU7j~0Sot7Kq9h>kQW
zrGlhUm0LgC9xpW$0bdtD)(hi1+{QG@%u=<==I^Z*zAf652p?;-tP98CTKKImIj%_9
zQ%&jYbLD}vBgBwU$HgkDHtaJw)7u>;mQkgm@FW%j+N<ek1AssN`{MEN7x5ULfJ^R?
z2yI}zYV1x~sd{x9+v0|-FS2K9TgH4mGc!f;=K#b+=4zS<=BqAti1c`2rsQuFO%zU2
z)U|^xoD+ZngsRr&bBBX0v&5e0Ld56a6+{LF!ckIE0`FaA@#+{)yR-fIs|H~#;VXeg
z#aefy+<3Ryw!n@L&IxW4ZgwU6NXwrK9@u5qGG(yGeFjRxT)vzuHlsfsU$d+Hll}eQ
z!O;Vfm1^T2IDjN4gN(=e?Q(CT76X&80_?2faxfio%@l;R;}8SH7yX``jEm;r<m^72
zE7g8x_EeFVP}onb2kcR*iSeCcQGu>1>}p)BNuuQ48@L`S77U(uV<%^w%lxIPRyH-z
zO?VKS^>?`6mGR^v=(_dhx0@%%<*!L{11`Ej)rng&(QNf+xFS^+E?T7z2KUeFTPQB<
z$<0RV;W6a5^5cerNqgZrtTaks5waHa>42f$h<}$Zn#z7*9lc|s&#a{S9r@E0K9gp@
z#eNF-L3wZS=BT#1W&g|F!_e33^u)$PFU)lt(;4p3ekO#<W%0g(IBYMjuhBoHA4kYE
z1W?+<0ZXNsW;{b63J7)I8ZH>Y=kZuX4?=46yi{(NcHLLRk9}w8x2v6l!gw0b&S}xw
zTvbyW@XK6(wpb0Qd*fGc3DC)?My+9`e<(=KE%UH96u4!I^_@naBe>jzG^eoG88k(b
zU^*^|Ngc*euikADhJGRpxw3Bj%W1_6529=mwakpz?<+-Q#}8txFNJs&P62>!SsiVz
zOGpj-O<n)NSDEvO50+Nz7(keEpW<uqk5lc=@8ycl26ZP)kF0?G{>>cG=%GMNoh!{f
zyQyfXRCa}ZBt4JP`Qf><4SKlvnVcZKVIGp+!>8w*$=I!PhQ&?n{x$~2`I5-iy~=9u
zJZTe!n$Kn+l9%giHn%6Pp*~u+LbrTKq6Pi((M|W{686qmt{=d9y`oKefmOP-PP<EZ
z8PO@SfJKGP2?_NFNMXi6E}RFToWp&ko5}zHS(7jE9*#OmJ;FsYa0+E|$YaJ+ot@0{
zsXR}Y;u0chyfk)yD-DBoYqPDNX*bEpft`k-a6;_Q5{ZUao^g4WTyF7!v{1|6$!6px
z5RugJb!m;9_E$$!ZXZ5LlZq}6k23wrX+><uapFV~jXQ3+roGw^Nbuu7O|~?b#`?3z
zNz`{E@5SV^DG$VuLiZK@gLarl>ytethHSYUzLBb+6>Ka;ThoghS$y7k>Wi98hjd@4
zC{>~$(OWv!*M`(LYkyW{cU*Q!uH)k558tUDbc~ZFDnMXNQgAdfl+P3kxzHnXKeNde
zZ+?AVxdpIvCP~Tb*zEyR1F=59D25~NRnldD2DM>i6=So3T1F|SEYLYj5%?yRVZ_gh
zCVFqlfcuW{{JKkSgNZB4v=<uKFY5=`sLQzRmb{J;q65_9h<xqYkj)AbUnu{C6*iE>
zw6OSvtr4CPFJS8C&5DK8yombUUG)Hof7iIwmFx0t4ARDX^4c*X_c~v{h2^AlVcZ)x
zxTn=Q7ep{2^ZYm#C30Qi9paTPLj^i*b55|bc4?Y{y9t2icie3b5fKqcm{4lCaX(w%
zL147>@f5mHy8`m1Y|!*C35M9JY?e6t2>&O=^asVex*+igz;JSNS5#CbH#axCkj@!V
z{S%Hhu$4pT<V-EL51<R>usK{)55t-xZYgaPg#uNr1C^V7ZfpiGR&i&21gXKf27e5i
zBs)x}+0oNdxmJfrb!=CPwD^P_@!s<dY>jUXl&$#&e)tr6xQ!sLMjN>eyh;cW;?y)3
zXXt{kjMk?ymz;uM_!gWXT{mi=xv*`T>5#AjiHSlUQ3Ydv8OAn!Xl^wg?nPw&^vTnp
ze+C5z5P<_RB@NVL51d=)h!3yjRyr%iw;}>EgMgJ)9_sbXHh-ivpBdj#ZsE4CWK6fx
zxoS(C#A<DRGzMFKG8b(Ct&fh)Xez0h8T>1v5%ml2<nNHWL|KHG{`S&Fj!_?BIKpVi
zI?ilqxA7XKCAT`N6|Wr+4rmD5ZNj#+gX#x=3vjEYh*0OrDm0z6n=fGvK`k3oW8VDu
z-@_Z(3`}w-n7NNv#d)<3zIVsT4(v2}Z4)n}9zd-Lgvz&XRyrwB_!7y#AX&=7p^jyT
z*dfb{&?mDQ#)x>|R5c{hDdxH!&6lzI4WX({z5oGqdBEO0$|Vl$re6nQNbtpK9!Exi
z$U8A?>tSatdT-0Yf$;M;1az|bvey~%;kf_Eq<?>daTj0o5A@^b%zn=r5~Jp68uf>L
zDAdR74Kf$^xQrKM(DOOGDu->3=tF~j6uXR&RIAfYe>=PbntspxZK@z_Xi$y!CVed4
zN8r+wA=JGj{N^?>&6J@Eso`snH(RI8GxUZPKD?KcRdM|pEu8yRA1rA;{`9=OVOeZ$
z0dUzTIr<0=L<VJ6C~&FK*>2|6ebPWgJ<!QKP2S1|Issnpk}QZ)qr<Ka2p8fjq#28-
zJtB<!McI7s$8;}tcdQ$}dR42?EVhFUS@SdcvAFQmD)doLbu}QmlW@K8(p||O3bRz}
z*cak^>2>o`>SJjRYf1P13hQkB?r4mr8hOTK+)sHrJ%a4WV?ONOtOxYGg7CZeAH**;
z%No&tlVH(KH+d87kMWt23P9S>oe}}r%PM!z3T$3LJeACwJBm#TT8sJtz_8Cv;7<$<
z9!=*{lv=kBKoa~1Ft@V>824EzqKWuuTlsvHsgLv5am#h;AxCB*IJM?u5Z#R7Ed=$?
zj5TkR5Nr2{fv9GhPp)A`>!x#LF+pXvj=RgzdJ>{fyuC)s+tU1sy#5gtG2M~&;puKY
z)!0g{PG<SAY?^fz<%5ZiZdU6!Q>U!jtx}%Mzz6vr5EC2}z#?OBs&C{!2!Ne6Cy8+<
z><uP3VkOy^9z2qRsCHMzDTKsRnQS~arfDXhaNFfR{IoTt!}QECq)c}^=<k-a%M^?m
z{;swqzq19{7y<8O{_UMazHxn2EcD%g8f8_+u~tvm5qE;rEZeN{rYJ`nIdKR#UmF?y
zd9Vc2k$A5!kFt^J0Z;*Q+0uCr)*No*5`SBXb_Hl&CJ|I=?)HVLHvz|_TzN-Yv-WHF
z&f-9I38?^DQndybY2~s=Yk^R^Ui&45<?IJC7y7g6-h#s#rQu6cKUzOd>EV~Md|hnF
z=Vl9u+3}#?D^p@7zW|^~N<JenMyFI1F2DOJ@d)x8cDVaR;m?6vPMwl{6d<(*srw+S
zP1e&F(Q8%!$EP@37XEl)Pyq#5-Jm;e&Jg!XomCJZx2|#X_V&gN>_(&h2b4JHhu6B?
zq!#{VRe!ez6eo!bvfd!wOWW0Slv00?Ln=S1IhC0qyVYw?;l!ldg_?`qJPZfvW%c8}
zqa@u~*ianU@=ty>Bx1nyv3cHfz`w+lFAdu|@PCwjh-z)r8$xsG+!E+m^R*^<%usCg
zW8MkDjpFTaOK#B04e4t>e9Wk5(mvaQmaY@42T~tWLfuzCIO}liP(o#$)IC6C{cI&e
zV3?K*-WWUX)=o-Y;J!;bMUDdRn>OiTcZHMCw0|otI?WM4!*K8ymNNG?tlFf$(D*N6
zi2<;Px-bn8!Hn|QMaxXxYq9rb(ET<pEN~Fyc)6<XL9m$JxNh{V{`-j_<r(%7P*!q|
z3?&**mrH$jzr4E~LT1Ld>vMZbt(i?m^>sVr5NF2qzcC|Wn|~zdYX<J7z}2SDPM8W9
z5d)x2sxWs-Z;^7|;y4k|Bq_56ycyZ~G`|X-vnYW#ps&-ig*@Mk`NGi2;6&ixu-)+R
zI1!2h3euOCm$G)?7@WP5&xn^sB+)Tf?9{4t2ow=&djR;_Q<|Ko0a{A5@x1G2PQaK6
zrS2asHf{3=Nrsa~F{fs|0Y_{~Emc*W2yyVyOU7q&z5J!XLfTA04P~Yhg7YYkf?2EK
z{;fi|q9l)~rercKA^ajM6fRi*h3m1uf1t;xMc~+6$0&2mW<L3vhLaYzKUpI+Ule!5
z2baEO$NACvy8l<bapX<Y$qI+>VVyngvKk7m6#xaUq7Hyz;X%!7B*IrgVZM{zTZ1vr
z2pLByV^o25_AORJIxcf3$j}zfK3=a-^IuVy0LHaRGUMv~f_Isu{PAZk*p|&(w53bX
zw%aRW^BZ#Sx-R^RZ6INuD_%aFN_zaQ`_%_eq(y+>yyIxn`$EZ5VZIM&XJHuq9TaAe
z9^;b!crq@|d-lpq1P^+xMY?}~IREb2KidE#0BU*c2ab};4K~`}Pk|jP&0kf9Zl=%B
zlTt(z*q#0z%+RR;Zodn{xGv*>6%@P6zS7P?ZV3Rb<;Q1;NDH*EPlO6=U5m9d>uH2l
zPeyMSbO3te1#0SUNA)84O$Ei8m4OSO)zf19_1nT}6p-jh{zVasF^M%=(vVE8REv~M
z*8J>+`rEe7gGfV9n8wPyte|5g&0&71C{ELH>&lPF9XNnK$S>vwO~|f;J_o3r5~Fzl
zuOV1nO}_UmUp73ZNpYAMgH*xR-9|hUa`7ICfLi!?A?xHSM-;;UaD5sAZ5386NSW}%
z>9wKU@>Vew-&U)N`dtMw9)-CAJ>1O+6Rz`~+;|`gBO@N$fXnsW$tAHXz_ILt0lBOw
zBT=H*6dLd6a|o;x5v$>RQi^Xg7Rtpf>!vT2+vfx0k%bd=KJqgOcU-<>@pd!Pjs4K#
zOomv>n~QL7ET1FUTmo7Wkz8r0_$Ij(!!qTnMW!eEl>lJ1PC6PX;(KcCdSpdZS7!%C
zQl%$UjoG)$7Y(oiPb?suq-ZIhbs7C6LTIm|8YaDOBso|+99dqIHEb5OHLmH?E{Xi5
ziYd!?o|2r{^M7Syxgr3NQum8VD-dAO{O;}!4DlbVY$J+5N2j%0LM7r&;$v7pxXJH}
z1epwICmK%kJEbj9{_M>faX-%<;xAr+3&E)a`rSE-S)+F<^Qk*#K=%n>*ux=N<D6I?
zz){Ck(UH>4z#bCEipUDVRt0=WV@Gpl16LuZ^BcIhXfi#Bsl0k{X)lzwz4GrFg?r4_
zxm}1uaHB>GbBs@PuHwEw_LeVvZ~#H$Tr?yDt!fH_1+Bc8Ho2=apg%QBK8xJ#6H^XZ
zhza=m_`7QutNi6&RB?bA5hXCF6<&B(&}g1pbvZaJmb80#3h`XXz1rkK9BROc%>Ig6
z&h2~D`KWgIY8}BI+Nq2_s=^NI&};!3qY654Z#b01M)e?(>aXHctV<E4>cJ6s<RRPw
z@0puC?Wo-)o0oVS3e8e+^(!)A3~RoMiFvl0P>F+SSkTo*h{2_=W#t^mZDdXTQ@z=>
zbns(YuOyM`KH<)B^DR~O=F`-S18-F?jtnviF<S;1p_=vtb=%QEN^BNK`Iamk>F5)&
z+G(`@hGY0Oa?hZ4=p-+G{{v_Eif_I<1}m{(G5*I!qKr+u2&6f)_3XMJJ1O}_hJtn6
zI;FU&2767E#?<fxvyauh3~jOmfF|gQV7y)7pZ9_W{+VqKq++%xLsqW?^SLlqn(rB^
z?Ch-brN3*CWD$g4ivKaE&p}s0ZMqC_6xU+uzc#_cdDdofX|swmnKz#z1z<Cs8PKP$
zEMd<;pj^zsz0Xnl_36i}HX`>AbF&2I^H-DdSMAhS4=9E}q!Mu?l4&v#aI*@Ha!nJ8
z#&gk^&V&=|gVh@9*+Q40&F0UKmt(qslrYJ|UhQtTNe>UhBMb)&t1hsXnR>bncE6*S
zviX^E5%asU_4YJJyt$@G?ASmlY8EU7u0MJmaQ#T2_T;x;NM1={rgUz9^6)Yy)aLPo
zvs0=ez5$VP(hqHUu!tkZ1zD?gv4!{!x&G7=`X8cZg%{dC>Y1X0VjMN9`cny>kED<G
z6AZJS0I)U3smEFY#bYg2k}W>=g$ZK>P?6yvY!%;A0&rAqpi~<mD5m7iOp^i*wqr=R
z=NG`yXwl;}V4oPU(U#vW1TeYWH+g5SdN2hxJgB=W2%`Xiy}~sxLq7qR??Dq!0*X=!
z9VvWHK+}pMgrJTDK#yMtSn(G8)7~(-G!XOV4uHv3pU*M_df6`;RpBYXy?XmqYk_+d
zX?IZ?WCkH&5}k=+WCTUNiVZ#C=s}CW!BygQk?f{`HW%LwBNqp_*A!!STtpC(@gg`}
z1t^FlOA#b!fqNOl=g0$al@d$O4&WMH3k>!@&+7{=@WJ3=(&`-nUOZ&$89vup>70!I
zM^>P<Soj;9_n+sb{5CI3knvzIIE4L}T#W&EC?#f1dV0`b0FX=}{>ukwLxVCx`n8%2
zEvY@HQf+90osUKLC_bLmU;gU#qgF?b?`YJ*Wwv`4?{fXy=_?69j;)MPcVWHt%ZB>n
zo9rn#qUe{H@c)aI|Fc5-|3$I#;z$bHRE`9^Ub`2lp`ihAB_02j1RxdNfLGj`^zSP)
zJX&yTt5At%Wd;7@W*;&@x2K|^fd!B)@sVT}V>2^YeSQ5td>sL|WBhdQt9|7*zgJSg
zPT68B6rHSs^YcA91qGC#pkUbnU{-Cp)>7}(n0*8|CA^U=ZHB?r`6OKvqOadFS<+1!
z*6EX24UStIntbR;UaB4WozAg{R;tg>Qu9O!)6`3gMnybM(QQPM`p2iT%~7w;CeeOL
zz-<5-=PCqryKfLH6Q3RV7iVJL6Isa|@lLT)YfXNgaq%B21szr;oi7i_%DS5vZ6B~S
z?N=pt<Ut&DhN7dq=`mP+oM)vIh8^VW!o(X>)lIMeD0KMj;ntv@Iiw6<|CfmQxz!z?
z%K`t3)ogzaPbq+l5@}X~HLWproA`|a<Bc1dHCYY%r$ajUz4j4~jwTDJ%!QV7KI@O!
znDi}^1KZyDGyLLFdd`>f!z%5~2Yu|XG+FS78|hViyikf{AHdJM(UaP(cn?RVzGrvo
zJ{{E3cHoO-$<<CrJQl%5DerRD{el%T(fCed6^8#|i=oB7ga&MweRUxXp1j(#-5B|H
zOVRgJAC+^w%=(@>Umu7bA#UWhx>%&^En)p6I=N;OH~Yd`QL9AL_Z@Hh@O_Vr<b*-Y
zwED0~RbD`MgMj+~)z?=>#Sv}kh9tNJY1|3!?$UVBMuNKs_uvHY-~{)^-8E=%2?Pil
z+})i7d6hde@6Eh>@9>AUXzJ8H(pBf|Pc|!EPG7&spzDFDeHR|n%Pg<3il@1hYW|LE
z3f3dRusK3DNTEN=^yvx-3&O`?_fBmg;8{_={g(B1HQ+g#!)$<pmNv|ww6KuI*U#^L
zm0;!rJv;l*6S<L|9<k8J6LT|$BkQRmbcdDpQqB~z|5V0TJOa{Y0NL<s;%J}*%rt;}
z$B)_Dt9^BA8=H;m!?}vnv-RFRz@fd#S;GFW4Eg?s#anlDU`i`MqD#fm{LSL2fHTS%
z_n~n@22KQsHM5){CXO77I%`S0%b}UI#rawE$7*}@Z=N#hVaLFi5}7R${!ydu;F*i<
zi7r3A%odlV=!^*!R72Wdr}6qK^k*0VO%Q)8+j>fcm~cG1+iBEVc-S+7ba>eMR{^qz
z161lfPujI{XycoB3-g8a@J4@b{xaqVzz5aCThQC>09t8cd-k2JtLE$X*^0o9aD2vO
zw%Df*Z`0k*$0OgJ1hjRYIm)@~{#nYuQspT+?X(}?Zd&Xo4p#BIRc!<2xm9w^jSFtx
zEOq!H#u&1u+S%lB-V)p|!uXtC+Y$@f5IE>}#GqP@=lka)$O$Ko!pcTo$NvR00ZB38
z6Yq)Ka(t9Whme`WTF|L3z5kd@#f@&*Pe34VKmLQiRty~whJJg~%aM9yT$S22Y62Hb
zxLvOCcC&SDC>xj8VX1<FfJfxdEpfk8{Cj|K)am;a6!*20zw-~pKXl5Uyu9j0f4v&S
z`iD;0UN2Ohr<`#oe9R~!*tt!$$;GSbX1IX6-Tw)tcXYt4=A59Pzg7!qhhA~Mmg40c
zMrNQ)IPHWx&+npAWru~>-ouX;#FzKWva_14HeQMt8Q%}+_=?xWCp2-H)PpLP37TUJ
z``S_*C%io|uTllM7l}+AfVbJ`Y(mMAR+WBWbTm5PU|ZDEQvnO=fji&<uQI(a>l3C`
z&Jyg0z08slVQKwBR|JTO*m-#^54E+m*{w|+9I8H{<_zP<0eaN#iHSG1b0eLpta?po
zGiC3COG_EDg}r)=`_M1Ad2I<ryc=E?OaK(8I-9*Nk?amm0^%<>)FZ=i%jtY3bhptf
zXsdfl+T3FV-nt^LAZutamvTHgX2x>n<kKyJ-O@&M#u|P-VY!{93B`H(o!m*1sHO+n
zrvlbX>Cm5r=bwdnxXyG#g12M`{hvciwDNVUcHgLn0~z47j#oWqrnM}>Xn>)xWzm^#
zD{i(zvgy|pMA{glq<k;Ht~DaPa&dzv(0J~rnrf);EP%1DP|L1weZ8EQrjXrjvOm8V
z7n^L+!%Sq>!QQ>4S#LH9fWNM>Ua03I6ZQ^iqf>#|?K}E7Y|(#u@i+PXBS#?e*OcYP
z!gjghCO}eN<n8Y^NoHB;^y=N&dCe$uMI1FXs6y#&MY4d+2G)J(z^5_}B-acJ7uU0*
zu*LZk3AjdFU#8Ud&A!^7bL6^wKq~S4vrDYF&+)Qf9#0nXQwEnR2XVT$r{LCF*e5aY
zdhjDmYX3`%_YUSLq5X*Qz(p2T#qlK_iu95by)*ev_&o<EYV9h%hClFJUkuQfElFS_
zTavS)9bqcDyZogvkIB&;-hBGY*8<{v`2g}%OpX4sE#K>^KoOC|2<Pnxp?5J=VXO#V
zN)3n4pufNeS{c-us&!Sx&0h8DtGEPYyL4P?vE>9Apq7AjS{XJ@*=x)6ySp9IAi9=Z
zr*kTH6xY7-KFLIhc!=c3_F>P^{fs5m7OA3UE9Jw8(rCc0M5p}4koV(n_vvaQvBe}y
zco1Oc*mt!*^^2d#pTl~B0)gBbiUd!ftE)TOMoCYPG&wn0aXN&h!~ZEh9!s;@aBN5P
zE$af{@&T?k?5F{_(A*A71OX4{h=&;huC$k}FvKfFRCJoS6yRuQd^BHsA$bGPq9O#J
zrh)-jE%&MA-2{aR5n>9fX67FOIGr)Nv^@7<Z|H4iwY63iL>vt6Z^#Yi_$X1Nw7<0H
zhd7bvVBlu+6DgckzmEVPQ;}!_(?KRprS*$)wq=d!4wAuq)Yv^@^~HT31Q5x2%J#G{
z^4SJ@6S+Hik2{3^&WVq!5j+-zks`w@#6)WXsH|bTcc`xYLau6uH-D#Vc;5GnZ;F`D
zFG83Np&XLo8`Jlf+SnvPa2-Bi6^4S*p`S#PuUk%{S3Y4-p`fbkTVsHL2koDaQ<IgU
zXk?060;FIC&4<4*E-qJbYOd#J><K~+T;f?7^UD%`rS?{tD^j%9rpm~CiF~$f5m~!w
z8E(hrm!waDRuRhangs}q*-HUP35NM;JYh<cvifpcm;kKXQcJ@f;iYypJ)@~TH8%o6
z#J>6F(~H7wvy7&v<=97bYC+&2jDcgX2-^HnKo<Pn-1dry_XQU|Km9`gUq$0zwAT)C
zBs&h1og}cYM#<}<1ZLQ)VAZ;L6li9>R10Dy6F|3s)cP#r+3Ax+z$M6-ZjFwf5(kio
zqOX2X-mA!mr*76U?WDo21F|U(_jdvkbglJ=wnD9Z%2IUCak8Njl=4YjZ`;jQBlz9Y
zxZfOK|E?iJ0mlp;Ng8atJNL<HikSSoa_H=}$`EzlDBeix4&)K5fm4D9s=VUU<rb>g
z82Th&^pKp8r+}~1{$3LTri2d#0r^kFbn=bO!Pvd&Qk;V?<jDe{-{I?k>n}i2Lwtpg
zPQ?A<dIi=$Gn3?HG2smqL}An@`9vuhR`WpcS9KRdnkJ@3ChYl1CYq?0r=$YVYUfY2
z$ih!aJhf+b_~Qg0?R1N`u?a_^zYp27wGVgONcZzHD3Nb_pfFY8v<sF<;|sNHWMt0V
zB>kGAJ5!Aq&6u>^TVu0`(ej0yDsUE$VCmgWZ<t3Xg^F4Rp>nA5ZjAN^8dMrJMeGlM
zNds^1pMSaD$q~d(g`fK3gCgCCDuRXfZ_n0_J|uZ;2RlfHucHN~`0&c)QX^C6p9Ohq
z=y$mj<KNKbdqfkB^n$M2-ujlji#0sDJHM}|zllD>?thD=0W1=-r8dlu*gtrB2fl1Y
zPKYPixCanuytP~Dk>HOiN?T*R*W(0hu@RR*b=xppKM%rR7fno5M5+%euPwJVTmLHJ
zv9Yy*e%laZ%>&q6Q;4x|4!)w9jiN&;J(QvxCU3*VrIm@)!^kGBZr7Ugq-(-L!t7`$
zsbb3U*h?sLZZjV`(wE%%ZDz}Z3x#I?L0ATG+#?eNURIRQm|=pykj9i?%qSp{{=EFz
z>2^EyND!x)ZAJVd>^0~=W|k{OFyE_rlsun}E4#Oq?JN1=Y{+5}D6f-ls|Q$O?fw@p
z|Gd+dDRzE@6nVollbYUEi}y!f(II7QM04^m_E1b9h&}7dRn^&@jyRdiwDX~Wo>&$M
zYI%V*rTP7x#)%vDpRD9$1R_l^jxHXZ^Lm3hJP4O+NK(>z4-tJb4nH6u0OAO(2=&&x
zySuB|A=(=3U+M6ftTB=FP;}LaA{QfDY<AR2lW~PiTtZY(b?J{_E5rapj@h{=At8Z^
zf$p{hqPiU59Va2dHt^M}*Jj#DJ378U=sP?C*D6l<kLN&QRTFweeW!XnBkYZJ1qopi
zKyJ6&N}uFF`~~W|Bd2pw4<A3N-Ri}Zm-){69hZ(ZGU-F8=i)RW7uK;{yH{pg{fKWZ
znH;jlTbwigX(vt+=1~)sp0332YXEn|<qnDSi9eR=>lV8}z&+<xaawIV?le>IOB7vw
zy9yH#cgAw2u1pH!KKokoFVFAJ+Wha;&}h6|3)FzslXxugyaVLZ>BmJ9T_|KBwdUPa
z%;z_u#}8k%*N$?9;Wb@%zxg(CXGi=*P57&ao~8T3e!luC!giOHs)voh3M0$-`!7~^
zNxI|gicT{TWEMBT&GVev_$bkf{3vp9xJSv_Ke91=GpYZLy@3r(;@6uTQD0y=c)IP1
z?qJYlXLks7kIunit$+c(!NtHa^bAGHv7?*7D&_toEej=KZj3*W*BA5Zs3XX$1eOCm
z@doPo&0{l+s+&4<yBUVeedumq)n1YJw0B`pP`Ml^RBUb%$!%iw=)i*es8#|j0(d6*
zE25Qnw4<*;qL?CKrywpRx9?Ff?d@O!T~k5ZC$}FP${8Ssi3iXHsZh39z>f=!q4jWI
zg9CRga`NgIMBUxp>>L~>%hP{?gFvlQNGv28>^xiFzbjuPx<tg1?-1^pmHnUq5h~)b
zbjMH+I&pduGN!PU1KP>0uPoMC-ttlV%db*C3wc5wJd#sgD<AEw8$ZCO)LbLIlamTc
zVbYz|x?U*da3QhLstS?({<z1P_m|3q>~mv!)Ubb6(;Nzq{0Gokk69W6W+M>~I3s=+
zzgy?E=UcsMghAZ7v}0P}@22>4P5I$2as>96pQGNIP~@W7O_-(p(qyL__C$TAjiw_Z
z(SVd&vH@ctgo^!iiTQ%GM2H}NV1FH8kRTZnL9O1F+U|upUHwe{dSz+!ULWYCdGnld
zUA`;{@++^*r%&$6HJsgX!`^q-%|_>Iv!sf1WU+bXT4f9|T$5joF!crf;Bv_noSroW
zZDR#Hm;gDI9U!N&<OX1B*9|-2&Oa|!kh|%1n%rVw5*S<&xNH%%u8I>f<y;P#ZBaw;
zU{Bv&IO{(bl9N>JICYVuU}=x6cAs-1u=fvUog(KDuJ4lZez;D&>u;0?P6o@v$F)DE
zybGT2kcxHmHri^4iCYAYZguV`Eq1FfK^K|W8q(bNg=uMoCo3J1Kvf#9%E_%%TRA-c
zZHY^xb{a9xJ<USBW(NxcH-(=-!CMo+QCz!OdB^l!uXqU^{B<&{Ep+0w7ofQSN^>#v
z$nR;EPD=)RYyRa#Y(JD1XLliW+>_PNEPnn$AgUn^MJ7Y7J-s5#)Wd<g^d;+{{uc}_
zl`~40t%pe(mbS`yWxq&ddsOjGO<BiOc{?P-jpe{X-F4ctNpeUuAgAJc<c0QMAo{3<
z-7^R-vy$aqPu~Z|8v+w<__pDMv&F&KJYS4AhZsPL8OQWzmhdbKs_|zo$Ca<Bh$?JN
zw$Pk%g{s9^Lux(B#jid!*9_C_lw^8p^nlF3u763qU;n!Rlq#<NL!>2iHRnD*AuL*(
zK<Rm%Jt1?Pu|gAr(WMzN6q^!&G&DxAQu%dE*F1kU?Jmv^ykW<Jan^#r56E?SWYBD)
ziPY#6s#G8XdOT+QW?vEPAilB?x2-Kzu<YsQs6m7rV^D%EucO?Tk1NuuUznXItJsr7
zYsmlw!?KGTV%)3pjrT6<=HyAgBzmQ+TZWG}QzpLq^6MVBjUC~70ejGRV#vrw0ICLk
zF#LheWZ8SBA{3$#XTb6wft)^Ms8qkz?H$&LiIo-N$B!QqX~fh@_`<TY$@22dPoAIW
zR=hq*JNwx`DBY`7%=hC-2XlBFb)>-NYfZtpZ6z>(I3<TxG7svHLAhD!Uuml)Zkvag
zou>QV>SvnZ<Gn(8Nc-iQLwB^SXSv&HRd@2Rv*Zd85nsv5%6cK8G`vfb3Pby>C?b8f
zAzQnfsUHer!?2-d!=T|QD;-x>w)d7-@jl;S(ZJ_>{i7$twB)Reof)?+$W&V&Zy%wH
zuXfO};>8;?Da*Lr<3;Fw)4{Y=PZRuthnfgYqBh=Z79>M@X+o`5aeu5`(~_SR`&uG_
z5tlC^$z`@o4k$t>)hHjS+cfNdYFM6nI^8t9i$%PM*%O-9^OkOjU>27b@Oyem-zn{m
zC22LIZ$?oTl{?o<MXP*mIcC8))!2QB*2b-81u<E0s|}1meu5*Q<9y}y+q=8eClU45
z73C^}Nz7&Y30WxSl+O<m-3W-M8oCpi$)!hrK|N(RXS%2T+3nb}#k|6T3M2E}8ZWGM
z+A%Ib_we~CM5`rb3EY|{5V$nm29;|$V}qS$#xi&|GNEYMTe7^k7S=l5ZK?97tZC7a
zCuiS5a64|Ad4&S5)TDgjWWI#!7Q+=6!Z;>m@Wa<07*+apUvITeOqT*1^6ne90^BsC
z4YiZZwwMXg&G`DgaqAt&2M8_eWx^o=0%&-K)7Ow{P5Ves42j^4F{}=<qzFO4kSDe_
zF`?`R18jvFuS-ibB5pZ^g#wR}C-63Kl%dyesi|nTU&J#Tj7jR|D$NC$DB3l~fk%3b
z`klvOMJ#U}Bg;3C8N76S%jTg&Pq_2ysM0F1joPzBhUpbTkkk=Wnkp<r&9KWa(znvg
z@|EiEefP<mET=4C(qIzZJXva?#={ush*6mWTl{(ci)1unG@3S9w`z16Tj-{vyA*Gn
z$AK@4))n9>BI3o!`7tpH4%M*3KYBDYqHhSn)SB-iGnL<#S92^a^nhx)RxR=C7GMv)
z=3jxi2w1Bm=K_my-#s^~jmdQPLBEr#?(?Vw{>_nEI?v+>tf%4L^c6?}Kg?7-)}LVQ
zIIxOUWM=rI<0|+*hz8PRD!{B?uV_E#5(<_sxW))S2G3uhTd&QNbR|bEuvNVt9*yI{
z8B*VfhWda%sBoE&LEX|g%Zj>ue+%npxZ!0Rk4=1lMlMusqW~~~r_cuFlFi4v0zy~q
z-GQ2Zob5*EU3q?HPODGSMI|idbJA;L>y>|CGPXhuczP075CRPXz4P@(q0~9)f;KiI
z0uRG@Oa*jV{gnVBD?aitr36M!gVLY38|yfVjv{EKoQ2Z6_lENIJ4S>W)+-^u4ZanN
z_y4N5QmrvI7nclrl?WH|BJfLHVw1(hO%zZqQ7#V5s9N?jV#6}nxR=ve9UQvj4pNb?
zHy_SJ*ecM*Z@A9SpVv}$XWVK8`%E(Qmzv~`7qoyhe&3$5i3s4fnDDa-%wE4{lryr3
zMC|_z^Tg6fJSO%_=LysMZdu3jI|q>}Qj%jmNU2n5?oX`vLF_NW9lNEVZmyjYI6(#+
zs8aFC&|8?+ytbI{?Q!!3B)Di?;%tXK1Puh{jg*4_74;;b>s<}VOIw-rgq7_vB~LO1
z3K^0k8U|wges_0ReT+|{WQ@zo&63cp_~Z(}Ium&Uw7+G7R1dUvW-E0;3YLn4oLC{v
z!3wJc?B<Hb6z#Hz(8NM?EN<__^<19+`{hQY3YOe|kdCLz0cqMVe$pUs&Ve6KMX!F!
zc5*&NObK)-!Yr%RL;%GjEY`E4<^S=fZr$yx`)2$aQBig#%zeUY+L%X1I&`%x_xWz!
zh0~sf<nVxcD)l!TMu<Cy-$MrQCB1o0Q?h@Am}(?eyvJIWLD#5`rikU>Z!w`04wmgL
zb9$P`EXyTB01XVZwj92lz5gNIA9D>UlSbcEK0oRCv8ny+<AgT;Su)pTUdV?OWtu*)
z_0>XOYViyL0!X(plQ8qPSR9^Z^^F9<2w0Duo($gNm4Mg9+XxVo<$UEVL&6}yU)sWp
zN#nB0Q!l3fDC8bj0{NzdQu3k9DGEis?7?y2CR;QTZ>6(lG>$B>a`W?99Rcl47*4}H
z(ONjUSdnddhY45MXr?W$=jH8vZfczix?RO(u2SUzzwZ+uy!W6mTj0hvG{*sI9MCUH
zF@ApBsg#-+>)n0sIYQ5vC~%Qh+^Zzl66y$yFnGy6>uOCWLL7GEip3z4V;XlVhs=Ue
zWmH~-kwq(9ycBj{6392~n%8ddDs4a5Sn{|msaEf`Wfp0xoFV373JZ8RPx@TV4yWvA
z3xjnAvc+8qQ&n{IqQ{7M7WbL?Jf5~+R1P(r&0Xx*pa?H;{hEj|yRZzDqD&;O367yC
z3c$F#x}Z5Y{0^KEDRtm-3=DpkwHmaVG_bI=QHLKjbG?;1M*hB*D?I2hD1~y!ii8C5
zMqIKu8HPq#r6i=__}PU@-11#*(&o^O-+Y%>al`2}3uVm%LwE(^6)|gWh{2zoyRX)8
zBnz#?KC_OJ-?L+^f3@WoRU`H$@M%G?Xn)4A;_8T`-yT8*kBNxo^JbL*@0d(c>xK|)
zo<(k4$c7cks>hpfzEhdts>+F)@^d_`Yh$8{RHhRCT5rrI6~ma3ALx+05ASDO5b+(b
z(u8?o>+E#eNzurR3<*O)hMQ-%*KM4{(D!LZp;o&(`U{uE!ZL%u$mB9uMkEzPYGjzu
z7`biuUHR=Jp5v&bQNB*^?Y}EM2VACL1UPVTs(-HN*=fOu7Pg4d`SaLYJYYit`CJyV
zhV5YEFtwr0pmwUnRGjIRudY^i_xHmDcq9D1S__71yJiRAAHPjXMxTq6$#7r2vReCk
zmn#=)`tAzEpb)t=mY)rQ4efB4u1I)BxD_lD&88ebLyNUvGd^j*@p>g6{h9@+FckIh
zl_~(DMqEf$$X%$eRaw|9cfE;OV${iu@LBGO@Ml4?z4u){9|X)x$p&4?mYl92ZJH_X
zH7H<aF)WF*sXM2_nOGBhSl?VB_Y-taKK^*JjB{qnuj#mw7eieg^|@2D#3oLM{^7=+
zaNIN>YL%aeEsbKfaoS1$@SROQVaMnijd2Ca9SqNW2}`yoRn#*k@p)_gQzMFG<JIkY
z@cL4@51P=)YCXRF(b4+$Zt%?yWtqnY7UzYKVFDhzf(7LX)2+M78dg}2t>idtBdbNA
zhE4xfp{+*9;55C^7qHe3q;8UD25T`GG113}_CQ~tKGMsMS5D@G{xdtcu6esqxS_}I
z<5wC^GA~}xvcHo8YuGG`U>SW#JnL+E%P9yM{=!AfI8z>|$*O#}li@h+tXsWD2+-Rm
z8x_@Y%XRTO2E2&UY&Ms+wK+X_kNybeIsBoO@f*pQ2WZP@ZK*pavE{|jUnIG<ha!Hu
zGv=$_&fe+D&V^-z`+-C%d$$9{MKV(e!pgwf`OwefdC~@iB*9;~1%5o+F5hIH;ra1B
zaAWEbx~Y6<8<%S?m^ZL`Xjyw_Bvo&DbShkPJyv&ytP3&EDl1aJp?R;nY%~LbTCnA0
zxcgJZvF@Z;rd|9Nr$Y&Ju~&KQJZHfzScOMqiKJWVn~GyIx*01?{`9|b+*&A?DyNE-
zL%GSpDL-$Gs>%D%;m4Hdc66Z{iM2`18|iJ%d@sdxEW4lg_Yi~Y3`K%abcvVQ)o5d{
zs5}8Uf%R@A{rNDdo%V0x(x?rgu&2mMVgKK_%_mDqE5!RDvN0<W*<fkYMfs;cRCNQ|
z&_lXP>7|ziG&ce?Tj#+1i)t0)Qz2~twfm$<B1YwsX1Pa;j>%%lh5HUus^6<bjz6|<
z395|4s5p3vZ8wL52R#)yl3a9YcVr*OV=Ap6@$-3|UQgKLr(*HW44wFC##h<|8hevv
z?X;Q{7$|!njXslo;Vm)T2_T6bYvKBl1lJgXg&05Th7^p##p6qoJO-n}pi0|+g8;I$
zx#MTe085jEZkSYjS^@qsmoJib$s0&lWhQ$IVF#mh=y0#k0xa?MhUvw4;5K7<$j!ie
z1i847EVd6O5v#e)Q~S~x@(E}|igSt*jd67P%vqZ^ID#K)UL;ANky^UGS!0I)a(*+c
z7|ve8uHHN7{0oh7gB};t4F0O<#s7APl^Ea-j(AEf*X$*7{4Cd=ZxKM=4UE;FLD1lr
zKpPZa(lAUQCPiVfy>)~dec-oTq&=`6MRf9T3$7Aqu$-k}2skv2NHpfVB?L=0*OPz=
z#s~jD`tbkX!Q<~8>aBY!!vXEqhtff6j*^M|_g+dB;v~2&^$uPnGUsnxH7LwNOEOn>
zTKo-Nk5EE3-H)=C%w|!J+MP!$=Efsq4FWH3tNT`lMJy{ny>HF5?C>{yC<Zw-eYo0(
zoAmC&7VvwHo*i)1fzuQZMqw|RfK7hcOC;2I8$Utx0PLZOxOK6!ID;eJV(SKz_rfHC
zWfbz%Eg|tz61G=n1RB=UPQD8j-%=RA!8Q~?)2F@&px=$hDOFM6{uIWN)q6C?E89gj
z1H#}4w)c>(OG1skxhCXVPGHJ%smOyt6EI-pxUC!B3R)n5-o0%=5DNo`B19)k6_3KG
zK8MV%4gSxF9{)zfLz2VGbXEuid#46}EtCTe^|$|1$YcgNFGM-`C>o6NxNxJOHSpg8
zvX`ic0!vGj3=JB?bC&?Kj84SzSvd_Xjg4H{9cu!~1?SUDGH{j1QRVX7ar}>nWd24Z
zgFaY1hT>Za1ly?re*9qt$u(N^-yb2+@GTAcoiz@V=xTcWnZ)tm0?K#;1Qh><@q$Ae
z4jmYs|2}YMe+O>D`kmVd8sir^Yjl6K{}IvT--uLu_wO6XMZ90Lv9TR3eZ>Jp+0wP9
z{SyH2!fj)osc<`6sdsjH*;}NP;dH(sjmx0+8bFT20p5aIu`&ydi-*SmK+QHyD%Wka
z`K#1j5Odv8WY%p!Lc}2X1i;n0%?{CUuMpM-$pbV70irMxwM^8v?qJ08gBhm#uWtTI
z>D;P=*137Ikn_1QJ#FkJQrnxOUOuCM=rZ1Z_HVhMp9S*wIkW-+#|Q&qtldxQR$KEf
zp{P9__O@HY4y8Z*o}XS>R_ertW;Acy1c%dGW?^14CQAA&3LX%MXj}p4+vig#JY}wS
zs|!u%;|=k2g(m4rHd&2a#!Uk4pWU1QcKcc8*Wn>+J^fvOi>1y#YT{$C=xx|KM>A{#
zFYi=g5v2OyU@X?o4Egza*oR((y`Q!DoKpDJ-Uy&-!%hj*MVX-_IzHO5Y&<p}gHBK6
zXq$P{PtAx6g6>d`+n!&Ssr)v~7$?hYe@39E=*`_HLs@((QMJ1E6I=j{cfjNSkpwy_
zz&z>K;M1;z%gKn;rfC;8{^i|Jsz{{Z^J>6T|4O6De3Lcli9UL`^uQIpYQFH1VDq<I
z27lnF+L31kIX}798$A^w+h^v=n}iIiq#r2GV`VP5(a&;-6+FO2x92^LwRl{;{Bgn`
zhAI?Gxv7#|Q>Betn4vYOW#k7s<Y<`91zOpeA&xpZ3RK+qSWus{7?8em+J^Z?*fe6;
znMZd{Hur+J?sR$a<9wqVHAcm1Ae8uH9HRlz7Mm)Phk-7oK{6Wcu5DvHI8>9Rc<R#s
z;f~|4-Tq(LPJ2BB8E2wgi|rQ~P}FiTG(3Ee0Pt96IQmtOxaxOHiUQQ`0_<l82=ck-
z7Z=UWH~KH^i<Ps)VN~9f1QIntBY<F6wbgBZPjbsAeNk1CkH-5INF}>Nys)a{Y;72)
zp;R3eE0)acdu}g%<{S#sGXbUX)Gh6?Of;fO4%qBAx30@MNxlWwAGMg(DA4@}$vm$G
zN$1mDK85u*k>^-yaMZ?5ljZ)GdG9^wgYa&c$Jxme_{Ur?Ik2mi-S8=N+UJC}1duBq
zFRq_-AXO~3VD(4h^*3Du?)lOY+GDeYA06Sycc^8X>}o325t-(yk_IV<*4Oc_d(9pa
zOZQIqKaZwyes*rG^`Ej7_)+M?7j<zReSN2U2)wCa<o=I+w}Y*qa@BkXme--9(e)q5
zq=d!m1wC4vj|CB8Ny1_bgowvP8lGS1F31EOh22DhA)8mj>Ua0}ws!MvV@RHaO4IYi
z9YGO*U5r`lAOXojJ8^$mV&L}>%JaI>VS{jvsyTLnK}Y*HoV!s$tB01X-9M3C&m~95
zX<#j$M`$PEtNqm$5j{K;vV3!4hJbhf`I+hQkQaZ~CI3Y-ONb?PrkIyKiEb;Y&u(Qb
z$IkJ0zPhm<&R4CkeTIKma%pj_S}?0w)O~Wlr$Q3*0bvC!OV$1cL5fu(2?i%@f`JBo
z&O114hxkdB>+q!+QzT+*$(}#tB?w`f$alrNkoeINBqzTT%Gd9(srww`<MgPk!)B%j
z(i+#7>bqXN@G-xOV35n`?r|zBIs~4W_M(qj4}eX;#8=m?*!GnTgg}@yVC{bnR22HE
z?QL^^+`MW!Ut<EWt&;7xu8nPNBR@<PnE>{dbu3cCk9G{%p4js(UYA97>Q9-1?(*=I
z>cz^^b5#blj;o>oQyYv?i=`s*=jJ%_+c$B5M6cy-6{i&z8VWDyw)g3)D|Ns(<#cZ3
zUwvb!V{}fY78aoZ$%~0R;mGJ3fl;4M5j?cR&P=o(D&HR=_c+L`AH{)+Z=!g5V*S2N
zrh>QDl{h4Sm(4V36)BNXTRetXL<|?Mr`I%0Hef!PEwXsr2v%T*Ux3Hgh-j(U{rtGv
zOo186sl4p8yDpiDnik$r`n>2$J)0mWLkfHaQ0(SwOyO-bDyfoguwMM!#S~M-c`;pE
z8T{@VlT08;zR^bE&gozRT!6C*2b4AjBc4A$)FqX}NKR`%nR%gtWEQwTI6d8QAivvh
zV+^R>K<e@%zO6EhcUAI-4iH@<F)C->;W#XNZ?c_}iqnX~Ovmby&i1%o0NJ+`SEay+
zqQ+yVhci{?l@=75?}=YF2Oc?ya2{T=yRV>4*VZT5>pthpLY$9}XkMd}1uv#h2gvr}
zYY6+@5xhDU+`Nv|`q>@^3u<rl*07`eGvJVh7&*ERCc_i8|FeFu-^FenLtYVyKmFT+
za@;5uw(%o0LwlDzDtzvAgl7O=BbAfZ01@?%QeWj%%A}<o`4+uh=&fVFQq`qg``sUg
z%v}uW5w}t>#QgIhx4xJMS(YWbOqhO}5~;GQy*I#+`(ZdhQtjO0N^@aiqYv(1fc0zR
z5CjFfKA60}vr1@c_dh}L|L7#WlT&9h)bqmkR&q<S#R6x?<Z=mAGL?&*er03pQiVqh
zB!nhy1Vyca(6`pbjf0wu;%ple5^yY$=WH1PUtI8Pg-)T?D=$8X*ZBs#8Z={&dZQ?)
zouS0j)AQS0pZX}Ujn6OfjF30P+j@j~LjGEJD<m_=yPifCR}peq_SKpVzD*oT<Dx4O
z11LGLN-80bqi=xsNCcM^RWnjcOUtKrkrLm#GccEmIFQFP?DBtAZdqxPG=}X{r1GT+
zCKdoBN+s+CVIiI_UoG9<7HSHKX~txAefsS{wl~>;B}|&%x%A;=qjGWUCZ^7mcxbqb
z)#Tt}rbMUgb^80*_FsjPR|Gs5Odcl#2dbU)I%_F=;d5I)Kt4Fd)F)ZG>8R#M3VyMe
zzg3(n8B$9k%j!72LEYOMyI*!cl{aZsx&iU^WLGSzZ@&k3q1~@0((80y=|#;-cGnSe
z5)pqAGg@USk#*<EBI)UbDvzuztX4M$4~GS)ORc9V!{GEt`HFadB{83BsWl-(0Dj6z
zDzCqMCKw)!lA^pE&-tElp2r>v2whD*HAuu<(3EUv5J`Ptx5hK0v1Fn>YPFzJ=zO+j
zk*`3b!FLewFb{90Uc1pNAnvR*Q?JPBVD={iJwHXBvr;>m?t*cd^+>ERNWv*gJSm@|
z_jSI4>bA#_SGU#QPgSSm1tqEDeY^jtb&XuMP&yd_#Ffw%Kt0i|r<?B<na<x}ZJQ~~
zsF-%TH)1d^_<@1Zy+QJRws9-&kdBpd+Ww^-k)}+g;n?(t6pYO7y6!1Rm6Cym$28*F
zG;s;+6dkjT^`~XyB46?uMHS3czDvwW&DThAiMZ?~(##z>laHpo^x4_4HM6ml0US-D
zi=KGA$xR2O#uxc2o8a0p`e*fw)_>)zx;Dt~ap;s`@=1)?`r3MWn?S)@m+dQ!gmwZz
z^zr%O{_=Yhz<H4yNAZ?i!4UDjiaQPqupG~3fs+OR2Ir>-uL6Y>Wslvl3@vY+L>4_f
zz^5f48+Tf()>PVj=uP9Q?cLcrr$2&H-Z9N<ZX#}L3N!PEn?*<MF3}=|ob_G0;?`{O
zeq=16Z%sKug45-Zt8IjB26KDAF!@5upZjSpl}5w@Hu2C>ap^l4F3iWnsCR#C7PfTS
z^<5_m>1igoCJvnW+^Q~=mizix>`OeH#oIAG>iW$9rV}nl{3CNEfmJU(l?g;fhThUJ
zYW6f9&Yhp_pyzvRqk~a`Kuq|dJxw0=g@nzgE7B(~yYfEWod|dtcP%(*f2D1&sfff&
zP>OY2l|TvR=L_3x(3~SKX<=#diaxuNseba4ZbxFm9km2mL25nj8NY`1zVqGHZ+F77
zCvJqoF-q+G2roWsp>T{4?m0Y3osW@ub^tM%1m{$^*p5Bq2pa(_tm|}1c4&{#dTj|?
zr*G;zt3~<%s>YFaE1atzZSQa~W>wbLkeZ1`8CX!?mBW6};Vx^h*$MrFe#HwU!zk;+
zu(mlzlj+}SGUv>q4E~&_!0PZMI!9V8suK4KZ<R}-rha+w)eo=a?vLf`AQD-qnYqLu
z41A~QX``0QLbdox3ziG@I#<}<D04Rw@%fA#y?m~av|-KPrwXLnr5#~G8;Z<?T&UNA
ze6l<G$$Rf}Ei#+^TV@U@n(g`TTQ~Y*f;|;5*HLz5*X3!VHoi<qsxq$nUPjye_Oop=
zsk)WYaL~oK7p4M#UMO7$GVkcbDyPNDVAjXS$8Ap6t)ak5z2-6q)$avl{pqsz3d_IG
zf$epk(|V6g?~nquQKv7qlVY|oA+V`Vd3-H}7Q8{IoCnMNTay)_2U>9TPdGU_eQR|;
zL<=9bC%2ugh|k88AsxPp1{M@xH#uQbf~l{^6K<PPLbvcXz||S2PWA|~tCblSV8{k=
zFmqZ4&J$tR5d;f0^g{)@Wgc;%^(x;>iV5ZE0^`MkBx?@u-u=Sm9#TS>(fHl?R7MBM
z^%O(HTBVa*LL^En^5~VBueHU`Ug-!X?|fb<iCs|y=}qeY#uWcpOKP9lm9row#*Itb
z=ANP_(ZeRwqh5G<Hfct1AoS8?@#9btr1pKqyH`SmdY9F}t2qq8i{>Tm0HOxLk7cIz
zGR44%bAL1Tr&taGemnMub{PU?u-G`<-u~=hiPCq+D+ER~doUl`IUMLU5dzQN%Z!8V
zNrfY&95K#`w<RrJ>x{HFmr2eHbx(-~FHwH$`=s2|99uhjqNG<HqH7QkZ7ydt=b$rc
z-j61qvk-X+PzDs{9hiLlp&R)Ml`lUuKxM0`R&(+B{tQ!QW<U4{zH*J-kbL#;7NV?H
zDzuYt1BEeL#2ckK{TRKt{JICEkaxHj$T*}XB&tboy*uRL;8OlBr?eLWbKAPv-P>%q
z%La$yRa(;SDrTd&U8;l%Q_%Z|W*Ll<KfGqpMf!LMl+qfm#pMbzRgq!~b7px0e4S=8
zg6g6QRB{YSm7Ve|$I`VaZ|c=^Z|C~ewJvI4Ubw{)0&Eu8UOsOoAnihlH(L+D^wc^(
zgWayK!?gx)_I?%w#vf(L#taBzeR#fGA{_cc`7?OH=@a&1(83X8vg~)=88D%EQABYe
zZmMf`O8C-=3BT3JZzUw$$GOv$gt6d-MsSLZ2Nf?^@r^0J3X?nV3VZ*OaY3jdG$$7G
z_YL<=oy}yYh-QUhu<h;-s*HIxybk?0i+(7PEX1XuwgKPBsVB94>5lPr0`#RVb0bq&
zzu)Yw5F}EXAN9R!aXC&G&K#eh+@pr=-O`H7U5!um_#l9aDshQRoKBA;`d``rZ=+SL
z8++Z2p0BP*=>$-qJhHLnp0Gx_`qUMeXLbZe_0t&FcdEFO>14SD{n?!>PS9XM8{B`A
zq*pT$&>E!<?!E-TS&ZP;Jnu{IyMx1OZVynZr~v|q!`<tAkC6744^^l%qZ{URHy;&o
zl3Gs@>tMWv(1gbq;=0E#3LlcI{ds(P+4qW6ixF1YOQ75fq4`#C)`Yb!kN4g-`E57+
z2%h>AYtjML!+M%?=RTU0`Sv{(^9NGc>l^Y=u0Jt(Y6%NYXGcZd<rFtSS_Z3)cj;10
zbM0rL0_W4~LdN$LuL}|0Z$KvYJNzGsfFdL6A|&(_J2F^fVo5Ev?95^8L8gXpt{@`-
zfhpR7ik?>*IOc)j1Q;N6pao8ePk9Dy9!Plmh@}&}Z%|+YfJ*YKeaNQ)KrLZTAtFGL
z_B@GGGS4JTdlb6+x)A4hIj=PS0%N6fp7!Q*jv+hZ{!|g~K|Wu@ad1-r#3N2=GrtL;
zVxbXn`C%|mb6+i0Xj)`I*rtWVU(XyajV1PUu@Q&l@Y&KObCw7I+L};fKMVG_n%>2A
zJK=u_L66MxbG5_H)@^2c42?q2YeySY#09$>AQH+R7Pa8*_RVsjWP5Foe&}7d$)X6)
zfF?-}l8cRyFH31sis1g8b^_v(vm>Dwl&(AZkjWnH4zmQow5I4Qyg<)QoEG)0Oho`H
zphB-Vz3{EbCW{bFXjg4ed-uzFB!8p3(r3@{Fob)5DsPYg6N~>+YpKl(F*o08qy^7j
zqzzR&H<tf38l&lxijVc@`4tZPP*pn=i|K4HVhfKqG%ZCxmC3$6HR{K$7gy|YPu;E3
zSVYYl5^6~4M%n#&IOp<x9GjC%qdg$oxq8}6op)_P%igc|t&8`{5%G^GtqNGX`0Pq=
zSjj9H?G`<A*khd+wgTkE;%Y~)HO4;|tKhbOiD>iuBH*$mr^5%&KrbUj<b3(20|HY-
zfxfeNetLvy<A%`yJ6IP5q(;@(mLsZudQykL>8y=}7a;B4LFwwY-h=hz=<|^R(HH?n
zLtwtymLV7*G;r`VK!6P_>k5+W%n9q>LJM4&AYt2&UpK^19DKI*1sAN$p^!mI@geLe
z!#607#TZTwB-^!@`cfa79o9eP)LC}>$8S?N<-Ojlpm&hM`{O;xtEhhL{SsuwrY~L#
z*kkj-d%Y*Xi!cClFlT?RB+t3<gdLIF&N;p)6sXk5ZC6xJr?g^CY+#7-GcgGZ=PqN?
zku1}!iW)1|B)a}^jUJ3Ll^lt#p$HU<;9sBF-amvdJ~5ac9tX@%<Mn5UlK#*g@pl^i
z1JH&)yE>(FDxH-{uRU^n|K8P*--9R?P~=cz?XhOO$7ncMC0xX-maRF(<vv^{yUxsO
z@(M9(52L&hv3Q}}{9#~K=KzieU@@53v9~g0tvK+Lt$IPpB4sGvBW$i#(#;<C7S-lj
zA8bbXZljbYthW0`JEJ2|_~f=b5$xtQ*#g{!jj7rEBNveoDQ`7Jk#>E%_pw)XdD;YK
zZ9c;d1-L1B+uxLBIG9BJG>)%0OD19}M>iCakw`?mHHuyq9+7J(=ZIDgWLPgYRib&k
zJKkD{6`&N};WoUdwirpA2IaqzqkxGUVyfhbMo$`5=?kP;ga}$^AX?n9Kj;ThC-No*
zS*cN~L;{{!L%-FqW>!~3FJuwC^dM-cEV#f^mu}n;CSL9V#XwzwcI11dH$}vw_f3dK
zN?FEsZqoMFcf9hR=hJLE5%omM!1zJW#_7*YDnOEfNj8vIx!8{v`<vc?9XoS!&4<c6
z;QS`bm?3+JJWI$Rt9m;kTO7VSl-aA|4Jlqb_KNlgmiqp`Jced`s=akDI6->!+QLt1
z@&dF$56P99q#|u@@p=-oQ1Q-7ys&RTT1EqRl}27Q$YJNrrP*aWWWZ)S2^{)Cp&x-U
zIpS*QmG@Qu3r7_<_x)VuPM<#*BlygLb*62<dUzCOJXo{{G+x9~ljS+Gm}!$O7YS6j
z_F4_U-5023@PyZY<p(LzcXlV}7j|M@mh#q(S|z&|l02Ta4h4tSuAdln1nXqUZtS8+
zPnc^fIttOWg`3d65$vg~pX2DdC79>N{w3}$v(ipPuH$n`pdqzzG@YG)=Q@X#SX&w8
zOI1^)cCs4r%^2&H7D&R~nfVp)dG?L9A?<N$e;W_ys0*OKyt){HNw6hP4+|~;t_-25
z_#-orGPRLbupSejNvB<;zj@scqoAKGc&DLD79keTYp?qrULIWb`dfhvO}T8Ld{T`<
zOOPxZ7z_rCZ<5DeQzE5C5%Vc40hT^Qi8H+um!^Q++2s(iP@qr{WU&bKO&ERNL)M6!
z9>I%!1y+yy&UsO!_N#NUxlrV{Py_de_&>4PFzdw_Y)d;5A(YZSQ4_}cIfqYHYiK;;
zy9diYlQV1-2xw_7o&qvI^eEJmmG|Zrx2&uyRaIa?4O&f}nPUEEnqOTNT$v3!NidYN
z)_!$~wF@H*H|+%^5`dJ5d8DB8Ptu{;A&nnTsHS30R_X{X`gr5|ziUCw1o}Tw`kM`!
z4mpvh)wy{XkG2R*im9NU5^AJ2soB9cz<sY0e;B>?y3jG1;jLxia4%4BJd65uc5sS}
z|52+2&5h?jcuCM@<Dw@2BR!ljShty~v@rTHdqc6{Jy4SaiDZwhDLN5*QMP^hA4`Kk
z@ARPxN1MkNuguNnQyq)hK#AAwZx&jfTd9$&4{O}LlF>%BAC{;xwcGGn9=s_&etsB0
zoY@lsxDjDOE&g<t=!D@p_Wq%Ian&|sO0HVQ_aR;-6E(C8=*NKor^dwdyXen^p2<OY
z3;XgivukZ2tuI?{<Eccak}U<~@)fH-H3g7hvCfM{a0f&a@u+QTrV=eRI~oBpu_4xl
zk=%kaN&@hUx87dY@-6p~pHhL^Uz2U(PQguX5X-oKkQ<nN#uz5(;HRhMCy7huZ+98E
zFVB**(O)e#^(5?$OFuvbTn-0r-kHrz=hn~KeOvp$74_2biS;H<MYr`Ojel*J<gzZm
z+l{aUZ#ZTCC!>sk=pc(CG%B(Y;%U&IF}4-76hcv(<ht(J-a&Jia@~FBe!??XR;gwc
zI&i8YZTpz-5gbM_j^L<*SsS{E{M*M{-rCu2)sV-14;PO44;q0ru4lc0l@&6L_s7F9
zHLAk5@Vol0rZi~v(01Ha^6ilDet~trNp15xm`2edpJQ^M;4n~?nhY$;#8jF3oUr==
zICmRP*m+`}g$zP-_ok^iX=-yJwSg!^n_{E*fjze6o~78<Gu?2q7$jfdc)83+pfihn
zJ!%EgvyvQuJ>myhWT^%>cZn<yRYR{ZULJVHAy?B9Ken{}eBZ|ddi~nhtR$kLq~Cc*
zN+ov?q0=F=Vd0Z@%RuUB@_k#4`-Ymv;ZK6X<MPs*#b#r``p6L9%r;z5T;m48u`m1U
z;d#Os8@-Jl-g<HM+Wd$Cy>>nBL0dBqN!flYz{WU^oTZ)?LmK<-A<hyW#u-;tEvH1{
z{Ky-j$q<a)II^ByQjOEi%`j0lw}C8|!$aLPY7|;%wkwyRt{<`2&*`YleKafRU2nO{
zRWebrf912$)~^KbrIab+qiOKgOCSoQLdWn2u^-9~3YQ>dW_;{dSEFfUfNvR1WJow7
z<FUa7Dj1@Lmt6w{)nRQM;t=9ywLMol#new|2!S_9ZWHJG!if@#5)Tg#(~4B`J}&+<
z#3dA!!@+r7(4uGkC4RMB@zkoyW7W4thWFV|uUYj%*Xwsppk_jDwhNG^XX@-PDmty$
zUE^8RG1S%^tyX+n<D?+xKTV#32cqt+FK}gNock*-hn>50w>1|V41pC&;S+}_&6gtT
zN&5mX2`F@mGSB{k7r~fY-2Bi9pG==RG(6e%)X;^*;*`P>Il=-QD$JRV>R6Q<ymSua
zk4JcayGn}xFsyQzr+5*nMjs}<c6Uy%MsE{a`?GjPOC&gg@1+c0&1kT0lRLXTxBxNQ
zv>5hIox=r+xfG5W=30FsU;n!`VBD~wwmv*%6=~ghO4Ys?rTgLoPLc6+&FYLt5FYhl
zY?wQoAK;i1x=*M<zsM1x#S*!)iCFGYFf#D<do8^&Uiz(jpCf5humIDmzf_j|N`Poy
zyguLLHv%yqi3i0Pc1T5Z=h<Y;G66``>1yX7!J_|=RwsKp#;KioS+GKr$zVfL$-&Ya
zi}X3jpV=p@C@wwB{L4&Axg6??+tP*mT8UCQ2BrO6X+4YY9~nAjpBQ;d4$SGeLZ!&7
zXKsN;w;m_z^<9z4S`k}_)2v<3<e7=-ex^if^tmtaeDS;OJ*Dhple0X7Anbw`#Yw_%
z!9_=D7E_*B+LskbHH3P@)N4h5NV?`*dFFn=BwT5^a&Te*CmJ2@i>+bm4*D-P+kg>p
zoHL_KB=HvjS4@4F$0Qe(J4GeRnBKLz2ocR!jfDl7Q|viiI=uc_{4RQ$L1~eV_p2zB
z9D(mtn!?~<S}tS3tsN)*&(%HZ5*`OLJ!^mQK>v-vaEAeKC3i9LKsglxy2TwViqx5<
zVR^IaPBia%_4zy3My=cjV*f+DI@Hr>H#|J&N2IZ+DFBwWqaF(2t6B{Sl?%_Br2@((
znC56nkQxD`gk0{3WBx?bv+iT0_z~`CMJu93{>r990KaZh5``K^#5#(FNH?J!;KlVl
zjTQ)Z0?d!ygS&%!1;PNTU<+E`oQ?2tkto(309g+u^unqTe*gjS53~zgn7Z|)H#}%^
zZuoSw`bBWWovkG+7eFA0EZpo;MgX19jp|zh1Oj}8fE7W&$0FN7I1)6`{uj-5?2*y~
zE|5ylyhOBw<a*)IF1!R74CxK&V(h^vV;Ss|c;8@DlLa&VfdCxd6V;BSN$~`L+0ZV_
z9nN5I=vQsQr$ciHR>0V(1wt^2YpvVE+%SylDLw5w8Ukp?bbnlrE;wR*D%z^{WxCcU
zfX1klYK>|PiMRe~^Yrb13!s%B2*4mU9={u<&j{|ncVaLg3t%u*r+pnYhM2G>$2<dl
z>NDbUP3wmB=rcch0r8xBwVpF;ieLWa2(%;P*u$YQVk_y6k*EG|0pR}~0aUIFD(%2K
zCZN~<uM>CG31I059<CHZfTYp?^V|sN)BhV|F-IUCQ5C-Iew3P*6)%{+{nM{u@xbaQ
z5Dj4_V$REd@$r9NV+`rWhx>OQza<9f7jKEx&p!W~dsF~SfldT%IL%KWWB7miMe&Os
z=+Up#AeE4R_3__p2sF-k{yFsjjBQv3n1bN}Twkhx*}=bmgauXqo11?E$?*a+A;(*^
zhGX*2vHeHD2q0hdf7dnfI#qxrQ^x_HgY@slhrMLY_Fwk=?;pQJ18e<DG{c?LKMl-(
zT?2+UdiC$R7H0>rd*baByXkuVX=?xT8Z^c`qJJ^$|7bnXJpbGCt6Ukb%ttck%@@GW
NJ85O9DhcDD{{!UxL302A

literal 0
HcmV?d00001

diff --git a/torchao/float8/README.md b/torchao/float8/README.md
index 99bb80c4bd..8533a05779 100644
--- a/torchao/float8/README.md
+++ b/torchao/float8/README.md
@@ -132,7 +132,9 @@ on using `torchao.float8` in a distributed setting.
 
 # Performance
 
-A common question about float8 training is "when is float8 linear faster vs bfloat16?".  Given the M, K, N of the forward pass through your linear, you can reference the table below for a microbenchmark based speedup estimate on NVIDIA H100:
+A common question about float8 training is "when is float8 linear faster vs bfloat16?".  Given the M, K, N of the forward pass through your linear, you can reference the tables below for a microbenchmark based speedup estimate on NVIDIA H100:
+
+### Tensorwise scaling
 
 <img width="805" alt="float8_speedup" src="https://github.com/user-attachments/assets/5c5f2817-7eb7-4cab-bd03-49fe70cd31a8">
 
@@ -152,6 +154,11 @@ To reproduce the raw data for table above, you can run the following script
 python benchmarks/float8/float8_roofline.py your_output_filename.csv --shape_gen_name sweep
 ```
 
+### Rowwise scaling
+
+<img width="805" alt="float8_rowwise_speedup" src="../../docs/static/fp8-rowwise-perf.png" />
+
+
 ## Derivation
 
 In a bf16 linear, assume all of the time is spent in gemms.  In a float8 linear, account for max_abs and casting overhead.  We want to know when

From 95151b4ca2697ff11e8841778aac31cace008ccc Mon Sep 17 00:00:00 2001
From: Zeyu Song <87307087+szyszyzys@users.noreply.github.com>
Date: Fri, 6 Jun 2025 14:16:10 -0400
Subject: [PATCH 092/165] Rename kleidi_ai in PackedWeightsType and update
 references (#2318)

Summary:
Rename kleidi_ai in PackedWeightsType and update references
---
 .../ops/linear_8bit_act_xbit_weight/kernel_selector.h     | 8 ++++----
 torchao/experimental/ops/packed_weights_header.h          | 2 +-
 2 files changed, 5 insertions(+), 5 deletions(-)

diff --git a/torchao/experimental/ops/linear_8bit_act_xbit_weight/kernel_selector.h b/torchao/experimental/ops/linear_8bit_act_xbit_weight/kernel_selector.h
index 930b93bd46..958b9c08e5 100644
--- a/torchao/experimental/ops/linear_8bit_act_xbit_weight/kernel_selector.h
+++ b/torchao/experimental/ops/linear_8bit_act_xbit_weight/kernel_selector.h
@@ -255,7 +255,7 @@ void register_ukernel_config_kleidi(
   if (!cpuinfo_initialize()) {
     throw std::runtime_error("Failed to initialize cpuinfo!");
   }
-  check_format(format, torchao::ops::PackedWeightsType::kleidi_ai, weight_nbit);
+  check_format(format, torchao::ops::PackedWeightsType::linear_8bit_act_xbit_weight_kleidi_ai, weight_nbit);
   namespace op = torchao::kernels::cpu::aarch64::kleidi::
       kai_matmul_clamp_f32_qai8dxp_qsi4c32p;
 
@@ -343,7 +343,7 @@ void register_ukernel_config(
       register_ukernel_config_universal<weight_nbit>(table, format, uarch);
       break;
     }
-    case torchao::ops::PackedWeightsType::kleidi_ai: {
+    case torchao::ops::PackedWeightsType::linear_8bit_act_xbit_weight_kleidi_ai: {
 #ifdef TORCHAO_ENABLE_KLEIDI
       register_ukernel_config_kleidi<weight_nbit>(table, format, uarch);
 #endif // TORCHAO_ENABLE_KLEIDI
@@ -411,7 +411,7 @@ PackedWeightsFormat select_packed_weights_format(
     if (weight_nbit == 4 && (!has_weight_zeros)) {
 #if defined(TORCHAO_ENABLE_ARM_I8MM)
       return PackedWeightsFormat(
-          torchao::ops::PackedWeightsType::kleidi_ai,
+          torchao::ops::PackedWeightsType::linear_8bit_act_xbit_weight_kleidi_ai,
           weight_nbit,
           has_weight_zeros,
           has_bias,
@@ -420,7 +420,7 @@ PackedWeightsFormat select_packed_weights_format(
           /*sr*/ 2);
 #elif defined(TORCHAO_ENABLE_ARM_NEON_DOT)
       return PackedWeightsFormat(
-          torchao::ops::PackedWeightsType::kleidi_ai,
+          torchao::ops::PackedWeightsType::linear_8bit_act_xbit_weight_kleidi_ai,
           weight_nbit,
           has_weight_zeros,
           has_bias,
diff --git a/torchao/experimental/ops/packed_weights_header.h b/torchao/experimental/ops/packed_weights_header.h
index 11703e8454..90f77beae2 100644
--- a/torchao/experimental/ops/packed_weights_header.h
+++ b/torchao/experimental/ops/packed_weights_header.h
@@ -16,7 +16,7 @@ enum class PackedWeightsType : uint32_t {
   unknown = 0,
   linear_8bit_act_xbit_weight_universal = 1,
   embedding_xbit_universal = 2,
-  kleidi_ai = 3,
+  linear_8bit_act_xbit_weight_kleidi_ai = 3,
   linear_8bit_act_xbit_weight_lut = 4,
 };
 

From 423583779f1efc00339a589b3b40536ac3287642 Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Fri, 6 Jun 2025 19:09:41 -0400
Subject: [PATCH 093/165] Add slicing support for fbgemm fp8 and int4 (#2308)

Summary:
att, this is needed in vllm
Note that irregular shapes will require padding, which is not implemented right now, we can add that
if it's required by the model

Test Plan:
python test/dtypes/test_fbgemm_fp8.py -k test_slice
python test/dtypes/test_fbgemm_int4.py -k test_slice

Reviewers:

Subscribers:

Tasks:

Tags:
---
 test/dtypes/test_fbgemm_fp8.py       |  79 ++++++++++++++++--
 test/dtypes/test_fbgemm_int4.py      |  86 +++++++++++++++++---
 torchao/dtypes/fbgemm_fp8_tensor.py  |  89 +++++++++++++++++++-
 torchao/dtypes/fbgemm_int4_tensor.py | 116 +++++++++++++++++++++++++--
 4 files changed, 344 insertions(+), 26 deletions(-)

diff --git a/test/dtypes/test_fbgemm_fp8.py b/test/dtypes/test_fbgemm_fp8.py
index d2f1e2d82a..56cf5ea081 100644
--- a/test/dtypes/test_fbgemm_fp8.py
+++ b/test/dtypes/test_fbgemm_fp8.py
@@ -25,24 +25,87 @@
 
 
 @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_8, "Need pytorch 2.8+")
+@unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+@unittest.skipIf(not is_sm_at_least_90(), "Nedd sm90+")
 class TestFbgemmFp8Tensor(TestCase):
-    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
-    @unittest.skipIf(not is_sm_at_least_90(), "Nedd sm90+")
+    def setUp(self):
+        self.config = FbgemmConfig(
+            input_dtype=e4m3_dtype,
+            weight_dtype=e4m3_dtype,
+            output_dtype=torch.bfloat16,
+        )
+
     def test_linear(self):
         dtype = torch.bfloat16
         device = "cuda"
         input = torch.randn(1, 128, dtype=dtype, device=device)
         linear = torch.nn.Linear(128, 256, dtype=dtype, device=device)
         original = linear(input)
-        config = FbgemmConfig(
-            input_dtype=e4m3_dtype,
-            weight_dtype=e4m3_dtype,
-            output_dtype=torch.bfloat16,
-        )
-        quantize_(linear, config)
+        quantize_(linear, self.config)
         quantized = linear(input)
         self.assertTrue(compute_error(original, quantized) > 20)
 
+    def test_slice(self):
+        dtype = torch.bfloat16
+        device = "cuda"
+        dummy = torch.nn.Linear(256, 256, bias=False, dtype=dtype, device=device)
+        dummy1 = torch.nn.Linear(256, 64, bias=False, dtype=dtype, device=device)
+        dummy1.weight = torch.nn.Parameter(
+            dummy.weight.narrow(0, 0, 64), requires_grad=False
+        )
+        dummy2 = torch.nn.Linear(128, 256, dtype=dtype, device=device)
+        dummy2.weight = torch.nn.Parameter(
+            dummy.weight.narrow(1, 0, 128), requires_grad=False
+        )
+
+        quantize_(dummy, self.config)
+        weight1 = dummy.weight.narrow(0, 0, 64)
+        weight2 = dummy.weight.narrow(1, 0, 128)
+        self.assertEqual(weight1.float8_data, dummy.weight.float8_data.narrow(0, 0, 64))
+        self.assertEqual(weight1.scale, dummy.weight.scale.narrow(0, 0, 64))
+        self.assertEqual(
+            weight2.float8_data, dummy.weight.float8_data.narrow(1, 0, 128)
+        )
+        self.assertEqual(weight2.scale, dummy.weight.scale)
+
+        # check for sliced weight, before and after float8 quantization
+        # does not differ too much
+        input = torch.randn(2, 256, dtype=dtype, device=device)
+        res_ref = dummy1(input)
+        dummy.weight = torch.nn.Parameter(weight1, requires_grad=False)
+        res = dummy(input)
+        assert compute_error(res, res_ref) > 25
+
+        input = torch.randn(2, 128, dtype=dtype, device=device)
+        res_ref = dummy2(input)
+        dummy.weight = torch.nn.Parameter(weight2, requires_grad=False)
+        res = dummy(input)
+        assert compute_error(res, res_ref) > 15
+
+    def test_slice_and_copy_(self):
+        l = torch.nn.Linear(1024, 1024).to("cuda").to(torch.bfloat16)
+        l.weight = torch.nn.Parameter(
+            torch.zeros(1024, 1024, dtype=torch.bfloat16, device="cuda")
+        )
+        quantize_(l, self.config)
+        param = l.weight
+        param_data = param.data
+        param_data = param_data.narrow(0, 0, 512)
+        assert param.data.float8_data.data_ptr() == param_data.float8_data.data_ptr()
+        assert param.data.scale.data_ptr() == param_data.scale.data_ptr()
+        orig_value = param.data.float8_data[0][0].item()
+
+        # dummy_l has random input (shouldn't be 0)
+        dummy_l = torch.nn.Linear(1024, 1024).to("cuda").to(torch.bfloat16)
+        quantize_(dummy_l, self.config)
+        quantized = dummy_l.weight
+        quantized = quantized.narrow(0, 0, 512)
+
+        param_data.copy_(quantized)
+
+        # making sure param.data is updated
+        assert param.data.float8_data[0][0] != orig_value
+
 
 if __name__ == "__main__":
     run_tests()
diff --git a/test/dtypes/test_fbgemm_int4.py b/test/dtypes/test_fbgemm_int4.py
index 22fe5bc110..25b71f0244 100644
--- a/test/dtypes/test_fbgemm_int4.py
+++ b/test/dtypes/test_fbgemm_int4.py
@@ -24,25 +24,93 @@
 
 
 @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_8, "Need pytorch 2.8+")
+@unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
+@unittest.skipIf(not is_sm_at_least_90(), "Nedd sm90+")
 class TestFbgemmInt4Tensor(TestCase):
-    @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
-    @unittest.skipIf(not is_sm_at_least_90(), "Nedd sm90+")
+    def setUp(self):
+        self.config = FbgemmConfig(
+            input_dtype=torch.bfloat16,
+            weight_dtype=torch.int4,
+            output_dtype=torch.bfloat16,
+            block_size=[1, 128],
+        )
+
     def test_linear(self):
         dtype = torch.bfloat16
         device = "cuda"
         input = torch.randn(1, 128, dtype=dtype, device=device)
         linear = torch.nn.Linear(128, 256, dtype=dtype, device=device)
         original = linear(input)
-        config = FbgemmConfig(
-            input_dtype=torch.bfloat16,
-            weight_dtype=torch.int4,
-            output_dtype=torch.bfloat16,
-            block_size=[1, 128],
-        )
-        quantize_(linear, config)
+        quantize_(linear, self.config)
         quantized = linear(input)
         self.assertTrue(compute_error(original, quantized) > 20)
 
+    def test_slice(self):
+        dtype = torch.bfloat16
+        device = "cuda"
+        dummy = torch.nn.Linear(256, 256, bias=False, dtype=dtype, device=device)
+        dummy1 = torch.nn.Linear(256, 64, bias=False, dtype=dtype, device=device)
+        dummy1.weight = torch.nn.Parameter(
+            dummy.weight.narrow(0, 0, 64), requires_grad=False
+        )
+        dummy2 = torch.nn.Linear(128, 256, dtype=dtype, device=device)
+        dummy2.weight = torch.nn.Parameter(
+            dummy.weight.narrow(1, 0, 128), requires_grad=False
+        )
+
+        quantize_(dummy, self.config)
+        weight1 = dummy.weight.narrow(0, 0, 64)
+        weight2 = dummy.weight.narrow(1, 0, 128)
+        self.assertEqual(
+            weight1.packed_weight, dummy.weight.packed_weight.narrow(0, 0, 64)
+        )
+        self.assertEqual(weight1.scale, dummy.weight.scale.narrow(1, 0, 64))
+        self.assertEqual(
+            weight2.packed_weight, dummy.weight.packed_weight.narrow(1, 0, 64)
+        )
+        self.assertEqual(weight2.scale, dummy.weight.scale.narrow(0, 0, 1))
+
+        # check for sliced weight, before and after float8 quantization
+        # does not differ too much
+        input = torch.randn(2, 256, dtype=dtype, device=device)
+        res_ref = dummy1(input)
+        dummy.weight = torch.nn.Parameter(weight1, requires_grad=False)
+        res = dummy(input)
+        assert compute_error(res, res_ref) > 20
+
+        input = torch.randn(2, 128, dtype=dtype, device=device)
+        res_ref = dummy2(input)
+        dummy.weight = torch.nn.Parameter(weight2, requires_grad=False)
+        res = dummy(input)
+        assert compute_error(res, res_ref) > 15
+
+    def test_slice_and_copy_(self):
+        l = torch.nn.Linear(1024, 1024).to("cuda").to(torch.bfloat16)
+        l.weight = torch.nn.Parameter(
+            torch.zeros(1024, 1024, dtype=torch.bfloat16, device="cuda")
+        )
+        quantize_(l, self.config)
+        param = l.weight
+        param_data = param.data
+        param_data = param_data.narrow(0, 0, 512)
+        assert (
+            param.data.packed_weight.data_ptr() == param_data.packed_weight.data_ptr()
+        )
+        assert param.data.scale.data_ptr() == param_data.scale.data_ptr()
+        assert param.data.zero_point.data_ptr() == param_data.zero_point.data_ptr()
+        orig_value = param.data.packed_weight[0][0].item()
+
+        # dummy_l has random input (shouldn't be 0)
+        dummy_l = torch.nn.Linear(1024, 1024).to("cuda").to(torch.bfloat16)
+        quantize_(dummy_l, self.config)
+        quantized = dummy_l.weight
+        quantized = quantized.narrow(0, 0, 512)
+
+        param_data.copy_(quantized)
+
+        # making sure param.data is updated
+        assert param.data.packed_weight[0][0] != orig_value
+
 
 if __name__ == "__main__":
     run_tests()
diff --git a/torchao/dtypes/fbgemm_fp8_tensor.py b/torchao/dtypes/fbgemm_fp8_tensor.py
index 735c21c2ca..df7ce69de7 100644
--- a/torchao/dtypes/fbgemm_fp8_tensor.py
+++ b/torchao/dtypes/fbgemm_fp8_tensor.py
@@ -13,6 +13,7 @@
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
     TorchAOBaseTensor,
+    fill_defaults,
 )
 
 __all__ = [
@@ -23,6 +24,10 @@
 
 
 class FbgemmFp8Tensor(TorchAOBaseTensor):
+    """
+    TODO: needs padding for cutlass kernels
+    """
+
     tensor_data_attrs = ["float8_data", "scale", "activation_scale_ub"]
     tensor_attributes = ["dtype"]
 
@@ -118,9 +123,13 @@ def _(func, types, args, kwargs):
     xq, x_scale = torch.ops.fbgemm.quantize_fp8_per_row(
         input_tensor, num_tokens, weight_tensor.activation_scale_ub
     )
+
+    a_data = xq
+    b_data = weight_tensor.float8_data
+
     res = torch.ops.fbgemm.f8f8bf16_rowwise(
-        xq,
-        weight_tensor.float8_data,
+        a_data,
+        b_data,
         x_scale,
         weight_tensor.scale,
         use_fast_accum=True,
@@ -139,13 +148,87 @@ def _(func, types, args, kwargs):
     )
 
 
-@implements([aten.clone.default, aten.copy_.default])
+@implements(aten.clone.default)
 def _(func, types, args, kwargs):
     return return_and_correct_aliasing(
         func, args, kwargs, args[0]._apply_fn_to_data(torch.clone)
     )
 
 
+def _same_metadata(self: "FbgemmFp8Tensor", src: "FbgemmFp8Tensor") -> bool:
+    return (
+        isinstance(self, FbgemmFp8Tensor)
+        and isinstance(src, FbgemmFp8Tensor)
+        and self.shape == src.shape
+        and self.float8_data.shape == src.float8_data.shape
+        and self.scale.shape == src.scale.shape
+        and self.activation_scale_ub.shape == src.activation_scale_ub.shape
+        and self.dtype == src.dtype
+    )
+
+
+@implements(aten.copy_.default)
+def _(func, types, args, kwargs):
+    self = args[0]
+    src = args[1]
+    if _same_metadata(self, src):
+        self_tensors = self.__tensor_flatten__()[0]
+        for tensor_name in self_tensors:
+            getattr(self, tensor_name).copy_(getattr(src, tensor_name))
+        return
+    raise ValueError(
+        f"Not supported args for copy_ due to metadata mismatch: {args[0], args[1]}"
+    )
+
+
+@implements(aten.slice.Tensor)
+def _(func, types, args, kwargs):
+    """Only supports slicing for dim == 1 and dim == 2
+    original tensor shape has dimension (N, K)
+    float8_data has dimension (N, K)
+    scale (per row quantization) has dimension: (N,)
+
+    since float8_data has the same dimension as original tensor, we can directly slice that
+    for scale, we'll do a slice when dim is 0, and don't need to do anything for dim 1
+
+    Note that we need to call slice on the float8_data and scale directly because slice
+    is an operation that need to preserve aliasing, see `test_slice_and_copy_` in `test_fbgemm_fp8`
+    for
+    """
+    self, dim, start, end, step = fill_defaults(args, 5, [0, None, None, 1])
+    assert step == 1
+    assert dim == 0 or dim == 1, f"Only dim==0 or 1 are supported, got: {dim}"
+    if end >= self.shape[dim]:
+        end = self.shape[dim]
+
+    assert self.float8_data.ndim == 2, (
+        f"Expected packed weight to have dim 2, got {self.float8_data.dim}"
+    )
+
+    # Always slice the float8_data
+    sliced_data = aten.slice.Tensor(
+        self.float8_data, dim, start, end, step
+    ).contiguous()
+
+    if dim == 0:
+        # scale has dimension (N,) where N is the dim 0 of `self`
+        # so we do the same slice on scale for dimension 0
+        sliced_scale = aten.slice.Tensor(self.scale, 0, start, end, step)
+    else:
+        # since scale is per row, slicing along the dim == 1 dimension does
+        # not change the scale
+        sliced_scale = self.scale
+
+    return return_and_correct_aliasing(
+        func,
+        args,
+        kwargs,
+        FbgemmFp8Tensor(
+            sliced_data, sliced_scale, self.activation_scale_ub, dtype=self.dtype
+        ),
+    )
+
+
 to_fbgemm_fp8 = FbgemmFp8Tensor.from_float
 
 
diff --git a/torchao/dtypes/fbgemm_int4_tensor.py b/torchao/dtypes/fbgemm_int4_tensor.py
index c2ab6246bf..ab108fea06 100644
--- a/torchao/dtypes/fbgemm_int4_tensor.py
+++ b/torchao/dtypes/fbgemm_int4_tensor.py
@@ -14,6 +14,7 @@
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
     TorchAOBaseTensor,
+    fill_defaults,
 )
 
 __all__ = [
@@ -32,17 +33,16 @@
 
 class FbgemmInt4Tensor(TorchAOBaseTensor):
     tensor_data_attrs = ["packed_weight", "scale", "zero_point"]
-    tensor_attributes = ["group_size"]
+    tensor_attributes = ["group_size", "shape"]
 
-    def __new__(cls, packed_weight, scale, zero_point, group_size):
-        shape = packed_weight.shape
+    def __new__(cls, packed_weight, scale, zero_point, group_size, shape):
         kwargs = {}
         kwargs["device"] = packed_weight.device
         kwargs["dtype"] = scale.dtype
         kwargs["requires_grad"] = False
         return torch.Tensor._make_wrapper_subclass(cls, shape, **kwargs)  # type: ignore[attr-defined]
 
-    def __init__(self, packed_weight, scale, zero_point, group_size):
+    def __init__(self, packed_weight, scale, zero_point, group_size, shape):
         self.packed_weight = packed_weight
         self.scale = scale
         self.zero_point = zero_point
@@ -90,6 +90,7 @@ def from_float(
             raise ImportError("Requires fbgemm-gpu-genai >= 1.2.0")
 
         group_size = block_size[-1]
+        original_shape = w.shape
 
         if w.ndim >= 3:
             wq, scale, zero_point = zip(
@@ -111,6 +112,7 @@ def from_float(
             scale=scale,
             zero_point=zero_point,
             group_size=group_size,
+            shape=original_shape,
         )
 
 
@@ -134,7 +136,7 @@ def _(func, types, args, kwargs):
 
     res = torch.ops.fbgemm.bf16i4bf16_rowwise(
         input_tensor,
-        weight_tensor.packed_weight,
+        weight_tensor.packed_weight.contiguous(),
         weight_tensor.scale,
         weight_tensor.zero_point,
     )
@@ -151,13 +153,115 @@ def _(func, types, args, kwargs):
     )
 
 
-@implements([aten.clone.default, aten.copy_.default])
+@implements(aten.clone.default)
 def _(func, types, args, kwargs):
     return return_and_correct_aliasing(
         func, args, kwargs, args[0]._apply_fn_to_data(torch.clone)
     )
 
 
+def _same_metadata(self: "FbgemmInt4Tensor", src: "FbgemmInt4Tensor") -> bool:
+    return (
+        isinstance(self, FbgemmInt4Tensor)
+        and isinstance(src, FbgemmInt4Tensor)
+        and self.shape == src.shape
+        and self.packed_weight.shape == src.packed_weight.shape
+        and self.scale.shape == src.scale.shape
+        and self.zero_point.shape == src.zero_point.shape
+        and self.group_size == src.group_size
+    )
+
+
+@implements(aten.copy_.default)
+def _(func, types, args, kwargs):
+    self = args[0]
+    src = args[1]
+    if _same_metadata(self, src):
+        self_tensors = self.__tensor_flatten__()[0]
+        for tensor_name in self_tensors:
+            getattr(self, tensor_name).copy_(getattr(src, tensor_name))
+        return
+    raise ValueError(
+        f"Not supported args for copy_ due to metadata mismatch: {args[0], args[1]}"
+    )
+
+
+@implements(aten.slice.Tensor)
+def _(func, types, args, kwargs):
+    """Only supports slicing for dim == 1 and dim == 2
+    packed_weight has dimension: (N, K/2)
+    scale and zero_point has dimension: (K/groups, N)
+
+    dim, start, end, step are args that's referring to the original tensor shape
+    which is (N, K), and we need to map that to the transformed weight shape of packed_weight,
+    scale and zero_point
+
+    when dim == 0: we do a slice on packed_weight dim 0, and on dim 1 of scale and zero_point,
+    also adjust the start and end indexes based on the ratio between original shape and the shape
+    of packed_weight and scale/zero_point
+
+    when dim == 1: we do a slice on packed_weight dim 1 and dim 0 of scale and zero_point and do the
+    same adjustment based on ratio
+
+    Note that we need to call slice on the packed_weight, scale and zero_point directly because slice
+    is an operation that need to preserve aliasing, see `test_slice_and_copy_` in `test_fbgemm_int4`
+    for
+    """
+    self, dim, start, end, step = fill_defaults(args, 5, [0, None, None, 1])
+    assert step == 1
+    assert dim == 0 or dim == 1, f"Only dim==0 or 1 are supported, got: {dim}"
+    if end >= self.shape[dim]:
+        end = self.shape[dim]
+
+    assert self.packed_weight.ndim == 2, (
+        f"Expected packed weight to have dim 2, got {self.packed_weight.dim}"
+    )
+    N, K_by_2 = self.packed_weight.shape
+    sz_dim0, sz_dim1 = self.scale.shape
+
+    data_len = self.shape[dim]
+
+    if dim == 0:
+        pw_len = N
+        sz_len = sz_dim1
+    else:
+        pw_len = K_by_2
+        sz_len = sz_dim0
+
+    sz_dim = 1 - dim
+    if pw_len == 0 or sz_len == 0:
+        return return_and_correct_aliasing(
+            func,
+            args,
+            kwargs,
+            self.__class__(
+                self.packed_weight,
+                self.scale,
+                self.zero_point,
+                group_size=self.group_size,
+                shape=self.shape,
+            ),
+        )
+
+    pw_ratio = data_len / pw_len
+    start_pw = int(start / pw_ratio)
+    end_pw = int(end / pw_ratio)
+
+    sz_ratio = data_len / sz_len
+    start_sz = int(start / sz_ratio)
+    end_sz = int(end / sz_ratio)
+
+    packed_weight = aten.slice.Tensor(self.packed_weight, dim, start_pw, end_pw, step)
+    scale = aten.slice.Tensor(self.scale, sz_dim, start_sz, end_sz, step)
+    zero_point = aten.slice.Tensor(self.zero_point, sz_dim, start_sz, end_sz, step)
+    packed_shape0, packed_shape1 = packed_weight.shape
+    new_shape = (packed_shape0, packed_shape1 * 2)
+    new = self.__class__(
+        packed_weight, scale, zero_point, group_size=self.group_size, shape=new_shape
+    )
+    return return_and_correct_aliasing(func, args, kwargs, new)
+
+
 to_fbgemm_int4 = FbgemmInt4Tensor.from_float
 
 
From 12398428a0573374c3971d9cb66d47185a11feff Mon Sep 17 00:00:00 2001
From: Mark Saroufim <marksaroufim@meta.com>
Date: Sat, 7 Jun 2025 16:16:17 -0700
Subject: [PATCH 094/165] Fix Windows Build (#2333)

---
 setup.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/setup.py b/setup.py
index 5288ec15bd..22b001b424 100644
--- a/setup.py
+++ b/setup.py
@@ -688,7 +688,7 @@ def bool_to_on_off(value):
     ext_modules=get_extensions(),
     extras_require={"dev": read_requirements("dev-requirements.txt")},
     description="Package for applying ao techniques to GPU models",
-    long_description=open("README.md").read(),
+    long_description=open("README.md", encoding="utf-8").read(),
     long_description_content_type="text/markdown",
     url="https://github.com/pytorch/ao",
     cmdclass={"build_ext": TorchAOBuildExt},

From 9452640006b3cbd2056de9b71f809e7b8b4402a8 Mon Sep 17 00:00:00 2001
From: Scott Roy <161522778+metascroy@users.noreply.github.com>
Date: Mon, 9 Jun 2025 10:13:01 -0700
Subject: [PATCH 095/165] Migrate xnnpack/vulkan/boltnn pt2e from torch.ao to
 torchao (#11363)

Differential Revision: D75492104

Pull Request resolved: https://github.com/pytorch/ao/pull/2302
---
 torchao/quantization/pt2e/__init__.py | 4 ++++
 torchao/testing/pt2e/utils.py         | 1 +
 2 files changed, 5 insertions(+)

diff --git a/torchao/quantization/pt2e/__init__.py b/torchao/quantization/pt2e/__init__.py
index 3e4352dabd..b6b8a728a3 100644
--- a/torchao/quantization/pt2e/__init__.py
+++ b/torchao/quantization/pt2e/__init__.py
@@ -39,6 +39,8 @@
     FusedMovingAvgObsFakeQuantize,
     default_dynamic_fake_quant,
     default_fake_quant,
+    disable_fake_quant,
+    disable_observer,
     enable_fake_quant,
     enable_observer,
 )
@@ -114,6 +116,8 @@
     # utils
     "enable_fake_quant",
     "enable_observer",
+    "disable_fake_quant",
+    "disable_observer",
     # export_utils
     "move_exported_model_to_eval",
     "move_exported_model_to_train",
diff --git a/torchao/testing/pt2e/utils.py b/torchao/testing/pt2e/utils.py
index 41be460a40..ad49fec014 100644
--- a/torchao/testing/pt2e/utils.py
+++ b/torchao/testing/pt2e/utils.py
@@ -78,6 +78,7 @@ def _test_quantizer(
             m,
             example_inputs,
             dynamic_shapes=dynamic_shapes if export_with_dynamic_shape else None,
+            strict=True,
         ).module()
 
         if is_qat:

From 70f2b85ae4713baefd1278e83e9c9536d57f9709 Mon Sep 17 00:00:00 2001
From: Peter Yeh <petrex@users.noreply.github.com>
Date: Mon, 9 Jun 2025 10:31:44 -0700
Subject: [PATCH 096/165] Enhance test_autoquant_compile to support ROCm
 (#2100)

* Enhance test_autoquant_compile to support ROCm and improve device checks

- Added checks for ROCm availability alongside CUDA.
- Improved device capability checks for CUDA to ensure compatibility with bfloat16 and specific tensor shapes.
- Updated skip conditions for unsupported devices and older PyTorch versions.

* lint

* Refactor device checks in test_autoquant_compile for improved clarity

- Simplified the logic for checking supported devices by consolidating CUDA and ROCm checks.
- Enhanced readability of the device capability validation for CUDA.
- Updated skip conditions for unsupported devices to ensure accurate test execution.

* Fix formatting in device check condition for consistency in test_autoquant_compile

* Refactor device check formatting in test_autoquant_compile for improved readability

- Adjusted the formatting of the device check condition to enhance clarity.
- Consolidated the logic for checking supported devices while maintaining functionality.
---
 test/integration/test_integration.py | 28 ++++++++++++++++++++--------
 1 file changed, 20 insertions(+), 8 deletions(-)

diff --git a/test/integration/test_integration.py b/test/integration/test_integration.py
index 8388a8bcff..7c070bf754 100644
--- a/test/integration/test_integration.py
+++ b/test/integration/test_integration.py
@@ -1602,15 +1602,27 @@ def test_autoquant_one_input(self, device, dtype, m, k, n):
     @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_5, "autoquant requires 2.5+.")
     def test_autoquant_compile(self, device, dtype, m1, m2, k, n):
         undo_recommended_configs()
-        if device != "cuda" or not torch.cuda.is_available():
+
+        is_supported_device = device == "cuda" and (
+            torch.cuda.is_available() or torch.version.hip is not None
+        )
+
+        if not is_supported_device:
             self.skipTest(f"autoquant currently does not support {device}")
-        if torch.cuda.is_available() and torch.cuda.get_device_capability() < (8, 0):
-            if dtype == torch.bfloat16:
-                self.skipTest("bfloat16 requires sm80+")
-            if m1 == 1 or m2 == 1:
-                self.skipTest(f"Shape {(m1, m2, k, n)} requires sm80+")
-        # This test fails on v0.4.0 and torch 2.4, so skipping for now.
-        if m1 == 1 or m2 == 1 and not TORCH_VERSION_AT_LEAST_2_5:
+
+        # Check CUDA-specific requirements if running on CUDA
+        if (
+            is_supported_device and torch.version.hip is None
+        ):  # Only apply to CUDA, not ROCm
+            device_capability = torch.cuda.get_device_capability()
+            if device_capability < (8, 0):
+                if dtype == torch.bfloat16:
+                    self.skipTest("bfloat16 requires sm80+")
+                if m1 == 1 or m2 == 1:
+                    self.skipTest(f"Shape {(m1, m2, k, n)} requires sm80+")
+
+        # Skip certain shapes on older PyTorch versions
+        if (m1 == 1 or m2 == 1) and not TORCH_VERSION_AT_LEAST_2_5:
             self.skipTest(f"Shape {(m1, m2, k, n)} requires torch version > 2.4")
         model = (
             torch.nn.Sequential(

From 4c063180edbaa16ee658549f219e865559309e98 Mon Sep 17 00:00:00 2001
From: Apurva Jain <apurvajain.kota@gmail.com>
Date: Mon, 9 Jun 2025 11:08:55 -0700
Subject: [PATCH 097/165] Update Quantization docs to show newer AOConfigs
 (#2317)

---
 docs/source/api_ref_quantization.rst | 46 +++++++++++++++++++---------
 1 file changed, 32 insertions(+), 14 deletions(-)

diff --git a/docs/source/api_ref_quantization.rst b/docs/source/api_ref_quantization.rst
index a13cd54450..5293684ab9 100644
--- a/docs/source/api_ref_quantization.rst
+++ b/docs/source/api_ref_quantization.rst
@@ -14,27 +14,45 @@ Main Quantization APIs
     :nosignatures:
 
     quantize_
-    autoquant    
+    autoquant
 
-Quantization APIs for quantize_
+Inference APIs for quantize\_
 -------------------------------
 
 .. autosummary::
     :toctree: generated/
     :nosignatures:
 
-    int4_weight_only
-    int8_weight_only
-    int8_dynamic_activation_int4_weight
-    int8_dynamic_activation_int8_weight
-    uintx_weight_only
-    gemlite_uintx_weight_only
-    intx_quantization_aware_training
-    from_intx_quantization_aware_training
-    float8_weight_only
-    float8_dynamic_activation_float8_weight
-    float8_static_activation_float8_weight
-    fpx_weight_only
+    Int4WeightOnlyConfig
+    Float8DynamicActivationFloat8WeightConfig
+    Float8WeightOnlyConfig
+    Float8StaticActivationFloat8WeightConfig
+    Int8DynamicActivationInt4WeightConfig
+    GemliteUIntXWeightOnlyConfig
+    Int8WeightOnlyConfig
+    Int8DynamicActivationInt8WeightConfig
+    UIntXWeightOnlyConfig
+    FPXWeightOnlyConfig
+
+.. currentmodule:: torchao.quantization.qat
+
+QAT APIs
+----------------------
+
+.. autosummary::
+    :toctree: generated/
+    :nosignatures:
+
+    IntXQuantizationAwareTrainingConfig
+    FromIntXQuantizationAwareTrainingConfig
+    FakeQuantizeConfig
+    Int4WeightOnlyQATQuantizer
+    Int8DynActInt4WeightQATQuantizer
+    Int4WeightOnlyEmbeddingQATQuantizer
+    ComposableQATQuantizer
+    initialize_fake_quantizers
+
+.. currentmodule:: torchao.quantization
 
 Quantization Primitives
 -----------------------

From 83663b86f98e755c37c3fedeaf6ea8dfb1b8e0d5 Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Mon, 9 Jun 2025 14:04:13 -0700
Subject: [PATCH 098/165] Fix Per Tensor 3d rehsape (#2293)

stack-info: PR: https://github.com/pytorch/ao/pull/2293, branch: drisspg/stack/64
---
 test/dtypes/test_affine_quantized_float.py | 47 +++++++++++++++++++++-
 torchao/dtypes/floatx/float8_layout.py     | 39 ++++++++++--------
 torchao/float8/inference.py                |  6 +--
 3 files changed, 70 insertions(+), 22 deletions(-)

diff --git a/test/dtypes/test_affine_quantized_float.py b/test/dtypes/test_affine_quantized_float.py
index 1ffd62ecbf..879551fc0a 100644
--- a/test/dtypes/test_affine_quantized_float.py
+++ b/test/dtypes/test_affine_quantized_float.py
@@ -25,7 +25,7 @@
 from torch._inductor.test_case import TestCase as InductorTestCase
 from torch.testing._internal import common_utils
 
-from torchao.dtypes.floatx.float8_layout import Float8AQTTensorImpl
+from torchao.dtypes.floatx.float8_layout import Float8AQTTensorImpl, preprocess_scale
 from torchao.float8.float8_utils import compute_error
 from torchao.quantization import (
     Float8DynamicActivationFloat8WeightConfig,
@@ -630,6 +630,51 @@ def test_float8_tensor_slicing_functional_correctness(self, granularity):
         error = compute_error(ref_output, quant_output)
         self.assertGreater(error, 15, f"Quantization SQNR too low: {error}")
 
+    def test_preprocess_scale_3d_reshape(self):
+        """Test that preprocess_scale correctly handles 3D scale tensors"""
+        device = "cpu"  # Use CPU for basic functionality test
+
+        # Test 1: PerTensor scale (scalar) - should reshape to (1, 1)
+        per_tensor_scale = torch.tensor(0.5, device=device)
+        result = preprocess_scale(per_tensor_scale, (2, 4, 8))
+        expected_shape = (1, 1)
+        self.assertEqual(result.shape, expected_shape)
+        self.assertEqual(result.item(), 0.5)
+
+        # Test 2: 1D scale tensor with one element - should reshape to (1, 1)
+        one_element_scale = torch.tensor([0.3], device=device)
+        result = preprocess_scale(one_element_scale, (2, 4, 8))
+        expected_shape = (1, 1)
+        self.assertEqual(result.shape, expected_shape)
+        self.assertEqual(result.item(), 0.3)
+
+        # Test 3: 3D scale tensor for per-row quantization - should flatten first N-1 dims
+        # This is the key test for the 3D reshape fix
+        scale_3d = torch.randn(
+            2, 4, device=device
+        )  # Shape matches first 2 dims of (2, 4, 8)
+        result = preprocess_scale(scale_3d, (2, 4, 8))
+        expected_shape = (8, 1)  # Flattened (2*4, 1)
+        self.assertEqual(result.shape, expected_shape)
+
+        # Verify the values are preserved correctly
+        expected_values = scale_3d.flatten().unsqueeze(-1)
+        self.assertTrue(torch.allclose(result, expected_values))
+
+        # Test 4: 2D scale tensor (already correct shape) - should just add last dimension
+        scale_2d = torch.randn(8, device=device)
+        result = preprocess_scale(scale_2d, (8, 16))
+        expected_shape = (8, 1)
+        self.assertEqual(result.shape, expected_shape)
+
+        # Test 5: Edge case with higher dimensions (4D)
+        scale_4d = torch.randn(
+            2, 2, 2, device=device
+        )  # Shape matches first 3 dims of (2, 2, 2, 8)
+        result = preprocess_scale(scale_4d, (2, 2, 2, 8))
+        expected_shape = (8, 1)  # Flattened (2*2*2, 1)
+        self.assertEqual(result.shape, expected_shape)
+
 
 common_utils.instantiate_parametrized_tests(TestAffineQuantizedFloat8Compile)
 
diff --git a/torchao/dtypes/floatx/float8_layout.py b/torchao/dtypes/floatx/float8_layout.py
index 799832a5ea..543bd5002b 100644
--- a/torchao/dtypes/floatx/float8_layout.py
+++ b/torchao/dtypes/floatx/float8_layout.py
@@ -370,10 +370,18 @@ def check_aqt(aqt: Union[torch.Tensor, AffineQuantizedTensor]) -> bool:
     return check_aqt(input_tensor) and check_aqt(weight_tensor)
 
 
-def preprocess_scale(input_scale: torch.Tensor, input_shape: Tuple[int]):
-    """Ensures input tensor is correctly formated for _scaled_mm"""
+def preprocess_scale(input_scale: torch.Tensor, input_shape: Tuple[int, ...]):
+    """Ensures input tensor is correctly formatted for _scaled_mm"""
+
+    # For PerTensor quantization, scale should be a scalar or have shape [1]
+    if input_scale.numel() == 1:
+        # Already a scalar, ensure it has the right shape for _scaled_mm
+        return input_scale.reshape(1, 1)
+
+    # For per-row/block quantization, we need to handle the reshaping
     input_scale = input_scale.unsqueeze(-1)
 
+    # Match: #input_data.reshape(-1, input_data.shape[-1])
     if input_scale.dim() > 2:
         input_scale = input_scale.reshape(-1, input_scale.shape[-1])
 
@@ -388,31 +396,28 @@ def _linear_fp8_act_fp8_weight_impl(
     """Implements matmul between FP8 input and FP8 weight with compute using _scaled_mm"""
     scaled_mm_config = weight_tensor._layout.mm_config
     assert scaled_mm_config is not None
-    out_shape = get_out_shape(input_tensor.shape, weight_tensor.shape)
+    assert not weight_tensor.tensor_impl.transposed, "Weight tensor must be contiguous"
 
-    # Weight tensor preprocessing
-    w_tensor_impl = weight_tensor.tensor_impl
-    assert not w_tensor_impl.transposed, "Weight tensor must be contiguous"
-    w_data = w_tensor_impl.float8_data
-    w_scale = w_tensor_impl.scale
+    out_shape = get_out_shape(input_tensor.shape, weight_tensor.shape)
 
-    # Input tensor preprocessing
-    inpt_data = input_tensor.tensor_impl.float8_data
+    # Extract tensor data and scales
+    inpt_data = input_tensor.tensor_impl.float8_data.reshape(
+        -1, input_tensor.tensor_impl.float8_data.shape[-1]
+    )
+    w_data = weight_tensor.tensor_impl.float8_data
     input_scale = input_tensor.tensor_impl.scale
-    # Handle case where input tensor is more than 2D
-    inpt_data = inpt_data.reshape(-1, inpt_data.shape[-1])
-    # Handle rowwise case
+    w_scale = weight_tensor.tensor_impl.scale
+
+    # Handle rowwise scaling
     if _is_rowwise_scaled(weight_tensor):
         assert _is_rowwise_scaled(input_tensor), (
             "Input tensor must be rowwise block size"
         )
-        w_scale = w_scale.T
-        input_scale = preprocess_scale(input_scale, input_tensor.shape)
+        w_scale = w_scale.transpose(-1, -2)
 
-    # Preprocess data
+    input_scale = preprocess_scale(input_scale, input_tensor.shape)
     inpt_data, w_data = preprocess_data(inpt_data, w_data.T, scaled_mm_config)
 
-    # Perform the computation
     return addmm_float8_unwrapped_inference(
         inpt_data,
         input_scale,
diff --git a/torchao/float8/inference.py b/torchao/float8/inference.py
index 42ea5e9dfa..144f1fa6f2 100644
--- a/torchao/float8/inference.py
+++ b/torchao/float8/inference.py
@@ -94,9 +94,8 @@ def addmm_float8_unwrapped_inference(
             out_dtype=output_dtype,
             use_fast_accum=use_fast_accum,
         )
-        output += bias
-        return output
-    output = torch._scaled_mm(
+        return output + bias
+    return torch._scaled_mm(
         a_data,
         b_data,
         scale_a=a_scale,
@@ -106,7 +105,6 @@ def addmm_float8_unwrapped_inference(
         out_dtype=output_dtype,
         use_fast_accum=use_fast_accum,
     )
-    return output
 
 
 def _is_rowwise_scaled(x) -> bool:

From 769ffa527bd78bd590227a11bebc182c1cd0eb26 Mon Sep 17 00:00:00 2001
From: odiemm-meta <xued@meta.com>
Date: Mon, 9 Jun 2025 20:01:50 -0700
Subject: [PATCH 099/165] add cast config for fp8 enablement

Differential Revision: D75945415

Pull Request resolved: https://github.com/pytorch/ao/pull/2328
---
 torchao/float8/__init__.py | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/torchao/float8/__init__.py b/torchao/float8/__init__.py
index ed21c93d20..2799f3197f 100644
--- a/torchao/float8/__init__.py
+++ b/torchao/float8/__init__.py
@@ -3,11 +3,10 @@
     CastConfig,
     Float8GemmConfig,
     Float8LinearConfig,
+    ScalingGranularity,
     ScalingType,
 )
-from torchao.float8.float8_linear_utils import (
-    convert_to_float8_training,
-)
+from torchao.float8.float8_linear_utils import convert_to_float8_training
 from torchao.float8.float8_tensor import (
     Float8Tensor,
     GemmInputRole,
@@ -39,6 +38,7 @@
     "Float8GemmConfig",
     "Float8LinearConfig",
     "CastConfig",
+    "ScalingGranularity",
     # top level UX
     "convert_to_float8_training",
     "precompute_float8_dynamic_scale_for_fsdp",

From 16e2d0ae32c2ed231872616aee941d21dbda0df8 Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Tue, 10 Jun 2025 07:54:03 -0400
Subject: [PATCH 100/165] Add support for bmm and `to` for fbgemm Tensor
 (#2337)

Add support for bmm for fbgemm config

Summary:
att, this PR adds support for running quantized bmm, the quantized bmm kernel for int4 and fp8 (with dynamic activation quantization) requires transpose of weights
in order to run, so added transpose_input to the convert function to transpose the weights first

Test Plan:
python test/dtypes/test_fbgemm_fp8.py -k test_bmm
python test/dtypes/test_fbgemm_int4.py -k test_bmm

Reviewers:

Subscribers:

Tasks:

Tags:
---
 test/dtypes/test_fbgemm_fp8.py       | 40 ++++++++++++++++++++++
 test/dtypes/test_fbgemm_int4.py      | 41 +++++++++++++++++++++++
 torchao/dtypes/__init__.py           |  6 ++--
 torchao/dtypes/fbgemm_fp8_tensor.py  | 50 +++++++++++++++++++++++++---
 torchao/dtypes/fbgemm_int4_tensor.py | 43 +++++++++++++++++++++---
 torchao/quantization/quant_api.py    |  5 +++
 6 files changed, 173 insertions(+), 12 deletions(-)

diff --git a/test/dtypes/test_fbgemm_fp8.py b/test/dtypes/test_fbgemm_fp8.py
index 56cf5ea081..1e681d00f9 100644
--- a/test/dtypes/test_fbgemm_fp8.py
+++ b/test/dtypes/test_fbgemm_fp8.py
@@ -34,6 +34,13 @@ def setUp(self):
             weight_dtype=e4m3_dtype,
             output_dtype=torch.bfloat16,
         )
+        self.bmm_config = FbgemmConfig(
+            input_dtype=e4m3_dtype,
+            weight_dtype=e4m3_dtype,
+            output_dtype=torch.bfloat16,
+            transpose_input=True,
+        )
+        self.GPU_DEVICES = ["cuda"] if torch.cuda.is_available() else []
 
     def test_linear(self):
         dtype = torch.bfloat16
@@ -106,6 +113,39 @@ def test_slice_and_copy_(self):
         # making sure param.data is updated
         assert param.data.float8_data[0][0] != orig_value
 
+    def test_bmm(self):
+        class M(torch.nn.Module):
+            def __init__(self, weight):
+                super().__init__()
+                self.weight = weight
+
+            def forward(self, x):
+                return torch.bmm(x, self.weight)
+
+        dtype = torch.bfloat16
+        device = "cuda"
+        input = torch.randn(10, 32, 128, dtype=dtype, device=device)
+        weight = torch.randn(10, 128, 256, dtype=dtype, device=device)
+        m = M(weight).eval()
+        original = m(input)
+        quantize_(m, self.bmm_config, filter_fn=lambda x, fqn: True)
+        quantized = m(input)
+        self.assertTrue(compute_error(original, quantized) > 20)
+
+    def test_to_device(self):
+        for device in self.GPU_DEVICES:
+            linear = torch.nn.Linear(128, 256, dtype=torch.bfloat16)
+            quantize_(linear, self.config)
+            linear.to(device)
+
+            linear = torch.nn.Linear(128, 256, dtype=torch.bfloat16)
+            quantize_(linear, self.config)
+            linear.to(device=device)
+
+            linear = torch.nn.Linear(128, 256, dtype=torch.bfloat16)
+            quantize_(linear, self.config)
+            linear.to(device)
+
 
 if __name__ == "__main__":
     run_tests()
diff --git a/test/dtypes/test_fbgemm_int4.py b/test/dtypes/test_fbgemm_int4.py
index 25b71f0244..cba9d81ae0 100644
--- a/test/dtypes/test_fbgemm_int4.py
+++ b/test/dtypes/test_fbgemm_int4.py
@@ -34,6 +34,14 @@ def setUp(self):
             output_dtype=torch.bfloat16,
             block_size=[1, 128],
         )
+        self.bmm_config = FbgemmConfig(
+            input_dtype=torch.bfloat16,
+            weight_dtype=torch.int4,
+            output_dtype=torch.bfloat16,
+            block_size=[1, 1, 128],
+            transpose_input=True,
+        )
+        self.GPU_DEVICES = ["cuda"] if torch.cuda.is_available() else []
 
     def test_linear(self):
         dtype = torch.bfloat16
@@ -111,6 +119,39 @@ def test_slice_and_copy_(self):
         # making sure param.data is updated
         assert param.data.packed_weight[0][0] != orig_value
 
+    def test_bmm(self):
+        class M(torch.nn.Module):
+            def __init__(self, weight):
+                super().__init__()
+                self.weight = weight
+
+            def forward(self, x):
+                return torch.bmm(x, self.weight)
+
+        dtype = torch.bfloat16
+        device = "cuda"
+        input = torch.randn(10, 32, 128, dtype=dtype, device=device)
+        weight = torch.randn(10, 128, 256, dtype=dtype, device=device)
+        m = M(weight).eval()
+        original = m(input)
+        quantize_(m, self.bmm_config, filter_fn=lambda x, fqn: True)
+        quantized = m(input)
+        self.assertTrue(compute_error(original, quantized) > 18)
+
+    def test_to_device(self):
+        for device in self.GPU_DEVICES:
+            linear = torch.nn.Linear(128, 256, dtype=torch.bfloat16)
+            quantize_(linear, self.config)
+            linear.to(device)
+
+            linear = torch.nn.Linear(128, 256, dtype=torch.bfloat16)
+            quantize_(linear, self.config)
+            linear.to(device=device)
+
+            linear = torch.nn.Linear(128, 256, dtype=torch.bfloat16)
+            quantize_(linear, self.config)
+            linear.to(device)
+
 
 if __name__ == "__main__":
     run_tests()
diff --git a/torchao/dtypes/__init__.py b/torchao/dtypes/__init__.py
index 692d56ad31..581c3e4ecb 100644
--- a/torchao/dtypes/__init__.py
+++ b/torchao/dtypes/__init__.py
@@ -8,8 +8,8 @@
     to_affine_quantized_intx,
     to_affine_quantized_intx_static,
 )
-from .fbgemm_fp8_tensor import to_fbgemm_fp8
-from .fbgemm_int4_tensor import to_fbgemm_int4
+from .fbgemm_fp8_tensor import FbgemmFp8Tensor, to_fbgemm_fp8
+from .fbgemm_int4_tensor import FbgemmInt4Tensor, to_fbgemm_int4
 from .floatx import (
     CutlassSemiSparseLayout,
     Float8Layout,
@@ -64,5 +64,7 @@
     "to_affine_quantized_packed_linear_int8_dynamic_activation_intx_weight",
     "Int4XPULayout",
     "to_fbgemm_int4",
+    "FbgemmInt4Tensor",
     "to_fbgemm_fp8",
+    "FbgemmFp8Tensor",
 ]
diff --git a/torchao/dtypes/fbgemm_fp8_tensor.py b/torchao/dtypes/fbgemm_fp8_tensor.py
index df7ce69de7..b6c1d72acc 100644
--- a/torchao/dtypes/fbgemm_fp8_tensor.py
+++ b/torchao/dtypes/fbgemm_fp8_tensor.py
@@ -18,6 +18,7 @@
 
 __all__ = [
     "to_fbgemm_fp8",
+    "FbgemmFp8Tensor",
 ]
 
 aten = torch.ops.aten
@@ -74,11 +75,22 @@ def __repr__(self):
     def _quantization_type(self):
         return f"shape={self.shape}, activation_scale_ub={self.activation_scale_ub}, device={self.device}"
 
+    def to(self, *args, **kwargs):
+        kwargs = self._get_to_kwargs(*args, **kwargs)
+        device = kwargs.pop("device")
+        return self.__class__(
+            self.float8_data.to(device),
+            self.scale.to(device),
+            self.activation_scale_ub.to(device),
+            self.dtype,
+        )
+
     @classmethod
     def from_float(
         cls,
         w: torch.Tensor,
         activation_scale_ub: Optional[float] = None,
+        transpose_input: bool = False,
     ):
         if activation_scale_ub is None:
             activation_scale_ub = 1200.0
@@ -88,6 +100,12 @@ def from_float(
             dtype=torch.float,
             device=w.device,
         )
+        if transpose_input:
+            if w.ndim == 3:
+                w = w.transpose(-1, -2)
+            else:
+                w = w.t()
+
         wq, w_scale = torch.ops.triton.quantize_fp8_row(w)
         # wq, w_scale = torch.ops.fbgemm.quantize_fp8_per_row(w)
         dtype = w.dtype
@@ -110,11 +128,6 @@ def _(func, types, args, kwargs):
         args[1],
         args[2] if len(args) > 2 else None,
     )
-    if not input_tensor.is_floating_point():
-        raise NotImplementedError(
-            f"{func} is not implemented for non floating point input"
-        )
-
     orig_act_size = input_tensor.size()
     orig_out_features = weight_tensor.shape[-2]
 
@@ -141,6 +154,33 @@ def _(func, types, args, kwargs):
     return res
 
 
+@implements(torch.bmm)
+def _(func, types, args, kwargs):
+    input_tensor, weight_tensor = (
+        args[0],
+        args[1],
+    )
+    orig_act_size = input_tensor.size()
+    # not used
+    num_tokens = torch.empty([input_tensor.size(0)], device=input_tensor.device)
+    xq, x_scale = torch.ops.fbgemm.quantize_fp8_per_row(
+        input_tensor, num_tokens, weight_tensor.activation_scale_ub
+    )
+
+    a_data = xq
+    b_data = weight_tensor.float8_data
+    orig_out_features = b_data.shape[-2]
+
+    res = torch.ops.fbgemm.f8f8bf16_rowwise_batched(
+        a_data,
+        b_data,
+        x_scale,
+        weight_tensor.scale,
+    )
+    res = res.reshape(*orig_act_size[:-1], orig_out_features)
+    return res
+
+
 @implements([aten.detach.default, aten.alias.default])
 def _(func, types, args, kwargs):
     return return_and_correct_aliasing(
diff --git a/torchao/dtypes/fbgemm_int4_tensor.py b/torchao/dtypes/fbgemm_int4_tensor.py
index ab108fea06..c398442168 100644
--- a/torchao/dtypes/fbgemm_int4_tensor.py
+++ b/torchao/dtypes/fbgemm_int4_tensor.py
@@ -19,6 +19,7 @@
 
 __all__ = [
     "to_fbgemm_int4",
+    "FbgemmInt4Tensor",
 ]
 
 aten = torch.ops.aten
@@ -77,11 +78,23 @@ def __repr__(self):
     def _quantization_type(self):
         return f"shape={self.shape}, group_size={self.group_size}, device={self.device}"
 
+    def to(self, *args, **kwargs):
+        kwargs = self._get_to_kwargs(*args, **kwargs)
+        device = kwargs.pop("device")
+        return self.__class__(
+            self.packed_weight.to(device),
+            self.scale.to(device),
+            self.zero_point.to(device),
+            self.group_size,
+            self.shape,
+        )
+
     @classmethod
     def from_float(
         cls,
         w: torch.Tensor,
         block_size: List[int],
+        transpose_input: bool = False,
     ):
         assert len(block_size) == w.ndim, (
             f"Expecting the length of block_size to be equal to the dimension of the weight, got {block_size=} and {w.ndim=}"
@@ -89,6 +102,12 @@ def from_float(
         if int4_row_quantize_zp is None:
             raise ImportError("Requires fbgemm-gpu-genai >= 1.2.0")
 
+        if transpose_input:
+            if w.ndim == 3:
+                w = w.transpose(-1, -2)
+            else:
+                w = w.t()
+
         group_size = block_size[-1]
         original_shape = w.shape
 
@@ -126,11 +145,6 @@ def _(func, types, args, kwargs):
         args[1],
         args[2] if len(args) > 2 else None,
     )
-    if not input_tensor.is_floating_point():
-        raise NotImplementedError(
-            f"{func} is not implemented for non floating point input"
-        )
-
     orig_act_size = input_tensor.size()
     orig_out_features = weight_tensor.shape[-2]
 
@@ -146,6 +160,25 @@ def _(func, types, args, kwargs):
     return res
 
 
+@implements(torch.bmm)
+def _(func, types, args, kwargs):
+    input_tensor, weight_tensor = (
+        args[0],
+        args[1],
+    )
+    orig_act_size = input_tensor.size()
+    orig_out_features = weight_tensor.shape[-2]
+
+    res = torch.ops.fbgemm.bf16i4bf16_rowwise_batched(
+        input_tensor,
+        weight_tensor.packed_weight.contiguous(),
+        weight_tensor.scale,
+        weight_tensor.zero_point,
+    )
+    res = res.reshape(*orig_act_size[:-1], orig_out_features)
+    return res
+
+
 @implements([aten.detach.default, aten.alias.default])
 def _(func, types, args, kwargs):
     return return_and_correct_aliasing(
diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index be25b144a6..d8af23414b 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -1991,6 +1991,7 @@ class FbgemmConfig(AOBaseConfig):
     output_dtype: torch.dtype
     block_size: Optional[List[int]] = None
     activation_scale_ub: Optional[float] = None
+    transpose_input: bool = False
 
 
 @register_quantize_module_handler(FbgemmConfig)
@@ -2018,9 +2019,11 @@ def _(module: torch.nn.Module, config: FbgemmConfig) -> torch.nn.Module:
         weight = to_fbgemm_int4(
             module.weight,
             config.block_size,
+            config.transpose_input,
         )
         module.weight = torch.nn.Parameter(weight, requires_grad=False)
         module.extra_repr = types.MethodType(_linear_extra_repr, module)
+        return module
     elif (
         (config.input_dtype == e4m3_dtype)
         and (config.weight_dtype == e4m3_dtype)
@@ -2029,9 +2032,11 @@ def _(module: torch.nn.Module, config: FbgemmConfig) -> torch.nn.Module:
         weight = to_fbgemm_fp8(
             module.weight,
             config.activation_scale_ub,
+            config.transpose_input,
         )
         module.weight = torch.nn.Parameter(weight, requires_grad=False)
         module.extra_repr = types.MethodType(_linear_extra_repr, module)
+        return module
     else:
         raise NotImplementedError(
             f"{config} is not supported. supported input, weight, output kernel dtypes are: {_SUPPORTED_DTYPES}"

From a581609b8bca63a517e50d96e769c6bde927f077 Mon Sep 17 00:00:00 2001
From: Apurva Jain <apurvajain.kota@gmail.com>
Date: Tue, 10 Jun 2025 10:49:51 -0700
Subject: [PATCH 101/165] [BE] Rename qparams for tinygemm (#2344)

---
 torchao/dtypes/affine_quantized_tensor.py     | 10 +++++-----
 torchao/dtypes/affine_quantized_tensor_ops.py |  4 ++--
 torchao/dtypes/uintx/int4_cpu_layout.py       |  4 ++--
 torchao/dtypes/uintx/int4_xpu_layout.py       | 10 ++++++++--
 .../dtypes/uintx/tensor_core_tiled_layout.py  |  4 ++--
 .../prototype/parq/quant/uniform_torchao.py   |  8 ++++----
 torchao/quantization/quant_primitives.py      | 20 +++++++++----------
 torchao/quantization/utils.py                 |  8 ++++----
 8 files changed, 37 insertions(+), 31 deletions(-)

diff --git a/torchao/dtypes/affine_quantized_tensor.py b/torchao/dtypes/affine_quantized_tensor.py
index 6cb2e8997e..132ac0f28e 100644
--- a/torchao/dtypes/affine_quantized_tensor.py
+++ b/torchao/dtypes/affine_quantized_tensor.py
@@ -26,14 +26,14 @@
     choose_qparams_and_quantize_affine_hqq,
     dequantize_affine,
     dequantize_affine_float8,
-    dequantize_affine_float_zero_point,
     dequantize_affine_floatx,
     dequantize_affine_no_zero_point,
+    dequantize_affine_tinygemm,
     quantize_affine,
     quantize_affine_float8,
-    quantize_affine_float_zero_point,
     quantize_affine_floatx,
     quantize_affine_no_zero_point,
+    quantize_affine_tinygemm,
 )
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
@@ -155,7 +155,7 @@ def dequantize(self, output_dtype: Optional[torch.dtype] = None) -> torch.Tensor
         else:
             data, scale, zero_point = self.tensor_impl.get_plain()
             if self.zero_point_domain == ZeroPointDomain.FLOAT:
-                dq = dequantize_affine_float_zero_point(
+                dq = dequantize_affine_tinygemm(
                     data,
                     self.block_size,
                     scale,
@@ -339,7 +339,7 @@ def from_hp_to_intx(
                     quant_max,
                 )
             elif zero_point_domain == ZeroPointDomain.FLOAT:
-                data = quantize_affine_float_zero_point(
+                data = quantize_affine_tinygemm(
                     input_float,
                     block_size,
                     scale,
@@ -410,7 +410,7 @@ def from_hp_to_intx_static(
                 quant_max,
             )
         elif zero_point_domain == ZeroPointDomain.FLOAT:
-            int_data = quantize_affine_float_zero_point(
+            int_data = quantize_affine_tinygemm(
                 input_float,
                 block_size,
                 scale,
diff --git a/torchao/dtypes/affine_quantized_tensor_ops.py b/torchao/dtypes/affine_quantized_tensor_ops.py
index 63650ce687..a76b4daa23 100644
--- a/torchao/dtypes/affine_quantized_tensor_ops.py
+++ b/torchao/dtypes/affine_quantized_tensor_ops.py
@@ -93,8 +93,8 @@
 from torchao.quantization.quant_primitives import (
     ZeroPointDomain,
     dequantize_affine,
-    dequantize_affine_float_zero_point,
     dequantize_affine_no_zero_point,
+    dequantize_affine_tinygemm,
 )
 from torchao.utils import (
     fill_defaults,
@@ -318,7 +318,7 @@ def _(func, types, args, kwargs):
     # we need to increase block size to correct dim
     new_blocks = idx.dim() - 1
     if args[1].zero_point_domain == ZeroPointDomain.FLOAT:
-        _dequantize_affine = dequantize_affine_float_zero_point
+        _dequantize_affine = dequantize_affine_tinygemm
     elif args[1].zero_point_domain == ZeroPointDomain.NONE:
         _dequantize_affine = dequantize_affine_no_zero_point
     else:
diff --git a/torchao/dtypes/uintx/int4_cpu_layout.py b/torchao/dtypes/uintx/int4_cpu_layout.py
index 56812ee4e1..6c89f98ff7 100644
--- a/torchao/dtypes/uintx/int4_cpu_layout.py
+++ b/torchao/dtypes/uintx/int4_cpu_layout.py
@@ -19,7 +19,7 @@
 from torchao.dtypes.utils import AQTTensorImpl, Layout, is_device
 from torchao.quantization.quant_primitives import (
     ZeroPointDomain,
-    quantize_affine_float_zero_point,
+    quantize_affine_tinygemm,
 )
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
@@ -266,7 +266,7 @@ def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
         # TODO: move this to `unpack_tinygemm_scales_and_zeros`?
         scale = scale.reshape(scale.shape[:-1]).contiguous()
         zero = zero.reshape(zero.shape[:-1]).contiguous()
-        int_data = quantize_affine_float_zero_point(
+        int_data = quantize_affine_tinygemm(
             dequantized,
             block_size,
             scale,
diff --git a/torchao/dtypes/uintx/int4_xpu_layout.py b/torchao/dtypes/uintx/int4_xpu_layout.py
index 722a37bc32..c67eebd747 100644
--- a/torchao/dtypes/uintx/int4_xpu_layout.py
+++ b/torchao/dtypes/uintx/int4_xpu_layout.py
@@ -1,3 +1,9 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
 from dataclasses import dataclass
 from typing import Optional, Tuple
 
@@ -372,7 +378,7 @@ def __torch_dispatch__(cls, func, types, args, kwargs):
     def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
         from torchao.quantization.quant_primitives import (
             quantize_affine,
-            quantize_affine_float_zero_point,
+            quantize_affine_tinygemm,
         )
         from torchao.quantization.utils import unpack_tinygemm_scales_and_zeros
 
@@ -423,7 +429,7 @@ def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
             # TODO: move this to `unpack_tinygemm_scales_and_zeros`?
             scale = scale.reshape(scale.shape[:-1]).contiguous()
             zero = zero.reshape(zero.shape[:-1]).contiguous()
-            int_data = quantize_affine_float_zero_point(
+            int_data = quantize_affine_tinygemm(
                 dequantized,
                 block_size,
                 scale,
diff --git a/torchao/dtypes/uintx/tensor_core_tiled_layout.py b/torchao/dtypes/uintx/tensor_core_tiled_layout.py
index 2baf45ded0..0856d22fee 100644
--- a/torchao/dtypes/uintx/tensor_core_tiled_layout.py
+++ b/torchao/dtypes/uintx/tensor_core_tiled_layout.py
@@ -21,7 +21,7 @@
 from torchao.quantization.quant_primitives import (
     ZeroPointDomain,
     _get_reduction_params,
-    quantize_affine_float_zero_point,
+    quantize_affine_tinygemm,
 )
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
@@ -511,7 +511,7 @@ def dequant_4d(self):
         target_dtype = torch.int32
         quant_min = 0
         quant_max = 15
-        int_data = quantize_affine_float_zero_point(
+        int_data = quantize_affine_tinygemm(
             dequantized,
             self.block_size,
             scale,
diff --git a/torchao/prototype/parq/quant/uniform_torchao.py b/torchao/prototype/parq/quant/uniform_torchao.py
index f742778ed0..a71ac8b5b3 100644
--- a/torchao/prototype/parq/quant/uniform_torchao.py
+++ b/torchao/prototype/parq/quant/uniform_torchao.py
@@ -18,11 +18,11 @@
     choose_qparams_affine_dont_preserve_zero,
     choose_qparams_affine_tinygemm,
     dequantize_affine,
-    dequantize_affine_float_zero_point,
     dequantize_affine_no_zero_point,
+    dequantize_affine_tinygemm,
     quantize_affine,
-    quantize_affine_float_zero_point,
     quantize_affine_no_zero_point,
+    quantize_affine_tinygemm,
 )
 
 from .quantizer import Quantizer
@@ -76,8 +76,8 @@ def quantize(
 
         if self.zero_point_domain == ZeroPointDomain.FLOAT and not self.preserve_zero:
             _choose_qparams_affine = choose_qparams_affine_tinygemm
-            _quantize_affine = quantize_affine_float_zero_point
-            _dequantize_affine = dequantize_affine_float_zero_point
+            _quantize_affine = quantize_affine_tinygemm
+            _dequantize_affine = dequantize_affine_tinygemm
         elif self.zero_point_domain == ZeroPointDomain.INT and not self.preserve_zero:
             _choose_qparams_affine = choose_qparams_affine_dont_preserve_zero
             _quantize_affine = quantize_affine
diff --git a/torchao/quantization/quant_primitives.py b/torchao/quantization/quant_primitives.py
index 9d453102cd..9e0c6447c8 100644
--- a/torchao/quantization/quant_primitives.py
+++ b/torchao/quantization/quant_primitives.py
@@ -30,10 +30,10 @@
     "choose_qparams_affine_floatx",
     "quantize_affine",
     "quantize_affine_no_zero_point",
-    "quantize_affine_float_zero_point",
+    "quantize_affine_tinygemm",
     "dequantize_affine",
     "dequantize_affine_no_zero_point",
-    "dequantize_affine_float_zero_point",
+    "dequantize_affine_tinygemm",
     "quantize_affine_floatx",
     "dequantize_affine_floatx",
     "fake_quantize_affine",
@@ -428,7 +428,7 @@ def _quantize_affine_no_dtype_cast(
     return quant
 
 
-def quantize_affine_float_zero_point(
+def quantize_affine_tinygemm(
     input: torch.Tensor,
     block_size: List[int],
     scale: torch.Tensor,
@@ -453,7 +453,7 @@ def quantize_affine_float_zero_point(
     # torch.uintx dtypes yet
     if output_dtype in _SUB_BYTE_UINT_BOUNDS:
         output_dtype = torch.uint8
-    return _quantize_affine_float_zero_point_no_dtype_cast(
+    return _quantize_affine_tinygemm_no_dtype_cast(
         input,
         block_size,
         scale,
@@ -463,7 +463,7 @@ def quantize_affine_float_zero_point(
     ).to(output_dtype)
 
 
-def _quantize_affine_float_zero_point_no_dtype_cast(
+def _quantize_affine_tinygemm_no_dtype_cast(
     input: torch.Tensor,
     block_size: Tuple[int, ...],
     scale: torch.Tensor,
@@ -803,7 +803,7 @@ def dequantize_affine_no_zero_point(
     )
 
 
-def _dequantize_affine_float_zero_point_no_dtype_check(
+def _dequantize_affine_tinygemm_no_dtype_check(
     input: torch.Tensor,
     block_size: List[int],
     scale: torch.Tensor,
@@ -848,7 +848,7 @@ def _dequantize_affine_float_zero_point_no_dtype_check(
     return dequant.view(original_shape).to(output_dtype)
 
 
-def dequantize_affine_float_zero_point(
+def dequantize_affine_tinygemm(
     input: torch.Tensor,
     block_size: Tuple[int, ...],
     scale: torch.Tensor,
@@ -887,7 +887,7 @@ def dequantize_affine_float_zero_point(
         torch.bfloat16,
     ], f"Unsupported output dtype: {output_dtype}"
     quant_min, quant_max = _get_and_check_qmin_qmax(input_dtype, quant_min, quant_max)
-    return _dequantize_affine_float_zero_point_no_dtype_check(
+    return _dequantize_affine_tinygemm_no_dtype_check(
         input,
         block_size,
         scale,
@@ -1013,8 +1013,8 @@ def _do_fake_quantize_affine(
         _quantize_affine = _quantize_affine_no_dtype_cast
         _dequantize_affine = _dequantize_affine_no_dtype_check
     elif zero_point_domain == ZeroPointDomain.FLOAT:
-        _quantize_affine = _quantize_affine_float_zero_point_no_dtype_cast
-        _dequantize_affine = _dequantize_affine_float_zero_point_no_dtype_check
+        _quantize_affine = _quantize_affine_tinygemm_no_dtype_cast
+        _dequantize_affine = _dequantize_affine_tinygemm_no_dtype_check
     elif ZeroPointDomain == ZeroPointDomain.NONE:
         _quantize_affine = _quantize_affine_no_zero_point_no_dtype_cast
         _dequantize_affine = _dequantize_affine_no_zero_point_no_dtype_check
diff --git a/torchao/quantization/utils.py b/torchao/quantization/utils.py
index 8f2554849c..3c968e2d40 100644
--- a/torchao/quantization/utils.py
+++ b/torchao/quantization/utils.py
@@ -19,11 +19,11 @@
     choose_qparams_affine_dont_preserve_zero,
     choose_qparams_affine_tinygemm,
     dequantize_affine,
-    dequantize_affine_float_zero_point,
     dequantize_affine_no_zero_point,
+    dequantize_affine_tinygemm,
     quantize_affine,
-    quantize_affine_float_zero_point,
     quantize_affine_no_zero_point,
+    quantize_affine_tinygemm,
 )
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
@@ -439,7 +439,7 @@ def groupwise_affine_quantize_tensor_from_qparams(
     if zero_point_domain == ZeroPointDomain.INT:
         _quantize_affine = quantize_affine
     elif zero_point_domain == ZeroPointDomain.FLOAT:
-        _quantize_affine = quantize_affine_float_zero_point
+        _quantize_affine = quantize_affine_tinygemm
     elif ZeroPointDomain == ZeroPointDomain.NONE:
         _quantize_affine = quantize_affine_no_zero_point
     else:
@@ -508,7 +508,7 @@ def groupwise_affine_dequantize_tensor_from_qparams(
     if zero_point_domain == ZeroPointDomain.INT:
         _dequantize_affine = dequantize_affine
     elif zero_point_domain == ZeroPointDomain.FLOAT:
-        _dequantize_affine = dequantize_affine_float_zero_point
+        _dequantize_affine = dequantize_affine_tinygemm
     else:
         _dequantize_affine = dequantize_affine_no_zero_point
     return _dequantize_affine(

From d2842e507b0c3e1c5cdaae42b9ba5fc6bf62ff49 Mon Sep 17 00:00:00 2001
From: salman <salman.mohammadi@outlook.com>
Date: Tue, 10 Jun 2025 12:02:49 -0700
Subject: [PATCH 102/165] Update QAT docs, highlight axolotl integration
 (#2266)

* updating docs

* updating docs

* updating docs

* updating qat readme
---
 README.md                          |  1 +
 torchao/quantization/qat/README.md | 28 +++++++++++++++++++++++++---
 2 files changed, 26 insertions(+), 3 deletions(-)

diff --git a/README.md b/README.md
index 8d524c5e7b..e744ea9815 100644
--- a/README.md
+++ b/README.md
@@ -213,6 +213,7 @@ We're also fortunate to be integrated into some of the leading open-source libra
 4. [TorchTune](https://pytorch.org/torchtune/main/tutorials/qlora_finetune.html?highlight=qlora) for our QLoRA and QAT recipes
 5. VLLM for LLM serving: [usage](https://docs.vllm.ai/en/latest/features/quantization/torchao.html)
 6. SGLang for LLM serving: [usage](https://docs.sglang.ai/backend/server_arguments.html#server-arguments) and the major [PR](https://github.com/sgl-project/sglang/pull/1341).
+7. Axolotl for [QAT](https://docs.axolotl.ai/docs/qat.html) and [PTQ](https://docs.axolotl.ai/docs/quantize.html)
 
 ## Videos
 * [Keynote talk at GPU MODE IRL](https://youtu.be/FH5wiwOyPX4?si=VZK22hHz25GRzBG1&t=1009)
diff --git a/torchao/quantization/qat/README.md b/torchao/quantization/qat/README.md
index 42ff4e2567..eee1047199 100644
--- a/torchao/quantization/qat/README.md
+++ b/torchao/quantization/qat/README.md
@@ -115,11 +115,20 @@ To fake quantize embedding in addition to linear, you can additionally call
 the following with a filter function during the prepare step:
 
 ```
-from torchao.quantization.quant_api import _is_linear
+# first apply linear transformation to the model as above
+activation_config = FakeQuantizeConfig(torch.int8, "per_token", is_symmetric=False)
+weight_config = FakeQuantizeConfig(torch.int4, group_size=32)
+quantize_(
+    model,
+    IntXQuantizationAwareTrainingConfig(activation_config, weight_config),
+)
+
+# then apply weight-only transformation to embedding layers
+# activation fake quantization is not supported for embedding layers
 quantize_(
     m,
-    IntXQuantizationAwareTrainingConfig(weight_config=weight_config),
-    filter_fn=lambda m, _: isinstance(m, torch.nn.Embedding) or _is_linear(m),
+    IntXQuantizationAwareTrainingConfig(weight_config=weight_config), 
+    filter_fn=lambda m, _: isinstance(m, torch.nn.Embedding) 
 )
 ```
 
@@ -193,6 +202,19 @@ tune run --nnodes 1 --nproc_per_node 4 qat_lora_finetune_distributed --config ll
 
 For more detail, please refer to [this QAT tutorial](https://pytorch.org/torchtune/main/tutorials/qat_finetune.html).
 
+## Axolotl integration
+
+[Axolotl](https://github.com/axolotl-ai-cloud) uses torchao to support quantized-aware fine-tuning. You can use the following commands to fine-tune, and then quantize a Llama-3.2-3B model:
+
+```bash
+axolotl train examples/llama-3/3b-qat-fsdp2.yaml
+# once training is complete, perform the quantization step
+axolotl quantize examples/llama-3/3b-qat-fsdp2.yaml
+# you should now have a quantized model saved in ./outputs/qat_out/quatized
+```
+
+Please see the [QAT documentation](https://docs.axolotl.ai/docs/qat.html) in axolotl for more details.
+
 ## Evaluation Results
 
 Evaluation was performed on 6-8 A100 GPUs (80GB each) using the torchtune QAT

From ab66083c8b84f9453e05fee4a3dc1cb8e87c0341 Mon Sep 17 00:00:00 2001
From: andrewor14 <andrewor14@gmail.com>
Date: Tue, 10 Jun 2025 16:15:13 -0400
Subject: [PATCH 103/165] Add static quant tutorial (#2047)

---
 docs/source/index.rst                      |   1 +
 docs/source/static_quantization.rst        | 262 +++++++++++++++++++++
 tutorials/calibration_flow/static_quant.py |  16 +-
 3 files changed, 271 insertions(+), 8 deletions(-)
 create mode 100644 docs/source/static_quantization.rst

diff --git a/docs/source/index.rst b/docs/source/index.rst
index 9df40131cf..8931770795 100644
--- a/docs/source/index.rst
+++ b/docs/source/index.rst
@@ -40,4 +40,5 @@ for an overall introduction to the library and recent highlight and updates.
    serialization
    subclass_basic
    subclass_advanced
+   static_quantization
    pretraining
diff --git a/docs/source/static_quantization.rst b/docs/source/static_quantization.rst
new file mode 100644
index 0000000000..d6a206e54c
--- /dev/null
+++ b/docs/source/static_quantization.rst
@@ -0,0 +1,262 @@
+Static Quantization
+--------------------
+
+Static quantization refers to using a fixed quantization range for all inputs during inference or generation. Unlike dynamic quantization, which dynamically computes new quantization ranges for each new input batch, static quantization typically results in more efficient computation, potentially at the cost of lower quantized accuracy since we cannot adapt to changes in the input distribution on-the-fly.
+
+In static quantization, this fixed quantization range is typically calibrated on similar inputs before quantizing the model. During the calibration phase, we first insert observers into the model to "observe" the distribution of the inputs to be quantized, and use this distribution to decide what scales and zero points to ultimately use when quantizing the model.
+
+In this tutorial, we walk through an example of how to achieve this in torchao. All code can be found in this `example script <https://github.com/pytorch/ao/tree/main/tutorials/calibration_flow/static_quant.py>`__. Let's start with our toy linear model:
+
+.. code:: py
+
+   import copy
+   import torch
+
+   class ToyLinearModel(torch.nn.Module):
+       def __init__(self, m=64, n=32, k=64):
+           super().__init__()
+           self.linear1 = torch.nn.Linear(m, k, bias=False)
+           self.linear2 = torch.nn.Linear(k, n, bias=False)
+   
+       def example_inputs(self, batch_size=1, dtype=torch.float32, device="cpu"):
+           return (
+               torch.randn(
+                   batch_size, self.linear1.in_features, dtype=dtype, device=device
+               ),
+           )
+   
+       def forward(self, x):
+           x = self.linear1(x)
+           x = self.linear2(x)
+           return x
+
+   dtype = torch.bfloat16
+   m = ToyLinearModel().eval().to(dtype).to("cuda")
+   m = torch.compile(m, mode="max-autotune")
+
+
+Calibration Phase
+~~~~~~~~~~~~~~~~~
+
+torchao comes with a a simple observer implementation, `AffineQuantizedMinMaxObserver`, that records the min and max values that have flowed through the observer during the calibration phase. Users are welcome to implement their own desired, more advanced observation techniques, such as those relying on moving averages or histograms, and these may be added to torchao in the future.
+
+.. code:: py
+
+   from torchao.quantization.granularity import PerAxis, PerTensor
+   from torchao.quantization.observer import AffineQuantizedMinMaxObserver
+   from torchao.quantization.quant_primitives import MappingType
+
+   # per tensor input activation asymmetric quantization
+   act_obs = AffineQuantizedMinMaxObserver(
+       MappingType.ASYMMETRIC,
+       torch.uint8,
+       granularity=PerTensor(),
+       eps=torch.finfo(torch.float32).eps,
+       scale_dtype=torch.float32,
+       zero_point_dtype=torch.float32,
+   )
+
+   # per channel weight asymmetric quantization
+   weight_obs = AffineQuantizedMinMaxObserver(
+       MappingType.ASYMMETRIC,
+       torch.uint8,
+       granularity=PerAxis(axis=0),
+       eps=torch.finfo(torch.float32).eps,
+       scale_dtype=torch.float32,
+       zero_point_dtype=torch.float32,
+   )
+
+Next, we define our observed linear that we will swap our `torch.nn.Linear` with. This is a high precision (e.g. fp32) linear module with the above observers inserted to record the input activation and weight values during calibration:
+
+.. code:: py
+
+   import torch.nn.functional as F
+
+   class ObservedLinear(torch.nn.Linear):
+       def __init__(
+           self,
+           in_features: int,
+           out_features: int,
+           act_obs: torch.nn.Module,
+           weight_obs: torch.nn.Module,
+           bias: bool = True,
+           device=None,
+           dtype=None,
+       ):
+           super().__init__(in_features, out_features, bias, device, dtype)
+           self.act_obs = act_obs
+           self.weight_obs = weight_obs
+   
+       def forward(self, input: torch.Tensor):
+           observed_input = self.act_obs(input)
+           observed_weight = self.weight_obs(self.weight)
+           return F.linear(observed_input, observed_weight, self.bias)
+   
+       @classmethod
+       def from_float(cls, float_linear, act_obs, weight_obs):
+           observed_linear = cls(
+               float_linear.in_features,
+               float_linear.out_features,
+               act_obs,
+               weight_obs,
+               False,
+               device=float_linear.weight.device,
+               dtype=float_linear.weight.dtype,
+           )
+           observed_linear.weight = float_linear.weight
+           observed_linear.bias = float_linear.bias
+           return observed_linear
+
+To actually insert these observers into our toy model:
+
+.. code:: py
+
+   from torchao.quantization.quant_api import (
+       _replace_with_custom_fn_if_matches_filter,
+   )
+
+   def insert_observers_(model, act_obs, weight_obs):
+       _is_linear = lambda m, fqn: isinstance(m, torch.nn.Linear)
+
+       def replacement_fn(m):
+           copied_act_obs = copy.deepcopy(act_obs)
+           copied_weight_obs = copy.deepcopy(weight_obs)
+           return ObservedLinear.from_float(m, copied_act_obs, copied_weight_obs)
+
+       _replace_with_custom_fn_if_matches_filter(model, replacement_fn, _is_linear)
+
+   insert_observers_(m, act_obs, weight_obs)
+
+Now we are ready to calibrate the model, which populates the observers we inserted with statistics recorded during the calibration. We can do this simply by feeding some example inputs to our "observed" model:
+
+.. code:: py
+
+   for _ in range(10):
+       example_inputs = m.example_inputs(dtype=dtype, device="cuda")
+       m(*example_inputs)
+
+
+Quantization Phase
+~~~~~~~~~~~~~~~~~~
+
+There are multiple ways to actually quantize the model. Here we walk through the simpler alternative, which is to define a `QuantizedLinear` class that we will swap our `ObservedLinear` to. Defining this new class isn't strictly necessary. For an alternative method that simply uses the existing `torch.nn.Linear`, please see the full `example script <https://github.com/pytorch/ao/tree/main/tutorials/calibration_flow/static_quant.py>`__.
+
+.. code:: py
+
+   from torchao.dtypes import to_affine_quantized_intx_static
+
+   class QuantizedLinear(torch.nn.Module):
+       def __init__(
+           self,
+           in_features: int,
+           out_features: int,
+           act_obs: torch.nn.Module,
+           weight_obs: torch.nn.Module,
+           weight: torch.Tensor,
+           bias: torch.Tensor,
+           target_dtype: torch.dtype,
+       ):
+           super().__init__()
+           self.act_scale, self.act_zero_point = act_obs.calculate_qparams()
+           weight_scale, weight_zero_point = weight_obs.calculate_qparams()
+           assert weight.dim() == 2
+           block_size = (1, weight.shape[1])
+           self.target_dtype = target_dtype
+           self.bias = bias
+           self.qweight = to_affine_quantized_intx_static(
+               weight, weight_scale, weight_zero_point, block_size, self.target_dtype
+           )
+   
+       def forward(self, input: torch.Tensor):
+           block_size = input.shape
+           qinput = to_affine_quantized_intx_static(
+               input,
+               self.act_scale,
+               self.act_zero_point,
+               block_size,
+               self.target_dtype,
+           )
+           return F.linear(qinput, self.qweight, self.bias)
+   
+       @classmethod
+       def from_observed(cls, observed_linear, target_dtype):
+           quantized_linear = cls(
+               observed_linear.in_features,
+               observed_linear.out_features,
+               observed_linear.act_obs,
+               observed_linear.weight_obs,
+               observed_linear.weight,
+               observed_linear.bias,
+               target_dtype,
+           )
+           return quantized_linear
+
+This linear class computes the scales and zero points for both input activations and weights in the beginning, effectively fixing the quantization range for future forward calls. Now, to actually quantize the model using this linear class, we can define the following config and pass it to torchao's main `quantize_` API:
+
+.. code:: py
+
+   from dataclasses import dataclass
+
+   from torchao.core.config import AOBaseConfig
+   from torchao.quantization import quantize_
+   from torchao.quantization.transform_module import (
+       register_quantize_module_handler,
+   )
+   
+   @dataclass
+   class StaticQuantConfig(AOBaseConfig):
+       target_dtype: torch.dtype
+   
+   @register_quantize_module_handler(StaticQuantConfig)
+   def _apply_static_quant(
+       module: torch.nn.Module,
+       config: StaticQuantConfig,
+   ):
+       """
+       Define a transformation associated with `StaticQuantConfig`.
+       This is called by `quantize_`, not by the user directly.
+       """
+       return QuantizedLinear.from_observed(module, config.target_dtype)
+
+   # filter function to identify which modules to swap
+   is_observed_linear = lambda m, fqn: isinstance(m, ObservedLinear)
+
+   # perform static quantization
+   quantize_(m, StaticQuantConfig(torch.uint8), is_observed_linear)
+
+Now, we will see that the linear layers in our model are swapped to our `QuantizedLinear` class, with a fixed input activation scale and a fixed quantized weight:
+
+.. code:: py
+
+   >>> m
+   OptimizedModule(
+     (_orig_mod): ToyLinearModel(
+       (linear1): QuantizedLinear()
+       (linear2): QuantizedLinear()
+     )
+   )
+   >>> m.linear1.act_scale
+   tensor([0.0237], device='cuda:0')
+   >>> m.linear1.qweight
+   AffineQuantizedTensor(tensor_impl=PlainAQTTensorImpl(data=tensor([[142,  31,  42,  ..., 113, 157,  57],
+           [ 59, 160,  70,  ...,  23, 150,  67],
+           [ 44,  49, 241,  ..., 238,  69, 235],
+           ...,
+           [228, 255, 201,  ..., 114, 236,  73],
+           [ 50,  88,  83,  ..., 109, 209,  92],
+           [184, 141,  35,  ..., 224, 110,  66]], device='cuda:0',
+          dtype=torch.uint8)... , scale=tensor([0.0009, 0.0010, 0.0009, 0.0010, 0.0009, 0.0010, 0.0010, 0.0010, 0.0010,
+           0.0010, 0.0010, 0.0010, 0.0010, 0.0010, 0.0010, 0.0010, 0.0010, 0.0010,
+           0.0010, 0.0010, 0.0010, 0.0009, 0.0010, 0.0010, 0.0010, 0.0009, 0.0010,
+           0.0009, 0.0010, 0.0010, 0.0010, 0.0009, 0.0009, 0.0009, 0.0010, 0.0009,
+           0.0010, 0.0009, 0.0010, 0.0010, 0.0010, 0.0009, 0.0009, 0.0009, 0.0010,
+           0.0009, 0.0010, 0.0009, 0.0009, 0.0009, 0.0010, 0.0010, 0.0009, 0.0009,
+           0.0010, 0.0009, 0.0010, 0.0010, 0.0009, 0.0009, 0.0009, 0.0009, 0.0009,
+           0.0010], device='cuda:0')... , zero_point=tensor([130., 128., 122., 130., 132., 128., 125., 130., 126., 128., 129., 126.,
+           128., 128., 128., 128., 129., 127., 130., 125., 128., 133., 126., 126.,
+           128., 124., 127., 128., 128., 128., 129., 124., 126., 133., 129., 127.,
+           126., 124., 130., 126., 127., 129., 124., 125., 127., 130., 128., 132.,
+           128., 129., 128., 129., 131., 132., 127., 135., 126., 130., 124., 136.,
+           131., 124., 130., 129.], device='cuda:0')... , _layout=PlainLayout()), block_size=(1, 64), shape=torch.Size([64, 64]), device=cuda:0, dtype=torch.bfloat16, requires_grad=False)
+
+In this tutorial, we walked through a basic example of how to perform integer static quantization in torchao. We also have an example of how to perform the same static quantization in float8. Please see the full `example script <https://github.com/pytorch/ao/tree/main/tutorials/calibration_flow/static_quant.py>`__ for more detail!
diff --git a/tutorials/calibration_flow/static_quant.py b/tutorials/calibration_flow/static_quant.py
index 59f50444e8..d81b00de8d 100644
--- a/tutorials/calibration_flow/static_quant.py
+++ b/tutorials/calibration_flow/static_quant.py
@@ -88,16 +88,16 @@ def replacement_fn(m):
 
 
 @dataclass
-class ApplyStaticQuantConfig(AOBaseConfig):
+class StaticQuantConfig(AOBaseConfig):
     target_dtype: torch.dtype
 
 
 # converting observed linear module to linear module with quantzied weights (and quantized activations)
 # with tensor subclasses
-@register_quantize_module_handler(ApplyStaticQuantConfig)
+@register_quantize_module_handler(StaticQuantConfig)
 def _apply_static_quant_transform(
     module: torch.nn.Module,
-    config: ApplyStaticQuantConfig,
+    config: StaticQuantConfig,
 ):
     target_dtype = config.target_dtype
     observed_linear = module
@@ -229,14 +229,14 @@ def from_observed(cls, observed_linear, target_dtype):
 
 
 @dataclass
-class ApplyStaticQuantConfig2(AOBaseConfig):
+class StaticQuantConfig2(AOBaseConfig):
     target_dtype: torch.dtype
 
 
-@register_quantize_module_handler(ApplyStaticQuantConfig2)
+@register_quantize_module_handler(StaticQuantConfig2)
 def apply_static_quant(
     module: torch.nn.Module,
-    config: ApplyStaticQuantConfig2,
+    config: StaticQuantConfig2,
 ):
     return QuantizedLinear.from_observed(module, config.target_dtype)
 
@@ -305,14 +305,14 @@ def test_static_quant(target_dtype: torch.dtype, mapping_type: MappingType):
 
     # quantized linear represented as an nn.Linear with modified tensor subclass weights
     # for both activation and weight quantization
-    quantize_(m, ApplyStaticQuantConfig(target_dtype), is_observed_linear)
+    quantize_(m, StaticQuantConfig(target_dtype), is_observed_linear)
     print("quantized model (applying tensor subclass to weight):", m)
     after_quant = m(*example_inputs)
     assert compute_error(before_quant, after_quant) > 25
     print("test passed")
 
     # quantized linear as a standalone module
-    quantize_(m2, ApplyStaticQuantConfig2(target_dtype), is_observed_linear)
+    quantize_(m2, StaticQuantConfig2(target_dtype), is_observed_linear)
     print("quantized model (quantized module):", m2)
     after_quant = m2(*example_inputs)
     assert compute_error(before_quant, after_quant) > 25

From b6bb7dc240b9083d105b52ee8a0393496cdbc428 Mon Sep 17 00:00:00 2001
From: Daniel Vega-Myhre <danvm@meta.com>
Date: Tue, 10 Jun 2025 15:44:12 -0700
Subject: [PATCH 104/165] float8 moe training conversion API prototype (#2275)

stack-info: PR: https://github.com/pytorch/ao/pull/2275, branch: danielvegamyhre/stack/1

migrate to quantize and add test

work on moe training test
---
 .../__init__.py                               |   0
 .../test_kernels.py                           |   4 +-
 .../test_scaled_grouped_mm.py                 |   2 +-
 test/prototype/moe_training/test_training.py  | 140 ++++++++++++++++++
 torchao/prototype/moe_training/__init__.py    |   3 +
 .../benchmarks/benchmark_kernels.py           |   4 +-
 .../benchmarks/benchmark_scaled_grouped_mm.py |   2 +-
 .../moe_training/conversion_utils.py          | 112 ++++++++++++++
 .../kernels/__init__.py                       |   4 +-
 .../kernels/jagged_float8_scales.py           |   2 +-
 .../scaled_grouped_mm.py                      |   9 +-
 torchao/prototype/moe_training/tensor.py      |  35 +++++
 .../utils.py                                  |   0
 .../prototype/scaled_grouped_mm/__init__.py   |   3 -
 14 files changed, 305 insertions(+), 15 deletions(-)
 rename test/prototype/{scaled_grouped_mm => moe_training}/__init__.py (100%)
 rename test/prototype/{scaled_grouped_mm => moe_training}/test_kernels.py (96%)
 rename test/prototype/{scaled_grouped_mm => moe_training}/test_scaled_grouped_mm.py (98%)
 create mode 100644 test/prototype/moe_training/test_training.py
 create mode 100644 torchao/prototype/moe_training/__init__.py
 rename torchao/prototype/{scaled_grouped_mm => moe_training}/benchmarks/benchmark_kernels.py (97%)
 rename torchao/prototype/{scaled_grouped_mm => moe_training}/benchmarks/benchmark_scaled_grouped_mm.py (98%)
 create mode 100644 torchao/prototype/moe_training/conversion_utils.py
 rename torchao/prototype/{scaled_grouped_mm => moe_training}/kernels/__init__.py (54%)
 rename torchao/prototype/{scaled_grouped_mm => moe_training}/kernels/jagged_float8_scales.py (99%)
 rename torchao/prototype/{scaled_grouped_mm => moe_training}/scaled_grouped_mm.py (95%)
 create mode 100644 torchao/prototype/moe_training/tensor.py
 rename torchao/prototype/{scaled_grouped_mm => moe_training}/utils.py (100%)
 delete mode 100644 torchao/prototype/scaled_grouped_mm/__init__.py

diff --git a/test/prototype/scaled_grouped_mm/__init__.py b/test/prototype/moe_training/__init__.py
similarity index 100%
rename from test/prototype/scaled_grouped_mm/__init__.py
rename to test/prototype/moe_training/__init__.py
diff --git a/test/prototype/scaled_grouped_mm/test_kernels.py b/test/prototype/moe_training/test_kernels.py
similarity index 96%
rename from test/prototype/scaled_grouped_mm/test_kernels.py
rename to test/prototype/moe_training/test_kernels.py
index ec18dd45bf..ed68e8fa23 100644
--- a/test/prototype/scaled_grouped_mm/test_kernels.py
+++ b/test/prototype/moe_training/test_kernels.py
@@ -19,11 +19,11 @@
     pytest.skip("Unsupported PyTorch version", allow_module_level=True)
 
 
-from torchao.prototype.scaled_grouped_mm.kernels.jagged_float8_scales import (
+from torchao.prototype.moe_training.kernels.jagged_float8_scales import (
     triton_fp8_col_major_jagged_colwise_scales,
     triton_fp8_row_major_jagged_rowwise_scales,
 )
-from torchao.prototype.scaled_grouped_mm.utils import (
+from torchao.prototype.moe_training.utils import (
     _is_column_major,
     _to_2d_jagged_float8_tensor_colwise,
     _to_2d_jagged_float8_tensor_rowwise,
diff --git a/test/prototype/scaled_grouped_mm/test_scaled_grouped_mm.py b/test/prototype/moe_training/test_scaled_grouped_mm.py
similarity index 98%
rename from test/prototype/scaled_grouped_mm/test_scaled_grouped_mm.py
rename to test/prototype/moe_training/test_scaled_grouped_mm.py
index 30af1abc04..844220c49c 100644
--- a/test/prototype/scaled_grouped_mm/test_scaled_grouped_mm.py
+++ b/test/prototype/moe_training/test_scaled_grouped_mm.py
@@ -26,7 +26,7 @@
 from torchao.float8.float8_linear import matmul_with_hp_or_float8_args
 from torchao.float8.float8_tensor import LinearMMConfig
 from torchao.float8.float8_utils import tensor_to_scale, to_fp8_saturated
-from torchao.prototype.scaled_grouped_mm.scaled_grouped_mm import (
+from torchao.prototype.moe_training.scaled_grouped_mm import (
     _scaled_grouped_mm,
 )
 from torchao.testing.utils import skip_if_rocm
diff --git a/test/prototype/moe_training/test_training.py b/test/prototype/moe_training/test_training.py
new file mode 100644
index 0000000000..71320af83e
--- /dev/null
+++ b/test/prototype/moe_training/test_training.py
@@ -0,0 +1,140 @@
+import copy
+
+import pytest
+import torch
+from torch import nn
+from torch.nn import functional as F
+
+# this feature requires CUDA and SM89+
+if not torch.cuda.is_available() or torch.cuda.get_device_capability() < (8, 9):
+    pytest.skip(
+        "CUDA not available or compute capability < 8.9", allow_module_level=True
+    )
+
+from torchao.float8.float8_utils import compute_error
+from torchao.prototype.moe_training.conversion_utils import MoETrainingConfig
+from torchao.prototype.moe_training.tensor import ScaledGroupedMMTensor
+from torchao.quantization.quant_api import quantize_
+
+# this test requires torchtitan
+try:
+    from torchtitan.experiments.llama4.model.args import TransformerModelArgs
+    from torchtitan.experiments.llama4.model.moe import MoE
+except ImportError:
+    import warnings
+
+    warnings.warn("torchtitan not installed, skipping MoE tests.")
+    pytest.skip(allow_module_level=True)
+
+
+@pytest.mark.parametrize(
+    "target_fqns",
+    [
+        ["experts"],
+        ["does.not.exist"],
+    ],
+)
+def test_moe_float8_training(target_fqns: list[str]):
+    model_args = TransformerModelArgs(
+        moe_enabled=True,
+        num_experts=8,
+        dim=256,
+    )
+    init_std = 0.02
+    device = torch.device("cuda")
+
+    # reference bf16 MoE
+    ref_model = MoE(model_args).to(torch.bfloat16).cuda()
+    torch.manual_seed(42)
+    ref_model.init_weights(init_std, device)
+
+    # target MoE for testing conversion
+    model = copy.deepcopy(ref_model)
+
+    # assert starting params are identical for both models
+    for param1, param2 in zip(model.parameters(), ref_model.parameters()):
+        assert torch.equal(param1, param2)
+
+    # convert MoE to float8 training
+    def moe_module_filter_fn(mod: nn.Module, cur_fqn: str) -> bool:
+        for target_fqn in target_fqns:
+            if target_fqn in cur_fqn:
+                return True
+        return False
+
+    # quantize test model
+    config = MoETrainingConfig()
+    quantize_(model, config=config, filter_fn=moe_module_filter_fn)
+
+    # validate that only the experts were converted
+    _validate_model_conversion(
+        model,
+        target_fqns=target_fqns,
+    )
+
+    # inputs
+    batch, seq, dim = 8, 2048, 256
+    ref_x = torch.randn(
+        batch, seq, dim, dtype=torch.bfloat16, requires_grad=True, device=device
+    )
+    x = ref_x.detach().clone().requires_grad_(True)
+
+    # forward pass
+    ref_out = ref_model(ref_x)
+    out = model(x)
+
+    # validate output
+    out_sqnr = compute_error(out, ref_out)
+    assert out_sqnr.item() >= 30.0, f"SQNR must be >= 30.0, got {out_sqnr.item()}."
+
+    # compute loss
+    labels = torch.ones_like(ref_out)
+    ref_loss = F.mse_loss(ref_out, labels)
+    out_loss = F.mse_loss(out, labels)
+
+    # backward pass
+    ref_loss.backward()
+    out_loss.backward()
+
+    # validate input gradient
+    input_grad_sqnr = compute_error(x.grad, ref_x.grad)
+    assert input_grad_sqnr.item() >= 30.0, (
+        f"SQNR must be >= 30.0, got {input_grad_sqnr.item()}."
+    )
+
+    # validate param gradients
+    for param1, param2 in zip(model.parameters(), ref_model.parameters()):
+        param_grad_sqnr = compute_error(param1.grad, param2.grad)
+        assert param_grad_sqnr.item() >= 25.0, (
+            f"SQNR must be >= 25.0, got {param_grad_sqnr.item()}."
+        )
+
+
+def _validate_model_conversion(
+    root_module: nn.Module,
+    target_fqns: list[str],
+):
+    def _recursive_validate(
+        module: nn.Module,
+        cur_fqn: str,
+    ):
+        is_allowed_module = cur_fqn in target_fqns
+
+        # check current module params
+        for param_name, param in module.named_parameters(recurse=False):
+            is_converted_type = isinstance(param, ScaledGroupedMMTensor)
+            if is_converted_type:
+                assert is_allowed_module, (
+                    f"Module {cur_fqn} is not in target_fqns, but has converted param {param_name}."
+                )
+            if not is_allowed_module:
+                assert not is_converted_type, (
+                    f"Module {cur_fqn} is not in target_fqns, but has converted param {param_name}."
+                )
+
+        # recursively check child modules
+        for child_name, child_module in module.named_children():
+            child_fqn = f"{cur_fqn}.{child_name}" if cur_fqn else child_name
+            _recursive_validate(child_module, child_fqn)
+
+    _recursive_validate(root_module, "")
diff --git a/torchao/prototype/moe_training/__init__.py b/torchao/prototype/moe_training/__init__.py
new file mode 100644
index 0000000000..8118193aff
--- /dev/null
+++ b/torchao/prototype/moe_training/__init__.py
@@ -0,0 +1,3 @@
+from torchao.prototype.moe_training.scaled_grouped_mm import _scaled_grouped_mm
+
+__all__ = ["_scaled_grouped_mm"]
diff --git a/torchao/prototype/scaled_grouped_mm/benchmarks/benchmark_kernels.py b/torchao/prototype/moe_training/benchmarks/benchmark_kernels.py
similarity index 97%
rename from torchao/prototype/scaled_grouped_mm/benchmarks/benchmark_kernels.py
rename to torchao/prototype/moe_training/benchmarks/benchmark_kernels.py
index cf40220ae0..37701e6545 100644
--- a/torchao/prototype/scaled_grouped_mm/benchmarks/benchmark_kernels.py
+++ b/torchao/prototype/moe_training/benchmarks/benchmark_kernels.py
@@ -14,11 +14,11 @@
 from tabulate import tabulate
 from tqdm import tqdm
 
-from torchao.prototype.scaled_grouped_mm.kernels.jagged_float8_scales import (
+from torchao.prototype.moe_training.kernels.jagged_float8_scales import (
     triton_fp8_col_major_jagged_colwise_scales,
     triton_fp8_row_major_jagged_rowwise_scales,
 )
-from torchao.prototype.scaled_grouped_mm.utils import (
+from torchao.prototype.moe_training.utils import (
     _to_2d_jagged_float8_tensor_colwise,
     _to_2d_jagged_float8_tensor_rowwise,
 )
diff --git a/torchao/prototype/scaled_grouped_mm/benchmarks/benchmark_scaled_grouped_mm.py b/torchao/prototype/moe_training/benchmarks/benchmark_scaled_grouped_mm.py
similarity index 98%
rename from torchao/prototype/scaled_grouped_mm/benchmarks/benchmark_scaled_grouped_mm.py
rename to torchao/prototype/moe_training/benchmarks/benchmark_scaled_grouped_mm.py
index 74921895ab..af1a652fc0 100644
--- a/torchao/prototype/scaled_grouped_mm/benchmarks/benchmark_scaled_grouped_mm.py
+++ b/torchao/prototype/moe_training/benchmarks/benchmark_scaled_grouped_mm.py
@@ -14,7 +14,7 @@
 from tabulate import tabulate
 from tqdm import tqdm
 
-from torchao.prototype.scaled_grouped_mm import _scaled_grouped_mm
+from torchao.prototype.moe_training import _scaled_grouped_mm
 
 device = torch.device("cuda")
 
diff --git a/torchao/prototype/moe_training/conversion_utils.py b/torchao/prototype/moe_training/conversion_utils.py
new file mode 100644
index 0000000000..928af1cf2e
--- /dev/null
+++ b/torchao/prototype/moe_training/conversion_utils.py
@@ -0,0 +1,112 @@
+from typing import Callable, Optional
+
+from torch import nn
+
+from torchao.core.config import AOBaseConfig
+from torchao.prototype.moe_training.tensor import ScaledGroupedMMTensor
+from torchao.quantization.transform_module import (
+    register_quantize_module_handler,
+)
+
+
+class MoETrainingConfig(AOBaseConfig):
+    """
+    The MoETrainingConfig is specifically designed to be used on MoE models using
+    `torch._grouped_mm` to implement expert computation in token-choice routing,
+    where expert weights are implemented as 3D nn.Parameters wit `num_experts` as
+    the leading dim.
+
+    MoETrainingConfig has a module handler registered to it which will
+    find all nn.Parameters whose parent module matches the module filter function,
+    and swap their data tensor with a ScaledGroupedMMTensor.
+
+    The ScaledGroupedMMTensor is a tensor subclass which overrides the
+    `torch._grouped_mm` op by dispatching to a differentiable scaled grouped mm,
+    which performs dynamic float8 rowwise quantization on scaled grouped GEMM
+    operands in both the forward and backward pass.
+
+    For all other ops, ScaledGroupedMMTensor behaves like a regular torch.Tensor.
+    """
+
+    pass
+
+
+@register_quantize_module_handler(MoETrainingConfig)
+def _moe_training_transform(
+    module: nn.Module,
+    config: MoETrainingConfig,
+) -> nn.Module:
+    """
+    Swaps `torch.nn.Parameter` data tensor with a ScaledGroupedMMTensor.
+
+    Args:
+        module: Module to modify.
+        config: MoETrainingConfig which defines how to perform the MoE training transform.
+
+    Returns:
+     nn.Module: The modified module with swapped parameters.
+    """
+    out = _swap_params(module)
+    return out
+
+
+def _swap_params(
+    module: nn.Module,
+    *,
+    module_filter_fn: Optional[Callable[[nn.Module, str], bool]] = None,
+) -> nn.Module:
+    """
+    Recurses through the nn.Module, recursively swapping the data tensor of
+    each nn.Parameter with a ScaledGroupedMMTensor. Only applies if the module
+    passed the module_filter_fn, if specified.
+
+    Args:
+        module: Module to modify.
+        module_filter_fn: If specified, only the `torch.nn.Parameter` subclasses that
+            that pass the filter function will be swapped. The inputs to the
+            filter function are the module instance, and the FQN.
+
+    Returns:
+     nn.Module: The modified module with swapped linear layers.
+    """
+    if isinstance(module, nn.Parameter) and (
+        module_filter_fn is None or module_filter_fn(module, "")
+    ):
+        if len(list(module.children())) > 0:
+            raise AssertionError(
+                f"Does not support a root nn.Parameter with children: {module}"
+            )
+        if not isinstance(module.data, ScaledGroupedMMTensor):
+            new_data = ScaledGroupedMMTensor(module.data)
+            return nn.Parameter(new_data, requires_grad=module.requires_grad)
+        return module
+
+    root_module = module
+
+    def post_order_traversal(
+        module: nn.Module,
+        cur_fqn: Optional[str] = None,
+        parent_module: Optional[nn.Module] = None,
+    ):
+        if cur_fqn is None:
+            cur_fqn = ""
+
+        for child_module_name, child_module in module.named_children():
+            if cur_fqn == "":
+                new_fqn = child_module_name
+            else:
+                new_fqn = f"{cur_fqn}.{child_module_name}"
+
+            post_order_traversal(child_module, new_fqn, module)
+
+        if module_filter_fn is None or module_filter_fn(module, cur_fqn):
+            for param_name, param in module.named_parameters(recurse=False):
+                if not isinstance(param.data, ScaledGroupedMMTensor):
+                    new_param = nn.Parameter(
+                        ScaledGroupedMMTensor(param), requires_grad=param.requires_grad
+                    )
+                    setattr(module, param_name, new_param)
+                    print(f"Swapped {cur_fqn}.{param_name} to ScaledGroupedMMTensor")
+
+    post_order_traversal(root_module)
+    return root_module
diff --git a/torchao/prototype/scaled_grouped_mm/kernels/__init__.py b/torchao/prototype/moe_training/kernels/__init__.py
similarity index 54%
rename from torchao/prototype/scaled_grouped_mm/kernels/__init__.py
rename to torchao/prototype/moe_training/kernels/__init__.py
index 1c75303568..b5446849b6 100644
--- a/torchao/prototype/scaled_grouped_mm/kernels/__init__.py
+++ b/torchao/prototype/moe_training/kernels/__init__.py
@@ -1,6 +1,6 @@
-from torchao.prototype.scaled_grouped_mm.kernels.jagged_float8_scales import (
+from torchao.prototype.moe_training.kernels.jagged_float8_scales import (
     triton_fp8_col_major_jagged_colwise_scales as triton_fp8_col_major_jagged_colwise_scales,
 )
-from torchao.prototype.scaled_grouped_mm.kernels.jagged_float8_scales import (
+from torchao.prototype.moe_training.kernels.jagged_float8_scales import (
     triton_fp8_row_major_jagged_rowwise_scales as triton_fp8_row_major_jagged_rowwise_scales,
 )
diff --git a/torchao/prototype/scaled_grouped_mm/kernels/jagged_float8_scales.py b/torchao/prototype/moe_training/kernels/jagged_float8_scales.py
similarity index 99%
rename from torchao/prototype/scaled_grouped_mm/kernels/jagged_float8_scales.py
rename to torchao/prototype/moe_training/kernels/jagged_float8_scales.py
index 4cc6177a48..3a497bf4a6 100644
--- a/torchao/prototype/scaled_grouped_mm/kernels/jagged_float8_scales.py
+++ b/torchao/prototype/moe_training/kernels/jagged_float8_scales.py
@@ -16,7 +16,7 @@
 import triton
 import triton.language as tl
 
-from torchao.prototype.scaled_grouped_mm.utils import _is_column_major
+from torchao.prototype.moe_training.utils import _is_column_major
 
 EPS = 1e-12
 
diff --git a/torchao/prototype/scaled_grouped_mm/scaled_grouped_mm.py b/torchao/prototype/moe_training/scaled_grouped_mm.py
similarity index 95%
rename from torchao/prototype/scaled_grouped_mm/scaled_grouped_mm.py
rename to torchao/prototype/moe_training/scaled_grouped_mm.py
index 169e2c5407..d3aaf615db 100644
--- a/torchao/prototype/scaled_grouped_mm/scaled_grouped_mm.py
+++ b/torchao/prototype/moe_training/scaled_grouped_mm.py
@@ -10,11 +10,11 @@
 
 from torchao.float8.config import ScalingGranularity
 from torchao.float8.float8_utils import tensor_to_scale, to_fp8_saturated
-from torchao.prototype.scaled_grouped_mm.kernels import (
+from torchao.prototype.moe_training.kernels import (
     triton_fp8_col_major_jagged_colwise_scales,
     triton_fp8_row_major_jagged_rowwise_scales,
 )
-from torchao.prototype.scaled_grouped_mm.utils import _is_column_major
+from torchao.prototype.moe_training.utils import _is_column_major
 
 
 def _scaled_grouped_mm(
@@ -83,7 +83,10 @@ def forward(
         assert not _is_column_major(A), "A must be row-major"
 
         # Due to hardware requirements, the right operand in a scaled grouped GEMM must be column-major.
-        assert _is_column_major(B_t), "B must be column-major"
+        if not _is_column_major(B_t):
+            # FSDP will complain if B_t (weights) is not contiguous, we can't require B_t to be column-major.
+            # TODO: figure out better solution than transposing for each forward pass.
+            B_t = B_t.transpose(-2, -1).contiguous().transpose(-2, -1)
 
         # Convert high precision input tensor to float8, row-major for left operand of grouped GEMM.
         # A shape: (M, K)
diff --git a/torchao/prototype/moe_training/tensor.py b/torchao/prototype/moe_training/tensor.py
new file mode 100644
index 0000000000..2a929d3b76
--- /dev/null
+++ b/torchao/prototype/moe_training/tensor.py
@@ -0,0 +1,35 @@
+import torch
+
+from torchao.prototype.moe_training import _scaled_grouped_mm
+
+
+class ScaledGroupedMMTensor(torch.Tensor):
+    """
+    ScaledGroupedMMTensor is a simple tensor subclass that wraps a regular tensor
+    and overrides the torch._grouped_mm op by dispatching to the
+    differentiable _scaled_grouped_mm autograd function.
+    """
+
+    grouped_mm_func_name = "_grouped_mm"
+    offs_arg_name = "offs"
+
+    def __init__(self, data: torch.Tensor):
+        self._data = data
+
+    @classmethod
+    def __torch_function__(cls, func, types, args, kwargs={}):
+        if func.__name__ == cls.grouped_mm_func_name:
+            # Use torchao scaled grouped mm with dynamic quant for
+            # "2d x 3d with offsets" case (used for routed experts).
+            # Otherwise, fall back to regular grouped mm.
+            #
+            # TODO: support "3d x 3d without offsets" case, which is
+            # used for shared experts. This is basically the grouped_mm
+            # kernel handling a bmm.
+            A, B = args[0], args[1]
+            A_is_2d = A.dim() == 2
+            B_is_3d = B.dim() == 3
+            has_offs = kwargs.get(cls.offs_arg_name) is not None
+            if A_is_2d and B_is_3d and has_offs:
+                return _scaled_grouped_mm(*args, **kwargs)
+        return super().__torch_function__(func, types, args, kwargs)
diff --git a/torchao/prototype/scaled_grouped_mm/utils.py b/torchao/prototype/moe_training/utils.py
similarity index 100%
rename from torchao/prototype/scaled_grouped_mm/utils.py
rename to torchao/prototype/moe_training/utils.py
diff --git a/torchao/prototype/scaled_grouped_mm/__init__.py b/torchao/prototype/scaled_grouped_mm/__init__.py
deleted file mode 100644
index 9c6278884a..0000000000
--- a/torchao/prototype/scaled_grouped_mm/__init__.py
+++ /dev/null
@@ -1,3 +0,0 @@
-from torchao.prototype.scaled_grouped_mm.scaled_grouped_mm import (
-    _scaled_grouped_mm as _scaled_grouped_mm,
-)

From 60c583eb47a66ec61b0b0410cd10dceec9a3f4a5 Mon Sep 17 00:00:00 2001
From: Daniel Vega-Myhre <danvm@meta.com>
Date: Tue, 10 Jun 2025 17:59:38 -0700
Subject: [PATCH 105/165] Add float8 MoE training readme and runnable example
 (#2353)

* add moe training readme and runnable example

* mention software requirements
---
 torchao/prototype/moe_training/README.md      | 101 ++++++++++++++++++
 .../moe_training/examples/simple_moe_layer.py |  65 +++++++++++
 2 files changed, 166 insertions(+)
 create mode 100644 torchao/prototype/moe_training/README.md
 create mode 100644 torchao/prototype/moe_training/examples/simple_moe_layer.py

diff --git a/torchao/prototype/moe_training/README.md b/torchao/prototype/moe_training/README.md
new file mode 100644
index 0000000000..e53278840e
--- /dev/null
+++ b/torchao/prototype/moe_training/README.md
@@ -0,0 +1,101 @@
+# Float8 MoE Training
+
+This prototype feature provides a way to use float8 rowwise training on MoE layers.
+
+Below is a simple runnable example of how to use this feature, using the MoE layer
+from the [torchtitan](https://github.com/pytorch/torchtitan) Llama4 implementation for demonstration.
+
+
+```python
+import torch
+from torch import nn
+from torch.nn import functional as F
+
+# this feature requires CUDA and SM89+
+assert torch.cuda.is_available() and torch.cuda.get_device_capability() >= (8, 9)
+
+from torchao.prototype.moe_training.conversion_utils import MoETrainingConfig
+from torchao.quantization.quant_api import quantize_
+
+# this example uses torchtitan llama4 MoE, see
+try:
+    from torchtitan.experiments.llama4.model.args import TransformerModelArgs
+    from torchtitan.experiments.llama4.model.moe import MoE
+except ImportError as e:
+    raise ImportError(
+        "torchtitan not installed, see installation instructions at https://github.com/pytorch/torchtitan"
+    ) from e
+
+
+# initialize model
+device = torch.device("cuda")
+model_args = TransformerModelArgs(
+    moe_enabled=True,
+    num_experts=8,
+    dim=256,
+)
+model = MoE(model_args).to(torch.bfloat16).to(device)
+init_std = 0.02
+model.init_weights(init_std, device)
+
+# module filter function to define which modules to quantize
+target_fqns = ["experts"]
+
+
+def moe_module_filter_fn(mod: nn.Module, cur_fqn: str) -> bool:
+    for target_fqn in target_fqns:
+        if target_fqn in cur_fqn:
+            return True
+    return False
+
+
+# quantize the model
+config = MoETrainingConfig()
+quantize_(model, config=config, filter_fn=moe_module_filter_fn)
+
+# training loop
+optimizer = torch.optim.AdamW(model.parameters(), lr=1e-3)
+for step in range(10):
+    batch, seq, dim = 8, 2048, 256
+    x = torch.randn(
+        batch, seq, dim, dtype=torch.bfloat16, requires_grad=True, device=device
+    )
+
+    # forward pass
+    out = model(x)
+
+    # compute loss
+    labels = torch.ones_like(out)
+    out_loss = F.mse_loss(out, labels)
+    print(f"step {step} loss: {out_loss.item()}")
+
+    # backward pass
+    out_loss.backward()
+    optimizer.step()
+
+```
+
+## Requirements
+- torchao nightly build
+- CUDA compute capability 8.9+ (SM89+)
+
+## Modeling requirements
+This prototype is specifically designed to be used on MoE models using
+`torch._grouped_mm` to implement expert computation in token-choice routing,
+where expert weights are implemented as 3D nn.Parameters with `num_experts` as
+the leading dim.
+
+The `MoETrainingConfig` has a module handler registered to it which will
+find all nn.Parameters whose parent module matches the module filter function,
+and swap their data tensor with a ScaledGroupedMMTensor.
+
+The ScaledGroupedMMTensor is a tensor subclass which overrides the
+`torch._grouped_mm` op by dispatching to a differentiable scaled grouped mm,
+which performs dynamic float8 rowwise quantization on scaled grouped GEMM
+operands in both the forward and backward pass.
+
+For all other ops, ScaledGroupedMMTensor behaves like a regular torch.Tensor.
+
+## Limitations
+- Only tested with eager mode, single GPU training so far.
+- Composability with parallelisms and `torch.compile` are next steps.
diff --git a/torchao/prototype/moe_training/examples/simple_moe_layer.py b/torchao/prototype/moe_training/examples/simple_moe_layer.py
new file mode 100644
index 0000000000..244d786c80
--- /dev/null
+++ b/torchao/prototype/moe_training/examples/simple_moe_layer.py
@@ -0,0 +1,65 @@
+import torch
+from torch import nn
+from torch.nn import functional as F
+
+# this feature requires CUDA and SM89+
+assert torch.cuda.is_available() and torch.cuda.get_device_capability() >= (8, 9)
+
+from torchao.prototype.moe_training.conversion_utils import MoETrainingConfig
+from torchao.quantization.quant_api import quantize_
+
+# this example uses torchtitan llama4 MoE, see
+try:
+    from torchtitan.experiments.llama4.model.args import TransformerModelArgs
+    from torchtitan.experiments.llama4.model.moe import MoE
+except ImportError as e:
+    raise ImportError(
+        "torchtitan not installed, see installation instructions at https://github.com/pytorch/torchtitan"
+    ) from e
+
+
+# initialize model
+device = torch.device("cuda")
+model_args = TransformerModelArgs(
+    moe_enabled=True,
+    num_experts=8,
+    dim=256,
+)
+model = MoE(model_args).to(torch.bfloat16).to(device)
+init_std = 0.02
+model.init_weights(init_std, device)
+
+# module filter function to define which modules to quantize
+target_fqns = ["experts"]
+
+
+def moe_module_filter_fn(mod: nn.Module, cur_fqn: str) -> bool:
+    for target_fqn in target_fqns:
+        if target_fqn in cur_fqn:
+            return True
+    return False
+
+
+# quantize the model
+config = MoETrainingConfig()
+quantize_(model, config=config, filter_fn=moe_module_filter_fn)
+
+# training loop
+optimizer = torch.optim.AdamW(model.parameters(), lr=1e-3)
+for step in range(10):
+    batch, seq, dim = 8, 2048, 256
+    x = torch.randn(
+        batch, seq, dim, dtype=torch.bfloat16, requires_grad=True, device=device
+    )
+
+    # forward pass
+    out = model(x)
+
+    # compute loss
+    labels = torch.ones_like(out)
+    out_loss = F.mse_loss(out, labels)
+    print(f"step {step} loss: {out_loss.item()}")
+
+    # backward pass
+    out_loss.backward()
+    optimizer.step()

From 2ec325da0bff7c7b63d7809a936a8cd0c1fa91ec Mon Sep 17 00:00:00 2001
From: Daniel Vega-Myhre <danvm@meta.com>
Date: Wed, 11 Jun 2025 09:18:37 -0700
Subject: [PATCH 106/165] [BE] Make ScalingGranularity module level so it can
 be rendered in API ref on docsite (#2314)

---
 torchao/float8/__init__.py | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/torchao/float8/__init__.py b/torchao/float8/__init__.py
index 2799f3197f..a97a46fa1c 100644
--- a/torchao/float8/__init__.py
+++ b/torchao/float8/__init__.py
@@ -29,12 +29,14 @@
             GemmInputRole,
             LinearMMConfig,
             Float8MMConfig,
+            ScalingGranularity,
         ]
     )
 
 __all__ = [
     # configuration
     "ScalingType",
+    "ScalingGranularity",
     "Float8GemmConfig",
     "Float8LinearConfig",
     "CastConfig",

From 3d7503998ecf33fb5add03ac79e74c0efc2c2509 Mon Sep 17 00:00:00 2001
From: Sayak Paul <spsayakpaul@gmail.com>
Date: Thu, 12 Jun 2025 04:22:49 +0530
Subject: [PATCH 107/165] Update README.md to include seamless v2 (#2355)

---
 README.md | 1 +
 1 file changed, 1 insertion(+)

diff --git a/README.md b/README.md
index e744ea9815..691594a933 100644
--- a/README.md
+++ b/README.md
@@ -13,6 +13,7 @@ From the team that brought you the fast series
 * 9.5x inference speedups for Image segmentation models with [sam-fast](https://pytorch.org/blog/accelerating-generative-ai)
 * 10x inference speedups for Language models with [gpt-fast](https://pytorch.org/blog/accelerating-generative-ai-2)
 * 3x inference speedup for Diffusion models with [sd-fast](https://pytorch.org/blog/accelerating-generative-ai-3)
+* 2.7x inference speedup for FAIR’s Seamless M4T-v2 model with [seamlessv2-fast](https://pytorch.org/blog/accelerating-generative-ai-4/)
 
 `torchao` isn't just for inference - it delivers substantial speedups at scale, from [up to 1.5x speedups](https://pytorch.org/blog/training-using-float8-fsdp2/) on 512 GPU clusters, to [1.34-1.43x speedups](https://pytorch.org/blog/accelerating-large-scale-training-and-convergence-with-pytorch-float8-rowwise-on-crusoe-2k-h200s/) on 2K H200 clusters with the latest `torchao.float8` rowwise
 

From afd58cca13283c3f6b689e09c0bd092198cd4f84 Mon Sep 17 00:00:00 2001
From: HDCharles <39544797+HDCharles@users.noreply.github.com>
Date: Wed, 11 Jun 2025 23:20:40 -0400
Subject: [PATCH 108/165] fix ROCM test failures (#2362)

Update regression_test_rocm.yml

these tests are timing out and breaking trunk
---
 .github/workflows/regression_test_rocm.yml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.github/workflows/regression_test_rocm.yml b/.github/workflows/regression_test_rocm.yml
index c24c76cfeb..d43b5f8d10 100644
--- a/.github/workflows/regression_test_rocm.yml
+++ b/.github/workflows/regression_test_rocm.yml
@@ -31,7 +31,7 @@ jobs:
       contents: read
     uses: pytorch/test-infra/.github/workflows/linux_job_v2.yml@main
     with:
-      timeout: 120
+      timeout: 150
       no-sudo: ${{ matrix.gpu-arch-type == 'rocm' }}
       runner: ${{ matrix.runs-on }}
       gpu-arch-type: ${{ matrix.gpu-arch-type }}

From eaaf78711173a76aab06c8c1f02e17fed65f045a Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Wed, 11 Jun 2025 20:25:26 -0700
Subject: [PATCH 109/165] Add Tutorial on E2E integration into VLLM and minimal
 Subclass (#2346)

---
 docs/requirements.txt                   |   2 +
 docs/source/conf.py                     |   7 +-
 docs/source/index.rst                   |   1 +
 docs/source/torchao_vllm_integration.md | 409 ++++++++++++++++++++++++
 4 files changed, 418 insertions(+), 1 deletion(-)
 create mode 100644 docs/source/torchao_vllm_integration.md

diff --git a/docs/requirements.txt b/docs/requirements.txt
index 99c41798e7..6900367d66 100644
--- a/docs/requirements.txt
+++ b/docs/requirements.txt
@@ -4,4 +4,6 @@ sphinx_design
 sphinx_copybutton
 sphinx-tabs
 matplotlib
+myst-parser
+sphinxcontrib-mermaid==1.0.0
 -e git+https://github.com/pytorch/pytorch_sphinx_theme.git#egg=pytorch_sphinx_theme
diff --git a/docs/source/conf.py b/docs/source/conf.py
index 66ee9a1c7e..1f549972c4 100644
--- a/docs/source/conf.py
+++ b/docs/source/conf.py
@@ -50,6 +50,8 @@
     "sphinx_design",
     "sphinx_gallery.gen_gallery",
     "sphinx_copybutton",
+    "myst_parser",
+    "sphinxcontrib.mermaid",
 ]
 
 sphinx_gallery_conf = {
@@ -96,7 +98,10 @@
 # The suffix(es) of source filenames.
 # You can specify multiple suffix as a list of string:
 #
-source_suffix = [".rst"]
+source_suffix = {
+    ".rst": "restructuredtext",
+    ".md": "markdown",
+}
 
 # The master toctree document.
 master_doc = "index"
diff --git a/docs/source/index.rst b/docs/source/index.rst
index 8931770795..20cd0748dc 100644
--- a/docs/source/index.rst
+++ b/docs/source/index.rst
@@ -42,3 +42,4 @@ for an overall introduction to the library and recent highlight and updates.
    subclass_advanced
    static_quantization
    pretraining
+   torchao_vllm_integration
diff --git a/docs/source/torchao_vllm_integration.md b/docs/source/torchao_vllm_integration.md
new file mode 100644
index 0000000000..9af8fb3885
--- /dev/null
+++ b/docs/source/torchao_vllm_integration.md
@@ -0,0 +1,409 @@
+(torchao_vllm_integration)=
+# Integration with VLLM: Architecture and Usage Guide
+
+This tutorial provides a comprehensive overview of how TorchAO integrates with VLLM, and what needs to be implemented to have a new technique work E2E.
+
+```{contents}
+:local:
+:depth: 2
+```
+
+
+(configuration-system)=
+## Configuration System
+
+(huggingface-model-configuration)=
+### 1. HuggingFace Model Configuration
+
+TorchAO quantization is configured through the model's `config.json` file:
+
+```json
+{
+  "model_type": "llama",
+  "quant_type": {
+    "default": {
+      "_type": "Int4WeightOnlyConfig",
+      "_data": {
+        "group_size": 128,
+        "use_hqq": true
+      }
+    }
+  }
+}
+```
+
+(torchao-configuration-classes)=
+### 2. TorchAO Configuration Classes
+
+All quantization methods inherit from `AOBaseConfig`:
+
+```python
+from torchao.core.config import AOBaseConfig
+from torchao.quantization import Int4WeightOnlyConfig
+
+# Example configuration
+config = Int4WeightOnlyConfig(
+    group_size=128,
+    use_hqq=True,
+)
+assert isinstance(config, AOBaseConfig)
+```
+
+```{note}
+All quantization configurations inherit from {class}`torchao.core.config.AOBaseConfig`, which provides serialization and validation capabilities.
+```
+
+(module-level-configuration)=
+### 3. Module-Level Configuration
+
+For granular control, use `ModuleFqnToConfig`:
+
+```python
+from torchao.quantization import ModuleFqnToConfig, Int4WeightOnlyConfig, Int8WeightOnlyConfig
+
+config = ModuleFqnToConfig({
+    "model.layers.0.self_attn.q_proj": Int4WeightOnlyConfig(group_size=64),
+    "model.layers.0.self_attn.k_proj": Int4WeightOnlyConfig(group_size=64),
+    "model.layers.0.mlp.gate_proj": Int8WeightOnlyConfig(),
+    "_default": Int4WeightOnlyConfig(group_size=128)  # Default for other modules
+})
+```
+
+(usage-examples)=
+## Usage Examples
+
+(quantizing-models-huggingface)=
+### 1. Quantizing Models with HuggingFace Integration
+
+```python
+from transformers import TorchAoConfig, AutoModelForCausalLM
+from torchao.quantization import Int4WeightOnlyConfig
+
+# Create quantization configuration
+quantization_config = TorchAoConfig(
+    quant_type=Int4WeightOnlyConfig(group_size=128, use_hqq=True)
+)
+
+# Load and automatically quantize the model
+model = AutoModelForCausalLM.from_pretrained(
+    "meta-llama/Llama-3.2-1B",
+    torch_dtype="auto",
+    device_map="auto",
+    quantization_config=quantization_config
+)
+
+# Save quantized model (see Serialization section below for safe_serialization details)
+model.push_to_hub("your-username/Llama-3.2-1B-int4", safe_serialization=False)
+```
+
+```{seealso}
+For more information on quantization configs, see {class}`torchao.quantization.Int4WeightOnlyConfig` and {class}`torchao.quantization.Int8WeightOnlyConfig`.
+```
+
+(serving-with-vllm)=
+### 2. Serving with VLLM
+
+```bash
+# Start VLLM server with TorchAO quantized model
+vllm serve your-username/Llama-3.2-1B-int4 \
+    --quantization torchao \
+    --dtype bfloat16 \
+```
+
+
+(adding-new-quantization-methods)=
+## Adding New Quantization Methods to VLLM
+
+(minimal-requirements-vllm)=
+### Minimal Requirements for VLLM Compatibility
+
+To make a new TorchAO quantization method work with VLLM, you need to implement minimal tensor subclass operations that support **tensor parallelism**. VLLM uses `narrow()` and `copy_()` to move data from host cpu loaded in a state dict to the device, these  require these specific aten operations:
+
+(why-these-operations)=
+### Why these ?
+
+VLLM's tensor parallelism works by:
+1. **{meth}`~torch.Tensor.narrow`** - Slicing weight tensors across different dimensions
+2. **Sharding** - Distributing tensor chunks across multiple GPUs
+3. **{meth}`~torch.Tensor.copy_`** - Moving tensor data between devices
+4. **{meth}`~torch.Tensor.detach`**
+
+
+A helpful pattern for doing this is `_apply_fn_to_data`, a method that applies a given function to all the attributes on your class w/ Tensor types. Below is a generic implementation that should work for most subclasses. We make heavy use of this pattern in the torchao codebase:
+
+```python
+def _apply_fn_to_data(self, fn: Callable):
+    """Applies a fn to all tensor components stored on this class"""
+    tensor_names, ctx = self.__tensor_flatten__()
+
+    # Apply the function to each tensor component
+    new_tensors = {}
+    for name in tensor_names:
+        new_tensors[name] = fn(getattr(self, name))
+
+    return self.__class__.__tensor_unflatten__(
+        new_tensors,
+        ctx,
+        None,  # outer_size parameter
+        None,  # outer_stride parameter
+    )
+```
+
+(step-by-step-guide)=
+## Step-by-Step Guide to Add a New Quantization Method
+
+(create-tensor-subclass)=
+### 1. Create Your Tensor Subclass
+
+```{note}
+For more details on tensor subclasses and their design principles, please refer to the [What are Tensor Subclasses?](https://docs.pytorch.org/ao/stable/subclass_basic.html#what-are-tensor-subclasses) documentation.
+```
+
+```python
+from torchao.core.config import AOBaseConfig
+from torchao.utils import TorchAOBaseTensor
+
+@dataclass
+class MyNewQuantConfig(AOBaseConfig):
+    """Configuration for your new quantization method"""
+    bits: int = 8
+    VERSION: ClassVar[int] = 1
+
+class MyQuantizedTensor(TorchAOBaseTensor):
+    """Example based on FbgemmFp8Tensor - stores quantized data + scale"""
+
+    tensor_data_attrs = ["quantized_data", "scale"]
+    tensor_attributes = ["dtype"]
+
+    def __new__(cls, quantized_data, scale, dtype):
+        shape = quantized_data.shape
+        return torch.Tensor._make_wrapper_subclass(
+            cls, shape, device=quantized_data.device, dtype=dtype, requires_grad=False
+        )
+
+    def __init__(self, quantized_data, scale, dtype):
+        self.quantized_data = quantized_data
+        self.scale = scale
+
+    def __tensor_flatten__(self) -> Tuple[List[str], List]:
+        """Serialize tensor subclass into plain tensors and metadata"""
+        return self.tensor_data_attrs, [
+            getattr(self, attr) for attr in self.tensor_attributes
+        ]
+
+    @classmethod
+    def __tensor_unflatten__(
+        cls,
+        tensor_data_dict: Dict[str, torch.Tensor],
+        tensor_attributes: List,
+        outer_size: Optional[torch.Size],
+        outer_stride: Optional[Tuple],
+    ) -> "MyQuantizedTensor":
+        """Reconstruct tensor subclass from serialized data"""
+        return cls(
+            *[tensor_data_dict[name] for name in cls.tensor_data_attrs],
+            *tensor_attributes,
+        )
+```
+
+(implement-vllm-operations)=
+### 2. Implement Required VLLM Operations
+
+```python
+from torch.utils._python_dispatch import return_and_correct_aliasing
+
+@MyQuantizedTensor.implements([aten.detach.default, aten.alias.default])
+def _(func, types, args, kwargs):
+    return return_and_correct_aliasing(
+        func, args, kwargs, args[0]._apply_fn_to_data(func)
+    )
+
+@MyQuantizedTensor.implements([aten._to_copy.default])
+def _(func, types, args, kwargs):
+    return return_and_correct_aliasing(
+        func, args, kwargs, args[0]._apply_fn_to_data(torch.clone)
+    )
+
+@MyQuantizedTensor.implements([aten.slice.Tensor])
+def _(func, types, args, kwargs):
+    self, dim, start, end, step = fill_defaults(args, 5, [0, None, None, 1])
+    if dim == 0 or dim == 1:
+        # NOTE the slicing here will likely be different for different quant techniques
+        return return_and_correct_aliasing(
+            func, args, kwargs,
+            args[0]._apply_fn_to_data(lambda x: aten.slice.Tensor(x, dim, start, end, step))
+        )
+    else:
+        raise NotImplementedError(f"Slicing along dim={dim} not supported")
+```
+
+(register-with-torchao)=
+### 3. Register with TorchAO's Quantization System
+
+```python
+from torchao.quantization.transform_module import register_quantize_module_handler
+
+@register_quantize_module_handler(MyNewQuantConfig)
+def _my_quant_transform(module: torch.nn.Module, config: MyNewQuantConfig):
+    """Transform function that applies your quantization to a module"""
+    weight = module.weight
+
+    # Your quantization logic here
+    quantized_weight = my_quantization_function(weight, config)
+
+    # Replace the weight with your quantized tensor
+    module.weight = torch.nn.Parameter(quantized_weight, requires_grad=False)
+    return module
+```
+
+```{important}
+The {func}`torchao.quantization.transform_module.register_quantize_module_handler` decorator registers your config class with TorchAO's quantization system.
+```
+
+(key-implementation-details)=
+### Key Implementation Details
+
+(hardware-specific-linear-ops)=
+### Hardware-Specific Linear Operations
+Your quantized tensor's forward pass determines hardware support and what actually gets called when {func}`torch.nn.functional.linear` is called.
+
+```python
+@MyQuantizedTensor.implements(torch.nn.functional.linear)
+def _(func, types, args, kwargs):
+    input_tensor, weight_tensor, bias = args[0], args[1], args[2] if len(args) > 2 else None
+
+    # This is where you define what hardware your method supports
+    if hasattr(weight_tensor, 'use_cutlass_kernel'):
+        return my_cutlass_linear(input_tensor, weight_tensor, bias)
+    elif hasattr(weight_tensor, 'use_triton_kernel'):
+        return my_triton_linear(input_tensor, weight_tensor, bias)
+    else:
+        # Fallback - dequantize and use standard linear
+        return torch.nn.functional.linear(
+            input_tensor, weight_tensor.dequantize(), bias
+        )
+```
+
+(compilation-benefits)=
+### Compilation Benefits
+The overhead of tensor subclasses disappears with {func}`torch.compile`, this is on by default in VLLM.
+
+(trade-off-tensor-subclasses)=
+### Trade Off of Tensor Subclasses
+1. **Compilation**: is essential for removing subclass overhead. Without it unless your model is extremely gpu bound the overhead of dispatch on the CPU can severely impact performance.
+2. The checkpoint defines the behavior of the model. You might be saying "don't all checkpoints do this". This is true, however people typically solely think of a torch.Tensor as its data. When in actuality its a true class where it brings the Dispatcher and all the kernels ATen has registered to it. When you define your tensor subclass, you are building a separate little world. One w/ a different representation of data, but also one where you need to explicitly define what ops you support and have implementations for all the hardware you want to support. This can feel a little like spooky action at a distance at first. But it can be very powerful. Case in point is being able to support TP with only 3 definitions.
+
+(serialization-model-sharing)=
+## Serialization and Model Sharing
+
+(safetensors-support)=
+### SafeTensors Support
+
+**Current Status**: TorchAO quantized models cannot yet be serialized with safetensors due to tensor subclass limitations. When saving quantized models, you must use `safe_serialization=False`.
+
+**Workaround**: For production use, save models with `safe_serialization=False` when pushing to HuggingFace Hub.
+
+**Future Work**: The TorchAO team is actively working on safetensors support for tensor subclasses. Track progress at: [pytorch/ao#2338](https://github.com/pytorch/ao/issues/2338)
+
+(integration-architecture-diagrams)=
+## Integration Architecture Diagrams
+
+(high-level-model-flow)=
+### 1. High-Level Model Flow: Transformers → VLLM + TorchAO
+
+This diagram shows the end-to-end flow from model creation to serving:
+
+```{mermaid}
+graph LR
+    A[HuggingFace Model] --> B[Transformers AutoModel]
+    B --> C{Quantization Config?}
+    C -->|TorchAO Config| D[Apply TorchAO Quantization]
+    C -->|No Config| E[Standard Model]
+
+    D --> F[Quantized Model w/ Tensor Subclasses]
+    E --> G[Standard PyTorch Model]
+
+    F --> H[VLLM Model Loading]
+    G --> H
+
+    H --> I[VLLM Distributed Engine]
+    I --> J[Tensor Parallel Sharding]
+    J --> K[Optimized Inference]
+
+    style D fill:#e1f5fe
+    style F fill:#f3e5f5
+    style J fill:#e8f5e8
+```
+
+(torchao-integration-points)=
+### 2. TorchAO Integration Points in VLLM
+
+This shows how VLLM detects and applies TorchAO quantization:
+
+```{mermaid}
+graph LR
+    A[Model Config Detection] --> B{quantization=torchao?}
+    B -->|Yes| C[TorchAOConfig.from_config]
+    B -->|No| D[Other Quantization Methods]
+
+    C --> E[Parse HF quant_type]
+    E --> F[config_from_dict]
+    F --> G[AOBaseConfig Instance]
+
+    G --> H[get_quant_method per layer]
+    H --> I{Layer Type?}
+    I -->|LinearBase| J[TorchAOLinearMethod]
+    I -->|Other| K[UnquantizedLinearMethod]
+
+    J --> L[create_weights]
+    L --> M[torchao_quantize_param_data]
+    M --> N[Quantized Tensor Subclass]
+
+    style C fill:#e1f5fe
+    style G fill:#f3e5f5
+    style N fill:#e8f5e8
+```
+
+(kernel-dispatch)=
+### 3. Kernel Dispatch: Bringing External Kernels to VLLM
+
+This illustrates how tensor subclasses enable custom kernel dispatch within VLLM:
+
+```{mermaid}
+graph LR
+    A[F.linear Call in VLLM] --> B[MyQuantTensor torch_function]
+    B --> C[Custom implements Handler]
+    C --> D{Hardware Check}
+
+    D --> E[Dispatch to External Kernel]
+    E --> F[Execute Optimized Kernel]
+    F --> G[Return Result to VLLM]
+
+    subgraph "External Libraries"
+        H[TorchAO CUTLASS]
+        I[TorchAO Triton]
+        J[FBGEMM-GPU]
+        K[Custom Libraries]
+    end
+
+    subgraph "Tensor Subclass Code"
+        L[implements F.linear]
+        M[custom_linear_impl]
+        N[call external kernel]
+    end
+
+    E --> H
+    E --> I
+    E --> J
+    E --> K
+
+    C --> L
+    L --> M
+    M --> N
+    N --> E
+
+    style B fill:#e8f6ff,color:#000
+    style C fill:#fff3e0,color:#000
+    style E fill:#e8f5e8,color:#000
+    style L fill:#f3e5f5,color:#000
+```

From 82bc17ec5301c566b6d98485921af6876319781b Mon Sep 17 00:00:00 2001
From: lilianaairhart <lilianaterry@meta.com>
Date: Wed, 11 Jun 2025 21:24:20 -0700
Subject: [PATCH 110/165] Back out "Add fbgemm as a dep for torchao in fbcode"

Differential Revision: D76400895

Pull Request resolved: https://github.com/pytorch/ao/pull/2360
---
 torchao/dtypes/fbgemm_int4_tensor.py | 7 +++----
 1 file changed, 3 insertions(+), 4 deletions(-)

diff --git a/torchao/dtypes/fbgemm_int4_tensor.py b/torchao/dtypes/fbgemm_int4_tensor.py
index c398442168..bb1558c6f8 100644
--- a/torchao/dtypes/fbgemm_int4_tensor.py
+++ b/torchao/dtypes/fbgemm_int4_tensor.py
@@ -5,7 +5,6 @@
 # LICENSE file in the root directory of this source tree.
 
 
-import importlib.util
 from typing import List
 
 import torch
@@ -25,11 +24,11 @@
 aten = torch.ops.aten
 
 
-if importlib.util.find_spec("fbgemm_gpu") is None:
+try: 
+    from fbgemm_gpu.experimental.gen_ai.quantize import int4_row_quantize_zp, pack_int4
+except:
     int4_row_quantize_zp = None
     pack_int4 = None
-else:
-    from fbgemm_gpu.experimental.gen_ai.quantize import int4_row_quantize_zp, pack_int4
 
 
 class FbgemmInt4Tensor(TorchAOBaseTensor):

From a2504181f436dc28c88d304b86578b38d24af1c0 Mon Sep 17 00:00:00 2001
From: Jesse Cai <jessecai@meta.com>
Date: Thu, 12 Jun 2025 11:35:14 -0400
Subject: [PATCH 111/165] Fix 2:4 sparsify meta registrations (#2366)

* fix 2:4 meta registrations

Summary:

We need to register in python for symbolic shape support, which is
needed for vLLM

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:

* add meta for sparse gemm
---
 test/sparsity/test_activation24.py            |  2 +-
 torchao/csrc/cuda/activation24/sparse_gemm.cu | 27 +++--------
 torchao/csrc/cuda/activation24/sparsify24.cu  | 20 ++------
 torchao/ops.py                                | 48 +++++++++++++++++--
 4 files changed, 54 insertions(+), 43 deletions(-)

diff --git a/test/sparsity/test_activation24.py b/test/sparsity/test_activation24.py
index 420bf4328a..cc8f1179bf 100644
--- a/test/sparsity/test_activation24.py
+++ b/test/sparsity/test_activation24.py
@@ -171,7 +171,7 @@ def test_sparse24_fp8_sm90_cutlass_gemm_eye(
     # Check MM with scale
     b_scale = torch.randn([1, A.shape[1]], device=eye.device, dtype=torch.float32)
     a_scale = torch.randn([A.shape[0], 1], device=eye.device, dtype=torch.float32)
-    A_reconstructed = torch.ops.torchao._sparse24_fp8_sm90_cutlass_gemm(
+    A_reconstructed = torch.ops.torchao.sparse24_fp8_sm90_cutlass_gemm(
         A_packed, A_mdata, eye, a_scale=a_scale, b_scale=b_scale
     )
     assert torch.allclose(
diff --git a/torchao/csrc/cuda/activation24/sparse_gemm.cu b/torchao/csrc/cuda/activation24/sparse_gemm.cu
index 776766794e..f837bcc3aa 100644
--- a/torchao/csrc/cuda/activation24/sparse_gemm.cu
+++ b/torchao/csrc/cuda/activation24/sparse_gemm.cu
@@ -132,9 +132,6 @@ struct SparseRowwiseKernel<cutlass::float_e4m3_t> {
 
 template <>
 struct SparseRowwiseKernel<cutlass::bfloat16_t> {
-  static constexpr auto kElementOutAt = at::ScalarType::BFloat16;
-  static constexpr auto kElementAAt = at::ScalarType::BFloat16;
-
   using ElementA = cutlass::bfloat16_t;
   using ElementB = cutlass::bfloat16_t;
   using ElementOut = cutlass::bfloat16_t;
@@ -209,7 +206,6 @@ struct SparseRowwiseKernel<cutlass::bfloat16_t> {
   using ElementE = CollectiveMainloop::ElementE;
 };
 
-template <bool kIsMeta>
 Tensor _sparse24_fp8_sm90_cutlass_gemm(
     const Tensor& tensor_a,
     const Tensor& tensor_e, // metadata for `A`
@@ -221,20 +217,16 @@ Tensor _sparse24_fp8_sm90_cutlass_gemm(
     std::string swizzle_axis,
     int64_t sm_count) {
   std::optional<at::cuda::CUDAGuard> device_guard;
-  if (!kIsMeta) {
-    device_guard.emplace(tensor_a.device());
-  }
+  device_guard.emplace(tensor_a.device());
 
   using K = SparseRowwiseKernel<cutlass::float_e4m3_t>;
 
   // For now, only CC 9.x devices are supported.
-  if (!kIsMeta) {
-    const auto dprops = at::cuda::getCurrentDeviceProperties();
-    TORCH_CHECK(
-        dprops && dprops->major == 9,
-        "_sparse24_gemm_fp8_sm90: Supported only on GPUs with "
-        "compute capability 9.x");
-  }
+  const auto dprops = at::cuda::getCurrentDeviceProperties();
+  TORCH_CHECK(
+      dprops && dprops->major == 9,
+      "_sparse24_gemm_fp8_sm90: Supported only on GPUs with "
+      "compute capability 9.x");
 
   // Validate layouts of input tensors.
   TORCH_CHECK(tensor_a.device() == tensor_b.device());
@@ -340,12 +332,7 @@ Tensor _sparse24_fp8_sm90_cutlass_gemm(
 TORCH_LIBRARY_IMPL(torchao, CUDA, m) {
   m.impl(
       TORCH_SELECTIVE_NAME("torchao::sparse24_fp8_sm90_cutlass_gemm"),
-      TORCH_FN(_sparse24_fp8_sm90_cutlass_gemm<false>));
+      TORCH_FN(_sparse24_fp8_sm90_cutlass_gemm));
 }
 
-TORCH_LIBRARY_IMPL(torchao, Meta, m) {
-  m.impl(
-      TORCH_SELECTIVE_NAME("torchao::sparse24_fp8_sm90_cutlass_gemm"),
-      TORCH_FN(_sparse24_fp8_sm90_cutlass_gemm<true>));
-}
 #endif
diff --git a/torchao/csrc/cuda/activation24/sparsify24.cu b/torchao/csrc/cuda/activation24/sparsify24.cu
index e8949fa5d8..076cb1df5b 100644
--- a/torchao/csrc/cuda/activation24/sparsify24.cu
+++ b/torchao/csrc/cuda/activation24/sparsify24.cu
@@ -263,7 +263,6 @@ struct SparsifyKernelParams {
 };
 
 template <
-    bool kIsMeta,
     typename MetadataFormat,
     typename ElementIn,
     typename ElementOut,
@@ -274,10 +273,8 @@ std::tuple<at::Tensor, at::Tensor> sparse24_sm90_sparsify_specialized(
     std::string sp_selection_algo,
     std::optional<at::Tensor> scale) {
   std::optional<at::cuda::CUDAGuard> device_guard;
-  if (!kIsMeta) {
-    TORCH_CHECK(input.is_cuda(), "All tensors must be on GPU");
-    device_guard.emplace(input.device());
-  }
+  TORCH_CHECK(input.is_cuda(), "All tensors must be on GPU");
+  device_guard.emplace(input.device());
 
   TORCH_CHECK(input.dim() == 2, "Can only sparsify 2d tensors");
   TORCH_CHECK(
@@ -306,9 +303,6 @@ std::tuple<at::Tensor, at::Tensor> sparse24_sm90_sparsify_specialized(
   auto launchKernel = [&](auto algo, std::string const& algo_name) {
     if (algo_name == sp_selection_algo) {
       kernel_launched = true;
-      if (kIsMeta) {
-        return;
-      }
       using Params = SparsifyKernelParams<
           ElementIn,
           ElementOut,
@@ -347,7 +341,6 @@ struct SquaredReLU {
   }
 };
 
-template <bool kIsMeta = false>
 std::tuple<at::Tensor, at::Tensor> sparse24_sm90_sparsify(
     at::Tensor input,
     std::string metadata_fmt,
@@ -363,7 +356,6 @@ std::tuple<at::Tensor, at::Tensor> sparse24_sm90_sparsify(
         using ElementIn = decltype(in_type);
         using ElementOut = decltype(out_type);
         return sparse24_sm90_sparsify_specialized<
-            kIsMeta,
             decltype(mdatafmt),
             ElementIn,
             ElementOut>(input, act, sp_selection_algo, scale);
@@ -409,11 +401,5 @@ std::tuple<at::Tensor, at::Tensor> sparse24_sm90_sparsify(
 TORCH_LIBRARY_IMPL(torchao, CUDA, m) {
   m.impl(
       TORCH_SELECTIVE_NAME("torchao::sparse24_sm90_sparsify"),
-      TORCH_FN(sparse24_sm90_sparsify<false>));
-}
-
-TORCH_LIBRARY_IMPL(torchao, Meta, m) {
-  m.impl(
-      TORCH_SELECTIVE_NAME("torchao::sparse24_sm90_sparsify"),
-      TORCH_FN(sparse24_sm90_sparsify<true>));
+      TORCH_FN(sparse24_sm90_sparsify));
 }
diff --git a/torchao/ops.py b/torchao/ops.py
index b91bb8ae18..cda3746624 100644
--- a/torchao/ops.py
+++ b/torchao/ops.py
@@ -843,15 +843,39 @@ def sparse24_sm90_sparsify(
     )
 
 
+@register_custom_op("torchao::sparse24_sm90_sparsify")
+def _(
+    input_tensor: Tensor,
+    metadata_format: str,
+    activation: str,
+    algorithm: str,
+    dtype=None,
+    scale=None,
+):
+    out_dtype = dtype if dtype is not None else input_tensor.dtype
+    return (
+        torch.empty(
+            (input_tensor.shape[0], input_tensor.shape[1] // 2),
+            dtype=out_dtype,
+            device=input_tensor.device,
+        ),
+        torch.empty(
+            (input_tensor.shape[0], input_tensor.shape[1] // 8),
+            dtype=torch.uint8,
+            device=input_tensor.device,
+        ),
+    )
+
+
 def sparse24_fp8_sm90_cutlass_gemm(
     a: Tensor,
     meta: Tensor,
     b: Tensor,
-    a_scale: Optional[Tensor],
-    b_scale: Optional[Tensor],
-    swizzle_size: int,
-    swizzle_axis: str,
-    sm_count: int,
+    a_scale: Optional[Tensor] = None,
+    b_scale: Optional[Tensor] = None,
+    swizzle_size: int = 8,
+    swizzle_axis: str = "n",
+    sm_count: int = 128,
 ) -> Tensor:
     return torch.ops.torchao.sparse24_fp8_sm90_cutlass_gemm(
         a,
@@ -865,6 +889,20 @@ def sparse24_fp8_sm90_cutlass_gemm(
     )
 
 
+@register_custom_op("torchao::sparse24_fp8_sm90_cutlass_gemm")
+def _(
+    a: Tensor,
+    meta: Tensor,
+    b: Tensor,
+    a_scale: Optional[Tensor] = None,
+    b_scale: Optional[Tensor] = None,
+    swizzle_size: int = 8,
+    swizzle_axis: str = "n",
+    sm_count: int = 128,
+):
+    return torch.empty((a.shape[0], b.shape[1]), dtype=torch.bfloat16, device=a.device)
+
+
 def swizzle_mm(
     mat1: Tensor, mat2: Tensor, mat1_is_swizzled: bool, mat2_is_swizzled: bool
 ) -> Tensor:

From aec08213b365daee91b86fec7c37f1b827f93d6f Mon Sep 17 00:00:00 2001
From: Jesse Cai <jessecai@meta.com>
Date: Thu, 12 Jun 2025 13:51:45 -0400
Subject: [PATCH 112/165] [float8] Add fnuz fp8 dtypes to Float8Layout (#2351)

This should give us AMD perf on vLLM. With Phi-4-mini-instruct on MI300x with TorchAO FP8 rowwise quant on the MLP I see the following, which is about a 5% speedup:
```
Avg latency: 1.080369415456274 seconds
10% percentile latency: 1.075335633114446 seconds
25% percentile latency: 1.0811904482543468 seconds
50% percentile latency: 1.082176529977005 seconds
75% percentile latency: 1.0826280051842332 seconds
90% percentile latency: 1.0831242799758911 seconds
99% percentile latency: 1.0836151059856638 seconds
```

For comparison, here is the baseline Phi-4-mini-instruct on MI300x:
```
Avg latency: 1.148340248184589 seconds
10% percentile latency: 1.1391733552212826 seconds
25% percentile latency: 1.14905939399614 seconds
50% percentile latency: 1.150204271019902 seconds
75% percentile latency: 1.1523984443047084 seconds
90% percentile latency: 1.1536207939614542 seconds
99% percentile latency: 1.1548575214319863 seconds
```

Previously, these checks were failing on the unsigned zero ROCm fp8 dtypes, causing us to call `.dequantize()` and then do a bfloat16 mm, which was slower than the bf16 baseline (~2s).
---
 torchao/dtypes/floatx/float8_layout.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/torchao/dtypes/floatx/float8_layout.py b/torchao/dtypes/floatx/float8_layout.py
index 543bd5002b..40091d2667 100644
--- a/torchao/dtypes/floatx/float8_layout.py
+++ b/torchao/dtypes/floatx/float8_layout.py
@@ -363,7 +363,7 @@ def check_aqt(aqt: Union[torch.Tensor, AffineQuantizedTensor]) -> bool:
         return (
             isinstance(aqt, AffineQuantizedTensor)
             and isinstance(aqt._layout, Float8Layout)
-            and aqt.tensor_impl.dtype in [torch.float8_e4m3fn, torch.float8_e5m2]
+            and _is_float8_type(aqt.tensor_impl.dtype)
             and (aqt.shape == aqt.block_size or _is_rowwise_scaled(aqt))
         )
 
@@ -442,7 +442,7 @@ def _linear_fp_act_fp8_weight_check(
         # weight is float8 quantized affine quantized tensor
         isinstance(weight_tensor, AffineQuantizedTensor)
         and isinstance(weight_tensor._layout, Float8Layout)
-        and weight_tensor.tensor_impl.dtype in [torch.float8_e4m3fn, torch.float8_e5m2]
+        and _is_float8_type(weight_tensor.tensor_impl.dtype)
         and (
             weight_tensor.shape == weight_tensor.block_size
             or _is_rowwise_scaled(weight_tensor)

From b51b2ec2f3835e009dc25dc324f4b31d4afb5a4c Mon Sep 17 00:00:00 2001
From: HDCharles <39544797+HDCharles@users.noreply.github.com>
Date: Thu, 12 Jun 2025 16:45:06 -0400
Subject: [PATCH 113/165] fixing ruff format for trunk (#2369)

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:
---
 torchao/dtypes/fbgemm_int4_tensor.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/torchao/dtypes/fbgemm_int4_tensor.py b/torchao/dtypes/fbgemm_int4_tensor.py
index bb1558c6f8..0c00ee1a81 100644
--- a/torchao/dtypes/fbgemm_int4_tensor.py
+++ b/torchao/dtypes/fbgemm_int4_tensor.py
@@ -24,7 +24,7 @@
 aten = torch.ops.aten
 
 
-try: 
+try:
     from fbgemm_gpu.experimental.gen_ai.quantize import int4_row_quantize_zp, pack_int4
 except:
     int4_row_quantize_zp = None

From dd22777024e31eecd4ee2312a269e66e37c6e6f5 Mon Sep 17 00:00:00 2001
From: HDCharles <39544797+HDCharles@users.noreply.github.com>
Date: Thu, 12 Jun 2025 17:11:34 -0400
Subject: [PATCH 114/165] fixing trunk - autoquant test failure (#2363)

fixing autoquant bug  `

Summary:

tests started failing recently in pytorch nightly: https://github.com/pytorch/ao/actions/runs/15590189942/job/43907010550

There was an old requirement for dynamic quant to have a minimum size
greater than 16 but then after some pytorch changes it was no longer
necessary, now its back

Test Plan: python test/integration/test_integration.py -k
"test_autoquant_compile"

also see CI since i can't repro this error locally hopefully this
resolves the CI error

Reviewers:

Subscribers:

Tasks:

Tags:

Update test_integration.py

more fixes

Summary:

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:
---
 test/integration/test_integration.py | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/test/integration/test_integration.py b/test/integration/test_integration.py
index 7c070bf754..654f8e47e1 100644
--- a/test/integration/test_integration.py
+++ b/test/integration/test_integration.py
@@ -1624,6 +1624,9 @@ def test_autoquant_compile(self, device, dtype, m1, m2, k, n):
         # Skip certain shapes on older PyTorch versions
         if (m1 == 1 or m2 == 1) and not TORCH_VERSION_AT_LEAST_2_5:
             self.skipTest(f"Shape {(m1, m2, k, n)} requires torch version > 2.4")
+        # TODO remove this once https://github.com/pytorch/pytorch/issues/155838 is resolved
+        if m1 == 1 or m2 == 1:
+            self.skipTest(f"Shape {(m1, m2, k, n)} is flaky, skipping")
         model = (
             torch.nn.Sequential(
                 torch.nn.ReLU(),

From 03c850afae7b76cd64fe69124840034f00a42632 Mon Sep 17 00:00:00 2001
From: Vasiliy Kuznetsov <vkuzo@users.noreply.github.com>
Date: Fri, 13 Jun 2025 08:00:00 -0400
Subject: [PATCH 115/165] make float8 training's
 force_recompute_fp8_weight_in_bwd flag do nothing (#2356)

Summary:

This PR makes the `Float8LinearConfig.force_recompute_fp8_weight_in_bwd`
flag do nothing and marks it for a future deprecation.

Now that PyTorch Core can handle this logic automatically, we
no longer need the workaround. Please
see https://github.com/pytorch/ao/issues/2251 for more context.

Test Plan:

```
./test/float8/test_everything.sh
```

Reviewers:

Subscribers:

Tasks:

Tags:
---
 .../float8/training/torchtitan_benchmark.sh   |  2 +-
 torchao/float8/config.py                      | 25 ++++------------
 torchao/float8/float8_linear.py               | 30 ++++++-------------
 3 files changed, 15 insertions(+), 42 deletions(-)

diff --git a/benchmarks/float8/training/torchtitan_benchmark.sh b/benchmarks/float8/training/torchtitan_benchmark.sh
index 85e1a9d354..d30b1eceb1 100755
--- a/benchmarks/float8/training/torchtitan_benchmark.sh
+++ b/benchmarks/float8/training/torchtitan_benchmark.sh
@@ -29,7 +29,7 @@ fi
 # validate recipe name
 if [ -n "${FLOAT8_RECIPE_WITH_BEST_SETTINGS}" ]; then
   if [ "${FLOAT8_RECIPE_WITH_BEST_SETTINGS}" == "tensorwise" ]; then
-    FLOAT8_ARGS="--model.converters="float8" --float8.enable_fsdp_float8_all_gather --float8.precompute_float8_dynamic_scale_for_fsdp --float8.force_recompute_fp8_weight_in_bwd"
+    FLOAT8_ARGS="--model.converters="float8" --float8.enable_fsdp_float8_all_gather --float8.precompute_float8_dynamic_scale_for_fsdp"
   else
     FLOAT8_ARGS="--model.converters="float8" --float8.recipe_name=${FLOAT8_RECIPE_WITH_BEST_SETTINGS}"
   fi
diff --git a/torchao/float8/config.py b/torchao/float8/config.py
index f9adb002cb..939f68e59a 100644
--- a/torchao/float8/config.py
+++ b/torchao/float8/config.py
@@ -192,20 +192,9 @@ class Float8LinearConfig:
     # If True, emulation is used instead of hardware accelerated gemm
     emulate: bool = False
 
-    # If the option is enabled, fp8_weight will always be re-computed in backward.
-    # It's recommended to enable this flag when using FSDP.
-    # Otherwise, the entire fp8_weight, instead of the sharded weight may be saved.
-    # If using outer activation checkpointing context or SAC, you may disable this option
-    # and handle the recomputation of fp8 weight in your customized AC context.
-    #
-    # Details:
-    # When using float8 training with FSDP, the original weight is sharded; fp8_weight (in forward) and fp8_weight_transpose (in backward) are used by the model.
-    # However, when partitioning the forward_backward graph, torch.compile may decide to
-    # save the fp8_weight_transpose for backward, which is an un-sahrded weight and costs a high memory utilization.
-    # The longer-term solution is to let compile decide how to partition the graph with optimal computation and memory savings.
-    # For now, we use the checkpointing api to force the recomputation of fp8 weight in backward.
-    # TODO(future PR): either enable by default or have a warning and set up the
-    # tests so that the warning does not spam the CI stdout.
+    # This flag is deprecated and currently has no effect. It will be removed
+    # in a future release. Please see https://github.com/pytorch/ao/issues/2251
+    # for more context.
     force_recompute_fp8_weight_in_bwd: bool = False
 
     # If this option is enabled, the scaling factor used for float8 quantization
@@ -278,13 +267,9 @@ def __post_init__(self):
                 f"{operand_name} must be cast to the same dtype in both matmuls it's used in"
             )
 
-        # See the comments around `force_recompute_fp8_weight_in_bwd` for more details of this warning.
-        if (
-            self.enable_fsdp_float8_all_gather
-            and not self.force_recompute_fp8_weight_in_bwd
-        ):
+        if self.force_recompute_fp8_weight_in_bwd:
             logger.warning(
-                "When using FSDP, it's recommended to enable config.force_recompute_fp8_weight_in_bwd."
+                "`config.force_recompute_fp8_weight_in_bwd` is deprecated and will be removed in a future release. Please see https://github.com/pytorch/ao/issues/2251 for more details."
             )
 
     @staticmethod
diff --git a/torchao/float8/float8_linear.py b/torchao/float8/float8_linear.py
index c926ede40f..fbafc1a393 100644
--- a/torchao/float8/float8_linear.py
+++ b/torchao/float8/float8_linear.py
@@ -10,7 +10,6 @@
 from typing import Optional
 
 import torch
-import torch.utils.checkpoint as checkpoint
 
 from torchao.float8.config import Float8LinearConfig, ScalingGranularity, ScalingType
 from torchao.float8.distributed_utils import tensor_already_casted_to_fp8
@@ -325,29 +324,18 @@ def forward(self, input: torch.Tensor) -> torch.Tensor:
         # TODO(future PR): check for axiswise scaling for input, weight,
         # grad_output separately instead of together
         if not has_any_axiswise_scaling:
-            # If force_recompute_fp8_weight_in_bwd, we only recompute the fp8 weight,
-            # weight_scale should be saved.
+            # TODO(future PR): now that `force_recompute_fp8_weight_in_bwd` is
+            # deprecated, we can simplify the below code and unify the per-tensor
+            # and per-axis paths further.
             weight_scale = _get_weight_scale(
                 self.weight, self.scaling_type_weight, self.config
             )
-
-            if self.config.force_recompute_fp8_weight_in_bwd:
-                weight_fp8_t = checkpoint.checkpoint(
-                    _cast_weight_to_float8_t,
-                    self.weight,
-                    self.config,
-                    self.linear_mm_config,
-                    weight_scale,
-                )
-            else:
-                weight_fp8_t = _cast_weight_to_float8_t(
-                    self.weight,
-                    self.config,
-                    self.linear_mm_config,
-                    weight_scale,
-                )
-
-            weight_maybe_fp8_t = weight_fp8_t
+            weight_maybe_fp8_t = _cast_weight_to_float8_t(
+                self.weight,
+                self.config,
+                self.linear_mm_config,
+                weight_scale,
+            )
 
         output = matmul_with_hp_or_float8_args.apply(
             input,

From 0afa4c1bd28c82921e360ddbd1b27c9d6da5b947 Mon Sep 17 00:00:00 2001
From: mobicham <37179323+mobicham@users.noreply.github.com>
Date: Fri, 13 Jun 2025 16:47:35 +0200
Subject: [PATCH 116/165] Add dynamic quantization support to gemlite layout
 (#2327)

* fix get_plain() with FMA mode

* update

* fix in_features/out_feature meta-data mismatch

* update gemlite slice test

* add packing_bitwidth support

* add packing_bitwidth support and cleanup

* update default gemlite layout

* cleanup

* fix symmetric use-case and relax _same_meta_data

* _copy() meta data

* fix (4,) in autoquant

* Add dynamic mode in gemlite layout

* mode explanation

Signed-off-by: mobicham <hicham@mobiuslabs.com>

* use weights_only instead of static

---------

Signed-off-by: mobicham <hicham@mobiuslabs.com>
---
 torchao/dtypes/uintx/gemlite_layout.py | 22 ++++++++++++++++++++--
 torchao/quantization/autoquant.py      |  8 +++++++-
 torchao/quantization/quant_api.py      | 11 +++++++++--
 3 files changed, 36 insertions(+), 5 deletions(-)

diff --git a/torchao/dtypes/uintx/gemlite_layout.py b/torchao/dtypes/uintx/gemlite_layout.py
index eb06cf2a96..51b453de8a 100644
--- a/torchao/dtypes/uintx/gemlite_layout.py
+++ b/torchao/dtypes/uintx/gemlite_layout.py
@@ -85,6 +85,7 @@ def get_gemlite_aqt_kwargs(
     group_size=64,
     bit_width=4,
     packing_bitwidth=None,
+    mode="weight_only",
     use_hqq=True,
 ):
     if gemlite is None:
@@ -108,6 +109,10 @@ def get_gemlite_aqt_kwargs(
         f"Invalid packing bitwidth, got {packing_bitwidth}"
     )
 
+    assert mode in ["weight_only", "dynamic"], (
+        f"Invalid mode: should be either weight_only or dynamic, got {mode}"
+    )
+
     out_features, in_features = weight.shape
     group_size = in_features if group_size is None else group_size
 
@@ -116,6 +121,7 @@ def get_gemlite_aqt_kwargs(
         group_size=group_size,
         bit_width=bit_width,
         packing_bitwidth=packing_bitwidth,
+        mode=mode,
     )
     aqt_kwargs["use_hqq"] = use_hqq
     return aqt_kwargs
@@ -126,6 +132,7 @@ class GemlitePackedLayout(Layout):
     group_size: Optional[int] = 128
     bit_width: int = 4
     packing_bitwidth: Optional[int] = None
+    mode: Optional[str] = "weight_only"
 
 
 @register_layout(GemlitePackedLayout)
@@ -202,13 +209,24 @@ def from_plain(
         group_size, bit_width = _layout.group_size, _layout.bit_width
         out_features, in_features = int_data.shape
         packing_bitwidth = _layout.packing_bitwidth
+        mode = _layout.mode
 
         if bit_width == 8 and group_size == in_features:
-            gemlite_linear = gemlite.helper.A16W8(device=int_data.device).from_weights(
+            processor = (
+                gemlite.helper.A8W8_int8_dynamic
+                if mode == "dynamic"
+                else gemlite.helper.A16W8
+            )
+            gemlite_linear = processor(device=int_data.device).from_weights(
                 int_data, scales=scale, bias=None
             )
         else:
-            gemlite_linear = gemlite.helper.A16Wn(
+            processor = (
+                gemlite.helper.A8Wn_dynamic
+                if mode == "dynamic"
+                else gemlite.helper.A16Wn
+            )
+            gemlite_linear = processor(
                 device=int_data.device, packing_bitwidth=packing_bitwidth
             ).from_weights(
                 int_data, scale, zero_point, bit_width, group_size, bias=None
diff --git a/torchao/quantization/autoquant.py b/torchao/quantization/autoquant.py
index 998204c8fe..6f0aac947a 100644
--- a/torchao/quantization/autoquant.py
+++ b/torchao/quantization/autoquant.py
@@ -742,10 +742,16 @@ def from_float(cls, weight):
 
         bit_width = 4
         packing_bitwidth = None
+        mode = "weight_only"
         use_hqq = True
 
         aqt_kwargs = get_gemlite_aqt_kwargs(
-            weight, cls.group_size, bit_width, packing_bitwidth, use_hqq
+            weight,
+            group_size=cls.group_size,
+            bit_width=bit_width,
+            packing_bitwidth=packing_bitwidth,
+            mode=mode,
+            use_hqq=use_hqq,
         )
         weight = to_affine_quantized_intx(weight, **aqt_kwargs)
         input_quant_func = _to_float16
diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index d8af23414b..7b40f388ed 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -986,13 +986,14 @@ class GemliteUIntXWeightOnlyConfig(AOBaseConfig):
          size is more fine grained
         `bit_width`: bit width of the quantized weight.
         `packing_bitwidth`: bit width of the packed weight, should be 8 or 32. Can have performance impacts depending on hardware.
-        `contiguous`: if set, the weight will be packed as specified. Leaving it as None lets gemlite determine the best choice.
+        `mode`: if set to "dynamic", activations are quantized at runtime; default is "weight_only" (weight-only quantization).
         `set_inductor_config`: if True, adjusts `torchinductor` settings to recommended values.
     """
 
     group_size: Optional[int] = 128
     bit_width: int = 4
     packing_bitwidth: Optional[int] = None
+    mode: Optional[str] = "weight_only"
     set_inductor_config: bool = True
 
 
@@ -1007,6 +1008,7 @@ def _gemlite_uintx_weight_only_transform(
     group_size = config.group_size
     bit_width = config.bit_width
     packing_bitwidth = config.packing_bitwidth
+    mode = config.mode
     if config.set_inductor_config:
         torchao.quantization.utils.recommended_inductor_config_setter()
 
@@ -1018,7 +1020,12 @@ def _gemlite_uintx_weight_only_transform(
     new_weight = to_affine_quantized_intx(
         weight,
         **get_gemlite_aqt_kwargs(
-            weight, group_size, bit_width, packing_bitwidth, use_hqq
+            weight,
+            group_size=group_size,
+            bit_width=bit_width,
+            packing_bitwidth=packing_bitwidth,
+            mode=mode,
+            use_hqq=use_hqq,
         ),
     )
     module.weight = torch.nn.Parameter(new_weight, requires_grad=False)

From 01b43cba283daf8829fe89e0146a83d5e25fda79 Mon Sep 17 00:00:00 2001
From: Jesse Cai <jessecai@meta.com>
Date: Fri, 13 Jun 2025 13:50:51 -0400
Subject: [PATCH 117/165] [ci] fix pt2e x86 unit tests (#2371)

fix pt2e x86 unit tests

Summary:

It looks like this
[change](https://github.com/pytorch/pytorch/commit/61e13782ddddf9e957c984ef11d7bb7643b871e7#diff-40b3d6cc2026cae8f139b15c4b0b05fd2e69c2715be0ce15648de79b0e15a4eb) in core was made and the corresponding test change was not duplicated here.

To unbreak CI, I copied over the test changes from the core PR, but I
this just skips the test, a proper fix is still needed.

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:
---
 test/quantization/pt2e/test_x86inductor_fusion.py | 11 +++++++----
 1 file changed, 7 insertions(+), 4 deletions(-)

diff --git a/test/quantization/pt2e/test_x86inductor_fusion.py b/test/quantization/pt2e/test_x86inductor_fusion.py
index fdf217366d..ffaa4573d8 100644
--- a/test/quantization/pt2e/test_x86inductor_fusion.py
+++ b/test/quantization/pt2e/test_x86inductor_fusion.py
@@ -2307,10 +2307,13 @@ def matcher_check_fn():
                 nodes_count = 10 if has_bias else 7
             else:
                 nodes_count = 7 if has_bias else 6
-            self.assertEqual(
-                counters["inductor"]["qlinear_weight_prepack_matcher_nodes"],
-                nodes_count,
-            )
+            if counters["inductor"]["removed_pointless_view_pair"] == 0:
+                # Removing pointless view pairs affect how the pattern
+                # for this test is matched.
+                self.assertEqual(
+                    counters["inductor"]["qlinear_weight_prepack_matcher_nodes"],
+                    nodes_count,
+                )
 
         self._test_common(
             mod,

From 6243040807b9ceee889a58cba8e68c5fc4e2ebd8 Mon Sep 17 00:00:00 2001
From: Zeyu Song <87307087+szyszyzys@users.noreply.github.com>
Date: Fri, 13 Jun 2025 14:51:21 -0400
Subject: [PATCH 118/165] Add test case generator for groupwise low bit LUT
 based quantization (#2359)

* Add test case generator for groupwise low bit LUT based quantization kernel

* Add granularity to LUT and scale generation in test cases

* Update LUT test case generation. scale_group_size and lut_group_size control the frequency of group change.

* Add has_scales tag to the LUT test case generation
---
 .../kernels/cpu/aarch64/tests/test_utils.h    | 186 ++++++++++++++++++
 1 file changed, 186 insertions(+)

diff --git a/torchao/experimental/kernels/cpu/aarch64/tests/test_utils.h b/torchao/experimental/kernels/cpu/aarch64/tests/test_utils.h
index 4f96f8bf96..aeb9042210 100644
--- a/torchao/experimental/kernels/cpu/aarch64/tests/test_utils.h
+++ b/torchao/experimental/kernels/cpu/aarch64/tests/test_utils.h
@@ -575,6 +575,192 @@ struct lowbit_embedding_test_case {
   }
 };
 
+struct groupwise_lowbit_weight_lut_test_case {
+  //--------------------------------------------------------------------------
+  // Parameters
+  //--------------------------------------------------------------------------
+  int m, k, n;
+  int scale_group_size;
+  int lut_group_size;
+  int weight_nbit;
+  bool has_scales, has_bias, has_clamp;
+  float clamp_min, clamp_max;
+
+  //--------------------------------------------------------------------------
+  // Data Tensors
+  //--------------------------------------------------------------------------
+  std::vector<float>   expected_output;
+  std::vector<float>   activations;
+  std::vector<float>   bias;
+  std::vector<uint8_t> weight_qval_indices;        // Indices into a LUT for each weight
+  std::vector<float>   weight_luts;         // The pool of unique LUTs
+  std::vector<float>   weight_scales;       // The pool of unique scales
+
+  //--------------------------------------------------------------------------
+  // Constructor
+  //--------------------------------------------------------------------------
+  groupwise_lowbit_weight_lut_test_case(
+      int m_, int k_, int n_, int scale_group_size_, int lut_group_size_, int weight_nbit_, bool has_scales_, bool has_bias_, bool has_clamp_,
+      float clamp_min_, float clamp_max_,
+      std::vector<float> expected_output_, std::vector<float> activations_,
+      std::vector<float> bias_, std::vector<uint8_t> weight_qval_indices_,
+      std::vector<float> weight_luts_, std::vector<float> weight_scales_)
+      : m(m_), k(k_), n(n_),
+        scale_group_size(scale_group_size_), lut_group_size(lut_group_size_), weight_nbit(weight_nbit_),
+        has_scales(has_scales_),
+        has_bias(has_bias_), has_clamp(has_clamp_), clamp_min(clamp_min_), clamp_max(clamp_max_),
+        expected_output(expected_output_),
+        activations(activations_),
+        bias(bias_),
+        weight_qval_indices(weight_qval_indices_),
+        weight_luts(weight_luts_),
+        weight_scales(weight_scales_)
+  {}
+
+  //--------------------------------------------------------------------------
+  // Generator Functions (Factories)
+  //--------------------------------------------------------------------------
+
+private:
+  /**
+   * @brief The private "master" generator that provides maximum flexibility.
+   *
+   * This function is the core engine. It takes the exact number of scales and LUTs
+   * to generate and constructs the test case. All other public generators are
+   * wrappers around this one.
+   */
+  static groupwise_lowbit_weight_lut_test_case _generate_master(
+    int m, int k, int n,
+    int scale_group_size, // Directly controls scale change frequency
+    int lut_group_size,   // Directly controls LUT change frequency
+    int weight_nbit, bool has_scales,
+    bool has_bias, bool has_clamp) {
+
+    // --- 0. Validation and Setup ---
+    const int total_weights = n * k;
+    // Frequencies are controlled by their group sizes.
+    assert(total_weights % scale_group_size == 0);
+    assert(total_weights % lut_group_size == 0);
+
+    // The number of unique scales/LUTs is derived directly from their group size.
+    const int num_scales = total_weights / scale_group_size;
+    const int num_luts = total_weights / lut_group_size;
+    const int lut_size = 1 << weight_nbit;
+    std::mt19937 gen(std::random_device{}());
+
+    // --- 1. Generate Primary Inputs ---
+    auto activations = get_random_vector(m * k, -1.0f, 1.0f);
+    std::vector<float> bias_vec(n, 0.0f);
+    if (has_bias) bias_vec = get_random_vector(n, -0.5f, 0.5f);
+    float clamp_min = -std::numeric_limits<float>::infinity(), clamp_max = std::numeric_limits<float>::infinity();
+    if (has_clamp) {
+      auto r = get_random_vector(2, -5.0f, 5.0f);
+      clamp_min = std::min(r[0], r[1]); clamp_max = std::max(r[0], r[1]);
+    }
+
+    // --- 2. Generate Quantization Data ---
+    // 2a. Generate the pools of unique scales and LUTs.
+    std::vector<float> weight_scales;
+    if (has_scales) {
+        // Normal case: generate random scales.
+        weight_scales = get_random_vector(num_scales, 0.001f, 0.1f);
+    } else {
+        // LUT-only case: create a vector where every scale is 1.0f.
+        weight_scales.assign(num_scales, 1.0f);
+    }
+
+    auto weight_luts = get_random_vector(num_luts * lut_size, -0.2f, 0.2f); // Independent random LUTs
+
+    // 2b. Generate random quantized indices for each weight.
+    auto weight_qval_indices = std::vector<uint8_t>(total_weights);
+    std::uniform_int_distribution<int> qval_dis(0, lut_size - 1);
+    for (int i = 0; i < total_weights; ++i) weight_qval_indices[i] = static_cast<uint8_t>(qval_dis(gen));
+
+  // --- 3. Compute Expected Output using the IMPLICIT mappings ---
+  std::vector<float> expected_output(m * n);
+  for (int m_idx = 0; m_idx < m; ++m_idx) {
+    for (int n_idx = 0; n_idx < n; ++n_idx) {
+      float res = 0.0f;
+      for (int k_idx = 0; k_idx < k; ++k_idx) {
+        float activation_val = activations[m_idx * k + k_idx];
+        int weight_idx = n_idx * k + k_idx;
+        uint8_t qval_idx = weight_qval_indices[weight_idx];
+
+        int32_t scale_idx = weight_idx / scale_group_size;
+        int32_t lut_idx   = weight_idx / lut_group_size;
+
+        // Dequantize: scale * LUT_value
+        float scale = weight_scales[scale_idx];
+        float lut_val = weight_luts[lut_idx * lut_size + qval_idx];
+        res += activation_val * (scale * lut_val);
+      }
+      res += bias_vec[n_idx];
+      if (has_clamp) { res = std::clamp(res, clamp_min, clamp_max); }
+      expected_output[m_idx * n + n_idx] = res;
+    }
+  }
+
+  // --- 4. Construct and Return ---
+  return groupwise_lowbit_weight_lut_test_case(
+    m, k, n, scale_group_size, lut_group_size, weight_nbit, has_scales,
+    has_bias, has_clamp, clamp_min, clamp_max,
+    expected_output,
+    activations,
+    bias_vec,
+    weight_qval_indices,
+    weight_luts,
+    weight_scales);
+
+  }
+
+public:
+  /**
+   * @brief OVERLOAD 1: Simple generator where scales and LUTs share the same grouping.
+   *
+   * This is for the simplest case where a block of weights gets one scale and one LUT,
+   * and this pattern repeats.
+   */
+  static groupwise_lowbit_weight_lut_test_case generate_per_group(
+    int m, int k, int n,
+    int group_size, // The size of the block for both scales and LUTs
+    int weight_nbit, bool has_scales,
+    bool has_bias, bool has_clamp) {
+
+    std::cout << "[Generator Info] Using 'Per-Group' model.\n"
+              << "  - Both scales and LUTs will switch every " << group_size << " weights." << std::endl;
+
+    // Just call the decoupled generator with the same group size for both.
+    return _generate_master(
+      m, k, n,
+      group_size, /* scale_group_size */
+      group_size, /* lut_group_size */
+      weight_nbit,
+      has_scales,
+      has_bias, has_clamp
+    );
+  }
+
+  /**
+   * @brief OVERLOAD 2: Advanced generator with separate grouping for scales and LUTs.
+   */
+  static groupwise_lowbit_weight_lut_test_case generate_with_decoupled_grouping(
+    int m, int k, int n,
+    int scale_group_size, int lut_group_size, int weight_nbit, bool has_scales,
+    bool has_bias, bool has_clamp) {
+
+    std::cout << "[Generator Info] Using 'Decoupled Grouping' model.\n"
+              << "  - Scales will switch every " << scale_group_size << " weights.\n"
+              << "  - LUTs will switch every " << lut_group_size << " weights." << std::endl;
+
+    return _generate_master(
+        m, k, n,
+        scale_group_size, lut_group_size,
+        weight_nbit, has_scales,
+        has_bias, has_clamp
+    );
+  }
+};
+
 } // namespace torchao
 
 #endif // defined(__aarch64__) || defined(__ARM_NEON)

From 7ffce593ca597744a7613ccdf23d999f61cd0558 Mon Sep 17 00:00:00 2001
From: andrewor14 <andrewor14@gmail.com>
Date: Mon, 16 Jun 2025 10:19:10 -0400
Subject: [PATCH 119/165] [docs] Replace deprecated configs with Config objects
 (#2375)

**Summary:** We still mention old, deprecated "configs" like
`int4_weight_only` in many user-facing docs. This commit replaces
these occurrences with the actual corresponding config objects.

**Test Plan:**
```
git grep int4_weight_only
git grep int8_dynamic_activation_
git grep quantize_
git grep sparsify_
```
---
 docs/source/api_ref_sparsity.rst |  1 -
 docs/source/quantization.rst     | 10 +++++-----
 docs/source/quick_start.rst      |  4 ++--
 docs/source/serialization.rst    |  6 +++---
 scripts/quick_start.py           |  4 ++--
 torchao/quantization/README.md   |  6 +++---
 torchao/sparsity/README.md       |  8 ++++----
 7 files changed, 19 insertions(+), 20 deletions(-)

diff --git a/docs/source/api_ref_sparsity.rst b/docs/source/api_ref_sparsity.rst
index 96b33af082..9fc6644683 100644
--- a/docs/source/api_ref_sparsity.rst
+++ b/docs/source/api_ref_sparsity.rst
@@ -12,7 +12,6 @@ torchao.sparsity
 
     sparsify_
     semi_sparse_weight
-    int8_dynamic_activation_int8_semi_sparse_weight
     apply_fake_sparsity
     WandaSparsifier
     PerChannelNormObserver
diff --git a/docs/source/quantization.rst b/docs/source/quantization.rst
index 958325280b..929bc1d00c 100644
--- a/docs/source/quantization.rst
+++ b/docs/source/quantization.rst
@@ -12,7 +12,7 @@ First we want to lay out the torchao stack::
               Basic dtypes: uint1-uint7, int1-int8, float3-float8
 
 
-Any quantization algorithm will be using some components from the above stack, for example int4_weight_only quantization uses:
+Any quantization algorithm will be using some components from the above stack, for example int4 weight-only quantization uses:
 (1) weight only quantization flow
 (2) `tinygemm bf16 activation + int4 weight kernel <https://github.com/pytorch/pytorch/blob/136e28f616140fdc9fb78bb0390aeba16791f1e3/aten/src/ATen/native/native_functions.yaml#L4148>`__ and `quant primitive ops <https://github.com/pytorch/ao/blob/main/torchao/quantization/quant_primitives.py>`__
 (3) `AffineQuantizedTensor <https://github.com/pytorch/ao/blob/main/torchao/dtypes/affine_quantized_tensor.py>`__ tensor subclass with `TensorCoreTiledLayout <https://github.com/pytorch/ao/blob/e41ca4ee41f5f1fe16c59e00cffb4dd33d25e56d/torchao/dtypes/affine_quantized_tensor.py#L573>`__
@@ -201,7 +201,7 @@ Case Study: How int4 weight only quantization works in torchao?
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 To connect everything together, here is a more detailed walk through for how int4 weight only quantization is implemented in torchao.
 
-Quantization Flow: quantize_(model, int4_weight_only())
+Quantization Flow: quantize_(model, Int4WeightOnlyConfig())
     * What happens: linear.weight = torch.nn.Parameter(to_affine_quantized_intx(linear.weight), requires_grad=False)
     * quantization primitive ops: choose_qparams and quantize_affine are called to quantize the Tensor
     * quantized Tensor will be `AffineQuantizedTensor`, a quantized tensor with derived dtype (e.g. int4 with scale and zero_point)
@@ -212,10 +212,10 @@ During Model Execution: model(input)
 
 During Quantization
 ###################
-First we start with the API call: ``quantize_(model, int4_weight_only())`` what this does is it converts the weights of nn.Linear modules in the model to int4 quantized tensor (``AffineQuantizedTensor`` that is int4 dtype, asymmetric, per group quantized), using the layout for tinygemm kernel: ``tensor_core_tiled`` layout.
+First we start with the API call: ``quantize_(model, Int4WeightOnlyConfig())`` what this does is it converts the weights of nn.Linear modules in the model to int4 quantized tensor (``AffineQuantizedTensor`` that is int4 dtype, asymmetric, per group quantized), using the layout for tinygemm kernel: ``tensor_core_tiled`` layout.
 
-* `quantize_ <https://github.com/pytorch/ao/blob/4865ee61340cc63a1469f437388067b853c9289e/torchao/quantization/quant_api.py#L403>`__: the model level API that quantizes the weight of linear by applying the conversion function from user (second argument)
-* `int4_weight_only <https://github.com/pytorch/ao/blob/242f181fe59e233b458740b06464ad42da8df6af/torchao/quantization/quant_api.py#L522>`__: the function that returns a function that converts weight of linear to int4 weight only quantized weight
+* `quantize_ <https://docs.pytorch.org/ao/main/generated/torchao.quantization.quantize_.html#torchao.quantization.quantize_>`__: the model level API that quantizes the weight of linear by applying the conversion function from user (second argument)
+* `Int4WeightOnlyConfig <https://docs.pytorch.org/ao/main/generated/torchao.quantization.Int4WeightOnlyConfig.html#torchao.quantization.Int4WeightOnlyConfig>`__: the function that returns a function that converts weight of linear to int4 weight only quantized weight
   * Calls quantization primitives ops like choose_qparams_affine and quantize_affine to quantize the Tensor
 * `TensorCoreTiledLayout <https://github.com/pytorch/ao/blob/242f181fe59e233b458740b06464ad42da8df6af/torchao/dtypes/affine_quantized_tensor.py#L573>`__: the tensor core tiled layout type, storing parameters for the packing format
 * `TensorCoreTiledAQTTensorImpl <https://github.com/pytorch/ao/blob/242f181fe59e233b458740b06464ad42da8df6af/torchao/dtypes/affine_quantized_tensor.py#L1376>`__: the tensor core tiled TensorImpl, stores the packed weight for efficient int4 weight only kernel (tinygemm kernel)
diff --git a/docs/source/quick_start.rst b/docs/source/quick_start.rst
index fea8bb912d..f92d960c45 100644
--- a/docs/source/quick_start.rst
+++ b/docs/source/quick_start.rst
@@ -56,8 +56,8 @@ for efficient mixed dtype matrix multiplication:
 .. code:: py
 
   # torch 2.4+ only
-  from torchao.quantization import int4_weight_only, quantize_
-  quantize_(model, int4_weight_only(group_size=32))
+  from torchao.quantization import Int4WeightOnlyConfig, quantize_
+  quantize_(model, Int4WeightOnlyConfig(group_size=32))
 
 The quantized model is now ready to use! Note that the quantization
 logic is inserted through tensor subclasses, so there is no change
diff --git a/docs/source/serialization.rst b/docs/source/serialization.rst
index 7cf80aec11..5e0c42f901 100644
--- a/docs/source/serialization.rst
+++ b/docs/source/serialization.rst
@@ -14,7 +14,7 @@ Here is the serialization and deserialization flow::
   from torchao.utils import get_model_size_in_bytes
   from torchao.quantization.quant_api import (
       quantize_,
-      int4_weight_only,
+      Int4WeightOnlyConfig,
   )
 
   class ToyLinearModel(torch.nn.Module):
@@ -36,7 +36,7 @@ Here is the serialization and deserialization flow::
   print(f"original model size: {get_model_size_in_bytes(m) / 1024 / 1024} MB")
 
   example_inputs = m.example_inputs(dtype=dtype, device="cuda")
-  quantize_(m, int4_weight_only())
+  quantize_(m, Int4WeightOnlyConfig())
   print(f"quantized model size: {get_model_size_in_bytes(m) / 1024 / 1024} MB")
 
   ref = m(*example_inputs)
@@ -70,7 +70,7 @@ quantized model ``state_dict``::
   {"linear1.weight": quantized_weight1, "linear2.weight": quantized_weight2, ...}
 
 
-The size of the quantized model is typically going to be smaller to the original floating point model, but it also depends on the specific techinque and implementation you are using. You can print the model size with ``torchao.utils.get_model_size_in_bytes`` utility function, specifically for the above example using int4_weight_only quantization, we can see the size reduction is around 4x::
+The size of the quantized model is typically going to be smaller to the original floating point model, but it also depends on the specific techinque and implementation you are using. You can print the model size with ``torchao.utils.get_model_size_in_bytes`` utility function, specifically for the above example using Int4WeightOnlyConfig quantization, we can see the size reduction is around 4x::
 
   original model size: 4.0 MB
   quantized model size: 1.0625 MB
diff --git a/scripts/quick_start.py b/scripts/quick_start.py
index 747dedcf95..55c17a8684 100644
--- a/scripts/quick_start.py
+++ b/scripts/quick_start.py
@@ -7,7 +7,7 @@
 
 import torch
 
-from torchao.quantization import int4_weight_only, quantize_
+from torchao.quantization import Int4WeightOnlyConfig, quantize_
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
     benchmark_model,
@@ -43,7 +43,7 @@ def forward(self, x):
 # ========================
 
 # torch 2.4+ only
-quantize_(model, int4_weight_only(group_size=32))
+quantize_(model, Int4WeightOnlyConfig(group_size=32))
 
 
 # =============
diff --git a/torchao/quantization/README.md b/torchao/quantization/README.md
index 90f83661aa..83caffdc09 100644
--- a/torchao/quantization/README.md
+++ b/torchao/quantization/README.md
@@ -381,7 +381,7 @@ We're trying to develop kernels for low bit quantization for intx quantization f
 
 You try can out these apis with the `quantize_` api as above alongside the config `UIntXWeightOnlyConfig`. An example can be found in  in `torchao/_models/llama/generate.py`.
 
-### int8_dynamic_activation_intx_weight Quantization
+### Int8DynamicActivationIntxWeightConfig Quantization
 We have kernels that do 8-bit dynamic quantization of activations and uintx groupwise quantization of weights.  These kernels are experimental and can only be run on a device with an ARM CPU (e.g., a Mac computers with Apple silicon).  The benchmarks below were run on an M1 Mac Pro, with 8 perf cores, and 2 efficiency cores, and 32GB of RAM.  In all cases, torch.compile was used.
 
 | Model         | Technique                                        | Tokens/Second | Memory Bandwidth (GB/s) | Peak Memory (GB) | Model Size (GB) |
@@ -390,7 +390,7 @@ We have kernels that do 8-bit dynamic quantization of activations and uintx grou
 |               | int8_dynamic_activation_intx_weight-4-256-false  |  16.03        |  65.81                  |  NA              | 4.11            |
 |               | int8_dynamic_activation_intx_weight-3-256-false  |  18.94        |  59.97                  |  NA              | 3.17            |
 
-You can try out these apis with the `quantize_` api as above alongside the constructor `int8_dynamic_activation_intx_weight`.  An example can be found in `torchao/_models/llama/generate.py`.
+You can try out these apis with the `quantize_` api as above alongside the config `Int8DynamicActivationIntxWeightConfig`.  An example can be found in `torchao/_models/llama/generate.py`.
 
 ### Codebook Quantization
 The benchmarks below were run on a single NVIDIA-A6000 GPU.
@@ -402,7 +402,7 @@ The benchmarks below were run on a single NVIDIA-A6000 GPU.
 | Llama-3.1-8B| Base (bfloat16)         |  7.713              |  32.16        |  482.70                 | 16.35            | 15.01           |
 |             | codebook-4-64           |  10.095             |  1.73         |  8.63                   | 23.11            |  4.98           |
 
-You try can out these apis with the `quantize_` api as above alongside the constructor `codebook_weight_only` an example can be found in  in `torchao/_models/llama/generate.py`.
+You try can out these apis with the `quantize_` api as above alongside the config `CodebookWeightOnlyConfig` an example can be found in  in `torchao/_models/llama/generate.py`.
 
 ### GPTQ Quantization
 We have a GPTQ quantization workflow that can be used to quantize a model to int4. More details can be found in [GPTQ](./GPTQ/README.md),
diff --git a/torchao/sparsity/README.md b/torchao/sparsity/README.md
index 4d894461ce..6971bcc84b 100644
--- a/torchao/sparsity/README.md
+++ b/torchao/sparsity/README.md
@@ -52,12 +52,12 @@ These benchmarks were also ran on a NVIDIA-A100-80GB.
 Sparse-Marlin 2:4 is an optimized GPU kernel that extends the Mixed Auto-Regressive Linear (Marlin) dense kernel to support 4-bit quantized weights and 2:4 sparsity, improving performance in matrix multiplication and accumulation. Full documentation can be found [here](https://github.com/IST-DASLab/Sparse-Marlin).
 
 ```py
-from torchao.quantization.quant_api import quantize_, int4_weight_only
+from torchao.quantization.quant_api import quantize_, Int4WeightOnlyConfig
 from torchao.dtypes import MarlinSparseLayout
 
 # Your FP16 model
 model = model.cuda().half()
-quantize_(model, int4_weight_only(layout=MarlinSparseLayout()))
+quantize_(model, Int4WeightOnlyConfig(layout=MarlinSparseLayout()))
 ```
 
 Note the existing API results in an extremely high accuracy degredation and is intended to be used in concert with an already sparsified+finetuned checkpoint where possible until we develop
@@ -68,11 +68,11 @@ the necessary supporting flows in torchao.
 We support composing int8 dynaic quantization with 2:4 sparsity. We fuse one of the scalar dequant multiplications into our cuSPARSELt sparse mm in order to remain performant.
 
 ```py
-from torchao.quantization.quant_api import quantize_, int8_dynamic_activation_int8_weight
+from torchao.quantization.quant_api import quantize_, Int8DynamicActivationInt8WeightConfig
 from torchao.dtypes import SemiSparseLayout
 
 model = model.cuda()
-quantize_(model, int8_dynamic_activation_int8_weight(layout=SemiSparseLayout()))
+quantize_(model, Int8DynamicActivationInt8WeightConfig(layout=SemiSparseLayout()))
 ```
 
 ### 2:4 sparsity

From 5bdc25de924a660bd76cd723fe6682e8daa617fc Mon Sep 17 00:00:00 2001
From: Jesse Cai <jessecai@meta.com>
Date: Mon, 16 Jun 2025 11:34:47 -0400
Subject: [PATCH 120/165] Skip a couple tests to unbreak CI (#2382)

Skip a couple test to unbreak CI
---
 test/integration/test_integration.py | 1 +
 test/sparsity/test_sparse_api.py     | 1 +
 2 files changed, 2 insertions(+)

diff --git a/test/integration/test_integration.py b/test/integration/test_integration.py
index 654f8e47e1..e6a8341f09 100644
--- a/test/integration/test_integration.py
+++ b/test/integration/test_integration.py
@@ -953,6 +953,7 @@ def test_int4_weight_only_quant_subclass(self, device, dtype):
     @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_3, "int4 requires torch nightly.")
     # @unittest.skipIf(TORCH_VERSION_AT_LEAST_2_5, "int4 skipping 2.5+ for now")
     @skip_if_rocm("ROCm enablement in progress")
+    @unittest.skip("Skip to fix CI until we deprecate these APIs long term")
     def test_int4_weight_only_quant_subclass_grouped(self, device, dtype):
         if dtype != torch.bfloat16:
             self.skipTest(f"Fails for {dtype}")
diff --git a/test/sparsity/test_sparse_api.py b/test/sparsity/test_sparse_api.py
index f0dd31fdfc..5e3086c411 100644
--- a/test/sparsity/test_sparse_api.py
+++ b/test/sparsity/test_sparse_api.py
@@ -62,6 +62,7 @@ class TestQuantSemiSparse(common_utils.TestCase):
     @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_5, "pytorch 2.5+ feature")
     @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
     @common_utils.parametrize("compile", [False])
+    @unittest.skip("Temporarily skip to unbreak CI")
     def test_quant_semi_sparse(self, compile):
         if not torch.backends.cusparselt.is_available():
             self.skipTest("Need cuSPARSELt")

From 0a81ae8de356b1ffe2688797f9f1f3940f3ebd4f Mon Sep 17 00:00:00 2001
From: Jesse Cai <jessecai@meta.com>
Date: Mon, 16 Jun 2025 11:57:55 -0400
Subject: [PATCH 121/165] [sparse] remove superblock (#2381)

Removing superblock folder from prototype, as the superblock subclass and kernel have already previously been promoted out of prototype to torchao.sparsity.

All that remains are custom training loops which is no longer used as it's for ViTs and the current block sparse work we are investigating is for LLMs.
---
 .../prototype/sparsity/superblock/.gitignore  |   27 -
 .../prototype/sparsity/superblock/README.md   |   97 --
 .../prototype/sparsity/superblock/TRAINING.md |  368 -----
 .../prototype/sparsity/superblock/__init__.py |    0
 .../sparsity/superblock/benchmark.py          |  140 --
 .../sparsity/superblock/benchmark.sh          |   44 -
 .../sparsity/superblock/benchmark_results.txt |   30 -
 .../prototype/sparsity/superblock/evaluate.py |  104 --
 .../prototype/sparsity/superblock/evaluate.sh |   28 -
 .../superblock/evaluation_results.txt         |   19 -
 .../prototype/sparsity/superblock/train.py    |  542 -------
 .../prototype/sparsity/superblock/utils.py    | 1297 -----------------
 12 files changed, 2696 deletions(-)
 delete mode 100644 torchao/prototype/sparsity/superblock/.gitignore
 delete mode 100644 torchao/prototype/sparsity/superblock/README.md
 delete mode 100644 torchao/prototype/sparsity/superblock/TRAINING.md
 delete mode 100644 torchao/prototype/sparsity/superblock/__init__.py
 delete mode 100644 torchao/prototype/sparsity/superblock/benchmark.py
 delete mode 100644 torchao/prototype/sparsity/superblock/benchmark.sh
 delete mode 100644 torchao/prototype/sparsity/superblock/benchmark_results.txt
 delete mode 100644 torchao/prototype/sparsity/superblock/evaluate.py
 delete mode 100644 torchao/prototype/sparsity/superblock/evaluate.sh
 delete mode 100644 torchao/prototype/sparsity/superblock/evaluation_results.txt
 delete mode 100644 torchao/prototype/sparsity/superblock/train.py
 delete mode 100644 torchao/prototype/sparsity/superblock/utils.py

diff --git a/torchao/prototype/sparsity/superblock/.gitignore b/torchao/prototype/sparsity/superblock/.gitignore
deleted file mode 100644
index dd0446104b..0000000000
--- a/torchao/prototype/sparsity/superblock/.gitignore
+++ /dev/null
@@ -1,27 +0,0 @@
-*/*.pyc
-
-# Model checkpoints
-*.pth
-
-# Editor temporaries
-*.swa
-*.swb
-*.swc
-*.swd
-*.swe
-*.swf
-*.swg
-*.swh
-*.swi
-*.swj
-*.swk
-*.swl
-*.swm
-*.swn
-*.swo
-*.swp
-*~
-.~lock.*
-
-# macOS dir files
-.DS_Store
diff --git a/torchao/prototype/sparsity/superblock/README.md b/torchao/prototype/sparsity/superblock/README.md
deleted file mode 100644
index 6fea1a0e3a..0000000000
--- a/torchao/prototype/sparsity/superblock/README.md
+++ /dev/null
@@ -1,97 +0,0 @@
-# SuperBlock
-
-SuperBlock combines two techniques for efficient neural network training and inference: Supermask and Block Compressed Sparse Row (BSR).
-The techniques are described in this [blog post](https://pytorch.org/blog/speeding-up-vits/).
-
-### Supermask
-[Supermask](https://arxiv.org/abs/2207.00670) is a technique for applying structured sparsity to neural networks using a learned mask. It works by learning a continuous mask (scores) that is applied element-wise to the weights of a neural network layer. The mask scores are learned separately from the weights and are thresholded based on a target sparsity level to obtain a binary mask. The mask determines which weigths are kept and which are pruned, and is learned during training.
-
-During inference, the binary mask is applied element-wise to the weights, pruning the weights that correspond to a 0 in the mask, resulting in a sparse network that can be efficiently computed.
-
-### Block compressed Sparse Row Format (BSR)
-[The BSR format](https://pytorch.org/docs/main/sparse.html#sparse-bsr-tensor) is a sparse matrix representation that stores dense sub-blocks of non-zero elements instead of individual non-zero elements. The matrix is divided into equal-sized blocks, and only the non-zero blocks are stored.
-
-The BSR format is efficient for sparse matrices with a block structure, where non-zero elements tend to cluster in dense sub-blocks. It reduces storage requirements and enables efficient matrix operations on the non-zero blocks.
-
-Currently, the BSR format is optimized for Nvidia A100 GPU(s) only.
-
-## Setup
-To use SuperBlock, you will need
-* [PyTorch](https://pytorch.org/get-started/locally/)
-
-To train the model or evaluate accuracy, you will need:
-* ImageNet2012-blurred dataset
-
-At least one GPU:
-* A100 or H100
-
-## Installation
-* Clone this repo
-  ```
-  git clone https://github.com/pytorch-labs/superblock.git
-  cd superblock
-  ```
-* Create a new conda environment
-  ```
-  conda create -n superblock
-  conda activate superblock
-  ```
-* Install PyTorch. For best performance, we recommend the pytorch nightlies
-  ```
-  pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu121
-  ```
-  We ran our experiments with torch==2.6.0.dev20240924+cu121
-
-
-# Results
-
-### Benchmarking
-For all our benchmarking results, you can run `benchmark.sh`.
-These benchmarks were run on a NVIDIA-A100-80GB, with cuSPARSELt v0.5.2.
-
-
-### Evaluation
-
-To reproduce our accuracy results, you can run `evaluate.sh`
-You will need to set the following environment variables first to run the script:
-
-```
-IMAGENET_PATH=<put the path of ImageNet dataset here>
-NGPUS=1 # put number of available GPUS here
-```
-
-## Training
-Please refer to [TRAINING.md](TRAINING.md) for training from scratch. We use [Torchvision](https://github.com/pytorch/vision/tree/main/references/classification) as our framework for training. Supermask can be applied during training.
-
-For example, if you would like to train a `vit_b_16` from scratch using Supermask, you can use the respective torchvision command found in [TRAINING.md](TRAINING.md) and append the supermask arguments:
-```
-torchrun --nproc_per_node=8 train.py\
-    --model vit_h_14 --epochs 3 --batch-size 64 --opt adamw --lr 0.003 --wd 0.3\
-    --lr-scheduler cosineannealinglr --lr-warmup-method linear --lr-warmup-epochs 30\
-    --lr-warmup-decay 0.033 --amp --label-smoothing 0.11 --mixup-alpha 0.2 \
-    --clip-grad-norm 1 --cutmix-alpha 1.0 --model-ema\
-    --sparsity semi_structured --data-path $IMAGENET_PATH
-```
-Through this command, we are training a `vit_b_16` with 90% sparsity to linear layers using 32x32 tiles.
-
-Please run `python train.py --help` for a full list of available arguments.
-
-
-## Pretrained Weights
-
-### Download:
-Instead of training from scratch, if you'd like to use the Supermask weights of `vit_b_16` trained on privacy mitigated Imagenet-blurred, you can download them here:
-```
-SPARSITY=0.80 # Checkpoints available for: 0.70, 0.80, 0.82, 0.84, 0.86, 0.88, 0.90
-BLOCK_SIZE=32 # Checkpoints available for: 16, 32, 64
-```
-
-```
-mkdir checkpoints
-# For baseline,
-wget https://huggingface.co/facebook/superblock-vit-b-16/resolve/main/checkpoints/baseline.pth -P checkpoints/
-# For sparsified checkpoints,
-wget https://huggingface.co/facebook/superblock-vit-b-16/resolve/main/checkpoints/sp${SPARSITY}-ts${BLOCK_SIZE}.pth -P checkpoints/
-```
-## License
-SuperBlock is released under the [MIT license](https://github.com/pytorch-labs/superblock?tab=MIT-1-ov-file#readme).
diff --git a/torchao/prototype/sparsity/superblock/TRAINING.md b/torchao/prototype/sparsity/superblock/TRAINING.md
deleted file mode 100644
index 8fc82b6688..0000000000
--- a/torchao/prototype/sparsity/superblock/TRAINING.md
+++ /dev/null
@@ -1,368 +0,0 @@
-# Image classification reference training scripts
-
-This folder contains reference training scripts for image classification.
-They serve as a log of how to train specific models, as provide baseline
-training and evaluation scripts to quickly bootstrap research.
-
-Except otherwise noted, all models have been trained on 8x V100 GPUs with 
-the following parameters:
-
-| Parameter                | value  |
-| ------------------------ | ------ |
-| `--batch_size`           | `32`   |
-| `--epochs`               | `90`   |
-| `--lr`                   | `0.1`  |
-| `--momentum`             | `0.9`  |
-| `--wd`, `--weight-decay` | `1e-4` |
-| `--lr-step-size`         | `30`   |
-| `--lr-gamma`             | `0.1`  |
-
-### AlexNet and VGG
-
-Since `AlexNet` and the original `VGG` architectures do not include batch 
-normalization, the default initial learning rate `--lr 0.1` is too high.
-
-```
-torchrun --nproc_per_node=8 train.py\
-    --model $MODEL --lr 1e-2
-```
-
-Here `$MODEL` is one of `alexnet`, `vgg11`, `vgg13`, `vgg16` or `vgg19`. Note
-that `vgg11_bn`, `vgg13_bn`, `vgg16_bn`, and `vgg19_bn` include batch
-normalization and thus are trained with the default parameters.
-
-### GoogLeNet
-
-The weights of the GoogLeNet model are ported from the original paper rather than trained from scratch.
-
-### Inception V3
-
-The weights of the Inception V3 model are ported from the original paper rather than trained from scratch.
-
-Since it expects tensors with a size of N x 3 x 299 x 299, to validate the model use the following command:
-
-```
-torchrun --nproc_per_node=8 train.py --model inception_v3\
-      --test-only --weights Inception_V3_Weights.IMAGENET1K_V1
-```
-
-### ResNet
-```
-torchrun --nproc_per_node=8 train.py --model $MODEL
-```
-
-Here `$MODEL` is one of `resnet18`, `resnet34`, `resnet50`, `resnet101` or `resnet152`.
-
-### ResNext
-```
-torchrun --nproc_per_node=8 train.py\
-    --model $MODEL --epochs 100
-```
-
-Here `$MODEL` is one of `resnext50_32x4d` or `resnext101_32x8d`.
-Note that the above command corresponds to a single node with 8 GPUs. If you use
-a different number of GPUs and/or a different batch size, then the learning rate
-should be scaled accordingly. For example, the pretrained model provided by
-`torchvision` was trained on 8 nodes, each with 8 GPUs (for a total of 64 GPUs),
-with `--batch_size 16` and `--lr 0.4`, instead of the current defaults
-which are respectively batch_size=32 and lr=0.1
-
-### MobileNetV2
-```
-torchrun --nproc_per_node=8 train.py\
-     --model mobilenet_v2 --epochs 300 --lr 0.045 --wd 0.00004\
-     --lr-step-size 1 --lr-gamma 0.98
-```
-
-
-### MobileNetV3 Large & Small
-```
-torchrun --nproc_per_node=8 train.py\
-     --model $MODEL --epochs 600 --opt rmsprop --batch-size 128 --lr 0.064\ 
-     --wd 0.00001 --lr-step-size 2 --lr-gamma 0.973 --auto-augment imagenet --random-erase 0.2
-```
-
-Here `$MODEL` is one of `mobilenet_v3_large` or `mobilenet_v3_small`.
-
-Then we averaged the parameters of the last 3 checkpoints that improved the Acc@1. See [#3182](https://github.com/pytorch/vision/pull/3182) 
-and [#3354](https://github.com/pytorch/vision/pull/3354) for details.
-
-
-### EfficientNet-V1
-
-The weights of the B0-B4 variants are ported from Ross Wightman's [timm repo](https://github.com/rwightman/pytorch-image-models/blob/01cb46a9a50e3ba4be167965b5764e9702f09b30/timm/models/efficientnet.py#L95-L108).
-
-The weights of the B5-B7 variants are ported from Luke Melas' [EfficientNet-PyTorch repo](https://github.com/lukemelas/EfficientNet-PyTorch/blob/1039e009545d9329ea026c9f7541341439712b96/efficientnet_pytorch/utils.py#L562-L564).
-
-All models were trained using Bicubic interpolation and each have custom crop and resize sizes. To validate the models use the following commands:
-```
-torchrun --nproc_per_node=8 train.py --model efficientnet_b0 --test-only --weights EfficientNet_B0_Weights.IMAGENET1K_V1
-torchrun --nproc_per_node=8 train.py --model efficientnet_b1 --test-only --weights EfficientNet_B1_Weights.IMAGENET1K_V1
-torchrun --nproc_per_node=8 train.py --model efficientnet_b2 --test-only --weights EfficientNet_B2_Weights.IMAGENET1K_V1
-torchrun --nproc_per_node=8 train.py --model efficientnet_b3 --test-only --weights EfficientNet_B3_Weights.IMAGENET1K_V1
-torchrun --nproc_per_node=8 train.py --model efficientnet_b4 --test-only --weights EfficientNet_B4_Weights.IMAGENET1K_V1
-torchrun --nproc_per_node=8 train.py --model efficientnet_b5 --test-only --weights EfficientNet_B5_Weights.IMAGENET1K_V1
-torchrun --nproc_per_node=8 train.py --model efficientnet_b6 --test-only --weights EfficientNet_B6_Weights.IMAGENET1K_V1
-torchrun --nproc_per_node=8 train.py --model efficientnet_b7 --test-only --weights EfficientNet_B7_Weights.IMAGENET1K_V1
-```
-
-
-### EfficientNet-V2
-```
-torchrun --nproc_per_node=8 train.py \
---model $MODEL --batch-size 128 --lr 0.5 --lr-scheduler cosineannealinglr \
---lr-warmup-epochs 5 --lr-warmup-method linear --auto-augment ta_wide --epochs 600 --random-erase 0.1 \
---label-smoothing 0.1 --mixup-alpha 0.2 --cutmix-alpha 1.0 --weight-decay 0.00002 --norm-weight-decay 0.0 \
---train-crop-size $TRAIN_SIZE --model-ema --val-crop-size $EVAL_SIZE --val-resize-size $EVAL_SIZE \
---ra-sampler --ra-reps 4
-```
-Here `$MODEL` is one of `efficientnet_v2_s` and `efficientnet_v2_m`. 
-Note that the Small variant had a `$TRAIN_SIZE` of `300` and a `$EVAL_SIZE` of `384`, while the Medium `384` and `480` respectively.
-
-Note that the above command corresponds to training on a single node with 8 GPUs.
-For generatring the pre-trained weights, we trained with 4 nodes, each with 8 GPUs (for a total of 32 GPUs),
-and `--batch_size 32`.
-
-The weights of the Large variant are ported from the original paper rather than trained from scratch. See the `EfficientNet_V2_L_Weights` entry for their exact preprocessing transforms.
-
-
-### RegNet
-
-#### Small models
-```
-torchrun --nproc_per_node=8 train.py\
-     --model $MODEL --epochs 100 --batch-size 128 --wd 0.00005 --lr=0.8\
-     --lr-scheduler=cosineannealinglr --lr-warmup-method=linear\
-     --lr-warmup-epochs=5 --lr-warmup-decay=0.1
-```
-Here `$MODEL` is one of `regnet_x_400mf`, `regnet_x_800mf`, `regnet_x_1_6gf`, `regnet_y_400mf`, `regnet_y_800mf` and `regnet_y_1_6gf`. Please note we used learning rate 0.4 for `regent_y_400mf` to get the same Acc@1 as [the paper)(https://arxiv.org/abs/2003.13678).
-
-#### Medium models
-```
-torchrun --nproc_per_node=8 train.py\
-     --model $MODEL --epochs 100 --batch-size 64 --wd 0.00005 --lr=0.4\
-     --lr-scheduler=cosineannealinglr --lr-warmup-method=linear\
-     --lr-warmup-epochs=5 --lr-warmup-decay=0.1
-```
-Here `$MODEL` is one of `regnet_x_3_2gf`, `regnet_x_8gf`, `regnet_x_16gf`, `regnet_y_3_2gf` and `regnet_y_8gf`.
-
-#### Large models
-```
-torchrun --nproc_per_node=8 train.py\
-     --model $MODEL --epochs 100 --batch-size 32 --wd 0.00005 --lr=0.2\
-     --lr-scheduler=cosineannealinglr --lr-warmup-method=linear\
-     --lr-warmup-epochs=5 --lr-warmup-decay=0.1
-```
-Here `$MODEL` is one of `regnet_x_32gf`, `regnet_y_16gf` and `regnet_y_32gf`.
-
-### Vision Transformer
-
-#### vit_b_16
-```
-torchrun --nproc_per_node=8 train.py\
-    --model vit_b_16 --epochs 300 --batch-size 512 --opt adamw --lr 0.003 --wd 0.3\
-    --lr-scheduler cosineannealinglr --lr-warmup-method linear --lr-warmup-epochs 30\
-    --lr-warmup-decay 0.033 --amp --label-smoothing 0.11 --mixup-alpha 0.2 --auto-augment ra\
-    --clip-grad-norm 1 --ra-sampler --cutmix-alpha 1.0 --model-ema
-```
-
-Note that the above command corresponds to training on a single node with 8 GPUs.
-For generatring the pre-trained weights, we trained with 8 nodes, each with 8 GPUs (for a total of 64 GPUs),
-and `--batch_size 64`.
-
-#### vit_b_32
-```
-torchrun --nproc_per_node=8 train.py\
-    --model vit_b_32 --epochs 300 --batch-size 512 --opt adamw --lr 0.003 --wd 0.3\
-    --lr-scheduler cosineannealinglr --lr-warmup-method linear --lr-warmup-epochs 30\
-    --lr-warmup-decay 0.033 --amp --label-smoothing 0.11 --mixup-alpha 0.2 --auto-augment imagenet\
-    --clip-grad-norm 1 --ra-sampler --cutmix-alpha 1.0 --model-ema
-```
-
-Note that the above command corresponds to training on a single node with 8 GPUs.
-For generatring the pre-trained weights, we trained with 2 nodes, each with 8 GPUs (for a total of 16 GPUs),
-and `--batch_size 256`.
-
-#### vit_l_16
-```
-torchrun --nproc_per_node=8 train.py\
-    --model vit_l_16 --epochs 600 --batch-size 128 --lr 0.5 --lr-scheduler cosineannealinglr\
-    --lr-warmup-method linear --lr-warmup-epochs 5 --label-smoothing 0.1 --mixup-alpha 0.2\
-    --auto-augment ta_wide --random-erase 0.1 --weight-decay 0.00002 --norm-weight-decay 0.0\
-    --clip-grad-norm 1 --ra-sampler --cutmix-alpha 1.0 --model-ema --val-resize-size 232
-```
-
-Note that the above command corresponds to training on a single node with 8 GPUs.
-For generatring the pre-trained weights, we trained with 2 nodes, each with 8 GPUs (for a total of 16 GPUs),
-and `--batch_size 64`.
-
-#### vit_l_32
-```
-torchrun --nproc_per_node=8 train.py\
-    --model vit_l_32 --epochs 300 --batch-size 512 --opt adamw --lr 0.003 --wd 0.3\
-    --lr-scheduler cosineannealinglr --lr-warmup-method linear --lr-warmup-epochs 30\
-    --lr-warmup-decay 0.033 --amp --label-smoothing 0.11 --mixup-alpha 0.2 --auto-augment ra\
-    --clip-grad-norm 1 --ra-sampler --cutmix-alpha 1.0 --model-ema
-```
-
-Note that the above command corresponds to training on a single node with 8 GPUs.
-For generatring the pre-trained weights, we trained with 8 nodes, each with 8 GPUs (for a total of 64 GPUs),
-and `--batch_size 64`.
-
-
-### ConvNeXt
-```
-torchrun --nproc_per_node=8 train.py\ 
---model $MODEL --batch-size 128 --opt adamw --lr 1e-3 --lr-scheduler cosineannealinglr \ 
---lr-warmup-epochs 5 --lr-warmup-method linear --auto-augment ta_wide --epochs 600 --random-erase 0.1 \ 
---label-smoothing 0.1 --mixup-alpha 0.2 --cutmix-alpha 1.0 --weight-decay 0.05 --norm-weight-decay 0.0 \
---train-crop-size 176 --model-ema --val-resize-size 232 --ra-sampler --ra-reps 4
-```
-Here `$MODEL` is one of `convnext_tiny`, `convnext_small`, `convnext_base` and `convnext_large`. Note that each variant had its `--val-resize-size` optimized in a post-training step, see their `Weights` entry for their exact value.
-
-Note that the above command corresponds to training on a single node with 8 GPUs.
-For generatring the pre-trained weights, we trained with 2 nodes, each with 8 GPUs (for a total of 16 GPUs),
-and `--batch_size 64`.
-
-
-### SwinTransformer
-```
-torchrun --nproc_per_node=8 train.py\ 
---model $MODEL --epochs 300 --batch-size 128 --opt adamw --lr 0.001 --weight-decay 0.05 --norm-weight-decay 0.0  --bias-weight-decay 0.0 --transformer-embedding-decay 0.0 --lr-scheduler cosineannealinglr --lr-min 0.00001 --lr-warmup-method linear  --lr-warmup-epochs 20 --lr-warmup-decay 0.01 --amp --label-smoothing 0.1 --mixup-alpha 0.8 --clip-grad-norm 5.0 --cutmix-alpha 1.0 --random-erase 0.25 --interpolation bicubic --auto-augment ta_wide --model-ema --ra-sampler --ra-reps 4  --val-resize-size 224
-```
-Here `$MODEL` is one of `swin_t`, `swin_s` or `swin_b`.
-Note that `--val-resize-size` was optimized in a post-training step, see their `Weights` entry for the exact value.
-
-
-
-
-### SwinTransformer V2
-```
-torchrun --nproc_per_node=8 train.py\
---model $MODEL --epochs 300 --batch-size 128 --opt adamw --lr 0.001 --weight-decay 0.05 --norm-weight-decay 0.0  --bias-weight-decay 0.0 --transformer-embedding-decay 0.0 --lr-scheduler cosineannealinglr --lr-min 0.00001 --lr-warmup-method linear  --lr-warmup-epochs 20 --lr-warmup-decay 0.01 --amp --label-smoothing 0.1 --mixup-alpha 0.8 --clip-grad-norm 5.0 --cutmix-alpha 1.0 --random-erase 0.25 --interpolation bicubic --auto-augment ta_wide --model-ema --ra-sampler --ra-reps 4  --val-resize-size 256 --val-crop-size 256 --train-crop-size 256 
-```
-Here `$MODEL` is one of `swin_v2_t`, `swin_v2_s` or `swin_v2_b`.
-Note that `--val-resize-size` was optimized in a post-training step, see their `Weights` entry for the exact value.
-
-
-### MaxViT
-```
-torchrun --nproc_per_node=8 --n_nodes=4 train.py\
---model $MODEL --epochs 400 --batch-size 128 --opt adamw --lr 3e-3 --weight-decay 0.05 --lr-scheduler cosineannealinglr --lr-min 1e-5 --lr-warmup-method linear  --lr-warmup-epochs 32  --label-smoothing 0.1 --mixup-alpha 0.8 --clip-grad-norm 1.0 --interpolation bicubic --auto-augment ta_wide --policy-magnitude 15 --model-ema --val-resize-size 224\
---val-crop-size 224 --train-crop-size 224 --amp  --model-ema-steps 32 --transformer-embedding-decay 0 --sync-bn
-```
-Here `$MODEL` is `maxvit_t`.
-Note that `--val-resize-size` was not optimized in a post-training step.
-
-
-### ShuffleNet V2
-```
-torchrun --nproc_per_node=8 train.py \
---batch-size=128 \
---lr=0.5 --lr-scheduler=cosineannealinglr --lr-warmup-epochs=5 --lr-warmup-method=linear \
---auto-augment=ta_wide --epochs=600 --random-erase=0.1 --weight-decay=0.00002 \
---norm-weight-decay=0.0 --label-smoothing=0.1 --mixup-alpha=0.2 --cutmix-alpha=1.0 \
---train-crop-size=176 --model-ema --val-resize-size=232 --ra-sampler --ra-reps=4
-```
-Here `$MODEL` is either `shufflenet_v2_x1_5` or `shufflenet_v2_x2_0`.
-
-The models `shufflenet_v2_x0_5` and `shufflenet_v2_x1_0` were contributed by the community. See [PR-849](https://github.com/pytorch/vision/pull/849#issuecomment-483391686) for details.
-
-
-## Mixed precision training
-Automatic Mixed Precision (AMP) training on GPU for Pytorch can be enabled with the [torch.cuda.amp](https://pytorch.org/docs/stable/amp.html?highlight=amp#module-torch.cuda.amp).
-
-Mixed precision training makes use of both FP32 and FP16 precisions where appropriate. FP16 operations can leverage the Tensor cores on NVIDIA GPUs (Volta, Turing or newer architectures) for improved throughput, generally without loss in model accuracy. Mixed precision training also often allows larger batch sizes. GPU automatic mixed precision training for Pytorch Vision can be enabled via the flag value `--amp=True`.
-
-```
-torchrun --nproc_per_node=8 train.py\
-    --model resnext50_32x4d --epochs 100 --amp
-```
-
-## Quantized
-
-### Post training quantized models
-
-For all post training quantized models, the settings are:
-
-1. num_calibration_batches: 32
-2. num_workers: 16
-3. batch_size: 32
-4. eval_batch_size: 128
-5. backend: 'fbgemm'
-
-```
-python train_quantization.py --device='cpu' --post-training-quantize --backend='fbgemm' --model='$MODEL'
-```
-Here `$MODEL` is one of `googlenet`, `inception_v3`, `resnet18`, `resnet50`, `resnext101_32x8d`, `shufflenet_v2_x0_5` and `shufflenet_v2_x1_0`.
-
-### Quantized ShuffleNet V2
-
-Here are commands that we use to quantized the `shufflenet_v2_x1_5` and `shufflenet_v2_x2_0` models.
-```
-# For shufflenet_v2_x1_5
-python train_quantization.py --device='cpu' --post-training-quantize --backend='fbgemm' \
-    --model=shufflenet_v2_x1_5 --weights="ShuffleNet_V2_X1_5_Weights.IMAGENET1K_V1" \
-    --train-crop-size 176 --val-resize-size 232 --data-path /datasets01_ontap/imagenet_full_size/061417/
-
-# For shufflenet_v2_x2_0
-python train_quantization.py --device='cpu' --post-training-quantize --backend='fbgemm' \
-    --model=shufflenet_v2_x2_0 --weights="ShuffleNet_V2_X2_0_Weights.IMAGENET1K_V1" \
-    --train-crop-size 176 --val-resize-size 232 --data-path /datasets01_ontap/imagenet_full_size/061417/
-```
-
-### QAT MobileNetV2
-
-For Mobilenet-v2, the model was trained with quantization aware training, the settings used are:
-1. num_workers: 16
-2. batch_size: 32
-3. eval_batch_size: 128
-4. backend: 'qnnpack'
-5. learning-rate: 0.0001
-6. num_epochs: 90
-7. num_observer_update_epochs:4
-8. num_batch_norm_update_epochs:3
-9. momentum: 0.9
-10. lr_step_size:30
-11. lr_gamma: 0.1
-12. weight-decay: 0.0001
-
-```
-torchrun --nproc_per_node=8 train_quantization.py --model='mobilenet_v2'
-```
-
-Training converges at about 10 epochs.
-
-### QAT MobileNetV3
-
-For Mobilenet-v3 Large, the model was trained with quantization aware training, the settings used are:
-1. num_workers: 16
-2. batch_size: 32
-3. eval_batch_size: 128
-4. backend: 'qnnpack'
-5. learning-rate: 0.001
-6. num_epochs: 90
-7. num_observer_update_epochs:4
-8. num_batch_norm_update_epochs:3
-9. momentum: 0.9
-10. lr_step_size:30
-11. lr_gamma: 0.1
-12. weight-decay: 0.00001
-
-```
-torchrun --nproc_per_node=8 train_quantization.py --model='mobilenet_v3_large' \
-    --wd 0.00001 --lr 0.001
-```
-
-For post training quant, device is set to CPU. For training, the device is set to CUDA.
-
-### Command to evaluate quantized models using the pre-trained weights:
-
-```
-python train_quantization.py --device='cpu' --test-only --backend='<backend>' --model='<model_name>'
-```
-
-For inception_v3 you need to pass the following extra parameters:
-```
---val-resize-size 342 --val-crop-size 299 --train-crop-size 299
-```
\ No newline at end of file
diff --git a/torchao/prototype/sparsity/superblock/__init__.py b/torchao/prototype/sparsity/superblock/__init__.py
deleted file mode 100644
index e69de29bb2..0000000000
diff --git a/torchao/prototype/sparsity/superblock/benchmark.py b/torchao/prototype/sparsity/superblock/benchmark.py
deleted file mode 100644
index b87834afae..0000000000
--- a/torchao/prototype/sparsity/superblock/benchmark.py
+++ /dev/null
@@ -1,140 +0,0 @@
-#  Copyright (c) Meta Platforms, Inc. and affiliates.
-
-import torch
-import torchvision
-from torch.sparse._triton_ops_meta import (
-    optimize_bsr_dense_addmm,
-)
-
-from torchao.prototype.sparsity.superblock.utils import (
-    accelerate_with_sparsity,
-    get_args_parser,
-    simulate_sparsity,
-)
-from torchao.utils import benchmark_model, profiler_runner
-
-torch.sparse.SparseSemiStructuredTensor._FORCE_CUTLASS = False
-torch.backends.mha.set_fastpath_enabled(False)
-
-
-@torch.inference_mode
-def main(args):
-    device = torch.device(args.device)
-
-    # We disable the cudnn benchmarking because it can noticeably affect the accuracy
-    torch.backends.cudnn.benchmark = False
-    torch.backends.cudnn.deterministic = True
-    num_classes = 1000
-
-    dtype = getattr(torch, args.dtype)
-
-    # BSR kernel tuning
-    if args.bsr and args.tune_kernel_params:
-        kwargs = dict(
-            dtype=torch.int8 if args.quantization else dtype,
-            sparsity=args.sparsity_linear,
-            verbose=True,
-            # per blocksparse_int_addmm:
-            alpha=1,
-            beta=0,
-            use_left_alpha=True,
-            use_right_alpha=True,
-            # force tuning because existing tuning parameters are
-            # computed for use_left/right_alpha=False, however, it
-            # turns out that re-tuning for use_left/right_alpha=False
-            # leads to the same set of tuning parametes:
-            # force=True
-        )
-        if args.model == "vit_b_16":
-            optimize_bsr_dense_addmm(3072, 768, 50432, args.bsr, args.bsr, **kwargs)
-            optimize_bsr_dense_addmm(768, 3072, 50432, args.bsr, args.bsr, **kwargs)
-        elif args.model == "vit_h_14":
-            optimize_bsr_dense_addmm(5120, 1280, 65792, args.bsr, args.bsr, **kwargs)
-            optimize_bsr_dense_addmm(1280, 5120, 65792, args.bsr, args.bsr, **kwargs)
-        else:
-            raise NotImplementedError(
-                "Tuning kernel params for this model is not supported yet."
-            )
-        # Warning: the following call will overwrite the source code
-        # of torch.sparse._triton_ops_meta (hence it is commented out
-        # by default) but when used, it'll enables reusing the tuned
-        # parameters in subsequent runs of this script:
-        # store_tuned_kernel_params()
-    model = torchvision.models.get_model(
-        args.model, weights=args.weights, num_classes=num_classes
-    ).eval()
-
-    # Fake sparsity necessary for BSR, since we find based on SuperBlock
-    sparsifier_or_none = simulate_sparsity(model, args)
-    if sparsifier_or_none is not None:
-        sparsifier_or_none.squash_mask()
-
-    if args.weights_path:
-        try:
-            checkpoint = torch.load(args.weights_path, map_location="cpu")
-            model.load_state_dict(checkpoint["model"])
-        except FileNotFoundError:
-            raise FileNotFoundError(f"No checkpoint found at {args.weights_path}.")
-
-    model.to(device).to(dtype)
-
-    # With quantization, we must use cuSPARSELt to fuse one of the scalar matmuls.
-    # Otherwise, we observe the CUTLASS kernels to be faster, so we use those instead.
-    accelerate_with_sparsity(model, args)
-
-    # compile
-    model = torch.compile(model, mode="max-autotune", fullgraph=True)
-
-    # define image
-    image = torch.randn(
-        args.batch_size,
-        3,
-        args.val_crop_size,
-        args.val_crop_size,
-        dtype=dtype,
-        device=device,
-    )
-
-    # warmup
-    benchmark_model(model, 10, args=(image,))
-    if args.profile:
-        return profiler_runner("test.json.gz", benchmark_model, model, 10, (image,))
-    else:
-        return benchmark_model(model, 100, args=(image,))
-
-
-if __name__ == "__main__":
-    args = get_args_parser(benchmark=True).parse_args()
-    result = main(args)
-    header = [
-        "model",
-        "batch_size",
-        "dtype",
-        "sparsity",
-        "bsr",
-        "sparsity_level",
-        "quantization",
-        "tune_kernel_params",
-        "latency",
-        "img/s",
-    ]
-    result_string = ",".join(
-        str(_)
-        for _ in [
-            args.model,
-            args.batch_size,
-            args.dtype,
-            args.sparsity,
-            args.bsr,
-            args.sparsity_linear,
-            args.quantization,
-            args.tune_kernel_params,
-            result,
-            1000 / result,
-        ]
-    )
-    with open("benchmark_results.txt", "a") as f:
-        if args.header:
-            f.write(",".join(header) + "\n")
-        f.write(result_string + "\n")
-    print(result_string)
diff --git a/torchao/prototype/sparsity/superblock/benchmark.sh b/torchao/prototype/sparsity/superblock/benchmark.sh
deleted file mode 100644
index ac52ee8e02..0000000000
--- a/torchao/prototype/sparsity/superblock/benchmark.sh
+++ /dev/null
@@ -1,44 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-MODEL=vit_h_14
-BATCH_SIZE=256
-
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --header
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --quantization
-
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity semi_structured
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.80 --bsr 64 --sparsity bsr
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.84 --bsr 64 --sparsity bsr
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.90 --bsr 64 --sparsity bsr
-
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity semi_structured --quantization
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.80 --bsr 64 --sparsity bsr --quantization
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.84 --bsr 64 --sparsity bsr --quantization
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.90 --bsr 64 --sparsity bsr --quantization
-
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.80 --bsr 64 --sparsity bsr --quantization  --tune-kernel-params
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.84 --bsr 64 --sparsity bsr --quantization  --tune-kernel-params
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.90 --bsr 64 --sparsity bsr --quantization  --tune-kernel-params
-
-MODEL=vit_b_16
-BATCH_SIZE=256
-
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --header
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --quantization
-
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity semi_structured
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.80 --bsr 64 --sparsity bsr
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.84 --bsr 64 --sparsity bsr
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.90 --bsr 64 --sparsity bsr
-
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity semi_structured --quantization
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.80 --bsr 64 --sparsity bsr --quantization
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.84 --bsr 64 --sparsity bsr --quantization
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.90 --bsr 64 --sparsity bsr --quantization
-
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.80 --bsr 64 --sparsity bsr --quantization  --tune-kernel-params
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.84 --bsr 64 --sparsity bsr --quantization  --tune-kernel-params
-python benchmark.py --model $MODEL --batch-size $BATCH_SIZE --sparsity-linear 0.90 --bsr 64 --sparsity bsr --quantization  --tune-kernel-params
diff --git a/torchao/prototype/sparsity/superblock/benchmark_results.txt b/torchao/prototype/sparsity/superblock/benchmark_results.txt
deleted file mode 100644
index 3e18d9faec..0000000000
--- a/torchao/prototype/sparsity/superblock/benchmark_results.txt
+++ /dev/null
@@ -1,30 +0,0 @@
-model,batch_size,dtype,sparsity,bsr,sparsity_level,quantization,tune_kernel_params,latency,img/s
-vit_h_14,256,bfloat16,None,None,0.0,False,False,489.645859375,2.0422923646825746
-vit_h_14,256,bfloat16,None,None,0.0,True,False,454.5648828125,2.1999059712064963
-vit_h_14,256,bfloat16,semi_structured,None,0.0,False,False,458.638046875,2.180368608347371
-vit_h_14,256,bfloat16,bsr,64,0.8,False,False,361.5827734375,2.765618479257699
-vit_h_14,256,bfloat16,bsr,64,0.84,False,False,343.1771484375,2.9139469354327407
-vit_h_14,256,bfloat16,bsr,64,0.9,False,False,315.37119140625,3.170866671559215
-vit_h_14,256,bfloat16,semi_structured,None,0.0,True,False,438.1652734375,2.2822438486619143
-vit_h_14,256,bfloat16,bsr,64,0.8,True,False,439.5409765625,2.2751007376392045
-vit_h_14,256,bfloat16,bsr,64,0.84,True,False,416.799375,2.3992358433838823
-vit_h_14,256,bfloat16,bsr,64,0.9,True,False,381.9370703125,2.6182323679181034
-vit_h_14,256,bfloat16,bsr,64,0.8,True,True,439.1569921875,2.277090010610706
-vit_h_14,256,bfloat16,bsr,64,0.84,True,True,416.18,2.4028064779662643
-vit_h_14,256,bfloat16,bsr,64,0.9,True,True,384.2584765625,2.6024149394069362
-
-model,batch_size,dtype,sparsity,bsr,sparsity_level,quantization,tune_kernel_params,latency,img/s
-vit_b_16,256,bfloat16,None,None,0.0,False,False,61.407705078125,16.284601398599175
-vit_b_16,256,bfloat16,None,None,0.0,True,False,60.934091796875,16.41117427881784
-vit_b_16,256,bfloat16,semi_structured,None,0.0,False,False,59.9600732421875,16.677764817945665
-vit_b_16,256,bfloat16,bsr,64,0.8,False,False,47.6238916015625,20.997864020990484
-vit_b_16,256,bfloat16,bsr,64,0.84,False,False,45.7176416015625,21.873394273378768
-vit_b_16,256,bfloat16,bsr,64,0.9,False,False,42.708759765625,23.414400359264707
-vit_b_16,256,bfloat16,semi_structured,None,0.0,True,False,58.783828125,17.011481420937148
-vit_b_16,256,bfloat16,bsr,64,0.8,True,False,58.1029541015625,17.210828872005806
-vit_b_16,256,bfloat16,bsr,64,0.84,True,False,55.8751025390625,17.89705887878946
-vit_b_16,256,bfloat16,bsr,64,0.9,True,False,52.3257763671875,19.111039900921202
-vit_b_16,256,bfloat16,bsr,64,0.8,True,True,58.649736328125,17.050375033322325
-vit_b_16,256,bfloat16,bsr,64,0.84,True,True,56.46744140625,17.709320186930174
-vit_b_16,256,bfloat16,bsr,64,0.9,True,True,52.528623046875,19.037239927413086
-vit_b_16,256,bfloat16,bsr,64,0.8,True,False,57.6839794921875,17.335835856044508
diff --git a/torchao/prototype/sparsity/superblock/evaluate.py b/torchao/prototype/sparsity/superblock/evaluate.py
deleted file mode 100644
index 04701e518e..0000000000
--- a/torchao/prototype/sparsity/superblock/evaluate.py
+++ /dev/null
@@ -1,104 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-import os
-
-import torch
-import torchvision
-
-from torchao.prototype.sparsity.superblock.train import evaluate, load_data
-from torchao.prototype.sparsity.superblock.utils import (
-    accelerate_with_sparsity,
-    get_args_parser,
-    init_distributed_mode,
-    simulate_sparsity,
-)
-
-torch.sparse.SparseSemiStructuredTensor._FORCE_CUTLASS = False
-torch.backends.mha.set_fastpath_enabled(False)
-
-
-def main(args):
-    init_distributed_mode(args)
-    print(args)
-
-    device = torch.device(args.device)
-    # We disable the cudnn benchmarking because it can noticeably affect the accuracy
-    torch.backends.cudnn.benchmark = False
-    torch.backends.cudnn.deterministic = True
-
-    # Load validation data
-    val_dir = os.path.join(args.data_path, "val")
-    dataset_test, test_sampler = load_data(None, val_dir, args)
-    data_loader_test = torch.utils.data.DataLoader(
-        dataset_test,
-        batch_size=args.batch_size,
-        sampler=test_sampler,
-        num_workers=args.workers,
-        pin_memory=True,
-        drop_last=True,
-    )
-    num_classes = len(dataset_test.classes)
-
-    # Create Model
-    print("Creating model")
-    model = torchvision.models.get_model(
-        args.model, weights=args.weights, num_classes=num_classes
-    )
-
-    sparsifier_or_none = simulate_sparsity(model, args)
-
-    if args.weights_path:
-        try:
-            checkpoint = torch.load(args.weights_path, map_location="cpu")
-            model.load_state_dict(checkpoint["model"])
-            print(f"Loaded checkpoint successfully from: {args.weights_path}")
-        except FileNotFoundError:
-            raise FileNotFoundError(f"No checkpoint found at {args.weights_path}")
-
-    model.to(device).bfloat16()
-
-    if sparsifier_or_none is not None:
-        sparsifier_or_none.squash_mask()
-    accelerate_with_sparsity(model, args)
-    model = torch.compile(model, mode="max-autotune", fullgraph=True)
-
-    criterion = torch.nn.CrossEntropyLoss(label_smoothing=args.label_smoothing)
-    return evaluate(
-        model, criterion, data_loader_test, device=device, dtype=torch.bfloat16
-    )
-
-
-if __name__ == "__main__":
-    args = get_args_parser(evaluate=True).parse_args()
-    accuracy, throughput, max_mem = main(args)
-    header = [
-        "model",
-        "batch_size",
-        "dtype",
-        "sparsity",
-        "bsr",
-        "sparsity_level",
-        "quantization",
-        "top-1_acc",
-        "encoder img/s",
-        "max_mem (MB)",
-    ]
-    result_string = ",".join(
-        str(_)
-        for _ in [
-            args.model,
-            args.batch_size,
-            "bfloat16",
-            args.sparsity,
-            args.bsr,
-            args.sparsity_linear,
-            args.quantization,
-            accuracy,
-            throughput,
-            max_mem,
-        ]
-    )
-    with open("evaluation_results.txt", "a") as f:
-        if args.header:
-            f.write(",".join(header) + "\n")
-        f.write(result_string + "\n")
-    print(result_string)
diff --git a/torchao/prototype/sparsity/superblock/evaluate.sh b/torchao/prototype/sparsity/superblock/evaluate.sh
deleted file mode 100644
index 8696c9da42..0000000000
--- a/torchao/prototype/sparsity/superblock/evaluate.sh
+++ /dev/null
@@ -1,28 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-MODEL=vit_b_16
-BATCH_SIZE=256
-
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --weights ViT_B_16_Weights.IMAGENET1K_V1 --header
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --weights ViT_B_16_Weights.IMAGENET1K_V1 --quantization
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --weights ViT_B_16_Weights.IMAGENET1K_V1 --sparsity semi_structured
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --weights ViT_B_16_Weights.IMAGENET1K_V1 --sparsity semi_structured --quantization
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --sparsity bsr --sparsity-linear 0.80 --bsr 64 --weights-path checkpoints/$MODEL/sp0.80-ts64.pth
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --sparsity bsr --sparsity-linear 0.80 --bsr 64 --weights-path checkpoints/$MODEL/sp0.80-ts64.pth --quantization
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --sparsity bsr --sparsity-linear 0.84 --bsr 64 --weights-path checkpoints/$MODEL/sp0.84-ts64.pth
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --sparsity bsr --sparsity-linear 0.84 --bsr 64 --weights-path checkpoints/$MODEL/sp0.84-ts64.pth --quantization
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --sparsity bsr --sparsity-linear 0.90 --bsr 64 --weights-path checkpoints/$MODEL/sp0.90-ts64.pth
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --sparsity bsr --sparsity-linear 0.90 --bsr 64 --weights-path checkpoints/$MODEL/sp0.90-ts64.pth --quantization
-
-MODEL=vit_h_14
-BATCH_SIZE=128
-
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --weights ViT_H_14_Weights.IMAGENET1K_SWAG_E2E_V1 --header
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --weights ViT_H_14_Weights.IMAGENET1K_SWAG_E2E_V1 --quantization
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --weights ViT_H_14_Weights.IMAGENET1K_SWAG_E2E_V1 --sparsity semi_structured
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --weights ViT_H_14_Weights.IMAGENET1K_SWAG_E2E_V1 --sparsity semi_structured --quantization
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --sparsity bsr --sparsity-linear 0.90 --bsr 64 --weights-path checkpoints/$MODEL/sp0.90-ts64.pth
-python evaluate.py --model $MODEL --batch-size $BATCH_SIZE --data-path $IMAGENET_PATH --sparsity bsr --sparsity-linear 0.90 --bsr 64 --weights-path checkpoints/$MODEL/sp0.90-ts64.pth --quantization
diff --git a/torchao/prototype/sparsity/superblock/evaluation_results.txt b/torchao/prototype/sparsity/superblock/evaluation_results.txt
deleted file mode 100644
index 58dcade663..0000000000
--- a/torchao/prototype/sparsity/superblock/evaluation_results.txt
+++ /dev/null
@@ -1,19 +0,0 @@
-model,batch_size,dtype,sparsity,bsr,sparsity_level,quantization,top-1_acc,encoder img/s,max_mem (MB)
-vit_b_16,256,bfloat16,None,None,0.0,False,81.97716346153847,734.904399886552,247.97265625
-vit_b_16,256,bfloat16,None,None,0.0,True,81.89503205128206,230.83627917226997,196.841796875
-vit_b_16,256,bfloat16,semi_structured,None,0.0,False,77.05729166666667,1386.7278781133518,316.40234375
-vit_b_16,256,bfloat16,semi_structured,None,0.0,True,76.74078525641026,150.53603093207843,249.25390625
-vit_b_16,256,bfloat16,bsr,64,0.8,False,77.13541666666667,1469.2705176409308,179.55322265625
-vit_b_16,256,bfloat16,bsr,64,0.8,True,77.13341346153847,87.8480561274922,158.70361328125
-vit_b_16,256,bfloat16,bsr,64,0.84,False,76.14983974358974,1752.835540513905,174.01953125
-vit_b_16,256,bfloat16,bsr,64,0.84,True,76.0556891025641,1013.7495284783578,156.630859375
-vit_b_16,256,bfloat16,bsr,64,0.9,False,62.99879807692308,1702.289195236525,164.2822265625
-vit_b_16,256,bfloat16,bsr,64,0.9,True,62.946714743589745,987.5488468441617,152.5732421875
-
-model,batch_size,dtype,sparsity,bsr,sparsity_level,quantization,top-1_acc,encoder img/s,max_mem (MB)
-vit_h_14,128,bfloat16,None,None,0.0,False,89.29286858974359,81.02922135697278,1430.05615234375
-vit_h_14,128,bfloat16,None,None,0.0,True,89.3349358974359,56.076129157634355,1025.00927734375
-vit_h_14,128,bfloat16,semi_structured,None,0.0,False,82.03725961538461,75.83586253901329,1900.36279296875
-vit_h_14,128,bfloat16,semi_structured,None,0.0,True,82.06330128205128,36.36097831133589,1390.98779296875
-vit_h_14,128,bfloat16,bsr,64,0.9,False,78.21113782051282,350.91330496491446,599.6201171875
-vit_h_14,128,bfloat16,bsr,64,0.9,True,78.2051282051282,108.84048044884008,531.5810546875
diff --git a/torchao/prototype/sparsity/superblock/train.py b/torchao/prototype/sparsity/superblock/train.py
deleted file mode 100644
index 330dba4b6d..0000000000
--- a/torchao/prototype/sparsity/superblock/train.py
+++ /dev/null
@@ -1,542 +0,0 @@
-#  Copyright (c) Meta Platforms, Inc. and affiliates.
-
-import datetime
-import glob
-import os
-import time
-import warnings
-
-import torch
-import torch.utils.data
-import torchvision
-import utils
-from torch import nn
-from torch.utils.data.dataloader import default_collate
-from torchvision.transforms.functional import InterpolationMode
-from utils import RASampler
-
-from torchao.prototype.sparsity.superblock.utils import simulate_sparsity
-
-
-def train_one_epoch(
-    model,
-    criterion,
-    optimizer,
-    data_loader,
-    device,
-    epoch,
-    args,
-    model_ema=None,
-    scaler=None,
-):
-    model.train()
-    metric_logger = utils.MetricLogger(delimiter="  ")
-    metric_logger.add_meter("lr", utils.SmoothedValue(window_size=1, fmt="{value}"))
-    metric_logger.add_meter("img/s", utils.SmoothedValue(window_size=10, fmt="{value}"))
-
-    header = f"Epoch: [{epoch}]"
-    accumulation_counter = 0  # Counter for tracking accumulated gradients
-
-    for i, (image, target) in enumerate(
-        metric_logger.log_every(data_loader, args.print_freq, header)
-    ):
-        start_time = time.time()
-        image, target = image.to(device), target.to(device)
-
-        with torch.cuda.amp.autocast(enabled=scaler is not None):
-            output = model(image)
-            loss = criterion(output, target) / args.accumulation_steps  # Scale loss
-
-        if scaler is not None:
-            scaler.scale(loss).backward()
-        else:
-            loss.backward()
-
-        accumulation_counter += 1
-
-        if accumulation_counter % args.accumulation_steps == 0:
-            if scaler is not None:
-                if args.clip_grad_norm is not None:
-                    scaler.unscale_(optimizer)  # Unscale gradients before clipping
-                    nn.utils.clip_grad_norm_(model.parameters(), args.clip_grad_norm)
-                scaler.step(optimizer)
-                scaler.update()
-            else:
-                if args.clip_grad_norm is not None:
-                    nn.utils.clip_grad_norm_(model.parameters(), args.clip_grad_norm)
-                optimizer.step()
-
-            optimizer.zero_grad()  # Zero out gradients after optimization step
-
-        if model_ema and i % args.model_ema_steps == 0:
-            model_ema.update_parameters(model)
-            if epoch < args.lr_warmup_epochs:
-                model_ema.n_averaged.fill_(0)
-
-        acc1, acc5 = utils.accuracy(output, target, topk=(1, 5))
-        batch_size = image.shape[0]
-        metric_logger.update(
-            loss=loss.item() * args.accumulation_steps,
-            lr=optimizer.param_groups[0]["lr"],
-        )  # Scale back up for logging
-        metric_logger.meters["acc1"].update(acc1.item(), n=batch_size)
-        metric_logger.meters["acc5"].update(acc5.item(), n=batch_size)
-        metric_logger.meters["img/s"].update(batch_size / (time.time() - start_time))
-
-
-def evaluate(
-    model,
-    criterion,
-    data_loader,
-    device,
-    print_freq=100,
-    log_suffix="",
-    dtype=torch.float32,
-):
-    model.eval()
-    metric_logger = utils.MetricLogger(delimiter="  ")
-    header = f"Test: {log_suffix}"
-    encoder_time = 0
-    num_processed_samples = 0
-    with torch.inference_mode():
-        for image, target in metric_logger.log_every(data_loader, print_freq, header):
-            image = image.to(device, non_blocking=True).to(dtype)
-            target = target.to(device, non_blocking=True).to(dtype)
-            # intialize encoder measurements
-            torch.cuda.reset_max_memory_allocated()
-            torch.cuda.synchronize()
-            start_event = torch.cuda.Event(enable_timing=True)
-            end_event = torch.cuda.Event(enable_timing=True)
-            start_event.record()
-
-            # run encoder
-            output = model(image)
-
-            # measure time in encoder
-            end_event.record()
-            torch.cuda.synchronize()
-            encoder_time += start_event.elapsed_time(end_event)
-            max_mem = torch.cuda.max_memory_allocated() / (1024**2)
-
-            acc1, acc5 = utils.accuracy(output, target, topk=(1, 5))
-            # FIXME need to take into account that the datasets
-            # could have been padded in distributed setup
-            batch_size = image.shape[0]
-            # metric_logger.update(loss=loss.item())
-            metric_logger.meters["acc1"].update(acc1.item(), n=batch_size)
-            metric_logger.meters["acc5"].update(acc5.item(), n=batch_size)
-            metric_logger.meters["batch_time"].update(encoder_time, n=batch_size)
-            num_processed_samples += batch_size
-    # gather the stats from all processes
-
-    num_processed_samples = utils.reduce_across_processes(num_processed_samples)
-    if (
-        hasattr(data_loader.dataset, "__len__")
-        and len(data_loader.dataset) != num_processed_samples
-    ):
-        # See FIXME above
-        warnings.warn(
-            f"It looks like the dataset has {len(data_loader.dataset)} samples, but {num_processed_samples} "
-            "samples were used for the validation, which might bias the results. "
-            "Try adjusting the batch size and / or the world size. "
-            "Setting the world size to 1 is always a safe bet."
-        )
-
-    metric_logger.synchronize_between_processes()
-
-    print(
-        f"{header} Acc@1 {metric_logger.acc1.global_avg:.3f} Acc@5 {metric_logger.acc5.global_avg:.3f}"
-    )
-    total_time = encoder_time / 1000.0
-    return (
-        metric_logger.acc1.global_avg,
-        num_processed_samples.item() / total_time,
-        max_mem,
-    )
-
-
-def _get_cache_path(filepath):
-    import hashlib
-
-    h = hashlib.sha1(filepath.encode()).hexdigest()
-    cache_path = os.path.join(
-        "~", ".torch", "vision", "datasets", "imagefolder", h[:10] + ".pt"
-    )
-    cache_path = os.path.expanduser(cache_path)
-    return cache_path
-
-
-def load_data(traindir, valdir, args):
-    # Data loading code
-    print("Loading data")
-    (
-        val_resize_size,
-        val_crop_size,
-    ) = (
-        args.val_resize_size,
-        args.val_crop_size,
-    )
-    interpolation = InterpolationMode(args.interpolation)
-    if traindir is not None:
-        train_crop_size = args.train_crop_size
-        print("Loading training data")
-        st = time.time()
-        cache_path = _get_cache_path(traindir)
-        if args.cache_dataset and os.path.exists(cache_path):
-            # Attention, as the transforms are also cached!
-            print(f"Loading dataset_train from {cache_path}")
-            dataset, _ = torch.load(cache_path)
-        else:
-            auto_augment_policy = getattr(args, "auto_augment", None)
-            random_erase_prob = getattr(args, "random_erase", 0.0)
-            ra_magnitude = args.ra_magnitude
-            augmix_severity = args.augmix_severity
-            preprocessing = utils.ClassificationPresetTrain(
-                crop_size=train_crop_size,
-                interpolation=interpolation,
-                auto_augment_policy=auto_augment_policy,
-                random_erase_prob=random_erase_prob,
-                ra_magnitude=ra_magnitude,
-                augmix_severity=augmix_severity,
-            )
-            dataset = torchvision.datasets.ImageFolder(traindir, preprocessing)
-            # ) if args.meta else torchvision.datasets.ImageNet(
-            #     traindir,
-            #     split="train",
-            #     transform=preprocessing,
-            # )
-            if args.cache_dataset:
-                print(f"Saving dataset_train to {cache_path}")
-                utils.mkdir(os.path.dirname(cache_path))
-                utils.save_on_master((dataset, traindir), cache_path)
-        print("Took", time.time() - st)
-        print(f"Number of training images: {len(dataset)}")
-        if args.distributed:
-            if hasattr(args, "ra_sampler") and args.ra_sampler:
-                train_sampler = RASampler(
-                    dataset, shuffle=True, repetitions=args.ra_reps
-                )
-            else:
-                train_sampler = torch.utils.data.distributed.DistributedSampler(dataset)
-        else:
-            train_sampler = torch.utils.data.RandomSampler(dataset)
-
-    print("Loading validation data")
-    cache_path = _get_cache_path(valdir)
-    if args.cache_dataset and os.path.exists(cache_path):
-        # Attention, as the transforms are also cached!
-        print(f"Loading dataset_test from {cache_path}")
-        dataset_test, test_sampler = torch.load(cache_path)
-    else:
-        if args.weights:
-            weights = torchvision.models.get_weight(args.weights)
-            preprocessing = weights.transforms()
-        else:
-            preprocessing = utils.ClassificationPresetEval(
-                crop_size=val_crop_size,
-                resize_size=val_resize_size,
-                interpolation=interpolation,
-            )
-        dataset_test = (
-            torchvision.datasets.ImageFolder(
-                valdir,
-                preprocessing,
-            )
-            if args.meta
-            else torchvision.datasets.ImageNet(
-                valdir, split="val", transform=preprocessing
-            )
-        )
-        if args.cache_dataset:
-            print(f"Saving dataset_test to {cache_path}")
-            utils.mkdir(os.path.dirname(cache_path))
-            utils.save_on_master((dataset_test, valdir), cache_path)
-
-        print(f"Number of validation images: {len(dataset_test)}")
-        test_sampler = (
-            torch.utils.data.distributed.DistributedSampler(dataset_test, shuffle=False)
-            if args.distributed
-            else torch.utils.data.SequentialSampler(dataset_test)
-        )
-
-    # for evaluation
-    if traindir is None:
-        return dataset_test, test_sampler
-
-    return dataset, dataset_test, train_sampler, test_sampler
-
-
-def main(args):
-    if args.output_dir:
-        utils.mkdir(args.output_dir)
-
-    utils.init_distributed_mode(args)
-    print(args)
-
-    device = torch.device(args.device)
-
-    if args.use_deterministic_algorithms:
-        torch.backends.cudnn.benchmark = False
-        torch.use_deterministic_algorithms(True)
-    else:
-        torch.backends.cudnn.benchmark = True
-
-    train_dir = os.path.join(args.data_path, "train_blurred")
-    val_dir = os.path.join(args.data_path, "val")
-    dataset, dataset_test, train_sampler, test_sampler = load_data(
-        train_dir, val_dir, args
-    )
-
-    collate_fn = None
-    num_classes = len(dataset.classes)
-    mixup_transforms = []
-    if args.mixup_alpha > 0.0:
-        mixup_transforms.append(
-            utils.RandomMixup(num_classes, p=1.0, alpha=args.mixup_alpha)
-        )
-    if args.cutmix_alpha > 0.0:
-        mixup_transforms.append(
-            utils.RandomCutmix(num_classes, p=1.0, alpha=args.cutmix_alpha)
-        )
-    if mixup_transforms:
-        mixupcutmix = torchvision.transforms.RandomChoice(mixup_transforms)
-
-        def collate_fn(batch):
-            return mixupcutmix(*default_collate(batch))
-
-    data_loader = torch.utils.data.DataLoader(
-        dataset,
-        batch_size=args.batch_size,
-        sampler=train_sampler,
-        num_workers=args.workers,
-        pin_memory=True,
-        collate_fn=collate_fn,
-    )
-    data_loader_test = torch.utils.data.DataLoader(
-        dataset_test,
-        batch_size=args.batch_size,
-        sampler=test_sampler,
-        num_workers=args.workers,
-        pin_memory=True,
-    )
-
-    print("Creating model")
-    model = torchvision.models.get_model(
-        args.model, weights=args.weights, num_classes=num_classes
-    )
-
-    if args.weights_path is not None:
-        sd = torch.load(args.weights_path, map_location="cpu")
-        model.load_state_dict(sd)
-
-    model.to(device)
-    if args.distributed and args.sync_bn:
-        model = torch.nn.SyncBatchNorm.convert_sync_batchnorm(model)
-
-    sparsifier = simulate_sparsity(model, args)
-    criterion = nn.CrossEntropyLoss(label_smoothing=args.label_smoothing)
-
-    custom_keys_weight_decay = []
-    if args.bias_weight_decay is not None:
-        custom_keys_weight_decay.append(("bias", args.bias_weight_decay))
-    if args.transformer_embedding_decay is not None:
-        for key in [
-            "class_token",
-            "position_embedding",
-            "relative_position_bias_table",
-        ]:
-            custom_keys_weight_decay.append((key, args.transformer_embedding_decay))
-    parameters = utils.set_weight_decay(
-        model,
-        args.weight_decay,
-        norm_weight_decay=args.norm_weight_decay,
-        custom_keys_weight_decay=(
-            custom_keys_weight_decay if len(custom_keys_weight_decay) > 0 else None
-        ),
-    )
-
-    opt_name = args.opt.lower()
-    if opt_name.startswith("sgd"):
-        optimizer = torch.optim.SGD(
-            parameters,
-            lr=args.lr,
-            momentum=args.momentum,
-            weight_decay=args.weight_decay,
-            nesterov="nesterov" in opt_name,
-        )
-    elif opt_name == "rmsprop":
-        optimizer = torch.optim.RMSprop(
-            parameters,
-            lr=args.lr,
-            momentum=args.momentum,
-            weight_decay=args.weight_decay,
-            eps=0.0316,
-            alpha=0.9,
-        )
-    elif opt_name == "adamw":
-        optimizer = torch.optim.AdamW(
-            parameters, lr=args.lr, weight_decay=args.weight_decay
-        )
-    else:
-        raise RuntimeError(
-            f"Invalid optimizer {args.opt}. Only SGD, RMSprop and AdamW are supported."
-        )
-
-    scaler = torch.cuda.amp.GradScaler() if args.amp else None
-
-    args.lr_scheduler = args.lr_scheduler.lower()
-    if args.lr_scheduler == "steplr":
-        main_lr_scheduler = torch.optim.lr_scheduler.StepLR(
-            optimizer, step_size=args.lr_step_size, gamma=args.lr_gamma
-        )
-    elif args.lr_scheduler == "cosineannealinglr":
-        main_lr_scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(
-            optimizer, T_max=args.epochs - args.lr_warmup_epochs, eta_min=args.lr_min
-        )
-    elif args.lr_scheduler == "exponentiallr":
-        main_lr_scheduler = torch.optim.lr_scheduler.ExponentialLR(
-            optimizer, gamma=args.lr_gamma
-        )
-    else:
-        raise RuntimeError(
-            f"Invalid lr scheduler '{args.lr_scheduler}'. Only StepLR, CosineAnnealingLR and ExponentialLR "
-            "are supported."
-        )
-
-    if args.lr_warmup_epochs > 0:
-        if args.lr_warmup_method == "linear":
-            warmup_lr_scheduler = torch.optim.lr_scheduler.LinearLR(
-                optimizer,
-                start_factor=args.lr_warmup_decay,
-                total_iters=args.lr_warmup_epochs,
-            )
-        elif args.lr_warmup_method == "constant":
-            warmup_lr_scheduler = torch.optim.lr_scheduler.ConstantLR(
-                optimizer,
-                factor=args.lr_warmup_decay,
-                total_iters=args.lr_warmup_epochs,
-            )
-        else:
-            raise RuntimeError(
-                f"Invalid warmup lr method '{args.lr_warmup_method}'. Only linear and constant are supported."
-            )
-        lr_scheduler = torch.optim.lr_scheduler.SequentialLR(
-            optimizer,
-            schedulers=[warmup_lr_scheduler, main_lr_scheduler],
-            milestones=[args.lr_warmup_epochs],
-        )
-    else:
-        lr_scheduler = main_lr_scheduler
-
-    model_without_ddp = model
-    if args.distributed:
-        model = torch.nn.parallel.DistributedDataParallel(
-            model, device_ids=[args.gpu], find_unused_parameters=True
-        )
-        model_without_ddp = model.module
-
-    model_ema = None
-    if args.model_ema:
-        # Decay adjustment that aims to keep the decay independent from other hyper-parameters originally proposed at:
-        # https://github.com/facebookresearch/pycls/blob/f8cd9627/pycls/core/net.py#L123
-        #
-        # total_ema_updates = (Dataset_size / n_GPUs) * epochs / (batch_size_per_gpu * EMA_steps)
-        # We consider constant = Dataset_size for a given dataset/setup and ommit it. Thus:
-        # adjust = 1 / total_ema_updates ~= n_GPUs * batch_size_per_gpu * EMA_steps / epochs
-        adjust = args.world_size * args.batch_size * args.model_ema_steps / args.epochs
-        alpha = 1.0 - args.model_ema_decay
-        alpha = min(1.0, alpha * adjust)
-        model_ema = utils.ExponentialMovingAverage(
-            model_without_ddp, device=device, decay=1.0 - alpha
-        )
-
-    # TODO: need to test resume functionality
-    if args.resume:
-        checkpoint_pattern = os.path.join(args.output_dir, "model_*.pth")
-        checkpoint_files = glob.glob(checkpoint_pattern)
-        epochs = [int(f.split("_")[-1].split(".")[0]) for f in checkpoint_files]
-        if epochs:
-            latest_epoch = max(epochs)
-            latest_checkpoint = os.path.join(
-                args.output_dir, f"model_{latest_epoch}.pth"
-            )
-            try:
-                checkpoint = torch.load(latest_checkpoint, map_location="cpu")
-                model_without_ddp.load_state_dict(checkpoint["model"])
-                optimizer.load_state_dict(checkpoint["optimizer"])
-                lr_scheduler.load_state_dict(checkpoint["lr_scheduler"])
-                args.start_epoch = checkpoint["epoch"] + 1
-                if model_ema:
-                    model_ema.load_state_dict(checkpoint["model_ema"])
-                if scaler:
-                    scaler.load_state_dict(checkpoint["scaler"])
-                print(f"Resumed training from epoch {args.start_epoch}.")
-            except FileNotFoundError:
-                print(
-                    f"No checkpoint found at {latest_checkpoint}. Starting training from scratch."
-                )
-                args.start_epoch = 0
-        else:
-            print("No checkpoint found. Starting training from scratch.")
-            args.start_epoch = 0
-    else:
-        args.start_epoch = 0
-        print("Zero-shot evaluation")
-        if model_ema:
-            evaluate(
-                model_ema, criterion, data_loader_test, device=device, log_suffix="EMA"
-            )
-        else:
-            evaluate(model, criterion, data_loader_test, device=device)
-
-    print("Start training")
-    start_time = time.time()
-    for epoch in range(args.start_epoch, args.epochs):
-        if args.distributed:
-            train_sampler.set_epoch(epoch)
-        train_one_epoch(
-            model,
-            criterion,
-            optimizer,
-            data_loader,
-            device,
-            epoch,
-            args,
-            model_ema,
-            scaler,
-        )
-        lr_scheduler.step()
-        evaluate(model, criterion, data_loader_test, device=device)
-        if model_ema:
-            evaluate(
-                model_ema, criterion, data_loader_test, device=device, log_suffix="EMA"
-            )
-        if args.output_dir:
-            checkpoint = {
-                "model": model_without_ddp.state_dict(),
-                "optimizer": optimizer.state_dict(),
-                "lr_scheduler": lr_scheduler.state_dict(),
-                "epoch": epoch,
-                "args": args,
-            }
-            if sparsifier:
-                checkpoint["sparsifier"] = sparsifier.state_dict()
-            if model_ema:
-                checkpoint["model_ema"] = model_ema.state_dict()
-            if scaler:
-                checkpoint["scaler"] = scaler.state_dict()
-            utils.save_on_master(
-                checkpoint, os.path.join(args.output_dir, f"model_{epoch}.pth")
-            )
-            utils.save_on_master(
-                checkpoint, os.path.join(args.output_dir, "checkpoint.pth")
-            )
-
-    total_time = time.time() - start_time
-    total_time_str = str(datetime.timedelta(seconds=int(total_time)))
-    print(f"Training time {total_time_str}")
-
-
-if __name__ == "__main__":
-    args = utils.get_args_parser(train=True).parse_args()
-    main(args)
diff --git a/torchao/prototype/sparsity/superblock/utils.py b/torchao/prototype/sparsity/superblock/utils.py
deleted file mode 100644
index d00cdea510..0000000000
--- a/torchao/prototype/sparsity/superblock/utils.py
+++ /dev/null
@@ -1,1297 +0,0 @@
-#  Copyright (c) Meta Platforms, Inc. and affiliates.
-
-import argparse
-import copy
-import datetime
-import errno
-import hashlib
-import math
-import os
-import time
-from collections import OrderedDict, defaultdict, deque
-from typing import List, Optional, Tuple
-
-import torch
-from torchvision.transforms import autoaugment, transforms
-from torchvision.transforms import functional as F
-from torchvision.transforms.functional import InterpolationMode
-
-from torchao.prototype.sparsity.sparsifier.weight_norm_sparsifier import (
-    WeightNormSparsifier,
-)
-from torchao.prototype.sparsity.superblock.blocksparse import block_sparse_weight
-from torchao.prototype.sparsity.superblock.supermask import (
-    SupermaskLinear,
-    apply_supermask,
-)
-from torchao.quantization import int8_dynamic_activation_int8_weight, quantize_
-from torchao.sparsity import semi_sparse_weight, sparsify_
-
-
-def get_args_parser(train=False, evaluate=False, benchmark=False):
-    assert sum([train, evaluate, benchmark]) == 1, (
-        "One and only one of training, evaluation, or benchmark can be true"
-    )
-
-    # Shared common args
-    parser = argparse.ArgumentParser(
-        description="SuperBlock Imagenet Training/Evaluation/Benchmarking Script",
-        add_help=True,
-    )
-    parser.add_argument("--data-path", type=str, help="IMAGENET dataset path")
-    parser.add_argument(
-        "--model",
-        default="vit_b_16",
-        choices=["vit_b_16", "vit_h_14"],
-        type=str,
-        help="ViT base model",
-    )
-    parser.add_argument(
-        "--device", default="cuda", type=str, help="device (Default: cuda)"
-    )
-    parser.add_argument(
-        "-b", "--batch-size", default=32, type=int, help="per device batch size"
-    )
-    parser.add_argument(
-        "--val-crop-size",
-        default=224,
-        type=int,
-        help="the central crop size used for validation (default: 224)",
-    )
-    parser.add_argument(
-        "--sparsity",
-        choices=["bsr", "semi_structured"],
-        default=None,
-        help="weight sparsification to apply",
-    )
-    parser.add_argument(
-        "--bsr",
-        type=int,
-        nargs="?",
-        const=256,
-        default=None,
-        help="Convert sparsified weights to BSR format with optional block size (default: 256)",
-    )
-    parser.add_argument("--sparsity-linear", type=float, default=0.0)
-    parser.add_argument("--sparsity-conv1x1", type=float, default=0.0)
-    parser.add_argument("--sparsity-conv", type=float, default=0.0)
-    parser.add_argument(
-        "--skip-last-layer-sparsity",
-        action="store_true",
-        help="Skip applying sparsity to the last linear layer (for vit only)",
-    )
-    parser.add_argument(
-        "--skip-first-transformer-sparsity",
-        action="store_true",
-        help="Skip applying sparsity to the first transformer layer (for vit only)",
-    )
-    parser.add_argument(
-        "--quantization", action="store_true", help="Run with int8 dynamic quantization"
-    )
-    parser.add_argument(
-        "--weights", default=None, type=str, help="the weights enum name to load"
-    )
-    parser.add_argument(
-        "--weights-path",
-        type=str,
-        help="optional checkpoint to load weights after intialization",
-    )
-    parser.add_argument(
-        "--header", action="store_true", help="Print header for first run"
-    )
-
-    # Eval a subset of training args
-    # lots of training args
-    if train or evaluate:
-        parser.add_argument(
-            "-j",
-            "--workers",
-            default=16,
-            type=int,
-            metavar="N",
-            help="number of data loading workers",
-        )
-        parser.add_argument(
-            "--accumulation-steps",
-            default=1,
-            type=int,
-            help="Number of steps to accumulate gradients over",
-        )
-        parser.add_argument(
-            "--epochs",
-            default=90,
-            type=int,
-            metavar="N",
-            help="number of total epochs to run",
-        )
-        parser.add_argument("--opt", default="sgd", type=str, help="optimizer")
-        parser.add_argument(
-            "--lr", default=0.1, type=float, help="initial learning rate"
-        )
-        parser.add_argument(
-            "--momentum", default=0.9, type=float, metavar="M", help="momentum"
-        )
-        parser.add_argument(
-            "--wd",
-            "--weight-decay",
-            default=1e-4,
-            type=float,
-            metavar="W",
-            help="weight decay",
-            dest="weight_decay",
-        )
-        parser.add_argument(
-            "--norm-weight-decay",
-            default=None,
-            type=float,
-            help="weight decay for Normalization layers (default: None, same value as --wd)",
-        )
-        parser.add_argument(
-            "--bias-weight-decay",
-            default=None,
-            type=float,
-            help="weight decay for bias parameters of all layers (default: None, same value as --wd)",
-        )
-        parser.add_argument(
-            "--transformer-embedding-decay",
-            default=None,
-            type=float,
-            help="weight decay for embedding parameters for vision transformer models (default: None, same value as --wd)",
-        )
-        parser.add_argument(
-            "--label-smoothing",
-            default=0.0,
-            type=float,
-            help="label smoothing (default: 0.0)",
-            dest="label_smoothing",
-        )
-        parser.add_argument(
-            "--mixup-alpha", default=0.0, type=float, help="mixup alpha (default: 0.0)"
-        )
-        parser.add_argument(
-            "--cutmix-alpha",
-            default=0.0,
-            type=float,
-            help="cutmix alpha (default: 0.0)",
-        )
-        parser.add_argument(
-            "--lr-scheduler",
-            default="steplr",
-            type=str,
-            help="the lr scheduler (default: steplr)",
-        )
-        parser.add_argument(
-            "--lr-warmup-epochs",
-            default=0,
-            type=int,
-            help="the number of epochs to warmup (default: 0)",
-        )
-        parser.add_argument(
-            "--lr-warmup-method",
-            default="constant",
-            type=str,
-            help="the warmup method (default: constant)",
-        )
-        parser.add_argument(
-            "--lr-warmup-decay", default=0.01, type=float, help="the decay for lr"
-        )
-        parser.add_argument(
-            "--lr-step-size",
-            default=30,
-            type=int,
-            help="decrease lr every step-size epochs",
-        )
-        parser.add_argument(
-            "--lr-gamma",
-            default=0.1,
-            type=float,
-            help="decrease lr by a factor of lr-gamma",
-        )
-        parser.add_argument(
-            "--lr-min",
-            default=0.0,
-            type=float,
-            help="minimum lr of lr schedule (default: 0.0)",
-        )
-        parser.add_argument(
-            "--print-freq", default=10, type=int, help="print frequency"
-        )
-        parser.add_argument(
-            "--output-dir", default=".", type=str, help="path to save outputs"
-        )
-        parser.add_argument(
-            "--resume",
-            action="store_true",
-            help='Resumes training from latest available checkpoint ("model_<epoch>.pth")',
-        )
-        parser.add_argument(
-            "--start-epoch", default=0, type=int, metavar="N", help="start epoch"
-        )
-        parser.add_argument(
-            "--cache-dataset",
-            dest="cache_dataset",
-            help="Cache the datasets for quicker initialization. It also serializes the transforms",
-            action="store_true",
-        )
-        parser.add_argument(
-            "--sync-bn", dest="sync_bn", help="Use sync batch norm", action="store_true"
-        )
-        parser.add_argument(
-            "--auto-augment",
-            default=None,
-            type=str,
-            help="auto augment policy (default: None)",
-        )
-        parser.add_argument(
-            "--ra-magnitude",
-            default=9,
-            type=int,
-            help="magnitude of auto augment policy",
-        )
-        parser.add_argument(
-            "--augmix-severity", default=3, type=int, help="severity of augmix policy"
-        )
-        parser.add_argument(
-            "--random-erase",
-            default=0.0,
-            type=float,
-            help="random erasing probability (default: 0.0)",
-        )
-        # Mixed precision training parameters
-        parser.add_argument(
-            "--amp",
-            action="store_true",
-            help="Use torch.cuda.amp for mixed precision training",
-        )
-        # distributed training parameters
-        parser.add_argument(
-            "--world-size", default=1, type=int, help="number of distributed processes"
-        )
-        parser.add_argument(
-            "--dist-url",
-            default="env://",
-            type=str,
-            help="url used to set up distributed training",
-        )
-        parser.add_argument(
-            "--model-ema",
-            action="store_true",
-            help="enable tracking Exponential Moving Average of model parameters",
-        )
-        parser.add_argument(
-            "--model-ema-steps",
-            type=int,
-            default=32,
-            help="the number of iterations that controls how often to update the EMA model (default: 32)",
-        )
-        parser.add_argument(
-            "--model-ema-decay",
-            type=float,
-            default=0.99998,
-            help="decay factor for Exponential Moving Average of model parameters (default: 0.99998)",
-        )
-        parser.add_argument(
-            "--use-deterministic-algorithms",
-            action="store_true",
-            help="Forces the use of deterministic algorithms only.",
-        )
-        parser.add_argument(
-            "--interpolation",
-            default="bilinear",
-            type=str,
-            help="the interpolation method (default: bilinear)",
-        )
-        parser.add_argument(
-            "--val-resize-size",
-            default=256,
-            type=int,
-            help="the resize size used for validation (default: 256)",
-        )
-        parser.add_argument(
-            "--train-crop-size",
-            default=224,
-            type=int,
-            help="the random crop size used for training (default: 224)",
-        )
-        parser.add_argument(
-            "--clip-grad-norm",
-            default=None,
-            type=float,
-            help="the maximum gradient norm (default None)",
-        )
-        parser.add_argument(
-            "--ra-reps",
-            default=3,
-            type=int,
-            help="number of repetitions for Repeated Augmentation (default: 3)",
-        )
-        parser.add_argument(
-            "--meta", action="store_true", help="Use Meta internal imagenet structure"
-        )
-
-    if benchmark:
-        parser.add_argument(
-            "--dtype",
-            choices=["float32", "bfloat16", "float16"],
-            help="Data type",
-            default="bfloat16",
-        )
-        parser.add_argument(
-            "--tune-kernel-params",
-            action="store_true",
-            help="Tune kernel params for BSR",
-        )
-        parser.add_argument(
-            "--profile", action="store_true", help="Dump Prefetto trace"
-        )
-
-    return parser
-
-
-# filter functions
-def mlp_0_only(mod, name):
-    return isinstance(mod, torch.nn.Linear) and "mlp.0" in name
-
-
-def mlp_3_only(mod, name):
-    return isinstance(mod, torch.nn.Linear) and "mlp.3" in name
-
-
-def mlp_only(mod, name):
-    return isinstance(mod, torch.nn.Linear) and "mlp" in name
-
-
-def superblock_only(mod, name):
-    return isinstance(mod, SupermaskLinear) and "mlp" in name
-
-
-def mlp_only_with_args(
-    mod, name, skip_last_layer_sparsity=False, skip_first_transformer_sparsity=False
-):
-    if skip_last_layer_sparsity and "heads.head" in name:
-        return False
-    if skip_first_transformer_sparsity and "encoder.layers.encoder_layer_0" in name:
-        return False
-    if isinstance(mod, torch.nn.Linear) and "mlp" in name:
-        return True
-    return False
-
-
-### Custom sparsification utils
-def apply_sparsity(model):
-    for name, module in model.named_modules():
-        if isinstance(module, SupermaskLinear) and "mlp" in name:
-            module.sparsify_offline()
-
-
-def accelerate_with_sparsity(model, args):
-    if args.sparsity == "bsr":
-        apply_sparsity(model)
-        if args.quantization:
-            from torchao.dtypes import BlockSparseLayout
-
-            quantize_(
-                model,
-                int8_dynamic_activation_int8_weight(
-                    _layout=BlockSparseLayout(blocksize=args.bsr)
-                ),
-                superblock_only,
-            )
-        else:
-            assert args.bsr is not None, "BSR requires a block size"
-            sparsify_(model, block_sparse_weight(blocksize=args.bsr), superblock_only)
-    elif args.sparsity == "semi_structured":
-        if args.quantization:
-            from torchao.dtypes import SemiSparseLayout
-
-            quantize_(
-                model,
-                int8_dynamic_activation_int8_weight(layout=SemiSparseLayout()),
-                mlp_0_only,
-            )
-            sparsify_(model, semi_sparse_weight(), mlp_3_only)
-        else:
-            sparsify_(model, semi_sparse_weight(), mlp_only)
-    else:
-        if args.quantization:
-            quantize_(model, int8_dynamic_activation_int8_weight(), mlp_only)
-
-
-def simulate_sparsity(model, args):
-    if args.sparsity == "bsr":
-        apply_supermask(
-            model,
-            linear_sparsity=args.sparsity_linear,
-            linear_sp_tilesize=args.bsr,
-            conv1x1_sparsity=args.sparsity_conv1x1,
-            conv1x1_sp_tilesize=args.bsr,
-            conv_sparsity=args.sparsity_conv,
-            conv_sp_tilesize=args.bsr,
-            skip_last_layer_sparsity=args.skip_last_layer_sparsity,
-            skip_first_transformer_sparsity=args.skip_first_transformer_sparsity,
-            device=args.device,
-            verbose=False,
-        )
-    elif args.sparsity == "semi_structured":
-        sparse_config = []
-        for name, mod in model.named_modules():
-            if mlp_only_with_args(
-                mod,
-                name,
-                skip_first_transformer_sparsity=args.skip_first_transformer_sparsity,
-                skip_last_layer_sparsity=args.skip_last_layer_sparsity,
-            ):
-                sparse_config.append({"tensor_fqn": f"{name}.weight"})
-
-        sparsifier = WeightNormSparsifier(
-            sparsity_level=1.0, sparse_block_shape=(1, 4), zeros_per_block=2
-        )
-        sparsifier.prepare(model, sparse_config)
-        sparsifier.step()
-        return sparsifier
-
-
-# ------------------------------------------------------------
-# The following code contains torchvision reference code,
-# largely copied from: https://github.com/pytorch/vision/tree/main/references/classification
-# Please open issues in the original repository if you have questions.
-
-
-class SmoothedValue:
-    """Track a series of values and provide access to smoothed values over a
-    window or the global series average.
-    """
-
-    def __init__(self, window_size=20, fmt=None):
-        if fmt is None:
-            fmt = "{median:.4f} ({global_avg:.4f})"
-        self.deque = deque(maxlen=window_size)
-        self.total = 0.0
-        self.count = 0
-        self.fmt = fmt
-
-    def update(self, value, n=1):
-        self.deque.append(value)
-        self.count += n
-        self.total += value * n
-
-    def synchronize_between_processes(self):
-        """
-        Warning: does not synchronize the deque!
-        """
-        t = reduce_across_processes([self.count, self.total])
-        t = t.tolist()
-        self.count = int(t[0])
-        self.total = t[1]
-
-    @property
-    def median(self):
-        d = torch.tensor(list(self.deque))
-        return d.median().item()
-
-    @property
-    def avg(self):
-        d = torch.tensor(list(self.deque), dtype=torch.float32)
-        return d.mean().item()
-
-    @property
-    def global_avg(self):
-        return self.total / self.count
-
-    @property
-    def max(self):
-        return max(self.deque)
-
-    @property
-    def value(self):
-        return self.deque[-1]
-
-    def __str__(self):
-        return self.fmt.format(
-            median=self.median,
-            avg=self.avg,
-            global_avg=self.global_avg,
-            max=self.max,
-            value=self.value,
-        )
-
-
-class MetricLogger:
-    def __init__(self, delimiter="\t"):
-        self.meters = defaultdict(SmoothedValue)
-        self.delimiter = delimiter
-
-    def update(self, **kwargs):
-        for k, v in kwargs.items():
-            if isinstance(v, torch.Tensor):
-                v = v.item()
-            assert isinstance(v, (float, int))
-            self.meters[k].update(v)
-
-    def __getattr__(self, attr):
-        if attr in self.meters:
-            return self.meters[attr]
-        if attr in self.__dict__:
-            return self.__dict__[attr]
-        raise AttributeError(
-            f"'{type(self).__name__}' object has no attribute '{attr}'"
-        )
-
-    def __str__(self):
-        loss_str = []
-        for name, meter in self.meters.items():
-            loss_str.append(f"{name}: {str(meter)}")
-        return self.delimiter.join(loss_str)
-
-    def synchronize_between_processes(self):
-        for meter in self.meters.values():
-            meter.synchronize_between_processes()
-
-    def add_meter(self, name, meter):
-        self.meters[name] = meter
-
-    def log_every(self, iterable, print_freq, header=None):
-        i = 0
-        if not header:
-            header = ""
-        start_time = time.time()
-        end = time.time()
-        iter_time = SmoothedValue(fmt="{avg:.4f}")
-        data_time = SmoothedValue(fmt="{avg:.4f}")
-        space_fmt = ":" + str(len(str(len(iterable)))) + "d"
-        if torch.cuda.is_available():
-            log_msg = self.delimiter.join(
-                [
-                    header,
-                    "[{0" + space_fmt + "}/{1}]",
-                    "eta: {eta}",
-                    "{meters}",
-                    "time: {time}",
-                    "data: {data}",
-                    "max mem: {memory:.0f}",
-                ]
-            )
-        else:
-            log_msg = self.delimiter.join(
-                [
-                    header,
-                    "[{0" + space_fmt + "}/{1}]",
-                    "eta: {eta}",
-                    "{meters}",
-                    "time: {time}",
-                    "data: {data}",
-                ]
-            )
-        MB = 1024.0 * 1024.0
-        for obj in iterable:
-            data_time.update(time.time() - end)
-            yield obj
-            iter_time.update(time.time() - end)
-            if i % print_freq == 0:
-                eta_seconds = iter_time.global_avg * (len(iterable) - i)
-                eta_string = str(datetime.timedelta(seconds=int(eta_seconds)))
-                if torch.cuda.is_available():
-                    print(
-                        log_msg.format(
-                            i,
-                            len(iterable),
-                            eta=eta_string,
-                            meters=str(self),
-                            time=str(iter_time),
-                            data=str(data_time),
-                            memory=torch.cuda.max_memory_allocated() / MB,
-                        )
-                    )
-                else:
-                    print(
-                        log_msg.format(
-                            i,
-                            len(iterable),
-                            eta=eta_string,
-                            meters=str(self),
-                            time=str(iter_time),
-                            data=str(data_time),
-                        )
-                    )
-            i += 1
-            end = time.time()
-        total_time = time.time() - start_time
-        total_time_str = str(datetime.timedelta(seconds=int(total_time)))
-        print(f"{header} Total time: {total_time_str}")
-
-
-class ExponentialMovingAverage(torch.optim.swa_utils.AveragedModel):
-    """Maintains moving averages of model parameters using an exponential decay.
-    ``ema_avg = decay * avg_model_param + (1 - decay) * model_param``
-    `torch.optim.swa_utils.AveragedModel <https://pytorch.org/docs/stable/optim.html#custom-averaging-strategies>`_
-    is used to compute the EMA.
-    """
-
-    def __init__(self, model, decay, device="cpu"):
-        def ema_avg(avg_model_param, model_param, num_averaged):
-            return decay * avg_model_param + (1 - decay) * model_param
-
-        super().__init__(model, device, ema_avg, use_buffers=True)
-
-
-def accuracy(output, target, topk=(1,)):
-    """Computes the accuracy over the k top predictions for the specified values of k"""
-    with torch.inference_mode():
-        maxk = max(topk)
-        batch_size = target.size(0)
-        if target.ndim == 2:
-            target = target.max(dim=1)[1]
-
-        _, pred = output.topk(maxk, 1, True, True)
-        pred = pred.t()
-        correct = pred.eq(target[None])
-
-        res = []
-        for k in topk:
-            correct_k = correct[:k].flatten().sum(dtype=torch.float32)
-            res.append(correct_k * (100.0 / batch_size))
-        return res
-
-
-def mkdir(path):
-    try:
-        os.makedirs(path)
-    except OSError as e:
-        if e.errno != errno.EEXIST:
-            raise
-
-
-def setup_for_distributed(is_master):
-    """
-    This function disables printing when not in master process
-    """
-    import builtins as __builtin__
-
-    builtin_print = __builtin__.print
-
-    def print(*args, **kwargs):
-        force = kwargs.pop("force", False)
-        if is_master or force:
-            builtin_print(*args, **kwargs)
-
-    __builtin__.print = print
-
-
-def is_dist_avail_and_initialized():
-    if not torch.distributed.is_available():
-        return False
-    if not torch.distributed.is_initialized():
-        return False
-    return True
-
-
-def get_world_size():
-    if not is_dist_avail_and_initialized():
-        return 1
-    return torch.distributed.get_world_size()
-
-
-def get_rank():
-    if not is_dist_avail_and_initialized():
-        return 0
-    return torch.distributed.get_rank()
-
-
-def is_main_process():
-    return get_rank() == 0
-
-
-def save_on_master(*args, **kwargs):
-    if is_main_process():
-        torch.save(*args, **kwargs)
-
-
-def init_distributed_mode(args):
-    if "RANK" in os.environ and "WORLD_SIZE" in os.environ:
-        args.rank = int(os.environ["RANK"])
-        args.world_size = int(os.environ["WORLD_SIZE"])
-        args.gpu = int(os.environ["LOCAL_RANK"])
-    elif "SLURM_PROCID" in os.environ:
-        args.rank = int(os.environ["SLURM_PROCID"])
-        args.gpu = args.rank % torch.cuda.device_count()
-    elif hasattr(args, "rank"):
-        pass
-    else:
-        print("Not using distributed mode")
-        args.distributed = False
-        return
-
-    args.distributed = True
-
-    torch.cuda.set_device(args.gpu)
-    args.dist_backend = "nccl"
-    print(f"| distributed init (rank {args.rank})", flush=True)
-    torch.distributed.init_process_group(
-        backend=args.dist_backend,
-        init_method=args.dist_url,
-        world_size=args.world_size,
-        rank=args.rank,
-    )
-    torch.distributed.barrier()
-    setup_for_distributed(args.rank == 0)
-
-
-def average_checkpoints(inputs):
-    """Loads checkpoints from inputs and returns a model with averaged weights. Original implementation taken from:
-    https://github.com/pytorch/fairseq/blob/a48f235636557b8d3bc4922a6fa90f3a0fa57955/scripts/average_checkpoints.py#L16
-
-    Args:
-      inputs (List[str]): An iterable of string paths of checkpoints to load from.
-    Returns:
-      A dict of string keys mapping to various values. The 'model' key
-      from the returned dict should correspond to an OrderedDict mapping
-      string parameter names to torch Tensors.
-    """
-    params_dict = OrderedDict()
-    params_keys = None
-    new_state = None
-    num_models = len(inputs)
-    for fpath in inputs:
-        with open(fpath, "rb") as f:
-            state = torch.load(
-                f,
-                map_location=(
-                    lambda s, _: torch.serialization.default_restore_location(s, "cpu")
-                ),
-            )
-        # Copies over the settings from the first checkpoint
-        if new_state is None:
-            new_state = state
-        model_params = state["model"]
-        model_params_keys = list(model_params.keys())
-        if params_keys is None:
-            params_keys = model_params_keys
-        elif params_keys != model_params_keys:
-            raise KeyError(
-                f"For checkpoint {f}, expected list of params: {params_keys}, but found: {model_params_keys}"
-            )
-        for k in params_keys:
-            p = model_params[k]
-            if isinstance(p, torch.HalfTensor):
-                p = p.float()
-            if k not in params_dict:
-                params_dict[k] = p.clone()
-                # NOTE: clone() is needed in case of p is a shared parameter
-            else:
-                params_dict[k] += p
-    averaged_params = OrderedDict()
-    for k, v in params_dict.items():
-        averaged_params[k] = v
-        if averaged_params[k].is_floating_point():
-            averaged_params[k].div_(num_models)
-        else:
-            averaged_params[k] //= num_models
-    new_state["model"] = averaged_params
-    return new_state
-
-
-def store_model_weights(model, checkpoint_path, checkpoint_key="model", strict=True):
-    """
-    This method can be used to prepare weights files for new models. It receives as
-    input a model architecture and a checkpoint from the training script and produces
-    a file with the weights ready for release.
-
-    Examples:
-        from torchvision import models as M
-
-        # Classification
-        model = M.mobilenet_v3_large(weights=None)
-        print(store_model_weights(model, './class.pth'))
-
-        # Quantized Classification
-        model = M.quantization.mobilenet_v3_large(weights=None, quantize=False)
-        model.fuse_model(is_qat=True)
-        model.qconfig = torch.ao.quantization.get_default_qat_qconfig('qnnpack')
-        _ = torch.ao.quantization.prepare_qat(model, inplace=True)
-        print(store_model_weights(model, './qat.pth'))
-
-        # Object Detection
-        model = M.detection.fasterrcnn_mobilenet_v3_large_fpn(weights=None, weights_backbone=None)
-        print(store_model_weights(model, './obj.pth'))
-
-        # Segmentation
-        model = M.segmentation.deeplabv3_mobilenet_v3_large(weights=None, weights_backbone=None, aux_loss=True)
-        print(store_model_weights(model, './segm.pth', strict=False))
-
-    Args:
-        model (pytorch.nn.Module): The model on which the weights will be loaded for validation purposes.
-        checkpoint_path (str): The path of the checkpoint we will load.
-        checkpoint_key (str, optional): The key of the checkpoint where the model weights are stored.
-            Default: "model".
-        strict (bool): whether to strictly enforce that the keys
-            in :attr:`state_dict` match the keys returned by this module's
-            :meth:`~torch.nn.Module.state_dict` function. Default: ``True``
-
-    Returns:
-        output_path (str): The location where the weights are saved.
-    """
-    # Store the new model next to the checkpoint_path
-    checkpoint_path = os.path.abspath(checkpoint_path)
-    output_dir = os.path.dirname(checkpoint_path)
-
-    # Deep copy to avoid side-effects on the model object.
-    model = copy.deepcopy(model)
-    checkpoint = torch.load(checkpoint_path, map_location="cpu")
-
-    # Load the weights to the model to validate that everything works
-    # and remove unnecessary weights (such as auxiliaries, etc)
-    if checkpoint_key == "model_ema":
-        del checkpoint[checkpoint_key]["n_averaged"]
-        torch.nn.modules.utils.consume_prefix_in_state_dict_if_present(
-            checkpoint[checkpoint_key], "module."
-        )
-    model.load_state_dict(checkpoint[checkpoint_key], strict=strict)
-
-    tmp_path = os.path.join(output_dir, str(model.__hash__()))
-    torch.save(model.state_dict(), tmp_path)
-
-    sha256_hash = hashlib.sha256()
-    with open(tmp_path, "rb") as f:
-        # Read and update hash string value in blocks of 4K
-        for byte_block in iter(lambda: f.read(4096), b""):
-            sha256_hash.update(byte_block)
-        hh = sha256_hash.hexdigest()
-
-    output_path = os.path.join(output_dir, "weights-" + str(hh[:8]) + ".pth")
-    os.replace(tmp_path, output_path)
-
-    return output_path
-
-
-def reduce_across_processes(val):
-    if not is_dist_avail_and_initialized():
-        # nothing to sync, but we still convert to tensor for consistency with the distributed case.
-        return torch.tensor(val)
-
-    t = torch.tensor(val, device="cuda")
-    torch.distributed.barrier()
-    torch.distributed.all_reduce(t)
-    return t
-
-
-def set_weight_decay(
-    model: torch.nn.Module,
-    weight_decay: float,
-    norm_weight_decay: Optional[float] = None,
-    norm_classes: Optional[List[type]] = None,
-    custom_keys_weight_decay: Optional[List[Tuple[str, float]]] = None,
-):
-    if not norm_classes:
-        norm_classes = [
-            torch.nn.modules.batchnorm._BatchNorm,
-            torch.nn.LayerNorm,
-            torch.nn.GroupNorm,
-            torch.nn.modules.instancenorm._InstanceNorm,
-            torch.nn.LocalResponseNorm,
-        ]
-    norm_classes = tuple(norm_classes)
-
-    params = {
-        "other": [],
-        "norm": [],
-    }
-    params_weight_decay = {
-        "other": weight_decay,
-        "norm": norm_weight_decay,
-    }
-    custom_keys = []
-    if custom_keys_weight_decay is not None:
-        for key, weight_decay in custom_keys_weight_decay:
-            params[key] = []
-            params_weight_decay[key] = weight_decay
-            custom_keys.append(key)
-
-    def _add_params(module, prefix=""):
-        for name, p in module.named_parameters(recurse=False):
-            if not p.requires_grad:
-                continue
-            is_custom_key = False
-            for key in custom_keys:
-                target_name = (
-                    f"{prefix}.{name}" if prefix != "" and "." in key else name
-                )
-                if key == target_name:
-                    params[key].append(p)
-                    is_custom_key = True
-                    break
-            if not is_custom_key:
-                if norm_weight_decay is not None and isinstance(module, norm_classes):
-                    params["norm"].append(p)
-                else:
-                    params["other"].append(p)
-
-        for child_name, child_module in module.named_children():
-            child_prefix = f"{prefix}.{child_name}" if prefix != "" else child_name
-            _add_params(child_module, prefix=child_prefix)
-
-    _add_params(model)
-
-    param_groups = []
-    for key in params:
-        if len(params[key]) > 0:
-            param_groups.append(
-                {"params": params[key], "weight_decay": params_weight_decay[key]}
-            )
-    return param_groups
-
-
-# Presets for ImageNet training/eval taken from: https://github.com/pytorch/vision/blob/main/references/classification/presets.py
-
-
-class ClassificationPresetTrain:
-    def __init__(
-        self,
-        *,
-        crop_size,
-        mean=(0.485, 0.456, 0.406),
-        std=(0.229, 0.224, 0.225),
-        interpolation=InterpolationMode.BILINEAR,
-        hflip_prob=0.5,
-        auto_augment_policy=None,
-        ra_magnitude=9,
-        augmix_severity=3,
-        random_erase_prob=0.0,
-    ):
-        trans = [transforms.RandomResizedCrop(crop_size, interpolation=interpolation)]
-        if hflip_prob > 0:
-            trans.append(transforms.RandomHorizontalFlip(hflip_prob))
-        if auto_augment_policy is not None:
-            if auto_augment_policy == "ra":
-                trans.append(
-                    autoaugment.RandAugment(
-                        interpolation=interpolation, magnitude=ra_magnitude
-                    )
-                )
-            elif auto_augment_policy == "ta_wide":
-                trans.append(
-                    autoaugment.TrivialAugmentWide(interpolation=interpolation)
-                )
-            elif auto_augment_policy == "augmix":
-                trans.append(
-                    autoaugment.AugMix(
-                        interpolation=interpolation, severity=augmix_severity
-                    )
-                )
-            else:
-                aa_policy = autoaugment.AutoAugmentPolicy(auto_augment_policy)
-                trans.append(
-                    autoaugment.AutoAugment(
-                        policy=aa_policy, interpolation=interpolation
-                    )
-                )
-        trans.extend(
-            [
-                transforms.PILToTensor(),
-                transforms.ConvertImageDtype(torch.float),
-                transforms.Normalize(mean=mean, std=std),
-            ]
-        )
-        if random_erase_prob > 0:
-            trans.append(transforms.RandomErasing(p=random_erase_prob))
-
-        self.transforms = transforms.Compose(trans)
-
-    def __call__(self, img):
-        return self.transforms(img)
-
-
-class ClassificationPresetEval:
-    def __init__(
-        self,
-        *,
-        crop_size,
-        resize_size=256,
-        mean=(0.485, 0.456, 0.406),
-        std=(0.229, 0.224, 0.225),
-        interpolation=InterpolationMode.BILINEAR,
-    ):
-        self.transforms = transforms.Compose(
-            [
-                transforms.Resize(resize_size, interpolation=interpolation),
-                transforms.CenterCrop(crop_size),
-                transforms.PILToTensor(),
-                transforms.ConvertImageDtype(torch.float),
-                transforms.Normalize(mean=mean, std=std),
-            ]
-        )
-
-    def __call__(self, img):
-        return self.transforms(img)
-
-
-# transforms taken from: https://github.com/pytorch/vision/blob/main/references/classification/transforms.py
-
-
-class RandomMixup(torch.nn.Module):
-    """Randomly apply Mixup to the provided batch and targets.
-    The class implements the data augmentations as described in the paper
-    `"mixup: Beyond Empirical Risk Minimization" <https://arxiv.org/abs/1710.09412>`_.
-
-    Args:
-        num_classes (int): number of classes used for one-hot encoding.
-        p (float): probability of the batch being transformed. Default value is 0.5.
-        alpha (float): hyperparameter of the Beta distribution used for mixup.
-            Default value is 1.0.
-        inplace (bool): boolean to make this transform inplace. Default set to False.
-    """
-
-    def __init__(
-        self,
-        num_classes: int,
-        p: float = 0.5,
-        alpha: float = 1.0,
-        inplace: bool = False,
-    ) -> None:
-        super().__init__()
-
-        if num_classes < 1:
-            raise ValueError(
-                f"Please provide a valid positive value for the num_classes. Got num_classes={num_classes}"
-            )
-
-        if alpha <= 0:
-            raise ValueError("Alpha param can't be zero.")
-
-        self.num_classes = num_classes
-        self.p = p
-        self.alpha = alpha
-        self.inplace = inplace
-
-    def forward(
-        self, batch: torch.Tensor, target: torch.Tensor
-    ) -> Tuple[torch.Tensor, torch.Tensor]:
-        """
-        Args:
-            batch (Tensor): Float tensor of size (B, C, H, W)
-            target (Tensor): Integer tensor of size (B, )
-
-        Returns:
-            Tensor: Randomly transformed batch.
-        """
-        if batch.ndim != 4:
-            raise ValueError(f"Batch ndim should be 4. Got {batch.ndim}")
-        if target.ndim != 1:
-            raise ValueError(f"Target ndim should be 1. Got {target.ndim}")
-        if not batch.is_floating_point():
-            raise TypeError(f"Batch dtype should be a float tensor. Got {batch.dtype}.")
-        if target.dtype != torch.int64:
-            raise TypeError(f"Target dtype should be torch.int64. Got {target.dtype}")
-
-        if not self.inplace:
-            batch = batch.clone()
-            target = target.clone()
-
-        if target.ndim == 1:
-            target = torch.nn.functional.one_hot(
-                target, num_classes=self.num_classes
-            ).to(dtype=batch.dtype)
-
-        if torch.rand(1).item() >= self.p:
-            return batch, target
-
-        # It's faster to roll the batch by one instead of shuffling it to create image pairs
-        batch_rolled = batch.roll(1, 0)
-        target_rolled = target.roll(1, 0)
-
-        # Implemented as on mixup paper, page 3.
-        lambda_param = float(
-            torch._sample_dirichlet(torch.tensor([self.alpha, self.alpha]))[0]
-        )
-        batch_rolled.mul_(1.0 - lambda_param)
-        batch.mul_(lambda_param).add_(batch_rolled)
-
-        target_rolled.mul_(1.0 - lambda_param)
-        target.mul_(lambda_param).add_(target_rolled)
-
-        return batch, target
-
-    def __repr__(self) -> str:
-        s = (
-            f"{self.__class__.__name__}("
-            f"num_classes={self.num_classes}"
-            f", p={self.p}"
-            f", alpha={self.alpha}"
-            f", inplace={self.inplace}"
-            f")"
-        )
-        return s
-
-
-class RandomCutmix(torch.nn.Module):
-    """Randomly apply Cutmix to the provided batch and targets.
-    The class implements the data augmentations as described in the paper
-    `"CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features"
-    <https://arxiv.org/abs/1905.04899>`_.
-
-    Args:
-        num_classes (int): number of classes used for one-hot encoding.
-        p (float): probability of the batch being transformed. Default value is 0.5.
-        alpha (float): hyperparameter of the Beta distribution used for cutmix.
-            Default value is 1.0.
-        inplace (bool): boolean to make this transform inplace. Default set to False.
-    """
-
-    def __init__(
-        self,
-        num_classes: int,
-        p: float = 0.5,
-        alpha: float = 1.0,
-        inplace: bool = False,
-    ) -> None:
-        super().__init__()
-        if num_classes < 1:
-            raise ValueError(
-                "Please provide a valid positive value for the num_classes."
-            )
-        if alpha <= 0:
-            raise ValueError("Alpha param can't be zero.")
-
-        self.num_classes = num_classes
-        self.p = p
-        self.alpha = alpha
-        self.inplace = inplace
-
-    def forward(
-        self, batch: torch.Tensor, target: torch.Tensor
-    ) -> Tuple[torch.Tensor, torch.Tensor]:
-        """
-        Args:
-            batch (Tensor): Float tensor of size (B, C, H, W)
-            target (Tensor): Integer tensor of size (B, )
-
-        Returns:
-            Tensor: Randomly transformed batch.
-        """
-        if batch.ndim != 4:
-            raise ValueError(f"Batch ndim should be 4. Got {batch.ndim}")
-        if target.ndim != 1:
-            raise ValueError(f"Target ndim should be 1. Got {target.ndim}")
-        if not batch.is_floating_point():
-            raise TypeError(f"Batch dtype should be a float tensor. Got {batch.dtype}.")
-        if target.dtype != torch.int64:
-            raise TypeError(f"Target dtype should be torch.int64. Got {target.dtype}")
-
-        if not self.inplace:
-            batch = batch.clone()
-            target = target.clone()
-
-        if target.ndim == 1:
-            target = torch.nn.functional.one_hot(
-                target, num_classes=self.num_classes
-            ).to(dtype=batch.dtype)
-
-        if torch.rand(1).item() >= self.p:
-            return batch, target
-
-        # It's faster to roll the batch by one instead of shuffling it to create image pairs
-        batch_rolled = batch.roll(1, 0)
-        target_rolled = target.roll(1, 0)
-
-        # Implemented as on cutmix paper, page 12 (with minor corrections on typos).
-        lambda_param = float(
-            torch._sample_dirichlet(torch.tensor([self.alpha, self.alpha]))[0]
-        )
-        _, H, W = F.get_dimensions(batch)
-
-        r_x = torch.randint(W, (1,))
-        r_y = torch.randint(H, (1,))
-
-        r = 0.5 * math.sqrt(1.0 - lambda_param)
-        r_w_half = int(r * W)
-        r_h_half = int(r * H)
-
-        x1 = int(torch.clamp(r_x - r_w_half, min=0))
-        y1 = int(torch.clamp(r_y - r_h_half, min=0))
-        x2 = int(torch.clamp(r_x + r_w_half, max=W))
-        y2 = int(torch.clamp(r_y + r_h_half, max=H))
-
-        batch[:, :, y1:y2, x1:x2] = batch_rolled[:, :, y1:y2, x1:x2]
-        lambda_param = float(1.0 - (x2 - x1) * (y2 - y1) / (W * H))
-
-        target_rolled.mul_(1.0 - lambda_param)
-        target.mul_(lambda_param).add_(target_rolled)
-
-        return batch, target
-
-    def __repr__(self) -> str:
-        s = (
-            f"{self.__class__.__name__}("
-            f"num_classes={self.num_classes}"
-            f", p={self.p}"
-            f", alpha={self.alpha}"
-            f", inplace={self.inplace}"
-            f")"
-        )
-        return s
-
-
-# RA Sampler implementaion taken from: https://github.com/pytorch/vision/blob/main/references/classification/sampler.py
-
-
-class RASampler(torch.utils.data.Sampler):
-    """Sampler that restricts data loading to a subset of the dataset for distributed,
-    with repeated augmentation.
-    It ensures that different each augmented version of a sample will be visible to a
-    different process (GPU).
-    Heavily based on 'torch.utils.data.DistributedSampler'.
-
-    This is borrowed from the DeiT Repo:
-    https://github.com/facebookresearch/deit/blob/main/samplers.py
-    """
-
-    def __init__(
-        self, dataset, num_replicas=None, rank=None, shuffle=True, seed=0, repetitions=3
-    ):
-        if num_replicas is None:
-            if not torch.distributed.is_available():
-                raise RuntimeError("Requires distributed package to be available!")
-            num_replicas = torch.distributed.get_world_size()
-        if rank is None:
-            if not torch.distributed.is_available():
-                raise RuntimeError("Requires distributed package to be available!")
-            rank = torch.distributed.get_rank()
-        self.dataset = dataset
-        self.num_replicas = num_replicas
-        self.rank = rank
-        self.epoch = 0
-        self.num_samples = int(
-            math.ceil(len(self.dataset) * float(repetitions) / self.num_replicas)
-        )
-        self.total_size = self.num_samples * self.num_replicas
-        self.num_selected_samples = int(
-            math.floor(len(self.dataset) // 256 * 256 / self.num_replicas)
-        )
-        self.shuffle = shuffle
-        self.seed = seed
-        self.repetitions = repetitions
-
-    def __iter__(self):
-        if self.shuffle:
-            # Deterministically shuffle based on epoch
-            g = torch.Generator()
-            g.manual_seed(self.seed + self.epoch)
-            indices = torch.randperm(len(self.dataset), generator=g).tolist()
-        else:
-            indices = list(range(len(self.dataset)))
-
-        # Add extra samples to make it evenly divisible
-        indices = [ele for ele in indices for i in range(self.repetitions)]
-        indices += indices[: (self.total_size - len(indices))]
-        assert len(indices) == self.total_size
-
-        # Subsample
-        indices = indices[self.rank : self.total_size : self.num_replicas]
-        assert len(indices) == self.num_samples
-
-        return iter(indices[: self.num_selected_samples])
-
-    def __len__(self):
-        return self.num_selected_samples
-
-    def set_epoch(self, epoch):
-        self.epoch = epoch

From 488c856ebf5e186d0487313b9599f91c7afc0e8c Mon Sep 17 00:00:00 2001
From: Lisa Jin <lisjin@users.noreply.github.com>
Date: Mon, 16 Jun 2025 10:23:41 -0700
Subject: [PATCH 122/165] Test PARQ with torchao activation quantization
 (#2370)

* Test PARQ with torchao activation quantization

* Replace assertTrue with torch.testing.assert_close
---
 test/prototype/test_parq.py                   | 89 +++++++++++++++++--
 .../prototype/parq/quant/uniform_torchao.py   | 44 +++++----
 2 files changed, 102 insertions(+), 31 deletions(-)

diff --git a/test/prototype/test_parq.py b/test/prototype/test_parq.py
index 83c60ccf12..68c25821ee 100644
--- a/test/prototype/test_parq.py
+++ b/test/prototype/test_parq.py
@@ -27,8 +27,15 @@
 )
 from torchao.prototype.parq.quant.uniform_torchao import _BIT_WIDTH_TO_DTYPE
 from torchao.quantization.granularity import PerGroup
+from torchao.quantization.qat import (
+    FakeQuantizeConfig,
+    FromIntXQuantizationAwareTrainingConfig,
+    IntXQuantizationAwareTrainingConfig,
+)
 from torchao.quantization.quant_api import (
+    Int8DynamicActivationIntxWeightConfig,
     IntxWeightOnlyConfig,
+    MappingType,
     _is_linear,
     int4_weight_only,
     quantize_,
@@ -68,9 +75,9 @@ def build_param_groups(model, b: int = 2, group_size: Optional[int] = None):
 
 
 class M(nn.Module):
-    def __init__(self, m=256, n=128, k=16, bias=False):
+    def __init__(self, m=256, n=128, k=16, bias=False, embedding=True):
         super().__init__()
-        self.embedding = nn.Embedding(10, m)
+        self.embedding = nn.Embedding(10, m) if embedding else nn.Identity()
         self.linear1 = nn.Linear(m, n, bias=bias)
         self.linear2 = nn.Linear(n, k, bias=bias)
         self.relu = nn.ReLU()
@@ -83,7 +90,11 @@ def reset_parameters(self):
                 nn.init.zeros_(module.bias)
 
     def example_inputs(self, device=None):
-        return torch.randint(1, 10, (1, 256), device=device)
+        return (
+            torch.randint(1, 10, (1, self.linear1.in_features), device=device)
+            if isinstance(self.embedding, nn.Embedding)
+            else torch.randn(1, self.linear1.in_features, device=device)
+        )
 
     def forward(self, x):
         x = self.embedding(x)
@@ -150,11 +161,11 @@ def compare_quantized_models(
             p = p.view(-1, group_size)
 
             q, Q = quantizer.quantize(p, b=b, dim=-1)
-            q = q.view(original_shape)
 
             # compare to AffineQuantizedTensor instance
+            q = q.view(original_shape)
             ref = getattr(m_ref, n).weight.dequantize()
-            self.assertTrue(q.equal(ref))
+            torch.testing.assert_close(q, ref, atol=0, rtol=0)
 
     def compare_parq_convert(
         self,
@@ -182,13 +193,13 @@ def compare_parq_convert(
             p = module.weight.dequantize()  # PARQ weight after quantize_
             p_ref = getattr(m_ref, n).weight.dequantize()  # native quantize_
 
-            self.assertTrue(p_orig.equal(p_ref))
-            self.assertTrue(p.equal(p_ref))
+            torch.testing.assert_true(p_orig, p_ref, atol=0, rtol=0)
+            torch.testing.assert_true(p, p_ref, atol=0, rtol=0)
 
     @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_4, "Test only enabled for 2.4+")
     @common_utils.parametrize("group_size", [32, 256])
     def test_int4_weight_only(self, group_size: int = 32):
-        model = M(m=512, n=512).to(torch.bfloat16).to(_DEVICE)
+        model = M(m=512, n=512).to(_DEVICE, dtype=torch.bfloat16)
         model.reset_parameters()
 
         m_ref = copy.deepcopy(model).eval().to(_DEVICE)
@@ -265,8 +276,70 @@ def test_intx_weight_only_e2e(self, b: int = 2, group_size: int = 32):
         self.compare_parq_convert(model, m_ref, optimizer, config)
 
 
+class TestInt8DynamicActivationTorchaoQuantizer(common_utils.TestCase):
+    def setUp(self):
+        torch.manual_seed(123)
+
+    @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_6, "Test only enabled for 2.6+")
+    @common_utils.parametrize("b", [2, 3, 4, 8])
+    @common_utils.parametrize("model_dtype", [torch.float16, torch.float32])
+    @common_utils.parametrize("group_size", [32, 128])
+    def test_int8_dynamic_activation_intx_e2e(
+        self,
+        b: int = 2,
+        model_dtype: torch.dtype = torch.float32,
+        group_size: int = 32,
+    ):
+        model = M(embedding=False).to(_DEVICE, dtype=model_dtype)
+        x = model.example_inputs(device=_DEVICE).to(model_dtype)
+
+        # reference model using native quantization
+        m_ref = copy.deepcopy(model).eval().to(_DEVICE)
+        quantizer = UnifTorchaoQuantizer()
+        config = Int8DynamicActivationIntxWeightConfig(
+            weight_dtype=_BIT_WIDTH_TO_DTYPE[b],
+            weight_granularity=PerGroup(group_size),
+            weight_mapping_type=quantizer.mapping_type,
+            act_mapping_type=MappingType.ASYMMETRIC,
+        )
+        quantize_(m_ref, config)
+        ref_out = m_ref(x)
+
+        # quantize weights with PARQ
+        base_optimizer = torch.optim.SGD(build_param_groups(model, b, group_size))
+        optimizer = QuantOptimizer(
+            base_optimizer, quantizer, ProxHardQuant(), quant_per_channel=True
+        )
+        optimizer.zero_grad()
+        optimizer.step()
+
+        # apply torchao quantized activations on top
+        activation_config = FakeQuantizeConfig(
+            torch.int8,
+            granularity="per_token",
+            mapping_type=config.act_mapping_type,
+        )
+        filter_fn = optimizer.get_filter_fn(model)
+        quantize_(
+            model,
+            IntXQuantizationAwareTrainingConfig(activation_config=activation_config),
+            filter_fn=filter_fn,
+        )
+        out = model(x)
+        torch.testing.assert_close(out, ref_out, atol=0, rtol=0)
+
+        # equivalent to torchao's convert step
+        model.eval()
+        optimizer.restore_latent_params()
+        quantize_(model, FromIntXQuantizationAwareTrainingConfig(), filter_fn=filter_fn)
+        quantize_(model, config, filter_fn=filter_fn)
+        converted_out = model(x)
+        torch.testing.assert_close(converted_out, ref_out, atol=0, rtol=0)
+
+
 common_utils.instantiate_parametrized_tests(TestPARQuantization)
 common_utils.instantiate_parametrized_tests(TestUnifTorchaoQuantizer)
+common_utils.instantiate_parametrized_tests(TestInt8DynamicActivationTorchaoQuantizer)
 
 
 if __name__ == "__main__":
diff --git a/torchao/prototype/parq/quant/uniform_torchao.py b/torchao/prototype/parq/quant/uniform_torchao.py
index a71ac8b5b3..4f90f9cb92 100644
--- a/torchao/prototype/parq/quant/uniform_torchao.py
+++ b/torchao/prototype/parq/quant/uniform_torchao.py
@@ -50,8 +50,23 @@ def __init__(
         self.quant_min = quant_min
         self.quant_max = quant_max
         self.eps = eps
-        self.preserve_zero = preserve_zero
-        self.zero_point_domain = zero_point_domain
+
+        # defaults: zero_point_domain=ZeroPointDomain.INT, preserve_zero=True
+        self._choose_qparams = choose_qparams_affine
+        self._quantize = quantize_affine
+        self._dequantize = dequantize_affine
+
+        if zero_point_domain == ZeroPointDomain.FLOAT and not preserve_zero:
+            self._choose_qparams = choose_qparams_affine_tinygemm
+            self._quantize = quantize_affine_tinygemm
+            self._dequantize = dequantize_affine_tinygemm
+        elif zero_point_domain == ZeroPointDomain.INT and not preserve_zero:
+            self._choose_qparams = choose_qparams_affine_dont_preserve_zero
+            self._quantize = quantize_affine
+            self._dequantize = dequantize_affine
+        elif zero_point_domain == ZeroPointDomain.NONE:
+            self._quantize = quantize_affine_no_zero_point
+            self._dequantize = dequantize_affine_no_zero_point
 
     def _init_quant_min_max(self, b: int) -> None:
         if self.quant_min is None or self.quant_max is None:
@@ -74,24 +89,7 @@ def quantize(
         # assume that p has already been grouped in QuantOptimizer.step
         block_size = (1, p.size(-1)) if dim is not None else p.size()
 
-        if self.zero_point_domain == ZeroPointDomain.FLOAT and not self.preserve_zero:
-            _choose_qparams_affine = choose_qparams_affine_tinygemm
-            _quantize_affine = quantize_affine_tinygemm
-            _dequantize_affine = dequantize_affine_tinygemm
-        elif self.zero_point_domain == ZeroPointDomain.INT and not self.preserve_zero:
-            _choose_qparams_affine = choose_qparams_affine_dont_preserve_zero
-            _quantize_affine = quantize_affine
-            _dequantize_affine = dequantize_affine
-        else:  # Default case: zero_point_domain == ZeroPointDomain.INT/NONE and preserve_zero
-            _choose_qparams_affine = choose_qparams_affine
-            if self.zero_point_domain == ZeroPointDomain.INT:
-                _quantize_affine = quantize_affine
-                _dequantize_affine = dequantize_affine
-            else:
-                _quantize_affine = quantize_affine_no_zero_point
-                _dequantize_affine = dequantize_affine_no_zero_point
-
-        s, zero_point = _choose_qparams_affine(
+        s, zero_point = self._choose_qparams(
             p,
             self.mapping_type,
             block_size,
@@ -101,13 +99,13 @@ def quantize(
             quant_max=self.quant_max,
         )
         q_args = (block_size, s, zero_point, self.target_dtype)
-        q = _quantize_affine(
+        q = self._quantize(
             p,
             *q_args,
             quant_min=self.quant_min,
             quant_max=self.quant_max,
         )
-        q = _dequantize_affine(
+        q = self._dequantize(
             q,
             *q_args,
             output_dtype=p.dtype,
@@ -124,7 +122,7 @@ def quantize(
         else:
             block_size = Q.shape
 
-        Q = _dequantize_affine(
+        Q = self._dequantize(
             Q,
             block_size,
             *q_args[1:],

From 5239ce7e64ff71f5b3f8affb95a137fe7200a6a0 Mon Sep 17 00:00:00 2001
From: andrewor14 <andrewor14@gmail.com>
Date: Mon, 16 Jun 2025 13:46:07 -0400
Subject: [PATCH 123/165] Revamp README (#2374)
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

## Major changes:
- Added performance highlights to the top
- Added Latest News and Quick Start section
- Moved Integrations to the top
- Added key features
- Updated overall messaging to match TorchAO paper
- Added more tags to look more official
- Condensed and hid some sections with too much detail
- General formatting fixes and visual improvements

## Before:
<img width="654" alt="Screenshot 2025-06-13 at 5 07 41 PM" src="https://github.com/user-attachments/assets/279d952f-146b-42af-b559-31c63b4c98a3" />

## After:
<img width="658" alt="Screenshot 2025-06-13 at 5 07 21 PM" src="https://github.com/user-attachments/assets/e97ba53e-b8cf-4d45-a616-ba5c6e73e1e9" />
---
 README.md | 274 +++++++++++++++++++++++++++++-------------------------
 1 file changed, 146 insertions(+), 128 deletions(-)

diff --git a/README.md b/README.md
index 691594a933..d269c3974e 100644
--- a/README.md
+++ b/README.md
@@ -1,40 +1,133 @@
-# torchao: PyTorch Architecture Optimization
+<div align="center">
 
+# TorchAO
+
+</div>
+
+### PyTorch-Native Training-to-Serving Model Optimization
+- Pre-train Llama-3.1-70B **1.5x faster** with float8 training
+- Recover **77% of quantized perplexity degradation** on Llama-3.2-3B with QAT
+- Quantize Llama-3-8B to int4 for **1.89x faster** inference with **58% less memory**
+
+<div align="center">
+
+[![](https://img.shields.io/badge/CodeML_%40_ICML-2025-blue)](https://codeml-workshop.github.io/codeml2025/)
 [![](https://dcbadge.vercel.app/api/server/gpumode?style=flat&label=TorchAO%20in%20GPU%20Mode)](https://discord.com/channels/1189498204333543425/1205223658021458100)
+[![](https://img.shields.io/github/contributors-anon/pytorch/ao?color=yellow&style=flat-square)](https://github.com/pytorch/ao/graphs/contributors)
+[![](https://img.shields.io/badge/torchao-documentation-blue?color=DE3412)](https://docs.pytorch.org/ao/stable/index.html)
+[![license](https://img.shields.io/badge/license-BSD_3--Clause-lightgrey.svg)](./LICENSE)
+
+[Latest News](#-latest-news) | [Overview](#-overview) | [Quick Start](#-quick-start)  | [Integrations](#-integrations) | [Inference](#-inference) | [Training](#-training) | [Videos](#-videos) | [Citation](#-citation)
+
+</div>
+
+
+## 📣 Latest News
+
+- [Jun 25] Our [TorchAO paper](https://codeml-workshop.github.io/codeml2025/) was accepted to CodeML @ ICML 2025!
+- [Apr 25] Float8 rowwise training yielded [1.34-1.43x training speedup](https://pytorch.org/blog/accelerating-large-scale-training-and-convergence-with-pytorch-float8-rowwise-on-crusoe-2k-h200s/) at 2k H100 GPU scale
+- [Apr 25] TorchAO is added as a [quantization backend to vLLM](https://docs.vllm.ai/en/latest/features/quantization/torchao.html) ([docs](https://docs.vllm.ai/en/latest/features/quantization/torchao.html))!
+- [Mar 25] Our [2:4 Sparsity paper](https://openreview.net/pdf?id=O5feVk7p6Y) was accepted to SLLM @ ICLR 2025!
+- [Jan 25] Our [integration with GemLite and SGLang](https://pytorch.org/blog/accelerating-llm-inference/) yielded 1.1-2x faster inference with int4 and float8 quantization across different batch sizes and tensor parallel sizes
+- [Jan 25] We added [1-8 bit ARM CPU kernels](https://pytorch.org/blog/hi-po-low-bit-operators/) for linear and embedding ops
+
+<details>
+  <summary>Older news</summary>
 
+- [Nov 24] We achieved [1.43-1.51x faster pre-training](https://pytorch.org/blog/training-using-float8-fsdp2/) on Llama-3.1-70B and 405B using float8 training
+- [Oct 24] TorchAO is added as a quantization backend to HF Transformers!
+- [Sep 24] We officially launched TorchAO. Check out our blog [here](https://pytorch.org/blog/pytorch-native-architecture-optimization/)!
+- [Jul 24] QAT [recovered up to 96% accuracy degradation](https://pytorch.org/blog/quantization-aware-training/) from quantization on Llama-3-8B
+- [Jun 24] Semi-structured 2:4 sparsity [achieved 1.1x inference speedup and 1.3x training speedup](https://pytorch.org/blog/accelerating-neural-network-training/) on the SAM and ViT models respectively
+- [Jun 24] Block sparsity [achieved 1.46x training speeedup](https://pytorch.org/blog/speeding-up-vits/) on the ViT model with <2% drop in accuracy
 
-[Introduction](#introduction) | [Inference](#inference) | [Training](#training)  | [Installation](#installation) |[Composability](#composability) | [Prototype Features](#prototype-features)  | [Integrations](#integrations) | [Videos](#videos) | [For Developers](#for-developers) | [License](#license) | [Citation](#citation)
+</details>
 
-## Introduction
 
-`torchao` accelerates PyTorch models with minimal code changes through advanced quantization and sparsification techniques. Optimize weights, gradients, activations, and more for both inference and training.
+## 🌅 Overview
 
-From the team that brought you the fast series
+TorchAO is a PyTorch-native model optimization framework leveraging quantization and sparsity to provide an end-to-end, training-to-serving workflow
+for AI models. TorchAO works out-of-the-box with `torch.compile()` and `FSDP2` across most HuggingFace PyTorch models. Key features include:
+* Float8 [training](torchao/float8/README.md) and [inference](https://docs.pytorch.org/ao/main/generated/torchao.quantization.Float8DynamicActivationFloat8WeightConfig.html) for speedups without compromising accuracy
+* [MX training and inference](torchao/prototype/mx_formats/README.md), provides MX tensor formats based on native PyTorch MX dtypes (prototype)
+* [Quantization-Aware Training (QAT)](torchao/quantization/qat/README.md) for mitigating quantization degradation
+* [Post-Training Quantization (PTQ)](torchao/quantization/README.md) for int4, int8, fp6 etc, with matching kernels targeting a variety of backends including CUDA, ARM CPU, and XNNPACK
+* [Sparsity](torchao/sparsity/README.md), includes different techniques such as 2:4 sparsity and block sparsity
+
+Check out our [docs](https://docs.pytorch.org/ao/main/) for more details!
+
+From the team that brought you the fast series:
 * 9.5x inference speedups for Image segmentation models with [sam-fast](https://pytorch.org/blog/accelerating-generative-ai)
 * 10x inference speedups for Language models with [gpt-fast](https://pytorch.org/blog/accelerating-generative-ai-2)
 * 3x inference speedup for Diffusion models with [sd-fast](https://pytorch.org/blog/accelerating-generative-ai-3)
 * 2.7x inference speedup for FAIR’s Seamless M4T-v2 model with [seamlessv2-fast](https://pytorch.org/blog/accelerating-generative-ai-4/)
 
-`torchao` isn't just for inference - it delivers substantial speedups at scale, from [up to 1.5x speedups](https://pytorch.org/blog/training-using-float8-fsdp2/) on 512 GPU clusters, to [1.34-1.43x speedups](https://pytorch.org/blog/accelerating-large-scale-training-and-convergence-with-pytorch-float8-rowwise-on-crusoe-2k-h200s/) on 2K H200 clusters with the latest `torchao.float8` rowwise
 
-`torchao` works out-of-the-box with `torch.compile()` and `FSDP2` across most Hugging Face PyTorch models
+## 🚀 Quick Start
+
+First, install TorchAO. We recommend installing the latest stable version:
+```
+pip install torchao
+```
+
+<details>
+  <summary>Other installation options</summary>
+
+  ```
+  # Nightly
+  pip install --pre torchao --index-url https://download.pytorch.org/whl/nightly/cu126
+  
+  # Different CUDA versions
+  pip install torchao --index-url https://download.pytorch.org/whl/cu126  # CUDA 12.6
+  pip install torchao --index-url https://download.pytorch.org/whl/cpu    # CPU only
+
+  # For developers
+  USE_CUDA=1 python setup.py develop
+  ```
 
+</details>
 
-## Inference
+Quantize your model weights to int4!
+```
+from torchao.quantization import Int4WeightOnlyConfig, quantize_
+quantize_(model, Int4WeightOnlyConfig(group_size=32))
+```
+Compared to a `torch.compiled` bf16 baseline, your quantized model should be significantly smaller and faster on a single A100 GPU:
+```
+int4 model size: 1.25 MB
+bfloat16 model size: 4.00 MB
+compression ratio: 3.2
+
+bf16 mean time: 30.393 ms
+int4 mean time: 4.410 ms
+speedup: 6.9x
+```
+For the full model setup and benchmark details, check out our [quick start guide](https://docs.pytorch.org/ao/stable/quick_start.html). Alternatively, try quantizing your favorite model using our [HuggingFace space](https://huggingface.co/spaces/pytorch/torchao-my-repo)!
 
-`torchao` delivers substantial performance gains with minimal code changes:
 
-### Performance Highlights
+## 🔗 Integrations
 
-- **INT4 Weight-Only Quantization**: 2x throughput (180 vs 107 tokens/sec) with 60% less memory (6.88 GB vs 16.43 GB) on LLaMA-3-7B
-- **Float8 Dynamic Quantization**: 53.88% speedup on Flux.1-Dev* and 27.33% speedup on CogVideoX-5b on H100 GPU with preserved quality
-- **INT4 + 2:4 Sparsity**: 2.4x throughput (226 vs 95 tokens/sec) with 80% memory reduction (5.3GB vs 16.4GB) on LLaMA-3-8B
+TorchAO is integrated into some of the leading open-source libraries including:
 
-[View detailed benchmarks](torchao/quantization/README.md) |  [Learn about sparsity](torchao/sparsity/README.md)
+* HuggingFace transformers with a [builtin inference backend](https://huggingface.co/docs/transformers/main/quantization/torchao) and [low bit optimizers](https://github.com/huggingface/transformers/pull/31865)
+* HuggingFace diffusers best practices with `torch.compile` and TorchAO in a standalone repo [diffusers-torchao](https://github.com/huggingface/diffusers/blob/main/docs/source/en/quantization/torchao.md)
+* Mobius HQQ backend leveraged our int4 kernels to get [195 tok/s on a 4090](https://github.com/mobiusml/hqq#faster-inference)
+* TorchTune for our [QLoRA](https://docs.pytorch.org/torchtune/main/tutorials/qlora_finetune.html), [QAT](https://docs.pytorch.org/torchtune/main/recipes/qat_distributed.html), and [float8 quantized fine-tuning](https://github.com/pytorch/torchtune/pull/2546) recipes
+* TorchTitan for [float8 pre-training](https://github.com/pytorch/torchtitan/blob/main/docs/float8.md)
+* VLLM for LLM serving: [usage](https://docs.vllm.ai/en/latest/features/quantization/torchao.html), [detailed docs](https://docs.pytorch.org/ao/main/torchao_vllm_integration.html)
+* SGLang for LLM serving: [usage](https://docs.sglang.ai/backend/server_arguments.html#server-arguments) and the major [PR](https://github.com/sgl-project/sglang/pull/1341).
+* Axolotl for [QAT](https://docs.axolotl.ai/docs/qat.html) and [PTQ](https://docs.axolotl.ai/docs/quantize.html)
 
-### Getting Started with Quantization
 
-Quantize any model with `nn.Linear` layers (including HuggingFace models) in just one line:
+## 🔎 Inference
+
+TorchAO delivers substantial performance gains with minimal code changes:
+
+- **Int4 weight-only**: [1.89x throughput with 58.1% less memory](torchao/quantization/README.md) on Llama-3-8B
+- **Float8 dynamic quantization**: [1.54x and 1.27x speedup on Flux.1-Dev* and CogVideoX-5b respectively](https://github.com/sayakpaul/diffusers-torchao) on H100 with preserved quality
+- **Int4 + 2:4 Sparsity**: [2.37x throughput with 67.7% memory reduction](torchao/sparsity/README.md) on Llama-3-8B
+
+Quantize any model with `nn.Linear` layers in just one line (Option 1), or load the quantized model directly from HuggingFace using our integration with HuggingFace transformers (Option 2):
 
 #### Option 1: Direct TorchAO API
 
@@ -61,65 +154,43 @@ quantized_model = AutoModelForCausalLM.from_pretrained(
 )
 ```
 
-### Deployment with vLLM
-
-Deploy quantized models with one command:
+#### Deploy quantized models in vLLM with one command:
 
 ```shell
 vllm serve pytorch/Phi-4-mini-instruct-int4wo-hqq --tokenizer microsoft/Phi-4-mini-instruct -O3
 ```
 
-**Benefits**: 67% VRAM reduction and 12-20% speedup on A100 GPUs while maintaining quality.
-
-[Step-by-step quantization guide](https://huggingface.co/pytorch/Phi-4-mini-instruct-int4wo-hqq#quantization-recipe) | [Pre-quantized models](https://huggingface.co/pytorch)
+With this quantization flow, we achieve **67% VRAM reduction and 12-20% speedup** on A100 GPUs while maintaining model quality. For more detail, see this [step-by-step quantization guide](https://huggingface.co/pytorch/Phi-4-mini-instruct-int4wo-hqq#quantization-recipe). We also release some pre-quantized models [here](https://huggingface.co/pytorch).
 
-## Training
+## 🚅 Training
 
-### Quantization Aware Training
+### Quantization-Aware Training
 
-Post-training quantization can result in a fast and compact model, but may also lead to accuracy degradation. We recommend exploring Quantization Aware Training (QAT) to overcome this limitation. In collaboration with [Torchtune](https://github.com/pytorch/torchtune/blob/main/recipes/quantization.md#quantization-aware-training-qat), we've developed a QAT recipe that demonstrates significant accuracy improvements over traditional PTQ, recovering **96% of the accuracy degradation on hellaswag and 68% of the perplexity degradation on wikitext** for Llama3 compared to post-training quantization (PTQ). And we've provided a full recipe [here](https://pytorch.org/blog/quantization-aware-training/). For more details, please see the [QAT README](./torchao/quantization/qat/README.md).
+Post-training quantization can result in a fast and compact model, but may also lead to accuracy degradation. We recommend exploring Quantization-Aware Training (QAT) to overcome this limitation, especially for lower bit-width dtypes such as int4. In collaboration with [TorchTune](https://github.com/pytorch/torchtune/blob/main/recipes/quantization.md#quantization-aware-training-qat), we've developed a QAT recipe that demonstrates significant accuracy improvements over traditional PTQ, recovering **96% of the accuracy degradation on hellaswag and 68% of the perplexity degradation on wikitext** for Llama3 compared to post-training quantization (PTQ). For more details, please refer to the [QAT README](torchao/quantization/qat/README.md) and the [original blog](https://pytorch.org/blog/quantization-aware-training/):
 
 ```python
-from torchao.quantization import (
-    quantize_,
-    Int8DynamicActivationInt4WeightConfig,
-)
-from torchao.quantization.qat import (
-    FakeQuantizeConfig,
-    FromIntXQuantizationAwareTrainingConfig,
-    IntXQuantizationAwareTrainingConfig,
-)
-
-# Insert fake quantization
+from torchao.quantization import quantize_
+from torchao.quantization.qat import FakeQuantizeConfig, IntXQuantizationAwareTrainingConfig
 activation_config = FakeQuantizeConfig(torch.int8, "per_token", is_symmetric=False)
 weight_config = FakeQuantizeConfig(torch.int4, group_size=32)
-quantize_(
-    my_model,
-    IntXQuantizationAwareTrainingConfig(activation_config, weight_config),
-)
+qat_config = IntXQuantizationAwareTrainingConfig(activation_config, weight_config),
+quantize_(my_model, qat_config)
+```
 
-# Run training... (not shown)
+Users can also combine LoRA + QAT to speed up training by [1.89x](https://dev-discuss.pytorch.org/t/speeding-up-qat-by-1-89x-with-lora/2700) compared to vanilla QAT using this [fine-tuning recipe](https://github.com/pytorch/torchtune/blob/main/recipes/qat_lora_finetune_distributed.py).
 
-# Convert fake quantization to actual quantized operations
-quantize_(my_model, FromIntXQuantizationAwareTrainingConfig())
-quantize_(my_model, Int8DynamicActivationInt4WeightConfig(group_size=32))
-```
 
 ### Float8
 
-[torchao.float8](torchao/float8) implements training recipes with the scaled float8 dtypes, as laid out in https://arxiv.org/abs/2209.05433
-
-With ``torch.compile`` on, current results show throughput speedups of up to **1.5x on up to 512 GPU / 405B parameter count scale** ([details](https://pytorch.org/blog/training-using-float8-fsdp2/))
+[torchao.float8](torchao/float8) implements training recipes with the scaled float8 dtypes, as laid out in https://arxiv.org/abs/2209.05433. With ``torch.compile`` on, current results show throughput speedups of up to **1.5x on up to 512 GPU / 405B parameter count scale** ([details](https://pytorch.org/blog/training-using-float8-fsdp2/)):
 
 ```python
 from torchao.float8 import convert_to_float8_training
-convert_to_float8_training(m, module_filter_fn=...)
+convert_to_float8_training(m)
 ```
 
-And for an end-to-minimal training recipe of pretraining with float8, you can check out [torchtitan](https://github.com/pytorch/torchtitan/blob/main/docs/float8.md).
-
-#### Blog posts about float8 training
-
+Our float8 training is integrated into [TorchTitan's pre-training flows](https://github.com/pytorch/torchtitan/blob/main/docs/float8.md) so users can easily try it out. For more details, check out these blog posts about our float8 training support:
+* [Accelerating Large Scale Training and Convergence with PyTorch Float8 Rowwise on Crusoe 2K H200s](https://pytorch.org/blog/accelerating-large-scale-training-and-convergence-with-pytorch-float8-rowwise-on-crusoe-2k-h200s/)
 * [Supercharging Training using float8 and FSDP2](https://pytorch.org/blog/training-using-float8-fsdp2/)
 * [Efficient Pre-training of Llama 3-like model architectures using torchtitan on Amazon SageMaker](https://aws.amazon.com/blogs/machine-learning/efficient-pre-training-of-llama-3-like-model-architectures-using-torchtitan-on-amazon-sagemaker/)
 * [Float8 in PyTorch](https://dev-discuss.pytorch.org/t/float8-in-pytorch-1-x/1815)
@@ -127,13 +198,10 @@ And for an end-to-minimal training recipe of pretraining with float8, you can ch
 
 ### Sparse Training
 
-We've added support for semi-structured 2:4 sparsity with **6% end-to-end speedups on ViT-L**. Full blog [here](https://pytorch.org/blog/accelerating-neural-network-training/)
-
-The code change is a 1 liner with the full example available [here](torchao/sparsity/training/)
+We've added support for semi-structured 2:4 sparsity with **6% end-to-end speedups on ViT-L**. Full blog [here](https://pytorch.org/blog/accelerating-neural-network-training/). The code change is a 1 liner with the full example available [here](torchao/sparsity/training/):
 
 ```python
 from torchao.sparsity.training import SemiSparseLinear, swap_linear_with_semi_sparse_linear
-
 swap_linear_with_semi_sparse_linear(model, {"seq.0": SemiSparseLinear})
 ```
 
@@ -141,8 +209,7 @@ swap_linear_with_semi_sparse_linear(model, {"seq.0": SemiSparseLinear})
 
 Optimizers like ADAM can consume substantial GPU memory - 2x as much as the model parameters themselves. TorchAO provides two approaches to reduce this overhead:
 
-1. **Quantized optimizers**: Reduce optimizer state memory by 2-4x by quantizing to lower precision
-
+**1. Quantized optimizers**: Reduce optimizer state memory by 2-4x by quantizing to lower precision
 
 ```python
 from torchao.optim import AdamW8bit, AdamW4bit, AdamWFp8
@@ -150,7 +217,7 @@ optim = AdamW8bit(model.parameters()) # replace with Adam4bit and AdamFp8 for th
 ```
 Our quantized optimizers are implemented in just a few hundred lines of PyTorch code and compiled for efficiency. While slightly slower than specialized kernels, they offer an excellent balance of memory savings and performance. See detailed [benchmarks here](https://github.com/pytorch/ao/tree/main/torchao/optim).
 
-2. **CPU offloading**: Move optimizer state and gradients to CPU memory
+**2. CPU offloading**: Move optimizer state and gradients to CPU memory
 
 For maximum memory savings, we support [single GPU CPU offloading](https://github.com/pytorch/ao/tree/main/torchao/optim#optimizer-cpu-offload) that efficiently moves both gradients and optimizer state to CPU memory. This approach can **reduce your VRAM requirements by 60%** with minimal impact on training speed:
 
@@ -159,32 +226,10 @@ optim = CPUOffloadOptimizer(model.parameters(), torch.optim.AdamW, fused=True)
 optim.load_state_dict(ckpt["optim"])
 ```
 
-## Installation
-
-`torchao` makes liberal use of several new features in PyTorch, it's recommended to use it with the current nightly or latest stable version of PyTorch, see [getting started](https://pytorch.org/get-started/locally/) for more details.
-
-Install the stable release (recommended):
-```bash
-pip install torchao
-```
-
-Other options:
-```bash
-# Nightly build
-pip install --pre torchao --index-url https://download.pytorch.org/whl/nightly/cu124
-
-# Different CUDA versions
-pip install torchao --index-url https://download.pytorch.org/whl/cu118  # CUDA 11.8
-pip install torchao --index-url https://download.pytorch.org/whl/cpu    # CPU only
-
-```
-
-### Development Install
-```
-USE_CPP=0 python setup.py develop  # Skip C++/CUDA extensions
-```
+<!--
+## For Developers
 
-## Composability
+### Composability
 `torch.compile`: A key design principle for us is composability - any custom dtype or memory layout should work with our compiler. We enable kernel implementations in PyTorch, CUDA, C++, or Triton. This allows researchers and engineers to start with high-level dtype and layout logic in pure PyTorch, then progressively optimize performance by implementing lower-level kernels as needed, while maintaining compatibility with the compile infrastructure.
 
 [FSDP2](https://github.com/pytorch/torchtitan/blob/main/docs/fsdp.md): Historically most quantization has been done for inference, there is now a thriving area of research combining distributed algorithms and quantization.
@@ -193,40 +238,6 @@ The best example we have combining the composability of lower bit dtype with com
 
 Our framework makes it straightforward to add tensor parallel support to your custom quantized tensor subclass. Check out our [tensor parallel tutorial](tutorials/developer_api_guide/tensor_parallel.py) to see how a quantized tensor subclass can be extended to support column and row-wise tensor sharding while maintaining compatibility with `torch.compile`.
 
-## Prototype Features
-
-The [prototype](torchao/prototype/README.md) directory contains experimental and upcoming features including:
-
-- [MX Training & Inference](torchao/prototype/mx_formats/README.md): MX formats with a native PyTorch POC
-- [Int8 Quantized Training](torchao/prototype/quantized_training/README.md): Low-precision training methods
-- And more experimental features in development
-
-These features are under active development and may change. We welcome contributions from researchers and developers!
-
-> ⚠️ Note: Features in the prototype directory do not have BC guarantees and are subject to change.
-
-## OSS Integrations
-
-We're also fortunate to be integrated into some of the leading open-source libraries including
-1. Hugging Face transformers with a [builtin inference backend](https://huggingface.co/docs/transformers/main/quantization/torchao) and [low bit optimizers](https://github.com/huggingface/transformers/pull/31865)
-2. Hugging Face diffusers best practices with torch.compile and torchao in a standalone repo [diffusers-torchao](https://github.com/huggingface/diffusers/blob/main/docs/source/en/quantization/torchao.md)
-3. Mobius HQQ backend leveraged our int4 kernels to get [195 tok/s on a 4090](https://github.com/mobiusml/hqq#faster-inference)
-4. [TorchTune](https://pytorch.org/torchtune/main/tutorials/qlora_finetune.html?highlight=qlora) for our QLoRA and QAT recipes
-5. VLLM for LLM serving: [usage](https://docs.vllm.ai/en/latest/features/quantization/torchao.html)
-6. SGLang for LLM serving: [usage](https://docs.sglang.ai/backend/server_arguments.html#server-arguments) and the major [PR](https://github.com/sgl-project/sglang/pull/1341).
-7. Axolotl for [QAT](https://docs.axolotl.ai/docs/qat.html) and [PTQ](https://docs.axolotl.ai/docs/quantize.html)
-
-## Videos
-* [Keynote talk at GPU MODE IRL](https://youtu.be/FH5wiwOyPX4?si=VZK22hHz25GRzBG1&t=1009)
-* [Low precision dtypes at PyTorch conference](https://youtu.be/xcKwEZ77Cps?si=7BS6cXMGgYtFlnrA)
-* [Slaying OOMs at the Mastering LLM's course](https://www.youtube.com/watch?v=UvRl4ansfCg)
-* [Advanced Quantization at CUDA MODE](https://youtu.be/1u9xUK3G4VM?si=4JcPlw2w8chPXW8J)
-* [Chip Huyen's GPU Optimization Workshop](https://www.youtube.com/live/v_q2JTIqE20?si=mf7HeZ63rS-uYpS6)
-* [Cohere for AI community talk](https://www.youtube.com/watch?v=lVgrE36ZUw0)
-
-
-## For Developers
-
 ### Custom Kernels
 
 We've added support for authoring and releasing [custom ops](./torchao/csrc/) that do not graph break with `torch.compile()`. We have a few examples you can follow
@@ -236,23 +247,30 @@ We've added support for authoring and releasing [custom ops](./torchao/csrc/) th
 3. [int4 tinygemm unpacker](https://github.com/pytorch/ao/pull/415) which makes it easier to switch quantized backends for inference
 
 If you believe there's other CUDA kernels we should be taking a closer look at please leave a comment on [this issue](https://github.com/pytorch/ao/issues/697) or feel free to contribute directly to the repo.
+-->
 
 
-## License
+## 🎥 Videos
+* [Keynote talk at GPU MODE IRL](https://youtu.be/FH5wiwOyPX4?si=VZK22hHz25GRzBG1&t=1009)
+* [Low precision dtypes at PyTorch conference](https://youtu.be/xcKwEZ77Cps?si=7BS6cXMGgYtFlnrA)
+* [Slaying OOMs at the Mastering LLM's course](https://www.youtube.com/watch?v=UvRl4ansfCg)
+* [Advanced Quantization at CUDA MODE](https://youtu.be/1u9xUK3G4VM?si=4JcPlw2w8chPXW8J)
+* [Chip Huyen's GPU Optimization Workshop](https://www.youtube.com/live/v_q2JTIqE20?si=mf7HeZ63rS-uYpS6)
+* [Cohere for AI community talk](https://www.youtube.com/watch?v=lVgrE36ZUw0)
 
-`torchao` is released under the [BSD 3](https://github.com/pytorch-labs/ao/blob/main/LICENSE) license.
 
-# Citation
+## 💬 Citation
 
 If you find the torchao library useful, please cite it in your work as below.
 
+<!-- TODO: update to cite CodeML paper after Jul 2025 -->
 ```bibtex
 @software{torchao,
-  title = {torchao: PyTorch native quantization and sparsity for training and inference},
-  author = {torchao maintainers and contributors},
-  url = {https://github.com/pytorch/torchao},
-  license = {BSD-3-Clause},
-  month = oct,
-  year = {2024}
+  title={TorchAO: PyTorch-Native Training-to-Serving Model Optimization},
+  author={torchao},
+  url={https://github.com/pytorch/torchao},
+  license={BSD-3-Clause},
+  month={oct},
+  year={2024}
 }
 ```

From e4f2715e94c14454c61153c4a3dfc4c8f0758350 Mon Sep 17 00:00:00 2001
From: Jeff Daily <jeff.daily@amd.com>
Date: Mon, 16 Jun 2025 15:54:37 -0700
Subject: [PATCH 124/165] remove rocm source files when not building for rocm
 (#2385)

* remove rocm source files when not building for rocm

fixes #2297

* lint

---------

Co-authored-by: Mark Saroufim <marksaroufim@gmail.com>
---
 setup.py | 7 +++++++
 1 file changed, 7 insertions(+)

diff --git a/setup.py b/setup.py
index 22b001b424..448eb344c1 100644
--- a/setup.py
+++ b/setup.py
@@ -491,6 +491,13 @@ def get_extensions():
             print("Currently only gfx942 is supported. Compiling only for gfx942.")
         extra_compile_args["nvcc"].append("--offload-arch=gfx942")
         sources += rocm_sources
+    else:
+        # Remove ROCm-based sources from the sources list.
+        extensions_rocm_dir = os.path.join(extensions_dir, "rocm")
+        rocm_sources = list(
+            glob.glob(os.path.join(extensions_rocm_dir, "**/*.cpp"), recursive=True)
+        )
+        sources = [s for s in sources if s not in rocm_sources]
 
     use_cutlass = False
     cutlass_90a_sources = None

From 21a2d29e27692ac419f6ac64be1cc0a6786a2b66 Mon Sep 17 00:00:00 2001
From: XiaoWang <wang.xiao@intel.com>
Date: Tue, 17 Jun 2025 07:41:41 +0000
Subject: [PATCH 125/165] Enable Int4WeightOnlyGPTQQuantizer on Intel GPU.
 (#2200)

Following https://github.com/pytorch/pytorch/issues/153019 requests, we enable int4wo-GPTQ for Intel GPU in pytorch/ao after RTN ready.
How to run  int4wo-GPTQ  on Intel GPU:
```markdown
from pathlib import Path

import torch

from torchao._models._eval import (
    LMEvalInputRecorder,
    TransformerEvalWrapper,
)
from torchao.quantization.GPTQ import Int4WeightOnlyGPTQQuantizer

from torchao._models.llama.model import Transformer, prepare_inputs_for_model
from torchao._models.llama.tokenizer import get_tokenizer

from torchao.dtypes import (
    Int4XPULayout,
)

precision = torch.bfloat16
device = "xpu"
checkpoint_path = Path("checkpoints/meta-llama/Llama-2-7b-chat-hf/model.pth")
model = Transformer.from_name(checkpoint_path.parent.name)
checkpoint = torch.load(str(checkpoint_path), mmap=True, weights_only=True)
model.load_state_dict(checkpoint, assign=True)
model = model.to(dtype=precision, device="cpu")
model.eval()
tokenizer_path = checkpoint_path.parent / "tokenizer.model"
assert tokenizer_path.is_file(), tokenizer_path
tokenizer = get_tokenizer(
    tokenizer_path,
    "Llama-2-7b-chat-hf",
)
groupsize = 64
blocksize = 128
percdamp = 0.01
calibration_tasks = ["wikitext"]
calibration_limit = 1
calibration_seq_length = 100
input_prep_func = prepare_inputs_for_model
pad_calibration_inputs = False

inputs = (
    LMEvalInputRecorder(
        tokenizer,
        calibration_seq_length,
        input_prep_func,
        model.config.vocab_size,
        pad_calibration_inputs,
        device="cpu",
    )
    .record_inputs(
        calibration_tasks,
        calibration_limit,
    )
    .get_recorded_inputs()
)

quantizer = Int4WeightOnlyGPTQQuantizer(
    groupsize,
    blocksize,
    percdamp,
    device=torch.device(device),
    layout=Int4XPULayout(),
)
model.setup_caches(max_batch_size=1, max_seq_length=calibration_seq_length)
model = quantizer.quantize(model, *inputs).xpu()

model.reset_caches()
limit = 1
result = TransformerEvalWrapper(
    model.xpu(),
    tokenizer,
    model.config.block_size,
    prepare_inputs_for_model,
    device,
).run_eval(
    ["wikitext"],
    limit,
)
Pull Request resolved: https://github.com/pytorch/ao/pull/2200
Approved by: https://github.com/liangan1, https://github.com/jerryzh168
---
 torchao/_models/_eval.py          |  2 +-
 torchao/quantization/GPTQ/GPTQ.py | 95 ++++++++++++++++++++++---------
 2 files changed, 69 insertions(+), 28 deletions(-)

diff --git a/torchao/_models/_eval.py b/torchao/_models/_eval.py
index 0266417de5..faf059c400 100644
--- a/torchao/_models/_eval.py
+++ b/torchao/_models/_eval.py
@@ -35,7 +35,7 @@ def __init__(
         self, model, tokenizer, max_seq_length, input_prep_func=None, device="cuda"
     ):
         try:
-            super().__init__()
+            super().__init__(device=device)
         except TypeError:
             # lm_eval 0.4.2 removed the default init
             super().__init__("gpt2", device="cpu")
diff --git a/torchao/quantization/GPTQ/GPTQ.py b/torchao/quantization/GPTQ/GPTQ.py
index 8c3f791fd6..fe55ed19db 100644
--- a/torchao/quantization/GPTQ/GPTQ.py
+++ b/torchao/quantization/GPTQ/GPTQ.py
@@ -10,7 +10,11 @@
 import torch.nn as nn
 from torch.utils._pytree import tree_flatten, tree_unflatten
 
-from torchao.dtypes import TensorCoreTiledLayout, to_affine_quantized_intx_static
+from torchao.dtypes import (
+    Layout,
+    TensorCoreTiledLayout,
+    to_affine_quantized_intx_static,
+)
 from torchao.quantization.quant_primitives import (
     ZeroPointDomain,
 )
@@ -131,6 +135,7 @@ def configure_quantization_mode(
         group_size=-1,
         percdamp=0.01,
         blocksize=128,
+        device: torch.device = torch.device("cuda"),
     ):
         cls.get_qparams_func = get_qparams_func
         cls.quantize_func = quantize_func
@@ -144,6 +149,7 @@ def configure_quantization_mode(
         cls.group_size = group_size
         cls.percdamp = percdamp
         cls.blocksize = blocksize
+        cls.device = device
 
     @classmethod
     def __torch_function__(
@@ -178,6 +184,10 @@ def __torch_function__(
         # then we can do the fast thing.
 
         quantize_linear = not skip_gptq and cls.is_linear_layer(func)
+        if hasattr(cls, "device") and isinstance(cls.device, torch.device):
+            device = cls.device
+        else:
+            device = "cpu"
         # Determine if function is in-place
 
         # initialize function tracking
@@ -199,7 +209,7 @@ def __torch_function__(
 
         # if we're not doing an in place op, move singular tensors to cuda now
         if not is_in_place:
-            flat_args = _tensors_to_cuda(flat_args)
+            flat_args = _tensors_to_device(flat_args, device=device)
 
         # convert [A, MultiTensor(b), MultiTensor(c1,c2,c3)] => [[A,b,c1], [A,b,c2] [A,b,c3]]
         # if its in place then instead we first pad i.e. MultiTensor(b) => MultiTensor(b1, b2, b3)
@@ -208,7 +218,9 @@ def __torch_function__(
 
         with torch._C.DisableTorchFunctionSubclass():
             if not quantize_linear:  # normal function eval
-                out = cls._evaluate_function(func, grouped_args, spec, is_in_place)
+                out = cls._evaluate_function(
+                    func, grouped_args, spec, is_in_place, device
+                )
 
                 # go back and unpad everything where possible.
                 if not GPTQ_FUNC_LIST[func]["is_in_place"]:
@@ -217,7 +229,7 @@ def __torch_function__(
 
             # GPTQ quantization for linear layers
             # Calculate Hessian approximation
-            H = _calculate_hessian(grouped_args, spec)
+            H = _calculate_hessian(grouped_args, spec, device)
 
             # turn weight MultiTensor into single cuda tensor
             W = args[1]
@@ -225,7 +237,7 @@ def __torch_function__(
                 W = W.values[0]
             W = W.to(H.device)
 
-            Q, DQ, all_qparams = cls.faster_quant(H, W.detach())
+            Q, DQ, all_qparams = cls.faster_quant(H, W.detach(), device)
 
             # make quantized tensor subclass
             qtensor = cls.make_qtensor(Q, all_qparams)
@@ -244,8 +256,8 @@ def __torch_function__(
                 _do_unpad(flat_args, orig_counts=orig_counts)
                 return out
             if args[0].debug:
-                act = args[0].values[0].to("cuda")
-                bias = args[2].values[0].to("cuda") if args[2] is not None else args[2]
+                act = args[0].values[0].to(device)
+                bias = args[2].values[0].to(device) if args[2] is not None else args[2]
 
                 new_out = out.values[0].cpu()
                 old_out = (
@@ -265,7 +277,7 @@ def __torch_function__(
                     "SQNR for QDQ (this should be inf)", SQNR(DQ, DQ_after)
                 )  # matches
                 print(
-                    "SQNR for weight (can be low)", SQNR(W, DQ.cuda())
+                    "SQNR for weight (can be low)", SQNR(W, DQ.to(device))
                 )  # fine to not match
                 print(
                     "SQNR for output with GPTQ (hopefully 35+)",
@@ -318,14 +330,14 @@ def grouped_to_flat(cls, grouped: List[Tuple[Any, ...]]) -> Tuple[List[Any], boo
         return flattened, non_tensors_equal
 
     @classmethod
-    def _evaluate_function(cls, func, grouped_args, spec, is_in_place):
+    def _evaluate_function(cls, func, grouped_args, spec, is_in_place, device):
         outputs = []
         for inp in grouped_args:
             # we move all remaining cpu tensors to cuda
-            cuda_inp = _tensors_to_cuda(inp)
+            device_inp = _tensors_to_device(inp, device)
 
             # return input to original structure
-            cur_args, cur_kwargs = tree_unflatten(cuda_inp, spec)
+            cur_args, cur_kwargs = tree_unflatten(device_inp, spec)
 
             out = func(*cur_args, **cur_kwargs)
 
@@ -336,7 +348,7 @@ def _evaluate_function(cls, func, grouped_args, spec, is_in_place):
             # categortize func as in place.
             if is_in_place:
                 detected_mutation = _maybe_copy_new_values(
-                    inp, cuda_inp, force=GPTQ_FUNC_LIST[func]["is_in_place"]
+                    inp, device_inp, force=GPTQ_FUNC_LIST[func]["is_in_place"]
                 )  # if we already know its in place, don't compare, just copy
                 if detected_mutation and GPTQ_FUNC_LIST[func]["is_in_place"] is None:
                     GPTQ_FUNC_LIST[func]["is_in_place"] = True
@@ -365,13 +377,14 @@ def _evaluate_function(cls, func, grouped_args, spec, is_in_place):
         return final_out
 
     @classmethod
-    def faster_quant(cls, H, W):
+    def faster_quant(cls, H, W, device):
         """
         GPTQ quantization implementation.
 
         Args:
             H: Hessian matrix approximation
             W: Weight matrix to quantize
+            device: accelerator device
 
         Returns:
             Tuple containing:
@@ -457,7 +470,12 @@ def faster_quant(cls, H, W):
                 Hinv[block_start:block_end, block_end:]
             )
 
-        torch.cuda.synchronize()
+        if "xpu" in device.type:
+            torch.xpu.synchronize()
+        elif "cuda" in device.type:
+            torch.cuda.synchronize()
+        else:
+            pass
 
         if all_qparams == []:
             all_qparams.append(cur_qparams)
@@ -571,6 +589,7 @@ def __init__(self):
         self.make_qtensor = None
         self.skip_layer_func = None
         self.act_fake_quant_func = None
+        self.device = None
 
     def _check_functions(self):
         assert self.get_qparams_func is not None, "get_qparams_func must be set"
@@ -611,6 +630,7 @@ def _create_quantized_state_dict(
             group_size=group_size,
             percdamp=percdamp,
             blocksize=blocksize,
+            device=self.device,
         )
         # Set the state dict for the original model
         self.state_dict_manager.set_state_dict(model)
@@ -639,6 +659,7 @@ def __init__(
         inner_k_tiles=8,
         padding_allowed=True,
         device: torch.device = torch.device("cuda"),
+        layout: Optional[Layout] = TensorCoreTiledLayout(inner_k_tiles=8),
     ):
         super().__init__()
         self.group_size = group_size
@@ -647,14 +668,31 @@ def __init__(
         self.inner_k_tiles = inner_k_tiles
         self.padding_allowed = padding_allowed
         self.device = device
+        self.device = self.device
         self.act_fake_quant_func = None
+        self.layout = layout
         n_bit = 4
+
+        if "xpu" in self.device.type:
+            self.zero_point_domain = ZeroPointDomain.INT
+            self.zeros_precision = torch.int8
+        else:
+            self.zero_point_domain = ZeroPointDomain.FLOAT
+
         self.get_qparams_func = lambda w: get_groupwise_affine_qparams(
-            w, n_bit, group_size
+            w,
+            n_bit,
+            group_size,
+            zero_point_domain=self.zero_point_domain,
         )
         self.quantize_func = (
             lambda w, qparams: groupwise_affine_quantize_tensor_from_qparams(
-                w, qparams[0], qparams[1], n_bit, group_size
+                w,
+                qparams[0],
+                qparams[1],
+                n_bit,
+                group_size,
+                zero_point_domain=self.zero_point_domain,
             )
         )
         self.dequantize_func = (
@@ -664,6 +702,7 @@ def __init__(
                 qparams[1],
                 n_bit,
                 group_size,
+                zero_point_domain=self.zero_point_domain,
             )
         )
         self.combine_qparams_list_func = lambda qparams_list: [
@@ -681,6 +720,8 @@ def make_qtensor(q, qparams):
             weight = self.dequantize_func(q, qparams)
             scale = qparams[0]
             zero_point = qparams[1]
+            if self.zero_point_domain == ZeroPointDomain.INT:
+                zero_point = zero_point.to(self.zeros_precision)
 
             # copied from quant_api apply_int4_weight_only_quant (this should probably be made into a utility fn at some point)
             # mapping_type = MappingType.ASYMMETRIC
@@ -688,8 +729,6 @@ def make_qtensor(q, qparams):
             target_dtype = torch.int32
             quant_min = 0
             quant_max = 15
-            zero_point_domain = ZeroPointDomain.FLOAT
-            _layout = TensorCoreTiledLayout(inner_k_tiles=8)
             # at least the big up to here should be a util
 
             quantized_tensor = to_affine_quantized_intx_static(
@@ -700,8 +739,8 @@ def make_qtensor(q, qparams):
                 target_dtype=target_dtype,
                 quant_min=quant_min,
                 quant_max=quant_max,
-                zero_point_domain=zero_point_domain,
-                _layout=_layout,
+                zero_point_domain=self.zero_point_domain,
+                _layout=self.layout,
             )
             return quantized_tensor
 
@@ -829,12 +868,13 @@ def _flat_to_grouped_and_pad(
     return grouped, orig_counts
 
 
-def _tensors_to_cuda(args, move_all=False):
+def _tensors_to_device(args, device=torch.device("cuda"), move_all=False):
     """
-    Move tensors to CUDA for faster processing.
+    Move tensors to accelerator for faster processing.
 
     Args:
         args: Arguments that may contain tensors
+        device: accelerator device
         move_all: Whether to move all tensors or just single count tensors
 
     Returns:
@@ -843,10 +883,10 @@ def _tensors_to_cuda(args, move_all=False):
     new_args = []
     for x in args:
         if isinstance(x, MultiTensor) and (x.count == 1 or move_all):
-            new_args.append(x.__class__(x.values[0].cuda()))
+            new_args.append(x.__class__(x.values[0].to(device)))
         else:
             new_args.append(
-                x.cuda()
+                x.to(device)
                 if isinstance(x, torch.Tensor) and not isinstance(x, MultiTensor)
                 else x
             )
@@ -888,13 +928,14 @@ def _do_unpad(args, orig_counts):
             arg.unpad(count)
 
 
-def _calculate_hessian(grouped_args, spec):
+def _calculate_hessian(grouped_args, spec, device=torch.device("cuda")):
     """
     Calculate the Hessian matrix for GPTQ.
 
     Args:
         grouped_args: Grouped arguments
         spec: Original structure specification
+        device: accelerator device
 
     Returns:
         torch.Tensor: Hessian matrix
@@ -903,10 +944,10 @@ def _calculate_hessian(grouped_args, spec):
     total_batches = 0
     for inp in grouped_args:
         # Move all remaining CPU tensors to CUDA
-        cuda_inp = [x.cuda() if isinstance(x, torch.Tensor) else x for x in inp]
+        device_inp = [x.to(device) if isinstance(x, torch.Tensor) else x for x in inp]
 
         # Return input to original structure
-        cur_args, _ = tree_unflatten(cuda_inp, spec)
+        cur_args, _ = tree_unflatten(device_inp, spec)
 
         # Setup x (activation tensor)
         x = cur_args[0].float()

From d1c8118292b89b6110a4f428b83bb368eaabb46f Mon Sep 17 00:00:00 2001
From: Vasiliy Kuznetsov <vkuzo@users.noreply.github.com>
Date: Tue, 17 Jun 2025 07:53:20 -0400
Subject: [PATCH 126/165] remove torchao dependency from torchao build script
 (#2383)

Summary:

We should not use torchao to build torchao. Before this PR,
I got stuck in a loop where I had a broken install (for some other
reason) and could not uninstall torchao with this setup script,
because the script required a working torchao to run.

Commenting out the offending code in this PR, leaving for a
future person to actually fix it.

Test Plan:

Reviewers:

Subscribers:

Tasks:

Tags:
---
 setup.py | 24 ++++++++++++------------
 1 file changed, 12 insertions(+), 12 deletions(-)

diff --git a/setup.py b/setup.py
index 448eb344c1..cb6be7e1c1 100644
--- a/setup.py
+++ b/setup.py
@@ -85,8 +85,6 @@ def read_version(file_path="version.txt"):
 #       └── TORCHAO_PARALLEL_BACKEND → Backend selection (aten_openmp, executorch, etc.)
 
 
-from torchao.utils import TORCH_VERSION_AT_LEAST_2_7
-
 version_prefix = read_version()
 # Version is version.dev year month date if using nightlies and version if not
 version = (
@@ -388,16 +386,18 @@ def get_extensions():
             ["-O3" if not debug_mode else "-O0", "-fdiagnostics-color=always"]
         )
 
-        if use_cpu_kernels and is_linux and TORCH_VERSION_AT_LEAST_2_7:
-            if torch._C._cpu._is_avx512_supported():
-                extra_compile_args["cxx"].extend(
-                    [
-                        "-DCPU_CAPABILITY_AVX512",
-                        "-march=native",
-                        "-mfma",
-                        "-fopenmp",
-                    ]
-                )
+        # TODO(future PR): make this work without using `TORCH_VERSION_AT_LEAST_2_7`,
+        # because we should not be using anything from `torchao` to build `torchao`.
+        # if use_cpu_kernels and is_linux and TORCH_VERSION_AT_LEAST_2_7:
+        #     if torch._C._cpu._is_avx512_supported():
+        #         extra_compile_args["cxx"].extend(
+        #             [
+        #                 "-DCPU_CAPABILITY_AVX512",
+        #                 "-march=native",
+        #                 "-mfma",
+        #                 "-fopenmp",
+        #             ]
+        #         )
 
         if debug_mode:
             extra_compile_args["cxx"].append("-g")

From bc80a5da0396113544084b02f806c0cdda16de0c Mon Sep 17 00:00:00 2001
From: Scott Roy <161522778+metascroy@users.noreply.github.com>
Date: Tue, 17 Jun 2025 10:11:11 -0700
Subject: [PATCH 127/165] turn off building tests with cpuinfo (#2324)

---
 torchao/experimental/CMakeLists.txt | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/torchao/experimental/CMakeLists.txt b/torchao/experimental/CMakeLists.txt
index 7313a37e56..1d3c28508e 100644
--- a/torchao/experimental/CMakeLists.txt
+++ b/torchao/experimental/CMakeLists.txt
@@ -95,6 +95,9 @@ endif()
 if (NOT TARGET cpuinfo)
     # For some reason cpuinfo package has unused functions/variables
     # TODO (T215533422): fix upstream
+    set(CPUINFO_BUILD_UNIT_TESTS OFF CACHE BOOL "Disable unit tests" FORCE)
+    set(CPUINFO_BUILD_MOCK_TESTS OFF CACHE BOOL "Disable mock tests" FORCE)
+    set(CPUINFO_BUILD_BENCHMARKS OFF CACHE BOOL "Disable benchmarks" FORCE)
     add_compile_options(-Wno-unused-function -Wno-unused-variable)
     include(FetchContent)
     FetchContent_Declare(cpuinfo

From 63a91d75f5705fb6ffff82112a7dd4e2363f8ad4 Mon Sep 17 00:00:00 2001
From: Daniel Vega-Myhre <danvm@meta.com>
Date: Tue, 17 Jun 2025 11:19:27 -0700
Subject: [PATCH 128/165] [float8 training] update torchtitan benchmark script
 args (#2392)

update torchtitan benchmark script args
---
 benchmarks/float8/training/README.md               | 2 +-
 benchmarks/float8/training/torchtitan_benchmark.sh | 6 +++---
 2 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/benchmarks/float8/training/README.md b/benchmarks/float8/training/README.md
index 5d8c2946d6..5897ea4962 100644
--- a/benchmarks/float8/training/README.md
+++ b/benchmarks/float8/training/README.md
@@ -12,7 +12,7 @@ Training parameters can be configured via environment variables.
     - `TORCHTITAN_ROOT`: Root directory of torchtitan in your local filesystem
 - Optional:
     - `FLOAT8_RECIPE_WITH_BEST_SETTINGS`: "rowwise" or "tensorwise". Applies float8 training with the specified scaling recipe, as well as additional training configs which are optimal for that scaling recipe. See `torchtitan_benchmark.sh` for more details.
-    - `BATCH_SIZE`: Defaults to 1.
+    - `LOCAL_BATCH_SIZE`: Defaults to 1.
     - `STEPS`: Defaults to 100.
     - `EXTRA_ARGS`: Extra arguments to pass to torchtitan training script. See [torchtitan](https://github.com/pytorch/torchtitan) docs for the full list of options.
 
diff --git a/benchmarks/float8/training/torchtitan_benchmark.sh b/benchmarks/float8/training/torchtitan_benchmark.sh
index d30b1eceb1..c1995ee39a 100755
--- a/benchmarks/float8/training/torchtitan_benchmark.sh
+++ b/benchmarks/float8/training/torchtitan_benchmark.sh
@@ -8,7 +8,7 @@
 # with the given parameters,
 
 # script arguments
-BATCH_SIZE=${BATCH_SIZE:-1}
+LOCAL_BATCH_SIZE=${LOCAL_BATCH_SIZE:-1}
 STEPS=${STEPS:-100}
 
 # temporary log file which is deleted after performance data is parsed out and metrics are calculated.
@@ -20,7 +20,7 @@ if [ -z "${TORCHTITAN_ROOT}" ]; then
   echo "Usage: TORCHTITAN_ROOT=<directory> ./float8_training_benchmark.sh"
   echo "Optional parameters configurable via environment variables:"
   echo " * FLOAT8_RECIPE_WITH_BEST_SETTINGS: "rowwise" or "tensorwise". if set, use float8 training in torchtitan with the specified recipe, including the additional settings which are optimal for that recipe. otherwise, use bf16 mixed precision training."
-  echo " * BATCH_SIZE: defaults to 1."
+  echo " * LOCAL_BATCH_SIZE: defaults to 1."
   echo " * STEPS: defaults to 100."
   echo " * EXTRA_ARGS: additional arguments to pass to the torchtitan training script."
   exit 1
@@ -45,7 +45,7 @@ cd ${TORCHTITAN_ROOT}
 echo "float8 args: ${FLOAT8_ARGS}"
 
 # run the command with the specified arguments
-CONFIG_FILE="./torchtitan/models/llama3/train_configs/llama3_8b.toml" ${TORCHTITAN_ROOT}/run_train.sh --training.steps=${STEPS} --training.batch_size=${BATCH_SIZE} --training.compile ${FLOAT8_ARGS} ${EXTRA_ARGS} 2>&1 | tee ${LOG_FILE}
+CONFIG_FILE="./torchtitan/models/llama3/train_configs/llama3_8b.toml" ${TORCHTITAN_ROOT}/run_train.sh --training.steps=${STEPS} --training.local-batch-size=${LOCAL_BATCH_SIZE} --training.compile ${FLOAT8_ARGS} ${EXTRA_ARGS} 2>&1 | tee ${LOG_FILE}
 
 # return to original working directory
 cd $original_dir

From 7e7ea92ddfe442d3c1d3dfc748d085fdc33a7b25 Mon Sep 17 00:00:00 2001
From: Gasoonjia <gasoonjia@icloud.com>
Date: Tue, 17 Jun 2025 13:17:50 -0700
Subject: [PATCH 129/165] deduplicate torch ao debugger tests between
 pytorch/ao and ExecuTorch (#2390)

Summary:
X-link: https://github.com/pytorch/executorch/pull/11735

This diff deduplicates numeric debugging tests on XnnPack quantizer between torchao and ExecuTorch.

Reviewed By: jerryzh168

Differential Revision: D76634915
---
 .../pt2e/test_numeric_debugger.py             | 152 +-----------------
 torchao/testing/pt2e/utils.py                 |  72 ++++++++-
 2 files changed, 74 insertions(+), 150 deletions(-)

diff --git a/test/quantization/pt2e/test_numeric_debugger.py b/test/quantization/pt2e/test_numeric_debugger.py
index 027d57d1b2..5f565767aa 100644
--- a/test/quantization/pt2e/test_numeric_debugger.py
+++ b/test/quantization/pt2e/test_numeric_debugger.py
@@ -12,22 +12,13 @@
 
 import torch
 from torch.testing._internal.common_quantization import TestHelperModules
-from torch.testing._internal.common_utils import IS_WINDOWS, TestCase, run_tests
+from torch.testing._internal.common_utils import IS_WINDOWS, run_tests
 
 from torchao.quantization.pt2e import (
-    CUSTOM_KEY,
-    NUMERIC_DEBUG_HANDLE_KEY,
-    compare_results,
-    extract_results_from_loggers,
     generate_numeric_debug_handle,
     prepare_for_propagation_comparison,
 )
-from torchao.quantization.pt2e.graph_utils import bfs_trace_with_node_process
-from torchao.quantization.pt2e.quantize_pt2e import convert_pt2e, prepare_pt2e
-from torchao.testing.pt2e._xnnpack_quantizer import (
-    XNNPACKQuantizer,
-    get_symmetric_quantization_config,
-)
+from torchao.testing.pt2e.utils import PT2ENumericDebuggerTestCase
 from torchao.utils import TORCH_VERSION_AT_LEAST_2_7
 
 if TORCH_VERSION_AT_LEAST_2_7:
@@ -36,59 +27,7 @@
 
 @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_7, "Requires torch 2.7+")
 @unittest.skipIf(IS_WINDOWS, "Windows not yet supported for torch.compile")
-class TestNumericDebugger(TestCase):
-    def _assert_each_node_has_debug_handle(self, model) -> None:
-        def _assert_node_has_debug_handle(node):
-            self.assertTrue(
-                CUSTOM_KEY in node.meta
-                and NUMERIC_DEBUG_HANDLE_KEY in node.meta[CUSTOM_KEY],
-                f"Node {node} doesn't have debug handle",
-            )
-
-        bfs_trace_with_node_process(model, _assert_node_has_debug_handle)
-
-    def _extract_debug_handles(self, model) -> dict[str, int]:
-        debug_handle_map: dict[str, int] = {}
-
-        def _extract_debug_handles_from_node(node):
-            nonlocal debug_handle_map
-            if (
-                CUSTOM_KEY in node.meta
-                and NUMERIC_DEBUG_HANDLE_KEY in node.meta[CUSTOM_KEY]
-            ):
-                debug_handle_map[str(node)] = node.meta[CUSTOM_KEY][
-                    NUMERIC_DEBUG_HANDLE_KEY
-                ]
-
-        bfs_trace_with_node_process(model, _extract_debug_handles_from_node)
-
-        return debug_handle_map
-
-    def _extract_debug_handles_with_prev_decomp_op(self, model) -> dict[str, int]:
-        prev_decomp_op_to_debug_handle_map: dict[str, int] = {}
-
-        def _extract_debug_handles_with_prev_decomp_op_from_node(node):
-            nonlocal prev_decomp_op_to_debug_handle_map
-            if (
-                CUSTOM_KEY in node.meta
-                and NUMERIC_DEBUG_HANDLE_KEY in node.meta[CUSTOM_KEY]
-            ):
-                prev_decomp_op = str(node.meta.get("nn_module_stack"))
-                debug_handle = node.meta[CUSTOM_KEY][NUMERIC_DEBUG_HANDLE_KEY]
-                if prev_decomp_op not in prev_decomp_op_to_debug_handle_map:
-                    prev_decomp_op_to_debug_handle_map[prev_decomp_op] = debug_handle
-                else:
-                    assert (
-                        prev_decomp_op_to_debug_handle_map[prev_decomp_op]
-                        == debug_handle
-                    ), f"Node {node} has different debug handle {debug_handle}"
-                    "than previous node sharing the same decomp op {prev_decomp_op}"
-
-        bfs_trace_with_node_process(
-            model, _extract_debug_handles_with_prev_decomp_op_from_node
-        )
-        return prev_decomp_op_to_debug_handle_map
-
+class TestNumericDebuggerInfra(PT2ENumericDebuggerTestCase):
     @unittest.skip(
         "torch._dynamo.exc.FailOnRecompileLimitHit: recompile_limit reached with one_graph=True. Excessive recompilations can degrade performance due to the compilation overhead of each recompilation. To monitor recom..."
     )
@@ -113,36 +52,6 @@ def test_control_flow(self):
 
         self.assertEqual(len(set(debug_handle_map.values())), len(debug_handle_map))
 
-    def test_quantize_pt2e_preserve_handle(self):
-        m = TestHelperModules.Conv2dThenConv1d()
-        example_inputs = m.example_inputs()
-        ep = export_for_training(m, example_inputs, strict=True)
-        generate_numeric_debug_handle(ep)
-        m = ep.module()
-
-        quantizer = XNNPACKQuantizer().set_global(
-            get_symmetric_quantization_config(is_per_channel=False)
-        )
-        m = prepare_pt2e(m, quantizer)
-        debug_handle_map = self._extract_debug_handles(m)
-        res_counter = Counter(debug_handle_map.values())
-        repeated_debug_handle_ids = [1, 2, 3]
-        # 3 ids were repeated because we copy over the id from node to its output observer
-        # torch.ops.aten.conv2d.default, torch.ops.aten.squeeze.dim and torch.ops.aten.conv1d.default
-        for dh_id in repeated_debug_handle_ids:
-            self.assertEqual(res_counter[dh_id], 2)
-
-        m(*example_inputs)
-        m = convert_pt2e(m)
-        self._assert_each_node_has_debug_handle(ep)
-        debug_handle_map = self._extract_debug_handles(m)
-        res_counter = Counter(debug_handle_map.values())
-        # same set of ids where repeated, because we copy over the id from observer/fake_quant to
-        # dequantize node
-        repeated_debug_handle_ids = [1, 2, 3]
-        for dh_id in repeated_debug_handle_ids:
-            self.assertEqual(res_counter[dh_id], 2)
-
     def test_copy_preserve_handle(self):
         m = TestHelperModules.Conv2dThenConv1d()
         example_inputs = m.example_inputs()
@@ -262,61 +171,6 @@ def test_prepare_for_propagation_comparison(self):
         self.assertTrue("conv2d" in [logger.node_name for logger in loggers])
         self.assertEqual(res, ref)
 
-    def test_extract_results_from_loggers(self):
-        m = TestHelperModules.Conv2dThenConv1d()
-        example_inputs = m.example_inputs()
-        ep = export_for_training(m, example_inputs, strict=True)
-        generate_numeric_debug_handle(ep)
-        m = ep.module()
-        m_ref_logger = prepare_for_propagation_comparison(m)
-
-        quantizer = XNNPACKQuantizer().set_global(
-            get_symmetric_quantization_config(is_per_channel=False)
-        )
-        m = prepare_pt2e(m, quantizer)
-        m(*example_inputs)
-        m = convert_pt2e(m)
-        m_quant_logger = prepare_for_propagation_comparison(m)
-
-        m_ref_logger(*example_inputs)
-        m_quant_logger(*example_inputs)
-        ref_results = extract_results_from_loggers(m_ref_logger)
-        quant_results = extract_results_from_loggers(m_quant_logger)
-        comparison_results = compare_results(ref_results, quant_results)
-        for node_summary in comparison_results.values():
-            if len(node_summary.results) > 0:
-                self.assertGreaterEqual(node_summary.results[0].sqnr, 35)
-
-    def test_extract_results_from_loggers_list_output(self):
-        m = TestHelperModules.Conv2dWithSplit()
-        example_inputs = m.example_inputs()
-        ep = export_for_training(m, example_inputs, strict=True)
-        generate_numeric_debug_handle(ep)
-        m = ep.module()
-        m_ref_logger = prepare_for_propagation_comparison(m)
-
-        quantizer = XNNPACKQuantizer().set_global(
-            get_symmetric_quantization_config(is_per_channel=False)
-        )
-        m = prepare_pt2e(m, quantizer)
-        m(*example_inputs)
-        m = convert_pt2e(m)
-        m_quant_logger = prepare_for_propagation_comparison(m)
-
-        m_ref_logger(*example_inputs)
-        m_quant_logger(*example_inputs)
-        ref_results = extract_results_from_loggers(m_ref_logger)
-        quant_results = extract_results_from_loggers(m_quant_logger)
-        comparison_results = compare_results(ref_results, quant_results)
-        for node_summary in comparison_results.values():
-            if len(node_summary.results) > 0:
-                sqnr = node_summary.results[0].sqnr
-                if isinstance(sqnr, list):
-                    for sqnr_i in sqnr:
-                        self.assertGreaterEqual(sqnr_i, 35)
-                else:
-                    self.assertGreaterEqual(sqnr, 35)
-
     def test_added_node_gets_unique_id(self) -> None:
         m = TestHelperModules.Conv2dThenConv1d()
         example_inputs = m.example_inputs()
diff --git a/torchao/testing/pt2e/utils.py b/torchao/testing/pt2e/utils.py
index ad49fec014..4342d81dc1 100644
--- a/torchao/testing/pt2e/utils.py
+++ b/torchao/testing/pt2e/utils.py
@@ -6,6 +6,7 @@
 
 import copy
 import unittest
+from typing import Dict
 
 import torch
 from torch.ao.quantization.backend_config import (
@@ -19,13 +20,19 @@
     NodeSpec,
     QuantizationTestCase,
 )
+from torch.testing._internal.common_utils import TestCase
 
+from torchao.quantization.pt2e import (
+    CUSTOM_KEY,
+    NUMERIC_DEBUG_HANDLE_KEY,
+)
+from torchao.quantization.pt2e.graph_utils import bfs_trace_with_node_process
 from torchao.quantization.pt2e.quantize_pt2e import (
     convert_pt2e,
     prepare_pt2e,
     prepare_qat_pt2e,
 )
-from torchao.utils import TORCH_VERSION_AT_LEAST_2_5
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_5, TORCH_VERSION_AT_LEAST_2_7
 
 if TORCH_VERSION_AT_LEAST_2_5:
     from torch.export import export_for_training
@@ -133,3 +140,66 @@ def _test_quantizer(
             fx_quant_output = m_fx(*example_inputs)
             self.assertEqual(fx_quant_output, pt2_quant_output)
         return m
+
+
+@unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_7, "Requires torch 2.7+")
+class PT2ENumericDebuggerTestCase(TestCase):
+    """
+    Base test case class for PT2E numeric debugger tests containing common utility functions
+    for numeric debugging functionality.
+    """
+
+    def _assert_each_node_has_debug_handle(self, model) -> None:
+        """Assert that each node in the model has a debug handle."""
+
+        def _assert_node_has_debug_handle(node):
+            self.assertTrue(
+                CUSTOM_KEY in node.meta
+                and NUMERIC_DEBUG_HANDLE_KEY in node.meta[CUSTOM_KEY],
+                f"Node {node} doesn't have debug handle",
+            )
+
+        bfs_trace_with_node_process(model, _assert_node_has_debug_handle)
+
+    def _extract_debug_handles(self, model) -> Dict[str, int]:
+        """Extract debug handles from all nodes in the model."""
+        debug_handle_map: Dict[str, int] = {}
+
+        def _extract_debug_handles_from_node(node):
+            nonlocal debug_handle_map
+            if (
+                CUSTOM_KEY in node.meta
+                and NUMERIC_DEBUG_HANDLE_KEY in node.meta[CUSTOM_KEY]
+            ):
+                debug_handle_map[str(node)] = node.meta[CUSTOM_KEY][
+                    NUMERIC_DEBUG_HANDLE_KEY
+                ]
+
+        bfs_trace_with_node_process(model, _extract_debug_handles_from_node)
+        return debug_handle_map
+
+    def _extract_debug_handles_with_prev_decomp_op(self, model) -> Dict[str, int]:
+        """Extract debug handles with previous decomposition operation mapping."""
+        prev_decomp_op_to_debug_handle_map: Dict[str, int] = {}
+
+        def _extract_debug_handles_with_prev_decomp_op_from_node(node):
+            nonlocal prev_decomp_op_to_debug_handle_map
+            if (
+                CUSTOM_KEY in node.meta
+                and NUMERIC_DEBUG_HANDLE_KEY in node.meta[CUSTOM_KEY]
+            ):
+                prev_decomp_op = str(node.meta.get("nn_module_stack"))
+                debug_handle = node.meta[CUSTOM_KEY][NUMERIC_DEBUG_HANDLE_KEY]
+                if prev_decomp_op not in prev_decomp_op_to_debug_handle_map:
+                    prev_decomp_op_to_debug_handle_map[prev_decomp_op] = debug_handle
+                else:
+                    assert (
+                        prev_decomp_op_to_debug_handle_map[prev_decomp_op]
+                        == debug_handle
+                    ), f"Node {node} has different debug handle {debug_handle}"
+                    "than previous node sharing the same decomp op {prev_decomp_op}"
+
+        bfs_trace_with_node_process(
+            model, _extract_debug_handles_with_prev_decomp_op_from_node
+        )
+        return prev_decomp_op_to_debug_handle_map

From 0a93be7a3fca0269e4a4626ad2b055d00766a223 Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Tue, 17 Jun 2025 15:17:14 -0700
Subject: [PATCH 130/165] Add pt2e tutorials to torchao doc page (#2384)

Summary:
att, after we migrate pt2e quant code from pytorch to torchao, now we
also want to migrate the docs as well

Test Plan:
check generated docs

Reviewers:

Subscribers:

Tasks:

Tags:
---
 docs/source/index.rst                         |  15 +-
 docs/source/quick_start.rst                   |  95 ++-
 .../tutorials_source/pt2e_quant_openvino.rst  | 251 ++++++++
 .../tutorials_source/pt2e_quant_ptq.rst       | 603 ++++++++++++++++++
 .../tutorials_source/pt2e_quant_qat.rst       | 487 ++++++++++++++
 .../pt2e_quant_x86_inductor.rst               | 305 +++++++++
 .../pt2e_quant_xpu_inductor.rst               | 238 +++++++
 .../tutorials_source/pt2e_quantizer.rst       | 381 +++++++++++
 .../pt2e/quantizer/x86_inductor_quantizer.py  |   4 +-
 9 files changed, 2369 insertions(+), 10 deletions(-)
 create mode 100644 docs/source/tutorials_source/pt2e_quant_openvino.rst
 create mode 100644 docs/source/tutorials_source/pt2e_quant_ptq.rst
 create mode 100644 docs/source/tutorials_source/pt2e_quant_qat.rst
 create mode 100644 docs/source/tutorials_source/pt2e_quant_x86_inductor.rst
 create mode 100644 docs/source/tutorials_source/pt2e_quant_xpu_inductor.rst
 create mode 100644 docs/source/tutorials_source/pt2e_quantizer.rst

diff --git a/docs/source/index.rst b/docs/source/index.rst
index 20cd0748dc..c0fd2e7bf5 100644
--- a/docs/source/index.rst
+++ b/docs/source/index.rst
@@ -12,6 +12,7 @@ for an overall introduction to the library and recent highlight and updates.
    :caption: Getting Started
 
    quick_start
+   pt2e_quant
 
 .. toctree::
    :glob:
@@ -35,7 +36,7 @@ for an overall introduction to the library and recent highlight and updates.
 .. toctree::
    :glob:
    :maxdepth: 1
-   :caption: Tutorials
+   :caption: Eager Quantization Tutorials
 
    serialization
    subclass_basic
@@ -43,3 +44,15 @@ for an overall introduction to the library and recent highlight and updates.
    static_quantization
    pretraining
    torchao_vllm_integration
+
+.. toctree::
+   :glob:
+   :maxdepth: 1
+   :caption: PT2E Quantization Tutorials
+
+   tutorials_source/pt2e_quant_ptq
+   tutorials_source/pt2e_quant_qat
+   tutorials_source/pt2e_quant_x86_inductor
+   tutorials_source/pt2e_quant_xpu_inductor
+   tutorials_source/pt2e_quantizer
+   tutorials_source/openvino_quantizer
diff --git a/docs/source/quick_start.rst b/docs/source/quick_start.rst
index f92d960c45..2bd0744d0c 100644
--- a/docs/source/quick_start.rst
+++ b/docs/source/quick_start.rst
@@ -29,20 +29,20 @@ First, let's set up our toy model:
 
   import copy
   import torch
-  
+
   class ToyLinearModel(torch.nn.Module):
       def __init__(self, m: int, n: int, k: int):
           super().__init__()
           self.linear1 = torch.nn.Linear(m, n, bias=False)
           self.linear2 = torch.nn.Linear(n, k, bias=False)
-  
+
       def forward(self, x):
           x = self.linear1(x)
           x = self.linear2(x)
           return x
-  
+
   model = ToyLinearModel(1024, 1024, 1024).eval().to(torch.bfloat16).to("cuda")
-  
+
   # Optional: compile model for faster inference and generation
   model = torch.compile(model, mode="max-autotune", fullgraph=True)
   model_bf16 = copy.deepcopy(model)
@@ -99,18 +99,18 @@ it is also much faster!
       benchmark_model,
       unwrap_tensor_subclass,
   )
-  
+
   # Temporary workaround for tensor subclass + torch.compile
   # Only needed for torch version < 2.5
   if not TORCH_VERSION_AT_LEAST_2_5:
       unwrap_tensor_subclass(model)
-  
+
   num_runs = 100
   torch._dynamo.reset()
   example_inputs = (torch.randn(1, 1024, dtype=torch.bfloat16, device="cuda"),)
   bf16_time = benchmark_model(model_bf16, num_runs, example_inputs)
   int4_time = benchmark_model(model, num_runs, example_inputs)
-  
+
   print("bf16 mean time: %0.3f ms" % bf16_time)
   print("int4 mean time: %0.3f ms" % int4_time)
   print("speedup: %0.1fx" % (bf16_time / int4_time))
@@ -121,6 +121,87 @@ On a single A100 GPU with 80GB memory, this prints::
   int4 mean time: 4.410 ms
   speedup: 6.9x
 
+PyTorch 2 Export Quantization
+=============================
+PyTorch 2 Export Quantization is a full graph quantization workflow mostly for static quantization. It targets hardwares that requires both input and output activation and weight to be quantized and relies of recognizing an operator pattern to make quantization decisions (such as linear - relu). PT2E quantization produces a pattern with quantize and dequantize ops inserted around the operators and during lowering quantized operator patterns will be fused into real quantized ops. Currently there are two typical lowering paths, 1. torch.compile through inductor lowering 2. ExecuTorch through delegation
+
+Here we show an example with X86InductorQuantizer
+
+API Example::
+
+  import torch
+  from torchao.quantization.pt2e.quantize_pt2e import prepare_pt2e
+  from torch.export import export
+  from torchao.quantization.pt2e.quantizer.x86_inductor_quantizer import (
+      X86InductorQuantizer,
+      get_default_x86_inductor_quantization_config,
+  )
+
+  class M(torch.nn.Module):
+      def __init__(self):
+          super().__init__()
+          self.linear = torch.nn.Linear(5, 10)
+
+     def forward(self, x):
+         return self.linear(x)
+
+  # initialize a floating point model
+  float_model = M().eval()
+
+  # define calibration function
+  def calibrate(model, data_loader):
+      model.eval()
+      with torch.no_grad():
+          for image, target in data_loader:
+              model(image)
+
+  # Step 1. program capture
+  m = export(m, *example_inputs).module()
+  # we get a model with aten ops
+
+  # Step 2. quantization
+  # backend developer will write their own Quantizer and expose methods to allow
+  # users to express how they
+  # want the model to be quantized
+  quantizer = X86InductorQuantizer()
+  quantizer.set_global(xiq.get_default_x86_inductor_quantization_config())
+
+  # or prepare_qat_pt2e for Quantization Aware Training
+  m = prepare_pt2e(m, quantizer)
+
+  # run calibration
+  # calibrate(m, sample_inference_data)
+  m = convert_pt2e(m)
+
+  # Step 3. lowering
+  # lower to target backend
+
+  # Optional: using the C++ wrapper instead of default Python wrapper
+  import torch._inductor.config as config
+  config.cpp_wrapper = True
+
+  with torch.no_grad():
+      optimized_model = torch.compile(converted_model)
+
+      # Running some benchmark
+      optimized_model(*example_inputs)
+
+
+Please follow these tutorials to get started on PyTorch 2 Export Quantization:
+
+Modeling Users:
+
+- `PyTorch 2 Export Post Training Quantization <https://docs.pytorch.org/ao/stable/tutorial_source/pt2e_quant_ptq.html>`_
+- `PyTorch 2 Export Quantization Aware Training <ttps://docs.pytorch.org/ao/stable/tutorial_source/pt2e_quant_qat.html>`_
+- `PyTorch 2 Export Post Training Quantization with X86 Backend through Inductor <https://docs.pytorch.org/ao/stable/tutorial_source/pt2e_quant_x86_inductor.html>`_
+- `PyTorch 2 Export Post Training Quantization with XPU Backend through Inductor <https://docs.pytorch.org/ao/stable/tutorial_source/pt2e_quant_xpu_inductor.html>`_
+- `PyTorch 2 Export Quantization for OpenVINO torch.compile Backend <https://docs.pytorch.org/ao/stable/tutorial_source/pt2e_quant_openvino.html>`_
+
+
+Backend Developers (please check out all Modeling Users docs as well):
+
+- `How to Write a Quantizer for PyTorch 2 Export Quantization <https://docs.pytorch.org/ao/stable/tutorial_source/pt2e_quantizer.html>`_
+
 
 Next Steps
 ==========
diff --git a/docs/source/tutorials_source/pt2e_quant_openvino.rst b/docs/source/tutorials_source/pt2e_quant_openvino.rst
new file mode 100644
index 0000000000..827023b300
--- /dev/null
+++ b/docs/source/tutorials_source/pt2e_quant_openvino.rst
@@ -0,0 +1,251 @@
+PyTorch 2 Export Quantization for OpenVINO torch.compile Backend
+===========================================================================
+
+**Authors**: `Daniil Lyakhov <https://github.com/daniil-lyakhov>`_,  `Aamir Nazir <https://github.com/anzr299>`_,  `Alexander Suslov <https://github.com/alexsu52>`_, `Yamini Nimmagadda <https://github.com/ynimmaga>`_, `Alexander Kozlov <https://github.com/AlexKoff88>`_
+
+Prerequisites
+--------------
+
+- `PyTorch 2 Export Post Training Quantization <https://docs.pytorch.org/ao/stable/tutorial_source/pt2e_quant_ptq.html>`_
+- `How to Write a Quantizer for PyTorch 2 Export Quantization <https://docs.pytorch.org/ao/stable/tutorial_source/pt2e_quantizer.html>`_
+
+Introduction
+--------------
+
+.. note::
+
+    This is an experimental feature, the quantization API is subject to change.
+
+This tutorial demonstrates how to use ``OpenVINOQuantizer`` from `Neural Network Compression Framework (NNCF) <https://github.com/openvinotoolkit/nncf/tree/develop>`_ in PyTorch 2 Export Quantization flow to generate a quantized model customized for the `OpenVINO torch.compile backend <https://docs.openvino.ai/2024/openvino-workflow/torch-compile.html>`_ and explains how to lower the quantized model into the `OpenVINO <https://docs.openvino.ai/2024/index.html>`_ representation.
+``OpenVINOQuantizer`` unlocks the full potential of low-precision OpenVINO kernels due to the placement of quantizers designed specifically for the OpenVINO.
+
+The PyTorch 2 export quantization flow uses ``torch.export`` to capture the model into a graph and performs quantization transformations on top of the ATen graph.
+This approach is expected to have significantly higher model coverage, improved flexibility, and a simplified UX.
+OpenVINO backend compiles the FX Graph generated by TorchDynamo into an optimized OpenVINO model.
+
+The quantization flow mainly includes four steps:
+
+- Step 1: Capture the FX Graph from the eager Model based on the `torch export mechanism <https://pytorch.org/docs/main/export.html>`_.
+- Step 2: Apply the PyTorch 2 Export Quantization flow with OpenVINOQuantizer based on the captured FX Graph.
+- Step 3: Lower the quantized model into OpenVINO representation with the `torch.compile <https://docs.openvino.ai/2024/openvino-workflow/torch-compile.html>`_ API.
+- Optional step 4: : Improve quantized model metrics via `quantize_pt2e <https://openvinotoolkit.github.io/nncf/autoapi/nncf/experimental/torch/fx/index.html#nncf.experimental.torch.fx.quantize_pt2e>`_ method.
+
+The high-level architecture of this flow could look like this:
+
+::
+
+    float_model(Python)                          Example Input
+        \                                              /
+         \                                            /
+    —--------------------------------------------------------
+    |                         export                       |
+    —--------------------------------------------------------
+                                |
+                        FX Graph in ATen
+                                |
+                                |           OpenVINOQuantizer
+                                |                 /
+    —--------------------------------------------------------
+    |                      prepare_pt2e                     |
+    |                           |                           |
+    |                       Calibrate
+    |                           |                           |
+    |                      convert_pt2e                     |
+    —--------------------------------------------------------
+                                |
+                         Quantized Model
+                                |
+    —--------------------------------------------------------
+    |                  Lower into Inductor                  |
+    —--------------------------------------------------------
+                                |
+                          OpenVINO model
+
+Post Training Quantization
+----------------------------
+
+Now, we will walk you through a step-by-step tutorial for how to use it with `torchvision resnet18 model <https://download.pytorch.org/models/resnet18-f37072fd.pth>`_
+for post training quantization.
+
+Prerequisite: OpenVINO and NNCF installation
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+OpenVINO and NNCF could be easily installed via `pip distribution <https://docs.openvino.ai/2024/get-started/install-openvino.html>`_:
+
+.. code-block:: bash
+
+    pip install -U pip
+    pip install openvino, nncf
+
+
+1. Capture FX Graph
+^^^^^^^^^^^^^^^^^^^^^
+
+We will start by performing the necessary imports, capturing the FX Graph from the eager module.
+
+.. code-block:: python
+
+    import copy
+    import openvino.torch
+    import torch
+    import torchvision.models as models
+    from torchao.quantization.pt2e.quantize_pt2e import convert_pt2e
+    from torchao.quantization.pt2e.quantize_pt2e import prepare_pt2e
+
+    import nncf.torch
+
+    # Create the Eager Model
+    model_name = "resnet18"
+    model = models.__dict__[model_name](pretrained=True)
+
+    # Set the model to eval mode
+    model = model.eval()
+
+    # Create the data, using the dummy data here as an example
+    traced_bs = 50
+    x = torch.randn(traced_bs, 3, 224, 224)
+    example_inputs = (x,)
+
+    # Capture the FX Graph to be quantized
+    with torch.no_grad(), nncf.torch.disable_patching():
+        exported_model = torch.export.export(model, example_inputs).module()
+
+
+
+2. Apply Quantization
+^^^^^^^^^^^^^^^^^^^^^^^
+
+After we capture the FX Module to be quantized, we will import the OpenVINOQuantizer.
+
+
+.. code-block:: python
+
+    from nncf.experimental.torch.fx import OpenVINOQuantizer
+
+    quantizer = OpenVINOQuantizer()
+
+``OpenVINOQuantizer`` has several optional parameters that allow tuning the quantization process to get a more accurate model.
+Below is the list of essential parameters and their description:
+
+
+* ``preset`` - defines quantization scheme for the model. Two types of presets are available:
+
+    * ``PERFORMANCE`` (default) - defines symmetric quantization of weights and activations
+
+    * ``MIXED`` - weights are quantized with symmetric quantization and the activations are quantized with asymmetric quantization. This preset is recommended for models with non-ReLU and asymmetric activation functions, e.g. ELU, PReLU, GELU, etc.
+
+    .. code-block:: python
+
+        OpenVINOQuantizer(preset=nncf.QuantizationPreset.MIXED)
+
+* ``model_type`` - used to specify quantization scheme required for specific type of the model. Transformer is the only supported special quantization scheme to preserve accuracy after quantization of Transformer models (BERT, Llama, etc.). None is default, i.e. no specific scheme is defined.
+
+    .. code-block:: python
+
+        OpenVINOQuantizer(model_type=nncf.ModelType.Transformer)
+
+* ``ignored_scope`` - this parameter can be used to exclude some layers from the quantization process to preserve the model accuracy.  For example, when you want to exclude the last layer of the model from quantization.  Below are some examples of how to use this parameter:
+
+    .. code-block:: python
+
+        #Exclude by layer name:
+        names = ['layer_1', 'layer_2', 'layer_3']
+        OpenVINOQuantizer(ignored_scope=nncf.IgnoredScope(names=names))
+
+        #Exclude by layer type:
+        types = ['Conv2d', 'Linear']
+        OpenVINOQuantizer(ignored_scope=nncf.IgnoredScope(types=types))
+
+        #Exclude by regular expression:
+        regex = '.*layer_.*'
+        OpenVINOQuantizer(ignored_scope=nncf.IgnoredScope(patterns=regex))
+
+        #Exclude by subgraphs:
+        # In this case, all nodes along all simple paths in the graph
+        # from input to output nodes will be excluded from the quantization process.
+        subgraph = nncf.Subgraph(inputs=['layer_1', 'layer_2'], outputs=['layer_3'])
+        OpenVINOQuantizer(ignored_scope=nncf.IgnoredScope(subgraphs=[subgraph]))
+
+
+* ``target_device`` - defines the target device, the specificity of which will be taken into account during optimization. The following values are supported: ``ANY`` (default), ``CPU``, ``CPU_SPR``, ``GPU``, and ``NPU``.
+
+    .. code-block:: python
+
+        OpenVINOQuantizer(target_device=nncf.TargetDevice.CPU)
+
+For further details on `OpenVINOQuantizer` please see the `documentation <https://openvinotoolkit.github.io/nncf/autoapi/nncf/experimental/torch/fx/index.html#nncf.experimental.torch.fx.OpenVINOQuantizer>`_.
+
+After we import the backend-specific Quantizer, we will prepare the model for post-training quantization.
+``prepare_pt2e`` folds BatchNorm operators into preceding Conv2d operators, and inserts observers in appropriate places in the model.
+
+.. code-block:: python
+
+    prepared_model = prepare_pt2e(exported_model, quantizer)
+
+Now, we will calibrate the ``prepared_model`` after the observers are inserted in the model.
+
+.. code-block:: python
+
+    # We use the dummy data as an example here
+    prepared_model(*example_inputs)
+
+Finally, we will convert the calibrated Model to a quantized Model. ``convert_pt2e`` takes a calibrated model and produces a quantized model.
+
+.. code-block:: python
+
+    quantized_model = convert_pt2e(prepared_model, fold_quantize=False)
+
+After these steps, we finished running the quantization flow, and we will get the quantized model.
+
+
+3. Lower into OpenVINO representation
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+
+After that the FX Graph can utilize OpenVINO optimizations using `torch.compile(…, backend=”openvino”) <https://docs.openvino.ai/2024/openvino-workflow/torch-compile.html>`_ functionality.
+
+.. code-block:: python
+
+    with torch.no_grad(), nncf.torch.disable_patching():
+        optimized_model = torch.compile(quantized_model, backend="openvino")
+
+        # Running some benchmark
+        optimized_model(*example_inputs)
+
+
+
+The optimized model is using low-level kernels designed specifically for Intel CPU.
+This should significantly speed up inference time in comparison with the eager model.
+
+4. Optional: Improve quantized model metrics
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+
+NNCF implements advanced quantization algorithms like `SmoothQuant <https://arxiv.org/abs/2211.10438>`_ and `BiasCorrection <https://arxiv.org/abs/1906.04721>`_, which help
+to improve the quantized model metrics while minimizing the output discrepancies between the original and compressed models.
+These advanced NNCF algorithms can be accessed via the NNCF `quantize_pt2e` API:
+
+.. code-block:: python
+
+    from nncf.experimental.torch.fx import quantize_pt2e
+
+    calibration_loader = torch.utils.data.DataLoader(...)
+
+
+    def transform_fn(data_item):
+        images, _ = data_item
+        return images
+
+
+    calibration_dataset = nncf.Dataset(calibration_loader, transform_fn)
+    quantized_model = quantize_pt2e(
+        exported_model, quantizer, calibration_dataset, smooth_quant=True, fast_bias_correction=False
+    )
+
+
+For further details, please see the `documentation <https://openvinotoolkit.github.io/nncf/autoapi/nncf/experimental/torch/fx/index.html#nncf.experimental.torch.fx.quantize_pt2e>`_
+and a complete `example on Resnet18 quantization <https://github.com/openvinotoolkit/nncf/blob/develop/examples/post_training_quantization/torch_fx/resnet18/README.md>`_.
+
+Conclusion
+------------
+
+This tutorial introduces how to use torch.compile with the OpenVINO backend and the OpenVINO quantizer.
+For more details on NNCF and the NNCF Quantization Flow for PyTorch models, refer to the `NNCF Quantization Guide <https://docs.openvino.ai/2025/openvino-workflow/model-optimization-guide/quantizing-models-post-training/basic-quantization-flow.html.>`_.
+For additional information, check out the `OpenVINO Deployment via torch.compile Documentation <https://docs.openvino.ai/2024/openvino-workflow/torch-compile.html>`_.
diff --git a/docs/source/tutorials_source/pt2e_quant_ptq.rst b/docs/source/tutorials_source/pt2e_quant_ptq.rst
new file mode 100644
index 0000000000..0b483697e3
--- /dev/null
+++ b/docs/source/tutorials_source/pt2e_quant_ptq.rst
@@ -0,0 +1,603 @@
+PyTorch 2 Export Post Training Quantization
+================================================================
+**Author**: `Jerry Zhang <https://github.com/jerryzh168>`_
+
+This tutorial introduces the steps to do post training static quantization in
+graph mode based on
+`torch._export.export <https://pytorch.org/docs/main/export.html>`_. Compared
+to `FX Graph Mode Quantization <https://pytorch.org/tutorials/prototype/fx_graph_mode_ptq_static.html>`_,
+this flow is expected to have significantly higher model coverage
+(`88% on 14K models <https://github.com/pytorch/pytorch/issues/93667#issuecomment-1601171596>`_),
+better programmability, and a simplified UX.
+
+Exportable by `torch.export.export` is a prerequisite to use the flow, you can
+find what are the constructs that's supported in `Export DB <https://pytorch.org/docs/main/generated/exportdb/index.html>`_.
+
+The high level architecture of quantization 2 with quantizer could look like
+this:
+
+::
+
+    float_model(Python)                          Example Input
+        \                                              /
+         \                                            /
+    —-------------------------------------------------------
+    |                        export                        |
+    —-------------------------------------------------------
+                                |
+                        FX Graph in ATen     Backend Specific Quantizer
+                                |                       /
+    —--------------------------------------------------------
+    |                     prepare_pt2e                      |
+    —--------------------------------------------------------
+                                |
+                         Calibrate/Train
+                                |
+    —--------------------------------------------------------
+    |                    convert_pt2e                       |
+    —--------------------------------------------------------
+                                |
+                        Quantized Model
+                                |
+    —--------------------------------------------------------
+    |                       Lowering                        |
+    —--------------------------------------------------------
+                                |
+            Executorch, Inductor or <Other Backends>
+
+
+The PyTorch 2 export quantization API looks like this:
+
+.. code:: python
+
+  import torch
+  class M(torch.nn.Module):
+     def __init__(self):
+        super().__init__()
+        self.linear = torch.nn.Linear(5, 10)
+
+     def forward(self, x):
+        return self.linear(x)
+
+
+  example_inputs = (torch.randn(1, 5),)
+  m = M().eval()
+
+  # Step 1. program capture
+  # This is available for pytorch 2.6+, for more details on lower pytorch versions
+  # please check `Export the model with torch.export` section
+  m = torch.export.export(m, example_inputs).module()
+  # we get a model with aten ops
+
+
+  # Step 2. quantization
+  from torchao.quantization.pt2e.quantize_pt2e import (
+    prepare_pt2e,
+    convert_pt2e,
+  )
+
+  # install executorch: `pip install executorch`
+  from executorch.backends.xnnpack.quantizer.xnnpack_quantizer import (
+    get_symmetric_quantization_config,
+    XNNPACKQuantizer,
+  )
+  # backend developer will write their own Quantizer and expose methods to allow
+  # users to express how they
+  # want the model to be quantized
+  quantizer = XNNPACKQuantizer().set_global(get_symmetric_quantization_config())
+  m = prepare_pt2e(m, quantizer)
+
+  # calibration omitted
+
+  m = convert_pt2e(m)
+  # we have a model with aten ops doing integer computations when possible
+
+
+Motivation of PyTorch 2 Export Quantization
+---------------------------------------------
+
+In PyTorch versions prior to 2, we have FX Graph Mode Quantization that uses
+`QConfigMapping <https://pytorch.org/docs/main/generated/torch.ao.quantization.qconfig_mapping.QConfigMapping.html>`_
+and `BackendConfig <https://pytorch.org/docs/stable/generated/torch.ao.quantization.backend_config.BackendConfig.html>`_
+for customizations. ``QConfigMapping`` allows modeling users to specify how
+they want their model to be quantized, ``BackendConfig`` allows backend
+developers to specify the supported ways of quantization in their backend. While
+that API covers most use cases relatively well, it is not fully extensible.
+There are two main limitations for the current API:
+
+* Limitation around expressing quantization intentions for complicated operator
+  patterns (how an operator pattern should be observed/quantized) using existing
+  objects: ``QConfig`` and ``QConfigMapping``.
+
+* Limited support on how user can express their intention of how they want
+  their model to be quantized. For example, if users want to quantize the every
+  other linear in the model, or the quantization behavior has some dependency on
+  the actual shape of the Tensor (for example, only observe/quantize inputs
+  and outputs when the linear has a 3D input), backend developer or modeling
+  users need to change the core quantization API/flow.
+
+A few improvements could make the existing flow better:
+
+* We use ``QConfigMapping`` and ``BackendConfig`` as separate objects,
+  ``QConfigMapping`` describes user’s intention of how they want their model to
+  be quantized, ``BackendConfig`` describes what kind of quantization a backend
+  supports. ``BackendConfig`` is backend-specific, but ``QConfigMapping`` is not,
+  and the user can provide a ``QConfigMapping`` that is incompatible with a specific
+  ``BackendConfig``, this is not a great UX. Ideally, we can structure this better
+  by making both configuration (``QConfigMapping``) and quantization capability
+  (``BackendConfig``) backend-specific, so there will be less confusion about
+  incompatibilities.
+* In ``QConfig`` we are exposing observer/ ``fake_quant`` observer classes as an
+  object for the user to configure quantization, this increases the things that
+  the user may need to care about. For example, not only the ``dtype`` but also
+  how the observation should happen, these could potentially be hidden from the
+  user so that the user flow is simpler.
+
+Here is a summary of the benefits of the new API:
+
+- **Programmability** (addressing 1. and 2.): When a user’s quantization needs
+  are not covered by available quantizers, users can build their own quantizer and
+  compose it with other quantizers as mentioned above.
+- **Simplified UX** (addressing 3.): Provides a single instance with which both
+  backend and users interact. Thus you no longer have the user facing quantization
+  config mapping to map users intent and a separate quantization config that
+  backends interact with to configure what backend support. We will still have a
+  method for users to query what is supported in a quantizer. With a single
+  instance, composing different quantization capabilities also becomes more
+  natural than previously.
+
+  For example XNNPACK does not support ``embedding_byte``
+  and we have natively support for this in ExecuTorch. Thus, if we had
+  ``ExecuTorchQuantizer`` that only quantized ``embedding_byte``, then it can be
+  composed with ``XNNPACKQuantizer``. (Previously, this used to be concatenating the
+  two ``BackendConfig`` together and since options in ``QConfigMapping`` are not
+  backend specific, user also need to figure out how to specify the configurations
+  by themselves that matches the quantization capabilities of the combined
+  backend. With a single quantizer instance, we can compose two quantizers and
+  query the composed quantizer for capabilities, which makes it less error prone
+  and cleaner, for example, ``composed_quantizer.quantization_capabilities())``.
+
+- **Separation of concerns** (addressing 4.): As we design the quantizer API, we
+  also decouple specification of quantization, as expressed in terms of ``dtype``,
+  min/max (# of bits), symmetric, and so on, from the observer concept.
+  Currently, the observer captures both quantization specification and how to
+  observe (Histogram vs MinMax observer). Modeling users are freed from
+  interacting with observer and fake quant objects with this change.
+
+Define Helper Functions and Prepare Dataset
+-------------------------------------------
+
+We’ll start by doing the necessary imports, defining some helper functions and
+prepare the data. These steps are identitcal to
+`Static Quantization with Eager Mode in PyTorch <https://pytorch.org/tutorials/advanced/static_quantization_tutorial.html>`_.
+
+To run the code in this tutorial using the entire ImageNet dataset, first
+download Imagenet by following the instructions at here
+`ImageNet Data <http://www.image-net.org/download>`_. Unzip the downloaded file
+into the ``data_path`` folder.
+
+Download the `torchvision resnet18 model <https://download.pytorch.org/models/resnet18-f37072fd.pth>`_
+and rename it to ``data/resnet18_pretrained_float.pth``.
+
+.. code:: python
+
+    import os
+    import sys
+    import time
+    import numpy as np
+
+    import torch
+    import torch.nn as nn
+    from torch.utils.data import DataLoader
+
+    import torchvision
+    from torchvision import datasets
+    from torchvision.models.resnet import resnet18
+    import torchvision.transforms as transforms
+
+    # Set up warnings
+    import warnings
+    warnings.filterwarnings(
+        action='ignore',
+        category=DeprecationWarning,
+        module=r'.*'
+    )
+    warnings.filterwarnings(
+        action='default',
+        module=r'torchao.quantization.pt2e'
+    )
+
+    # Specify random seed for repeatable results
+    _ = torch.manual_seed(191009)
+
+
+    class AverageMeter(object):
+        """Computes and stores the average and current value"""
+        def __init__(self, name, fmt=':f'):
+            self.name = name
+            self.fmt = fmt
+            self.reset()
+
+        def reset(self):
+            self.val = 0
+            self.avg = 0
+            self.sum = 0
+            self.count = 0
+
+        def update(self, val, n=1):
+            self.val = val
+            self.sum += val * n
+            self.count += n
+            self.avg = self.sum / self.count
+
+        def __str__(self):
+            fmtstr = '{name} {val' + self.fmt + '} ({avg' + self.fmt + '})'
+            return fmtstr.format(**self.__dict__)
+
+
+    def accuracy(output, target, topk=(1,)):
+        """
+        Computes the accuracy over the k top predictions for the specified
+        values of k.
+        """
+        with torch.no_grad():
+            maxk = max(topk)
+            batch_size = target.size(0)
+
+            _, pred = output.topk(maxk, 1, True, True)
+            pred = pred.t()
+            correct = pred.eq(target.view(1, -1).expand_as(pred))
+
+            res = []
+            for k in topk:
+                correct_k = correct[:k].reshape(-1).float().sum(0, keepdim=True)
+                res.append(correct_k.mul_(100.0 / batch_size))
+            return res
+
+
+    def evaluate(model, criterion, data_loader):
+        model.eval()
+        top1 = AverageMeter('Acc@1', ':6.2f')
+        top5 = AverageMeter('Acc@5', ':6.2f')
+        cnt = 0
+        with torch.no_grad():
+            for image, target in data_loader:
+                output = model(image)
+                loss = criterion(output, target)
+                cnt += 1
+                acc1, acc5 = accuracy(output, target, topk=(1, 5))
+                top1.update(acc1[0], image.size(0))
+                top5.update(acc5[0], image.size(0))
+        print('')
+
+        return top1, top5
+
+    def load_model(model_file):
+        model = resnet18(pretrained=False)
+        state_dict = torch.load(model_file, weights_only=True)
+        model.load_state_dict(state_dict)
+        model.to("cpu")
+        return model
+
+    def print_size_of_model(model):
+        torch.save(model.state_dict(), "temp.p")
+        print("Size (MB):", os.path.getsize("temp.p")/1e6)
+        os.remove("temp.p")
+
+    def prepare_data_loaders(data_path):
+        normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406],
+                                         std=[0.229, 0.224, 0.225])
+        dataset = torchvision.datasets.ImageNet(
+            data_path, split="train", transform=transforms.Compose([
+                transforms.RandomResizedCrop(224),
+                transforms.RandomHorizontalFlip(),
+                transforms.ToTensor(),
+                normalize,
+            ]))
+        dataset_test = torchvision.datasets.ImageNet(
+            data_path, split="val", transform=transforms.Compose([
+                transforms.Resize(256),
+                transforms.CenterCrop(224),
+                transforms.ToTensor(),
+                normalize,
+            ]))
+
+        train_sampler = torch.utils.data.RandomSampler(dataset)
+        test_sampler = torch.utils.data.SequentialSampler(dataset_test)
+
+        data_loader = torch.utils.data.DataLoader(
+            dataset, batch_size=train_batch_size,
+            sampler=train_sampler)
+
+        data_loader_test = torch.utils.data.DataLoader(
+            dataset_test, batch_size=eval_batch_size,
+            sampler=test_sampler)
+
+        return data_loader, data_loader_test
+
+    data_path = '~/.data/imagenet'
+    saved_model_dir = 'data/'
+    float_model_file = 'resnet18_pretrained_float.pth'
+
+    train_batch_size = 30
+    eval_batch_size = 50
+
+    data_loader, data_loader_test = prepare_data_loaders(data_path)
+    example_inputs = (next(iter(data_loader))[0])
+    criterion = nn.CrossEntropyLoss()
+    float_model = load_model(saved_model_dir + float_model_file).to("cpu")
+    float_model.eval()
+
+    # create another instance of the model since
+    # we need to keep the original model around
+    model_to_quantize = load_model(saved_model_dir + float_model_file).to("cpu")
+
+Set the model to eval mode
+--------------------------
+
+For post training quantization, we'll need to set the model to the eval mode.
+
+.. code:: python
+
+    model_to_quantize.eval()
+
+Export the model with torch.export
+----------------------------------
+
+Here is how you can use ``torch.export`` to export the model:
+
+.. code-block:: python
+
+    example_inputs = (torch.rand(2, 3, 224, 224),)
+    # for pytorch 2.6+
+    exported_model = torch.export.export(model_to_quantize, example_inputs).module()
+
+    # for pytorch 2.5 and before
+    # from torch._export import capture_pre_autograd_graph
+    # exported_model = capture_pre_autograd_graph(model_to_quantize, example_inputs)
+
+    # or capture with dynamic dimensions
+    # for pytorch 2.6+
+    dynamic_shapes = tuple(
+      {0: torch.export.Dim("dim")} if i == 0 else None
+      for i in range(len(example_inputs))
+    )
+    exported_model = torch.export.export_for_training(model_to_quantize, example_inputs, dynamic_shapes=dynamic_shapes).module()
+
+    # for pytorch 2.5 and before
+    # dynamic_shape API may vary as well
+    # from torch._export import dynamic_dim
+    # exported_model = capture_pre_autograd_graph(model_to_quantize, example_inputs, constraints=[dynamic_dim(example_inputs[0], 0)])
+
+
+Import the Backend Specific Quantizer and Configure how to Quantize the Model
+-----------------------------------------------------------------------------
+
+The following code snippets describes how to quantize the model:
+
+.. code-block:: python
+
+  from executorch.backends.xnnpack.quantizer.xnnpack_quantizer import (
+    get_symmetric_quantization_config,
+    XNNPACKQuantizer,
+  )
+  quantizer = XNNPACKQuantizer()
+  quantizer.set_global(get_symmetric_quantization_config())
+
+``Quantizer`` is backend specific, and each ``Quantizer`` will provide their
+own way to allow users to configure their model. Just as an example, here is
+the different configuration APIs supported by ``XNNPackQuantizer``:
+
+.. code-block:: python
+
+  quantizer.set_global(qconfig_opt)  # qconfig_opt is an optional quantization config
+      .set_object_type(torch.nn.Conv2d, qconfig_opt) # can be a module type
+      .set_object_type(torch.nn.functional.linear, qconfig_opt) # or torch functional op
+      .set_module_name("foo.bar", qconfig_opt)
+
+.. note::
+
+   Check out our
+   `tutorial <https://pytorch.org/tutorials/prototype/pt2e_quantizer.html>`_
+   that describes how to write a new ``Quantizer``.
+
+Prepare the Model for Post Training Quantization
+----------------------------------------------------------
+
+``prepare_pt2e`` folds ``BatchNorm`` operators into preceding ``Conv2d``
+operators, and inserts observers in appropriate places in the model.
+
+.. code-block:: python
+
+    prepared_model = prepare_pt2e(exported_model, quantizer)
+    print(prepared_model.graph)
+
+Calibration
+--------------
+
+The calibration function is run after the observers are inserted in the model.
+The purpose for calibration is to run through some sample examples that is
+representative of the workload (for example a sample of the training data set)
+so that the observers in themodel are able to observe the statistics of the
+Tensors and we can later use this information to calculate quantization
+parameters.
+
+.. code-block:: python
+
+    def calibrate(model, data_loader):
+        model.eval()
+        with torch.no_grad():
+            for image, target in data_loader:
+                model(image)
+    calibrate(prepared_model, data_loader_test)  # run calibration on sample data
+
+Convert the Calibrated Model to a Quantized Model
+-------------------------------------------------
+
+``convert_pt2e`` takes a calibrated model and produces a quantized model.
+
+.. code-block:: python
+
+    quantized_model = convert_pt2e(prepared_model)
+    print(quantized_model)
+
+At this step, we currently have two representations that you can choose from, but exact representation
+we offer in the long term might change based on feedback from PyTorch users.
+
+* Q/DQ Representation (default)
+
+  Previous documentation for `representations <https://github.com/pytorch/rfcs/blob/master/RFC-0019-Extending-PyTorch-Quantization-to-Custom-Backends.md>`_ all quantized operators are represented as ``dequantize -> fp32_op -> qauntize``.
+
+.. code-block:: python
+
+   def quantized_linear(x_int8, x_scale, x_zero_point, weight_int8, weight_scale, weight_zero_point, bias_fp32, output_scale, output_zero_point):
+       x_fp32 = torch.ops.quantized_decomposed.dequantize_per_tensor(
+                x_i8, x_scale, x_zero_point, x_quant_min, x_quant_max, torch.int8)
+       weight_fp32 = torch.ops.quantized_decomposed.dequantize_per_tensor(
+                weight_i8, weight_scale, weight_zero_point, weight_quant_min, weight_quant_max, torch.int8)
+       weight_permuted = torch.ops.aten.permute_copy.default(weight_fp32, [1, 0]);
+       out_fp32 = torch.ops.aten.addmm.default(bias_fp32, x_fp32, weight_permuted)
+       out_i8 = torch.ops.quantized_decomposed.quantize_per_tensor(
+       out_fp32, out_scale, out_zero_point, out_quant_min, out_quant_max, torch.int8)
+       return out_i8
+
+* Reference Quantized Model Representation
+
+  We will have a special representation for selected ops, for example, quantized linear. Other ops are represented as ``dq -> float32_op -> q`` and ``q/dq`` are decomposed into more primitive operators.
+  You can get this representation by using ``convert_pt2e(..., use_reference_representation=True)``.
+
+.. code-block:: python
+
+  # Reference Quantized Pattern for quantized linear
+  def quantized_linear(x_int8, x_scale, x_zero_point, weight_int8, weight_scale, weight_zero_point, bias_fp32, output_scale, output_zero_point):
+      x_int16 = x_int8.to(torch.int16)
+      weight_int16 = weight_int8.to(torch.int16)
+      acc_int32 = torch.ops.out_dtype(torch.mm, torch.int32, (x_int16 - x_zero_point), (weight_int16 - weight_zero_point))
+      bias_scale = x_scale * weight_scale
+      bias_int32 = out_dtype(torch.ops.aten.div.Tensor, torch.int32, bias_fp32, bias_scale)
+      acc_int32 = acc_int32 + bias_int32
+      acc_int32 = torch.ops.out_dtype(torch.ops.aten.mul.Scalar, torch.int32, acc_int32, x_scale * weight_scale / output_scale) + output_zero_point
+      out_int8 = torch.ops.aten.clamp(acc_int32, qmin, qmax).to(torch.int8)
+      return out_int8
+
+
+See `here <https://github.com/pytorch/pytorch/blob/main/torch/ao/quantization/pt2e/representation/rewrite.py>`_ for the most up-to-date reference representations.
+
+
+Checking Model Size and Accuracy Evaluation
+----------------------------------------------
+
+Now we can compare the size and model accuracy with baseline model.
+
+.. code-block:: python
+
+    # Baseline model size and accuracy
+    print("Size of baseline model")
+    print_size_of_model(float_model)
+
+    top1, top5 = evaluate(float_model, criterion, data_loader_test)
+    print("Baseline Float Model Evaluation accuracy: %2.2f, %2.2f"%(top1.avg, top5.avg))
+
+    # Quantized model size and accuracy
+    print("Size of model after quantization")
+    # export again to remove unused weights
+    quantized_model = torch.export.export_for_training(quantized_model, example_inputs).module()
+    print_size_of_model(quantized_model)
+
+    top1, top5 = evaluate(quantized_model, criterion, data_loader_test)
+    print("[before serilaization] Evaluation accuracy on test dataset: %2.2f, %2.2f"%(top1.avg, top5.avg))
+
+
+.. note::
+   We can't do performance evaluation now since the model is not lowered to
+   target device, it's just a representation of quantized computation in ATen
+   operators.
+
+.. note::
+   The weights are still in fp32 right now, we may do constant propagation for quantize op to
+   get integer weights in the future.
+
+If you want to get better accuracy or performance,  try configuring
+``quantizer`` in different ways, and each ``quantizer`` will have its own way
+of configuration, so please consult the documentation for the
+quantizer you are using to learn more about how you can have more control
+over how to quantize a model.
+
+Save and Load Quantized Model
+---------------------------------
+
+We'll show how to save and load the quantized model.
+
+
+.. code-block:: python
+
+    # 0. Store reference output, for example, inputs, and check evaluation accuracy:
+    example_inputs = (next(iter(data_loader))[0],)
+    ref = quantized_model(*example_inputs)
+    top1, top5 = evaluate(quantized_model, criterion, data_loader_test)
+    print("[before serialization] Evaluation accuracy on test dataset: %2.2f, %2.2f"%(top1.avg, top5.avg))
+
+    # 1. Export the model and Save ExportedProgram
+    pt2e_quantized_model_file_path = saved_model_dir + "resnet18_pt2e_quantized.pth"
+    # capture the model to get an ExportedProgram
+    quantized_ep = torch.export.export(quantized_model, example_inputs)
+    # use torch.export.save to save an ExportedProgram
+    torch.export.save(quantized_ep, pt2e_quantized_model_file_path)
+
+
+    # 2. Load the saved ExportedProgram
+    loaded_quantized_ep = torch.export.load(pt2e_quantized_model_file_path)
+    loaded_quantized_model = loaded_quantized_ep.module()
+
+    # 3. Check results for example inputs and check evaluation accuracy again:
+    res = loaded_quantized_model(*example_inputs)
+    print("diff:", ref - res)
+
+    top1, top5 = evaluate(loaded_quantized_model, criterion, data_loader_test)
+    print("[after serialization/deserialization] Evaluation accuracy on test dataset: %2.2f, %2.2f"%(top1.avg, top5.avg))
+
+
+Output:
+
+
+.. code-block:: python
+
+   [before serialization] Evaluation accuracy on test dataset: 79.82, 94.55
+   diff: tensor([[0., 0., 0.,  ..., 0., 0., 0.],
+           [0., 0., 0.,  ..., 0., 0., 0.],
+           [0., 0., 0.,  ..., 0., 0., 0.],
+           ...,
+           [0., 0., 0.,  ..., 0., 0., 0.],
+           [0., 0., 0.,  ..., 0., 0., 0.],
+           [0., 0., 0.,  ..., 0., 0., 0.]])
+
+   [after serialization/deserialization] Evaluation accuracy on test dataset: 79.82, 94.55
+
+
+Debugging the Quantized Model
+------------------------------
+
+You can use `Numeric Suite <https://pytorch.org/docs/stable/quantization-accuracy-debugging.html#numerical-debugging-tooling-prototype>`_
+that can help with debugging in eager mode and FX graph mode. The new version of
+Numeric Suite working with PyTorch 2 Export models is still in development.
+
+Lowering and Performance Evaluation
+------------------------------------
+
+The model produced at this point is not the final model that runs on the device,
+it is a reference quantized model that captures the intended quantized computation
+from the user, expressed as ATen operators and some additional quantize/dequantize operators,
+to get a model that runs on real devices, we'll need to lower the model.
+For example, for the models that run on edge devices, we can lower with delegation and ExecuTorch runtime
+operators.
+
+Conclusion
+--------------
+
+In this tutorial, we went through the overall quantization flow in PyTorch 2
+Export Quantization using ``XNNPACKQuantizer`` and got a quantized model that
+could be further lowered to a backend that supports inference with XNNPACK
+backend. To use this for your own backend, please first follow the
+`tutorial <https://pytorch.org/tutorials/prototype/pt2e_quantizer.html>`__ and
+implement a ``Quantizer`` for your backend, and then quantize the model with
+that ``Quantizer``.
diff --git a/docs/source/tutorials_source/pt2e_quant_qat.rst b/docs/source/tutorials_source/pt2e_quant_qat.rst
new file mode 100644
index 0000000000..cba870c668
--- /dev/null
+++ b/docs/source/tutorials_source/pt2e_quant_qat.rst
@@ -0,0 +1,487 @@
+PyTorch 2 Export Quantization-Aware Training (QAT)
+================================================================
+**Author**: `Andrew Or <https://github.com/andrewor14>`_
+
+This tutorial shows how to perform quantization-aware training (QAT) in
+graph mode based on `torch.export.export <https://pytorch.org/docs/main/export.html>`_.
+For more details about PyTorch 2 Export Quantization in general, refer
+to the `post training quantization tutorial <https://docs.pytorch.org/ao/stable/tutorial_source/pt2e_quant_ptq.html>`_
+
+The PyTorch 2 Export QAT flow looks like the following—it is similar
+to the post training quantization (PTQ) flow for the most part:
+
+.. code:: python
+
+  import torch
+  from torch._export import capture_pre_autograd_graph
+  from torchao.quantization.pt2e.quantize_pt2e import (
+    prepare_qat_pt2e,
+    convert_pt2e,
+  )
+  from executorch.backends.xnnpack.quantizer.xnnpack_quantizer import (
+    get_symmetric_quantization_config,
+    XNNPACKQuantizer,
+  )
+
+  class M(torch.nn.Module):
+     def __init__(self):
+        super().__init__()
+        self.linear = torch.nn.Linear(5, 10)
+
+     def forward(self, x):
+        return self.linear(x)
+
+
+  example_inputs = (torch.randn(1, 5),)
+  m = M()
+
+  # Step 1. program capture
+  # This is available for pytorch 2.6+, for more details on lower pytorch versions
+  # please check `Export the model with torch.export` section
+  m = torch.export.export(m, example_inputs).module()
+  # we get a model with aten ops
+
+  # Step 2. quantization-aware training
+  # backend developer will write their own Quantizer and expose methods to allow
+  # users to express how they want the model to be quantized
+  quantizer = XNNPACKQuantizer().set_global(get_symmetric_quantization_config())
+  m = prepare_qat_pt2e(m, quantizer)
+
+  # train omitted
+
+  m = convert_pt2e(m)
+  # we have a model with aten ops doing integer computations when possible
+
+  # move the quantized model to eval mode, equivalent to `m.eval()`
+  torchao.quantization.pt2e.move_exported_model_to_eval(m)
+
+Note that calling ``model.eval()`` or ``model.train()`` after program capture is
+not allowed, because these methods no longer correctly change the behavior of
+certain ops like dropout and batch normalization. Instead, please use
+``torchao.quantization.pt2e.move_exported_model_to_eval()`` and
+``torchao.quantization.pt2e.move_exported_model_to_train()`` (coming soon)
+respectively.
+
+
+Define Helper Functions and Prepare the Dataset
+-----------------------------------------------
+
+To run the code in this tutorial using the entire ImageNet dataset, first
+download ImageNet by following the instructions in
+`ImageNet Data <http://www.image-net.org/download>`_. Unzip the downloaded file
+into the ``data_path`` folder.
+
+Next, download the `torchvision resnet18 model <https://download.pytorch.org/models/resnet18-f37072fd.pth>`_
+and rename it to ``data/resnet18_pretrained_float.pth``.
+
+We’ll start by doing the necessary imports, defining some helper functions and
+prepare the data. These steps are very similar to the ones defined in the
+`static eager mode post training quantization tutorial <https://pytorch.org/tutorials/advanced/static_quantization_tutorial.html>`_:
+
+.. code:: python
+
+    import os
+    import sys
+    import time
+    import numpy as np
+
+    import torch
+    import torch.nn as nn
+    from torch.utils.data import DataLoader
+
+    import torchvision
+    from torchvision import datasets
+    from torchvision.models.resnet import resnet18
+    import torchvision.transforms as transforms
+
+    # Set up warnings
+    import warnings
+    warnings.filterwarnings(
+        action='ignore',
+        category=DeprecationWarning,
+        module=r'.*'
+    )
+    warnings.filterwarnings(
+        action='default',
+        module=r'torchao.quantization.pt2e'
+    )
+
+    # Specify random seed for repeatable results
+    _ = torch.manual_seed(191009)
+
+    class AverageMeter(object):
+        """Computes and stores the average and current value"""
+        def __init__(self, name, fmt=':f'):
+            self.name = name
+            self.fmt = fmt
+            self.reset()
+
+        def reset(self):
+            self.val = 0
+            self.avg = 0
+            self.sum = 0
+            self.count = 0
+
+        def update(self, val, n=1):
+            self.val = val
+            self.sum += val * n
+            self.count += n
+            self.avg = self.sum / self.count
+
+        def __str__(self):
+            fmtstr = '{name} {val' + self.fmt + '} ({avg' + self.fmt + '})'
+            return fmtstr.format(**self.__dict__)
+
+    def accuracy(output, target, topk=(1,)):
+        """
+        Computes the accuracy over the k top predictions for the specified
+        values of k.
+        """
+        with torch.no_grad():
+            maxk = max(topk)
+            batch_size = target.size(0)
+
+            _, pred = output.topk(maxk, 1, True, True)
+            pred = pred.t()
+            correct = pred.eq(target.view(1, -1).expand_as(pred))
+
+            res = []
+            for k in topk:
+                correct_k = correct[:k].reshape(-1).float().sum(0, keepdim=True)
+                res.append(correct_k.mul_(100.0 / batch_size))
+            return res
+
+    def evaluate(model, criterion, data_loader, device):
+        torchao.quantization.pt2e.move_exported_model_to_eval(model)
+        top1 = AverageMeter('Acc@1', ':6.2f')
+        top5 = AverageMeter('Acc@5', ':6.2f')
+        cnt = 0
+        with torch.no_grad():
+            for image, target in data_loader:
+                image = image.to(device)
+                target = target.to(device)
+                output = model(image)
+                loss = criterion(output, target)
+                cnt += 1
+                acc1, acc5 = accuracy(output, target, topk=(1, 5))
+                top1.update(acc1[0], image.size(0))
+                top5.update(acc5[0], image.size(0))
+        print('')
+
+        return top1, top5
+
+    def load_model(model_file):
+        model = resnet18(pretrained=False)
+        state_dict = torch.load(model_file, weights_only=True)
+        model.load_state_dict(state_dict)
+        return model
+
+    def print_size_of_model(model):
+        if isinstance(model, torch.jit.RecursiveScriptModule):
+            torch.jit.save(model, "temp.p")
+        else:
+            torch.jit.save(torch.jit.script(model), "temp.p")
+        print("Size (MB):", os.path.getsize("temp.p")/1e6)
+        os.remove("temp.p")
+
+    def prepare_data_loaders(data_path):
+        normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406],
+                                         std=[0.229, 0.224, 0.225])
+        dataset = torchvision.datasets.ImageNet(
+            data_path, split="train", transform=transforms.Compose([
+                transforms.RandomResizedCrop(224),
+                transforms.RandomHorizontalFlip(),
+                transforms.ToTensor(),
+                normalize,
+            ]))
+        dataset_test = torchvision.datasets.ImageNet(
+            data_path, split="val", transform=transforms.Compose([
+                transforms.Resize(256),
+                transforms.CenterCrop(224),
+                transforms.ToTensor(),
+                normalize,
+            ]))
+
+        train_sampler = torch.utils.data.RandomSampler(dataset)
+        test_sampler = torch.utils.data.SequentialSampler(dataset_test)
+
+        data_loader = torch.utils.data.DataLoader(
+            dataset, batch_size=train_batch_size,
+            sampler=train_sampler)
+
+        data_loader_test = torch.utils.data.DataLoader(
+            dataset_test, batch_size=eval_batch_size,
+            sampler=test_sampler)
+
+        return data_loader, data_loader_test
+
+    def train_one_epoch(model, criterion, optimizer, data_loader, device, ntrain_batches):
+        # Note: do not call model.train() here, since this doesn't work on an exported model.
+        # Instead, call `torchao.quantization.pt2e.move_exported_model_to_train(model)`, which will
+        # be added in the near future
+        top1 = AverageMeter('Acc@1', ':6.2f')
+        top5 = AverageMeter('Acc@5', ':6.2f')
+        avgloss = AverageMeter('Loss', '1.5f')
+
+        cnt = 0
+        for image, target in data_loader:
+            start_time = time.time()
+            print('.', end = '')
+            cnt += 1
+            image, target = image.to(device), target.to(device)
+            output = model(image)
+            loss = criterion(output, target)
+            optimizer.zero_grad()
+            loss.backward()
+            optimizer.step()
+            acc1, acc5 = accuracy(output, target, topk=(1, 5))
+            top1.update(acc1[0], image.size(0))
+            top5.update(acc5[0], image.size(0))
+            avgloss.update(loss, image.size(0))
+            if cnt >= ntrain_batches:
+                print('Loss', avgloss.avg)
+
+                print('Training: * Acc@1 {top1.avg:.3f} Acc@5 {top5.avg:.3f}'
+                      .format(top1=top1, top5=top5))
+                return
+
+        print('Full imagenet train set:  * Acc@1 {top1.global_avg:.3f} Acc@5 {top5.global_avg:.3f}'
+              .format(top1=top1, top5=top5))
+        return
+
+    data_path = '~/.data/imagenet'
+    saved_model_dir = 'data/'
+    float_model_file = 'resnet18_pretrained_float.pth'
+
+    train_batch_size = 32
+    eval_batch_size = 32
+
+    data_loader, data_loader_test = prepare_data_loaders(data_path)
+    example_inputs = (next(iter(data_loader))[0])
+    criterion = nn.CrossEntropyLoss()
+    float_model = load_model(saved_model_dir + float_model_file).to("cuda")
+
+
+Export the model with torch.export
+----------------------------------
+
+Here is how you can use ``torch.export`` to export the model:
+
+.. code:: python
+
+    from torch.export import export
+
+    example_inputs = (torch.rand(2, 3, 224, 224),)
+    # for pytorch 2.6+
+    exported_model = torch.export.export(float_model, example_inputs).module()
+    # for pytorch 2.5 and before
+    # from torch._export import capture_pre_autograd_graph
+    # exported_model = capture_pre_autograd_graph(model_to_quantize, example_inputs)
+
+
+.. code:: python
+
+    # or, to capture with dynamic dimensions:
+
+    # for pytorch 2.6+
+    dynamic_shapes = tuple(
+      {0: torch.export.Dim("dim")} if i == 0 else None
+      for i in range(len(example_inputs))
+    )
+    exported_model = torch.export.export(float_model, example_inputs, dynamic_shapes=dynamic_shapes).module()
+
+    # for pytorch 2.5 and before
+    # dynamic_shape API may vary as well
+    # from torch._export import dynamic_dim
+
+    # example_inputs = (torch.rand(2, 3, 224, 224),)
+    # exported_model = capture_pre_autograd_graph(
+    #     float_model,
+    #     example_inputs,
+    #     constraints=[dynamic_dim(example_inputs[0], 0)],
+    # )
+
+
+Import the Backend Specific Quantizer and Configure how to Quantize the Model
+-----------------------------------------------------------------------------
+
+The following code snippets describe how to quantize the model:
+
+.. code-block:: python
+
+  from executorch.backends.xnnpack.quantizer.xnnpack_quantizer import (
+    get_symmetric_quantization_config,
+    XNNPACKQuantizer,
+  )
+  quantizer = XNNPACKQuantizer()
+  quantizer.set_global(get_symmetric_quantization_config(is_qat=True))
+
+``Quantizer`` is backend specific, and each ``Quantizer`` will provide their
+own way to allow users to configure their model.
+
+.. note::
+
+   Check out our
+   `tutorial <https://pytorch.org/tutorials/prototype/pt2e_quantizer.html>`_
+   that describes how to write a new ``Quantizer``.
+
+
+Prepare the Model for Quantization-Aware Training
+----------------------------------------------------------
+
+``prepare_qat_pt2e`` inserts fake quantizes in appropriate places in the model
+and performs the appropriate QAT "fusions", such as ``Conv2d`` + ``BatchNorm2d``,
+for better training accuracies. The fused operations are represented as a subgraph
+of ATen ops in the prepared graph.
+
+.. code-block:: python
+
+    prepared_model = prepare_qat_pt2e(exported_model, quantizer)
+    print(prepared_model)
+
+.. note::
+
+    If your model contains batch normalization, the actual ATen ops you get
+    in the graph depend on the model's device when you export the model.
+    If the model is on CPU, then you'll get ``torch.ops.aten._native_batch_norm_legit``.
+    If the model is on CUDA, then you'll get ``torch.ops.aten.cudnn_batch_norm``.
+    However, this is not fundamental and may be subject to change in the future.
+
+    Between these two ops, it has been shown that ``torch.ops.aten.cudnn_batch_norm``
+    provides better numerics on models like MobileNetV2. To get this op, either
+    call ``model.cuda()`` before export, or run the following after prepare to manually
+    swap the ops:
+
+    .. code:: python
+
+        for n in prepared_model.graph.nodes:
+            if n.target == torch.ops.aten._native_batch_norm_legit.default:
+                n.target = torch.ops.aten.cudnn_batch_norm.default
+        prepared_model.recompile()
+
+    In the future, we plan to consolidate the batch normalization ops such that
+    the above will no longer be necessary.
+
+Training Loop
+-----------------------------------------------------------------------------
+
+The training loop is similar to the ones in previous versions of QAT. To achieve
+better accuracies, you may optionally disable observers and updating batch
+normalization statistics after a certain number of epochs, or evaluate the QAT
+or the quantized model trained so far every ``N`` epochs.
+
+.. code:: python
+
+    num_epochs = 10
+    num_train_batches = 20
+    num_eval_batches = 20
+    num_observer_update_epochs = 4
+    num_batch_norm_update_epochs = 3
+    num_epochs_between_evals = 2
+
+    # QAT takes time and one needs to train over a few epochs.
+    # Train and check accuracy after each epoch
+    for nepoch in range(num_epochs):
+        train_one_epoch(prepared_model, criterion, optimizer, data_loader, "cuda", num_train_batches)
+
+        # Optionally disable observer/batchnorm stats after certain number of epochs
+        if epoch >= num_observer_update_epochs:
+            print("Disabling observer for subseq epochs, epoch = ", epoch)
+            prepared_model.apply(torchao.quantization.pt2e.disable_observer)
+        if epoch >= num_batch_norm_update_epochs:
+            print("Freezing BN for subseq epochs, epoch = ", epoch)
+            for n in prepared_model.graph.nodes:
+                # Args: input, weight, bias, running_mean, running_var, training, momentum, eps
+                # We set the `training` flag to False here to freeze BN stats
+                if n.target in [
+                    torch.ops.aten._native_batch_norm_legit.default,
+                    torch.ops.aten.cudnn_batch_norm.default,
+                ]:
+                    new_args = list(n.args)
+                    new_args[5] = False
+                    n.args = new_args
+            prepared_model.recompile()
+
+        # Check the quantized accuracy every N epochs
+        # Note: If you wish to just evaluate the QAT model (not the quantized model),
+        # then you can just call `torchao.quantization.pt2e.move_exported_model_to_eval/train`.
+        # However, the latter API is not ready yet and will be available in the near future.
+        if (nepoch + 1) % num_epochs_between_evals == 0:
+            prepared_model_copy = copy.deepcopy(prepared_model)
+            quantized_model = convert_pt2e(prepared_model_copy)
+            top1, top5 = evaluate(quantized_model, criterion, data_loader_test, neval_batches=num_eval_batches)
+            print('Epoch %d: Evaluation accuracy on %d images, %2.2f' % (nepoch, num_eval_batches * eval_batch_size, top1.avg))
+
+
+Saving and Loading Model Checkpoints
+----------------------------------------------------------
+
+Model checkpoints for the PyTorch 2 Export QAT flow are
+the same as in any other training flow. They are useful for
+pausing training and resuming it later, recovering from
+failed training runs, and performing inference on different
+machines at a later time. You can save model checkpoints
+during or after training as follows:
+
+.. code:: python
+
+    checkpoint_path = "/path/to/my/checkpoint_%s.pth" % nepoch
+    torch.save(prepared_model.state_dict(), "checkpoint_path")
+
+To load the checkpoints, you must export and prepare the
+model the exact same way it was initially exported and
+prepared. For example:
+
+.. code:: python
+
+    from torch._export import capture_pre_autograd_graph
+    from executorch.backends.xnnpack.quantizer.xnnpack_quantizer import (
+        get_symmetric_quantization_config,
+        XNNPACKQuantizer,
+    )
+    from torchvision.models.resnet import resnet18
+
+    example_inputs = (torch.rand(2, 3, 224, 224),)
+    float_model = resnet18(pretrained=False)
+    exported_model = capture_pre_autograd_graph(float_model, example_inputs)
+    quantizer = XNNPACKQuantizer()
+    quantizer.set_global(get_symmetric_quantization_config(is_qat=True))
+    prepared_model = prepare_qat_pt2e(exported_model, quantizer)
+    prepared_model.load_state_dict(torch.load(checkpoint_path))
+
+    # resume training or perform inference
+
+
+Convert the Trained Model to a Quantized Model
+----------------------------------------------------------
+
+``convert_pt2e`` takes a calibrated model and produces a quantized model.
+Note that, before inference, you must first call
+``torchao.quantization.pt2e.move_exported_model_to_eval()`` to ensure certain ops
+like dropout behave correctly in the eval graph. Otherwise, we would continue
+to incorrectly apply dropout in the forward pass during inference, for example.
+
+.. code-block:: python
+
+    quantized_model = convert_pt2e(prepared_model)
+
+    # move certain ops like dropout to eval mode, equivalent to `m.eval()`
+    torchao.quantization.pt2e.move_exported_model_to_eval(m)
+
+    print(quantized_model)
+
+    top1, top5 = evaluate(quantized_model, criterion, data_loader_test, neval_batches=num_eval_batches)
+    print('Final evaluation accuracy on %d images, %2.2f' % (num_eval_batches * eval_batch_size, top1.avg))
+
+.. TODO: add results here
+
+
+Conclusion
+--------------
+
+In this tutorial, we demonstrated how to run Quantization-Aware Training (QAT)
+flow in PyTorch 2 Export Quantization. After convert, the rest of the flow
+is the same as Post-Training Quantization (PTQ); the user can
+serialize/deserialize the model and further lower it to a backend that supports
+inference with XNNPACK backend. For more detail, follow the
+`PTQ tutorial <https://pytorch.org/tutorials/prototype/pt2e_quant_ptq.html>`_.
diff --git a/docs/source/tutorials_source/pt2e_quant_x86_inductor.rst b/docs/source/tutorials_source/pt2e_quant_x86_inductor.rst
new file mode 100644
index 0000000000..e4faec469f
--- /dev/null
+++ b/docs/source/tutorials_source/pt2e_quant_x86_inductor.rst
@@ -0,0 +1,305 @@
+PyTorch 2 Export Quantization with X86 Backend through Inductor
+==================================================================
+
+**Author**: `Leslie Fang <https://github.com/leslie-fang-intel>`_, `Weiwen Xia <https://github.com/Xia-Weiwen>`_, `Jiong Gong <https://github.com/jgong5>`_, `Jerry Zhang <https://github.com/jerryzh168>`_
+
+Prerequisites
+---------------
+
+- `PyTorch 2 Export Post Training Quantization <https://docs.pytorch.org/ao/stable/tutorial_source/pt2e_quant_ptq.html>`_
+- `PyTorch 2 Export Quantization Aware Training <ttps://docs.pytorch.org/ao/stable/tutorial_source/pt2e_quant_qat.html>`_
+-  `TorchInductor and torch.compile concepts in PyTorch <https://pytorch.org/tutorials/intermediate/torch_compile_tutorial.html>`_
+-  `Inductor C++ Wrapper concepts <https://pytorch.org/tutorials/prototype/inductor_cpp_wrapper_tutorial.html>`_
+
+Introduction
+--------------
+
+This tutorial introduces the steps for utilizing the PyTorch 2 Export Quantization flow to generate a quantized model customized
+for the x86 inductor backend and explains how to lower the quantized model into the inductor.
+
+The pytorch 2 export quantization flow uses the torch.export to capture the model into a graph and perform quantization transformations on top of the ATen graph.
+This approach is expected to have significantly higher model coverage, better programmability, and a simplified UX.
+TorchInductor is the new compiler backend that compiles the FX Graphs generated by TorchDynamo into optimized C++/Triton kernels.
+
+This flow of quantization 2 with Inductor supports both static and dynamic quantization. Static quantization works best for CNN models, like ResNet-50. And dynamic quantization is more suitable for NLP models, like RNN and BERT.
+For the difference between the two quantization types, please refer to the `following page <https://pytorch.org/docs/stable/quantization.html#quantization-mode-support>`__.
+
+The quantization flow mainly includes three steps:
+
+- Step 1: Capture the FX Graph from the eager Model based on the `torch export mechanism <https://pytorch.org/docs/main/export.html>`_.
+- Step 2: Apply the Quantization flow based on the captured FX Graph, including defining the backend-specific quantizer, generating the prepared model with observers,
+  performing the prepared model's calibration or quantization-aware training, and converting the prepared model into the quantized model.
+- Step 3: Lower the quantized model into inductor with the API ``torch.compile``.
+
+The high-level architecture of this flow could look like this:
+
+::
+
+    float_model(Python)                          Example Input
+        \                                              /
+         \                                            /
+    —--------------------------------------------------------
+    |                         export                       |
+    —--------------------------------------------------------
+                                |
+                        FX Graph in ATen
+                                |            X86InductorQuantizer
+                                |                 /
+    —--------------------------------------------------------
+    |                      prepare_pt2e                     |
+    |                           |                           |
+    |                     Calibrate/Train                   |
+    |                           |                           |
+    |                      convert_pt2e                     |
+    —--------------------------------------------------------
+                                |
+                         Quantized Model
+                                |
+    —--------------------------------------------------------
+    |                    Lower into Inductor                |
+    —--------------------------------------------------------
+                                |
+                             Inductor
+
+Combining Quantization in PyTorch 2 Export and TorchInductor, we have flexibility and productivity with the new Quantization frontend
+and outstanding out-of-box performance with the compiler backend. Especially on Intel fourth generation (SPR) Xeon processors which can
+further boost the models' performance by leveraging the
+`advanced-matrix-extensions <https://www.intel.com/content/www/us/en/products/docs/accelerator-engines/advanced-matrix-extensions/overview.html>`_ feature.
+
+Post Training Quantization
+----------------------------
+
+Now, we will walk you through a step-by-step tutorial for how to use it with `torchvision resnet18 model <https://download.pytorch.org/models/resnet18-f37072fd.pth>`_
+for post training quantization.
+
+1. Capture FX Graph
+^^^^^^^^^^^^^^^^^^^^^
+
+We will start by performing the necessary imports, capturing the FX Graph from the eager module.
+
+::
+
+    import torch
+    import torchvision.models as models
+    import copy
+    from torchao.quantization.pt2e.quantize_pt2e import prepare_pt2e, convert_pt2e
+    import torchao.quantization.pt2e.quantizer.x86_inductor_quantizer as xiq
+    from torchao.quantization.pt2e.quantizer.x86_inductor_quantizer import X86InductorQuantizer
+    from torch.export import export
+
+    # Create the Eager Model
+    model_name = "resnet18"
+    model = models.__dict__[model_name](pretrained=True)
+
+    # Set the model to eval mode
+    model = model.eval()
+
+    # Create the data, using the dummy data here as an example
+    traced_bs = 50
+    x = torch.randn(traced_bs, 3, 224, 224).contiguous(memory_format=torch.channels_last)
+    example_inputs = (x,)
+
+    # Capture the FX Graph to be quantized
+    with torch.no_grad():
+        # Note: requires torch >= 2.6
+        exported_model = export(
+            model,
+            example_inputs
+        )
+
+
+Next, we will have the FX Module to be quantized.
+
+2. Apply Quantization
+^^^^^^^^^^^^^^^^^^^^^^^
+
+After we capture the FX Module to be quantized, we will import the Backend Quantizer for X86 CPU and configure how to
+quantize the model.
+
+::
+
+    quantizer = X86InductorQuantizer()
+    quantizer.set_global(xiq.get_default_x86_inductor_quantization_config())
+
+.. note::
+
+   The default quantization configuration in ``X86InductorQuantizer`` uses 8-bits for both activations and weights.
+  When Vector Neural Network Instruction is not available, the oneDNN backend silently chooses kernels that assume
+  `multiplications are 7-bit x 8-bit <https://oneapi-src.github.io/oneDNN/dev_guide_int8_computations.html#inputs-of-mixed-type-u8-and-s8>`_. In other words, potential
+  numeric saturation and accuracy issue may happen when running on CPU without Vector Neural Network Instruction.
+
+The quantization config is for static quantization by default. To apply dynamic quantization, add an argument ``is_dynamic=True`` when getting the config.
+
+.. code-block:: python
+
+    quantizer = X86InductorQuantizer()
+    quantizer.set_global(xiq.get_default_x86_inductor_quantization_config(is_dynamic=True))
+
+
+After we import the backend-specific Quantizer, we will prepare the model for post-training quantization.
+``prepare_pt2e`` folds BatchNorm operators into preceding Conv2d operators, and inserts observers in appropriate places in the model.
+
+::
+
+    prepared_model = prepare_pt2e(exported_model, quantizer)
+
+Now, we will calibrate the ``prepared_model`` after the observers are inserted in the model. This step is needed for static quantization only.
+
+::
+
+    # We use the dummy data as an example here
+    prepared_model(*example_inputs)
+
+    # Alternatively: user can define the dataset to calibrate
+    # def calibrate(model, data_loader):
+    #     model.eval()
+    #     with torch.no_grad():
+    #         for image, target in data_loader:
+    #             model(image)
+    # calibrate(prepared_model, data_loader_test)  # run calibration on sample data
+
+Finally, we will convert the calibrated Model to a quantized Model. ``convert_pt2e`` takes a calibrated model and produces a quantized model.
+
+::
+
+    converted_model = convert_pt2e(prepared_model)
+
+After these steps, we finished running the quantization flow and we will get the quantized model.
+
+
+3. Lower into Inductor
+^^^^^^^^^^^^^^^^^^^^^^^^
+
+After we get the quantized model, we will further lower it to the inductor backend. The default Inductor wrapper
+generates Python code to invoke both generated kernels and external kernels. Additionally, Inductor supports
+C++ wrapper that generates pure C++ code. This allows seamless integration of the generated and external kernels,
+effectively reducing Python overhead. In the future, leveraging the C++ wrapper, we can extend the capability
+to achieve pure C++ deployment. For more comprehensive details about C++ Wrapper in general, please refer to the
+dedicated tutorial on `Inductor C++ Wrapper Tutorial <https://pytorch.org/tutorials/prototype/inductor_cpp_wrapper_tutorial.html>`_.
+
+::
+
+    # Optional: using the C++ wrapper instead of default Python wrapper
+    import torch._inductor.config as config
+    config.cpp_wrapper = True
+
+::
+
+    with torch.no_grad():
+        optimized_model = torch.compile(converted_model)
+
+        # Running some benchmark
+        optimized_model(*example_inputs)
+
+In a more advanced scenario, int8-mixed-bf16 quantization comes into play. In this instance,
+a Convolution or GEMM operator produces BFloat16 output data type instead of Float32 in the absence
+of a subsequent quantization node. Subsequently, the BFloat16 tensor seamlessly propagates through
+subsequent pointwise operators, effectively minimizing memory usage and potentially enhancing performance.
+The utilization of this feature mirrors that of regular BFloat16 Autocast, as simple as wrapping the
+script within the BFloat16 Autocast context.
+
+::
+
+    with torch.autocast(device_type="cpu", dtype=torch.bfloat16, enabled=True), torch.no_grad():
+        # Turn on Autocast to use int8-mixed-bf16 quantization. After lowering into Inductor CPP Backend,
+        # For operators such as QConvolution and QLinear:
+        # * The input data type is consistently defined as int8, attributable to the presence of a pair
+            of quantization and dequantization nodes inserted at the input.
+        # * The computation precision remains at int8.
+        # * The output data type may vary, being either int8 or BFloat16, contingent on the presence
+        #   of a pair of quantization and dequantization nodes at the output.
+        # For non-quantizable pointwise operators, the data type will be inherited from the previous node,
+        # potentially resulting in a data type of BFloat16 in this scenario.
+        # For quantizable pointwise operators such as QMaxpool2D, it continues to operate with the int8
+        # data type for both input and output.
+        optimized_model = torch.compile(converted_model)
+
+        # Running some benchmark
+        optimized_model(*example_inputs)
+
+Put all these codes together, we will have the toy example code.
+Please note that since the Inductor ``freeze`` feature does not turn on by default yet, run your example code with ``TORCHINDUCTOR_FREEZING=1``.
+
+For example:
+
+::
+
+    TORCHINDUCTOR_FREEZING=1 python example_x86inductorquantizer_pytorch_2_1.py
+
+With PyTorch 2.1 release, all CNN models from TorchBench test suite have been measured and proven effective comparing with Inductor FP32 inference path. Please refer
+to `this document <https://dev-discuss.pytorch.org/t/torchinductor-update-6-cpu-backend-performance-update-and-new-features-in-pytorch-2-1/1514#int8-inference-with-post-training-static-quantization-3>`_
+for detail benchmark number.
+
+Quantization Aware Training
+-----------------------------
+
+The PyTorch 2 Export Quantization-Aware Training (QAT) is now supported on X86 CPU using X86InductorQuantizer,
+followed by the subsequent lowering of the quantized model into Inductor.
+For a more in-depth understanding of PT2 Export Quantization-Aware Training,
+we recommend referring to the dedicated `PyTorch 2 Export Quantization-Aware Training <https://pytorch.org/tutorials/prototype/pt2e_quant_qat.html>`_.
+
+The PyTorch 2 Export QAT flow is largely similar to the PTQ flow:
+
+.. code:: python
+
+  import torch
+  from torch._export import capture_pre_autograd_graph
+  from torchao.quantization.pt2e.quantize_pt2e import (
+    prepare_qat_pt2e,
+    convert_pt2e,
+  )
+  from torch.export import export
+  import torchao.quantization.pt2e.quantizer.x86_inductor_quantizer as xiq
+  from torchao.quantization.pt2e.quantizer.x86_inductor_quantizer import X86InductorQuantizer
+
+  class M(torch.nn.Module):
+     def __init__(self):
+        super().__init__()
+        self.linear = torch.nn.Linear(1024, 1000)
+
+     def forward(self, x):
+        return self.linear(x)
+
+  example_inputs = (torch.randn(1, 1024),)
+  m = M()
+
+  # Step 1. program capture
+  # NOTE: this API will be updated to torch.export API in the future, but the captured
+  # result shoud mostly stay the same
+  exported_model = export(m, example_inputs)
+  # we get a model with aten ops
+
+  # Step 2. quantization-aware training
+  # Use Backend Quantizer for X86 CPU
+  # To apply dynamic quantization, add an argument ``is_dynamic=True`` when getting the config.
+  quantizer = X86InductorQuantizer()
+  quantizer.set_global(xiq.get_default_x86_inductor_quantization_config(is_qat=True))
+  prepared_model = prepare_qat_pt2e(exported_model, quantizer)
+
+  # train omitted
+
+  converted_model = convert_pt2e(prepared_model)
+  # we have a model with aten ops doing integer computations when possible
+
+  # move the quantized model to eval mode, equivalent to `m.eval()`
+  torchao.quantization.pt2e.move_exported_model_to_eval(converted_model)
+
+  # Lower the model into Inductor
+  with torch.no_grad():
+    optimized_model = torch.compile(converted_model)
+    _ = optimized_model(*example_inputs)
+
+Please note that the Inductor ``freeze`` feature is not enabled by default.
+To use this feature, you need to run example code with ``TORCHINDUCTOR_FREEZING=1``.
+
+For example:
+
+::
+
+    TORCHINDUCTOR_FREEZING=1 python example_x86inductorquantizer_qat.py
+
+Conclusion
+------------
+
+With this tutorial, we introduce how to use Inductor with X86 CPU in PyTorch 2 Quantization. Users can learn about
+how to use ``X86InductorQuantizer`` to quantize a model and lower it into the inductor with X86 CPU devices.
diff --git a/docs/source/tutorials_source/pt2e_quant_xpu_inductor.rst b/docs/source/tutorials_source/pt2e_quant_xpu_inductor.rst
new file mode 100644
index 0000000000..a0901291e9
--- /dev/null
+++ b/docs/source/tutorials_source/pt2e_quant_xpu_inductor.rst
@@ -0,0 +1,238 @@
+PyTorch 2 Export Quantization with Intel GPU Backend through Inductor
+==================================================================
+
+**Author**: `Yan Zhiwei <https://github.com/ZhiweiYan-96>`_, `Wang Eikan <https://github.com/EikanWang>`_, `Zhang Liangang <https://github.com/liangan1>`_, `Liu River <https://github.com/riverliuintel>`_, `Cui Yifeng <https://github.com/CuiYifeng>`_
+
+Prerequisites
+---------------
+
+- `PyTorch 2 Export Post Training Quantization <https://docs.pytorch.org/ao/stable/tutorial_source/pt2e_quant_ptq.html>`_
+-  `TorchInductor and torch.compile concepts in PyTorch <https://pytorch.org/tutorials/intermediate/torch_compile_tutorial.html>`_
+- PyTorch 2.7 or later
+
+Introduction
+--------------
+
+This tutorial introduces ``XPUInductorQuantizer``, which aims to serve quantized models for inference on Intel GPUs.
+``XPUInductorQuantizer`` uses the PyTorch Export Quantization flow and lowers the quantized model into the inductor.
+
+The Pytorch 2 Export Quantization flow uses `torch.export` to capture the model into a graph and perform quantization transformations on top of the ATen graph.
+This approach is expected to have significantly higher model coverage with better programmability and a simplified user experience.
+TorchInductor  is a compiler backend that transforms FX Graphs generated by ``TorchDynamo`` into optimized C++/Triton kernels.
+
+The quantization flow has three steps:
+
+- Step 1: Capture the FX Graph from the eager model based on the `torch export mechanism <https://pytorch.org/docs/main/export.html>`_.
+- Step 2: Apply the quantization flow based on the captured FX Graph, including defining the backend-specific quantizer, generating the prepared model with observers,
+  performing the prepared model's calibration, and converting the prepared model into the quantized model.
+- Step 3: Lower the quantized model into inductor with the API ``torch.compile``, which would call Triton kernels or oneDNN GEMM/Convolution kernels.
+
+
+The high-level architecture of this flow could look like this:
+
+.. image:: ../_static/img/pt2e_quant_xpu_inductor.png
+    :align: center
+
+Post Training Quantization
+----------------------------
+
+Static quantization is the only method we currently support.
+
+The following dependencies are recommended to be installed through the Intel GPU channel:
+
+::
+
+    pip3 install torch torchvision torchaudio pytorch-triton-xpu --index-url https://download.pytorch.org/whl/xpu
+
+
+Please note that since the inductor ``freeze`` feature does not turn on by default yet, you must run your example code with ``TORCHINDUCTOR_FREEZING=1``.
+
+For example:
+
+::
+
+    TORCHINDUCTOR_FREEZING=1 python xpu_inductor_quantizer_example.py
+
+
+1. Capture FX Graph
+^^^^^^^^^^^^^^^^^^^^^
+
+We will start by performing the necessary imports, capturing the FX Graph from the eager module.
+
+::
+
+    import torch
+    import torchvision.models as models
+    from torchao.quantization.pt2e.quantize_pt2e import prepare_pt2e, convert_pt2e
+    import torchao.quantization.pt2e.quantizer.xpu_inductor_quantizer as xpuiq
+    from torchao.quantization.pt2e.quantizer.xpu_inductor_quantizer import XPUInductorQuantizer
+    from torch.export import export
+
+    # Create the Eager Model
+    model_name = "resnet18"
+    model = models.__dict__[model_name](weights=models.ResNet18_Weights.DEFAULT)
+
+    # Set the model to eval mode
+    model = model.eval().to("xpu")
+
+    # Create the data, using the dummy data here as an example
+    traced_bs = 50
+    x = torch.randn(traced_bs, 3, 224, 224, device="xpu").contiguous(memory_format=torch.channels_last)
+    example_inputs = (x,)
+
+    # Capture the FX Graph to be quantized
+    with torch.no_grad():
+        exported_model = export(
+            model,
+            example_inputs,
+        ).module()
+
+
+Next, we will quantize the FX Module.
+
+2. Apply Quantization
+^^^^^^^^^^^^^^^^^^^^^^^
+
+After we capture the FX Module, we will import the Backend Quantizer for Intel GPU and configure it to
+quantize the model.
+
+::
+
+    quantizer = XPUInductorQuantizer()
+    quantizer.set_global(xpuiq.get_default_xpu_inductor_quantization_config())
+
+The default quantization configuration in ``XPUInductorQuantizer`` uses signed 8-bits for both activations and weights. The tensors are per-tensor quantized, whereas the weights are signed 8-bit per-channel quantized.
+
+Optionally, in addition to the default quantization configuration using asymmetric quantized activation, signed 8-bits symmetric quantized activation is also supported, which has the potential to provide better performance.
+
+::
+
+    from torchao.quantization.pt2e.observer import HistogramObserver, PerChannelMinMaxObserver
+    from torchao.quantization.pt2e.quantizer.quantizer import QuantizationSpec
+    from torchao.quantization.pt2e.quantizer import QuantizationConfig
+    from typing import Any, Optional, TYPE_CHECKING
+    if TYPE_CHECKING:
+        from torchao.quantization.pt2e import ObserverOrFakeQuantizeConstructor
+    def get_xpu_inductor_symm_quantization_config():
+        extra_args: dict[str, Any] = {"eps": 2**-12}
+        act_observer_or_fake_quant_ctr = HistogramObserver
+        act_quantization_spec = QuantizationSpec(
+            dtype=torch.int8,
+            quant_min=-128,
+            quant_max=127,
+            qscheme=torch.per_tensor_symmetric,  # Change the activation quant config to symmetric
+            is_dynamic=False,
+            observer_or_fake_quant_ctr=act_observer_or_fake_quant_ctr.with_args(
+                **extra_args
+            ),
+        )
+
+        weight_observer_or_fake_quant_ctr: ObserverOrFakeQuantizeConstructor = (
+            PerChannelMinMaxObserver
+        )
+
+        weight_quantization_spec = QuantizationSpec(
+            dtype=torch.int8,
+            quant_min=-128,
+            quant_max=127,
+            qscheme=torch.per_channel_symmetric, # Same as the default config, the only supported option for weight
+            ch_axis=0,  # 0 corresponding to weight shape = (oc, ic, kh, kw) of conv
+            is_dynamic=False,
+            observer_or_fake_quant_ctr=weight_observer_or_fake_quant_ctr.with_args(
+                **extra_args
+            ),
+        )
+
+        bias_quantization_spec = None  # will use placeholder observer by default
+        quantization_config = QuantizationConfig(
+            act_quantization_spec,
+            act_quantization_spec,
+            weight_quantization_spec,
+            bias_quantization_spec,
+            False,
+        )
+        return quantization_config
+
+    # Then, set the quantization configuration to the quantizer.
+    quantizer = XPUInductorQuantizer()
+    quantizer.set_global(get_xpu_inductor_symm_quantization_config())
+
+After the backend-specific quantizer is imported, prepare the model for post-training quantization.
+``prepare_pt2e`` folds ``BatchNorm`` operators into preceding Conv2d operators, and inserts observers into appropriate places in the model.
+
+::
+
+    prepared_model = prepare_pt2e(exported_model, quantizer)
+
+**(For static quantization only)** Calibrate the ``prepared_model`` after the observers are inserted into the model.
+
+::
+
+    # We use the dummy data as an example here
+    prepared_model(*example_inputs)
+
+    # Alternatively: user can define the dataset to calibrate
+    # def calibrate(model, data_loader):
+    #     model.eval()
+    #     with torch.no_grad():
+    #         for image, target in data_loader:
+    #             model(image)
+    # calibrate(prepared_model, data_loader_test)  # run calibration on sample data
+
+Finally, convert the calibrated model to a quantized model. ``convert_pt2e`` takes a calibrated model and produces a quantized model.
+
+::
+
+    converted_model = convert_pt2e(prepared_model)
+
+After these steps, the quantization flow has been completed and the quantized model is available.
+
+
+3. Lower into Inductor
+^^^^^^^^^^^^^^^^^^^^^^^^
+
+The quantized model will then be lowered into the inductor backend.
+
+::
+
+    with torch.no_grad():
+        optimized_model = torch.compile(converted_model)
+
+        # Running some benchmark
+        optimized_model(*example_inputs)
+
+In a more advanced scenario, int8-mixed-bf16 quantization comes into play. In this instance,
+a convolution or GEMM operator produces the output in BFloat16 instead of Float32 in the absence
+of a subsequent quantization node. Subsequently, the BFloat16 tensor seamlessly propagates through
+subsequent pointwise operators, effectively minimizing memory usage and potentially enhancing performance.
+The utilization of this feature mirrors that of regular BFloat16 Autocast, as simple as wrapping the
+script within the BFloat16 Autocast context.
+
+::
+
+    with torch.amp.autocast(device_type="xpu", dtype=torch.bfloat16), torch.no_grad():
+            # Turn on Autocast to use int8-mixed-bf16 quantization. After lowering into indcutor backend,
+            # For operators such as QConvolution and QLinear:
+            # * The input data type is consistently defined as int8, attributable to the presence of a pair
+            #    of quantization and dequantization nodes inserted at the input.
+            # * The computation precision remains at int8.
+            # * The output data type may vary, being either int8 or BFloat16, contingent on the presence
+            #   of a pair of quantization and dequantization nodes at the output.
+            # For non-quantizable pointwise operators, the data type will be inherited from the previous node,
+            # potentially resulting in a data type of BFloat16 in this scenario.
+            # For quantizable pointwise operators such as QMaxpool2D, it continues to operate with the int8
+            # data type for both input and output.
+            optimized_model = torch.compile(converted_model)
+
+            # Running some benchmark
+            optimized_model(*example_inputs)
+
+
+Conclusion
+------------
+
+In this tutorial, we have learned how to utilize the ``XPUInductorQuantizer`` to perform post-training quantization on models for inference
+on Intel GPUs, leveraging PyTorch 2's Export Quantization flow. We covered the step-by-step process of capturing an FX Graph,
+applying quantization, and lowering the quantized model into the inductor backend using ``torch.compile``. Additionally, we explored
+the benefits of using int8-mixed-bf16 quantization for improved memory efficiency and potential performance gains,
+especially when using ``BFloat16`` autocast.
diff --git a/docs/source/tutorials_source/pt2e_quantizer.rst b/docs/source/tutorials_source/pt2e_quantizer.rst
new file mode 100644
index 0000000000..e669c5b986
--- /dev/null
+++ b/docs/source/tutorials_source/pt2e_quantizer.rst
@@ -0,0 +1,381 @@
+How to Write a ``Quantizer`` for PyTorch 2 Export Quantization
+================================================================
+
+**Author**: `Leslie Fang <https://github.com/leslie-fang-intel>`_, `Weiwen Xia <https://github.com/Xia-Weiwen>`__, `Jiong Gong <https://github.com/jgong5>`__, `Kimish Patel <https://github.com/kimishpatel>`__, `Jerry Zhang <https://github.com/jerryzh168>`__
+
+Prerequisites:
+^^^^^^^^^^^^^^^^
+
+Required:
+
+-  `Torchdynamo concepts in PyTorch <https://pytorch.org/docs/stable/torch.compiler_dynamo_overview.html>`__
+
+-  `Quantization concepts in PyTorch <https://pytorch.org/docs/master/quantization.html#quantization-api-summary>`__
+
+-  `(prototype) PyTorch 2 Export Post Training Quantization <https://pytorch.org/tutorials/prototype/pt2e_quant_ptq.html>`__
+
+Optional:
+
+-  `FX Graph Mode post training static quantization <https://pytorch.org/tutorials/prototype/fx_graph_mode_ptq_static.html>`__
+
+-  `BackendConfig in PyTorch Quantization FX Graph Mode <https://pytorch.org/tutorials/prototype/backend_config_tutorial.html?highlight=backend>`__
+
+-  `QConfig and QConfigMapping in PyTorch Quantization FX Graph Mode <https://pytorch.org/tutorials/prototype/backend_config_tutorial.html#set-up-qconfigmapping-that-satisfies-the-backend-constraints>`__
+
+Introduction
+^^^^^^^^^^^^^
+
+`(prototype) PyTorch 2 Export Post Training Quantization <https://pytorch.org/tutorials/prototype/pt2e_quant_ptq.html>`__ introduced the overall API for pytorch 2 export quantization, main difference from fx graph mode quantization in terms of API is that we made it explicit that quantiation is targeting a specific backend. So to use the new flow, backend need to implement a ``Quantizer`` class that encodes:
+(1). What is supported quantized operator or patterns in the backend
+(2). How can users express the way they want their floating point model to be quantized, for example, quantized the whole model to be int8 symmetric quantization, or quantize only linear layers etc.
+
+Please see `here <https://pytorch.org/tutorials/prototype/pt2e_quant_ptq.html#motivation-of-pytorch-2-export-quantization>`__ For motivations for the new API and ``Quantizer``.
+
+An existing quantizer object defined for ``XNNPACK`` is in
+`QNNPackQuantizer <https://github.com/pytorch/pytorch/blob/main/torch/ao/quantization/pt2e/quantizer/xnnpack_quantizer.py>`__
+
+Annotation API
+^^^^^^^^^^^^^^^^^^^
+
+``Quantizer`` uses annotation API to convey quantization intent for different operators/patterns.
+Annotation API mainly consists of
+`QuantizationSpec <https://github.com/pytorch/pytorch/blob/1ca2e993af6fa6934fca35da6970308ce227ddc7/torch/ao/quantization/_pt2e/quantizer/quantizer.py#L38>`__
+and
+`QuantizationAnnotation <https://github.com/pytorch/pytorch/blob/07104ca99c9d297975270fb58fda786e60b49b38/torch/ao/quantization/_pt2e/quantizer/quantizer.py#L144>`__.
+
+``QuantizationSpec`` is used to convey intent of how a tensor will be quantized,
+e.g. dtype, bitwidth, min, max values, symmetric vs. asymmetric etc.
+Furthermore, ``QuantizationSpec`` also allows quantizer to specify how a
+tensor value should be observed, e.g. ``MinMaxObserver``, or ``HistogramObserver``
+, or some customized observer.
+
+``QuantizationAnnotation`` composed of ``QuantizationSpec`` objects is used to annotate input tensors
+and output tensor of a pattern. Annotating input tensors is equivalent of annotating input edges,
+while annotating output tensor is equivalent of annotating node. ``QuantizationAnnotation`` is a ``dataclass``
+with several fields:
+
+-  ``input_qspec_map`` field is of class ``Dict`` to map each input tensor (as input edge) to a ``QuantizationSpec``.
+-  ``output_qspec`` field expresses the ``QuantizationSpec`` used to annotate the output tensor;
+-  ``_annotated`` field indicates if this node has already been annotated by quantizer.
+
+To conclude, annotation API requires quantizer to annotate edges (input tensors) or
+nodes (output tensor) of the graph. Now, we will have a step-by-step tutorial for
+how to use the annotation API with different types of ``QuantizationSpec``.
+
+1. Annotate Common Operator Patterns
+--------------------------------------------------------
+
+In order to use the quantized pattern/operators, e.g. ``quantized add``,
+backend developers will have intent to quantize (as expressed by ``QuantizationSpec``)
+inputs, output of the pattern. Following is an example flow (take ``add`` operator as example)
+of how this intent is conveyed in the quantization workflow with annotation API.
+
+-  Step 1: Identify the original floating point pattern in the FX graph. There are
+   several ways to identify this pattern: Quantizer may use a pattern matcher
+   to match the operator pattern; Quantizer may go through the nodes from start to the end and compare
+   the node's target type to match the operator pattern. In this example, we can use the
+   `get_source_partitions <https://github.com/pytorch/pytorch/blob/07104ca99c9d297975270fb58fda786e60b49b38/torch/fx/passes/utils/source_matcher_utils.py#L51>`__
+   to match this pattern. The original floating point ``add`` pattern only contain a single ``add`` node.
+
+::
+
+    add_partitions = get_source_partitions(gm.graph, [operator.add, torch.add])
+    add_partitions = list(itertools.chain(*add_partitions.values()))
+    for add_partition in add_partitions:
+        add_node = add_partition.output_nodes[0]
+
+-  Step 2: Define the ``QuantizationSpec`` for inputs and output of the pattern. ``QuantizationSpec``
+   defines the ``data type``, ``qscheme``, and other quantization parameters about users' intent of
+   how to observe or fake quantize a tensor.
+
+::
+
+    act_quantization_spec = QuantizationSpec(
+        dtype=torch.int8,
+        quant_min=-128,
+        quant_max=127,
+        qscheme=torch.per_tensor_affine,
+        is_dynamic=False,
+        observer_or_fake_quant_ctr=HistogramObserver.with_args(eps=2**-12),
+    )
+
+    input_act_qspec = act_quantization_spec
+    output_act_qspec = act_quantization_spec
+
+-  Step 3: Annotate the inputs and output of the pattern with ``QuantizationAnnotation``.
+   In this example, we will create the ``QuantizationAnnotation`` object with the ``QuantizationSpec``
+   created in above step 2 for two inputs and one output of the ``add`` node.
+
+::
+
+    input_qspec_map = {}
+    input_act0 = add_node.args[0]
+    input_qspec_map[input_act0] = input_act_qspec
+
+    input_act1 = add_node.args[1]
+    input_qspec_map[input_act1] = input_act_qspec
+
+    add_node.meta["quantization_annotation"] = QuantizationAnnotation(
+        input_qspec_map=input_qspec_map,
+        output_qspec=output_act_qspec,
+        _annotated=True,
+    )
+
+After we annotate the ``add`` node like this, in the following up quantization flow, ``HistogramObserver`` will
+be inserted at its two input nodes and one output node in prepare phase. And ``HistogramObserver`` will be substituted with
+``quantize`` node and ``dequantize`` node in the convert phase.
+
+2. Annotate Operators that Shares Quantization Params
+--------------------------------------------------------
+
+It is natural that users want to annotate a quantized model where quantization
+parameters can be shared among some tensors explicitly. Two typical use cases are:
+
+-  Example 1: One example is for ``add`` where having both inputs sharing quantization
+   parameters makes operator implementation much easier. Without using of
+   `SharedQuantizationSpec <https://github.com/pytorch/pytorch/blob/1ca2e993af6fa6934fca35da6970308ce227ddc7/torch/ao/quantization/_pt2e/quantizer/quantizer.py#L90>`__,
+   we must annotate ``add`` as example in above section 1, in which two inputs of ``add``
+   has different quantization parameters.
+-  Example 2: Another example is that of sharing quantization parameters between inputs and output.
+   This typically results from operators such as ``maxpool``, ``average_pool``, ``concat`` etc.
+
+``SharedQuantizationSpec`` is designed for this use case to annotate tensors whose quantization
+parameters are shared with other tensors. Input of ``SharedQuantizationSpec`` is an ``EdgeOrNode`` object which
+can be an input edge or an output value.
+
+.. note::
+
+   * Sharing is transitive
+
+     Some tensors might be effectively using shared quantization spec due to:
+
+     * Two nodes/edges are configured to use ``SharedQuantizationSpec``.
+     * There is existing sharing of some nodes.
+
+     For example, let's say we have two ``conv`` nodes ``conv1`` and ``conv2``, and both of them are fed into a ``cat``
+     node: ``cat([conv1_out, conv2_out], ...)``. Let's say the output of ``conv1``, ``conv2``, and the first input of ``cat`` are configured
+     with the same configurations of ``QuantizationSpec``. The second input of ``cat`` is configured to use ``SharedQuantizationSpec``
+     with the first input.
+
+     .. code-block::
+
+       conv1_out: qspec1(dtype=torch.int8, ...)
+       conv2_out: qspec1(dtype=torch.int8, ...)
+       cat_input0: qspec1(dtype=torch.int8, ...)
+       cat_input1: SharedQuantizationSpec((conv1, cat))  # conv1 node is the first input of cat
+
+     First of all, the output of ``conv1`` is implicitly sharing quantization parameters (and observer object)
+     with the first input of ``cat``, and the same is true for the output of ``conv2`` and the second input of ``cat``.
+     Therefore, since the user configures the two inputs of ``cat`` to share quantization parameters, by transitivity,
+     ``conv2_out`` and ``conv1_out`` will also be sharing quantization parameters. In the observed graph, you
+     will see the following:
+
+     .. code-block::
+
+         conv1 -> obs -> cat
+         conv2 -> obs   /
+
+     and both ``obs`` will be the same observer instance.
+
+
+-  Input edge is the connection between input node and the node consuming the input,
+   so it's a ``Tuple[Node, Node]``.
+-  Output value is an FX ``Node``.
+
+Now, if we want to rewrite ``add`` annotation example with ``SharedQuantizationSpec`` to indicate
+two input tensors as sharing quantization parameters. We can define its ``QuantizationAnnotation``
+as this:
+
+-  Step 1: Identify the original floating point pattern in the FX graph. We can use the same
+   methods introduced in ``QuantizationSpec`` example to identify the ``add`` pattern.
+-  Step 2: Annotate input_act0 of ``add`` with ``QuantizationSpec``.
+-  Step 3: Create a ``SharedQuantizationSpec`` object with input edge defined as ``(input_act0, add_node)`` which means to
+   share the observer used for this edge. Then, user can annotate input_act1 with this ``SharedQuantizationSpec``
+   object.
+
+::
+
+    input_qspec_map = {}
+    share_qparams_with_input_act0_qspec = SharedQuantizationSpec((input_act0, add_node))
+    input_qspec_map = {input_act0: act_quantization_spec, input_act1: share_qparams_with_input_act0_qspec}
+
+    add_node.meta["quantization_annotation"] = QuantizationAnnotation(
+        input_qspec_map=input_qspec_map,
+        output_qspec=act_quantization_spec,
+        _annotated=True,
+    )
+
+3. Annotate Operators with Fixed Quantization Parameters
+---------------------------------------------------------
+
+Another typical use case to annotate a quantized model is for tensors whose
+quantization parameters are known beforehand. For example, operator like ``sigmoid``, which has
+predefined and fixed scale/zero_point at input and output tensors.
+`FixedQParamsQuantizationSpec <https://github.com/pytorch/pytorch/blob/1ca2e993af6fa6934fca35da6970308ce227ddc7/torch/ao/quantization/_pt2e/quantizer/quantizer.py#L90>`__
+is designed for this use case. To use ``FixedQParamsQuantizationSpec``, users need to pass in parameters
+of ``scale`` and ``zero_point`` explicitly.
+
+-  Step 1: Identify the original floating point pattern in the FX graph. We can use the same
+   methods introduced in ``QuantizationSpec`` example to identify the ``sigmoid`` pattern.
+-  Step 2: Create ``FixedQParamsQuantizationSpec`` object with inputs of fixed ``scale``, ``zero_point`` value.
+   These values will be used to create the ``quantize`` node and ``dequantize`` node in the convert phase.
+-  Step 3: Annotate inputs and output to use this ``FixedQParamsQuantizationSpec`` object.
+
+::
+
+    act_qspec = FixedQParamsQuantizationSpec(
+        dtype=torch.uint8,
+        quant_min=0,
+        quant_max=255,
+        qscheme=torch.per_tensor_affine,
+        scale=1.0 / 256.0,
+        zero_point=0,
+    )
+    sigmoid_node.meta["quantization_annotation"] = QuantizationAnnotation(
+        input_qspec_map={input_act: act_qspec},
+        output_qspec=act_qspec,
+        _annotated=True,
+    )
+
+4. Annotate Tensors with Derived Quantization Parameters
+---------------------------------------------------------------
+
+Another use case is to define the constraint for tensors whose quantization parameters are derived from other tensors.
+For example, if we want to annotate a convolution node, and define the ``scale`` of its bias input tensor
+as product of the activation tensor's ``scale`` and weight tensor's ``scale``. We can use
+`DerivedQuantizationSpec <https://github.com/pytorch/pytorch/blob/1ca2e993af6fa6934fca35da6970308ce227ddc7/torch/ao/quantization/_pt2e/quantizer/quantizer.py#L102>`__
+to annotate this conv node.
+
+-  Step 1: Identify the original floating point pattern in the FX graph. We can use the same
+   methods introduced in ``QuantizationSpec`` example to identify the ``convolution`` pattern.
+-  Step 2: Define ``derive_qparams_fn`` function, it accepts list of ``ObserverOrFakeQuantize`` (
+   `ObserverBase <https://github.com/pytorch/pytorch/blob/07104ca99c9d297975270fb58fda786e60b49b38/torch/ao/quantization/observer.py#L124>`__
+   or `FakeQuantizeBase <https://github.com/pytorch/pytorch/blob/07104ca99c9d297975270fb58fda786e60b49b38/torch/ao/quantization/fake_quantize.py#L60>`__)
+   as input. From each ``ObserverOrFakeQuantize`` object, user can get the ``scale``, ``zero point`` value.
+   User can define its heuristic about how to derive new ``scale``, ``zero point`` value based on the
+   quantization parameters calculated from the observer or fake quant instances.
+-  Step 3: Define ``DerivedQuantizationSpec`` obejct, it accepts inputs of: list of ``EdgeOrNode`` objects.
+   The observer corresponding to each ``EdgeOrNode`` object will be passed into the ``derive_qparams_fn`` function;
+   ``derive_qparams_fn`` function; several other quantization parameters such as ``dtype``, ``qscheme``.
+-  Step 4: Annotate the inputs and output of this conv node with ``QuantizationAnnotation``.
+
+::
+
+    def derive_qparams_fn(obs_or_fqs: List[ObserverOrFakeQuantize]) -> Tuple[Tensor, Tensor]:
+        assert len(obs_or_fqs) == 2, \
+            "Expecting two obs/fqs, one for activation and one for weight, got: {}".format(len(obs_or_fq))
+        act_obs_or_fq = obs_or_fqs[0]
+        weight_obs_or_fq = obs_or_fqs[1]
+        act_scale, act_zp = act_obs_or_fq.calculate_qparams()
+        weight_scale, weight_zp = weight_obs_or_fq.calculate_qparams()
+        return torch.tensor([act_scale * weight_scale]).to(torch.float32), torch.tensor([0]).to(torch.int32)
+
+    bias_qspec = DerivedQuantizationSpec(
+        derived_from=[(input_act, node), (weight, node)],
+        derive_qparams_fn=derive_qparams_fn,
+        dtype=torch.int32,
+        quant_min=-2**31,
+        quant_max=2**31 - 1,
+        qscheme=torch.per_tensor_symmetric,
+    )
+    input_qspec_map = {input_act: act_quantization_spec, weight: weight_quantization_spec, bias: bias_qspec}
+    node.meta["quantization_annotation"] = QuantizationAnnotation(
+        input_qspec_map=input_qspec_map,
+        output_qspec=act_quantization_spec,
+        _annotated=True,
+    )
+
+5. A Toy Example with Resnet18
+--------------------------------------------------------
+
+After above annotation methods defined with ``QuantizationAnnotation API``, we can now put them together to construct a ``BackendQuantizer``
+and run a `toy example <https://gist.github.com/leslie-fang-intel/b78ed682aa9b54d2608285c5a4897cfc>`__
+with ``Torchvision Resnet18``. To better understand the final example, here are the classes and utility
+functions that are used in the example:
+
+-  `QuantizationConfig <https://github.com/pytorch/pytorch/blob/73fd7235ad25ff061c087fa4bafc6e8df4d9c299/torch/ao/quantization/_pt2e/quantizer/quantizer.py#L103-L109>`__
+   consists of ``QuantizationSpec`` for activation, weight, and bias separately.
+-  When annotating the model,
+   `get_input_act_qspec <https://github.com/pytorch/pytorch/blob/47cfcf566ab76573452787335f10c9ca185752dc/torch/ao/quantization/_pt2e/quantizer/utils.py#L10>`__,
+   `get_output_act_qspec <https://github.com/pytorch/pytorch/blob/47cfcf566ab76573452787335f10c9ca185752dc/torch/ao/quantization/_pt2e/quantizer/utils.py#L23>`__,
+   `get_weight_qspec <https://github.com/pytorch/pytorch/blob/47cfcf566ab76573452787335f10c9ca185752dc/torch/ao/quantization/_pt2e/quantizer/utils.py#L36>`__, and
+   `get_bias_qspec <https://github.com/pytorch/pytorch/blob/47cfcf566ab76573452787335f10c9ca185752dc/torch/ao/quantization/_pt2e/quantizer/utils.py#L53>`__
+   can be used to get the ``QuantizationSpec`` from ``QuantizationConfig`` for a specific pattern.
+
+A Note on IR for PT2E Quantization Flow
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+IR means the intermediate representation of the model, for example, ``torch`` IR (``torch.nn`` modules, ``torch.nn.functional`` ops) or ``aten`` IR (``torch.ops.aten.linear``, ...). PT2E Quantization Flow is using pre autograd aten IR (the output of `torch.export` API) so that we support training. As is shown before, we need to match the operator or operator patterns before we can attach annotations on them, So the question is how do we match the pattern?
+
+Motivation: Problem of Matching ``aten`` IR directly
+--------------------------------------------------------
+
+The most straightforward way might be matching ``aten`` IR directly.
+
+Example::
+
+  for n in gm.graph.nodes:
+        if n.op != "call_function" or n.target not in [
+            torch.ops.aten.relu.default,
+            torch.ops.aten.relu_.default,
+        ]:
+            continue
+        relu_node = n
+        maybe_conv_node = n.args[0]
+        if (
+            not isinstance(maybe_conv_node, Node)
+            or maybe_conv_node.op != "call_function"
+            or maybe_conv_node.target
+            not in [
+                torch.ops.aten.conv1d.default,
+                torch.ops.aten.conv2d.default,
+            ]
+        ):
+            continue
+
+        # annotate conv and relu nodes
+        ...
+
+However one problem for using this IR is that the representation might change if the PyTorch implementation for modules or functional ops changed. But this could be unexpected since modeling users typically assume that when the eager mode model code doesn't change, they should get the same model representation after program capture as well. One concrete effect for this problem is that if a ``Quantizer`` do annotations based on recognizing ``aten`` IR patterns, then it may fail to recognzing the pattern after PyTorch version update, and the same eager mode floating point may be left unquantized.
+
+Recommendation: Use ``SubgraphMatcherWithNameNodeMap`` for pattern matching
+-----------------------------------------------------------------------------
+Because of this, we recommend people to recognize the pattern through ``SubgraphMatcherWithNameNodeMap`` (an improved version of ``SubgraphMatcher`` that makes it easier to query the nodes that people want to annotate), through capturing a ``torch`` IR pattern (with the same program capture used for capturing the floating point model), instead of using the ``aten`` IR pattern directly.
+
+Example::
+
+  def conv_relu_pattern(input, weight, bias):
+      conv = torch.nn.functional.conv2d(input, weight, bias)
+      output = torch.nn.functional.relu(conv)
+      # returns an additional dict that includes a map from name to node that we want to annotate
+      return relu, {"input": input, "weight": weight, "bias": bias, "output": output}
+
+  matcher = SubgraphMatcherWithNameNodeMap(conv_relu_pattern)
+  matches = matcher.match(model)
+  for match in matches:
+      # find input and output of the pattern
+      # annotate the nodes
+      name_node_map = match.name_node_map
+      input_node = name_node_map["input"]
+      weight_node = name_node_map["weight"]
+      bias_node = name_node_map["bias"]
+      output_node = name_node_map["relu"]
+      input_node.users[0].meta["quantization_annotation"] = ...
+      weight_node.users[0].meta["quantization_annotation"] = ...
+      bias_node.users[0].meta["quantization_annotation"] = ...
+      output_node.meta["quantization_annotation"] = ...
+
+With this, the ``Quantizer`` will still be valid even when the implementation for nn modules and functionals changes, the ``aten`` IR for floating point model will change, but since we capture the pattern again instead of hardcoding the ``aten`` IR for the pattern, we'll get the updated ``aten`` IR as well and will still be able to match the pattern.
+
+One caveat is that if inputs of the pattern has multiple users, we don't have a good way to identify which user node we want to annotate except for checking the aten op target.
+
+Another caveat is that we need to make sure we have an exhaustive list of examples (e.g. 2D, 3D, 4D inputs, real v.s. symbolic inputs, training=True v.s. training=False etc.) for the pattern to make sure cover different possible ``aten`` IR outcomes captured from the ``torch`` IR pattern.
+
+Note: We may provide some (pattern, list of example_inputs) or some pre-generated matcher object so people can just use them directly in the future.
+
+Conclusion
+^^^^^^^^^^^^^^^^^^^
+
+With this tutorial, we introduce the new quantization path in PyTorch 2. Users can learn about
+how to define a ``BackendQuantizer`` with the ``QuantizationAnnotation API`` and integrate it into the PyTorch 2 Export Quantization flow.
+Examples of ``QuantizationSpec``, ``SharedQuantizationSpec``, ``FixedQParamsQuantizationSpec``, and ``DerivedQuantizationSpec``
+are given for specific annotation use case. You can use `XNNPACKQuantizer <https://github.com/pytorch/pytorch/blob/main/torch/ao/quantization/quantizer/xnnpack_quantizer.py>`_ as an example to start implementing your own ``Quantizer``. After that please follow `this tutorial <https://pytorch.org/tutorials/prototype/pt2e_quant_ptq.html>`_ to actually quantize your model.
diff --git a/torchao/quantization/pt2e/quantizer/x86_inductor_quantizer.py b/torchao/quantization/pt2e/quantizer/x86_inductor_quantizer.py
index cc296ebe33..84a66447c1 100644
--- a/torchao/quantization/pt2e/quantizer/x86_inductor_quantizer.py
+++ b/torchao/quantization/pt2e/quantizer/x86_inductor_quantizer.py
@@ -49,7 +49,7 @@
 
 
 if TYPE_CHECKING:
-    from torchao.quantization.pt2e import _ObserverOrFakeQuantizeConstructor
+    from torchao.quantization.pt2e import ObserverOrFakeQuantizeConstructor
 
 __all__ = [
     "X86InductorQuantizer",
@@ -314,7 +314,7 @@ def get_default_x86_inductor_quantization_config(
         ),
     )
 
-    weight_observer_or_fake_quant_ctr: _ObserverOrFakeQuantizeConstructor = (
+    weight_observer_or_fake_quant_ctr: ObserverOrFakeQuantizeConstructor = (
         FusedMovingAvgObsFakeQuantize if is_qat else PerChannelMinMaxObserver
     )
 

From e29b9bd0015f9c0b62c3982b32a485028c4da548 Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Tue, 17 Jun 2025 15:18:27 -0700
Subject: [PATCH 131/165] Update index.rst (#2395)

---
 docs/source/index.rst | 1 -
 1 file changed, 1 deletion(-)

diff --git a/docs/source/index.rst b/docs/source/index.rst
index c0fd2e7bf5..d4d8580863 100644
--- a/docs/source/index.rst
+++ b/docs/source/index.rst
@@ -12,7 +12,6 @@ for an overall introduction to the library and recent highlight and updates.
    :caption: Getting Started
 
    quick_start
-   pt2e_quant
 
 .. toctree::
    :glob:

From 804fa1ed765db8d6852bed0c59f45a58faf010be Mon Sep 17 00:00:00 2001
From: cccclai <chenlai@meta.com>
Date: Tue, 17 Jun 2025 17:48:42 -0700
Subject: [PATCH 132/165] Add inplace quantizer examples

Differential Revision: D76312488

Pull Request resolved: https://github.com/pytorch/ao/pull/2345
---
 test/quantization/pt2e/test_quantize_pt2e.py | 91 ++++++++++++++++++++
 torchao/quantization/pt2e/constant_fold.py   | 25 ++++++
 2 files changed, 116 insertions(+)

diff --git a/test/quantization/pt2e/test_quantize_pt2e.py b/test/quantization/pt2e/test_quantize_pt2e.py
index 730969ba9c..be5a4dc537 100644
--- a/test/quantization/pt2e/test_quantize_pt2e.py
+++ b/test/quantization/pt2e/test_quantize_pt2e.py
@@ -2826,6 +2826,97 @@ def check_nn_module(node):
             if node.name == "mul":
                 check_nn_module(node)
 
+    def test_quantize_in_place_ops(self):
+        class TestQuantizer(Quantizer):
+            example_inputs = None
+
+            def set_example_inputs(self, example_inputs):
+                self.example_inputs = example_inputs
+
+            def transform_for_annotation(
+                self, model: torch.fx.GraphModule
+            ) -> torch.fx.GraphModule:
+                # Make a copy of the graph to ensure that we are using the
+                # return value of this function.
+                ep = torch.export.export(model, self.example_inputs)
+                ep = ep.run_decompositions({})
+                return ep.module()
+
+            def annotate(self, model: torch.fx.GraphModule) -> torch.fx.GraphModule:
+                act_qspec = QuantizationSpec(
+                    dtype=torch.uint8,
+                    quant_min=0,
+                    quant_max=255,
+                    qscheme=torch.per_tensor_affine,
+                    is_dynamic=False,
+                    observer_or_fake_quant_ctr=observer.default_observer,
+                )
+                for node in model.graph.nodes:
+                    if (
+                        node.op == "call_function"
+                        and node.target == torch.ops.aten.add.Tensor
+                    ):
+                        input_act0 = node.args[0]
+                        assert isinstance(input_act0, torch.fx.Node)
+                        input_act1 = node.args[1]
+                        assert isinstance(input_act1, torch.fx.Node)
+                        print("input_act1 is a node")
+                        node.meta["quantization_annotation"] = QuantizationAnnotation(
+                            input_qspec_map={
+                                input_act0: act_qspec,
+                                input_act1: act_qspec,
+                            },
+                            output_qspec=act_qspec,
+                            _annotated=True,
+                        )
+
+            def validate(self, model: torch.fx.GraphModule) -> None:
+                pass
+
+        class M(torch.nn.Module):
+            def __init__(self):
+                super().__init__()
+                self.register_buffer("buf", torch.randn(1, 2, 3, 3))
+
+            def forward(self, x):
+                self.buf.add_(x)
+                return self.buf
+
+        def has_inplace_ops(graph_module: torch.fx.GraphModule) -> bool:
+            return (
+                len(
+                    [
+                        n
+                        for n in graph_module.graph.nodes
+                        if n.op == "call_function"
+                        and n.name.endswith("_")
+                        and n.name != "copy_"
+                    ]
+                )
+                > 0
+            )
+
+        m = M().eval()
+        quantizer = TestQuantizer()
+        example_inputs = (torch.randn(1, 2, 3, 3),)
+        quantizer.set_example_inputs(example_inputs)
+        m = export_for_training(m, example_inputs, strict=True).module()
+        # Check that the model has in-place ops
+        self.assertTrue(has_inplace_ops(m))
+        m = prepare_pt2e(m, quantizer)
+        # Check that the model no longer has in-place ops because the graph is funtionalized during annotate_to_tranform
+        self.assertFalse(has_inplace_ops(m))
+        m(*example_inputs)
+        m = convert_pt2e(m, fold_quantize=True)
+        for node in m.graph.nodes:
+            if node.name == "quantize_per_tensor_default":
+                # Ensure the quant node is not fused with the mutable buffer
+                self.assertTrue(node.op == "call_function")
+
+        # Verify the quantized model works
+        result = m(*example_inputs)
+        self.assertIsNotNone(result)
+
 
 @skipIfNoQNNPACK
 @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_7, "Requires torch 2.7+")
diff --git a/torchao/quantization/pt2e/constant_fold.py b/torchao/quantization/pt2e/constant_fold.py
index 37a84c45bf..27f82e6757 100644
--- a/torchao/quantization/pt2e/constant_fold.py
+++ b/torchao/quantization/pt2e/constant_fold.py
@@ -93,6 +93,24 @@ def __init__(
         self.deferred_value = object()
         self.skip_folding_node_fn = skip_folding_node_fn
 
+        # Identify mutable buffers by finding copy_ operations
+        self.mutable_buffers = self._find_mutable_buffers()
+
+    def _find_mutable_buffers(self) -> set[torch.fx.Node]:
+        """Find mutable buffers by identifying copy_ operations.
+        The first argument of copy_ op is the mutable buffer."""
+        mutable_buffers = set()
+        for node in self.module.graph.nodes:
+            if (
+                node.op == "call_function"
+                and hasattr(node.target, "_schema")
+                and "copy_" in str(node.target)
+            ):
+                # The first argument of copy_ is the mutable buffer
+                if len(node.args) > 0 and isinstance(node.args[0], torch.fx.Node):
+                    mutable_buffers.add(node.args[0])
+        return mutable_buffers
+
     def _support_dynamic_shape(self) -> bool:
         # ConstantFolder not support dynamic shape now
         return False
@@ -156,6 +174,13 @@ def is_woq_int8_pattern(node: torch.fx.node.Node) -> bool:
             # We only folding fp32_weight -> q
             # int8_weight and leave dq in graph to be fused
             return True
+
+        # Check if any input to this node is a mutable buffer
+        # If so, prevent constant folding to avoid issues with quantize_per_tensor_default
+        for arg in node.args:
+            if isinstance(arg, torch.fx.Node) and arg in self.mutable_buffers:
+                return True
+
         return False
 
     def node_to_last_non_output_use(self) -> dict[torch.fx.Node, list[torch.fx.Node]]:

From 346baf65031d035641549fd3d59077baf78e4a77 Mon Sep 17 00:00:00 2001
From: Mark Saroufim <marksaroufim@meta.com>
Date: Tue, 17 Jun 2025 18:30:12 -0700
Subject: [PATCH 133/165] Delete Galore (#2397)

* Delete Galore

* restore cutlass changes
---
 benchmarks/bench_galore_fused_kernels.py      |  65 ---
 benchmarks/fused_benchmark_utils.py           | 261 -----------
 test/galore/README.md                         | 170 -------
 test/galore/profile_memory_usage.py           | 297 -------------
 test/kernel/galore_test_utils.py              | 180 --------
 test/kernel/test_fused_kernels.py             | 119 -----
 test/kernel/test_galore_downproj.py           |  55 ---
 test/quantization/test_galore_quant.py        | 116 -----
 torchao/prototype/README.md                   |   3 -
 torchao/prototype/galore/README.md            |  11 -
 torchao/prototype/galore/docs/README.md       | 198 ---------
 .../prototype/galore/docs/galore_adam8bit.md  |  35 --
 .../galore/kernels/adam_downproj_fused.py     | 365 ---------------
 torchao/prototype/galore/kernels/matmul.py    | 417 ------------------
 .../prototype/galore/optim/galore_torch.py    | 401 -----------------
 torchao/prototype/galore/utils.py             | 114 -----
 16 files changed, 2807 deletions(-)
 delete mode 100644 benchmarks/bench_galore_fused_kernels.py
 delete mode 100644 benchmarks/fused_benchmark_utils.py
 delete mode 100644 test/galore/README.md
 delete mode 100644 test/galore/profile_memory_usage.py
 delete mode 100644 test/kernel/galore_test_utils.py
 delete mode 100644 test/kernel/test_fused_kernels.py
 delete mode 100644 test/kernel/test_galore_downproj.py
 delete mode 100644 test/quantization/test_galore_quant.py
 delete mode 100644 torchao/prototype/galore/README.md
 delete mode 100644 torchao/prototype/galore/docs/README.md
 delete mode 100644 torchao/prototype/galore/docs/galore_adam8bit.md
 delete mode 100644 torchao/prototype/galore/kernels/adam_downproj_fused.py
 delete mode 100644 torchao/prototype/galore/kernels/matmul.py
 delete mode 100644 torchao/prototype/galore/optim/galore_torch.py
 delete mode 100644 torchao/prototype/galore/utils.py

diff --git a/benchmarks/bench_galore_fused_kernels.py b/benchmarks/bench_galore_fused_kernels.py
deleted file mode 100644
index 3bfa9056bd..0000000000
--- a/benchmarks/bench_galore_fused_kernels.py
+++ /dev/null
@@ -1,65 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-import argparse
-import os
-
-import torch
-from fused_benchmark_utils import get_benchmark  # , make_data
-
-
-def run(args):
-    dtype = getattr(torch, args.dtype)
-    allow_tf32 = args.allow_tf32
-    torch.backends.cuda.matmul.allow_tf32 = allow_tf32
-    M, N = args.M, args.N
-    rank = args.rank
-
-    # exp_avg, exp_avg2, grad, proj_matrix, params = make_data(M, N, rank, dtype)
-
-    benchmark = get_benchmark(M, N, dtype, allow_tf32=allow_tf32)
-    save_path = (
-        f"benchmark_{M}x{N}_{rank}_{args.dtype}_{'tf32' if allow_tf32 else 'no-tf32'}"
-    )
-    if not os.path.exists(save_path):
-        os.makedirs(save_path)
-    print(
-        f"Running benchmark for {M}x{N}, dtype {args.dtype}, allow_tf32 {allow_tf32}",
-        flush=True,
-    )
-    benchmark.run(show_plots=False, print_data=True, save_path=save_path)
-    print(f"Finished benchmark, results saved to {save_path}")
-
-
-if __name__ == "__main__":
-    parser = argparse.ArgumentParser(
-        formatter_class=argparse.ArgumentDefaultsHelpFormatter
-    )
-    parser.add_argument(
-        "--kernel",
-        choices=["hybrid", "fused", "compiled"],
-        default="hybrid",
-        type=str,
-        help="Kernel to test",
-    )
-
-    parser.add_argument(
-        "--allow_tf32", action="store_true", help="Allow tf32 for matmuls"
-    )
-    parser.add_argument("--M", type=int, default=4096, help="Grad (param) shape M")
-    parser.add_argument("--N", type=int, default=4096, help="Grad (param) shape N")
-    parser.add_argument(
-        "--rank", type=int, default=128, help="Rank of GaLore projection"
-    )
-    parser.add_argument(
-        "--dtype",
-        type=str,
-        choices=["float32", "float16", "bfloat16"],
-        default="float32",
-        help="Data type of grad (param) tensors",
-    )
-
-    args = parser.parse_args()
-    run(args)
diff --git a/benchmarks/fused_benchmark_utils.py b/benchmarks/fused_benchmark_utils.py
deleted file mode 100644
index c1ae0bfac2..0000000000
--- a/benchmarks/fused_benchmark_utils.py
+++ /dev/null
@@ -1,261 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-import torch
-import triton
-from triton.testing import do_bench
-
-from torchao.prototype.galore.kernels.adam_downproj_fused import fused_adam_mm_launcher
-from torchao.prototype.galore.kernels.adam_step import triton_adam_launcher
-from torchao.prototype.galore.kernels.matmul import triton_mm_launcher
-from torchao.prototype.galore.utils import TestGaLoreProjector as GaLoreProjector
-
-torch.manual_seed(0)
-
-BETA1 = 0.9
-BETA2 = 0.999
-EPS = 1e-8
-STEP_SIZE = 1e-4
-
-
-def make_data(M, N, rank, dtype):
-    grad = torch.randn(M, N, device="cuda", dtype=dtype)
-    params = torch.randn(M, N, device="cuda", dtype=dtype)
-
-    galore_proj = GaLoreProjector(rank=rank)
-    galore_proj.update_orthogonal_matrix(grad)
-
-    if M >= N:
-        exp_avg = torch.randn(M, rank, device="cuda", dtype=dtype)
-    else:
-        exp_avg = torch.randn(rank, N, device="cuda", dtype=dtype)
-    exp_avg2 = exp_avg**2
-
-    return exp_avg, exp_avg2, grad, galore_proj.ortho_matrix, params
-
-
-def make_copy(*args):
-    return [t.detach().clone() for t in args]
-
-
-def _ref_op(
-    grad,
-    proj_matrix,
-    exp_avg,
-    exp_avg2,
-    params,
-    beta1=BETA1,
-    beta2=BETA2,
-    eps=EPS,
-    step_size=STEP_SIZE,
-    **kwargs,
-):
-    # Step 1: Down proj grad
-    M, N = grad.shape
-    if M >= N:
-        a, b = grad, proj_matrix.t()
-    else:
-        a, b = proj_matrix.t(), grad
-    low_rank_grad = a @ b
-
-    # Step 2: update adam state
-    exp_avg.mul_(beta1).add_(low_rank_grad, alpha=(1.0 - beta1))
-    exp_avg2.mul_(beta2).addcmul_(low_rank_grad, low_rank_grad, value=1.0 - beta2)
-    denom = exp_avg2.sqrt().add_(eps)
-    low_rank_norm_grad = exp_avg / denom
-
-    # Step 3: project normalized low rank grad to full rank
-    if M >= N:
-        a, b = low_rank_norm_grad, proj_matrix
-    else:
-        a, b = proj_matrix, low_rank_norm_grad
-    full_grad_norm = a @ b
-
-    # Finally, update params with updated grad
-    params.add_(full_grad_norm, alpha=-step_size)
-
-    return exp_avg, exp_avg2, params
-
-
-def _tt_hybrid(
-    grad,
-    proj_matrix,
-    exp_avg,
-    exp_avg2,
-    params,
-    store=True,
-    step_size=STEP_SIZE,
-    fp8_fast_accum=False,
-    allow_tf32=False,
-):
-    M, N = grad.shape
-    if M >= N:
-        a, b = grad, proj_matrix.t()
-    else:
-        a, b = proj_matrix.t(), grad
-    low_rank_grad = a @ b
-
-    exp_avg, exp_avg2, norm_grad = triton_adam_launcher(
-        exp_avg, exp_avg2, low_rank_grad, store=store
-    )
-
-    if M >= N:
-        a, b = low_rank_grad, proj_matrix
-    else:
-        a, b = proj_matrix, low_rank_grad
-    params = triton_mm_launcher(
-        a,
-        b,
-        epilogue_alpha=-step_size,
-        epilogue_source=params,
-        allow_tf32=allow_tf32,
-        fp8_fast_accum=fp8_fast_accum,
-    )
-    return exp_avg, exp_avg2, params
-
-
-def _tt_fused(
-    grad,
-    proj_matrix,
-    exp_avg,
-    exp_avg2,
-    params,
-    store=True,
-    step_size=STEP_SIZE,
-    fp8_fast_accum=False,
-    allow_tf32=False,
-):
-    M, N = grad.shape
-
-    if M >= N:
-        a, b = grad, proj_matrix.t()
-    else:
-        a, b = proj_matrix.t(), grad
-    exp_avg, exp_avg2, low_rank_grad = fused_adam_mm_launcher(
-        a,
-        b,
-        exp_avg=exp_avg,
-        exp_avg2=exp_avg2,
-        store=store,
-        fp8_fast_accum=fp8_fast_accum,
-        allow_tf32=allow_tf32,
-    )
-
-    if M >= N:
-        a, b = low_rank_grad, proj_matrix
-    else:
-        a, b = proj_matrix, low_rank_grad
-    params = triton_mm_launcher(
-        a,
-        b,
-        epilogue_alpha=-step_size,
-        epilogue_source=params,
-        allow_tf32=allow_tf32,
-        fp8_fast_accum=fp8_fast_accum,
-    )
-    return exp_avg, exp_avg2, params
-
-    # logging.basicConfig(level=logging.INFO)
-
-
-def get_kernel(kernel):
-    if kernel == "ref":
-        op = _ref_op
-    elif kernel == "ref":
-        op = torch.compile(_ref_op, fullgraph=True, mode="max-autotune")
-    elif kernel == "hybrid":
-        op = _tt_hybrid
-    elif kernel == "fused":
-        op = _tt_fused
-    else:
-        raise ValueError(f"Unknown kernel {kernel}")
-
-    return lambda *args, **kwargs: op(*args, **kwargs)
-
-
-def get_benchmark(
-    M, N, dtype, allow_tf32, fp8_fast_accum=False, quantiles=[0.5, 0.2, 0.8]
-):
-    config = triton.testing.Benchmark(
-        x_names=["rank"],  # Argument names to use as an x-axis for the plot
-        x_vals=[
-            32,
-            64,
-            128,
-            256,
-            512,
-        ],  # Different possible values for `x_name`
-        line_arg="kernel",  # Argument name whose value corresponds to a different line in the plot
-        # Possible values for `line_arg`
-        line_vals=["torch", "hybrid", "fused", "compiled"],
-        # Label name for the lines
-        line_names=["torch", "hybrid", "fused", "compiled"],
-        # Line styles
-        styles=[("black", "-"), ("blue", "-"), ("red", "-"), ("green", "-")],
-        ylabel="ms",  # Label name for the y-axis
-        plot_name=f"Adam Kernel Comparison Grad shape: {M}x{N}, dtype: {dtype}, allow_tf32: {allow_tf32}\nMedian times (ms)",  # Name for the plot, used also as a file name for saving the plot.
-        args={},
-    )
-
-    def benchmark(rank, kernel):
-        torch.backends.cuda.matmul.allow_tf32 = allow_tf32
-
-        exp_avg, exp_avg2, grad, proj_matrix, params = make_data(M, N, rank, dtype)
-
-        if kernel == "torch":
-            ms, min_ms, max_ms = do_bench(
-                lambda: _ref_op(
-                    grad,
-                    proj_matrix,
-                    exp_avg,
-                    exp_avg2,
-                    params,
-                ),
-                quantiles=quantiles,
-            )
-        if kernel == "hybrid":
-            ms, min_ms, max_ms = triton.testing.do_bench(
-                lambda: _tt_hybrid(
-                    grad,
-                    proj_matrix,
-                    exp_avg,
-                    exp_avg2,
-                    params,
-                    store=True,
-                    allow_tf32=allow_tf32,
-                    fp8_fast_accum=fp8_fast_accum,
-                ),
-                quantiles=quantiles,
-            )
-        if kernel == "fused":
-            ms, min_ms, max_ms = triton.testing.do_bench(
-                lambda: _tt_fused(
-                    grad,
-                    proj_matrix,
-                    exp_avg,
-                    exp_avg2,
-                    params,
-                    store=True,
-                    allow_tf32=allow_tf32,
-                    fp8_fast_accum=fp8_fast_accum,
-                ),
-                quantiles=quantiles,
-            )
-        if kernel == "compiled":
-            compiled_op = torch.compile(_ref_op, fullgraph=True, mode="max-autotune")
-            ms, min_ms, max_ms = triton.testing.do_bench(
-                lambda: compiled_op(
-                    grad,
-                    proj_matrix,
-                    exp_avg,
-                    exp_avg2,
-                    params,
-                ),
-                quantiles=quantiles,
-            )
-
-        return ms, max_ms, min_ms
-
-    return triton.testing.perf_report(config)(benchmark)
diff --git a/test/galore/README.md b/test/galore/README.md
deleted file mode 100644
index fc479267d8..0000000000
--- a/test/galore/README.md
+++ /dev/null
@@ -1,170 +0,0 @@
-### GaLore Memory Profiler
-
-Tests memory usage of `GaLore` optimizers.
-
-Uses `torch.profiler` under the hood with additional options for `nsys`, [`torch.cuda.memory`](https://pytorch.org/docs/stable/torch_cuda_memory.html) analyses.
-
-Runs an untrained Llama model with configs for various model sizes (see `configs`) from the original GaLore [repo](https://github.com/jiaweizzhao/GaLore/tree/master/configs) on a sample batch of data for a configurable set of iterations.
-
-The results of the profiler are saved and can be analyzed using the provided notebook.
-
-#### Examples
-
-Run memory profiler with `torch.optim.AdamW`
-
-```
-python galore_mem_prof.py -t --optimizer=adamw
-```
-
-Run profiler with `GaLoreAdamW` reference implementation with rank 128
-
-```
-python galore_mem_prof.py -t --optimizer=galore_adamw --rank=128
-```
-
-More options
-
-```
-python profile_memory_usage.py --help
-
-usage: profile_memory_usage.py [-h] [-t] [-m] [-ns] [--optimizer {adamw,galore_adamw}] [--rank RANK] [--update_proj_gap UPDATE_PROJ_GAP]
-                            [--galore_scale GALORE_SCALE] [--wait_steps WAIT_STEPS] [--warmup_steps WARMUP_STEPS] [--profiler_steps PROFILER_STEPS]
-                            [--max_steps MAX_STEPS] [--model_config MODEL_CONFIG] [--data_path DATA_PATH] [--output_dir OUTPUT_DIR] [-lr LEARNING_RATE]
-                            [--weight_decay WEIGHT_DECAY] [--seed SEED]
-
-options:
-  -h, --help            show this help message and exit
-  -t, --torch_profiler  Enable torch profiler (default: False)
-  -m, --torch_memory_snapshot
-                        Enable torch memory snapshot (default: False)
-  -ns, --nsys_profiler  Enable nsys profiling context managerSurrounds training loop with cudaProfilerApi.{Start,Stop} (default: False)
-  --optimizer {adamw,galore_adamw}
-                        Which optimizer to use (default: adamw)
-  --rank RANK
-  --update_proj_gap UPDATE_PROJ_GAP
-  --galore_scale GALORE_SCALE
-  --wait_steps WAIT_STEPS
-                        Number of steps to run before starting torch profiler (default: 0)
-  --warmup_steps WARMUP_STEPS
-                        Number of warmup steps for torch profiler (default: 0)
-  --profiler_steps PROFILER_STEPS
-                        Number of active steps for torch profiler (default: 5)
-  --max_steps MAX_STEPS
-                        Max number of train steps to run.Total train steps will be min of `max_steps` and the sum of torch profiler steps (`wait_steps` +
-                        `warmup_steps` + `profiler_steps`). (default: 100)
-  --model_config MODEL_CONFIG
-                        Path to Llama config file see `https://github.com/jiaweizzhao/GaLore/tree/master/configs` (default: ./configs/llama_100m.json)
-  --data_path DATA_PATH
-                        Path to sample batch (default: ./data/sample_batch.pt)
-  --output_dir OUTPUT_DIR
-                        Directory for profiler outputs (default: profiler_out)
-  -lr LEARNING_RATE, --learning_rate LEARNING_RATE
-                        Learning rate (default: 0.001)
-  --weight_decay WEIGHT_DECAY
-                        Weight decay for AdamW (default: 0.01)
-  --seed SEED           Random seed for torch (default: 0)
-```
-
-#### Analysis
-
-After running the `profile_memory_usage`, the output directory (defaults to `profiler_out`) will have three types of files:
-
-- `*.{json,html} - these are the memory trace exports of `torch.profiler`
-  - the `html` contains the memory timeline plot
-  - the `json` file contains the raw data for this plot, which can be analyzed to extract summary stats.
-  - `galore_memory_analysis.py` along with `galore_memory_analysis_utils.py` demonstrate such analysis.
-- `*.json.gz` - these are the complete `torch.profiler` traces which can be viewed using `perfetto`.
-
-#### Preliminary Observations
-
-- Memory Usage over Time
-
-  - We can see a long delay between the first backwards step for `GaLoreAdamW` due to the calculation of the projection matrix (calls `torch.linalg.svd` on the `grad`).
-  - To visualize, paste the following into a jupyter notebook (replacing the filenames with the those after running the profiler script):
-
-  ```python
-    adamW_html_trace = "./profiler_out/adamw_04-09-23.html"
-    adamW8bit_html_trace = "./profiler_out/adamw8bit_04-11-01.html"
-    galore_adamw_128_html_trace = "./profiler_out/galore_adamw-128-1.0-50_04-09-23.html"
-    galore_adamw8bit_128_html_trace = "./profiler_out/galore_adamw8bit-128-1.0-50_04-11-01.html"
-
-    plot_memory_timeline(adamW_html_trace)
-    plot_memory_timeline(adamW8bit_html_trace)
-    plot_memory_timeline(galore_adamw_128_html_trace)
-    plot_memory_timeline(galore_adamw8bit_128_html_trace)
-  ```
-
-- Memory Usage Stats
-
-  - Summary stats for memory usage by type as well as total across all types can be viewed by running the following in jupyter notebook, again replacing the respective filepaths:
-
-  ```python
-  adamW_trace = "./profiler_out/adamw_04-11-21-memory-timeline.json"
-  adamW8bit_trace = "./profiler_out/adamw8bit_04-11-21-memory-timeline.json"
-  galore_adamW_trace_128 = "./profiler_out/galore_adamw-128-1.0-50_04-11-21-memory-timeline.json"
-  galore_adamW8bit_trace_128 = "./profiler_out/galore_adamw8bit-128-1.0-50_04-11-21-memory-timeline.json"
-
-  adamW_df = create_mem_df(adamW_trace, units="MB")
-  adamW8bit_df = create_mem_df(adamW8bit_trace, units="MB")
-  galore_adamW_df_128 = create_mem_df(galore_adamW_trace_128, units="MB")
-  galore_adamW8bit_df_128 = create_mem_df(galore_adamW8bit_trace_128, units="MB")
-
-  show_memory_stats(adamW_df)
-  show_memory_stats(adamW8bit_df)
-  show_memory_stats(galore_adamW_df_128)
-  show_memory_stats(galore_adamW8bit_df_128)
-  ```
-
-  The following are results from sample runs of `Llama1B` model config with the following optimizers (all units in MB):
-
-- torch.optim.AdamW
-
-  |        | Parameter | Optimizer_State | Input | Temporary | Activation | Gradient | Autograd_Detail | Unknown | Total    |
-  | ------ | --------- | --------------- | ----- | --------- | ---------- | -------- | --------------- | ------- | -------- |
-  | mean   | 5,108.2   | 8,330.3         | 0.0   | 0.6       | 2,249.5    | 2,113.8  | 19.0            | 197.3   | 18,018.8 |
-  | min    | 5,108.2   | 0.0             | 0.0   | 0.0       | 0.0        | 0.0      | 0.0             | 0.0     | 5,108.2  |
-  | median | 5,108.2   | 10,216.4        | 0.0   | 0.0       | 2,151.1    | 1,930.1  | 10.0            | 16.3    | 20,306.5 |
-  | max    | 5,108.3   | 10,216.4        | 0.3   | 20.0      | 5,946.4    | 5,108.2  | 312.2           | 5,124.4 | 25,557.3 |
-
-- GaLoreAdamW reference, rank 128
-
-  |        | Parameter | Optimizer_State | Input | Temporary | Activation | Gradient | Autograd_Detail | Unknown | Total    |
-  | ------ | --------- | --------------- | ----- | --------- | ---------- | -------- | --------------- | ------- | -------- |
-  | mean   | 7,298.0   | 1,348.4         | 0.0   | 0.7       | 1,455.6    | 3,183.6  | 12.2            | 31.3    | 13,330.0 |
-  | min    | 5,108.2   | 0.0             | 0.0   | 0.0       | 0.0        | 0.0      | 0.0             | 0.0     | 5,108.2  |
-  | median | 7,796.2   | 1,576.7         | 0.0   | 0.0       | 545.4      | 3,898.2  | 0.0             | 26.2    | 14,422.8 |
-  | max    | 8,047.2   | 1,576.7         | 0.3   | 42.7      | 5,960.0    | 5,108.2  | 312.2           | 518.2   | 15,349.2 |
-
-- bitsandbytes AdamW8bit
-
-  |        | Parameter | Optimizer_State | Input | Temporary | Activation | Gradient | Autograd_Detail | Unknown | Total    |
-  | ------ | --------- | --------------- | ----- | --------- | ---------- | -------- | --------------- | ------- | -------- |
-  | mean   | 5,108.2   | 2,047.4         | 0.0   | 0.7       | 2,390.0    | 1,925.2  | 20.1            | 20.3    | 11,511.9 |
-  | min    | 5,108.2   | 0.0             | 0.0   | 0.0       | 0.0        | 0.0      | 0.0             | 0.0     | 5,108.2  |
-  | median | 5,108.2   | 2,560.4         | 0.0   | 0.0       | 2,351.0    | 1,738.1  | 10.0            | 16.3    | 12,621.3 |
-  | max    | 5,108.3   | 2,560.4         | 0.3   | 20.0      | 5,946.4    | 5,108.2  | 312.2           | 46.9    | 13,631.3 |
-
-- GaLore AdamW8bit
-
-  |        | Parameter | Optimizer_State | Input | Temporary | Activation | Gradient | Autograd_Detail | Unknown | Total    |
-  | ------ | --------- | --------------- | ----- | --------- | ---------- | -------- | --------------- | ------- | -------- |
-  | mean   | 4,971.0   | 334.7           | 0.1   | 0.8       | 1,644.0    | 2,130.9  | 13.8            | 2,360.3 | 11,455.6 |
-  | min    | 500.4     | 0.0             | 0.0   | 0.0       | 0.0        | 0.0      | 0.0             | 0.0     | 5,108.2  |
-  | median | 5,108.2   | 395.6           | 0.0   | 0.0       | 1,076.4    | 2,106.1  | 0.0             | 2,704.3 | 11,673.8 |
-  | max    | 5,153.5   | 395.6           | 85.4  | 42.7      | 5,947.8    | 5,109.2  | 312.2           | 7,685.4 | 14,155.9 |
-
-- The `optimizer state` is indeed smaller for the `GaLoreAdamW` optimizer.
-- Interestingly, the `Parameter` sizes balloons in the `GaLore` optimizer, likely due to extra data copies. Admittedly, the implementation is only a reference (per original repo) and leaves much room for optimization.
-- The memory usage is in terms of memory allocated, which we can confirm by printing the max cuda memory allocated vs reserved (which the profiler script prints automatically).
-- The `Total` column shows the allocation stats across all categories across all sampled timepoints. (Should not be interpreted as the row-wise sums).
-
-**NOTE**: The `json` output of the torch profiler memory trace is unlabeled. However, we can infer -- and confirm -- the labels by comparing the plots of the parsed dataframe with that of the direct `html` export of the profiler.
-
-- For example, after creating the dataframes per above, the following will plot the raw data, which should roughly reproduce the direct `html` export from `torch.profiler`, albeit with different timescale:
-
-```python
-_ = adamW_df.plot(kind="area", stacked=True, ylabel="Memory (MB)" )
-_ = adamW8bit_df.plot(kind="area", stacked=True, ylabel="Memory (MB)" )
-_ = galore_adamW_df_128.plot(kind="area", stacked=True, ylabel="Memory (MB)" )
-_ = galore_adamW8bit_df_128.plot(kind="area", stacked=True, ylabel="Memory (MB)" )
-```
diff --git a/test/galore/profile_memory_usage.py b/test/galore/profile_memory_usage.py
deleted file mode 100644
index 33fd746c39..0000000000
--- a/test/galore/profile_memory_usage.py
+++ /dev/null
@@ -1,297 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-import argparse
-import contextlib
-import logging
-import os
-
-import model_configs
-import profiling_utils
-import torch
-import torch.nn as nn
-import torch.utils.data
-from bitsandbytes.optim import AdamW8bit
-from torch.profiler import record_function
-from transformers import LlamaConfig, LlamaForCausalLM
-
-from torchao.prototype.galore.optim.galore_torch import AdamW as GaLoreAdamW
-from torchao.prototype.galore.optim.galore_torch import AdamW8bit as GaLoreAdamW8bit
-
-logging.basicConfig(level=logging.INFO)
-logger = logging.getLogger(__name__)
-
-
-def setup_galore(model, lr, weight_decay, rank, galore_scale, update_proj_gap):
-    galore_params = []
-    target_modules_list = ["attn", "mlp"]
-    for module_name, module in model.named_modules():
-        if not isinstance(module, nn.Linear):
-            continue
-
-        if not any(target_key in module_name for target_key in target_modules_list):
-            continue
-
-        logger.debug("Enabling GaLore for weights in module: ", module_name)
-        galore_params.append(module.weight)
-    id_galore_params = [id(p) for p in galore_params]
-    # make parameters without "rank" to another group
-    regular_params = [p for p in model.parameters() if id(p) not in id_galore_params]
-    # then call galore_adamw
-
-    total_galore_params = sum(p.numel() for p in galore_params)
-    total_regular_params = sum(p.numel() for p in regular_params)
-    total_params = sum(p.numel() for p in model.parameters())
-    assert total_galore_params + total_regular_params == total_params
-
-    print(
-        f"Total params: {total_params} = GaLore params: {total_galore_params} + Regular params: {total_regular_params}"
-    )
-    param_groups = [
-        {"params": regular_params},
-        {
-            "params": galore_params,
-            "rank": rank,
-            "update_proj_gap": update_proj_gap,
-            "scale": galore_scale,
-            "proj_type": "std",
-        },
-    ]
-    if "adamw" in args.optimizer:
-        if "8bit" in args.optimizer:
-            optimizer = GaLoreAdamW8bit(param_groups, lr=lr, weight_decay=weight_decay)
-        else:
-            optimizer = GaLoreAdamW(param_groups, lr=lr, weight_decay=weight_decay)
-    else:
-        raise ValueError(f"Unknown optimizer: {args.optimizer}")
-    return optimizer
-
-
-def train_step(model, batch, labels, optimizer, profiler=None):
-    with record_function("MODEL_FORWARD"):
-        loss = model(**batch, labels=labels).loss
-
-    with record_function("MODEL_BACKWARD"):
-        loss.backward()
-
-    with record_function("OPTIMIZER_STEP"):
-        optimizer.step()
-        optimizer.zero_grad(set_to_none=True)
-
-    if profiler:
-        profiler.step()
-
-
-def run(args, file_prefix):
-    torch.manual_seed(args.seed)
-
-    # Initialize model from config dict
-    model_config = LlamaConfig()
-    try:
-        model_config_dict = getattr(model_configs, args.model_config.upper())
-    except:
-        raise ValueError(f"Model config {args.model_config} not found")
-    model_config.update(model_config_dict)
-    model = LlamaForCausalLM(model_config).to("cuda")
-
-    # Load sample batch
-    input_ids = torch.randint(
-        0,
-        model_config.vocab_size,
-        size=(args.batch_size, args.max_seq_len),
-        dtype=torch.int64,
-        device="cuda",
-    )
-    attention_mask = torch.ones_like(input_ids)
-    batch = dict(input_ids=input_ids, attention_mask=attention_mask)
-    labels = batch["input_ids"].clone()
-
-    n_total_params = sum(p.numel() for p in model.parameters())
-    trainable_params = [p for p in model.parameters() if p.requires_grad]
-    print(
-        f"Trainable params: {sum(p.numel() for p in trainable_params)} / {n_total_params}"
-    )
-
-    if args.optimizer.lower() == "adamw":
-        optimizer = torch.optim.AdamW(
-            trainable_params, lr=args.learning_rate, weight_decay=args.weight_decay
-        )
-
-    elif "galore" in args.optimizer.lower():
-        optimizer = setup_galore(
-            model,
-            args.learning_rate,
-            args.weight_decay,
-            rank=args.rank,
-            galore_scale=args.galore_scale,
-            update_proj_gap=args.update_proj_gap,
-        )
-    elif args.optimizer.lower() == "adamw8bit":
-        optimizer = AdamW8bit(
-            trainable_params, lr=args.learning_rate, weight_decay=args.weight_decay
-        )
-    else:
-        raise "Unsupported optimizer"
-
-    if args.torch_profiler:
-        prof_ctx = profiling_utils.get_torch_profiler(
-            name=file_prefix,
-            output_dir=args.output_dir,
-            wait_steps=args.wait_steps,
-            warmup_steps=args.warmup_steps,
-            active_steps=args.profiler_steps,
-        )
-    elif args.nsys_profiler:
-        prof_ctx = profiling_utils.nsys_profiler()
-    else:
-        prof_ctx = contextlib.nullcontext()
-
-    total_steps = min(
-        args.wait_steps + args.warmup_steps + args.profiler_steps, args.max_steps
-    )
-    print(
-        f"Profiling {args.model_config} with {args.optimizer.upper()} for {total_steps} steps (wait_steps={args.wait_steps}, warmup_steps={args.warmup_steps}, profiler_steps={args.profiler_steps})"
-    )
-    with prof_ctx as prof:
-        logger.debug(f"Profiler: {prof}")
-        for _ in range(total_steps):
-            with record_function("TRAIN_STEP"):
-                train_step(
-                    model,
-                    batch,
-                    labels,
-                    optimizer,
-                    profiler=prof if args.torch_profiler else None,
-                )
-    if args.torch_profiler:
-        print(f"Finished profiling, outputs saved to {args.output_dir}/{file_prefix}*")
-    else:
-        print("Finished profiling")
-
-
-if __name__ == "__main__":
-    parser = argparse.ArgumentParser(
-        formatter_class=argparse.ArgumentDefaultsHelpFormatter
-    )
-    parser.add_argument(
-        "-t", "--torch_profiler", action="store_true", help="Enable torch profiler"
-    )
-    parser.add_argument(
-        "-m",
-        "--torch_memory_snapshot",
-        action="store_true",
-        help="Enable torch memory snapshot",
-    )
-
-    parser.add_argument(
-        "-ns",
-        "--nsys_profiler",
-        action="store_true",
-        help="Enable nsys profiling context manager"
-        "Surrounds training loop with cudaProfilerApi.{Start,Stop}",
-    )
-    parser.add_argument(
-        "--optimizer",
-        default="adamw",
-        type=str,
-        choices=["adamw", "galore_adamw", "adamw8bit", "galore_adamw8bit"],
-        help="Which optimizer to use",
-    )
-    parser.add_argument("--rank", type=int, default=128)
-    parser.add_argument("--update_proj_gap", type=int, default=50)
-    parser.add_argument("--galore_scale", type=float, default=1.0)
-    # parser.add_argument("--proj_type", type=str, default="std")
-    parser.add_argument(
-        "--wait_steps",
-        type=int,
-        default=0,
-        help="Number of steps to run before starting torch profiler",
-    )
-    parser.add_argument(
-        "--warmup_steps",
-        type=int,
-        default=0,
-        help="Number of warmup steps for torch profiler",
-    )
-
-    parser.add_argument(
-        "--profiler_steps",
-        type=int,
-        default=5,
-        help="Number of active steps for torch profiler",
-    )
-    parser.add_argument(
-        "--max_steps",
-        type=int,
-        default=100,
-        help="Max number of train steps to run."
-        "Total train steps will be min of `max_steps` and the sum of torch profiler steps (`wait_steps` + `warmup_steps` + `profiler_steps`).",
-    )
-    parser.add_argument(
-        "--model_config",
-        default="llama100M",
-        type=str,
-        choices=["llama100M", "llama1B"],
-        help="Model configuration (see model_configs.py)",
-    )
-    parser.add_argument(
-        "--batch_size", default=5, type=int, help="Batch size to use for train step"
-    )
-    parser.add_argument(
-        "--max_seq_len",
-        default=256,
-        type=int,
-        help="Sequence length to use for train step, should be less than that in the specific model config",
-    )
-    parser.add_argument(
-        "--output_dir",
-        default="profiler_out",
-        type=str,
-        help="Directory for profiler outputs",
-    )
-
-    parser.add_argument(
-        "-lr",
-        "--learning_rate",
-        default=1e-3,
-        type=float,
-        help="Learning rate",
-    )
-    parser.add_argument(
-        "--weight_decay",
-        default=1e-2,
-        type=float,
-        help="Weight decay for AdamW",
-    )
-
-    parser.add_argument("--seed", default=0, type=int, help="Random seed for torch")
-    args = parser.parse_args()
-    output_dir = args.output_dir
-    # output_prefix = args.output_prefix
-    if not os.path.exists(output_dir):
-        os.makedirs(output_dir)
-    if "galore" not in args.optimizer.lower():
-        file_prefix = args.optimizer.lower()
-    else:
-        file_prefix = "-".join(
-            [
-                args.optimizer.lower(),
-                str(args.rank),
-                str(args.galore_scale),
-                str(args.update_proj_gap),
-            ]
-        )
-    mem_ctx = (
-        profiling_utils.memory_recorder(
-            file_name=os.path.join(output_dir, f"{file_prefix}-memory-snapshot")
-        )
-        if args.torch_memory_snapshot
-        else contextlib.nullcontext()
-    )
-    profiling_utils.flush_cuda_mem()
-    with mem_ctx:
-        run(args, file_prefix)
-
-    profiling_utils.get_cuda_memory_usage(units="MB", show=True)
diff --git a/test/kernel/galore_test_utils.py b/test/kernel/galore_test_utils.py
deleted file mode 100644
index 2810941fe1..0000000000
--- a/test/kernel/galore_test_utils.py
+++ /dev/null
@@ -1,180 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-import torch
-
-from torchao.prototype.galore.kernels.adam_downproj_fused import fused_adam_mm_launcher
-from torchao.prototype.galore.kernels.adam_downproj_fused import (
-    set_tuner_top_k as adam_downproj_tuner_topk,
-)
-from torchao.prototype.galore.kernels.adam_step import triton_adam_launcher
-from torchao.prototype.galore.kernels.matmul import set_tuner_top_k as matmul_tuner_topk
-from torchao.prototype.galore.kernels.matmul import triton_mm_launcher
-from torchao.prototype.galore.utils import TestGaLoreProjector as GaLoreProjector
-
-torch.manual_seed(0)
-
-adam_downproj_tuner_topk(10)
-matmul_tuner_topk(10)
-
-BETA1 = 0.9
-BETA2 = 0.999
-EPS = 1e-8
-STEP_SIZE = 1e-4
-
-
-def make_data(M, N, rank, dtype):
-    grad = torch.randn(M, N, device="cuda", dtype=dtype)
-    params = torch.randn(M, N, device="cuda", dtype=dtype)
-
-    galore_proj = GaLoreProjector(rank=rank)
-    galore_proj.update_orthogonal_matrix(grad)
-
-    if M >= N:
-        exp_avg = torch.randn(M, rank, device="cuda", dtype=dtype)
-    else:
-        exp_avg = torch.randn(rank, N, device="cuda", dtype=dtype)
-    exp_avg2 = exp_avg**2
-
-    return exp_avg, exp_avg2, grad, galore_proj.ortho_matrix, params
-
-
-def make_copy(*args):
-    return [t.detach().clone() for t in args]
-
-
-def _ref_op(
-    grad,
-    proj_matrix,
-    exp_avg,
-    exp_avg2,
-    params,
-    beta1=BETA1,
-    beta2=BETA2,
-    eps=EPS,
-    step_size=STEP_SIZE,
-    **kwargs,
-):
-    # Step 1: Down proj grad
-    M, N = grad.shape
-    if M >= N:
-        a, b = grad, proj_matrix.t()
-    else:
-        a, b = proj_matrix.t(), grad
-    low_rank_grad = a @ b
-
-    # Step 2: update adam state
-    exp_avg.mul_(beta1).add_(low_rank_grad, alpha=(1.0 - beta1))
-    exp_avg2.mul_(beta2).addcmul_(low_rank_grad, low_rank_grad, value=1.0 - beta2)
-    denom = exp_avg2.sqrt().add_(eps)
-    low_rank_norm_grad = exp_avg / denom
-
-    # Step 3: project normalized low rank grad to full rank
-    if M >= N:
-        a, b = low_rank_norm_grad, proj_matrix
-    else:
-        a, b = proj_matrix, low_rank_norm_grad
-    full_grad_norm = a @ b
-
-    # Finally, update params with updated grad
-    params.add_(full_grad_norm, alpha=-step_size)
-
-    return exp_avg, exp_avg2, params
-
-
-def _tt_hybrid(
-    grad,
-    proj_matrix,
-    exp_avg,
-    exp_avg2,
-    params,
-    store=True,
-    step_size=STEP_SIZE,
-    fp8_fast_accum=False,
-    allow_tf32=False,
-):
-    M, N = grad.shape
-    if M >= N:
-        a, b = grad, proj_matrix.t()
-    else:
-        a, b = proj_matrix.t(), grad
-    low_rank_grad = a @ b
-
-    exp_avg, exp_avg2, norm_grad = triton_adam_launcher(
-        exp_avg, exp_avg2, low_rank_grad, store=store
-    )
-
-    if M >= N:
-        a, b = low_rank_grad, proj_matrix
-    else:
-        a, b = proj_matrix, low_rank_grad
-    params = triton_mm_launcher(
-        a,
-        b,
-        epilogue_alpha=-step_size,
-        epilogue_source=params,
-        allow_tf32=allow_tf32,
-        fp8_fast_accum=fp8_fast_accum,
-    )
-    return exp_avg, exp_avg2, params
-
-
-def _tt_fused(
-    grad,
-    proj_matrix,
-    exp_avg,
-    exp_avg2,
-    params,
-    store=True,
-    step_size=STEP_SIZE,
-    fp8_fast_accum=False,
-    allow_tf32=False,
-):
-    M, N = grad.shape
-
-    if M >= N:
-        a, b = grad, proj_matrix.t()
-    else:
-        a, b = proj_matrix.t(), grad
-    exp_avg, exp_avg2, low_rank_grad = fused_adam_mm_launcher(
-        a,
-        b,
-        exp_avg=exp_avg,
-        exp_avg2=exp_avg2,
-        store=store,
-        fp8_fast_accum=fp8_fast_accum,
-        allow_tf32=allow_tf32,
-    )
-
-    if M >= N:
-        a, b = low_rank_grad, proj_matrix
-    else:
-        a, b = proj_matrix, low_rank_grad
-    params = triton_mm_launcher(
-        a,
-        b,
-        epilogue_alpha=-step_size,
-        epilogue_source=params,
-        allow_tf32=allow_tf32,
-        fp8_fast_accum=fp8_fast_accum,
-    )
-    return exp_avg, exp_avg2, params
-
-    # logging.basicConfig(level=logging.INFO)
-
-
-def get_kernel(kernel):
-    if kernel == "ref":
-        op = _ref_op
-    elif kernel == "ref":
-        op = torch.compile(_ref_op, fullgraph=True, mode="max-autotune")
-    elif kernel == "hybrid":
-        op = _tt_hybrid
-    elif kernel == "fused":
-        op = _tt_fused
-    else:
-        raise ValueError(f"Unknown kernel {kernel}")
-
-    return lambda *args, **kwargs: op(*args, **kwargs)
diff --git a/test/kernel/test_fused_kernels.py b/test/kernel/test_fused_kernels.py
deleted file mode 100644
index 3c51b78f1b..0000000000
--- a/test/kernel/test_fused_kernels.py
+++ /dev/null
@@ -1,119 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-import itertools
-
-import pytest
-
-# Skip entire test if triton is not available, otherwise CI failure
-try:
-    import triton  # noqa: F401
-except ImportError:
-    pytest.skip("triton is not installed", allow_module_level=True)
-
-import torch
-from galore_test_utils import get_kernel, make_copy, make_data
-
-from torchao.testing.utils import skip_if_rocm
-
-torch.manual_seed(0)
-MAX_DIFF_no_tf32 = 1e-5
-MAX_DIFF_tf32 = 1e-3
-
-
-def run_test(kernel, exp_avg, exp_avg2, grad, proj_matrix, params, allow_tf32):
-    # Copy to use for first run -- needed because of autotuning and inplace ops
-    (
-        exp_avg_autotune_copy,
-        exp_avg2_autotune_copy,
-        grad_autotune_copy,
-        proj_matrix_autotune_copy,
-        params_autotune_copy,
-    ) = make_copy(exp_avg, exp_avg2, grad, proj_matrix, params)
-
-    # Copy to use for second run to check accuracy
-    (
-        exp_avg_test_copy,
-        exp_avg2_test_copy,
-        grad_test_copy,
-        proj_matrix_test_copy,
-        params_test_copy,
-    ) = make_copy(exp_avg, exp_avg2, grad, proj_matrix, params)
-
-    print(
-        f"Running with {grad.shape[0]} x {grad.shape[1]} grad (param) shape, GaLore orthogonal matrix {list(proj_matrix.shape)}, dtype {grad.dtype} and allow_tf32 {allow_tf32}\n"
-        f"Kernel: {kernel}",
-        flush=True,
-    )
-
-    ref_op = get_kernel("ref")
-    test_op = get_kernel(kernel)
-
-    # Reference run
-    ref_out = ref_op(
-        grad,
-        proj_matrix,
-        exp_avg,
-        exp_avg2,
-        params,
-    )
-
-    # Autotune
-    _ = test_op(
-        grad_autotune_copy,
-        proj_matrix_autotune_copy,
-        exp_avg_autotune_copy,
-        exp_avg2_autotune_copy,
-        params_autotune_copy,
-        store=False,
-        allow_tf32=allow_tf32,
-    )
-
-    # Accuracy run
-    test_out = test_op(
-        grad_test_copy,
-        proj_matrix_test_copy,
-        exp_avg_test_copy,
-        exp_avg2_test_copy,
-        params_test_copy,
-        store=True,
-        allow_tf32=allow_tf32,
-    )
-    print("Accuracy:")
-
-    output_names = [
-        "adam state - running grad mean",
-        "adam state - running grad var",
-        "params (after update)",
-    ]
-    MAX_DIFF = MAX_DIFF_tf32 if allow_tf32 else MAX_DIFF_no_tf32
-    for name, ref, tt in zip(output_names, ref_out, test_out):
-        max_diff = (ref - tt).abs().max()
-        print(f"-> {name}:\n  Max err: {max_diff:.6f}")
-        assert max_diff < MAX_DIFF
-
-
-KERNELS = ["hybrid"]  #  "fused"]
-DTYPES = [torch.float32]  # torch.float16
-ROW_DIMS = [4096]
-COL_DIMS = [4096]  # , 11008]
-RANKS = [128]
-ALLOW_TF32 = [False]  # , True]
-
-TEST_CONFIGS = list(
-    itertools.product(KERNELS, DTYPES, ROW_DIMS, COL_DIMS, RANKS, ALLOW_TF32)
-)
-
-# TEST_CONFIGS = TEST_CONFIGS[0:1]
-
-
-@pytest.mark.skipif(not torch.cuda.is_available(), reason="requires GPU")
-@pytest.mark.parametrize("kernel, dtype, M, N, rank, allow_tf32", TEST_CONFIGS)
-@skip_if_rocm("ROCm enablement in progress")
-def test_galore_fused_kernels(kernel, dtype, M, N, rank, allow_tf32):
-    torch.backends.cuda.matmul.allow_tf32 = allow_tf32
-
-    exp_avg, exp_avg2, grad, proj_matrix, params = make_data(M, N, rank, dtype)
-    run_test(kernel, exp_avg, exp_avg2, grad, proj_matrix, params, allow_tf32)
diff --git a/test/kernel/test_galore_downproj.py b/test/kernel/test_galore_downproj.py
deleted file mode 100644
index f0e135667e..0000000000
--- a/test/kernel/test_galore_downproj.py
+++ /dev/null
@@ -1,55 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-import pytest
-
-# Skip entire test if triton is not available, otherwise CI failure
-try:
-    import triton  # noqa: F401
-except ImportError:
-    pytest.skip("triton is not installed", allow_module_level=True)
-
-import torch
-from galore_test_utils import make_data
-
-from torchao.prototype.galore.kernels.matmul import set_tuner_top_k as matmul_tuner_topk
-from torchao.prototype.galore.kernels.matmul import triton_mm_launcher
-from torchao.testing.utils import skip_if_rocm
-
-torch.manual_seed(0)
-
-matmul_tuner_topk(10)
-MAX_DIFF_no_tf32 = 1e-4
-MAX_DIFF_tf32 = 1e-2
-
-
-TEST_CONFIGS = [
-    # (4096, 4096, 128, True, False, torch.float32),
-    (4096, 4096, 128, False, False, torch.float32),
-    # (4096, 11008, 128, True, False, torch.float32),
-    (4096, 11008, 128, False, False, torch.float32),
-]
-
-
-@pytest.mark.skipif(not torch.cuda.is_available(), reason="requires GPU")
-@pytest.mark.parametrize("M, N, rank, allow_tf32, fp8_fast_accum, dtype", TEST_CONFIGS)
-@skip_if_rocm("ROCm enablement in progress")
-def test_galore_downproj(M, N, rank, allow_tf32, fp8_fast_accum, dtype):
-    torch.backends.cuda.matmul.allow_tf32 = allow_tf32
-    MAX_DIFF = MAX_DIFF_tf32 if allow_tf32 else MAX_DIFF_no_tf32
-    exp_avg, exp_avg2, grad, galore_proj, params = make_data(M, N, rank, dtype)
-
-    if M >= N:
-        a, b = grad, galore_proj.t()
-    else:
-        a, b = galore_proj.t(), grad
-    low_rank_ref = lambda: a @ b
-    low_rank_tt = lambda: triton_mm_launcher(
-        a, b, allow_tf32=allow_tf32, fp8_fast_accum=fp8_fast_accum
-    )
-    diff = torch.max(torch.abs(low_rank_ref() - low_rank_tt()))
-    if not diff < MAX_DIFF:
-        print("diff: ", torch.max(torch.abs(low_rank_ref() - low_rank_tt())))
-    assert diff < MAX_DIFF
diff --git a/test/quantization/test_galore_quant.py b/test/quantization/test_galore_quant.py
deleted file mode 100644
index cb2902d00f..0000000000
--- a/test/quantization/test_galore_quant.py
+++ /dev/null
@@ -1,116 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-import itertools
-
-import pytest
-
-from torchao.utils import TORCH_VERSION_AT_LEAST_2_7
-
-# Skip entire test if triton is not available, otherwise CI failure
-try:  # noqa: F401
-    import triton  # noqa: F401
-except ImportError:  # noqa: F401
-    pytest.skip("triton is not installed", allow_module_level=True)  # noqa: F401
-import torch
-
-# Skip entire test if CUDA is not available or ROCM is enabled
-if not torch.cuda.is_available() or torch.version.hip is not None:
-    pytest.skip(
-        "CUDA is not available/ ROCM support is under development",
-        allow_module_level=True,
-    )
-
-from bitsandbytes.functional import (
-    create_dynamic_map,
-    dequantize_blockwise,
-    quantize_blockwise,
-)
-
-from torchao.prototype.galore.kernels import (
-    triton_dequant_blockwise,
-    triton_quantize_blockwise,
-)
-from torchao.testing.utils import skip_if_rocm
-
-SEED = 0
-torch.manual_seed(SEED)
-
-DIM1 = [64, 1024, 4096]
-DIM2 = [1024, 2048, 4096]
-SIGNS = [True, False]
-DTYPES = [torch.float32]  # , torch.float16]
-BLOCKSIZE = [2048]
-
-TEST_CONFIGS = list(itertools.product(DIM1, DIM2, DTYPES, SIGNS, BLOCKSIZE))
-
-
-@pytest.mark.skip("skipping for now, see comments below")
-@pytest.mark.skipif(not torch.cuda.is_available(), reason="Need CUDA available")
-@pytest.mark.parametrize(
-    "dim1,dim2,dtype,signed,blocksize",
-    TEST_CONFIGS,
-)
-def test_galore_quantize_blockwise(dim1, dim2, dtype, signed, blocksize):
-    g = torch.randn(dim1, dim2, device="cuda", dtype=dtype) * 0.01
-
-    qmap = create_dynamic_map(signed).to(g.device)
-
-    ref_bnb, qstate = quantize_blockwise(g, code=qmap, blocksize=blocksize)
-    bnb_norm = (g.reshape(-1, blocksize) / qstate.absmax[:, None]).reshape(g.shape)
-
-    tt_q, tt_norm, tt_absmax = triton_quantize_blockwise(
-        g, qmap, group_size=blocksize, return_normalized=True
-    )
-    tt_check = torch.allclose(ref_bnb, tt_q)
-
-    # see notes.md under `prototype.galore.kernels` for an explanation of the following conditions
-    if not tt_check:
-        print(
-            f"Failed quantization check for {dim1} x {dim2}, {dtype}, signed {signed}"
-        )
-        print(f"Absmax: {(qstate.absmax - tt_absmax).abs().max()}")
-        print(f"Norm diff: {(bnb_norm - tt_norm).abs().max()}")
-
-        idx_diff = (ref_bnb != tt_q).to("cuda")
-        print(f"Num code idx diffs: {idx_diff.sum()}")
-        max_idx_diff = (ref_bnb - tt_q).abs().max()
-        print(f"Max code idx diff: {max_idx_diff}")
-
-        # This below checks that the value being quantized falls half-way between two code buckets
-        # where bitsandbytes assigns to one and the triton implementation assigns to the other
-        # Since either bucket is technically valid, we only check that the distance between the value and the
-        # adjacent buckets are the same.  I.e., we don't require that the triton implementation exactly matches
-        # bitsandbytes.
-
-        bnb_code = qmap[ref_bnb[idx_diff].tolist()]
-        tt_code = qmap[tt_q[idx_diff].tolist()]
-        bnb_dist = torch.abs(bnb_code - bnb_norm[idx_diff])
-        torch_dist = torch.abs(tt_code - bnb_norm[idx_diff])
-
-        dist_sum = torch.sum(bnb_dist - torch_dist)
-        print(f"Distance sum: {torch.sum(bnb_dist - torch_dist)}")
-    assert tt_check or (not tt_check and dist_sum < 1e-4)
-
-
-@pytest.mark.parametrize(
-    "dim1,dim2,dtype,signed,blocksize",
-    TEST_CONFIGS,
-)
-@skip_if_rocm("ROCm enablement in progress")
-@pytest.mark.skipif(not torch.cuda.is_available(), reason="Need CUDA available")
-@pytest.mark.skipif(
-    TORCH_VERSION_AT_LEAST_2_7, reason="Failing in CI"
-)  # TODO: fix this
-def test_galore_dequant_blockwise(dim1, dim2, dtype, signed, blocksize):
-    g = torch.randn(dim1, dim2, device="cuda", dtype=dtype) * 0.01
-
-    qmap = create_dynamic_map(signed).to(g.device)
-
-    q, qstate = quantize_blockwise(g, code=qmap, blocksize=blocksize)
-
-    dq_ref = dequantize_blockwise(q, qstate)
-    dq = triton_dequant_blockwise(q, qmap, qstate.absmax, group_size=blocksize)
-    assert torch.allclose(dq, dq_ref)
diff --git a/torchao/prototype/README.md b/torchao/prototype/README.md
index 70f9d87537..257ba4ffb8 100644
--- a/torchao/prototype/README.md
+++ b/torchao/prototype/README.md
@@ -6,9 +6,6 @@
 
 #### Code structure
 
-- `galore` - fused kernels for memory-efficient pre-training / fine-tuning per the [GaLore algorithm](https://arxiv.org/abs/2403.03507)
-  - `galore/kernels` - `triton` kernels that fuse various steps of the `GaLore` algorithm
-  - `galore/docs` - implementation notes and discussion of issues faced in kernel design.
 - [`quant_llm`](quant_llm) - FP16 x Floatx mixed matmul kernel per [FP6-LLM](https://arxiv.org/abs/2401.14112)
 - ~~`low_bit_optim`~~ - re-implementation of 8-bit optimizers from [bitsandbytes](https://github.com/TimDettmers/bitsandbytes) and 4-bit optimizers from [lpmm](https://github.com/thu-ml/low-bit-optimizers). **Promoted to `torchao.optim`.**
 - [`spinquant`](spinquant) - re-implementation of [SpinQuant](https://arxiv.org/abs/2405.16406)
diff --git a/torchao/prototype/galore/README.md b/torchao/prototype/galore/README.md
deleted file mode 100644
index 2a7ae1f7d9..0000000000
--- a/torchao/prototype/galore/README.md
+++ /dev/null
@@ -1,11 +0,0 @@
-## Fused GaLore
-
-### Experimental kernels for fusing various parts of the GaLore algorithm
-
-#### AdamW
-
-See `docs/galore_adam.md` for implementation notes.
-
-#### AdamW8bit
-
-See `docs/galore_adam8bit.md` for implementation notes.
diff --git a/torchao/prototype/galore/docs/README.md b/torchao/prototype/galore/docs/README.md
deleted file mode 100644
index 74b077c4a9..0000000000
--- a/torchao/prototype/galore/docs/README.md
+++ /dev/null
@@ -1,198 +0,0 @@
-## Fused GaLore Adam (WIP)
-
-### Various fused implementations of `Adam` update step per [Gradient Low-Rank Projection](https://arxiv.org/abs/2403.03507)
-
-This is an initial attempt at optimizing the update step of the `GaLore Adam` optimizer.
-
-#### Overview
-
-The `GaLore` `Adam` optimizer introduces additional ops to the traditional `adam` update step.
-
-Specifically:
-
-1.  `grad` is projected to low rank --> additional matmul
-2.  `adam` states are updated with `grad` elementwise (same as `Adam` except in low-rank)
-3.  normalized `grad` is projected to full rank --> additional matmul
-4.  `params` are updated with the normalized full rank grad
-
-#### Implementation
-
-Various fusions were attempted across 2 kernel implementations:
-
-- `Fused`
-  - Steps 1 & 2 are fused: the `adam` state updates are loaded and updated (inplace) during the first `matmul`
-  - Steps 3 & 4 are fused: the param update is folded as an epilogue into the second `matmul`
-- `Hybrid`
-  - Step 1 is performed using standard `torch matmul` (i.e., `cuBlas`)
-  - Step 2 is fused as an elementwise kernel
-  - Steps 3 & 4 per `Fused`
-
-#### Performance
-
-Below are benchmarks for various kernels:
-
-- `torch` - reference `torch` implementation where each of the steps are implemented verbatim per above
-- `hybrid` - see above
-- `fused` - see above
-- `compiled` - `torch` reference implementation compiled using `torch.compile` with `fullgraph=True` and `mode="max-autotune"`.
-
-Configs for each benchmark are the `grad (param)` shape, `dtype` of `grad` and `adam` states, and `allow_tf32`, whether `torch` and `triton` matmuls are allowed to use `TF32` tensor cores (see `Discussion`).
-
-`Grad shape`: `4096x4096`, `dtype`: `torch.float32`, `allow_tf32`: `False`
-
-```
-Median times (ms):
-    rank     torch    hybrid     fused  compiled
-0   32.0  0.560128  0.347136  0.505856  0.534528
-1   64.0  0.627712  0.404480  0.600960  0.615424
-2  128.0  0.825232  0.583168  0.985072  0.833536
-3  256.0  1.378304  1.126400  1.489920  1.375232
-4  512.0  2.286080  2.101760  2.969600  2.302976
-```
-
-`Grad shape`: `4096x4096`, `dtype`: `torch.float32`, `allow_tf32`: `True`
-
-```
-Median times (ms):
-    rank     torch    hybrid     fused  compiled
-0   32.0  0.540672  0.321536  0.316416  0.508928
-1   64.0  0.612240  0.337728  0.345024  0.538624
-2  128.0  0.640000  0.395264  0.393216  0.693248
-3  256.0  0.777216  0.489472  0.548784  1.102848
-4  512.0  1.216512  0.864256  0.960512  1.968128
-```
-
-`Grad shape`: `4096x11008`, `dtype`: `torch.float32`, `allow_tf32`: `False`
-
-```
-Median times (ms):
-    rank     torch    hybrid     fused  compiled
-0   32.0  1.538672  0.915456  0.835584  1.364032
-1   64.0  1.546240  0.940032  1.022976  1.486848
-2  128.0  2.116608  1.498112  1.613312  2.098176
-3  256.0  3.423744  2.719744  2.881536  3.227136
-4  512.0  5.499904  5.036544  5.450752  5.508096
-```
-
-`Grad shape`: `4096x11008`, `dtype`: `torch.float32`, `allow_tf32`: `True`
-
-```
-Median times (ms):
-    rank     torch    hybrid     fused  compiled
-0   32.0  1.413120  0.871424  0.817152  1.353184
-1   64.0  1.489920  0.916480  0.854016  1.389568
-2  128.0  1.679360  0.996352  1.005568  1.563648
-3  256.0  2.152448  1.415168  1.470464  2.185216
-4  512.0  3.210240  2.460672  2.580480  3.477504
-```
-
-##### Accuracy
-
-Comparison to reference `torch` implementation:
-
-```
-Running with 4096 x 4096 grad (param) shape, GaLore orthogonal matrix [128, 4096], dtype torch.float32, and allow_tf32 True
-Kernel: hybrid
-Accuracy:
--> adam state - running grad mean:
-  Max err: 0.000000 Relative err: 0.000001
--> adam state - running grad var:
-  Max err: 0.000002 Relative err: 0.000002
--> params (after update):
-  Max err: 0.000000 Relative err: 0.000001
-```
-
-```
-Running with 4096 x 4096 grad (param) shape, GaLore orthogonal matrix [128, 4096], dtype torch.float32 and allow_tf32 False
-Kernel: hybrid
-Accuracy:
--> adam state - running grad mean:
-  Max err: 0.000000 Relative err: 0.000000
--> adam state - running grad var:
-  Max err: 0.000002 Relative err: 0.000002
--> params (after update):
-  Max err: 0.000000 Relative err: 0.000000
-```
-
-```
-Running with 4096 x 4096 grad (param) shape, GaLore orthogonal matrix [128, 4096], dtype torch.float32 and allow_tf32 True
-Kernel: fused
-Accuracy:
--> adam state - running grad mean:
-  Max err: 0.000845 Relative err: 0.001152
--> adam state - running grad var:
-  Max err: 0.000162 Relative err: 0.000161
--> params (after update):
-  Max err: 0.000000 Relative err: 0.000001
-```
-
-```
-Running with 4096 x 4096 grad (param) shape, GaLore orthogonal matrix [128, 4096], dtype torch.float32 and allow_tf32 False
-Kernel: fused
-Accuracy:
--> adam state - running grad mean:
-Max err: 0.000003 Relative err: 0.000004
--> adam state - running grad var:
-Max err: 0.000002 Relative err: 0.000002
--> params (after update):
-Max err: 0.000000 Relative err: 0.000000
-```
-
-#### Discussion
-
-##### Down Projection GEMM Shape
-
-The motivation for the `hybrid` approach is the unconventional matrix shapes of the down projection (Step 1):
-
-- The projection is always done such that the larger dimension of the `grad` matrix is maintained while other is projected to low rank per the `GaLore` algorithm
-  - E.g., if `M >= N`, the GEMM is of shape (`M x N`) x (`N x rank`) = (`M x rank`), (`rank x M`) x (`M x N`) = (`rank x N`) otherwise
-- Since `{M, N} >> rank` by definition, this results in a large reduction dimension relative to one of the output dimensions (output matrix is either fat or skinny)
-- This does not fit cleanly into the `split-k / parallel reduction` `GEMM` paradigm which is more tailored for shapes where both output dims are smaller than the reduction dimension.
-- Consequently, I had trouble finding an optimal kernel config using `triton` `autotuner` for the down projection step, despite tuning across many compute and io-bound configs (see `fused.triton_utils.kernels.matmul.py`).
-- Benchmarking `triton`-tuned `matmul` against default `torch.matmul` for these shapes showed worse performance, for `torch.float32`
-
-#### Effect of `TF32` tensor cores
-
-`allow_tf32`: this has significant impact on relative performance of `triton` vs `torch` matmuls:
-
-- Quick benchmarks of the downprojection `matmul` show that:
-  - with `allow_tf32=True` for both, triton exhibits `~1.30x` performance improvement over `torch`.
-  - with `allow_tf32=False`, performance of `triton` degrades significantly to `~.50x` of `torch`.
-
-See this [`torch note`](https://pytorch.org/docs/stable/notes/cuda.html#tf32-on-ampere) for more details on this feature.
-
-**Note**: This might be less of a concern given this incoming triton [PR](https://github.com/openai/triton/pull/3234), which implements a fast `TF32` trick that improves both performance and accuracy.
-
-#### Repro
-
-_Accuracy_
-
-- Test accuracy of `torch` vs `hybrid` for `M=4096`, `N=4096`, `rank=128`, and `tf32` switched on:
-
-  ```python
-  pytest test/kernel/test_fused_kernels.py
-  ```
-
-_Benchmark_
-
-- Benchmark across all kernels without `tf32`:
-
-  ```python
-  python benchmarks/bench_galore_fused_kernels.py
-  ```
-
-For additional benchmarking options:
-
-```python
-  python benchmarks/bench_galore_fused_kernels.py --help
-```
-
-#### Test Env
-
-- GPU Device Props:
-  - Name: `NVIDIA RTX A6000`
-  - CC: `86`
-  - Total_memory: `48676MB`
-  - SM count: `84`
-- Torch: `2.2.2`
-- Triton: `2.2.0`
diff --git a/torchao/prototype/galore/docs/galore_adam8bit.md b/torchao/prototype/galore/docs/galore_adam8bit.md
deleted file mode 100644
index ddb45c29b8..0000000000
--- a/torchao/prototype/galore/docs/galore_adam8bit.md
+++ /dev/null
@@ -1,35 +0,0 @@
-## GaLore AdamW8bit Optimizer
-
-### Overview
-
-`GaLore` AdamW8bit optimizer utilizes `bitsandbytes` `AdamW8bit` optimizer to additionally quantize the optimizer states.
-
-In addition to the additional ops introduced by `GaLore` to the standard `Adam` update step (see the `galore_adam.md` for details), additional dequantize / quantize steps are needed:
-
-- one to to dequantize the quantized states for the state update
-- after the states are updated, they need to quantized along and `quant_state` updated
-- For `bitsandbytes` `AdamW8bit`, the `quant_state` consists of group-wise (`blocksize`) scaling factors.
-
-The `bitsandbytes` 8bit optimizer is implemented in CUDA, with handcrafted logic for implementing each of these steps.
-
-> The motivation for re-implementing this optimizer purely in `triton` / `torch` is to enable exploration of various fusion / optimization strategies that would be difficult with the current CUDA impl.
-
-#### Quantization Algorithm
-
-1. Weights are quantized in contiguous `blocksize` segments
-2. Given tensor `M x N`, reshape to `-1 x blocksize`
-3. Find columnwise `absmax` and normalize tensor by dividing by `absmax`
-4. Reshape normalized tensor back to original shape
-5. `bitsandbytes` then uses an `8-bit` [quantization code](https://github.com/TimDettmers/bitsandbytes/blob/76885a41df9e6c94b3f80b1c37374c8441b6933e/bitsandbytes/optim/optimizer.py#L146-L151), which can either be signed or unsigned -- signed for tracking `mean`, unsigned for tracking `var`.
-6. The normalized tensor is then assigned to the code it is closest to:
-   - E.g., given normalized value `.0412` and buckets `.0402` and `.0416`, it will be assigned the latter code.
-7. **IMPORTANT**: This gives rise to a small number of edge-case errors when trying to reproduce `bitsandbytes` quantization
-   - Specifically, if a normalized value falls directly between two codes there is a degree of indeterminism.
-   - E.g., in the previous example, if the normalized value is `.0409`, it would be equidistant to the codes `.0402` and `.0416`.
-   - See the assertions in the `test_galore_quant.py` unittest that checks that these are the only discrepancies arising from the triton implementation (run with `pytest -sv -k` flags to see the output from this test).
-
-### bitsandbytes CUDA Source
-
-- Adam[W]8bit [update step](https://github.com/TimDettmers/bitsandbytes/blob/fd9d072e02b74348004f197e686e168448883a9e/csrc/kernels.cu#L1770)
-- Adam blockwise [quantization](https://github.com/TimDettmers/bitsandbytes/blob/fd9d072e02b74348004f197e686e168448883a9e/csrc/kernels.cu#L413) after update
-- [Blockwise](https://github.com/TimDettmers/bitsandbytes/blob/fd9d072e02b74348004f197e686e168448883a9e/csrc/kernels.cu#L726) [Quantization](https://github.com/TimDettmers/bitsandbytes/blob/fd9d072e02b74348004f197e686e168448883a9e/csrc/kernels.cu#L339) kernel
diff --git a/torchao/prototype/galore/kernels/adam_downproj_fused.py b/torchao/prototype/galore/kernels/adam_downproj_fused.py
deleted file mode 100644
index c45fc5d238..0000000000
--- a/torchao/prototype/galore/kernels/adam_downproj_fused.py
+++ /dev/null
@@ -1,365 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-import logging
-
-import torch
-import triton
-import triton.language as tl
-
-from torchao.prototype.common.triton.matmul_perf_model import (
-    early_config_prune,
-    estimate_matmul_time,
-)
-
-from .adam_step import BETA1, BETA2, EPS
-from .custom_autotune import Config, autotune
-from .matmul import (
-    TRITON_ACC_TYPES,
-    get_higher_dtype,
-    get_mm_heuristics,
-    init_to_zero,
-    to_tl_type,
-)
-from .matmul import get_autotuner as default_mm_autotuner
-
-logger = logging.getLogger(__name__)
-
-AUTOTUNER_TOP_K = 50
-
-
-def set_tuner_top_k(k):
-    global AUTOTUNER_TOP_K
-    AUTOTUNER_TOP_K = k
-
-
-@triton.jit
-def _fused_adam_mm_kernel(
-    # matmul args
-    A,
-    B,
-    C,
-    M,
-    N,
-    K,  #
-    stride_am,
-    stride_ak,  #
-    stride_bk,
-    stride_bn,  #
-    stride_cm,
-    stride_cn,  #
-    # adam epilogue,
-    exp_avg_ptr,  # these will be updated inplace
-    exp_avg2_ptr,
-    store,
-    # grad_ptr,  # low rank grad output -- not needed, C is the output
-    # meta params
-    BLOCK_M: tl.constexpr,
-    BLOCK_N: tl.constexpr,
-    BLOCK_K: tl.constexpr,  #
-    SPLIT_K: tl.constexpr,
-    EVEN_K: tl.constexpr,
-    GROUP_M: tl.constexpr,
-    # Adam-specific params
-    BETA1: tl.constexpr = BETA1,
-    BETA2: tl.constexpr = BETA2,
-    EPS: tl.constexpr = EPS,
-    # matmul kernel settings
-    acc_dtype: tl.constexpr = tl.float32,  #
-    allow_tf32: tl.constexpr = False,  # higher precision for this phase
-    fp8_fast_accum: tl.constexpr = False,  #
-    AB_DTYPE: tl.constexpr = None,  #
-):
-    # matrix multiplication
-    pid = tl.program_id(0)
-    pid_z = tl.program_id(1)
-    grid_m = tl.cdiv(M, BLOCK_M)
-    grid_n = tl.cdiv(N, BLOCK_N)
-    # re-order program ID for better L2 performance
-    width = GROUP_M * grid_n
-    group_id = pid // width
-    group_size = min(grid_m - group_id * GROUP_M, GROUP_M)
-    pid_m = group_id * GROUP_M + (pid % group_size)
-    pid_n = (pid % width) // (group_size)
-    # do matrix multiplication
-    rm = pid_m * BLOCK_M + tl.arange(0, BLOCK_M)
-    rn = pid_n * BLOCK_N + tl.arange(0, BLOCK_N)
-    ram = tl.max_contiguous(tl.multiple_of(rm % M, BLOCK_M), BLOCK_M)
-    rbn = tl.max_contiguous(tl.multiple_of(rn % N, BLOCK_N), BLOCK_N)
-    rk = pid_z * BLOCK_K + tl.arange(0, BLOCK_K)
-    # pointers
-    A = A + (ram[:, None] * stride_am + rk[None, :] * stride_ak)
-    B = B + (rk[:, None] * stride_bk + rbn[None, :] * stride_bn)
-    acc = tl.zeros((BLOCK_M, BLOCK_N), dtype=acc_dtype)
-    for k in range(0, tl.cdiv(K, BLOCK_K * SPLIT_K)):
-        if EVEN_K:
-            a = tl.load(A)
-            b = tl.load(B)
-        else:
-            k_remaining = K - k * (BLOCK_K * SPLIT_K)
-            _0 = tl.zeros((1, 1), dtype=C.dtype.element_ty)
-            a = tl.load(A, mask=rk[None, :] < k_remaining, other=_0)
-            b = tl.load(B, mask=rk[:, None] < k_remaining, other=_0)
-        if AB_DTYPE is not None:
-            a = a.to(AB_DTYPE)
-            b = b.to(AB_DTYPE)
-        if fp8_fast_accum:
-            acc = tl.dot(a, b, acc, out_dtype=acc_dtype, allow_tf32=allow_tf32)
-        else:
-            acc += tl.dot(a, b, out_dtype=acc_dtype, allow_tf32=allow_tf32)
-        A += BLOCK_K * SPLIT_K * stride_ak
-        B += BLOCK_K * SPLIT_K * stride_bk
-    # acc = acc.to(C.dtype.element_ty)
-
-    # rematerialize rm and rn to save registers
-    rm = pid_m * BLOCK_M + tl.arange(0, BLOCK_M)
-    rn = pid_n * BLOCK_N + tl.arange(0, BLOCK_N)
-
-    epilogue_offsets = rm[:, None] * stride_cm + rn[None, :] * stride_cn
-    mask = (rm < M)[:, None] & (rn < N)[None, :]
-
-    # Load adam state
-    exp_avg = tl.load(exp_avg_ptr + epilogue_offsets, mask=mask)
-    exp_avg2 = tl.load(exp_avg2_ptr + epilogue_offsets, mask=mask)
-
-    # Perform update
-    exp_avg = BETA1 * exp_avg.to(acc.dtype) + (1.0 - BETA1) * acc
-    exp_avg2 = BETA2 * exp_avg2.to(acc.dtype) + (1.0 - BETA2) * (acc * acc)
-    denom = tl.sqrt(exp_avg2) + EPS
-    norm_grad = exp_avg / denom
-    # Convert to output type
-    norm_grad = norm_grad.to(C.dtype.element_ty)
-
-    # acc = acc.to(C.dtype.element_ty)
-    C = C + epilogue_offsets
-
-    # handles write-back with reduction-splitting
-    if SPLIT_K == 1:
-        tl.store(C, norm_grad, mask=mask)
-    else:
-        tl.atomic_add(C, norm_grad, mask=mask)
-
-    if store:
-        tl.store(
-            exp_avg_ptr + epilogue_offsets,
-            exp_avg,
-            mask=mask,
-        )
-        tl.store(
-            exp_avg2_ptr + epilogue_offsets,
-            exp_avg2,
-            mask=mask,
-        )
-
-
-def _get_configs_splitk_all():
-    """
-    Configs specific to split-k matmuls
-    Not used currently
-    """
-    configs = []
-    for num_stages in [2, 3, 4, 5]:
-        for block_m in [16, 32, 64, 128]:
-            for block_k in [16, 32, 64, 128, 256]:
-                for block_n in [16, 32, 64, 128]:
-                    num_warps = 2 if block_n <= 64 else 4
-                    configs.append(
-                        Config(
-                            {
-                                "BLOCK_M": block_m,
-                                "BLOCK_N": block_n,
-                                "BLOCK_K": block_k,
-                                "SPLIT_K": 1,
-                            },
-                            num_stages=num_stages,
-                            num_warps=num_warps,
-                        )
-                    )
-                    # split_k
-                    for split_k in [2, 4, 8]:
-                        configs.append(
-                            Config(
-                                {
-                                    "BLOCK_M": block_m,
-                                    "BLOCK_N": block_n,
-                                    "BLOCK_K": block_k,
-                                    "SPLIT_K": split_k,
-                                },
-                                num_stages=num_stages,
-                                num_warps=num_warps,
-                                pre_hook=init_to_zero("C"),
-                            )
-                        )
-    return configs
-
-
-def _get_configs_splitk_small():
-    """Configs for split-k, smaller version than above
-    Not used currently
-    """
-    configs = []
-    for num_stages in [2, 3, 4]:
-        for block_m in [64, 128]:
-            for block_k in [16, 32, 64]:
-                for block_n in [64, 128]:
-                    num_warps = 2 if block_n <= 64 else 4
-                    configs.append(
-                        Config(
-                            {
-                                "BLOCK_M": block_m,
-                                "BLOCK_N": block_n,
-                                "BLOCK_K": block_k,
-                                "SPLIT_K": 1,
-                            },
-                            num_stages=num_stages,
-                            num_warps=num_warps,
-                        )
-                    )
-                    # split_k
-                    for split_k in [2, 4, 8]:
-                        configs.append(
-                            Config(
-                                {
-                                    "BLOCK_M": block_m,
-                                    "BLOCK_N": block_n,
-                                    "BLOCK_K": block_k,
-                                    "SPLIT_K": split_k,
-                                },
-                                num_stages=num_stages,
-                                num_warps=num_warps,
-                                pre_hook=init_to_zero("C"),
-                            )
-                        )
-    return configs
-
-
-def _splitk_autotuner(
-    configs=_get_configs_splitk_small(),
-    key=["M", "N", "K"],
-    early_config_prune=early_config_prune,
-    perf_model=estimate_matmul_time,
-    top_k=AUTOTUNER_TOP_K,
-):
-    """Autotuner for splitk matmuls
-    Not used currently
-    """
-    autotuner = autotune(
-        configs=configs,
-        key=key,
-        prune_configs_by={
-            "early_config_prune": early_config_prune,
-            "perf_model": perf_model,
-            "top_k": top_k,
-        },
-    )
-
-    return autotuner
-
-
-def _get_kernel(
-    tuner_fn=default_mm_autotuner, heuristics_fn=get_mm_heuristics, topk=AUTOTUNER_TOP_K
-):
-    tuner = tuner_fn()
-    tuner.topk = topk
-    heuristics = heuristics_fn()
-    return tuner(heuristics(_fused_adam_mm_kernel))
-
-
-DEFAULT_KERNEL = _get_kernel()
-
-
-def fused_adam_mm_launcher(
-    a,
-    b,
-    *,
-    exp_avg,
-    exp_avg2,
-    store=True,
-    BETA1=BETA1,
-    BETA2=BETA2,
-    EPS=EPS,
-    allow_tf32=False,
-    fp8_fast_accum=False,
-    acc_dtype=None,
-    output_dtype=None,
-    kernel=None,
-):
-    device = a.device
-    # handle non-contiguous inputs if necessary
-    # a = grad
-    # b = galore_proj.ortho_matrix.t()
-    if a.stride(0) > 1 and a.stride(1) > 1:
-        a = a.contiguous()
-    if b.stride(0) > 1 and b.stride(1) > 1:
-        b = b.contiguous()
-    # checks constraints
-    assert a.shape[1] == b.shape[0], "incompatible dimensions"
-    M, K = a.shape
-    _, N = b.shape
-
-    # common type between a and b
-    ab_dtype = get_higher_dtype(a.dtype, b.dtype)
-
-    # allocates output
-    if output_dtype is None:
-        output_dtype = ab_dtype
-
-    c = torch.empty((M, N), device=device, dtype=output_dtype)
-
-    if acc_dtype is None:
-        acc_dtype = [ab_dtype][0]
-    else:
-        assert isinstance(acc_dtype, torch.dtype), "acc_dtype must be a torch.dtype"
-        assert acc_dtype in TRITON_ACC_TYPES[a.dtype], (
-            "acc_dtype not compatible with the type of a"
-        )
-        assert acc_dtype in TRITON_ACC_TYPES[b.dtype], (
-            "acc_dtype not compatible with the type of b"
-        )
-
-    acc_dtype = to_tl_type(acc_dtype)
-    ab_dtype = to_tl_type(ab_dtype)
-    output_dtype = to_tl_type(output_dtype)
-
-    # Tensor cores support input with mixed float8 types.
-    if a.dtype in [tl.float8e4nv, tl.float8e5] and b.dtype in [
-        tl.float8e4nv,
-        tl.float8e5,
-    ]:
-        ab_dtype = None
-
-    grid = lambda META: (
-        triton.cdiv(M, META["BLOCK_M"]) * triton.cdiv(N, META["BLOCK_N"]),
-        META["SPLIT_K"],
-    )
-
-    if kernel is None:
-        kernel = DEFAULT_KERNEL
-    kernel[grid](
-        a,
-        b,
-        c,
-        M,
-        N,
-        K,  #
-        a.stride(0),
-        a.stride(1),  #
-        b.stride(0),
-        b.stride(1),  #
-        c.stride(0),
-        c.stride(1),  #
-        exp_avg,
-        exp_avg2,
-        store=store,
-        BETA1=BETA1,  # ,  #
-        BETA2=BETA2,  # ,  #
-        EPS=EPS,  #
-        acc_dtype=acc_dtype,  #
-        allow_tf32=allow_tf32,  #
-        fp8_fast_accum=fp8_fast_accum,  #
-        GROUP_M=8,
-        AB_DTYPE=ab_dtype,
-    )
-    return exp_avg, exp_avg2, c  # c -> normalized low rank grad
diff --git a/torchao/prototype/galore/kernels/matmul.py b/torchao/prototype/galore/kernels/matmul.py
deleted file mode 100644
index 0a7c830f02..0000000000
--- a/torchao/prototype/galore/kernels/matmul.py
+++ /dev/null
@@ -1,417 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-import torch
-import triton
-import triton.language as tl
-
-from torchao.prototype.common.triton.matmul_perf_model import (
-    early_config_prune,
-    estimate_matmul_time,
-)
-
-from .custom_autotune import Config, autotune, heuristics
-
-# Allowed types for acc_type given the types of a and b.
-TRITON_ACC_TYPES = {
-    torch.float16: (torch.float32, torch.float16),
-    torch.bfloat16: (torch.float32, torch.bfloat16),
-    torch.float32: (torch.float32,),
-    torch.int8: (torch.int32,),
-}
-
-AUTOTUNER_TOP_K = 50
-_ordered_datatypes = [torch.int8, torch.float16, torch.bfloat16, torch.float32]
-
-
-def upcast_if_fp8(a):
-    if "fp8" in str(a):
-        return torch.float16
-    return a
-
-
-def get_higher_dtype(a, b):
-    a = upcast_if_fp8(a)
-    b = upcast_if_fp8(b)
-    if a is b:
-        return a
-
-    assert a in _ordered_datatypes
-    assert b in _ordered_datatypes
-
-    for d in _ordered_datatypes:
-        if a is d:
-            return b
-        if b is d:
-            return a
-
-
-def init_to_zero(name):
-    return lambda nargs: nargs[name].zero_()
-
-
-def set_tuner_top_k(k):
-    global AUTOTUNER_TOP_K
-    AUTOTUNER_TOP_K = k
-
-
-def to_tl_type(ty):
-    return getattr(tl, str(ty).split(".")[-1])
-
-
-def get_configs_io_bound():
-    configs = []
-    for num_stages in [2, 3, 4, 5, 6]:
-        for block_m in [16, 32]:
-            for block_k in [32, 64]:
-                for block_n in [32, 64, 128, 256]:
-                    num_warps = 2 if block_n <= 64 else 4
-                    configs.append(
-                        Config(
-                            {
-                                "BLOCK_M": block_m,
-                                "BLOCK_N": block_n,
-                                "BLOCK_K": block_k,
-                                "SPLIT_K": 1,
-                            },
-                            num_stages=num_stages,
-                            num_warps=num_warps,
-                        )
-                    )
-                    # split_k
-                    for split_k in [2, 4, 8, 16]:
-                        configs.append(
-                            Config(
-                                {
-                                    "BLOCK_M": block_m,
-                                    "BLOCK_N": block_n,
-                                    "BLOCK_K": block_k,
-                                    "SPLIT_K": split_k,
-                                },
-                                num_stages=num_stages,
-                                num_warps=num_warps,
-                                pre_hook=init_to_zero("C"),
-                            )
-                        )
-    return configs
-
-
-def get_configs_compute_bound():
-    configs = [
-        # basic configs for compute-bound matmuls
-        Config(
-            {"BLOCK_M": 128, "BLOCK_N": 256, "BLOCK_K": 32, "SPLIT_K": 1},
-            num_stages=3,
-            num_warps=8,
-        ),
-        Config(
-            {"BLOCK_M": 256, "BLOCK_N": 128, "BLOCK_K": 32, "SPLIT_K": 1},
-            num_stages=3,
-            num_warps=8,
-        ),
-        Config(
-            {"BLOCK_M": 256, "BLOCK_N": 64, "BLOCK_K": 32, "SPLIT_K": 1},
-            num_stages=4,
-            num_warps=4,
-        ),
-        Config(
-            {"BLOCK_M": 64, "BLOCK_N": 256, "BLOCK_K": 32, "SPLIT_K": 1},
-            num_stages=4,
-            num_warps=4,
-        ),
-        Config(
-            {"BLOCK_M": 128, "BLOCK_N": 128, "BLOCK_K": 32, "SPLIT_K": 1},
-            num_stages=4,
-            num_warps=4,
-        ),
-        Config(
-            {"BLOCK_M": 128, "BLOCK_N": 64, "BLOCK_K": 32, "SPLIT_K": 1},
-            num_stages=4,
-            num_warps=4,
-        ),
-        Config(
-            {"BLOCK_M": 64, "BLOCK_N": 128, "BLOCK_K": 32, "SPLIT_K": 1},
-            num_stages=4,
-            num_warps=4,
-        ),
-        Config(
-            {"BLOCK_M": 128, "BLOCK_N": 32, "BLOCK_K": 32, "SPLIT_K": 1},
-            num_stages=4,
-            num_warps=4,
-        ),
-        Config(
-            {"BLOCK_M": 64, "BLOCK_N": 32, "BLOCK_K": 32, "SPLIT_K": 1},
-            num_stages=5,
-            num_warps=2,
-        ),
-        # good for int8
-        Config(
-            {"BLOCK_M": 128, "BLOCK_N": 256, "BLOCK_K": 128, "SPLIT_K": 1},
-            num_stages=3,
-            num_warps=8,
-        ),
-        Config(
-            {"BLOCK_M": 256, "BLOCK_N": 128, "BLOCK_K": 128, "SPLIT_K": 1},
-            num_stages=3,
-            num_warps=8,
-        ),
-        Config(
-            {"BLOCK_M": 256, "BLOCK_N": 64, "BLOCK_K": 128, "SPLIT_K": 1},
-            num_stages=4,
-            num_warps=4,
-        ),
-        Config(
-            {"BLOCK_M": 64, "BLOCK_N": 256, "BLOCK_K": 128, "SPLIT_K": 1},
-            num_stages=4,
-            num_warps=4,
-        ),
-        Config(
-            {"BLOCK_M": 128, "BLOCK_N": 128, "BLOCK_K": 128, "SPLIT_K": 1},
-            num_stages=4,
-            num_warps=4,
-        ),
-        Config(
-            {"BLOCK_M": 128, "BLOCK_N": 64, "BLOCK_K": 64, "SPLIT_K": 1},
-            num_stages=4,
-            num_warps=4,
-        ),
-        Config(
-            {"BLOCK_M": 64, "BLOCK_N": 128, "BLOCK_K": 64, "SPLIT_K": 1},
-            num_stages=4,
-            num_warps=4,
-        ),
-        Config(
-            {"BLOCK_M": 128, "BLOCK_N": 32, "BLOCK_K": 64, "SPLIT_K": 1},
-            num_stages=4,
-            num_warps=4,
-        ),
-        Config(
-            {"BLOCK_M": 64, "BLOCK_N": 32, "BLOCK_K": 64, "SPLIT_K": 1},
-            num_stages=5,
-            num_warps=2,
-        ),
-    ]
-    return configs
-
-
-def get_autotuner(
-    configs=get_configs_compute_bound() + get_configs_io_bound(),
-    key=["M", "N", "K"],
-    early_config_prune=early_config_prune,
-    perf_model=estimate_matmul_time,
-    top_k=AUTOTUNER_TOP_K,
-):
-    autotuner = autotune(
-        configs=configs,
-        key=key,
-        prune_configs_by={
-            "early_config_prune": early_config_prune,
-            "perf_model": perf_model,
-            "top_k": top_k,
-        },
-    )
-
-    return autotuner
-
-
-def get_mm_heuristics():
-    return heuristics(
-        {
-            "EVEN_K": lambda args: args["K"] % (args["BLOCK_K"] * args["SPLIT_K"]) == 0,
-        }
-    )
-
-
-@triton.jit
-def _matmul_kernel(
-    A,
-    B,
-    C,
-    M,
-    N,
-    K,  #
-    stride_am,
-    stride_ak,  #
-    stride_bk,
-    stride_bn,  #
-    stride_cm,
-    stride_cn,  #
-    # meta params
-    BLOCK_M: tl.constexpr,
-    BLOCK_N: tl.constexpr,
-    BLOCK_K: tl.constexpr,  #
-    SPLIT_K: tl.constexpr,
-    EVEN_K: tl.constexpr,
-    GROUP_M: tl.constexpr,
-    # epilogue
-    epilogue_alpha=None,
-    epilogue_beta=None,
-    epilogue_source=None,  # Corresponds to C in GEMM convention of D = AB + C
-    # matmul kernel settings
-    acc_dtype: tl.constexpr = tl.float32,  #
-    allow_tf32: tl.constexpr = True,  #
-    fp8_fast_accum: tl.constexpr = True,  #
-    AB_DTYPE: tl.constexpr = None,  #
-    EPILOGUE: tl.constexpr = False,
-):
-    # matrix multiplication
-    pid = tl.program_id(0)
-    pid_z = tl.program_id(1)
-    grid_m = tl.cdiv(M, BLOCK_M)
-    grid_n = tl.cdiv(N, BLOCK_N)
-    # re-order program ID for better L2 performance
-    width = GROUP_M * grid_n
-    group_id = pid // width
-    group_size = min(grid_m - group_id * GROUP_M, GROUP_M)
-    pid_m = group_id * GROUP_M + (pid % group_size)
-    pid_n = (pid % width) // (group_size)
-    # do matrix multiplication
-    rm = pid_m * BLOCK_M + tl.arange(0, BLOCK_M)
-    rn = pid_n * BLOCK_N + tl.arange(0, BLOCK_N)
-    ram = tl.max_contiguous(tl.multiple_of(rm % M, BLOCK_M), BLOCK_M)
-    rbn = tl.max_contiguous(tl.multiple_of(rn % N, BLOCK_N), BLOCK_N)
-    rk = pid_z * BLOCK_K + tl.arange(0, BLOCK_K)
-    # pointers
-    A = A + (ram[:, None] * stride_am + rk[None, :] * stride_ak)
-    B = B + (rk[:, None] * stride_bk + rbn[None, :] * stride_bn)
-    acc = tl.zeros((BLOCK_M, BLOCK_N), dtype=acc_dtype)
-    for k in range(0, tl.cdiv(K, BLOCK_K * SPLIT_K)):
-        if EVEN_K:
-            a = tl.load(A)
-            b = tl.load(B)
-        else:
-            k_remaining = K - k * (BLOCK_K * SPLIT_K)
-            _0 = tl.zeros((1, 1), dtype=C.dtype.element_ty)
-            a = tl.load(A, mask=rk[None, :] < k_remaining, other=_0)
-            b = tl.load(B, mask=rk[:, None] < k_remaining, other=_0)
-        if AB_DTYPE is not None:
-            a = a.to(AB_DTYPE)
-            b = b.to(AB_DTYPE)
-        if fp8_fast_accum:
-            acc = tl.dot(a, b, acc, out_dtype=acc_dtype, allow_tf32=allow_tf32)
-        else:
-            acc += tl.dot(a, b, out_dtype=acc_dtype, allow_tf32=allow_tf32)
-        A += BLOCK_K * SPLIT_K * stride_ak
-        B += BLOCK_K * SPLIT_K * stride_bk
-    # acc = acc.to(C.dtype.element_ty)
-
-    # rematerialize rm and rn to save registers
-    rm = pid_m * BLOCK_M + tl.arange(0, BLOCK_M)
-    rn = pid_n * BLOCK_N + tl.arange(0, BLOCK_N)
-
-    if EPILOGUE:
-        if epilogue_alpha is not None:
-            acc = epilogue_alpha.to(acc_dtype) * acc
-        if epilogue_source is not None:
-            epilogue_src = tl.load(
-                epilogue_source + rm[:, None] * stride_cm + rn[None, :] * stride_cn
-            )
-            if epilogue_beta is not None:
-                epilogue_src = epilogue_src.to(acc_dtype) * epilogue_beta.to(acc_dtype)
-            acc = acc + epilogue_src
-
-    acc = acc.to(C.dtype.element_ty)
-    C = C + (rm[:, None] * stride_cm + rn[None, :] * stride_cn)
-    mask = (rm < M)[:, None] & (rn < N)[None, :]
-    # handles write-back with reduction-splitting
-    if SPLIT_K == 1:
-        tl.store(C, acc, mask=mask)
-    else:
-        tl.atomic_add(C, acc, mask=mask)
-
-
-_autotuner = get_autotuner()
-_heuristics = get_mm_heuristics()
-matmul = _autotuner(_heuristics(_matmul_kernel))
-
-
-def triton_mm_launcher(
-    a,
-    b,
-    epilogue_alpha=None,
-    epilogue_beta=None,
-    epilogue_source=None,
-    allow_tf32=True,
-    fp8_fast_accum=True,
-    acc_dtype=None,
-    output_dtype=None,
-    kernel=matmul,
-):
-    device = a.device
-    # handle non-contiguous inputs if necessary
-    # a = grad
-    # b = galore_proj.ortho_matrix.t()
-    if a.stride(0) > 1 and a.stride(1) > 1:
-        a = a.contiguous()
-    if b.stride(0) > 1 and b.stride(1) > 1:
-        b = b.contiguous()
-    # checks constraints
-    assert a.shape[1] == b.shape[0], "incompatible dimensions"
-    M, K = a.shape
-    _, N = b.shape
-
-    # common type between a and b
-    ab_dtype = get_higher_dtype(a.dtype, b.dtype)
-
-    # allocates output
-    if output_dtype is None:
-        output_dtype = ab_dtype
-
-    c = torch.empty((M, N), device=device, dtype=output_dtype)
-
-    if acc_dtype is None:
-        acc_dtype = [ab_dtype][0]
-    else:
-        assert isinstance(acc_dtype, torch.dtype), "acc_dtype must be a torch.dtype"
-        assert acc_dtype in TRITON_ACC_TYPES[a.dtype], (
-            "acc_dtype not compatible with the type of a"
-        )
-        assert acc_dtype in TRITON_ACC_TYPES[b.dtype], (
-            "acc_dtype not compatible with the type of b"
-        )
-
-    acc_dtype = to_tl_type(acc_dtype)
-    ab_dtype = to_tl_type(ab_dtype)
-    output_dtype = to_tl_type(output_dtype)
-
-    # Tensor cores support input with mixed float8 types.
-    if a.dtype in [tl.float8e4nv, tl.float8e5] and b.dtype in [
-        tl.float8e4nv,
-        tl.float8e5,
-    ]:
-        ab_dtype = None
-    # launch kernel
-    # print(
-    #     f"{__file__} triton matmul args: (AB dtype {ab_dtype}) (C dtype {c.dtype}) (allow_tf32 {allow_tf32}) (fp8_fast_accum {fp8_fast_accum})"
-    # )
-    grid = lambda META: (
-        triton.cdiv(M, META["BLOCK_M"]) * triton.cdiv(N, META["BLOCK_N"]),
-        META["SPLIT_K"],
-    )
-
-    matmul[grid](
-        a,
-        b,
-        c,
-        M,
-        N,
-        K,  #
-        a.stride(0),
-        a.stride(1),  #
-        b.stride(0),
-        b.stride(1),  #
-        c.stride(0),
-        c.stride(1),  #
-        epilogue_alpha=epilogue_alpha,  #
-        epilogue_beta=epilogue_beta,  #
-        epilogue_source=epilogue_source,  #
-        acc_dtype=acc_dtype,  #
-        allow_tf32=allow_tf32,  #
-        fp8_fast_accum=fp8_fast_accum,  #
-        GROUP_M=8,
-        AB_DTYPE=ab_dtype,
-        EPILOGUE=any([epilogue_alpha, epilogue_beta, epilogue_source]),
-    )
-    return c
diff --git a/torchao/prototype/galore/optim/galore_torch.py b/torchao/prototype/galore/optim/galore_torch.py
deleted file mode 100644
index 876c40292d..0000000000
--- a/torchao/prototype/galore/optim/galore_torch.py
+++ /dev/null
@@ -1,401 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-"""Reference implementations
-See https://github.com/jiaweizzhao/GaLore/tree/master/galore_torch
-"""
-
-# copy dependencies from transformers/optimization.py
-import math
-import warnings
-from typing import Callable, Iterable, Tuple
-
-import torch
-from bitsandbytes.optim.optimizer import Optimizer2State
-from torch import nn
-from torch.optim import Optimizer
-
-
-class GaLoreProjector:
-    def __init__(
-        self, rank, verbose=False, update_proj_gap=200, scale=1.0, proj_type="std"
-    ):
-        self.rank = rank
-        self.verbose = verbose
-        self.update_proj_gap = update_proj_gap
-        self.scale = scale
-        self.ortho_matrix = None
-        self.proj_type = proj_type
-
-    def project(self, full_rank_grad, iter):
-        if self.proj_type == "std":
-            if full_rank_grad.shape[0] >= full_rank_grad.shape[1]:
-                if self.ortho_matrix is None or iter % self.update_proj_gap == 0:
-                    self.ortho_matrix = self.get_orthogonal_matrix(
-                        full_rank_grad, self.rank, type="right"
-                    )
-                low_rank_grad = torch.matmul(full_rank_grad, self.ortho_matrix.t())
-            else:
-                if self.ortho_matrix is None or iter % self.update_proj_gap == 0:
-                    self.ortho_matrix = self.get_orthogonal_matrix(
-                        full_rank_grad, self.rank, type="left"
-                    )
-                low_rank_grad = torch.matmul(self.ortho_matrix.t(), full_rank_grad)
-        elif self.proj_type == "reverse_std":
-            if full_rank_grad.shape[0] >= full_rank_grad.shape[1]:
-                if self.ortho_matrix is None or iter % self.update_proj_gap == 0:
-                    self.ortho_matrix = self.get_orthogonal_matrix(
-                        full_rank_grad, self.rank, type="left"
-                    )
-                low_rank_grad = torch.matmul(self.ortho_matrix.t(), full_rank_grad)
-            else:
-                if self.ortho_matrix is None or iter % self.update_proj_gap == 0:
-                    self.ortho_matrix = self.get_orthogonal_matrix(
-                        full_rank_grad, self.rank, type="right"
-                    )
-                low_rank_grad = torch.matmul(full_rank_grad, self.ortho_matrix.t())
-        elif self.proj_type == "right":
-            if self.ortho_matrix is None or iter % self.update_proj_gap == 0:
-                self.ortho_matrix = self.get_orthogonal_matrix(
-                    full_rank_grad, self.rank, type="right"
-                )
-            low_rank_grad = torch.matmul(full_rank_grad, self.ortho_matrix.t())
-        elif self.proj_type == "left":
-            if self.ortho_matrix is None or iter % self.update_proj_gap == 0:
-                self.ortho_matrix = self.get_orthogonal_matrix(
-                    full_rank_grad, self.rank, type="left"
-                )
-            low_rank_grad = torch.matmul(self.ortho_matrix.t(), full_rank_grad)
-        elif self.proj_type == "full":
-            if self.ortho_matrix is None or iter % self.update_proj_gap == 0:
-                self.ortho_matrix = self.get_orthogonal_matrix(
-                    full_rank_grad, self.rank, type="full"
-                )
-            low_rank_grad = (
-                torch.matmul(self.ortho_matrix[0].t(), full_rank_grad)
-                @ self.ortho_matrix[1].t()
-            )
-
-        return low_rank_grad
-
-    def project_back(self, low_rank_grad):
-        if self.proj_type == "std":
-            if low_rank_grad.shape[0] >= low_rank_grad.shape[1]:
-                full_rank_grad = torch.matmul(low_rank_grad, self.ortho_matrix)
-            else:
-                full_rank_grad = torch.matmul(self.ortho_matrix, low_rank_grad)
-        elif self.proj_type == "reverse_std":
-            if (
-                low_rank_grad.shape[0] <= low_rank_grad.shape[1]
-            ):  # note this is different from std
-                full_rank_grad = torch.matmul(self.ortho_matrix, low_rank_grad)
-            else:
-                full_rank_grad = torch.matmul(low_rank_grad, self.ortho_matrix)
-        elif self.proj_type == "right":
-            full_rank_grad = torch.matmul(low_rank_grad, self.ortho_matrix)
-        elif self.proj_type == "left":
-            full_rank_grad = torch.matmul(self.ortho_matrix, low_rank_grad)
-        elif self.proj_type == "full":
-            full_rank_grad = (
-                torch.matmul(self.ortho_matrix[0], low_rank_grad) @ self.ortho_matrix[1]
-            )
-
-        return full_rank_grad * self.scale
-
-    # svd decomposition
-    def get_orthogonal_matrix(self, weights, rank, type):
-        module_params = weights
-
-        if module_params.data.dtype != torch.float:
-            float_data = False
-            original_type = module_params.data.dtype
-            original_device = module_params.data.device
-            matrix = module_params.data.float()
-        else:
-            float_data = True
-            matrix = module_params.data
-
-        U, s, Vh = torch.linalg.svd(matrix, full_matrices=False)
-
-        # make the smaller matrix always to be orthogonal matrix
-        if type == "right":
-            # A = U[:, :rank] @ torch.diag(s[:rank])
-            B = Vh[:rank, :]
-
-            if not float_data:
-                B = B.to(original_device).type(original_type)
-            return B
-        elif type == "left":
-            A = U[:, :rank]
-            # B = torch.diag(s[:rank]) @ Vh[:rank, :]
-            if not float_data:
-                A = A.to(original_device).type(original_type)
-            return A
-        elif type == "full":
-            A = U[:, :rank]
-            B = Vh[:rank, :]
-            if not float_data:
-                A = A.to(original_device).type(original_type)
-                B = B.to(original_device).type(original_type)
-            return [A, B]
-        else:
-            raise ValueError("type should be left, right or full")
-
-
-class AdamW(Optimizer):
-    """
-    Implements Adam algorithm with weight decay fix as introduced in [Decoupled Weight Decay
-    Regularization](https://arxiv.org/abs/1711.05101).
-
-    Parameters:
-        params (`Iterable[nn.parameter.Parameter]`):
-            Iterable of parameters to optimize or dictionaries defining parameter groups.
-        lr (`float`, *optional*, defaults to 0.001):
-            The learning rate to use.
-        betas (`Tuple[float,float]`, *optional*, defaults to `(0.9, 0.999)`):
-            Adam's betas parameters (b1, b2).
-        eps (`float`, *optional*, defaults to 1e-06):
-            Adam's epsilon for numerical stability.
-        weight_decay (`float`, *optional*, defaults to 0.0):
-            Decoupled weight decay to apply.
-        correct_bias (`bool`, *optional*, defaults to `True`):
-            Whether or not to correct bias in Adam (for instance, in Bert TF repository they use `False`).
-        no_deprecation_warning (`bool`, *optional*, defaults to `False`):
-            A flag used to disable the deprecation warning (set to `True` to disable the warning).
-    """
-
-    def __init__(
-        self,
-        params: Iterable[nn.parameter.Parameter],
-        lr: float = 1e-3,
-        betas: Tuple[float, float] = (0.9, 0.999),
-        eps: float = 1e-6,
-        weight_decay: float = 0.0,
-        correct_bias: bool = True,
-        no_deprecation_warning: bool = False,
-    ):
-        if not no_deprecation_warning:
-            warnings.warn(
-                "This implementation of AdamW is deprecated and will be removed in a future version. Use the PyTorch"
-                " implementation torch.optim.AdamW instead, or set `no_deprecation_warning=True` to disable this"
-                " warning",
-                FutureWarning,
-            )
-        if lr < 0.0:
-            raise ValueError(f"Invalid learning rate: {lr} - should be >= 0.0")
-        if not 0.0 <= betas[0] < 1.0:
-            raise ValueError(
-                f"Invalid beta parameter: {betas[0]} - should be in [0.0, 1.0)"
-            )
-        if not 0.0 <= betas[1] < 1.0:
-            raise ValueError(
-                f"Invalid beta parameter: {betas[1]} - should be in [0.0, 1.0)"
-            )
-        if not 0.0 <= eps:
-            raise ValueError(f"Invalid epsilon value: {eps} - should be >= 0.0")
-        defaults = {
-            "lr": lr,
-            "betas": betas,
-            "eps": eps,
-            "weight_decay": weight_decay,
-            "correct_bias": correct_bias,
-        }
-        super().__init__(params, defaults)
-
-    @torch.no_grad()
-    def step(self, closure: Callable = None):
-        """
-        Performs a single optimization step.
-
-        Arguments:
-            closure (`Callable`, *optional*): A closure that reevaluates the model and returns the loss.
-        """
-        loss = None
-        if closure is not None:
-            loss = closure()
-
-        for group in self.param_groups:
-            for p in group["params"]:
-                if p.grad is None:
-                    continue
-                grad = p.grad
-                if grad.is_sparse:
-                    raise RuntimeError(
-                        "Adam does not support sparse gradients, please consider SparseAdam instead"
-                    )
-
-                state = self.state[p]
-
-                if "step" not in state:
-                    state["step"] = 0
-
-                # GaLore Projection
-                if "rank" in group:
-                    if "projector" not in state:
-                        state["projector"] = GaLoreProjector(
-                            group["rank"],
-                            update_proj_gap=group["update_proj_gap"],
-                            scale=group["scale"],
-                            proj_type=group["proj_type"],
-                        )
-
-                    grad = state["projector"].project(grad, state["step"])
-
-                # State initialization
-                if "exp_avg" not in state:
-                    # Exponential moving average of gradient values
-                    state["exp_avg"] = torch.zeros_like(grad)
-                    # Exponential moving average of squared gradient values
-                    state["exp_avg_sq"] = torch.zeros_like(grad)
-
-                exp_avg, exp_avg_sq = state["exp_avg"], state["exp_avg_sq"]
-                beta1, beta2 = group["betas"]
-
-                state["step"] += 1
-
-                # Decay the first and second moment running average coefficient
-                # In-place operations to update the averages at the same time
-                exp_avg.mul_(beta1).add_(grad, alpha=(1.0 - beta1))
-                exp_avg_sq.mul_(beta2).addcmul_(grad, grad, value=1.0 - beta2)
-                denom = exp_avg_sq.sqrt().add_(group["eps"])
-
-                step_size = group["lr"]
-                if group["correct_bias"]:  # No bias correction for Bert
-                    bias_correction1 = 1.0 - beta1 ** state["step"]
-                    bias_correction2 = 1.0 - beta2 ** state["step"]
-                    step_size = (
-                        step_size * math.sqrt(bias_correction2) / bias_correction1
-                    )
-
-                # compute norm gradient
-                norm_grad = exp_avg / denom
-
-                # GaLore Projection Back
-                if "rank" in group:
-                    norm_grad = state["projector"].project_back(norm_grad)
-
-                p.add_(norm_grad, alpha=-step_size)
-
-                # Just adding the square of the weights to the loss function is *not*
-                # the correct way of using L2 regularization/weight decay with Adam,
-                # since that will interact with the m and v parameters in strange ways.
-                #
-                # Instead we want to decay the weights in a manner that doesn't interact
-                # with the m/v parameters. This is equivalent to adding the square
-                # of the weights to the loss with plain (non-momentum) SGD.
-                # Add weight decay at the end (fixed version)
-                if group["weight_decay"] > 0.0:
-                    p.add_(p, alpha=(-group["lr"] * group["weight_decay"]))
-
-        return loss
-
-
-class AdamW8bit(Optimizer2State):
-    def __init__(
-        self,
-        params,
-        lr=1e-3,
-        betas=(0.9, 0.999),
-        eps=1e-8,
-        weight_decay=1e-2,
-        amsgrad=False,
-        optim_bits=32,
-        args=None,
-        min_8bit_size=4096,
-        percentile_clipping=100,
-        block_wise=True,
-        is_paged=False,
-    ):
-        super().__init__(
-            "adam",
-            params,
-            lr,
-            betas,
-            eps,
-            weight_decay,
-            8,
-            args,
-            min_8bit_size,
-            percentile_clipping,
-            block_wise,
-            is_paged=is_paged,
-        )
-
-    @torch.no_grad()
-    def step(self, closure=None):
-        """Performs a single optimization step.
-
-        Arguments:
-            closure (callable, optional): A closure that reevaluates the model
-                and returns the loss.
-        """
-        loss = None
-        if closure is not None:
-            with torch.enable_grad():
-                loss = closure()
-
-        if not self.initialized:
-            self.check_overrides()
-            self.to_gpu()  # needed for fairseq pure fp16 training
-            self.initialized = True
-
-        # if self.is_paged: self.page_mng.prefetch_all()
-        for gindex, group in enumerate(self.param_groups):
-            for pindex, p in enumerate(group["params"]):
-                if p.grad is None:
-                    continue
-                state = self.state[p]
-
-                if "step" not in state:
-                    state["step"] = 0
-
-                # GaLore Projection
-                if "rank" in group:
-                    if "projector" not in state:
-                        state["projector"] = GaLoreProjector(
-                            group["rank"],
-                            update_proj_gap=group["update_proj_gap"],
-                            scale=group["scale"],
-                            proj_type=group["proj_type"],
-                        )
-
-                    if "weight_decay" in group and group["weight_decay"] > 0:
-                        # ensure that the weight decay is not applied to the norm grad
-                        group["weight_decay_saved"] = group["weight_decay"]
-                        group["weight_decay"] = 0
-
-                    grad = state["projector"].project(p.grad, state["step"])
-
-                    # suboptimal implementation
-                    p.saved_data = p.data.clone()
-                    p.data = grad.clone().to(p.data.dtype).to(p.data.device)
-                    p.data.zero_()
-                    p.grad = grad
-
-                if "state1" not in state:
-                    self.init_state(group, p, gindex, pindex)
-
-                self.prefetch_state(p)
-                self.update_step(group, p, gindex, pindex)
-                torch.cuda.synchronize()
-
-                # GaLore Projection Back
-                if "rank" in group:
-                    p.data = p.saved_data.add_(state["projector"].project_back(p.data))
-
-                    # apply weight decay
-                    if "weight_decay_saved" in group:
-                        p.data.add_(
-                            p.data, alpha=-group["lr"] * group["weight_decay_saved"]
-                        )
-                        group["weight_decay"] = group["weight_decay_saved"]
-                        del group["weight_decay_saved"]
-
-        if self.is_paged:
-            # all paged operation are asynchronous, we need
-            # to sync to make sure all tensors are in the right state
-            torch.cuda.synchronize()
-
-        return loss
diff --git a/torchao/prototype/galore/utils.py b/torchao/prototype/galore/utils.py
deleted file mode 100644
index 6e9db05d30..0000000000
--- a/torchao/prototype/galore/utils.py
+++ /dev/null
@@ -1,114 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-import torch
-
-
-def get_orthogonal_matrix(weights, rank, type):
-    module_params = weights
-
-    if module_params.data.dtype != torch.float:
-        float_data = False
-        original_type = module_params.data.dtype
-        original_device = module_params.data.device
-        matrix = module_params.data.float()
-    else:
-        float_data = True
-        matrix = module_params.data
-
-    U, s, Vh = torch.linalg.svd(matrix, full_matrices=False)
-
-    # make the smaller matrix always to be orthogonal matrix
-    if type == "right":
-        # A = U[:, :rank] @ torch.diag(s[:rank])
-        B = Vh[:rank, :]
-
-        if not float_data:
-            B = B.to(original_device).type(original_type)
-        return B
-    elif type == "left":
-        A = U[:, :rank]
-        # B = torch.diag(s[:rank]) @ Vh[:rank, :]
-        if not float_data:
-            A = A.to(original_device).type(original_type)
-        return A
-    elif type == "full":
-        A = U[:, :rank]
-        B = Vh[:rank, :]
-        if not float_data:
-            A = A.to(original_device).type(original_type)
-            B = B.to(original_device).type(original_type)
-        return [A, B]
-    else:
-        raise ValueError("type should be left, right or full")
-
-
-class TestGaLoreProjector:
-    def __init__(
-        self,
-        rank=128,
-        scale=1.0,
-        proj_type="std",
-    ):
-        self.rank = rank
-        self.scale = scale
-
-        if proj_type != "std":
-            raise ("Only std projection is supported")
-
-        self.proj_type = proj_type
-
-        self.ortho_matrix = None
-
-    def update_orthogonal_matrix(self, full_rank_grad):
-        if full_rank_grad.shape[0] >= full_rank_grad.shape[1]:
-            self.ortho_matrix = get_orthogonal_matrix(
-                full_rank_grad, self.rank, type="right"
-            )
-        else:
-            self.ortho_matrix = get_orthogonal_matrix(
-                full_rank_grad, self.rank, type="left"
-            )
-
-    def project(self, full_rank_grad):
-        if full_rank_grad.shape[0] >= full_rank_grad.shape[1]:
-            low_rank_grad = torch.matmul(full_rank_grad, self.ortho_matrix.t())
-        else:
-            low_rank_grad = torch.matmul(self.ortho_matrix.t(), full_rank_grad)
-
-        return low_rank_grad
-
-    def project_back(self, low_rank_grad):
-        if low_rank_grad.shape[0] >= low_rank_grad.shape[1]:
-            full_rank_grad = torch.matmul(low_rank_grad, self.ortho_matrix)
-        else:
-            full_rank_grad = torch.matmul(self.ortho_matrix, low_rank_grad)
-
-        return full_rank_grad * self.scale
-
-
-def make_copy(*args):
-    return [t.detach().clone() for t in args]
-
-
-# def adam_step(
-#     exp_avg,
-#     exp_avg2,
-#     grad,
-#     galore_proj,
-#     params,
-#     step_size=1e-4,
-#     beta1=BETA1,
-#     beta2=BETA2,
-#     eps=EPS,
-# ):
-#     grad = galore_proj.project(grad)
-#     exp_avg = beta1 * exp_avg + (1 - beta1) * grad
-#     exp_avg2 = beta2 * exp_avg2 + (1 - beta2) * torch.square(grad)
-#     denom = exp_avg2.sqrt() + eps
-#     norm_grad = exp_avg / denom
-#     norm_grad = galore_proj.project_back(norm_grad)
-#     # params = params - step_size * norm_grad
-#     return exp_avg, exp_avg2, denom, norm_grad

From 282d04f923f1646eb2fa0ec19d11300286339760 Mon Sep 17 00:00:00 2001
From: Apurva Jain <apurvajain.kota@gmail.com>
Date: Tue, 17 Jun 2025 19:32:19 -0700
Subject: [PATCH 134/165] [BE] Convert quant_primitives methods private (#2350)

---
 docs/source/api_ref_quantization.rst          |   6 -
 test/dtypes/test_affine_quantized_float.py    |  20 +-
 test/dtypes/test_floatx.py                    |   8 +-
 test/prototype/test_gguf_quant.py             |   4 +-
 test/quantization/test_marlin_qqq.py          |   4 +-
 test/quantization/test_qat.py                 |   4 +-
 test/quantization/test_quant_primitives.py    |  12 +-
 test/test_ops.py                              |   6 +-
 torchao/dtypes/affine_quantized_tensor.py     |  58 +--
 torchao/dtypes/affine_quantized_tensor_ops.py |   8 +-
 .../floatx/floatx_tensor_core_layout.py       |   2 +-
 torchao/dtypes/uintx/int4_cpu_layout.py       |   4 +-
 torchao/dtypes/uintx/int4_xpu_layout.py       |   4 +-
 torchao/dtypes/uintx/marlin_qqq_tensor.py     |  12 +-
 .../dtypes/uintx/tensor_core_tiled_layout.py  |   4 +-
 .../prototype/parq/quant/uniform_torchao.py   |  24 +-
 .../gguf/gguf_quantized_tensor.py             |  12 +-
 torchao/quantization/__init__.py              |  16 -
 .../qat/affine_fake_quantized_tensor.py       |  12 +-
 torchao/quantization/qat/utils.py             |   6 +-
 torchao/quantization/quant_primitives.py      | 365 ++++++++++++++----
 torchao/quantization/utils.py                 |  24 +-
 tutorials/calibration_flow/gptq_like.py       |   6 +-
 23 files changed, 399 insertions(+), 222 deletions(-)

diff --git a/docs/source/api_ref_quantization.rst b/docs/source/api_ref_quantization.rst
index 5293684ab9..f2fad00b69 100644
--- a/docs/source/api_ref_quantization.rst
+++ b/docs/source/api_ref_quantization.rst
@@ -63,14 +63,8 @@ Quantization Primitives
 
     choose_qparams_affine
     choose_qparams_affine_with_min_max
-    choose_qparams_affine_floatx
     quantize_affine
-    quantize_affine_floatx
     dequantize_affine
-    dequantize_affine_floatx
-    choose_qparams_and_quantize_affine_hqq
-    fake_quantize_affine
-    fake_quantize_affine_cachemask
     safe_int_mm
     int_scaled_matmul
     MappingType
diff --git a/test/dtypes/test_affine_quantized_float.py b/test/dtypes/test_affine_quantized_float.py
index 879551fc0a..b63a406715 100644
--- a/test/dtypes/test_affine_quantized_float.py
+++ b/test/dtypes/test_affine_quantized_float.py
@@ -42,10 +42,10 @@
 )
 from torchao.quantization.quant_primitives import (
     MappingType,
+    _choose_qparams_affine_float8,
+    _dequantize_affine_float8,
+    _quantize_affine_float8,
     choose_qparams_affine,
-    choose_qparams_affine_float8,
-    dequantize_affine_float8,
-    quantize_affine_float8,
 )
 from torchao.utils import (
     is_sm_at_least_89,
@@ -358,21 +358,21 @@ def test_mm_float8dq_per_row(
     @common_utils.parametrize("output_dtype", [torch.float32, torch.bfloat16])
     @common_utils.parametrize("block_size", [None, (1, 32), (2, 16), (4, 8)])
     def test_dequantize_affine_float8(self, float8_dtype, output_dtype, block_size):
-        """Test dequantize_affine_float8 with various configurations"""
+        """Test _dequantize_affine_float8 with various configurations"""
 
         device = "cuda"
         input_tensor = torch.randn(8, 64, device=device, dtype=torch.float32)
 
         # Choose quantization parameters
-        scale = choose_qparams_affine_float8(
+        scale = _choose_qparams_affine_float8(
             input_tensor, float8_dtype=float8_dtype, block_size=block_size
         )
 
         # Quantize
-        quantized = quantize_affine_float8(input_tensor, scale, float8_dtype)
+        quantized = _quantize_affine_float8(input_tensor, scale, float8_dtype)
 
         # Dequantize
-        dequantized = dequantize_affine_float8(quantized, scale, output_dtype)
+        dequantized = _dequantize_affine_float8(quantized, scale, output_dtype)
 
         # Verify output properties
         self.assertEqual(dequantized.dtype, output_dtype)
@@ -395,7 +395,7 @@ def test_dequantize_affine_float8_scale_broadcasting(self):
         block_size = (2, 16)  # 2x2 blocks in first dim, 2x16 blocks in second dim
 
         # Choose quantization parameters
-        scale = choose_qparams_affine_float8(
+        scale = _choose_qparams_affine_float8(
             input_tensor, float8_dtype=torch.float8_e4m3fn, block_size=block_size
         )
 
@@ -407,10 +407,10 @@ def test_dequantize_affine_float8_scale_broadcasting(self):
         self.assertEqual(scale.shape, expected_scale_shape)
 
         # Quantize
-        quantized = quantize_affine_float8(input_tensor, scale, torch.float8_e4m3fn)
+        quantized = _quantize_affine_float8(input_tensor, scale, torch.float8_e4m3fn)
 
         # Dequantize
-        dequantized = dequantize_affine_float8(quantized, scale, torch.float32)
+        dequantized = _dequantize_affine_float8(quantized, scale, torch.float32)
 
         # Verify shapes match
         self.assertEqual(dequantized.shape, input_tensor.shape)
diff --git a/test/dtypes/test_floatx.py b/test/dtypes/test_floatx.py
index 956ef9a03e..237bc2bd92 100644
--- a/test/dtypes/test_floatx.py
+++ b/test/dtypes/test_floatx.py
@@ -91,13 +91,13 @@ def test_from_scaled_tc_floatx_compile(self, ebits, mbits, device):
     @parametrize("ebits,mbits", _Floatx_DTYPES)
     def test_to_copy_device(self, ebits, mbits):
         from torchao.quantization.quant_primitives import (
-            choose_qparams_affine_floatx,
-            quantize_affine_floatx,
+            _choose_qparams_affine_floatx,
+            _quantize_affine_floatx,
         )
 
         x = torch.randn(256, 64)
-        scale = choose_qparams_affine_floatx(x, ebits, mbits)
-        x = quantize_affine_floatx(x, scale, ebits, mbits)
+        scale = _choose_qparams_affine_floatx(x, ebits, mbits)
+        x = _quantize_affine_floatx(x, scale, ebits, mbits)
         _layout = FloatxTensorCoreLayout(ebits, mbits)
         floatx_tensor_impl = FloatxTensorCoreAQTTensorImpl.from_plain(
             x, scale, None, _layout
diff --git a/test/prototype/test_gguf_quant.py b/test/prototype/test_gguf_quant.py
index b68d84b101..af44243fe4 100644
--- a/test/prototype/test_gguf_quant.py
+++ b/test/prototype/test_gguf_quant.py
@@ -13,7 +13,7 @@
     GGUFWeightOnlyConfig,
 )
 from torchao.quantization import quantize_
-from torchao.quantization.quant_primitives import choose_qparams_gguf
+from torchao.quantization.quant_primitives import _choose_qparams_gguf
 from torchao.quantization.utils import compute_error
 
 
@@ -31,7 +31,7 @@ def test_choose_qparams_gguf(self):
             super_block_min_scale,
             quantized_block_scale,
             quantized_block_min,
-        ) = choose_qparams_gguf(self.input, self.block_size, self.dtype)
+        ) = _choose_qparams_gguf(self.input, self.block_size, self.dtype)
 
         assert super_block_scale_scale.shape, (2, 8)
         assert super_block_min_scale.shape, (2, 8)
diff --git a/test/quantization/test_marlin_qqq.py b/test/quantization/test_marlin_qqq.py
index cff46ad329..8fe21c6bd3 100644
--- a/test/quantization/test_marlin_qqq.py
+++ b/test/quantization/test_marlin_qqq.py
@@ -21,7 +21,7 @@
 )
 from torchao.quantization.quant_primitives import (
     MappingType,
-    choose_qparams_and_quantize_affine_qqq,
+    _choose_qparams_and_quantize_affine_qqq,
 )
 from torchao.testing.utils import skip_if_rocm
 from torchao.utils import TORCH_VERSION_AT_LEAST_2_5
@@ -102,7 +102,7 @@ def test_pack_unpack_equivalence(self):
 
         for group_size in [-1, 128]:
             # Quantize weights
-            q_w, s_group, s_channel, _ = choose_qparams_and_quantize_affine_qqq(
+            q_w, s_group, s_channel, _ = _choose_qparams_and_quantize_affine_qqq(
                 w, num_bits, group_size
             )
 
diff --git a/test/quantization/test_qat.py b/test/quantization/test_qat.py
index 323802757d..f0404a2ac2 100644
--- a/test/quantization/test_qat.py
+++ b/test/quantization/test_qat.py
@@ -64,9 +64,9 @@
     MappingType,
     TorchAODType,
     ZeroPointDomain,
+    _fake_quantize_affine,
     choose_qparams_affine,
     dequantize_affine,
-    fake_quantize_affine,
     quantize_affine,
 )
 from torchao.quantization.unified import (
@@ -637,7 +637,7 @@ def test_qat_4w_primitives(self):
             group_size,
             scales_precision,
         )
-        w_fq = fake_quantize_affine(
+        w_fq = _fake_quantize_affine(
             weight,
             block_size,
             scales,
diff --git a/test/quantization/test_quant_primitives.py b/test/quantization/test_quant_primitives.py
index e69d68b27f..ac2a42b9cf 100644
--- a/test/quantization/test_quant_primitives.py
+++ b/test/quantization/test_quant_primitives.py
@@ -13,11 +13,11 @@
 from torchao.quantization.quant_primitives import (
     MappingType,
     ZeroPointDomain,
+    _choose_qparams_affine_tinygemm,
+    _fake_quantize_affine,
+    _fake_quantize_affine_cachemask,
     choose_qparams_affine,
-    choose_qparams_affine_tinygemm,
     dequantize_affine,
-    fake_quantize_affine,
-    fake_quantize_affine_cachemask,
     quantize_affine,
 )
 
@@ -672,7 +672,7 @@ def test_get_groupwise_affine_qparams(self):
                 zero_point_domain=zero_point_domain,
             )
             if zero_point_domain == ZeroPointDomain.FLOAT:
-                scale, zero_point = choose_qparams_affine_tinygemm(
+                scale, zero_point = _choose_qparams_affine_tinygemm(
                     input,
                     mapping_type,
                     block_size,
@@ -780,7 +780,7 @@ def test_fake_quantize_affine(self):
         dequantized = dequantize_affine(
             quantized, block_size, scale, zero_point, dtype, quant_min, quant_max
         )
-        fake_quantized = fake_quantize_affine(
+        fake_quantized = _fake_quantize_affine(
             input, block_size, scale, zero_point, dtype, quant_min, quant_max
         )
         torch.testing.assert_close(dequantized, fake_quantized)
@@ -816,7 +816,7 @@ def test_fake_quantize_affine_cachemask(self):
         dequantized = dequantize_affine(
             quantized, block_size, scale, zero_point, dtype, quant_min, quant_max
         )
-        (fake_quantized, mask) = fake_quantize_affine_cachemask(
+        (fake_quantized, mask) = _fake_quantize_affine_cachemask(
             input,
             block_size,
             scale,
diff --git a/test/test_ops.py b/test/test_ops.py
index 012a4d562d..faec689a69 100644
--- a/test/test_ops.py
+++ b/test/test_ops.py
@@ -23,7 +23,9 @@
     marlin_qqq_workspace,
     pack_to_marlin_qqq,
 )
-from torchao.quantization.quant_primitives import choose_qparams_and_quantize_affine_qqq
+from torchao.quantization.quant_primitives import (
+    _choose_qparams_and_quantize_affine_qqq,
+)
 from torchao.sparsity.marlin import inject_24, marlin_24_workspace, pack_to_marlin_24
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
@@ -713,7 +715,7 @@ def test_marlin_qqq(batch_size, k_chunk, n_chunk, num_bits, group_size, mnk_fact
     )
 
     # Quantize weights
-    q_w, s_group, s_channel, w_ref = choose_qparams_and_quantize_affine_qqq(
+    q_w, s_group, s_channel, w_ref = _choose_qparams_and_quantize_affine_qqq(
         b_weight, num_bits, group_size
     )
     q_w = q_w.t()
diff --git a/torchao/dtypes/affine_quantized_tensor.py b/torchao/dtypes/affine_quantized_tensor.py
index 132ac0f28e..39f9131a9e 100644
--- a/torchao/dtypes/affine_quantized_tensor.py
+++ b/torchao/dtypes/affine_quantized_tensor.py
@@ -18,22 +18,22 @@
     FP8_TYPES,
     MappingType,
     ZeroPointDomain,
+    _choose_qparams_affine_dont_preserve_zero,
+    _choose_qparams_affine_float8,
+    _choose_qparams_affine_floatx,
+    _choose_qparams_affine_tinygemm,
+    _choose_qparams_and_quantize_affine_hqq,
+    _dequantize_affine_float8,
+    _dequantize_affine_floatx,
+    _dequantize_affine_no_zero_point,
+    _dequantize_affine_tinygemm,
+    _quantize_affine_float8,
+    _quantize_affine_floatx,
+    _quantize_affine_no_zero_point,
+    _quantize_affine_tinygemm,
     choose_qparams_affine,
-    choose_qparams_affine_dont_preserve_zero,
-    choose_qparams_affine_float8,
-    choose_qparams_affine_floatx,
-    choose_qparams_affine_tinygemm,
-    choose_qparams_and_quantize_affine_hqq,
     dequantize_affine,
-    dequantize_affine_float8,
-    dequantize_affine_floatx,
-    dequantize_affine_no_zero_point,
-    dequantize_affine_tinygemm,
     quantize_affine,
-    quantize_affine_float8,
-    quantize_affine_floatx,
-    quantize_affine_no_zero_point,
-    quantize_affine_tinygemm,
 )
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
@@ -142,7 +142,7 @@ def dequantize(self, output_dtype: Optional[torch.dtype] = None) -> torch.Tensor
 
         if isinstance(self._layout, FloatxTensorCoreLayout):
             int_data, scale = self.tensor_impl.get_plain()
-            return dequantize_affine_floatx(
+            return _dequantize_affine_floatx(
                 int_data,
                 scale,
                 self._layout.ebits,
@@ -151,11 +151,11 @@ def dequantize(self, output_dtype: Optional[torch.dtype] = None) -> torch.Tensor
             )
         elif isinstance(self._layout, Float8Layout):
             data, scale, _ = self.tensor_impl.get_plain()
-            return dequantize_affine_float8(data, scale, output_dtype)
+            return _dequantize_affine_float8(data, scale, output_dtype)
         else:
             data, scale, zero_point = self.tensor_impl.get_plain()
             if self.zero_point_domain == ZeroPointDomain.FLOAT:
-                dq = dequantize_affine_tinygemm(
+                dq = _dequantize_affine_tinygemm(
                     data,
                     self.block_size,
                     scale,
@@ -166,7 +166,7 @@ def dequantize(self, output_dtype: Optional[torch.dtype] = None) -> torch.Tensor
                     output_dtype=output_dtype,
                 )
             elif self.zero_point_domain == ZeroPointDomain.NONE:
-                dq = dequantize_affine_no_zero_point(
+                dq = _dequantize_affine_no_zero_point(
                     data,
                     self.block_size,
                     scale,
@@ -270,7 +270,7 @@ def from_hp_to_intx(
             from torchao.dtypes import Int4CPULayout
             from torchao.dtypes.uintx import TensorCoreTiledLayout
 
-            data, scale, zero_point, _ = choose_qparams_and_quantize_affine_hqq(
+            data, scale, zero_point, _ = _choose_qparams_and_quantize_affine_hqq(
                 input_float,
                 nbits=nbits,
                 group_size=group_size,
@@ -291,7 +291,7 @@ def from_hp_to_intx(
             data = data.to(target_dtype)
         else:
             if zero_point_domain == ZeroPointDomain.FLOAT and not preserve_zero:
-                scale, zero_point = choose_qparams_affine_tinygemm(
+                scale, zero_point = _choose_qparams_affine_tinygemm(
                     input_float,
                     mapping_type,
                     block_size,
@@ -303,7 +303,7 @@ def from_hp_to_intx(
                     zero_point_dtype,
                 )
             elif zero_point_domain == ZeroPointDomain.INT and not preserve_zero:
-                scale, zero_point = choose_qparams_affine_dont_preserve_zero(
+                scale, zero_point = _choose_qparams_affine_dont_preserve_zero(
                     input_float,
                     mapping_type,
                     block_size,
@@ -329,7 +329,7 @@ def from_hp_to_intx(
             # choose_qparams_affine is a custom op that does support returning optional Tensors. We thus set the zero_point to None if its domain is None
             if zero_point_domain == ZeroPointDomain.NONE:
                 zero_point = None
-                data = quantize_affine_no_zero_point(
+                data = _quantize_affine_no_zero_point(
                     input_float,
                     block_size,
                     scale,
@@ -339,7 +339,7 @@ def from_hp_to_intx(
                     quant_max,
                 )
             elif zero_point_domain == ZeroPointDomain.FLOAT:
-                data = quantize_affine_tinygemm(
+                data = _quantize_affine_tinygemm(
                     input_float,
                     block_size,
                     scale,
@@ -400,7 +400,7 @@ def from_hp_to_intx_static(
 
         if zero_point_domain == ZeroPointDomain.NONE:
             zero_point = None
-            int_data = quantize_affine_no_zero_point(
+            int_data = _quantize_affine_no_zero_point(
                 input_float,
                 block_size,
                 scale,
@@ -410,7 +410,7 @@ def from_hp_to_intx_static(
                 quant_max,
             )
         elif zero_point_domain == ZeroPointDomain.FLOAT:
-            int_data = quantize_affine_tinygemm(
+            int_data = _quantize_affine_tinygemm(
                 input_float,
                 block_size,
                 scale,
@@ -462,10 +462,10 @@ def from_hp_to_floatx(
         if target_dtype in FP8_TYPES:
             original_shape = input_float.shape
             input_float = _layout.pre_process(input_float)
-            scale = choose_qparams_affine_float8(
+            scale = _choose_qparams_affine_float8(
                 input_float, float8_dtype=target_dtype, block_size=block_size
             )
-            data = quantize_affine_float8(input_float, scale, target_dtype)
+            data = _quantize_affine_float8(input_float, scale, target_dtype)
             data, scale, zero_point = _layout.post_process(
                 data, scale, None, block_size
             )
@@ -499,7 +499,7 @@ def from_hp_to_floatx_static(
                 input_float, scale, ZeroPointDomain.NONE, block_size
             )
 
-            data = quantize_affine_float8(
+            data = _quantize_affine_float8(
                 input_float,
                 scale,
                 target_dtype,
@@ -545,8 +545,8 @@ def from_hp_to_fpx(
 
         ebits, mbits = _layout.ebits, _layout.mbits
         # Note: these ops are hardcoded to have per axis quantization (axis=1) right now
-        scale = choose_qparams_affine_floatx(input_float, ebits, mbits)
-        floatx_unpacked = quantize_affine_floatx(input_float, scale, ebits, mbits)
+        scale = _choose_qparams_affine_floatx(input_float, ebits, mbits)
+        floatx_unpacked = _quantize_affine_floatx(input_float, scale, ebits, mbits)
         floatx_packed, scale, _ = _layout.post_process(
             floatx_unpacked, scale, None, block_size
         )
diff --git a/torchao/dtypes/affine_quantized_tensor_ops.py b/torchao/dtypes/affine_quantized_tensor_ops.py
index a76b4daa23..02a2d3004a 100644
--- a/torchao/dtypes/affine_quantized_tensor_ops.py
+++ b/torchao/dtypes/affine_quantized_tensor_ops.py
@@ -92,9 +92,9 @@
 )
 from torchao.quantization.quant_primitives import (
     ZeroPointDomain,
+    _dequantize_affine_no_zero_point,
+    _dequantize_affine_tinygemm,
     dequantize_affine,
-    dequantize_affine_no_zero_point,
-    dequantize_affine_tinygemm,
 )
 from torchao.utils import (
     fill_defaults,
@@ -318,9 +318,9 @@ def _(func, types, args, kwargs):
     # we need to increase block size to correct dim
     new_blocks = idx.dim() - 1
     if args[1].zero_point_domain == ZeroPointDomain.FLOAT:
-        _dequantize_affine = dequantize_affine_tinygemm
+        _dequantize_affine = _dequantize_affine_tinygemm
     elif args[1].zero_point_domain == ZeroPointDomain.NONE:
-        _dequantize_affine = dequantize_affine_no_zero_point
+        _dequantize_affine = _dequantize_affine_no_zero_point
     else:
         _dequantize_affine = dequantize_affine
 
diff --git a/torchao/dtypes/floatx/floatx_tensor_core_layout.py b/torchao/dtypes/floatx/floatx_tensor_core_layout.py
index 6871033f1a..c7fb1e1a7c 100644
--- a/torchao/dtypes/floatx/floatx_tensor_core_layout.py
+++ b/torchao/dtypes/floatx/floatx_tensor_core_layout.py
@@ -467,7 +467,7 @@ class FloatxTensorCoreLayout(Layout):
 class FloatxTensorCoreAQTTensorImpl(AQTTensorImpl):
     """FloatxTensorCoreAQTTensorImpl represents a Tensor with dtype floatx(ebits=a, mbits=b),
     it has a internal tensor field of "packed_floatx_data", which is packed from the
-    uint8 unpacked data (the output of `quantize_affine_floatx` operator)
+    uint8 unpacked data (the output of `_quantize_affine_floatx` operator)
 
     The packing is optimized for TensorCore, from the fp6-llm paper: https://arxiv.org/abs/2401.14112
     github repo: https://github.com/usyd-fsalab/fp6_llm, now renamed to quant-llm
diff --git a/torchao/dtypes/uintx/int4_cpu_layout.py b/torchao/dtypes/uintx/int4_cpu_layout.py
index 6c89f98ff7..bf9446d265 100644
--- a/torchao/dtypes/uintx/int4_cpu_layout.py
+++ b/torchao/dtypes/uintx/int4_cpu_layout.py
@@ -19,7 +19,7 @@
 from torchao.dtypes.utils import AQTTensorImpl, Layout, is_device
 from torchao.quantization.quant_primitives import (
     ZeroPointDomain,
-    quantize_affine_tinygemm,
+    _quantize_affine_tinygemm,
 )
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
@@ -266,7 +266,7 @@ def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
         # TODO: move this to `unpack_tinygemm_scales_and_zeros`?
         scale = scale.reshape(scale.shape[:-1]).contiguous()
         zero = zero.reshape(zero.shape[:-1]).contiguous()
-        int_data = quantize_affine_tinygemm(
+        int_data = _quantize_affine_tinygemm(
             dequantized,
             block_size,
             scale,
diff --git a/torchao/dtypes/uintx/int4_xpu_layout.py b/torchao/dtypes/uintx/int4_xpu_layout.py
index c67eebd747..955a7a8610 100644
--- a/torchao/dtypes/uintx/int4_xpu_layout.py
+++ b/torchao/dtypes/uintx/int4_xpu_layout.py
@@ -377,8 +377,8 @@ def __torch_dispatch__(cls, func, types, args, kwargs):
 
     def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
         from torchao.quantization.quant_primitives import (
+            _quantize_affine_tinygemm,
             quantize_affine,
-            quantize_affine_tinygemm,
         )
         from torchao.quantization.utils import unpack_tinygemm_scales_and_zeros
 
@@ -429,7 +429,7 @@ def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
             # TODO: move this to `unpack_tinygemm_scales_and_zeros`?
             scale = scale.reshape(scale.shape[:-1]).contiguous()
             zero = zero.reshape(zero.shape[:-1]).contiguous()
-            int_data = quantize_affine_tinygemm(
+            int_data = _quantize_affine_tinygemm(
                 dequantized,
                 block_size,
                 scale,
diff --git a/torchao/dtypes/uintx/marlin_qqq_tensor.py b/torchao/dtypes/uintx/marlin_qqq_tensor.py
index 3f3f4fa075..04066a6c65 100644
--- a/torchao/dtypes/uintx/marlin_qqq_tensor.py
+++ b/torchao/dtypes/uintx/marlin_qqq_tensor.py
@@ -24,8 +24,8 @@
 from torchao.dtypes.utils import AQTTensorImpl, Layout
 from torchao.quantization.quant_primitives import (
     ZeroPointDomain,
-    choose_qparams_and_quantize_affine_qqq,
-    dequantize_affine_qqq,
+    _choose_qparams_and_quantize_affine_qqq,
+    _dequantize_affine_qqq,
 )
 
 logger = logging.getLogger(__name__)
@@ -36,9 +36,9 @@
 class MarlinQQQTensor(AffineQuantizedTensor):
     """MarlinQQQ quantized tensor subclass which inherits AffineQuantizedTensor class.
 
-    To see what happens during choose_qparams_and_quantize_affine_qqq, quantization and dequantization for marlin qqq quantization,
+    To see what happens during _choose_qparams_and_quantize_affine_qqq, quantization and dequantization for marlin qqq quantization,
     please checkout https://github.com/pytorch/ao/blob/main/torchao/quantization/quant_primitives.py
-    and check the two quant primitive ops: choose_qparams_and_quantize_affine_qqq and dequantize_affine_qqq
+    and check the two quant primitive ops: _choose_qparams_and_quantize_affine_qqq and _dequantize_affine_qqq
     """
 
     def dequantize(self, output_dtype: Optional[torch.dtype] = None) -> torch.Tensor:
@@ -48,7 +48,7 @@ def dequantize(self, output_dtype: Optional[torch.dtype] = None) -> torch.Tensor
         int_data, s_group, s_channel = self.tensor_impl.get_plain()
         nbits = int(math.log2(self.quant_max - self.quant_min + 1))
         group_size = max(self.block_size)
-        return dequantize_affine_qqq(
+        return _dequantize_affine_qqq(
             int_data, s_group, s_channel, nbits, group_size, output_dtype
         )
 
@@ -69,7 +69,7 @@ def from_hp_to_intx(
         input_float = _layout.pre_process(input_float)
         nbits = int(math.log2(quant_max - quant_min + 1))
         group_size = max(block_size)
-        data, s_group, s_channel, _ = choose_qparams_and_quantize_affine_qqq(
+        data, s_group, s_channel, _ = _choose_qparams_and_quantize_affine_qqq(
             input_float, nbits, group_size
         )
         tensor_impl_ctr = get_tensor_impl_constructor(type(_layout))
diff --git a/torchao/dtypes/uintx/tensor_core_tiled_layout.py b/torchao/dtypes/uintx/tensor_core_tiled_layout.py
index 0856d22fee..591d9a9be1 100644
--- a/torchao/dtypes/uintx/tensor_core_tiled_layout.py
+++ b/torchao/dtypes/uintx/tensor_core_tiled_layout.py
@@ -21,7 +21,7 @@
 from torchao.quantization.quant_primitives import (
     ZeroPointDomain,
     _get_reduction_params,
-    quantize_affine_tinygemm,
+    _quantize_affine_tinygemm,
 )
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
@@ -511,7 +511,7 @@ def dequant_4d(self):
         target_dtype = torch.int32
         quant_min = 0
         quant_max = 15
-        int_data = quantize_affine_tinygemm(
+        int_data = _quantize_affine_tinygemm(
             dequantized,
             self.block_size,
             scale,
diff --git a/torchao/prototype/parq/quant/uniform_torchao.py b/torchao/prototype/parq/quant/uniform_torchao.py
index 4f90f9cb92..ebe4e775e6 100644
--- a/torchao/prototype/parq/quant/uniform_torchao.py
+++ b/torchao/prototype/parq/quant/uniform_torchao.py
@@ -14,15 +14,15 @@
     _DTYPE_TO_QVALUE_BOUNDS,
     MappingType,
     ZeroPointDomain,
+    _choose_qparams_affine_dont_preserve_zero,
+    _choose_qparams_affine_tinygemm,
+    _dequantize_affine_no_zero_point,
+    _dequantize_affine_tinygemm,
+    _quantize_affine_no_zero_point,
+    _quantize_affine_tinygemm,
     choose_qparams_affine,
-    choose_qparams_affine_dont_preserve_zero,
-    choose_qparams_affine_tinygemm,
     dequantize_affine,
-    dequantize_affine_no_zero_point,
-    dequantize_affine_tinygemm,
     quantize_affine,
-    quantize_affine_no_zero_point,
-    quantize_affine_tinygemm,
 )
 
 from .quantizer import Quantizer
@@ -57,16 +57,16 @@ def __init__(
         self._dequantize = dequantize_affine
 
         if zero_point_domain == ZeroPointDomain.FLOAT and not preserve_zero:
-            self._choose_qparams = choose_qparams_affine_tinygemm
-            self._quantize = quantize_affine_tinygemm
-            self._dequantize = dequantize_affine_tinygemm
+            self._choose_qparams = _choose_qparams_affine_tinygemm
+            self._quantize = _quantize_affine_tinygemm
+            self._dequantize = _dequantize_affine_tinygemm
         elif zero_point_domain == ZeroPointDomain.INT and not preserve_zero:
-            self._choose_qparams = choose_qparams_affine_dont_preserve_zero
+            self._choose_qparams = _choose_qparams_affine_dont_preserve_zero
             self._quantize = quantize_affine
             self._dequantize = dequantize_affine
         elif zero_point_domain == ZeroPointDomain.NONE:
-            self._quantize = quantize_affine_no_zero_point
-            self._dequantize = dequantize_affine_no_zero_point
+            self._quantize = _quantize_affine_no_zero_point
+            self._dequantize = _dequantize_affine_no_zero_point
 
     def _init_quant_min_max(self, b: int) -> None:
         if self.quant_min is None or self.quant_max is None:
diff --git a/torchao/prototype/quantization/gguf/gguf_quantized_tensor.py b/torchao/prototype/quantization/gguf/gguf_quantized_tensor.py
index 9757769d16..c1272fceb6 100644
--- a/torchao/prototype/quantization/gguf/gguf_quantized_tensor.py
+++ b/torchao/prototype/quantization/gguf/gguf_quantized_tensor.py
@@ -10,9 +10,9 @@
 from torch.utils._python_dispatch import return_and_correct_aliasing
 
 from torchao.quantization.quant_primitives import (
-    choose_qparams_gguf,
-    dequantize_gguf,
-    quantize_gguf,
+    _choose_qparams_gguf,
+    _dequantize_gguf,
+    _quantize_gguf,
 )
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
@@ -130,7 +130,7 @@ def dequantize(self, output_dtype: Optional[torch.dtype] = None) -> torch.Tensor
         block_size = tuple(
             [1] * (self.int_data.ndim - 1) + [_QK_K // self.n_blocks_per_superblock]
         )
-        return dequantize_gguf(
+        return _dequantize_gguf(
             self.int_data,
             block_size,
             self.dtype,
@@ -198,9 +198,9 @@ def from_float(cls, input_float, n_blocks_per_superblock, target_dtype):
             super_block_min_scale,
             quantized_block_scale,
             quantized_block_min,
-        ) = choose_qparams_gguf(input_float, block_size, target_dtype)
+        ) = _choose_qparams_gguf(input_float, block_size, target_dtype)
 
-        int_data = quantize_gguf(
+        int_data = _quantize_gguf(
             input_float,
             block_size,
             target_dtype,
diff --git a/torchao/quantization/__init__.py b/torchao/quantization/__init__.py
index 44fc6c8397..d9aba0bcc5 100644
--- a/torchao/quantization/__init__.py
+++ b/torchao/quantization/__init__.py
@@ -83,17 +83,9 @@
     TorchAODType,
     ZeroPointDomain,
     choose_qparams_affine,
-    choose_qparams_affine_dont_preserve_zero,
-    choose_qparams_affine_floatx,
-    choose_qparams_affine_tinygemm,
     choose_qparams_affine_with_min_max,
-    choose_qparams_and_quantize_affine_hqq,
     dequantize_affine,
-    dequantize_affine_floatx,
-    fake_quantize_affine,
-    fake_quantize_affine_cachemask,
     quantize_affine,
-    quantize_affine_floatx,
 )
 from .smoothquant import (
     SmoothFakeDynamicallyQuantizedLinear,
@@ -172,17 +164,9 @@
     "AffineQuantizedObserverBase",
     # quant primitive ops
     "choose_qparams_affine",
-    "choose_qparams_affine_tinygemm",
-    "choose_qparams_affine_dont_preserve_zero",
     "choose_qparams_affine_with_min_max",
-    "choose_qparams_affine_floatx",
     "quantize_affine",
-    "quantize_affine_floatx",
     "dequantize_affine",
-    "dequantize_affine_floatx",
-    "choose_qparams_and_quantize_affine_hqq",
-    "fake_quantize_affine",
-    "fake_quantize_affine_cachemask",
     # operators/kernels
     "safe_int_mm",
     "int_scaled_matmul",
diff --git a/torchao/quantization/qat/affine_fake_quantized_tensor.py b/torchao/quantization/qat/affine_fake_quantized_tensor.py
index 6896588971..80ecd173c2 100644
--- a/torchao/quantization/qat/affine_fake_quantized_tensor.py
+++ b/torchao/quantization/qat/affine_fake_quantized_tensor.py
@@ -12,11 +12,11 @@
 from torchao.quantization.quant_primitives import (
     MappingType,
     ZeroPointDomain,
+    _choose_qparams_affine_dont_preserve_zero,
+    _choose_qparams_affine_tinygemm,
+    _fake_quantize_affine,
     _get_and_check_qmin_qmax,
     choose_qparams_affine,
-    choose_qparams_affine_dont_preserve_zero,
-    choose_qparams_affine_tinygemm,
-    fake_quantize_affine,
 )
 from torchao.utils import TorchAOBaseTensor
 
@@ -55,7 +55,7 @@ def apply_fake_quant_fn(t: torch.Tensor):
             assert isinstance(t, AffineFakeQuantizedTensor)
             qmin, qmax = _get_and_check_qmin_qmax(target_dtype, quant_min, quant_max)
             if zero_point_domain == ZeroPointDomain.FLOAT and not preserve_zero:
-                scale, zero_point = choose_qparams_affine_tinygemm(
+                scale, zero_point = _choose_qparams_affine_tinygemm(
                     t.original_tensor,
                     mapping_type,
                     block_size,
@@ -67,7 +67,7 @@ def apply_fake_quant_fn(t: torch.Tensor):
                     zero_point_dtype,
                 )
             elif zero_point_domain == ZeroPointDomain.INT and not preserve_zero:
-                scale, zero_point = choose_qparams_affine_dont_preserve_zero(
+                scale, zero_point = _choose_qparams_affine_dont_preserve_zero(
                     t.original_tensor,
                     mapping_type,
                     block_size,
@@ -90,7 +90,7 @@ def apply_fake_quant_fn(t: torch.Tensor):
                     scale_dtype,
                     zero_point_dtype,
                 )
-            fq = fake_quantize_affine(
+            fq = _fake_quantize_affine(
                 t,
                 block_size,
                 scale,
diff --git a/torchao/quantization/qat/utils.py b/torchao/quantization/qat/utils.py
index 132020499c..4f3323a1e8 100644
--- a/torchao/quantization/qat/utils.py
+++ b/torchao/quantization/qat/utils.py
@@ -9,7 +9,7 @@
 
 from torchao.quantization.quant_primitives import (
     ZeroPointDomain,
-    fake_quantize_affine,
+    _fake_quantize_affine,
 )
 from torchao.quantization.utils import (
     _get_per_token_block_size,
@@ -87,7 +87,7 @@ def _fake_quantize_per_channel_group(
     assert input.shape[-1] % group_size == 0
     assert input.dim() == 2
     block_size = (1, group_size)
-    return fake_quantize_affine(
+    return _fake_quantize_affine(
         input,
         block_size,
         scales,
@@ -110,7 +110,7 @@ def _fake_quantize_per_token(
 
     _per_token_quant_qparam_dim_check(input, scales, zero_points)
     block_size = _get_per_token_block_size(input)
-    fq = fake_quantize_affine(
+    fq = _fake_quantize_affine(
         input,
         block_size,
         scales,
diff --git a/torchao/quantization/quant_primitives.py b/torchao/quantization/quant_primitives.py
index 9e0c6447c8..df136bc06e 100644
--- a/torchao/quantization/quant_primitives.py
+++ b/torchao/quantization/quant_primitives.py
@@ -24,32 +24,32 @@
 
 __all__ = [
     "choose_qparams_affine",
-    "choose_qparams_affine_tinygemm",
-    "choose_qparams_affine_dont_preserve_zero",
     "choose_qparams_affine_with_min_max",
-    "choose_qparams_affine_floatx",
     "quantize_affine",
-    "quantize_affine_no_zero_point",
-    "quantize_affine_tinygemm",
     "dequantize_affine",
-    "dequantize_affine_no_zero_point",
-    "dequantize_affine_tinygemm",
-    "quantize_affine_floatx",
-    "dequantize_affine_floatx",
-    "fake_quantize_affine",
-    "fake_quantize_affine_cachemask",
-    "choose_qparams_and_quantize_affine_hqq",
-    "choose_qparams_and_quantize_affine_qqq",
-    "dequantize_affine_qqq",
     "MappingType",
     "ZeroPointDomain",
     "TorchAODType",
-    "choose_qparams_affine_float8",
-    "quantize_affine_float8",
-    "dequantize_affine_float8",
-    "choose_qparams_gguf",
-    "quantize_gguf",
-    "dequantize_gguf",
+    "_choose_qparams_affine_tinygemm",
+    "_choose_qparams_affine_dont_preserve_zero",
+    "_choose_qparams_affine_floatx",
+    "_choose_qparams_and_quantize_affine_hqq",
+    "_choose_qparams_and_quantize_affine_qqq",
+    "_choose_qparams_affine_float8",
+    "_choose_qparams_gguf",
+    "_quantize_affine_no_zero_point",
+    "_quantize_affine_tinygemm",
+    "_quantize_affine_floatx",
+    "_quantize_affine_float8",
+    "_quantize_gguf",
+    "_dequantize_affine_no_zero_point",
+    "_dequantize_affine_tinygemm",
+    "_dequantize_affine_floatx",
+    "_dequantize_affine_qqq",
+    "_dequantize_affine_float8",
+    "_dequantize_gguf",
+    "_fake_quantize_affine",
+    "_fake_quantize_affine_cachemask",
 ]
 
 
@@ -228,9 +228,19 @@ def backward(ctx, gy: torch.Tensor) -> torch.Tensor:
 
 # TODO: decide on if we want to allow custom quant_min/quant_max here
 def _get_and_check_qmin_qmax(dtype, quant_min, quant_max):
-    """Get quant_min and quant_max args based on dtype and also
-    verify that they are within the range of possible quant_min/quant_max
-    for dtype
+    """Get quant_min and quant_max args based on dtype and also verify bounds.
+
+    Args:
+        dtype: Target quantization dtype (e.g., torch.uint8, torch.int8, or FP8 types)
+        quant_min: Minimum quantized value, or None to use dtype default
+        quant_max: Maximum quantized value, or None to use dtype default
+
+    Returns:
+        Tuple[int/float, int/float]: Validated (quant_min, quant_max) values
+
+    Raises:
+        ValueError: If dtype is unsupported
+        AssertionError: If quant_min/quant_max are out of bounds for dtype
     """
     if dtype in FP8_TYPES:
         quant_min_lower_bound, quant_max_upper_bound = (
@@ -357,11 +367,25 @@ def _quantize_affine(
     quant_min: Optional[Union[int, float, bool]] = None,
     quant_max: Optional[Union[int, float, bool]] = None,
 ) -> torch.Tensor:
-    """op definition that has compatible signatures with custom op library
+    """Quantize tensor using affine quantization with integer zero point domain.
+
+    Op definition that has compatible signatures with custom op library.
+
+    Args:
+        input: Input tensor to quantize (float32, float16, or bfloat16)
+        block_size: Granularity of quantization - size of tensor elements sharing same qparam
+        scale: Quantization scale parameter
+        zero_point: Quantization zero point parameter (optional)
+        output_dtype: Target quantized dtype (e.g., torch.uint8, torch.int8)
+        quant_min: Minimum quantized value, derived from dtype if None
+        quant_max: Maximum quantized value, derived from dtype if None
+
+    Returns:
+        Quantized tensor with requested dtype
 
     Note:
-        zero_point_domain is pre-defined specifies how we quantize the floating point to quantized data:
-        INT: quantized_val = (float_val / scale) (integer) + zero_point (integer)
+        zero_point_domain is pre-defined as INT, meaning:
+        quantized_val = (float_val / scale) (integer) + zero_point (integer)
     """
     quant_min, quant_max = _get_and_check_qmin_qmax(output_dtype, quant_min, quant_max)
     # workaround for uintx dtypes, since we don't have native Uintx dtype connected with
@@ -386,12 +410,26 @@ def _quantize_affine_no_dtype_cast(
     quant_min: Union[int, float],
     quant_max: Union[int, float],
 ) -> torch.Tensor:
-    """
+    """Quantize tensor using affine quantization without dtype casting.
+
+    Performs quantization with integer zero point domain without casting to target dtype.
+
+    Args:
+        input: Input tensor to quantize (float32, float16, or bfloat16)
+        block_size: Granularity of quantization - size of tensor elements sharing same qparam
+        scale: Quantization scale parameter
+        zero_point: Quantization zero point parameter (optional)
+        quant_min: Minimum quantized value
+        quant_max: Maximum quantized value
+
+    Returns:
+        Quantized tensor without dtype casting
+
     The op does the following:
-    1. figure out the dimension for reduction based on block_size, also reshape the input to align with
+    1. Figure out the dimension for reduction based on block_size, also reshape the input to align with
        the shape after reduction
-    2. quantize the input based on the quantization parameters scale and zero_point and zero_point_domain = INT
-    3. reshape the quantized result to origianl shape
+    2. Quantize the input based on the quantization parameters scale and zero_point with zero_point_domain = INT
+    3. Reshape the quantized result to original shape
     """
     # TODO: validations
     # TODO: validate scale/zero_point dimensions are compatible with block_size
@@ -428,7 +466,7 @@ def _quantize_affine_no_dtype_cast(
     return quant
 
 
-def quantize_affine_tinygemm(
+def _quantize_affine_tinygemm(
     input: torch.Tensor,
     block_size: List[int],
     scale: torch.Tensor,
@@ -437,16 +475,31 @@ def quantize_affine_tinygemm(
     quant_min: Optional[Union[int, float, bool]] = None,
     quant_max: Optional[Union[int, float, bool]] = None,
 ) -> torch.Tensor:
-    """
+    """Quantize tensor using affine quantization with float zero point domain for tinygemm.
+
+    Specialized quantization for tinygemm int4mm kernel where zero point is in floating point domain.
+
+    Args:
+        input: Input tensor to quantize (float32, float16, or bfloat16)
+        block_size: Granularity of quantization - size of tensor elements sharing same qparam
+        scale: Quantization scale parameter
+        zero_point: Quantization zero point parameter (optional)
+        output_dtype: Target quantized dtype (e.g., torch.uint8, torch.int8)
+        quant_min: Minimum quantized value, derived from dtype if None
+        quant_max: Maximum quantized value, derived from dtype if None
+
+    Returns:
+        Quantized tensor with requested dtype
+
     The op does the following:
-    1. figure out the dimension for reduction based on block_size, also reshape the input to align with
+    1. Figure out the dimension for reduction based on block_size, also reshape the input to align with
        the shape after reduction
-    2. quantize the input based on the quantization parameters scale and zero_point and zero_point_domain = FLOAT
-    3. reshape the quantized result to origianl shape
+    2. Quantize the input based on the quantization parameters scale and zero_point with zero_point_domain = FLOAT
+    3. Reshape the quantized result to original shape
 
     Note:
-        zero_point_domain is pre-defined specifies how we quantize the floating point to quantized data:
-        FLOAT: quantized_val = (float_val - (zero_point (float) - scale * mid_point)) / scale
+        zero_point_domain is pre-defined as FLOAT, meaning:
+        quantized_val = (float_val - (zero_point (float) - scale * mid_point)) / scale
     """
     quant_min, quant_max = _get_and_check_qmin_qmax(output_dtype, quant_min, quant_max)
     # workaround for uintx dtypes, since we don't have native Uintx dtype connected with
@@ -471,12 +524,26 @@ def _quantize_affine_tinygemm_no_dtype_cast(
     quant_min: Optional[Union[int, float]] = None,
     quant_max: Optional[Union[int, float]] = None,
 ) -> torch.Tensor:
-    """
+    """Quantize tensor using affine quantization with float zero point domain without dtype casting.
+
+    Specialized quantization for tinygemm int4mm kernel where zero point is in floating point domain.
+
+    Args:
+        input: Input tensor to quantize (float32, float16, or bfloat16)
+        block_size: Granularity of quantization - size of tensor elements sharing same qparam
+        scale: Quantization scale parameter
+        zero_point: Quantization zero point parameter (optional)
+        quant_min: Minimum quantized value
+        quant_max: Maximum quantized value
+
+    Returns:
+        Quantized tensor without dtype casting
+
     The op does the following:
-    1. figure out the dimension for reduction based on block_size, also reshape the input to align with
+    1. Figure out the dimension for reduction based on block_size, also reshape the input to align with
        the shape after reduction
-    2. quantize the input based on the quantization parameters scale and zero_point and zero_point_domain = FLOAT
-    3. reshape the quantized result to origianl shape
+    2. Quantize the input based on the quantization parameters scale and zero_point with zero_point_domain = FLOAT
+    3. Reshape the quantized result to original shape
     """
     # TODO: validations
     # TODO: validate scale/zero_point dimensions are compatible with block_size
@@ -513,7 +580,7 @@ def _quantize_affine_tinygemm_no_dtype_cast(
     return quant
 
 
-def quantize_affine_no_zero_point(
+def _quantize_affine_no_zero_point(
     input: torch.Tensor,
     block_size: List[int],
     scale: torch.Tensor,
@@ -522,17 +589,32 @@ def quantize_affine_no_zero_point(
     quant_min: Optional[Union[int, float, bool]] = None,
     quant_max: Optional[Union[int, float, bool]] = None,
 ) -> torch.Tensor:
-    """
+    """Quantize tensor using affine quantization without zero point.
+
+    Specialized quantization for cases where zero point is not needed (e.g., floatx quantization).
+
+    Args:
+        input: Input tensor to quantize (float32, float16, or bfloat16)
+        block_size: Granularity of quantization - size of tensor elements sharing same qparam
+        scale: Quantization scale parameter
+        zero_point: Quantization zero point parameter (ignored, should be None)
+        output_dtype: Target quantized dtype (e.g., torch.uint8, torch.int8)
+        quant_min: Minimum quantized value, derived from dtype if None
+        quant_max: Maximum quantized value, derived from dtype if None
+
+    Returns:
+        Quantized tensor with requested dtype
+
     The op does the following:
-    1. figure out the dimension for reduction based on block_size, also reshape the input to align with
+    1. Figure out the dimension for reduction based on block_size, also reshape the input to align with
        the shape after reduction
-    2. quantize the input based on the quantization parameters scale and zero_point and zero_point_domain = NONE
-    3. reshape the quantized result to origianl shape
+    2. Quantize the input based on the quantization parameters scale with zero_point_domain = NONE
+    3. Reshape the quantized result to original shape
 
     Note:
-        zero_point_domain is pre-defined specifies how we quantize the floating point to quantized data:
-        None: quantized_val = (float_val / scale) | this is primarily used for floatx quantization
-            Where we do not want to round values to nearest integer and instead scale and cast.
+        zero_point_domain is pre-defined as NONE, meaning:
+        quantized_val = (float_val / scale) | This is primarily used for floatx quantization
+        where we do not want to round values to nearest integer and instead scale and cast.
     """
     quant_min, quant_max = _get_and_check_qmin_qmax(output_dtype, quant_min, quant_max)
     # workaround for uintx dtypes, since we don't have native Uintx dtype connected with
@@ -557,12 +639,26 @@ def _quantize_affine_no_zero_point_no_dtype_cast(
     quant_min: Optional[Union[int, float]] = None,
     quant_max: Optional[Union[int, float]] = None,
 ) -> torch.Tensor:
-    """
+    """Quantize tensor using affine quantization without zero point and without dtype casting.
+
+    Specialized quantization for cases where zero point is not needed without casting to target dtype.
+
+    Args:
+        input: Input tensor to quantize (float32, float16, or bfloat16)
+        block_size: Granularity of quantization - size of tensor elements sharing same qparam
+        scale: Quantization scale parameter
+        zero_point: Quantization zero point parameter (ignored, should be None)
+        quant_min: Minimum quantized value
+        quant_max: Maximum quantized value
+
+    Returns:
+        Quantized tensor without dtype casting
+
     The op does the following:
-    1. figure out the dimension for reduction based on block_size, also reshape the input to align with
+    1. Figure out the dimension for reduction based on block_size, also reshape the input to align with
        the shape after reduction
-    2. quantize the input based on the quantization parameters scale and zero_point and zero_point_domain = NONE
-    3. reshape the quantized result to origianl shape
+    2. Quantize the input based on the quantization parameters scale with zero_point_domain = NONE
+    3. Reshape the quantized result to original shape
     """
     # TODO: validations
     # TODO: validate scale/zero_point dimensions are compatible with block_size
@@ -648,7 +744,23 @@ def _dequantize_affine(
     quant_max: Optional[Union[int, float, bool]] = None,
     output_dtype: torch.dtype = torch.float32,
 ) -> torch.Tensor:
-    """op definition that has compatible signatures with custom op library"""
+    """Dequantize tensor using affine dequantization with integer zero point domain.
+
+    Op definition that has compatible signatures with custom op library.
+
+    Args:
+        input: Quantized tensor to dequantize
+        block_size: Granularity of quantization - size of tensor elements sharing same qparam
+        scale: Quantization scale parameter
+        zero_point: Quantization zero point parameter (optional)
+        input_dtype: Expected dtype of input tensor (e.g., torch.uint8, torch.int8)
+        quant_min: Minimum quantized value for input tensor
+        quant_max: Maximum quantized value for input tensor
+        output_dtype: Target output dtype (default: torch.float32)
+
+    Returns:
+        Dequantized tensor with requested output dtype
+    """
     # TODO: validate scale/zero_point dimensions are compatible with block_size
     if input_dtype not in _SUB_BYTE_UINT_BOUNDS:
         assert input.dtype == input_dtype, (
@@ -680,13 +792,27 @@ def _dequantize_affine_no_dtype_check(
     quant_max: Union[int, float],
     output_dtype: torch.dtype = torch.float32,
 ) -> torch.Tensor:
-    """This function converts AQT tensors to their high precision floating point representation
+    """Dequantize tensor using affine dequantization without dtype checking.
+
+    Converts quantized tensors to their high precision floating point representation.
+
+    Args:
+        input: Quantized tensor to dequantize
+        block_size: Granularity of quantization - size of tensor elements sharing same qparam
+        scale: Quantization scale parameter
+        zero_point: Quantization zero point parameter (optional)
+        quant_min: Minimum quantized value for input tensor
+        quant_max: Maximum quantized value for input tensor
+        output_dtype: Target output dtype (default: torch.float32)
+
+    Returns:
+        Dequantized tensor with requested output dtype
 
     The op does the following:
-    1. figure out the dimension for reduction based on block_size, also reshape the input to align with
+    1. Figure out the dimension for reduction based on block_size, also reshape the input to align with
        the shape after reduction
-    2. dequantize the input based on the quantization parameters scale and zero_point and args like zero_point_domain
-    3. reshape the quantized result to origianl shape and change dtype to the output_dtype
+    2. Dequantize the input based on the quantization parameters scale and zero_point
+    3. Reshape the quantized result to original shape and change dtype to the output_dtype
     """
     assert len(block_size) == input.dim(), (
         f"Got input dim:{input.dim()}, block_size: {block_size}"
@@ -723,13 +849,27 @@ def _dequantize_affine_no_zero_point_no_dtype_check(
     quant_max: Union[int, float],
     output_dtype: torch.dtype = torch.float32,
 ) -> torch.Tensor:
-    """This function converts AQT tensors to their high precision floating point representation
+    """Dequantize tensor using affine dequantization without zero point and without dtype checking.
+
+    Converts quantized tensors to their high precision floating point representation without zero point.
+
+    Args:
+        input: Quantized tensor to dequantize
+        block_size: Granularity of quantization - size of tensor elements sharing same qparam
+        scale: Quantization scale parameter
+        zero_point: Quantization zero point parameter (ignored, should be None)
+        quant_min: Minimum quantized value for input tensor
+        quant_max: Maximum quantized value for input tensor
+        output_dtype: Target output dtype (default: torch.float32)
+
+    Returns:
+        Dequantized tensor with requested output dtype
 
     The op does the following:
-    1. figure out the dimension for reduction based on block_size, also reshape the input to align with
+    1. Figure out the dimension for reduction based on block_size, also reshape the input to align with
        the shape after reduction
-    2. dequantize the input based on the quantization parameters scale and zero_point and args like zero_point_domain
-    3. reshape the quantized result to origianl shape and change dtype to the output_dtype
+    2. Dequantize the input based on the quantization parameters scale (no zero point)
+    3. Reshape the quantized result to original shape and change dtype to the output_dtype
     """
     assert len(block_size) == input.dim(), (
         f"Got input dim:{input.dim()}, block_size: {block_size}"
@@ -745,7 +885,7 @@ def _dequantize_affine_no_zero_point_no_dtype_check(
     scale = scale.view(shape_after_reduction)
 
     assert zero_point is None, (
-        "zero_point should be None for dequantize_affine_no_zero_point"
+        "zero_point should be None for _dequantize_affine_no_zero_point"
     )
     dequant = input.to(output_dtype)
     dequant = dequant * scale
@@ -753,7 +893,7 @@ def _dequantize_affine_no_zero_point_no_dtype_check(
     return dequant.view(original_shape).to(output_dtype)
 
 
-def dequantize_affine_no_zero_point(
+def _dequantize_affine_no_zero_point(
     input: torch.Tensor,
     block_size: Tuple[int, ...],
     scale: torch.Tensor,
@@ -848,7 +988,7 @@ def _dequantize_affine_tinygemm_no_dtype_check(
     return dequant.view(original_shape).to(output_dtype)
 
 
-def dequantize_affine_tinygemm(
+def _dequantize_affine_tinygemm(
     input: torch.Tensor,
     block_size: Tuple[int, ...],
     scale: torch.Tensor,
@@ -898,7 +1038,7 @@ def dequantize_affine_tinygemm(
     )
 
 
-def fake_quantize_affine(
+def _fake_quantize_affine(
     input: torch.Tensor,
     block_size: Tuple[int, ...],
     scale: torch.Tensor,
@@ -946,7 +1086,7 @@ def fake_quantize_affine(
     return fq
 
 
-def fake_quantize_affine_cachemask(
+def _fake_quantize_affine_cachemask(
     input: torch.Tensor,
     block_size: Tuple[int, ...],
     scale: torch.Tensor,
@@ -961,12 +1101,12 @@ def fake_quantize_affine_cachemask(
     This is equivalent to calling `quantize_affine` + `dequantize_affine`
     but without the dtype casts.
 
-    Note: Compared to :func:`~torchao.quantization.quant_primitives.fake_quantize_affine`,
+    Note: Compared to :func:`~torchao.quantization.quant_primitives._fake_quantize_affine`,
     this consumes more memory and returns an additional outlier mask for
     intermediate quantized values.
 
     Args:
-      Same as :func:`~torchao.quantization.quant_primitives.fake_quantize_affine`.
+      Same as :func:`~torchao.quantization.quant_primitives._fake_quantize_affine`.
 
     Returns:
       A 2-tuple of (
@@ -1003,8 +1143,25 @@ def _do_fake_quantize_affine(
     quant_max: Optional[Union[int, float]] = None,
     zero_point_domain: ZeroPointDomain = ZeroPointDomain.INT,
 ) -> Tuple[torch.Tensor, torch.Tensor]:
-    """
-    Helper function for `fake_quantize_affine` that returns both the
+    """Helper function for fake quantization that returns both intermediate and final values.
+
+    Performs quantization followed by dequantization without dtype casting, returning both
+    the intermediate quantized values and the final dequantized values.
+
+    Args:
+        input: Input tensor to fake quantize (float32, float16, or bfloat16)
+        block_size: Granularity of quantization - size of tensor elements sharing same qparam
+        scale: Quantization scale parameter
+        zero_point: Quantization zero point parameter (optional)
+        quant_dtype: Target quantized dtype for determining quant_min/quant_max
+        quant_min: Minimum quantized value, derived from dtype if None
+        quant_max: Maximum quantized value, derived from dtype if None
+        zero_point_domain: Domain of zero point (INT, FLOAT, or NONE)
+
+    Returns:
+        Tuple of (intermediate quantized values, final dequantized values)
+
+    Helper function for `_fake_quantize_affine` that returns both the
     intermediate quantized values and the final dequantized values.
     """
     input_dtype = input.dtype
@@ -1086,7 +1243,7 @@ def choose_qparams_affine(
 
 # TODO: lower this op to custom op library
 @torch.no_grad()
-def choose_qparams_affine_tinygemm(
+def _choose_qparams_affine_tinygemm(
     input: torch.Tensor,
     mapping_type: MappingType,
     block_size: Tuple[int],
@@ -1157,7 +1314,7 @@ def choose_qparams_affine_tinygemm(
 
 
 # TODO: lower this op to custom op library
-def choose_qparams_affine_dont_preserve_zero(
+def _choose_qparams_affine_dont_preserve_zero(
     input: torch.Tensor,
     mapping_type: MappingType,
     block_size: Tuple[int],
@@ -1427,7 +1584,7 @@ def _choose_qparams_affine(
     )
 
 
-def choose_qparams_and_quantize_affine_qqq(
+def _choose_qparams_and_quantize_affine_qqq(
     w: torch.Tensor,
     num_bits: int,
     group_size: int,
@@ -1497,7 +1654,7 @@ def reshape_w(w):
     return q_w, s_group, s_channel, w_ref
 
 
-def choose_qparams_gguf(
+def _choose_qparams_gguf(
     input: Optional[torch.Tensor],
     block_size: List[int],
     target_dtype: torch.dtype,
@@ -1580,7 +1737,7 @@ def choose_qparams_gguf(
     )
 
 
-def quantize_gguf(
+def _quantize_gguf(
     input: torch.Tensor,
     block_size: List[int],
     target_dtype: torch.dtype,
@@ -1642,7 +1799,7 @@ def quantize_gguf(
     return int_data
 
 
-def dequantize_gguf(
+def _dequantize_gguf(
     input: torch.Tensor,
     block_size: List[int],
     target_dtype: torch.dtype,
@@ -1705,7 +1862,7 @@ def dequantize_gguf(
     return dequant
 
 
-def dequantize_affine_qqq(
+def _dequantize_affine_qqq(
     w: torch.Tensor,
     s_group: torch.Tensor,
     s_channel: torch.Tensor,
@@ -1845,7 +2002,7 @@ def _convert_to_affinequantized_format(
 
 
 # Main hqq quantizer function
-def choose_qparams_and_quantize_affine_hqq(
+def _choose_qparams_and_quantize_affine_hqq(
     tensor: torch.Tensor,
     nbits: float = 4,
     group_size: int = 64,
@@ -1857,6 +2014,28 @@ def choose_qparams_and_quantize_affine_hqq(
     raw_output: bool = False,  # If True, it will return the quant params in hqq lib format
     optimize_weights: Callable = optimize_weights_proximal_legacy,  # weights proximal optimizer function
 ) -> tuple:
+    """Choose quantization parameters and quantize tensor using HQQ (Half-Quadratic Quantization).
+
+    Performs quantization using HQQ method with optional weight optimization via proximal solver.
+
+    Args:
+        tensor: Input tensor to quantize (float32, float16, or bfloat16)
+        nbits: Number of bits for quantization (default: 4)
+        group_size: Size of quantization groups (default: 64)
+        optimize: Whether to optimize weights using proximal solver (default: True)
+        axis: Axis along which to perform quantization (0 or 1, default: 1)
+        compute_dtype: Target compute dtype (default: torch.float16)
+        device: Target device for computation (default: "cuda")
+        verbose: Whether to print optimization error information (default: False)
+        raw_output: If True, return params in HQQ library format (default: False)
+        optimize_weights: Weight optimization function (default: optimize_weights_proximal_legacy)
+
+    Returns:
+        Tuple of (quantized_weights, scale, zero_point, original_shape)
+
+    Note:
+        Uses proximal solver to minimize ||W - dequantize(quantize(W))||_p^p for weight optimization.
+    """
     assert axis in [0, 1], "axis should be either 0 or 1"
     if group_size is not None:
         assert _is_divisible(tensor.numel(), group_size), (
@@ -1939,9 +2118,25 @@ def choose_qparams_and_quantize_affine_hqq(
     return W_q, scale, zero, shape
 
 
-def choose_qparams_affine_floatx(
+def _choose_qparams_affine_floatx(
     tensor: torch.Tensor, ebits: int, mbits: int
 ) -> torch.Tensor:
+    """Choose quantization parameters for floatx quantization.
+
+    Calculates scale parameter for quantizing to custom floating point format.
+
+    Args:
+        tensor: Input tensor to quantize (float32, float16, or bfloat16)
+        ebits: Number of exponent bits in target floatx format
+        mbits: Number of mantissa bits in target floatx format
+
+    Returns:
+        Scale tensor for floatx quantization
+
+    Note:
+        Uses global lookup table as workaround for torch.compile() compatibility
+        since _n_ones() is not compatible due to << operator.
+    """
     # _n_ones() is not compatible with torch.compile() due to << operator
     # https://github.com/pytorch/pytorch/issues/119152
     # exp_bias = _n_ones(ebits - 1)
@@ -1959,7 +2154,7 @@ def choose_qparams_affine_floatx(
     return scale.to(dtype)
 
 
-def quantize_affine_floatx(
+def _quantize_affine_floatx(
     tensor: torch.Tensor, scale: torch.Tensor, ebits: int, mbits: int
 ) -> torch.Tensor:
     """Quantizes the float32 high precision floating point tensor to low precision floating point number and
@@ -1970,7 +2165,7 @@ def quantize_affine_floatx(
     return tensor_floatx
 
 
-def dequantize_affine_floatx(
+def _dequantize_affine_floatx(
     tensor: torch.Tensor,
     scale: torch.Tensor,
     ebits: int,
@@ -1983,7 +2178,7 @@ def dequantize_affine_floatx(
     return tensor
 
 
-def choose_qparams_affine_float8(
+def _choose_qparams_affine_float8(
     tensor: torch.Tensor,
     float8_dtype: torch.dtype = torch.float8_e4m3fn,
     scale_dtype: torch.dtype = torch.float32,
@@ -2075,7 +2270,7 @@ def _expand_scale_to_tensor_shape(
     return expanded_scale
 
 
-def quantize_affine_float8(
+def _quantize_affine_float8(
     tensor: torch.Tensor,
     scale: torch.Tensor,
     float8_dtype: torch.dtype = torch.float8_e4m3fn,
@@ -2095,7 +2290,7 @@ def quantize_affine_float8(
     return fp8_tensor
 
 
-def dequantize_affine_float8(
+def _dequantize_affine_float8(
     tensor: torch.Tensor,
     scale: torch.Tensor,
     output_dtype: torch.dtype = torch.float32,
diff --git a/torchao/quantization/utils.py b/torchao/quantization/utils.py
index 3c968e2d40..c7dd92d55c 100644
--- a/torchao/quantization/utils.py
+++ b/torchao/quantization/utils.py
@@ -15,15 +15,15 @@
 from torchao.quantization.quant_primitives import (
     MappingType,
     ZeroPointDomain,
+    _choose_qparams_affine_dont_preserve_zero,
+    _choose_qparams_affine_tinygemm,
+    _dequantize_affine_no_zero_point,
+    _dequantize_affine_tinygemm,
+    _quantize_affine_no_zero_point,
+    _quantize_affine_tinygemm,
     choose_qparams_affine,
-    choose_qparams_affine_dont_preserve_zero,
-    choose_qparams_affine_tinygemm,
     dequantize_affine,
-    dequantize_affine_no_zero_point,
-    dequantize_affine_tinygemm,
     quantize_affine,
-    quantize_affine_no_zero_point,
-    quantize_affine_tinygemm,
 )
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_5,
@@ -357,7 +357,7 @@ def get_groupwise_affine_qparams(
     )
 
     if zero_point_domain == ZeroPointDomain.FLOAT and not preserve_zero:
-        scale, zero_point = choose_qparams_affine_tinygemm(
+        scale, zero_point = _choose_qparams_affine_tinygemm(
             w,
             mapping_type,
             block_size,
@@ -369,7 +369,7 @@ def get_groupwise_affine_qparams(
             zero_point_dtype=zero_point_dtype,
         )
     elif zero_point_domain == ZeroPointDomain.INT and not preserve_zero:
-        scale, zero_point = choose_qparams_affine_dont_preserve_zero(
+        scale, zero_point = _choose_qparams_affine_dont_preserve_zero(
             w,
             mapping_type,
             block_size,
@@ -439,9 +439,9 @@ def groupwise_affine_quantize_tensor_from_qparams(
     if zero_point_domain == ZeroPointDomain.INT:
         _quantize_affine = quantize_affine
     elif zero_point_domain == ZeroPointDomain.FLOAT:
-        _quantize_affine = quantize_affine_tinygemm
+        _quantize_affine = _quantize_affine_tinygemm
     elif ZeroPointDomain == ZeroPointDomain.NONE:
-        _quantize_affine = quantize_affine_no_zero_point
+        _quantize_affine = _quantize_affine_no_zero_point
     else:
         raise ValueError(f"Unrecognized zero point domain: {zero_point_domain}")
 
@@ -508,9 +508,9 @@ def groupwise_affine_dequantize_tensor_from_qparams(
     if zero_point_domain == ZeroPointDomain.INT:
         _dequantize_affine = dequantize_affine
     elif zero_point_domain == ZeroPointDomain.FLOAT:
-        _dequantize_affine = dequantize_affine_tinygemm
+        _dequantize_affine = _dequantize_affine_tinygemm
     else:
-        _dequantize_affine = dequantize_affine_no_zero_point
+        _dequantize_affine = _dequantize_affine_no_zero_point
     return _dequantize_affine(
         w_int32,
         block_size,
diff --git a/tutorials/calibration_flow/gptq_like.py b/tutorials/calibration_flow/gptq_like.py
index ab7a2b4f37..df824e506f 100644
--- a/tutorials/calibration_flow/gptq_like.py
+++ b/tutorials/calibration_flow/gptq_like.py
@@ -48,7 +48,7 @@
     LinearActivationQuantizedTensor,
     MappingType,
     PerTensor,
-    fake_quantize_affine,
+    _fake_quantize_affine,
     quantize_,
     to_linear_activation_quantized,
 )
@@ -237,7 +237,9 @@ def forward_pre_hook(
         new_input = []
         for inp in args[0]:
             new_input.append(
-                fake_quantize_affine(inp, inp.shape, input_scale, input_zp, torch.uint8)
+                _fake_quantize_affine(
+                    inp, inp.shape, input_scale, input_zp, torch.uint8
+                )
             )
 
         mt = MultiTensor(new_input)

From 6a8887f942e2ce65ed274dcd497e830af5f406bf Mon Sep 17 00:00:00 2001
From: qizixi <22851944+zixi-qi@users.noreply.github.com>
Date: Tue, 17 Jun 2025 20:28:01 -0700
Subject: [PATCH 135/165] fix torchao quantized model in fbcode (#2396)

Summary:
Without this change, ran into:
> AttributeError: module 'fbgemm_gpu' has no attribute '__version__'

Differential Revision: D76858513
---
 torchao/quantization/quant_api.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index 7b40f388ed..1ee092eff3 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -81,6 +81,7 @@
     is_MI300,
     is_sm_at_least_89,
     is_sm_at_least_90,
+    is_fbcode,
 )
 
 from .autoquant import AutoQuantizableLinearWeight, autoquant
@@ -2010,7 +2011,7 @@ def _(module: torch.nn.Module, config: FbgemmConfig) -> torch.nn.Module:
 
     import fbgemm_gpu.experimental.gen_ai  # noqa: F401
 
-    if fbgemm_gpu.__version__ < "1.2.0":
+    if not is_fbcode() and fbgemm_gpu.__version__ < "1.2.0":
         raise ImportError("Requires fbgemm-gpu-genai >= 1.2.0")
 
     _SUPPORTED_DTYPES = {

From 8b12ddf7735ab82026e8fcd99e5232f44e5e779f Mon Sep 17 00:00:00 2001
From: andrewor14 <andrewor14@gmail.com>
Date: Wed, 18 Jun 2025 09:52:55 -0400
Subject: [PATCH 136/165] Fix ruff broken on main (#2404)

---
 torchao/quantization/quant_api.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index 1ee092eff3..8b66ac84ce 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -78,10 +78,10 @@
     TORCH_VERSION_AT_LEAST_2_4,
     TORCH_VERSION_AT_LEAST_2_5,
     TORCH_VERSION_AT_LEAST_2_6,
+    is_fbcode,
     is_MI300,
     is_sm_at_least_89,
     is_sm_at_least_90,
-    is_fbcode,
 )
 
 from .autoquant import AutoQuantizableLinearWeight, autoquant

From c561d263dbe16b0852cc72ef9c1e773f2e74eb40 Mon Sep 17 00:00:00 2001
From: andrewor14 <andrewor14@gmail.com>
Date: Wed, 18 Jun 2025 12:24:12 -0400
Subject: [PATCH 137/165] Add part 2 of end-to-end tutorial: fine-tuning
 (#2394)

This commit adds the QAT tutorial and a general structure for
the fine-tuning tutorial, which all also include QLoRA and float8
quantized fine-tuning. It also connects the 3 tutorial parts
(pre-training, fine-tuning, and serving) into one cohesive
end-to-end flow with some visuals and text.
---
 docs/source/finetuning.rst     | 293 +++++++++++++++++++++++++++++++++
 docs/source/index.rst          |   8 +-
 docs/source/pretraining.rst    |  43 +++--
 docs/source/serving.rst        |  12 ++
 docs/static/e2e_flow_part1.png | Bin 0 -> 258271 bytes
 docs/static/e2e_flow_part2.png | Bin 0 -> 265822 bytes
 docs/static/e2e_flow_part3.png | Bin 0 -> 279562 bytes
 docs/static/qat_eval.png       | Bin 0 -> 224659 bytes
 8 files changed, 338 insertions(+), 18 deletions(-)
 create mode 100644 docs/source/finetuning.rst
 create mode 100644 docs/source/serving.rst
 create mode 100644 docs/static/e2e_flow_part1.png
 create mode 100644 docs/static/e2e_flow_part2.png
 create mode 100644 docs/static/e2e_flow_part3.png
 create mode 100644 docs/static/qat_eval.png

diff --git a/docs/source/finetuning.rst b/docs/source/finetuning.rst
new file mode 100644
index 0000000000..00e2471e7f
--- /dev/null
+++ b/docs/source/finetuning.rst
@@ -0,0 +1,293 @@
+(Part 2) Fine-tuning with QAT, QLoRA, and float8
+------------------------------------------------
+
+TorchAO provides an end-to-end pre-training, fine-tuning, and serving
+model optimization flow by leveraging our quantization and sparsity
+techniques integrated into our partner frameworks. This is part 2 of 3
+such tutorials showcasing this end-to-end flow, focusing on the
+fine-tuning step.
+
+.. image:: ../static/e2e_flow_part2.png
+
+Fine-tuning is an important step for adapting your pre-trained model
+to more domain-specific data. In this tutorial, we demonstrate 3 model
+optimization techniques that can be applied to your model during fine-tuning:
+
+1. **Quantization-Aware Training (QAT)**, for adapting your model to
+quantization numerics during fine-tuning, with the goal of mitigating
+quantization degradations in your fine-tuned model when it is quantized
+eventually, e.g. in the serving step. Check out `our blog <https://pytorch.org/blog/quantization-aware-training/>`__
+and `README <https://github.com/pytorch/ao/blob/main/torchao/quantization/qat/README.md>`__ for more details!
+
+2. **Quantized Low-Rank Adaptation (QLoRA)**, for reducing the resource
+requirement of fine-tuning by introducing small, trainable low-rank
+matrices and freezing the original pre-trained checkpoint, a type of
+Parameter-Efficient Fine-Tuning (PEFT). Please refer to the `original
+paper <https://arxiv.org/pdf/2305.14314>`__ for more details.
+
+3. **Float8 Quantized Fine-tuning**, for speeding up fine-tuning by
+dynamically quantizing high precision weights and activations to float8,
+similar to `pre-training in float8 <pretraining.html>`__.
+
+
+Quantization-Aware Training (QAT)
+##################################
+
+The goal of Quantization-Aware Training is to adapt the model to
+quantization numerics during training or fine-tuning, so as to mitigate
+the inevitable quantization degradation when the model is actually
+quantized eventually, presumably during the serving step after fine-tuning.
+TorchAO's QAT support has been used successfully for the recent release of
+the `Llama-3.2 quantized 1B/3B <https://ai.meta.com/blog/meta-llama-quantized-lightweight-models/>`__
+and the `LlamaGuard-3-8B <https://github.com/meta-llama/PurpleLlama/blob/main/Llama-Guard3/8B/MODEL_CARD.md>`__ models to improve the quality of the quantized models.
+
+TorchAO's QAT support involves two separate steps: prepare and convert.
+The prepare step "fake" quantizes activations and/or weights during
+training, which means, the high precision values (e.g. bf16) are mapped
+to their corresponding quantized values *without* actually casting them
+to the target lower precision dtype (e.g. int4). The convert step,
+applied after training, replaces "fake" quantization operations in the
+model with "real" quantization that does perform the dtype casting:
+
+.. image:: ../../torchao/quantization/qat/images/qat_diagram.png
+
+There are multiple options for using TorchAO's QAT for fine-tuning:
+
+1. Use our integration with `TorchTune <https://github.com/pytorch/torchtune>`__
+2. Use our integration with `Axolotl <https://github.com/axolotl-ai-cloud/axolotl>`__
+3. Directly use our QAT APIs with your own training loop
+
+
+Option 1: TorchTune QAT Integration
+===================================
+
+TorchAO's QAT support is integrated into TorchTune's distributed fine-tuning recipe.
+Instead of the following command, which applies full distributed fine-tuning without QAT:
+
+.. code::
+
+  # Regular fine-tuning without QAT
+  tune run --nnodes 1 --nproc_per_node 4 full_finetune_distributed --config llama3_2/3B_full batch_size=16
+
+Users can run the following equivalent command instead. Note that specifying the quantizer
+is optional:
+
+.. code::
+
+  # Fine-tuning with QAT, by default:
+  #   activations are fake quantized to asymmetric per token int8
+  #   weights are fake quantized to symmetric per group int4 
+  #   configurable through "quantizer._component_" in the command
+  tune run --nnodes 1 --nproc_per_node 4 qat_distributed --config llama3_2/3B_qat_full batch_size=16
+
+After fine-tuning, users can quantize and evaluate the resulting model as follows.
+This is the same whether or not QAT was used during the fine-tuning process:
+
+.. code::
+
+  # Quantize model weights to int4
+  tune run quantize --config quantization \
+      model._component_=torchtune.models.llama3_2.llama3_2_3b \
+      checkpointer._component_=torchtune.training.FullModelHFCheckpointer \
+      'checkpointer.checkpoint_files=[model-00001-of-00002.safetensors,model-00002-of-00002.safetensors]' \
+      checkpointer.model_type=LLAMA3 \
+      quantizer._component_=torchtune.training.quantization.Int8DynActInt4WeightQuantizer \
+      quantizer.groupsize=32
+
+  # Evaluate the int4 model on hellaswag and wikitext
+  tune run eleuther_eval --config eleuther_evaluation \
+      batch_size=1 \
+      'tasks=[hellaswag, wikitext]' \
+      model._component_=torchtune.models.llama3_2.llama3_2_3b \
+      checkpointer._component_=torchtune.training.FullModelTorchTuneCheckpointer \
+      'checkpointer.checkpoint_files=[model-00001-of-00002-8da4w.ckpt]' \
+      checkpointer.model_type=LLAMA3 \
+      tokenizer._component_=torchtune.models.llama3.llama3_tokenizer \
+      tokenizer.path=/tmp/Meta-Llama-3-8B-Instruct/original/tokenizer.model \
+      quantizer._component_=torchtune.training.quantization.Int8DynActInt4WeightQuantizer \
+      quantizer.groupsize=32
+
+This should print the following after fine-tuning:
+
+.. code::
+
+  |  Tasks  |Version|Filter|n-shot| Metric |   |Value |   |Stderr|
+  |---------|------:|------|------|--------|---|-----:|---|-----:|
+  |hellaswag|      1|none  |None  |acc     |↑  |0.5021|±  |0.0050|
+  |         |       |none  |None  |acc_norm|↑  |0.6797|±  |0.0047|
+
+  | Tasks  |Version|Filter|n-shot|    Metric     |   | Value |   |Stderr|
+  |--------|------:|------|------|---------------|---|------:|---|------|
+  |wikitext|      2|none  |None  |bits_per_byte  |↓  | 0.6965|±  |   N/A|
+  |        |       |none  |None  |byte_perplexity|↓  | 1.6206|±  |   N/A|
+  |        |       |none  |None  |word_perplexity|↓  |13.2199|±  |   N/A|
+
+You can compare these values with and without QAT to see how much QAT helped mitigate quantization degradation!
+For example, when fine-tuning Llama-3.2-3B on the
+`OpenAssistant Conversations (OASST1) <https://huggingface.co/datasets/OpenAssistant/oasst1>`__
+dataset, we find that the quantized model achieved 3.4% higher accuracy
+with QAT than without, recovering 69.8% of the overall accuracy degradation
+from quantization:
+
+.. image:: ../static/qat_eval.png
+
+In addition to vanilla QAT as in the above example, TorchAO's QAT can also be composed with LoRA to yield a `1.89x training speedup <https://dev-discuss.pytorch.org/t/speeding-up-qat-by-1-89x-with-lora/2700>`__ and lower memory usage by 36.1%. This is implemented in TorchTune's `QAT + LoRA fine-tuning recipe <https://github.com/pytorch/torchtune/blob/main/recipes/qat_lora_finetune_distributed.py>`__, which can be run using the following command:
+
+.. code::
+
+  # Fine-tuning with QAT + LoRA
+  tune run --nnodes 1 --nproc_per_node 4 qat_lora_finetune_distributed --config llama3_2/3B_qat_lora batch_size=16
+
+For more details about how QAT is set up in TorchTune, please refer to `this tutorial <https://docs.pytorch.org/torchtune/main/tutorials/qat_finetune.html>`__.
+
+
+Option 2: Axolotl QAT Integration
+=================================
+
+Axolotl also recently added a QAT fine-tuning recipe that leverages TorchAO's QAT support.
+To get started, try fine-tuning Llama-3.2-3B with QAT using the following command:
+
+.. code::
+
+  axolotl train examples/llama-3/3b-qat-fsdp2.yaml
+  # once training is complete, perform the quantization step
+
+  axolotl quantize examples/llama-3/3b-qat-fsdp2.yaml
+  # you should now have a quantized model saved in ./outputs/qat_out/quatized
+
+Please refer to the `Axolotl QAT documentation <https://docs.axolotl.ai/docs/qat.html>`__ for full details.
+
+
+Option 3: TorchAO QAT API
+=========================
+
+If you prefer to use a different training framework or your own custom training loop,
+you can call TorchAO's QAT APIs directly to transform the model before fine-tuning.
+These APIs are what the TorchTune and Axolotl QAT integrations call under the hood.
+
+In this example, we will fine-tune a mini version of Llama3 on a single GPU:
+
+.. code:: py
+
+  import torch
+  from torchtune.models.llama3 import llama3
+
+  # Set up a smaller version of llama3 to fit in a single A100 GPU
+  # For smaller GPUs, adjust the model attributes accordingly
+  def get_model():
+      return llama3(
+          vocab_size=4096,
+          num_layers=16,
+          num_heads=16,
+          num_kv_heads=4,
+          embed_dim=2048,
+          max_seq_len=2048,
+      ).cuda()
+
+  # Example training loop
+  def train_loop(m: torch.nn.Module):
+      optimizer = torch.optim.SGD(m.parameters(), lr=0.001, momentum=0.9, weight_decay=1e-5)
+      loss_fn = torch.nn.CrossEntropyLoss()
+      for i in range(10):
+          example = torch.randint(0, 4096, (2, 16)).cuda()
+          target = torch.randn((2, 16, 4096)).cuda()
+          output = m(example)
+          loss = loss_fn(output, target)
+          loss.backward()
+          optimizer.step()
+          optimizer.zero_grad()
+
+Next, run the prepare step, which fake quantizes the model. In this example,
+we use int8 per token dynamic activations and int4 symmetric per group weights
+as our quantization scheme. Note that although we are targeting lower integer
+precisions, training still performs arithmetic in higher float precision (float32)
+because we are not actually casting the fake quantized values.
+
+.. code:: py
+
+  from torchao.quantization import (
+      quantize_,
+  )
+  from torchao.quantization.qat import (
+      FakeQuantizeConfig,
+      IntXQuantizationAwareTrainingConfig,
+  )
+  model = get_model()
+
+  # prepare: insert fake quantization ops
+  # swaps `torch.nn.Linear` with `FakeQuantizedLinear`
+  activation_config = FakeQuantizeConfig(torch.int8, "per_token", is_symmetric=False)
+  weight_config = FakeQuantizeConfig(torch.int4, group_size=32)
+  qat_config = IntXQuantizationAwareTrainingConfig(activation_config, weight_config)
+  quantize_(model, qat_config)
+
+  # fine-tune
+  train_loop(model)
+
+After fine-tuning, we end up with a model in the original high precision.
+This fine-tuned model has the exact same structure as the original model.
+The only difference is the QAT fine-tuned model has weights that are more
+attuned to quantization, which will be beneficial later during inference.
+The next step is to actually quantize the model:
+
+.. code:: py
+
+  from torchao.quantization import (
+      Int8DynamicActivationInt4WeightConfig,
+  )
+  from torchao.quantization.qat import (
+      FromIntXQuantizationAwareTrainingConfig,
+  )
+
+  # convert: transform fake quantization ops into actual quantized ops
+  # swap `FakeQuantizedLinear` back to `torch.nn.Linear` and inserts
+  # quantized activation and weight tensor subclasses
+  quantize_(model, FromIntXQuantizationAwareTrainingConfig())
+  quantize_(model, Int8DynamicActivationInt4WeightConfig(group_size=32))
+
+Now our model is ready for serving, and will typically have higher quantized
+accuracy than if we did not apply the prepare step (fake quantization) during
+fine-tuning.
+
+For full details of using TorchAO's QAT API, please refer to the `QAT README <https://github.com/pytorch/ao/blob/main/torchao/quantization/qat/README.md>`__.
+
+.. raw:: html
+
+   <details>
+   <summary><a>Alternative Legacy API</a></summary>
+
+The above `quantize_` API is the recommended flow for using TorchAO QAT.
+We also offer an alternative legacy "quantizer" API for specific quantization
+schemes, but these are not customizable unlike the above example.
+
+.. code::
+
+  from torchao.quantization.qat import Int8DynActInt4WeightQATQuantizer
+  qat_quantizer = Int8DynActInt4WeightQATQuantizer(group_size=32)
+
+  # prepare: insert fake quantization ops
+  # swaps `torch.nn.Linear` with `Int8DynActInt4WeightQATLinear`
+  model = qat_quantizer.prepare(model)
+
+  # train
+  train_loop(model)
+
+  # convert: transform fake quantization ops into actual quantized ops
+  # swaps `Int8DynActInt4WeightQATLinear` with `Int8DynActInt4WeightLinear`
+  model = qat_quantizer.convert(model)
+
+.. raw:: html
+
+   </details>
+
+
+Quantized Low-Rank Adaptation (QLoRA)
+#####################################
+
+(Coming soon!)
+
+
+Float8 Quantized Fine-tuning
+############################
+
+(Coming soon!)
diff --git a/docs/source/index.rst b/docs/source/index.rst
index d4d8580863..aac72590fd 100644
--- a/docs/source/index.rst
+++ b/docs/source/index.rst
@@ -37,12 +37,14 @@ for an overall introduction to the library and recent highlight and updates.
    :maxdepth: 1
    :caption: Eager Quantization Tutorials
 
+   pretraining
+   finetuning
+   serving
+   torchao_vllm_integration
    serialization
+   static_quantization
    subclass_basic
    subclass_advanced
-   static_quantization
-   pretraining
-   torchao_vllm_integration
 
 .. toctree::
    :glob:
diff --git a/docs/source/pretraining.rst b/docs/source/pretraining.rst
index 441b8c4a4b..da9659b9a0 100644
--- a/docs/source/pretraining.rst
+++ b/docs/source/pretraining.rst
@@ -1,21 +1,29 @@
-Pretraining with float8
+(Part 1) Pre-training with float8
 ---------------------------------
 
-Pretraining with float8 using torchao can provide `up to 1.5x speedups <https://pytorch.org/blog/training-using-float8-fsdp2/>`__ on 512 GPU clusters,
+TorchAO provides an end-to-end pre-training, fine-tuning, and serving
+model optimization flow by leveraging our quantization and sparsity
+techniques integrated into our partner frameworks. This is part 1 of 3
+such tutorials showcasing this end-to-end flow, focusing on the
+pre-training step.
+
+.. image:: ../static/e2e_flow_part1.png
+
+Pre-training with float8 using torchao can provide `up to 1.5x speedups <https://pytorch.org/blog/training-using-float8-fsdp2/>`__ on 512 GPU clusters,
 and up to `1.34-1.43x speedups <https://pytorch.org/blog/accelerating-large-scale-training-and-convergence-with-pytorch-float8-rowwise-on-crusoe-2k-h200s/>`__ on 2K H200 clusters with the latest `torchao.float8` rowwise recipe.
 
-In this tutorial, we will show 2 ways to use the **torchao.float8** recipes for pretraining:
+In this tutorial, we will show 2 ways to use the **torchao.float8** recipes for pre-training:
 
-1. :ref:`Pretraining with torchtitan`, the offical PyTorch pretraining framework with native torchao integration.
-2. :ref:`Pretraining with torchao directly`, to integrate torchao's float8 training recipes into your own pretraining code.
+1. :ref:`Pre-training with torchtitan`, the offical PyTorch pre-training framework with native torchao integration.
+2. :ref:`Pre-training with torchao directly`, to integrate torchao's float8 training recipes into your own pre-training code.
 
 
-Pretraining with torchtitan
+Pre-training with torchtitan
 ###########################
 
-In this tutorial we'll pretrain Llama3 8b using torchtitan with torchao's float8 training recipes: rowwise scaling and tensorwise scaling.
+In this tutorial we'll pre-train Llama3-8B using torchtitan with torchao's float8 training recipes: rowwise scaling and tensorwise scaling.
 
-`Torchtitan <https://github.com/pytorch/torchtitan/>`__ is PyTorch's official pretraining framework that is natively integrated with torchao, and supports
+`Torchtitan <https://github.com/pytorch/torchtitan/>`__ is PyTorch's official pre-training framework that is natively integrated with torchao, and supports
 several popular flagship models with common forms of parallelism, float8 training, distributed checkpointing and more.
 See the torchtitan `docs <https://github.com/pytorch/torchtitan>`__ for additional details.
 
@@ -29,12 +37,12 @@ Prerequisites
 2. `Install torchao <https://github.com/pytorch/ao/tree/main?tab=readme-ov-file#installation>`__.
 3. `Install torchtitan <https://github.com/pytorch/torchtitan/tree/main?tab=readme-ov-file#installation>`__, including the "downloading a tokenizer" step.
 
-You're now ready to start a pretraining job using one of the recipes below!
+You're now ready to start a pre-training job using one of the recipes below!
 
 Rowwise scaling
 ===============
 
-Run the following command from torchtitan root directory to launch a Llama3 8b training job on 8 GPUs with float8 rowwise training:
+Run the following command from torchtitan root directory to launch a Llama3-8B training job on 8 GPUs with float8 rowwise training:
 
 .. code:: console
 
@@ -104,10 +112,10 @@ Picking a recipe
 The higher throughput of tensorwise scaling comes at the cost of slightly higher quantization error (i.e., reduced numerical integrity vs bfloat16) compared to rowwise scaling.
 This is because rowwise scaling using a more granular scaling factor (per row, instead of per tensor), which limits the impact of outliers that can cause underflow during scaling.
 
-Below you can see the loss curves comparing bfloat16, float8 tensorwise, and float8 rowwise training for training Llama3 8b on 8xH100 GPUs:
+Below you can see the loss curves comparing bfloat16, float8 tensorwise, and float8 rowwise training for training Llama3-8B on 8xH100 GPUs:
 
 .. image:: ../static/fp8-loss-curves.png
-  :alt: Loss curves for training Llama3 8b on 8xH100s with torchtitan using bfloat16, float8 tensorwise, and float8 rowwise training.
+  :alt: Loss curves for training Llama3-8B on 8xH100s with torchtitan using bfloat16, float8 tensorwise, and float8 rowwise training.
 
 
 Important notes
@@ -117,12 +125,12 @@ Important notes
 * You must use :code:`--training.compile` to achieve high performance. torchao float8 training recipes are built natively on top of :code:`torch.compile`, so it will work out of the box!
 
 
-Pretraining with torchao directly
+Pre-training with torchao directly
 #################################
 
-In this tutorial we'll pretrain a toy model using torchao APIs directly.
+In this tutorial we'll pre-train a toy model using torchao APIs directly.
 
-You can use this workflow to integrate torchao into your own custom pretraining code directly.
+You can use this workflow to integrate torchao into your own custom pre-training code directly.
 
 Prerequisites
 ================
@@ -200,3 +208,8 @@ Below is a code snippet showing how to use it:
         'model_state_dict': m.state_dict(),
         'optimizer_state_dict': optimizer.state_dict(),
     }, 'checkpoint.pth')
+
+
+After pre-training your model, you can optionally fine-tune it to more domain-specific datasets
+and adapt it for eventual quantization during serving. In the `next part <finetuning.html>`__ of
+this tutorial, we will explore a few model optimization options during the fine-tuning step.
diff --git a/docs/source/serving.rst b/docs/source/serving.rst
new file mode 100644
index 0000000000..cb61b159c4
--- /dev/null
+++ b/docs/source/serving.rst
@@ -0,0 +1,12 @@
+(Part 3) Serving on vLLM, SGLang, ExecuTorch
+------------------------------------------------
+
+TorchAO provides an end-to-end pre-training, fine-tuning, and serving
+model optimization flow by leveraging our quantization and sparsity
+techniques integrated into our partner frameworks. This is part 3 of 3
+such tutorials showcasing this end-to-end flow, focusing on the
+serving step.
+
+.. image:: ../static/e2e_flow_part3.png
+
+(Coming soon!)
diff --git a/docs/static/e2e_flow_part1.png b/docs/static/e2e_flow_part1.png
new file mode 100644
index 0000000000000000000000000000000000000000..bb996f7e2fcf039b2fb9efdc517aa01f1db1338f
GIT binary patch
literal 258271
zcmeFZXH-*b*Def*im*l4G^GnF(xpqNN|UZ4y($9IrT3;N2m&h7t5hKnYCu9$s?s5n
zNN57md+%`W#oqgUp7DJ@%pPZq^Xp{{Oi0$cbC)@<dChCi`0B2P(s@#PQUU^k^U8PR
z?-LM^784MhzD{xmys|`dR*Qh(4^?Y9xx318a;$fq9WAZxEC>khyo%91YZR@-Q19{h
zHVH*&;OpWzRyOv)*AzNG7;Zhd{U__|i&W3T7&vu`9Voxt>*bPj(v}S)L)v6tUovL=
zcpa%1Zn(=w+|%cHP}jb^bhJC_a_o~jUF*R}u)$aNATivA=ncoWxaKqaW!E@zi|<GU
zl6+hVIi*@B%Qq>n6mm-M<$iq}7E6$^z%Owfc_e;h8XkN13LQb9yj(Khd$KjwBT9lA
zZPu8{Q?l=GkNE1;J$Qw^Rlxq7{I*eMQv%mee$y<MuT#%8=~%K=c7m^SzI8lQ1QF6-
z%See6?uL+Op4RyDgC0={OOv#hmryVT|Fa)waGynHRs7udbYTerXf>AJU+Y3j#ayvp
zZj)2AXICAFA6vnWJifJS|55btJls2$=ZelHp^m}K<Vz1#3dmOtmAxNRH{l4<Kk40k
zQq<JJqj2Y08#9vfYt;>_z;mltyc`%EL!)TcPBpNK2H%u>$8bsdvDW*`<o9u(4?fV0
z`<h5Lc~f9Re+4<oiMCn@Jqp3r#$KLqez}wDJCJ@s<*+*}nK)8~1>N=M>dOs*)`o(e
zE1`K5XQ@M}*e_!OZ{AO(q7!`_Z4loa!C3K@^HEHRo-7ZQ^0PzjJw30NJlEa7*70dd
zGfKEis&<4kHpH!!jmtf#YG6LM^Zck$uUPtRaP*A=_IH}(ERhP=Nl6|wM@B2W3%*Gc
zHLtvWXs+$zBw_8a@kVNizwNxvnk7YRJK6ZlY1&_noq2t&s#&|et6VaxZFc@o%G+3c
zSxC+rQ4r|K657Jz2}^@MWme|V9ce`n6H31cQe!0|m+M%0o%MzCoZW=%<sBwA$~RFR
z>nw~kK}25z=$pC3S4nbhm}Fae;_qKQEBW%~h2S8g9aDjiS1zrxQc6C1y~D!1`jF=H
zMdydwk;gv%@rMmhS*fI(uD{fM+#ACCDyWIz5s5(PlW>Ng(x2#<$qi-nQk+DW1Q=WC
zd>YJebBqy=aeWAX>Vo=oN3^Y-r04YJ^OtMUM{fR4xj)W^?N5x{W#XDp8zQ**lkX`L
z`4X9~`wJeAuZ|WvdYR?Nv|n^}pL~rRm%qhne%+rssaHs3LD)#?!TYKsm<*RGT4}A5
z>C&ZI>23G|*+Ujl+@Jfj5}_$yG|Z-pbqdZE7n|z|VIrCCjlX5ue)6>Sd=ah0j3)W_
zOSM*YM*0@lCN(xSq%>Hx&37{fcH5HPO31;Ku61>^Svmb=kZT%OCXSrY>(b~#5L_RX
z$!{Hm$A8%-ZLm9T;N3k>uxx(n)F~OivD;CE#iLBpf074`+5K4Q&p7jWppocBfo$_w
z+e?BpMpw`6*;D3b<aTC~U7yc;63S4J+`dH}diI+c{f0EzlFOy|(^Ems>BR4Yw9TYG
z5*vPTzk6yc@KpM_@@G^(t)4O)5$k@j|Kx-E;?i^0<oN}XXKyIz8)P>qsha*QQA(y1
z9e+;DHg<>S-RrE&38BRISl8cNy>qGbOrCtjW#m`?UpJhI#6w)!#NO`Txv<8u#@u|@
z?ZH`*+l4)=*BK_$A3l+U(R9jNWxRMIfFdfCh4&6WVfQAIiZW5C?wNifbLNJ~>sJYn
z$S*QXJi4bx8XNSj__Q9UPNcT^c|Ee4uDBAu0y>`%DyK7D4NO1D$-huNC6uNz4did-
zUZt<0lzCy=vOM9pV?`8UcBh!b^H0y<Z^3E}Jh#t%NG^_k8v2xeM0GeAE6?^;x%?Wc
z(MKR5UOidWNMlHCNL5l};fnN?t>`;f{N71@OQKd7k6u&0niY{XoMoP+n&r@ESV}(-
zyr4$Tmiy-FFE(fKsz~4WzON2~4}vn3OR_xgXI#JC#@MFPMy^6ONtB(m7L>1m%<<Nm
z$Q$_H{GHV1)TZzz`DRRFVq!vKh{5YbJ^Qx?FL2VxGMnxGkvv=YV4h3ARzJ-g_jivx
z7Tx;1qcFux{oaEooaMeaQUl(_D~rsFg=gd%?>*1G{9W(kz3kqPPRbLfQ*Kvgxy+zv
zUTiq;-P$|tU35(Wtr89YhBZpp&-T(=M_Ja>%Go~Cd9Ra-aV~@vx)^98m2o<_Al&W6
zM~jO%4kU}<jhEuj+bM3u-f+L6A%t=Zg<)WlDRwD>DN-;dm>&v<;zPYcmAS!Pqh{O%
z1afGiTRSWekD1L(%<EXpg<lFO3R@1uzZ8gTsp(~aPv>&<arY0xJ+zl=rB!9_$|waO
z{iBbJPYr$UVr?;t{X+X3eWupjt;IWn<~1*qkJ$pR-1nZY8<?kvG51FIMt^qmOf&Yp
zUd7C4#o87%bD0Ud3AYxd2p_eJ*QBpKigvr!s+L;fs?Vsy2Y==k)^BC=g#J<fjbTgN
z!@VyZIG!&BU+szpj9v1@2PGSQQ@oPA(q6n$2yT`P_YOCVrB<!5h@CvsE)?rnP*C`;
zAl5)cUkZsSo6@H<z#5L0d>Gilb(H5-R6SBHw-}uI;ZRZgBm`H5vl!4GFfLYF9A0SN
zN?Md?rEKwf9sL^4>@j?6IB4ST&%4V{N8ip~T+;jX<JZokn&zGNtMJyeOUDD>`Z=-I
zA?U?(II7zm)ap+XR&vWy%05@M?Y7C|n$lm9afoXA&OTaZa~>FXZj2eDA47ddc5X%|
zRVQ^6ekp7nZjkEqi{5vuAeTt2P4>e)|2ei?(v#Ugk&>HaRX0u8EmOl-<6JXWld4gg
zdL^;kyid+i$gyr)beWGORx`1CTiUoTr_OiOX7sH8l>hDe6o1W|70Gs84qapc903W(
zmygAaG?#prRtb1mZ>9^Uv)`4tak*G<#pI3tUCX<EcTJ0JSB8F0Tn>Iy{HFgh)=N>6
zuqYNwH^&T<*?17|t!JcX@#Fc^>Zkgis>Jk^^d+L>8d(-uS4ufa<ySK>io+2Vk*Svs
zwf+#e2Fu}^a#{%f;Z<Tae$fd%F*k0~y5Cy#x<17$I{nTQ)hv#jYnW?w%A|J;qQ8rH
z9sJsj?&e^)5+0qTb%*m6r-asCF0qEbOtwV72=dA%?!kOsS#D~Q<qcjB+}qiW*@M}$
zXcB8>Yd33_-FpW%{sAz4KP~UHK<*!`o_rfr2&%2n8U<T<O~D!=%wx&UjV`04f#}I3
z?bLqmsW9$l{xZ4JO3V6hui6G;gx(~*uNI3+j*Ios%i#U?HaYR3r1{osjl9}&d7KE^
zWoj?Muk^-%hB#Xqmtz+;h-Gh)l%ZKHZ2z?MY3<XFR#&@VHw|qo9=q=|R*Sb!Npk+d
zb?}f+TK7h!ed=sY^ZHWvbjN4~f&QDibo&px4dX9{!=KUh^W^Y#=^xm>)#^>msE@tE
zYt1RjW%A%)CF!T*oT{+O<Ez*>Z{FcO-lM{u!AJ|LID4b5st0;|stH>9UIVR@&nD}A
z#m1_`me1%sE|}4qt#EGV8t3|!ZwvR+#TN7$XnmR*!-XOv=Jn=Pu!l(hy*-ynzDYx|
zyJFWxUA2RCg&oU(e6pEnZ7XPlYaeO*h+T3psF>}v9Gg-#Jg5-16Tul&Y#wfpFFV?i
zjbQZbwT<giKGmA-PcXfb=sNg(^uay%OIK-1n!B>QTYnQKIp3|Quu!PLP(KR8J?G<|
zyHxjy!%WlVxm;sKZAY!e{%7gtI;(y3mZ=1Vd-@{lzFA{btc(M!>E;7msBo9{f^D14
zoQ;OVk|d+|r^06VWRGT~%%Y8meIYEv=kesdx!&>2Q>~;?n=En6%TjN>#vcxDR19)(
zq}4ccO+9FxEk;`fknipOy400mZdKb|k-9GFu|v1TuRcB8C00>g!LrxCiIrn=V2Yp{
z;ukjE`1GSsJa2vG>ZmFQ-&v!hUDD;YUHDsFiK44U)lO2I-q`bF5xHV6j&(KKPv;vK
z6+B2hRF-W<c<Ze^i}u6@N4MOo+?c9Zp4K1U8hSo>;q-+xnRhaKKa3CJw>}-b`WB7L
z?b0;#dFIV0owQc4U$wCtGV*Q|=|8&BFx4CtuyfcuB34zjpS>{oIj!AvwjQ?`*KTTm
z*n7BbGF^MLlCx2GG??hI;9)hwQ5&%K5Tn%B8m3v1W*{BnS10sF>;~&(`_A(;qKkK#
z?F9*TT<8eO9}`?$8M>2_0b?Pjm3PZwlK(05u>X>C@h8F_g8Er=?=ftr8^P8h!DrGr
zv=(7#4k5)dVb3cnrMVS-hn1l`9(hmE9qBDCZxh&#n1b82!?xvKsk`~8z}~}pg0{J5
zyH&|sAkQEOv(QtvR97e90?$bZhzaQlPJ?HJ;8&WE;eVbh5?&`bb@Dn90YQj00rB70
zXn;rP=MDIU?)mHS)Vr4iXTe{8f?v;cqJOR?Elxl6&-2sQ!FvR^wB(eP!K0SBvxS9&
z%M(XeSBF>+@WQ#Lcl2Ed2xzZDzl6&7udIOae^@`zbJbH<gPA+p^F4g*_{f6K)BY(m
z4uPa63_P{BaDB+?X>aG?0`rt&JGlY|o<lG5v$39B;%Y0!rl)?FRnF1bf>o672Hy=f
zX;M~JR!Qf_mazNsihth@{*q#Q;_CVo#?SBJ;lbx2#OLU2#V;T(F3x{LkY7-c7hJ*X
z;^pA_(397}h5fHV{uxK!!o}R#`l+k6qXR26?!!lpZmv>nY|sb&&(B};wD7e4&nG#!
z{Jku&Kz`^QegVE4{QomHxK$E*6?WI!)51<)-r64Q8Tbro0U^N~k|#I(|K9q~NB-BX
zdjGjqP)tblzi<7oxBkDkYP(oC%Q@PE4|SFP&w>4Y^MAkj_l=VL(AxiNFaFx-lUKn`
zOOs0S|IevOljc5ffDV$;T3+)3cm!q!{Sdte{{T~g9>FgWl{iPb?g9aUEP=B8tp}cj
z3&UqU87Heme|EQQ*r0uc;(Km~6QVDlL6h@-C-}g0``lFS%N~i#?|YPQtIpI?CHF{#
zju4$eUpD)rCEnz4dYDSTw7gn~JK}MnYXCO8tXgQ<SIDLNNzdgA%Ukr@X>b1^A||0=
zl?@~y#Oq1Ql^)eVWOUZzOFVBl89n_9>*qN|{67WUH1mLv5Th|!A%xeo{#gT|&i22V
zSD<VzDM_(AS7i$2znL6KG3xBU*)(F9wrn6$t7`G}znPqDV80aJ=K^g&PaY9bK}wsw
z)jzv|*VYjgEa7+be~%iZK|^7-_`pGe{ohQE!p!Z$zc4dm64(4d0^3~Y!At*Ua)AVJ
zAABwOWI5?tr-}6>Vg|eZ)o~K*4WIf~dz`|>`Wcru<gWN{CI?)G`QKRO|GJFq|GLco
zy3GH&%>PCiyu<82QAVHSHM10|@$%m0yzW<NMq4WLdpQE;O4Tq-&b-dA>I@@^y}ed(
z2@G42FWSf`i6_ik_q{cvrqZ#4I3@$J7rahAiR;D6MB+*`JQu_EnvmDO<#>e&MqHBE
z^Jp&-HLheEr8&8xYoLVIYcgqS9QXL%_v#F_2~QYw1+7~@M{@3UY-HV$)AvZX23y_l
z90&zv(N3-R)*U~3>kT83vnZNf#9vo*MIyg)j|$UauZ3rf&{)v7qED{)2$vp{RH$;_
z*o?|_FQ781&X9KERVlSj%}_IMi98y1E>Oqv&Ktkg(cdpk1zV&K=z{)j3>{w&`1ueJ
z-z4+oEIFgzS0^mGgq%UN;EfAHSo!$qQ0stNU~W=x;=;_QvoPnTT7xE*kWJSDcE#6s
zR?%<GzrMNrLd{gO)j+cw?hV6udzmz!H|77IKfO)*(Ipu4dVXpo(j-+kwUFvad~z9c
zPAY8g*D@yKO48KoGI1hLnD6xHIqJLt;W#VXXoa`Sl7`{m59+JHgIL5RDMN{t{xYPw
zk(6P$$EF?ch_K~`-Qq>vZcL;T^e1@F6CK|RT~UoI6Y&p7jG9WD@LTWhoUh@K4V0w>
zD^<AezAnyIbMKeT>$%wgqoQ1M8saB=3OsXBGv1_p&>Xd%=7Bk;rs{&lr52_ZI@P=X
zx;|%m_xoRy|K|;LO`3p8QGM#&t}^7E&YY^SJr>N|te3WC>)Zg&waB~TzuuEHglvWG
zm|0>8%k~niEaN|`vrB9*Lw?Kn=#g5epsaB-%4$BCS;243j#tIG!AsJRW8?aGw3RJo
zSmE@FoxT12rgs@e;Wuer0MC;Gq@{Y=%^s_-K*6UNO!i3lj9&O2UBKps3;|fk9$kL+
zAaWxhZ0}Tl>g^9;HJj8%`MKtWxzpNGOmHi>mF-XwllTEye`N0_{{yh2;2*Hdhr>7l
zL~0?^#N2>E4Y+7EM<CP6w)K;Dh5KvhPw-xIQp@YVt~j~0x!Sve){$Q5?<=57X_uk9
ztvhB0a7bf`shJLyKv@q8z!=GOOH!uq@)hHp+t`i+^K*aR2XlF&jW(XYfW8*aHo6<I
z7ycdW$uW8qat*fQgh{ZS+9x~cJ3U~KWr;RQEmWsfs9pcBEt&&cbnhKi*TewqgA!#L
zFqgY_QXy8hw$W^{o)xqoet462V=&hijmHOYCSTSDeJWx-te5Y1W41_RM@Pz#HL5<b
z-W3%}MQatQg)#QHvX(NWly^+!rd^>O8Y7ZgXdeTwOR=(bORGTeg7d{34n`6LE%5_B
zcUa^E7qVm4v-cg%|JXqk5FdNXdYUaDzJjW_Ve05cApyFpS>f=Zfu^zg{H)$Q=TqP#
zT%U0pKf!U9US9))zD-nj*{wdYfg^|i9Q*&<HC>|Ek2*e-LPXyRBnX-Uj?yWD+TACC
zx5)fqbFNU7BQH*7C;Y%%^K1Sr`SrP|+V~O^qKB*1e{RbvMP~RH%|T0}Hu!J%_o~p?
z$=b3@>B;=4sc=X}+KtKK9$&_s9CG!E%lzk1r;a-(|FM_<3*)nu0uV9oMYF9vao8`=
zV0l$GJ(ZYPZ+_MWIi@$rU|?U@o^eEo^VL{BhgTLdV-ys7e#O8)GSm8xq>AmYTp~BE
zlj~QJwfiMfghZPhte*`6usrLb407;$dP^*P2~-cRhX&~FoK-x{7>?gZJh}R2I*Fe>
zntJ&CL@TRo`ZNj1M5AqoFFuGke)M70&qtH@D5&S6-sXjnEgKw!*S}3UWV@-pQkmH!
zGQOF(oL@fY>IhP32WLO_avT8osWR(7K9UwxB=o%e?La3VCQKD->AQ-Kz5EqND>6v&
zkspk<hceNQ5+y1?x|;SsL~`ZE;5SscT)IFFZU+~eN31`XVaY(Wc^T{=3zidmZ)&yy
zchSIp;ZvgRBL)0Mqj(Y`8?47Z`at!0-BdNzV|&DyRL~L_5hsP1*eSaxYWHJjJHnBz
z0C$k<RHgg-eLGpMYlUpE{va+!`wg<JDE5$Y<|bHgWLe5}Au(a$*T+TFu7)Ys<34NP
zce-CM_xyN^<b8-CDQ$V;+gT!U6{NHRU_?ImTR5Ma5xf=bH8yyeA}|eRVtToPh$62j
zFA!_JRQoAedzyiDSN}NebQ8}lo5>@JAjGs_ZOD85w9jH}Zeu8CaKPD(_xEnX@Z6z|
zn?WrEwiCAE1jD-Rd3uWJ{*a4J8;IY>cYy1E4KVR-z7BVNEJpSas4p77Y{k4cX1@3I
zyg5V87!Mej*xRU<CH%ITwMXPMTNAxZ1KfCh?<N-!5)6pp(lPU!I3<$vdc`JK?>wG!
zqxi@}p?*q)tYE?Xe2_OKg;@%TE*En;rAY*KsxjbFk5Qu!z9WGXtA=EywU~$=8#y_-
z=2}HMontpy1!iviWriRJR$$Pt=mb!R7EL7OSU*V#J)UO`Wk5kokmPVqR}_U%d@5p6
zrg*~RF8=EgzUYc-V*76f&(zR=>Gu@DfBu9-!}>t<I#uK_vXYO0GkH>~spF@91PKzo
zT@D*#C~N<zC!bCQY)pcr>cfZ25zJCBm#v^vXXj9fd0F_4MM%_qPS{c7;%Fk1INx)E
zpe{(eB3PCj)4otk9w>Gd4^V}`L6A5xM3+I8y_+UQZ=xTZuM3zJnQLSueD!JjTn+sN
zn0+o;uow-V!#R`4S8&r)>(JNTtA6)-k~oZx!i@K;@cb9r>bHITB!j|u9@CTOvZ;<(
zOnUM8V$sVzX8^j0rXz>0IC_fo?ViDNE+lG_gqJa|tQ@<E6Uj)5MX^sB_bJ&Gvv%@C
zGuHE0Y(y^4<9X;kUPNBbrmzzCk<H@VR8C-ik@HKJG31g-f8v*uo3W984N#Z&t-iLx
z0<C4_46})Sa2dV|ASyJFQID>Qf;>|RcwfatDZuTl-b|&qlw12Vr98BF&LUm)97&0L
zUi+At_ZuKVO7Oc^QNUMhB<|U3;Ae9|8q^ez7Uk`#*;Y)!GKd^rOkLI)>nD;`2Mi0J
zQwh?b4RxG|<k3S4JpK9kdy#3q%~cE~>l-cEKoO1yI{K2I*lOm+-e0u<R0J<eLFEKe
z*kWt=BJ+J9T<V^mE5P$iWz)|S-7c_~Ejt$^3iwF{VdpixJ`oJx<9E9BcEPIp@Ts%p
z3v~otuVpzPhC@_pjAz&jl=VCJ`l0|^vu5_?CIjUbXQEx;b?f4JY<LRKLCn`!n{bVM
zpU{i{wwUmdBdCC4{&UbNEmv~@dLPvRl!@~9<GuDqVy+i@``gQD;}ErT2WEilw8QiG
z35lfC(*MFc?*sk$8dz!r1Cjlo6lV5RNfCITTkbjeP!YvoT@e3pfUe@CWelnCbHl%k
z^!s(d(AeXh@w2eMrWLexj->bq>(~@ZnHO+;w1_Sj!P7!d?w8F8B$y8fWvii=5nyZL
z`f8A|5`gb|p-D5b^-P>9=xl^XG~6zT_|pVW3UOjh&14%p1hybp(@S}~au4_)?!~}L
zTHtse8DtrElVzjGi(>(|xdSJ&%?!quc|!gmTS6oS`wX-DQ5=>i_wtXtPhF({YUeA+
zHhvJmm*DpG)^^JH!OY3gJc*Kx`lDEftmsV65`3{L+fMag-29QRhy7GR<ID5#kA3w4
z$J8=-2c458w~}mpBCtg+!5iRAF3|}wc!A?z2GwJfu5?;YDT+CTo}NB2?U;Bu<c~{&
zU#wX0wiloY_4<~W*869tu}uk`4f3X&xksootUG_`?skBupMT^JdQx+70O=V)0Aa=a
zJTW705c!{AAk4$YmoXL#qxAt{EYI;?7xm>H$xk@nI+9|=H~p+V=+oY6fk=aG?F+%F
zN47r?@U&-OhQYcF^z>~SAIWU>X~}%jWuwj&&(+~hEj#3@;di`2udYxKg4`vRA(1au
ztE3?J+(zihQ32bWwZ;zZ;u%Z>WzUk$G~m8`&MEQ<Vx~0f_d_l%YXM0PuRRGuQT4n)
zF7YLtT9OZPU@<Gi_#pwVaQfq4w7y#&$XB2co>(Mt&UGJhkl|T(H$J@2m(W;me%@Og
z*F`mhfviJfS+SG@U&nmHn@(nHOQlK@EL%wq4q)yY-V1*PZk=zcBib6JIgPRp)ZXq#
zcvg#F1E1_#@R=jc_uYu!_VC7t&vJ~3QY2$SPJ(5k@Op<(E_lq_fQ|aDXV>}dyDtRA
zr~H1Sd(>p<FqRib{@f{o=Gh{y_y#$7QSkAdb_Hoo`JfBZJFHCJGasl{N!Av<XL>$Z
zf4dsjp<9seKs@3(5#c)I)H(?p(bAL>Q5PF_t+J`M=~d=PdH?bPOX~iL=+M)~@?J%T
zNyKtTgJa$9wPELW-r2Qweog+GmD`-<dy{ddmdv-8M{3cf?R-fX6Q4z4&y}CTPkPdY
zXS1R$9dhxolpf|F8)H2S9FE;~(3@taf)F!Bm*pjfIXc|W-4Q@Ve%{2Iril*Pl_6YY
zX(F#Yi|noHoiQPzGx2<g^O{Z((&U19`tOW|B)Az@{akHj(QN0h_oWweFj{IHa;RSH
zYo;?zuCB`@oA|*3_Q4e_KMP(|2aC8QlrvnNY!R#9ck3+Ed-p;6O5w@(S`|LhRCq9)
zwsQ~W8(@F)JLe>Q#q>c^$j2u7!&w2{%v8jBMg08niX-)h8~MkMw@tcHQS>7D9rWRI
z#%9~Y9-0Ar=rlo1^V&^}YUQxIp{21dpPtubjOtjoL8JgIMtZf03TfAO87XtHA_rS6
zNB0d_rKPZ`jZm6z4OnTOW$}HAbHf^=A4jWWD64O9{5DSaG@j;idl>OoN-d=f!LLu>
zi^5zNW7|Sx->}E%aP|eSVK=OL!14ZQ^@afKQ^h%X+4a2K)V86Wuk2B3N{mkOV3xd}
zrV?%YXbtV|t&gb-bqZTA{3yxOEiw^tH2i+%cn@3OM=r7OCgZuC)$3c&&t%X1AvIr6
z=H9Zj@Ov1Yxkc2EDki@qm~~e9rZy4hxndOAwR~A$CeP72KXh)IKkQx<yX|xci@zsq
z?qg<YTS1XfP*MF63^Lr=>gBq2$u*K2N^h!|Tg66wqiOXYzulNha;%tLF|P)8QmH;z
zVU;<9@?QJK5%;Xoi9AIdECt~@5h0dCa+Bfrm=cshoPSy`^OUXYBN37fYCsB8owKWF
zyvSLkYp4t6GeX3UiXFg#mLKiSM;$MyZ&P?~^eUmlxDoO5j};^6V=NP`bBvJ2g)>c5
znrdg6T<<1bnBN+7)J!=v-KjZPYtKf&qolU<lA@|>88pNv-_Pd55h@H0pC0<;mg12s
znAOMv0u;t-+y1xQ;2j1MAkC^i;|)pvs$cKQ54Q$AdNXZd1#j7va`Y_|vaN$WhHw9T
zE!1_#XSvp6s*0!hGtn#(YtmjYA9k9>f9IjWlMgTYew3IG`g-OjJFDP4M*RkB{0bSQ
z_ZP~nH~V!p&0AjQxuF~8b5p(NHh`IAU5(YtSgBIK^IN~)P=mZ)qWYU&cMVY&3JxU~
zG2Fd!QRV=nW;=ws7y7JZx+T}MDo4EGsw|n$ZIeC&AC2Ry-RSFxsKnX8U7KliA7k8_
zpAEYY@*eJX2RL9qECLvsty%A~#WH${F$+ABHvmqh72HzY7D})_5ha6A2+*x!jr^@K
zx}FMxD1cP>%xC%(AVNvq0vQB{(IlU5<m%?)s>qVDmtDnx<t)y&Xt6D1<_GTj4YSXI
z8*SW0j~)Ex@^W+hwgx!L5O5mF<AZhU+3YwC$dRkb?R(O1&3*`BwgK}K^<S>tRvGID
z#ww)gHIN7(KWBF;iN8}~xyE{_YFfiI;Lt6MubjXBz?oj!*K@#rjmOAm5s6-`98LA!
zUP{R|I{#b0mrc(<u?md>UZr4N_9h#OnR7rllp5pm7<2Ij6YB$Kip^n{91EuEi_tYn
zupJENue*7;kt@@wJy`l=D#1#ltXtZry;&MtCF?8YcW^3T=#x`|)!NVJ7jj~B3^<`x
z%FnDtN-RCue)t02$`UZN<dv^Zv0j9l%bztp-qS^vmd@v-xZ}zfD+Y7G3s~)dZm_mZ
zS71T8(HgM41(rYy4#$cW$leX@N)*bjj^II1aMvgxSuK_URSa<)2`D#ih2!M9IEh|d
zkU4ldHJ~B*?Fwf@7+Ot8-LmjmD*Myv6px%Q&(B(=K24MM>jRLIn3HIe-+@CscnaV@
z`@HCn^kO;h<HK#VU0J8j58qCXF!GYs{evIoQ6i?vyZ)u$uBo;%c^KjBD~E0N4kM?(
zd^yXK+$FU=)Zr)0ujjkkjCSdkiu2x_>-R0$#sgAB&;0=^wF~Y<1s3`|3opUR46kHt
z1#9gc?JuKU(duz^dvov(bVQH7Zw%^IdX=o}N(6;DCbX*-xQ3dJew+bIJ&P(&iM;pj
zWSmfxZK~IlvSa<ByX7!|^c0Mqc|-@Qf;!o$<&rfpHiR`AGB9J8P7&*>$ym5`^;EM}
znxDIMJ!N{QM8@-Z0GFwiMof5ERfepqS%gMGr;@Lh1JEW_M|p;PtG0<znE-M;YVxIi
zCbQlBw9%(J4MQ_|3<(%}j=iX|q1j{%QWqV#G7N}E0>?r9@qYa*f55IPh$~z-L7eCV
z{2|8cj!TDt5^OrzrLTp-F<GC%1^7a0f*X?dHN6NIZ_P?WHs3d|N+!T?PyjTwKyX-h
zxL>jaAVW<qguL)m-DH^eAHtQAXVZSmxPuUvPi%;^&^=;)>^jU8c=>wgVhKSI3H1>O
zW?dp$zUrR7&7Z*5e@=GkN;o=P4iGbauyqImN}T(EMO^7TYP><fyyg87cXE`>(arT0
zzUqb2@-{Ab)=Wd92uOx6V=|P8gS%yp4~EcuWgUXEL1&roXsL^6FWHxpW@gR-yiL*;
z^*=Optc_{6J2*3f2m1hNQjZFlE6uCZo2++LXBGj`xYN#8ZI_#jsT}n;B*h+1upHlk
zO8gLvhml9G!rT{r2si#A^!_OP)g`NBfld*uk@aMZt_HlY!XOM0S?jaScW@ERa(&|)
zN7~~q2|&2A0TV3O9%gW?dCT^BcgUqXo6gj?gnH-o&*^7meDN6I#C^JXt<wfddXfh#
zjkAEL@gLS~;cT<9KSlwpX$gicC9ZeN1kejVxocpZ9it*M8CinyQ#u6kMt7~dY!N_9
zQmm2lH=S%Ja*rV=B@~EJXjT5&_ll8>`g^Y$2v42KN;~+)k)4)yd@ybO^K(#P#q!6~
z`%Bf1dtim};)iqaqEyI0gdK)H32%Pa$}Otf%bydqEhte$fy>~S?<hfku{cxz-3@^M
zQ#j!z2%;pnk?kV00b$ZRKc5Q&z8$kvD>-QN^vh}M+!XgVt$h62V}nS6!_t`XEa8YK
zcV6GMz{Eca<5c<5oAE4aa%;Qsf=t%TV~A8`S1+Ns{Z^alCfoA)!p-IZR>p(CU;jN;
z_DS})3palTx&l(7Yar#ntHk2>p6$Wl&5?lPL)V3p*4PI4sNc5n#JEmTZ<WyPkI`y^
z%5b+yTKT&ob)|<5Wc+Grep~ug@50*0=a;qtPTij#hO&r9#;G)7BcA3szz_vh*?;WL
z=B8;p^`}Hh?#*PXe(7JXKbCfhG^zE@CNWC$9DkKf;4*b)@p@>_Mn*VaV!m-%e4S>R
z^lXAvs&Y7Qg`TzJ3CN7SpvzwpZ^(2qr50hk$uRZ{Ojj8DK3Y@S3$;DsgC^xJcmuD)
zWEgu4BVFsK2OQ=LD>cC0d!^nN`8^s!u=4=)8Wa+kJ7H-;17|kSnrUn|6Gbwr%|`-_
zFh-M*#cj^Mkt0`zf?`#_2!E1Y>9;<xmuVU|$AZ6)ys=!6MA?min5G?N9(0=a4keF0
zqsNGs6%K%@%V{-Dsm<@@-O~HQ4hE|tFuzoHob@cm(6MvazO3)D(_**ybaHv8=->mc
zZ$`}6g`J70?gB%L8125p?NQTwpQGJrGzi{_4t2Xz9gA%=9kBU=S+HL!^N4DPs{R)|
z;ddQ^UCI<)t))OF(Gu6ZSvU5Qp(OyZVYxBW%L$vH70B>e1e_toC%=(gqJWyQtM*pJ
z3r*?W#|92nlg{=uSV2?;o^_&fV*mh)?iI;*h(L~K7H0M^wFGP8lP%PBlU>tVU4+td
z$Rf`8KA?o^gOj|eK1)?-05yY%qSUA&i>Tu1>9hb7w@O2YDht$F8@H;+>K@$mkjrm>
zu~NJ8Rm|burmAD@rcNRttz4K$MsY!VuxJRoKI)+{G?W_=Mb1$U8OTTwPIF1-EF)$@
z8B(++rU3`+Sg=bJF*S;Uu%d^rI%5CzQWoTn6RlxI5S4(qOd{C$R_wu6Wxaa9P9qDn
zMN?pBx!lwX%j;q%ozjd!EUglKg=li>=%uX8R6MAYzv%&TjVgBm%Z~WIWnBcm<>vA~
zKkgIQ`dYY8%m6)S!mwyqj}_&wSbU>9G;j!Fl)1tloe-sB+t>w3*5pVI?~B!#*?`@4
zQxzut!BRist6(Lo9qQnie!ZJcJKD%CZ)Nt$+OgS|oLFhRpsB><_MjOe6EJ&_E6=8Q
zjO6K|M`-E~Cizt_e;ujynNH>E;%}&=l<lDJJtu~0QG8nVvE<7chAgo8*&k<B*5!8u
zQ6VqAFrOAm+YQ``qyPw`kB^p*E$tJ#02#dhRHE!g=1-8cs`NGsFE968jWc>z0a)*A
z{lR(|Y63KS@nGdwyHiio8Qst=WW!J3Fd+Nx7bpTVYrz_bu~0sa2sAjjIIL*~JeGM>
zKzM$^#CtZo{3~1d<CsYk7E@yx*O{IT0BOHQa-?2BC=~YD&h?K%w<c`=ayeQfA!!&O
z7AMggkWT6>tpiq-r!uT-1u~w}byJUFx9p#b00;El{oayYkX-qEKjeFjOC7K~>(7CN
zRc-7S8AKJLW?UIA&txc$*wzBllM4(sx8GqI<aN~Zr7d;)OG!{pR8ZQn>2$Q}lWcXc
zU?rmp<x6w@aNX23_x^(^v3g~Q&LG5@{Wf~b0Xdk?*OvcnCUPQX+6JL66zj~z(p}bJ
z(l<0+St`DQVy*+3Tte=jrr0A85~*o@_d)be^WUx>wOFd0dA4J)PO`#V-g8?-ooV<%
zHz0xegYvSXL@C@wHO>%;gkwZatNwP$%-xLD<tXXB8P{KLm8O<{!TcLV>t4BpvhEAE
z^F-UeoRP&{8kU4JsV&H$!e|AgfeDnaG>}=D)JyyAWm%<qUE{6z@u<*!ABaZTRa1%Z
z{<T=Lmw#NkPx_$J$Yg%{yx36j_W{vv_c#-8>oAS#6oCx*ia;x4w5@Khf*5KRUr<p`
zA3UQ6+6X_MvK?G{#aG)81td#AD~(#A%s&T;WV-e`_d3czn6Ip2unImk9d90aUr)GO
z7h5Tr`YDaQ$)G*7=zRc)XmE$pnT+rp;8nHPa!GEtU~{{HITudV{d`7-+n`ye6g9EQ
z%kG1Sm5JYGKXr-=dwhb2JV(b&XoA&3?e+*wW2IL`)V?FKUq@Ayuj=tPJ|4D?ouYt4
z?(V7V#G6>i={)?94FF7en0yvW`c+is^W8L=fcOIe*L|JVp-)plx3Zk7%cp5tetN*?
z3&fZHHkEm{8gQ1!66ylY)Couh>STaN)*zC86X}QKqKZL>Y9nMAerog+-n&>r3{<Iv
z@mEL}zR%D~?>!{Wm{>y1Ba-Hu$YC?-t_|lne&rYHP!poE<4j<FK&|R;GbkJc!MV?W
ze=#mr@6jvaVOMm7=`nElEWnP$n4W$nwEp$=?L?eaZC>`o1SDxdNmR$1pIOlwiTdcZ
zPi*CMW3{pD$!rw+Ai7r=X|K8jKZ8)Jd}lmdvxieGQU+n{S{t$Lr5NnC?)uQ!shP$l
z#5if$BR?;P%eed01<7LSExS6thImL&nl(z~FWT@2=cWnpP9bcmWbu*{|M`nISi#xo
zYUjRsv$itUsJbnm-2j2$EFfL*a#VQ@P=96tuB!qK(XAh4!+pFKSDyu?dHpIaMR3fl
zhwr^0$4DUA+~58wsRbRh^?IjRH{K*mkjRb6ETSu9745t+kL6crRmt2x*Mvp0I5kmL
zX)J(UR!wq1StD>N3cU%={o1<fP&~|jr_-KUJq0$#1c&Hvvm}!~+L<^3Zjy${OAuG~
z9)HEL_C6McL=-oWR@t=ED73Z%@D?wuS!>Jg`q+C;2==-T?4)&y8%CLoxBM==^JqHY
zDEIrT^8PSEGDyw2PxrmBas<_Z%Tegvbzk}Ug%cr%xd?N8@~zgum{^@%?Ep|>U2a>X
z1E3C?5Dzgh3p#C3Xlt|r$Y>5w$R?NG?*l@hol@j9Vp9an&K?DVKz_`7i~`^xc3Q|K
zy80c3u+fA9%5AfuaC;_+g<`qA!O^2w+x40I4E35RB2XGaZ5+J*I^bY}B^%M<Wz&ym
z3Sp3Lc;@di=ZrrQq%@&6F@`QFdak+2wuma{ejP5<Y72vw>wS<NYRv=9S{I47Xs=>R
zzclt$G7}Uz4*>|b^FSKkeb=G_H~ElG)1$Sx*-sOZszA@yT<QcoZLQDUOEmPU-NniC
z3CqA}W`VzdONPPT)&Ydpo(IZNUSeY$C8ie8b(djPASK!4soM5G-&t;((PK!tHwa?}
zu1!7sxU8WTN>=hF95Mb73dg`kEc+F<hi4iFF_gyMrXXN-bXtLA7szfb78n|R3Z|fC
zFcl*$fV-L2AVcofhKK%MQHT0(FegTLV|1oB(=a85z?S=+Lzx*y-%1_Ir>1u0Z`>ey
zw#Y<zH+-L`TMy(7Xt@hg@5e9NUg}lwe04SUYd?+fv+PyvO?`7fs5Ik@oRxJ3i03%~
zU3CRX7l!&r#5qV3^k0ik%bK~KWYy%PFx^wb{_Lw)Lpc;(_YT&(wTK^cN5~xSc3T69
z7`R&h8cFjA&=;zn=KwTt!9B^0Fz7@(-y(id57MUZxteLQaOVIMkZ1LQKy8GSo{Hkj
z0cwtCKT6LFQ1@8Wk|m8|&n84`xwxy3Ag2}TxFHwjfYdjCeqQwJaIcsxqGp~BD5t`{
zJ1a($l(CWfjrf(F)9s-hV-mH~8z`eS<88mcO*ZO1UkD{vld!0n@AMBFwqDPmsxSt&
zlZkB4o<RkKq*L~1nLW*5pj05ZjclQ}eUAzPGfWqTGgyOW?+vfRO>8cZxhr?ajg~bf
zSDRdWZk?UXX95leJKR9K^o#O`%`*edIUYEp3e$bZ>cxuk&qQPoxVTRXvwuvm+E^Nv
zP>4fM#v1ZzdgV<y2J9Q+9)>Up&VztDWprynh055iU)vg3Rerhm!5T1du@vVv&IuV^
zpY_kDE@Wxz8Y2yqt&NFYGliTCTR=og8fWejT6>9H?}(|i1Td;%>bI$F>2*-2qz4Jh
z-38#Qg7{dNtXGi3C9{a4Ys=Uo(_Nv8a);B1+AUl;&}XJ$N9K{@*Px<Jl?^wILVVf%
zJE%!fiN$g)6bPIKd|ijTFBu%}K%i&oM?3|&5%pM`$^=?dM%{0JtMkBScWO{+#RX{5
zwsqIH_d$sx=li6P?em$HJ&-D4hdzi-Ni7sN_CZ?J6!6BrZX+NG9r^KqA!ke7O%3XQ
zy;IEr34*llA|%Ol-JE!Bgp5#tY5*|cN(?eOzQzE@Ra1<)X&>mX0+5S?jez_hNjv|3
zo~@lL6$n(;aEu7z0H}n{Zi$fm<Kn?-pIp5PQglsq;1i}3t@%ZitlbRmg|K^FF<ugf
zEv`_e$yuE0Vq<|{viP3z;~>F2a8Yi5<o=t>a&5`^3Y&ayDpjqMt%x<T`c^5TY0km&
z6Y#EjfGr*384Tvcr{Qi#9f?;eqKf#tg&<rIo_H;!!&8{;Vy9LLAU6wyhJtb5ew`XX
zLOF>dyjq~_GDB{*iN04r2r&zk#W!9glwp2AJ9Q3`Vc-}7Vip>dAinREjN2MY^tJ@o
zA0IBGmjObBxriY`ZRxQUv6K(7PxD2`{g21P`R^0Ivt>HV_*53Q`zzYTers>OD0g={
zO-9$AQh`zj@Vi<UbtJ&yTu{f7#GB5yk$txhbOWs$oc;!ppxuv2FJg&<!k8N(&_*0v
zpe|MkCtC*bE#b@s=44yb)tFT}W7m67)Eo^s_Dck2uT^6i0Z6(y2>I!c^hW~C)ouVU
z%Z+ygN;mwbDUt@HJ$88#Hps*lH{gx(1|ae<$hhy#10wN82Y8avz7%lfKA>Hu!7IFa
zeb+nVMgRs(g}2o~!V(&A8zXmP<O_DCNHr*+?k$vc=f`CC>lpG5gJo;mwiOxy5JwAj
zOKLgv6SrrCFM|D&{!%K*GM)?oqd_v;x+7j7dtXS`iBRGBne!@9l52Mm3F96MmGy`A
z2m?Gjkl)kIxD)<UUyS<<bUQuLG7Gnm*JUOE%G+Ni*;2kLDu{Y&nY!8?a3tjM1KH<0
z(GsBwv}$X_QaVI0AT^6iJq9XEx&oBaH5&D81|nR1Mwz`~>z}GTZ|C9P1GdW2v=`!s
zFn(CnFlTP^JBjyu5PcV)iqFh3me-xJNpVWj#DLD(hAd18&=7LgyCjO{EPF3+0@~uB
z^%-)AJ6IzZ_5NM+Nq|K$85Nkfm2&pUjX>l}0xGliJRk1CF)+|v5|-BGhp7T3jX%61
z@BO|ka5sSHt&H`7wdCFo4;A*~7_u6){<v3i<J7yS0Riq{`pP{%U#qKc5kq~ew?F{W
z)n>LJd$o$uF=iRQw!gJ#h|F=C1W8YH27`UJ!1j<!E>K-6`{q{LC*lG2in)sWHy+n{
z0qTebGS!f?(?B;=^MZjwLmOhg;KhmZ0DMfygU<L)8Xy53sMyoTJFPN(z>^L595%fm
zwcWfmvT!%m3n+Z|84ZK0;1N(^B?VmFufm0p`1MAv4_LOTlix%bdz7Rg6QG0<EH3p^
zhqZ}bQweBLD~$IU*`if!9j>{x1jHSoTCl|_v<Um<s)674<bPx#991!q!M44nWxrcV
zh?z0FIJ*`rhpWlHv%PbGtv?c31oWax<646c<+yEkJODkdREHu4yW(3Y5OZ*4Y*vnr
z|NLJ7@V<(o+AV{nt}p#{b%)O{NZ*0P5X8hQ^2A={vcd_Fj`$b=dCSF~842l02wWr=
z#1{J?`BmJ{SH#y>!MAV%BwNZ*33SS`oww4+`(U+IXx@PK4`#`m!$6bfrPExg@>m|>
zgmr3wswfpt_x>0#IdzDDSb7;Qr`+5I?FWJ`M>GBmV{={fUQyhUR)AfoPN(`fSTQ9Y
z{+>BX-2uAOS!26g1JKjv#{T`qXF$*1N(j@YXz2p45KY6Lq$)rPH5yFw-<!1t^}H$@
zI1Qu^Sc60kt|RDg9Q?ovu<F&cr1~llHPDI-_TPQ)HE-*hcv*xYvh0~wwYOGdw)D;4
zDPQA!(K$$;-;pTOy>~BDF&oq^uWDM`*#2;DJTImOii5UO((XVab?p+LevA>}5A`xX
zLI^?$6*bdCTP8|R^3eiHW1ETXVj;zYRtl&$V99tGBwbao#i`W0mw#XD_*qZX+apl=
z2d`4S|6w0!6f)%7N{}4}-L{y+s|%Mn-c-sx`tNd*Xk*Rs(LN_kcIr~Ep9reB!Xp_7
zth4FQ$=i~1pkxUkvMMDhuNbJ57oTXnh9X}|Nl5$wZ3X960VI{LEN<WLB_y?CM`VEO
zCAcx^Q+#LyA%Wk8Zt>h;7eE~-HB8w51k&r1g1bIeZv|+SxxjZN&x3ljQ?GnLM4*T3
zb%ZO64(v0Dq|%Cb_eCK~wM1|t>+dV7EI|>^8Wd2~AO!^>J_P~;_3%4esb!;R?%y|P
zde?w5PgMPBZ${ZlvSP(P$v>wRw<&i(BvUng#r&nSpadciK#LKD7tHN}PL0b7A>Sm~
zpCwTC*e!n@tQA6q>X0cT%DP~)K-agL8Y=*Gu34Z_ek*|M6oUwyMaK6j9Wbw9%Ov|)
zh!}OCB6&j7?TH=A6b+Zt0Q^ZPd=lvP1e!V;60CE}AGm;0C2ilN*fzNf?TNDV;RS7*
z{$YTHSCQO<RzFG5my$SDgaip4zefFDf047Jd!I5#HrO>8kJ{V6*UV&jiDHNf1X=+)
z*(9j&2B9b*@=^S-v5knVIMyO>{zWg7(+e7%uWsa&`5l8}C4Ip_YcLH9v`SqCRl+R5
zMnp8Nn-fW<S{T!O*OZ$RTWBB(hXOhQy-bC73MkTP9X#i;Wd!0CCkk0%RRF}6yuRg!
z>s|m^PYhhx^!w~`rs@(XKgL##&QR=4%N&cBAuMhYy8@?Mj}15Ui;S%7)h`DSP>6{!
zq}Y}R#W@#awDX|HuTlUc0+2*0vdHEy)_Ai!G_r{!`RVP{KGA+(&{YCSahx!|=}S-|
z?+xaT{zIta4Sq#tOVACG_|5L_G$@F;`4jpyjA8qN1RFxUPC3UcECKPZ9PoZ^1F0`-
zB;}m|hpBkrn~hMpxdIRbqa+0iVWJO{Euoa`&K^y^Gao|w(r-O)Q;+u1cTM#J=PEcK
zb#pw_XjoH-!$#?rD}qVH=E2k-CmldetxOOAGJ5_D;zYSvMi@wpE&*Vj1)5}gqI(92
z;?}`xwwI8>jdY;C1En>>->yV|FAX0;)*mi9qFIhsLWVYh*k}dB{4!@O_m$rh_;Q8x
z`*Pw;dV?9(NeDjBo!ejZW<nJdbo@}j?wyq-0d2C*%Z_c+Hq4vp*ELlq<F9#|-A~0+
z4}iT7G@XclDK(HODDP959SdRULh2)n?CZzFxch)(M~ip=iq=eRiDXK;2C~HtoXu%S
zPYh$V!-Nv7Ir^_B6_o1Crv)7CZUE6bM}b!Vio$k#MI<<Xp-#ZEszd|+aSDio(c2ch
zT>^Q_2?zTbc*;5C+Jv-`T}ktO*O|pIbC58p0(IL-J!A`l4-%^BSy4tRP%N9QY8*x~
z-WjS~^<mi7O%(v*RQArWtz+e+<o<oR-=;Vlc2Ika-=Pm~z@wS~p5?V&{eu1T#gvO>
zE$_87^hqtZX3-q*^0_^zf2Y~VOA#6Q(W@fhpMIHK;ZCrg*$A<bk9tX!hE@ywj%F3(
zT}NeXb<#(mNR80BZ{Ptg&V_`(GKAMHVkUNZ#_2)0Zjmt5GxAr-kR)ET4oa`qJKO5&
z|7lxtH(q~%){wBL2VgiiT<x*moUj}KqNp%LbwQO@vP?8`64G2Ojj8QwR$FFsk{sH!
zB?Q7^0b$tysWY}_-hgP<>4GFc=0(yQm6D%94$BH;Anz)K?nFgzo=8J09*wl=nWwo<
zLrQD>+G7jY-cE;R`W>)mY$Bc7pJa(iC%#C4f@Vk6+4J=8;p|VQ<c~Q+HNqkB!P45N
zPDc`Et4Oi}#FX|SP3k7y@1UG_L}R<|E)UB7erUio?>nW|aJz%%z72?`lt~hW2kZ}y
z3eG3e8M*c<Kvhngx{nL{pER8Q=zlg(DJcoKUAx1m@7O=})Twai+9*UJBp)DfGiQKq
zyKaer+7_(~k(joEr1;a6J7CK+RS72yA}9XIN0-$7H{qs}sO~kji^k4kKg^zQfROZy
zlfRz_2<5Xc=uDn?w2lu+Jiwzt=n2>kX1`sZp>J4=KsQi8%lq)*!$NaD?PKohpclpl
zKM~bSDv&(l!ZZOmPKpM|kd2V~3SN!rtNmM0fe?6FRcVeL^5~?24U}o%lb~`Mx(yCX
z1!@YZ>gR;TwqTP307<pLikW&s4Jp9#YIZY3Yh|Y5&HI3RrdBONWld(UUvE25EkO0(
zZl*QliMS|`;dHMVJEOud>;=g>VIq`jwaaz;TnI-a%3Ii(a{c+Q3>7I*d*Ro&>_WLw
zk%$w~5kfQD34hRGgGOJ8R(q$PRLR;f4tfSu_rQk<ioNm?L``4>p`>0I%yAN>%P=jq
z^}`%}IfSuqr$oJol62&0<9V$GndQ)>`V+qV^UL#fhm6SI%MLw!L0_8{q!E)nLCEaT
z?qR5@Ny4bv!IvD0129kvcS#uo0(GK4D1J@lcXGi%ZhW8k(faGc3LF<CAA6~^V&!wY
z-7xwb3Un9{(GmR(8K9nOX8?r!HMJP1rIh+h_g3Woa=i?=$tD3UPqG5!IQ7*Fy#<tG
z-|Q;}t{H=#EdA{4O-klrAjWWE6iHlOUb6hU>9z{xI(yCh{`Z^^D%@bvQLcda>wvnr
zm+MgtVALmdLeP3}{q!B~LdUv;Q1-|>l)-%78_T0IfF#%^php0+)2<%XNn}OMw;<sb
zCq*Gh7}Ww4&1Qh-aDVhz1JpEJNwFl}SV4$_^;ID4GGp=BJ!W8#TQdU{BhdFI7sED-
zCnAdIqly^2g-pPTs7<$xn|5Y0qxu+KI^If{c>^Un8x(EWun6F`W949a(?|5{Gj;UC
zccApi=?J7E{EI-orooCK;{Q%pe(aPO7lBZ&&dIn3WEHEfvOX2=Y#`6yD02Ymg9@O{
zIsln?O24vY7r7T<{2>2QJMq%p5s+{T13#V0w>K#ta&FHCRKIjLqjb6K_SceLsNRbT
zkpYKX>LP3kwcErlg{v5QC1Ejp{vd_bggQTk#3TT$p+SFNv_7`f?EA-i5G$Ak1%B(Q
z{JH5LQ=s<1<#xZ&U?(kxCE&mb2KrQ0x3yBcns}$f5%Au3^?-Ts>h9vvr#^E7Y$ti9
zh!Y((_)_09y5`Fw=Q==B$}EUhwgz{{jDscEi)n|Y!|9R1R_1BFuhv0a)X>rpw-}HM
zbx2>O+3Xcq2Qin|P|INqM2dJ(Ac#7{TlmAFCf71WVk%I-#uSte%};O-tas53t3y3F
z5X@I59s?s+ftpA-Z~U;acyZbbmZKQgJ+qY{VwqqOEA0I1D->keYa~F}n<Rxz&*}g%
zE+l6nQUcNM-^P0rv_GnD8&$b28q<FG4x$OKOQNy+z*VfDu0ux6hk55g#j|5GPZ*d2
z0R`To#`60gvlkETtV0cwz*!20rV`p89qpLkAR5IdQV2o+$(7b%-L(qv1skZV-1Hvn
zGdQJLr%;CBI0S%_*;Td~`{Pi(sal#eQ|=dF4)0<?rc@3(u;MEGK-*g%Xvv6ydM7tP
zyF<UQsjvMW=<P_T>b$SY8<Pr>>JF5ov8)h>wa&^v!so!dIY;)3pP;5a&`2PvU^M`e
zL_P?MW<j50!R-8S<2H~yzW%|Z^l=9?2Nn9?J=Pz@m@Q{UNhj(UIW>3eX0oF8An}mK
zb`<z!-(hraroAhDWIAL<22OQb1v}`pqxVqy*1@^vj^P#S{p2*!2S!iMV0Y4`C*vuW
zMS&0PlU(mW$B?&|;E|om1567sdXlSulAXHh2LX=FX%7N<Rpc@dBfEyH1hK)#yg0xc
z(NK}fK$NpU^mZQQn`Ga$Z}6^5rcunsvLKr7=ev~%YSQ&|C>v1A2Z}r^ND*P%fmm@a
zRQyV)HUbSBeZVgg^syK-$Kdb~a;8M_fM7OL(4m>{24o?16kv4u7-2*Q+OMLdg13nB
zC#13piABgd5W5V*QUQgd#(s>AY_cELO<iQW$hfUD^3yj}9G~iq4fuw0p@OP?EtG}s
z(=4>K27J97k_C!N(%4H72wP`Hhywbl+6&m-J<=bwAe<oWFiSX+zG1L(>k+T%&gA)%
zj*HR`o&(KWI&?jfF69NUG(Pq!uO~Uy0e4^NrZj=%l2(t(!iwiJkLkaRfcS<m(6=5Q
zJwDn_tX^z+3A!eY^U54B<P`vK?#B(NxKTb}2F+d|iPtv=1sDF)No8}mvbxx%Ru<ot
zTZtfW4AxZ7Xw(2&l~ZEgTHzJRCTjHX1x+6SyEIGSEo?bLXMdlQr>lcR!~Rj(y%f;(
ziJ5&de=Y>V|G3-9UR@$Y9#98iDj?e9woB~7@zd~O+tiwlGoY``l^zr*5<yUIE3mJf
z0Xc#yaAnPT8s6AnvqZQ@(L*dyg}NNj^eKd+>O;_5s5;gUF29DIf)eGhyN^-@Y`%Xy
ziOifS>6Q>ULTQYde$|D4I;7hRxp>1@=71h`-^p*C<|GM3R5D3H)!Pjq^ja-lgT*3B
zTIdtp`bjgW=7B;Q2N5e93#L*8qz^z^CJeBT`ygb&9<yA#`umLJ7x-dyCwDeN0&1fU
zf&Vz)eHnI7v9c3%CO%Fb1`_|k*q6$gy-UNQnS+m&B2N@o5G}I1K6q_MZ^Ngde(E99
zdubk{o%2Vd$NK@ZfZ93MeJtLF3PhYWP*HL!6_oT&dMrB&p!@?pUsRt8q6F(w=O?9g
zSM^%pG-xh(L7#J2-!#Zs1nmL-T40ezpZ@7}nH(qIWyF9UtOrv=P@@LUJW5J%zLb<L
znE5h><h2JT9_ms8Br)FqXg$pX!?zgn`>=c$`p+4;qGE>Cz+;ke&yq8&w_gxtICTl+
zyG|(3fVK9%0)7qUx&)3JYWA|nN=}MKI>bRW@4V<a5LHYNS>vTIXbrAItZsa-g$AlY
zA~XskHtoHj+NR3>4$!m*OT7l{X^mZbU4itUGoxnM{sVv-8fwO=`UbLt1U7kt`Ov%T
zfQ|`?B|Uzp{8xi9sBh{Zd;2}!D$puJ9aV5QUb-g96V3$EFayNgn{Kb?y-)%gHgD2&
zQNrDB)&nYPb3a0bxpV;Vob{;RHx4sT1HFY@7=1jx(l`SpUtP47^{+S~)lwy>7JTbo
zLrrs^@6J!qAFm2knGpk^3GvhYof9R!*J%x6$Si&v_o}VtK~lt7>;ZZYbAV)loZ3|c
zU(;iI9cLv8r~^>Fb=tIWh(sXQSAO3WuA{A!G6#k56G<|x3jrzQomvVvTz6K+5(ZNM
zq*{a8WP5?F{!@@+<;szZXHAalqyahd+x-<#MnC2OZF^MCqt%qDP*X^oI{I?^II|4+
zdWYb&2|!CU6t?trRd2Z#K>8sX0Gvs?WdbO_32Dx5+XKAF`#<cxXH=9+vo<UUN)!Yo
zN>TxlBqCXYqN0*i1csa>4moESNd|(7fRYsjVaPD#BvC+uAVUU+oO6zE-@>r>`ObNt
z?f&zw^{sV&><vq1?z_9Hy6Wnys;iS5ZN{pJ{-9I?A5h#>c&3qnxM@5F*ZL;<&5;l)
zGMNMiAifEJvhKbglR7wiU<dUXs{I%Bf$$WEsOcC(sq5-}h;8iwz`Gr6KeeYS-aGY%
zJAjf@$#y^+wA<PsTRgT_I2>?dK;e^m+VnGgC|~g7_A+$T1Im@i7XwC;wGC`pBBA0E
z2!?d#S{N+8<1=^!XvIh8WYEttN5JZNql`B5u-_{M4pN=ls!$iiZUq3{JR55u%8#RH
z+!IhWX=s$@6;NWBIC1|vz|1Jk4!yXHf}s~@v|u^4pmaSPDj!YFj_j;Mx&1<%eB|2=
zuw%~|z1h4#5cNeY0JA<BQNCk1DOxul_a_#W0^F_EYJ+fkFw_f*K-q5X5@N%31Hdow
zQcxiPVK(}Ge&88@=35OuGVTD_<MWCrI1&LJhDjpWU447{MibyY#i0EuYt)1$z2xZ!
zfv-$=pd%-y;84VGE)tM_x{4ocVny)FKtg*3c$-gPC0-T>!kPp$3O9cCu#*)i0_4Cg
zgWS^OI=AQe$8AgB>Ii_oerKBdUS9oYCa<CzG;E03=&U$x9}9TQakXB`e~vhZl*gA#
zSM;l&We+~?1t(@7B^11%SHBT|3IMd}g^wan{`uWU{!B_73f;>cb~AsL>--IU5TXDp
zr&YZid-ac{?SGrmDi=5l-lE!)^>0p)Pdxzc^b~KTG}}K%pCefIGY801Tt~d_4|^^A
z9^@Bk;I2eVOisN&63##W@}LD+<f{AXIkCS@^q(a8zly@va{ND4lmo3U12~pX2aaQ@
zt%Fb$u4VZLX_vn^MyXDSYKKnut9@mW_J8~DzYcsBUFX+_M|S!LzqkfMDUQOQ3UB|}
z7!OuRQMQyj|0Yy0#4rT4o&auLojc$A-!Jr53qUXwH+{B0F9LqCW9DG_<0Z(z4cO=(
zm1FbwA%{I_CQS9GE@>hQd_#P#ZT%Z1weIZeh~51hC-!5GG5Dnw<?o-cZ9h?Dmv0Mt
zaTl4pM37B*+xOSgw)5XU4&mZTEIcPJ3t%qh%2pOsdr9#0=GoI6=g*vd5p<V0_uHe1
zHz+l>`X_Nuj0QH@V(hOLI*rA;wTP@oyLmD74Y;)|ahK13Z{phD*7EsNM}x=)fjr#e
z&I-FCa2(eiI{vUR5pWcAz<pYfH|Q}y-NsJ0n~?vL$G{rl0|)S`l$Q9tB(U+4PZ)*$
zsaTm`g#tTL$V}n>41RJX-A?)gr1E=I@x720SkxA~m4H)W;`?_Lv4i<1YhVRq<gULp
zafbz{)b9%1_fIXD;5&#EqB$X@F|0s7YRjg7+R2Fd!9yUQ7YfmqLeMwQM1}t8EWM@j
zz#zL_Q_}jt&(T<>(m(A>j^F{)oPG0L@H-(6jtVvIAIE`92%rf<wj0z$lt4~_>e7E|
z1XA&3;F})wZla1HHZG6-eD<fajDHFycQ*Q(mZduQrl~0V9~^Hycs61NSV2zCW2H@i
zF&ZUhT>qIkKXh(dPy;gjQ1fR=;G2p{&i`aJe@Wq>;fxzMHE5HmUQ$T)$5^8RYDsJS
zx~ugoZWw9i061JBkYoseut0wA9}gR^0YWQd-9PeE@h{WrHqqVi_-kbUAn*8o@c!9Y
zoLOqnzDoU5Ufw@^{;vfk#Q<TDD}qj-F&SJ&0eRz3FBFjKzym!7@*=gMN@2KV{%ff)
zAa3M!x2=B#f#Shy@!91g{#evtNh?zUEVwi?`L7TV))4>H*+Q%8G1LjJAt!16j}-w5
zXo&zZqhj4=|F1xuA<)9*me{g?15__VosPcVYd8F3mkiqV{I8NAB>4YQNe}9eO}Dl_
zfaqj1TdTf;tT9LWe`D=<4J;43k4=v?MZt+IdvcTi{nvq+1iQ2n{~I&ugy^)U$Ml!}
zG`PG~WA?nd3EH))X@LS816Y=Rjash-^MikD*iv=So4-G%yL%kCG*V`fKab%f00Ktl
zXKpouOIy?vyIZOMbixzrVD+WPY^9$AZJksVif{bsDwOI5F{)AU!d56~_X3YCn)-9+
zLJGWuAi-$nZ(8A*={15s9qgAP@Tv~u2m9?nP>DZmx&Bl`<lpW=efVG<;g5h<d)xj|
z=})~{s|8R+zu<7cxHb-YF4imIkJ|yg0b>k*a^60H97y=)JAs>j1)hI^W=6or$8^^X
zG=pr$Z0hDUx<8iB7a*V8><al&;F}gNn(qDSETxz=z#z@VJ5(&ePurG|fj<s~5s=N+
z-=ZJ$1sAyxBmQA(f5qmvQa}@Uq4C6i5JPt-?L!LDOrM};NBXqTp;qJ5D}EIrineF4
z``7<*0~aq2g@2n)GdEz5y~F7pg2Zy9pXd5qbw3Iz<=2pg_V)HEH({;XmYPPhe8rx=
z-6zdvaK$2tZ0$d41tACGI{)ZnwR-SVR^mocM359o(t!JL`11xlr5rwG;)AiaYT<_7
zK-X{2(Ut!APblxw9WZGc<FvQZ;ODvJcxqZ=x%5OjX(TR^b~pu_%zs57N1Cm@_KQ^R
zFLC`3bN>b;C~*9i@?+?sSCu{|<PgFP9Ryjnu^x7lQ0|1fpV~6N3jhCop-7DbO3HEX
z96hEK2y$KB`SA@zeQS!c3a7A3(P2gx^sjpI%weg_;G~)Ee=@17z;K&r9y@%d`eN?A
z3Mfw`VX@6{ZDg;-%sB*&dJv)`%BrtT#OEr-p+!pt5LJ^Snc)En>3aXc;+}wVt4NV#
zB3UjFP~gwS9k^w1kZEJjkY?EDG~<S{0QpBpDgCFOIf(lZKC$hwFS-ZJoDCDL67BuV
z%m%HFEq)x~zCx=TQ_@l_zKXS&|49X3-hg!$W+bbl0WvTa%B`D)gaqkhcaZwn;q>C`
zdn-Rf&9=w?r#pvODSrpXwFyw2m|oa_2Mg{TtOu>iY-FDa`C(U6d=5UInwXns5Y|Ng
zFSvdctbytJt^q0>WO|;TR>GmO5P3k%)4#Sp>sj|pX>5P6`3Hw`NdZ`tFr2&TylzK_
zn)eLWwc8hXcfiElpOS`P2lhX&9wji0Bwgn&MrasyT1f0LvWW<?!ySxPURInzWVtbg
z#GNZ&um34y;E<;%UTc6I6ru;WRNUBnellk1+FaC@djk&{u;?o+S3HN#RCnE_iF3am
z#@3yFxFTqYSJvVl>M1G?CXd@}j|}q%FZ>RhAAviXj!(l?(X!wyuf;Bj&u7W?xo3Y)
z!19SMB0Ab{D1ZHFSxOWbbugbxAEa9P+@7Z2Ok<5^&^rI%RfRZC$KsEwB)T&S+yvVE
zzvmH8h`9LORkTag_#x$4VMs+WP_IrGJN5UcwVY<t^v2Q0!zMF=kNm(H&MO6;rd{@<
ztTlou0=RezgaoNY6j-|oJ0r|s5<`-wVtYnZ-n$|YSLryiGKK$9_d!R<`@GDp>RTLb
zH*oQm0D;{!2qSLCbF`#CWizUb=`g(#d-R&0XS(b=erveNLy&^`)rX2FCLKgb+K(wO
z4z<-Pfuo0B>xRFV;=#RV?Vul~{GmhBS^55NB{nd(QmPuFuEJ>(Z-S1Dmmnrs%3R*>
z`7bk)jLUzm`ZfYh;F(wk&fwzNl9OvT;V5JK$s=qD339^W5-a{vRk$~iq)H;Me!tlM
zZN*4KYGo>e0Jvz_Tgn0~y&j&tF=lcf&_q(CBIONsc&wmpt=82a{%V2Vt!8}9>R1Ns
zt(?>=)Dy~&Vt7+vouNas4jSay$9OBN6<aotzLV;N4l?w=%{Q*7M1ojw85=>`@qA%o
z7I%V@tZ}|}RMrb%H>8&myqV#&#<$}LF5*5#@*F=fz4&18uM9L%gydhKQs>d6%$?%}
zb3GbW&1oka1|Nza6^VZF1-*G$6YsG%Ub42m9?1UJLiMirRB`JSDxckVpq?A_LpON|
z9E?Vnz=4cYE-`;ouTg6^#>F!N5jy5xU0FE3uc`(cXmyKq9i)h_tFl#zoV>|db)a`(
zGsQDxdho^lhgf^TBlvmx9YJ=p{L@q-99%!*z_>o9%C5VZS+fIalYhwrvp|h2f?E>`
zRHeLEwTVN3U)F~F@{tye2?(-czhVdxIr#e40_g>!MjahFHs)A?lYe0a1C^~2#1$b7
zWIQ!oFOU7pHBRR0p48}NU?331_1-AKXUlduNaJP+$I-*_mOwA%CMDJWFsi#xk(8K@
z`(!uAu?rBdhXp+0l!Jw1SjEP3rLW4!bjOZd`U52QO-bsNfTETICG)F%@brO7Em--2
z8MQ(Y3)UO=T(a)=5%P6bA|MxLy&|FCq1<`I0ZC2cK21%dPeA}ig0I9?e^4#T0t+2-
zFN3$H#4iJlL`bn7PX)BH-tt(JK$D<F&ttpdpc;b5;w7S)=3h;}d~O_9ydGOLyP`mb
zmHAm}ngOqs6@pVUVvbvjKWCGKRDL1I;rML#sF$f}h?7*b7-VrFbsWk7K?3ZKU+OVF
z;vNEc4;Aeg_c`prlUFDyD=(nHwG~6HoGtK%S5aW9mbv|^HXW5nzIR2K%27&6fy|l5
zFx0kD(=)8#jEPC+C8^kaQZ+0ynp2pg(u=N<q|*z#N#&7GoIr#QCsiW*uc#Ot+32Om
zQqNEiEQ1`rRBY7mvIGX%PfU=!JXmU%qJSTVu)DN(g&c_b{F7asnH9|zRhS~hzP5$M
zS>Y=uREASh7PWOz4E&(%;`hAb8*nw|h0i|Wc8dqGtwHsDnGiQ~Nzb(yO6(W`)jBat
zD84IB$~bccI67dQ!l<c~g(*{tLs=s9fn;9VG$X?{CPz>WFV1qBS>y#teFpG~Q`}>8
za>t=_fX>lU{6Xxg{`Sy%WfgoCSs?+@!+s8rVa)z&WHZH1Vd$%*hSs}nnUf8&4L?~u
zSYBm#FPN2;nH`~XVd?m!av|T5eV`Rmg6f5-=Tq+4^2aaO5*%ph0Uzj~{zAU%?VRO6
ziO5f)EKqpMN06m}SjxNrqL-LHU9Z?PfL17m(&TPiqvUcv@E#}^+&=l%L0N?btx!4?
zIL(EF>BzZjjx{s#Z#q)X1iTEm?Y+TxPRe~``5mPY&E(|zX=B%kGF9vbR*FP`2OR5*
zb_kK`u0#U&b0}YLDK|X*cMgrSqiV_{*(a?C78AksfQZG{i{!O$qW;=G9JcrFeByxT
ztBT}Tbv<w{MYn*$T`9RM)JsL$hsS_Kqw?*H&RaKi2)(VmVU0S|4*K%{wrHsc;<wz@
zMUyGARRCb~#GS30zl+0};W&~@cLwV@&44dfj^f+pz9r?1A~y;;jJA{bzOeQv)G`SU
z+HneA3{~rXtP%TCnw?q(8Lr+gexul3^aJd|>7cqK`^w=^Q7J*m>v)O81Q`m{i_wQZ
zUn*V;1p5z3<w;s;@Cd0*Fr!8xcGp9FM+0BsdO{{S4(y~{UF~@c!0Q5U6n`$d>Z_Vo
z)WfYBWpfz*l+Rw0ezl4f8UfHs@Vh%cShd){1^!w_KIv;N+Z9h+F9L%LY05+9SdZHb
zrYdsW_;Kkm_?=fN$zUG?e0#EcOv%_3eNPVufG}Y?!`PMWkKaJ9?=eQq*kkR*a5p{|
zw-Wg|hK>QtU)z^LUE6hVkKH8Kb~t+|G-Zm3Nm+@}f~1W5T60BZL{O-5TJ^?<6}xUl
z(YqI`>XeQw*;Q3!Z#Fp$s2#ou^6j}|)uM;c!7oI^2k$B+jqDzc=$joGtUm?~tREp_
z3&mNgqi)92<KH0*SR6?_d@WweMdoVtxo!$w?)9Astpm#4(cNN}B;yp92Ki6})Wg~9
zJuUNr&RY?<Rofwc8dg06d9N*srrNF)SjJn-!rw`8;tpRJuCIH*_P01E^&H=I%T4<3
zUIzKZWgzbKNK2oCk|hS#)?OypF`nr!EDmkDU@4gj1{n$h&2{_ENJ{^TL|O?CyF66X
zcV2zd*h$q9?T9rNJX?x_)kFq8=lvhiW*ItZ%CPC)E+t#w+v;T=5@m$Dhua_F&R>j(
z*iDL59{)KC8m8_Jt>c2~hfXR1&vlH8h-Khy8<a4zyl;O=2E6;6jab^0V_Mnek{(ml
zH;ac7>gUN^4ffD$oZTieE|~dB4@I%d7nn=b-zT>{JaXo4c&=_Y6}`w#;c5X4YU{OR
zN_#<zPsQiZ)rzXdCt0}=h<n6{RlEoW&7VI~CiTjLmkZXQW7ts!s{p6Xm7oJ74@`c-
z9pRXEwD_7&3RVV_(?|-UPY+)?;z1B|6cg{G@L<F8EUopp2?15kwjkggSaS^MF<qWW
z>Hp)Q0bmEdOkR7Z2K<#VPWJX&DKQnDv)T@;*qxN9Mmz(H3Nq7iO`zjpLe7>Mv;?rm
zQ6!Ibkl=DyNQTMM{5*#;B*w?e5aKY5F57=P24sl)O6<e)kE-Amv%bh$8tj1he+MSZ
zQq%44Cr2~a-}5?~oI<6%k@5#igI50td`iW0|6b{Xms2gWI!*R)RdgUQd+3ocxZ)m-
z(i4-MC0e9th~l2rhZ}><n&ViBk!XrzYME>O=(s<^aG9SWpaJ`4yax8xU~;4~tkH>K
z;>Ua3;kw%9zF&V`Jpq_bm>=qCXkudy@H)+wBZmTxkHjtA{a`$oZMIf=+>N`U2N7y^
z*8w=p>9#IDjt47KNO~SkMzqeWk{s!yg*HKiNOPJY*03B@?Sh@`<Ry(tFZq<YcI_5(
zn0JS&l8wl_BbQc<tD?ufI5MH00~Stkq<Du5)_b%Og8^Mvx>%teTi6=9175i-lx|Oa
zI|CS|`eftnBbX#le1<{4{}9i&?>d}El;EY7MMk8$9>v-o7TvRG$1iYxAsl4JUz^YP
zi_qKaZ}|cuFfzIIH7>9YVySdn%G)PlOtv+*mB-qgj!c^h59mz>fSX)DIy%XY%c(&c
zBH2>lc~sBRIF3Gb6EC$=ognAVi_@7~f5YWHoL~TJTZ(x+6`~xNGJ5c$V!dz;nqdLe
z!Pd&|Nd?rFnJBLe7P^Vb>pJgeSx?LN64Qq(!-x~m4}5?TK$+PimlsBnNd*6#C~G`T
z2=hS22F@OuM-m~B+Zq1L73wccTc1CLrt~yjpZ|6`B)1yQTSrYFyNS;f5=|SD4UiAX
zvpgUIGYQwHvww<J4f9DHWagN6O2bF|)H3zlg0%xvLO4Q(60?=mL#1o6e{SN24FE+o
zYO3j<r_)OXX8K&?UwKN7ym(1uDs$mztfN$yY|o+(!8(V~vjK-7U<k!VDWurqfz~jf
zirEI!`RE%O9w@u9w!4R~s|5n>d8ZUCLzoFjjHx!l$AT52*RDOLTs~j|YFBVOH9e%a
zLL-H%rjYXSB3L2-<k&RkyQuT}$}(P^wmkIFukx<lj86ye2IhNI*44@az5CVknP$Di
z9fH%TfiDNfgGfIM#O#)&?TsqkQ|DEQe}jY8e_oV>I>0;6^jAC1zeQmm^(DL_O=y+?
z#D=kf$wtPK-=QWA2*_fzQy2?*rT8GLt5xIdCJqdlX()RnfZdli@Bk~xYkqYMuCXbg
zoe6^L*I&w}>0gc^J5-Ujw<oY&tm9z_%x+y}nvg|H>5oIH)|WDnlE1sByVKPrS3HZ2
zv7ikmbT=deUr@i$vmaG@*9)<G4}|5JiAkOIpeml4cla<_K2p(#&~-33T9x5rMQ|%p
zv3$mFrM<xM#K5q;45ESP42o!)UuU7Ufo{_IBmuCy<7_|3k9-Ur#UZ3+m}15?gjRr>
z(M?IL-4Lv-aFcyV%3zRp@`wVP3IS4;RM<nXp}<RlGMb~^jal=MDuYpRDLqrjLP|K6
zF?nE$_^6_XUE-h9?8}OvFv}9i`u8YHO#lp&n5{6>-(<BzAyVGp&>uyfo|q*Qw~G+4
zOSA)HX@%rk^|;^eSCfz>;bOQ`)|S~o<rEeTKi2uh*}2cWegnI8pZy(jf{jprT{{7I
zR24mokYbf6kRZ2cZaTyvQZj@qD;bkt7HLRua7Urs`CxQzsmyIWSXx=nnko9o09diE
z<XUIhsdODWK`obi=@wt2rQ|^X|C^4$7m6Ul5}sH@c|ueo8%gP}M}qZ_;driF;Q_7f
zosSq40O@qNIkBHCgQu6VtiLAC98*X=dZP>hv?Brz%x%uV1t79WH+ni|>u_*fLhYg;
zHp~&&mr1qk3^X%+I_(G{I~loz8;5^OBU)Jth%IbXPpjDk1Ng!T6c&*v<^*WybLrdF
z+=XO&EUKDsp{HW$wh0nMhUUIc-^uJl@Z8t?;}{|tiad!Dt49&QTS^re20M-lZD&z2
z9kv$$8ngtzPiDJfO`~Xu-7CgVgBVb}M{!Jw8M^qd#E(;D|3HPtw6Hv8P20_$>roG|
zj5xTNfw0fDJ@`t=zDfE83f-nK)ln4Qo0+K%(1f0wuJ_1jMK$B|*;iK9?KhZ7GnT+&
z35&aV{BRc8lwgg7Y8jdV(zD_kc&RCK|6cC1W7Gb`5do{zT=R}*!&t*1H+g_{+Vt0p
z3ad^W#=XMOnA`ER|6Q>VZ#bP;^5QrnQ@3)B<usOeW~N5OmR%ffZ;z1ezYJg^;O5}J
zNDznK^;e*Unj|>cqW&10^+z;QT{>Suhab23G{8~t(~mG&@L<j54?;)Y*N<rB`#g89
zc+ly)KyQ&M-xm-5B*jj=@?GuB0Uz=024Kif{=BTJcFTJe=<>1Qd5^!Q=2M}XzJFsb
zjR>+T1P54s^;1X#72TMdLr0ZrQq;iwAw{BjA{SqfI_%t{k<7}_k3nl4Mn|dOLo9KQ
z{sFi+rys2Po~9ffgBfVm2c>me&>gCA=JMmCf>U4~M`|=U`&*6ec(oxx^1VYGSn~$A
z!9k@iv4!a)cV+$ytS9KZ0Ir#T#4N>pfNYU4hXEWkDK!t-G%rm1Hk}8St|d1~s6dOY
z`Elou7jM-kB6&!Crcd+;-<NlSxErCSyezDfCXl0^c;8D2Nv#3Otk<gjIJ_|<z6n=+
z7v9r%9HdZMlYu40h~~%#%X*{k2`6E3Cc(&MV39BY-e(K*SSlhpGa8bJF22kN4uK&Y
zE<dk3QkoW9YcHki7TEZhqmlfYIOwVGVORpw4+xs|Wyk8uS#+#F0r>=U?r!e=w3<wj
zU9WY)9A*A@S53~7U_lh>>2~j^q*(J{B_%}-0Y%Iwr=?el!GGWXfTtX0H!qX8?~Lq`
z*WO8KRrbJABxl&bOleU51b|392Je)2*~KBwMCWH69Y2WQ#nma?J6Y&Bbhxqn2D+~b
zIO&rfIhVJZz%EB9fA;s&0|ecF?5JGp3v^fJ@ftwjT?JZf^3CGET)0`w%`&jWMOHZU
z@j6oVZ)+M#z$}b7_O|{m{R)b}qLp}m$aT?aSe$S51kzY*K`<V^d6aVEea@xdG#K-%
ztiKal9EXG!K)jiMAzqO6hpu_bYte3`1%EIiNjbVd5^)*IiP)fv5?Vl_ldt8@VMzD{
ze7*ems0pZ_1H7|EU&?UE8Qs|p4nZlb<$uOM1drG9`A7~uzU3<NU4<zaZ2KAPSi$ut
z89=`4%^uw{JQeC|v~7|HPl#s#<}~}DlMOKk)t3jmSem?bISD%%&P@=ZS(f*qO!%+1
zZ58(5nUm*ZRh4z!pIrCN`fHO5l&lZ_#uK~qhD-}m#wWK!PoM!{;!DGjI0bEFDlF?G
z+NhV{F;t1w)*fLoo>9Dp&a|6Gm~+NFiaIuZh6Ktn9Ju*MKthRZb~o<<*DNc_S9JR*
zWJBrI4}Em-$GQi8;70<3%;6s==)fTKlUxC*_(A2F1E_zx@eI{f*s8t<Cb>zknuw2s
zZjcK*$_f-giD=HG(hDcS{^NDK*@L4+!U0~Z^i-sT26|vL>X7$&47t`W4oY2av<7?@
zN;_qEC96~Ga(CEIfXICC?L&7StD*uvoUN3EWi4=UX@QcBo+YOo7M2})qSl9Ca5V}^
z$KY85>TpO)Zo9G_MaSUDiPFYL!6Xq_j>7T9+-&gSuozK>BM<rw<Ol?$<&+IU{v$Hx
zbL1f?3I^0Rx1%UN?Byz2-3`p9cUmU}4e*!%gXmEcfh+P--VSunlET1L(q?{6{)Hr=
ze)wSDcv%e0e}=2$kO~464j5%SM}>N7KDr0E{2uN7M<`%VDU+?VhtofXFa_Ujm%5&o
z3O;O@q)>OH)2pBcw253vxf{&I$T%6gln1CgJ^?b37zH5cQWRPnyl`zRBE<m*{YXBb
z8EXy%a$qIIoES1S1XJM@a}YhM@p|<EyvF}sN(0c1fS9bnp+95*)sX5l_C%Rf(`l$R
zAo#q_^2ceQU5J^e{ZWf?-AI5_u8}KpLa3uVx&0_5hads3;jezI><H%4t(NlqkT$sV
z+rE^%Q824C6yWs%bpLDy4E}NZhl9KnWQgrxK1m2?bv5we28Ebl?B0vu3GnKXEQu-E
zU@lF~kK_-Rhzt-1l~@cg0#|q%l>ePw<yD@>P5m5sD&}bC`wsX?QPS%62FOu3PT3!E
zcg#=?KM9|5800@4!y!Nc4OSFtQr|Us=6_A~e@*p&P4)jzUKOgf1Lb=1g`l-S0jRYz
zhK@}2e>;5?n`VLgu!t)S&jDV$39V#t^oI`Uh|*YzgL?)(Ow98I>0vI?1d3WB`9>`i
zx)v(UF3M-VJn=@oXjPubIR-y#bdL$^pZg()UTQaJdI20m$fXrvJo4y9z@tSyv{RS^
z&grk+^A~XIBs^=G?f)AMB3tawiP~S8=`I$FXmE4AIWaj&YB%<su(Z_f&GtZR)b%*A
zd|obC=9TYJLc9@<Q0g0@j$2iAva+?T6y?~_Po-1WEII$NXnR(ewE`U`^$Ua@B<BaH
zprKbNba;3eQ$10?<`7>K?k26cv^>z~4;OhK=)gs57ugo&?jz`=Fl_NDxi<?4=8{jv
z^HBDiMXI&rV=HXsUb3F+fSG@l21cG2Yt{%FstH`Ui#_%o17Xpb!2cFA#`qcb7m~|~
zy>^DEN0c_XP-|@EnsJg|UvIs0(5;t(p==#s@B36TB-s1LE18Jaw=vrR+x_!xSG)#x
z)XcJ>x`rI$lJQ+DVk`GXq_L!R!)ZQiug1=~$n2UbbzF0Jau+%Xh_+vNI!43@#J{HL
z*9J0`d0M@_od_z8*iK2_XrY1+81*68@VoZ6e#_MU4)A7qyB7vPbq_cYy?O4E)k4=k
zad1YYk#L>}PZFsCbH4^vp&xrA{risO0nL|((T4SRv`qvJT_Q=-0V0E{IS<Q>BWwoo
zVf-gblZqTq!02gzRQkQFG+->{*y(H0q-9)dl~I@fc=}r12-`wOMn8=L8|R0e>e_&D
zwEv4`O7iR{QE}dpgwX(ZII!Bk00Q1NdgSfk=mv5QLFXPyAPPQ?{TQyRtoX<}Ivvdz
z1{tNj(no16XtP!msx$Th1ZNk=m7s%AYXV(oL%%2>A72GRF(`LwCsFhk2vQlY3m2~t
zb+|}9I9`Sc@!VIeQk2;Fp(Nxc$Lxe)5X%n`Dw#ZsiObl2;#?y;NFKZM$r$v_KamZU
zZ4B6F-^mN5m@9_vZ|KeNZl)~<qa6F&C>aq2FUDFI9&`znNOEas3X`OZCS8wd4{ZZc
zH{8+8K9v{@rr5d-dF2Txm;U}n;&AU~0kE^h@gg=t`{!WT5pwnys?O+I+~U~fQzpt(
z2%bAlR(!r>P1%Z+Q#C!dZzLAfe$>4=Ydf%xaPp;T7IU1LxJ3_^)&uHC$*&AOznd@T
zDBGccqL2bQt{TwQIA!t!ZXm%xP4(LqjFJmGkLY&gSXl{+xY~Y{mZjo3t;=2a^KBV5
zfDLiy8D`D{P{0#8bD31x8+AYDbH<_a5x~mu_2Dn1A^_%a?DlQB2KImN?IQ<OYmULs
z&Gvk?tLhzCLRi=DdZliD6$`B(!HwJPll1E>T^!ZhUQ07R$65h$fuCau)W(Fg{%M%A
zXN4tfug?tRi=C4nAQwRa1lzIT%m#+`-hSr70|*~NkQXX)xp65#{wxgx16hKB0p{nf
z^Ta*JwY4?5zOg<#rZ~>uqX(I9+*IXQaS!$f2lbJPA4(~8n*xecaL`})z*4hbjT)r(
zT*8DjpOi_{;#i28_v9?ua^NM5+Mo819H!PytAF%7=w|q)JZ0~Wd50!97>HR@!~h!D
zMw(UVIwP=DKYW<6knJruygPMwss?u5su0pu0%E`|gx1v3f%gkMFhAc4%|P%g+!1QM
z_THn&d49v0pe{I$Bp@XA?wm|$=2R)7<Br<amTT3{o`|0Ie&2|d^`d9<t#7Cw%M3E{
z=C}q1!}Uq}7j@2Y+z+&^%fR<Lh5$u1nJQMzEAOO~A-!K!!e3GH7GN5=d=i%M?I}KS
zl}_nAB}Rs~l#7WO<rq`}u4t^(7+fn_$Y<K09*Oyu;7|vW&Jl?#V!m9<QRnkEyHg6)
z!GJp=c}vrv(<Fmz^WwOvImE=!j`W#6er=Vru=Rpemz(aTKvtxB2PZhx`NTX96#0p2
zRomfWgN!k->=>M+ZO58dQ<#LLn@E{A+cfCLqH5;piXj)h`i~NN=v14Ih~kQ}<8@WB
z9x_U(_RxzkUI{O?6uWbB-cry(x<)=S*BkMa&_cFRi8>d03?6Eo6RoleY;NGiC}&lj
z#Li@<-tJ~jAleewn7BG~N=9<+>jFBzT!Ms*NqF1aR0D$4k0+qj5n3ZCsUe^Wkx}Z)
zpYvD2Q>S}JN@akr(L3-p(Na5+{iRllG$MRg;R#^U6e7O>lc5rUi&%nkX~sM&Pk@7(
zJ`*_S;XE_~>*BY+c23mx;}ze5iyisGgjqaVSFQ9N(3Ny(as(9^zea`K<-aQSrEY_N
z;=KCswmqbwQ3Y`6?E90u83A&s)jgDhR7rrZ`z0yl#Zj__;w2m`p6w-#J^d77hChov
z_;$6NLoX^WEfNXsPtrEqdbfa*RxOqWE>wsXXC9lLxfA?N=T~(-CFR$SDj71NzIV_!
zwY=g1IRY};_o34AkM*r#(3Wl<HBl)8!Xe9vCI2@X?tST3GYceBwX-T-q|Qbjn-zpS
z>y@zMg!V_A>!pLEaG%9v0B>1Ws)U>RaJ+-pOQ~S$xnk4F`)Lg9nNB8(&Rq$f*H#O_
z4mdPy43DL8C-JF;XP#L)V0GcBF<Gl=us28N*Sm#);Z_3i(u<t;LWnu_b+o1+mE6u(
zh$>eNzXvihZp#V**E1h%Y;J(Xa^i#Nd}dX>8L~K3S#@{{X?V$Qe8t~Rg`0$!`a8F@
z(+WaL9(*j4OORp$27U>SQ9pj66}kjGPw|F}DA+x<XxamJJ=tc6v5VVlxpF1*8WR`F
z@omLGX>nCm`bO4I0}5Svd6h^?XcZ9s(<(T~{mqS00jKV=7F22u#%dUKdiOm<g)|WB
zwUi}La%P0vEHs`NlTWQxuPvLT1a{O3Xh9I>X45x8!uvJ|4OGcmOL-uT_&(m~c&aQF
znQtTGLPb#w9X%8Au)(mNxj9#0a4bn(2oqVIOmIL|0GS^Kvy1ul!Kcu@r2eJOO2Y!D
z;(l7uZnjUwCt#PKZmstb0|(prKReh+(#*A$6<_>is*(Ouwdwh&UTSnIOnllV^rU$&
zO1zpci32y)H1}Lo1kjgu_7nsy(vRbg0uGG3MRTJ543H-WP5+|x;KE`iyP6B?yP*q(
zz831^u4HI<_uauBz-;y~I;ByVKo2M$LCMB1Lrd2yn4a+iWR1zE%mpi4Ct1k|nD(Ql
zAE5+Rf4zSFI@4l1d|{Nnj7GwvpS`L{XWxtsfo3Y&@Wd!}YD=OxLI{6C__V(52YtSI
zDgVx|wcbZTS^4=w*N5~}KZz#MlNt2}<yd});vPUmD!0Kf*P7IGaL|QzWB$aQTCHWl
zLfuPQBl5us2?@!~v7zpAqdR+>$;~!b5UF5*IaJDnj}aSIUpF>>a_30S%}*0A%Hsi&
zzZ<B?XgWDB5ImXxY3dz;lVl;jF~#krlNnkUGz!f<VXynn;2J`VNxS(3G2*~1(6|Uo
zfUsxL?=$!;anN*^XwA)3y&YUTL7xRW?bRMhLY<8v<D~ifyE_I<d-l#1A$!hK%h8|;
z9UwV@!8_nSaKw4=#+MJ!cc4_+?Mt1O3B9<fsI%s*4<IUWspT~zzz@vC;CHSw9j^<4
zw8uUfrY(H?5vsSHE}cBs)z-Y2s#bV~ORH_Lna3omf)+f-*xLDK{4k^t2;xgYXH|Re
z=#=^61N#fj2K5RPwV|V|1B($>r>xw@<MMOqrkCT^129gp%a!gGKYRGVGZ^^8P5@2|
z(S|K8fP_tjqah5q4E*a!6xhO3K&He)=3`OaY3~6(vL(onYiw_Ry)Vl_IFNN+`EqHg
zIA+H|wz6*|lplx?tQ+nsu8HG_A!y<`XbOZSC8$DoFfsWurkQqtHV^hQU*2D6IHMag
zvp=Y{jahgTvHNwT{pWhfR(+kXQ|YX9a*N$fCkUf-y3=z5I^zZO<eO^rx50p^K4=z`
z{w`mo05x>S;N3>Ipxf?Wg@E5B(#<R$g2-^Y!Yo=McOTXj)t3Sb=b9t)K~kw?O>gx<
z2#7&A+5eXA2{0d8>zVUX@vMmZCtwE74p1%P$uiUSL{KXq4KSjEV}eoeB?E7P;9=U9
zof-)Bc71<U*>DzF8BxB`l-TU>XdR5lu|<;}${4(W4CubPm<w=^W89kMo{+rOur->}
zI?x#7z!-rmwFEg46n=?Wv}m}yI)*{RUs}@-)zQ}5PC3>blt1uX`Qi4PZ4o=y%83bQ
zVG&U(h1hds>}+#&SG8sxc7F|J>hATa6wkZka)Vdp$$i1a4Fm5^`)NPPg}4s^3A3W5
z*;F8nGDFf#&++0xB2|gata`GE1bNb(K}jzqSdMFEvR%wii2OaIn-S-MNxl4uR*41w
z<}%f+nSX5hyTlsBrI%pHhuKz8;CBoT3jC}f-t=C<RCJ!#hI5y=eeUN|yy~sg;k+>s
zmv6aFe0!cbUy)@!<80>@5!HjC(GFr!@slbB&+ipK-ouUseivHhq1RvQ%?VWYcA$!9
zbBYkCpbJ>0Z}GfefRWrUO@8gMG#p1J={~qE<Y0+p-|bW_rvTnX(igPny<pz$YAoz*
zBAlw@q%G`K<%cO*<{<$6S{^#DBrsB+2q($ydEB(TKi-?~zrWEoUWK-B^6PhV3=ns7
zV$JWz{Q8Q?wAbyfCPD#BehU0|pE2VU+0J4R<|~;i?46L6cGH%qgFzBLtk<F6qPL9I
zeLipAcYgm@F(z-`%W0@c%zZ*v*nQ-#Fi0i}+m0+$vtG;a8mJaP4@ydskdXL(wL|;c
zHH!$PGF%th`L@eLD(O0Ds8>JaUdAT6NViwZE#$Yq)3Q$>Ha~FMai))PuFP$_+QZ7q
z3WhS1x7A=!$<U;nvy0pIk1NtwDwwEzDfXHrg3saUEO)-AxclOuq|l<(gB>T`^||6u
zFS0oW74?azjYti#0?VPjN@AW<A#O7*exr>lBl_JzVW8Y?IMrzkB;<RAG62JvWA%A-
z@k*@wyxYZd^dhmT`u11VYAzMlY>%LODOE)yLsM<9ISqMgFYPW2;lF${Zl`W~HNvj0
zwzd*uP%j+JB&+g-j+DJlL7}g%E~{EXG4S*HPv@;S^W0S2Fq$Ec{Ij49()-1YRo97$
z57zn(ofdt9f)e4H^LC0_>-7Rm8Owh4opVoJmc@)0L_#i>C7!$Q$$Q0Ce<ZN8cEe~@
zgfip8qQK}+`0&$B;;N4$=+IOO)x@idMehPJChl5t+LVfH8376P@NJW;c^j_6P6~s`
zeBWc}shV|OX)+Nv{PggsmjYXRa4zQwz`l{Crq9jfsB}o3%o!B+nrLPFksBEkZ)$b{
z#@Z_z^BMpue9~3CZ_;=J{Zf!izAWN$XZdXM!<Yvy2uk+4H}f*>e%Zsy#a9RsU@P(%
zI)dIM^70_1fte3RX__PRz`{U{^R^EVXBsuQ6lGsM3Demvitr`#*eFffjvV_MAhEEH
zxk0w`++ShSM{+ObqWAi&e{j%A@d+>Si#zp9<x{D{lIxo-zD{M^O&E>+<))l9`N2%)
z%?pE+aSJ00$QEan0%pS8yhpX6gC_2ywfh8d<$F08Vx1jxa80zv)YKSz`IG(UCnc|6
zpE?~vsCs=W3ll96ljAzuS-y!{Xp7j#sIe`Qo#L~8pLZ+DFvqu)ale4wcl`RalW}TM
zLubE`RiTLc-17c8iS0tg0I~V4uYtqn_QpFGIy`uatej^IJlS^imrynX{={_RD9mvB
zZa|1X+1@I+RZxPFX8*3&Y~3DfhsfeDdLb{7lCf1@d53`xD_2F~{gSPWlZ)_eCdu8!
zg?dGg>%T*P2ZN3=<MKpZ0K4QQtvUQ#Sa;qXC%EO-me8J9p+q{VPQhN$^DA~uK4#{D
zAJCkPtL>N+osH3jX8}5|HJ4G6J=0c_d!3jnrd_EZx+$xzUv84ICE7e0UQ#FLPV3HA
z+?#D<A<WFP8Y<?lD1w_fEy?__=Ok`YtTceDq}~(1x9z{~=Mz9C=&o%=k*@C5Ttpip
z8H=Y95Gra=YAPvyG1y@7X^o!g5?lHP+b72`nr!j6C6hA?x1^>`o=NH?a_@TFd*!hA
z@wv4QiM7L{LU^5)Kmfn((k(NjaEpgSS!bmAMgNPP>DpqOxpN++o*m*W-C6FsF0gEq
zdbxmWCA`|(PV=S3m|=FZ>&6|r?>ajrH*-I1(_HK?vV%+4DKO@`n_flxt=5U2PQ7kx
zGBmwz($E=CQ=*w`{gCD^*D?{OWp^R#>MF{<KKprR=sll1^G-9}v<eq-+V3=0UVKty
zwwY2Cpm<_y7;fOMb#FP6!i$%DS|{7u#;DV*Ke##bg0|hFgLs)Bqj-1;58FOGw>ksk
zY(c_BcXvPvwrz}rb!ye0V;2rmp{HVJ;|$+Au3M!`%XsN;35;xC0S0l;tLFVSUy@@<
z(-rm@wBF9SrMZ#@1qB6gi=AToTE23lr(U!(Rg*lNXENPSiLLIS0v|${>Z#k{M6q-l
z`E+d%y$?A&%kBf}uoh2_7-Z|@l;0muW!mj6C*pPMco|8zA(mdoR;{c+&r!aTTNgm{
z4W6sH_^r<0X|Lv_A`|2O!eWY~o6W|zx^$7!v>zuIBbGzls}=o_gDYjNgK>M*#6n)X
zNKA|NeiDoSwVca*-&cMn?Wk`IwruWZ+D~SurdVi*+ngONh_re=nyk2oT1fI*>Y<HF
z9ddB0Qr+V&!8B!%*n|z1$Z86#u<p+bP;#P-I?!$d`*{ns`6Z&t4vW*6@QjYVgjKn-
z9ukD7_nPPTw&Vh$QS(fai+<LFOk1yW^5z+OD76=-_UZRVbtGe^LcENX-<nUzR^qof
zPg(hn@2wH@YvD(N%@%6RW-5=S%wso7`?SPzw^wvgVRGGcb3eKE_7oCchBLz8wK-<J
z+N%?nGQg{|AM^w@-;vy$y!91OByl%(;{ei*d3$NE4B*XPM+-8W@22-jgwizZEF+cJ
zf}y=}mzT9y)p*UTp4-#BsV+OWoUKe$L3`%#uI7djQd?PSUJF#p<MBFgbQxy1-a@Bw
z&_KbWK$4I>T|LiC-w>VLi`)?QM_U$8Z~HllZ^e|am8kXZ3}{Ubv{G?u#`vC!U}dS}
zy07`!sj+|Z=I5+_((zO>zLJ>4>cK*HFL;rVLb`UDDD8B&juM}o$hGU&Y-W=PRnXJ(
zAD`St(~Qk1dRl(Z?#mn9PA=zB<<X#3xyUk_%X)&Ny(GMbd9>%^Gfm_<xtm{$*Jop4
zg@x$7YrXodB0aU8JLhFd2Il(9o%CzERC<FlrWdEv(J9%c<^Bd*@HdJNA7R;0QUKfp
zy&v~W`;!Iv7O#KWrsW8B>{!~YZ$M6#wM5Euq^lRQ61LY~f%6+;b_(_Se+?NaIGp;O
z<TZhEYaDrrihxj$Y<_+g+SdH~G}>W^gLZ$?cuv=X)p?_~vz&itCQ-+nAT5kpZ^x(Z
z<^GBvOZrTgdEv;OB$dSCkCsGHaAi~)re$ymH2m!JxZ2@jdWw+-Mi;w1GZ;lsT+^zd
zEX&#XFvp--tU`Uof%>>DugfNrFK_=sjnTbGQL7&xYcOP<^NN+c`)wKM9UsM>`$(GX
zotg1Hj*^)$UZU-_&OHME+!LX7b;^7?YwQ`sQH<Nmp;78Z#%{bi=)85b`&a_lxGl`B
zYcULL@8v7Hf1iKv7Ue~ydSbiDSc13Ym(!lf`GxChp<qv1{e2yrQQ7X&fckZ;HHCq_
z|Jp1`X06n4+41el2ez^~=LcsJh*(ZgpNxXVWWO#-V&Zpq7A7<yHKb^b)LtK17FOhQ
z4|ha0)h{<%^H!*PQKiu6ipQp2rBe-(r$ndnTF=MQC}_sw`51U#Lq0+sgKHv0)4zCJ
zBFr?>(!c9$Jt|U|@z{gQMY?jX;PS?|EV%%3)h~>i?^Cb$d5ulk;ikU7I<Efy7`R96
zvK5qjS1Y_9o$oZ5H8LJ#zt30`B39nADa*gfux0;AT1LT_q4<>IVBf;>OS>u6Dh6w2
zNVWE1AdY9X119aiW(`3~<E===)?~|$$Hp$Tct$cpXL+EUSTbu7LmJb2-+PtYYq4h`
zeZ2(r!EuUV<)fst+QzER?yPHZOONMn`L66nsieDtaJYM*+G$qLm5t&-5V}g1%`zk&
z-(pfXO`trUdRyBmzi(@GA$ok@tSiS@m9xFIt&pt5-5~q^qML?xeb#-JMhxaSX0$#9
zx#(~ugTm)UhHE!{Rap5(Be&4kHMvSIi<Z>QpE*7O{#DD`3*Q%XbawBj^}jbS-Ur~*
z%4OKC(uJPq-4{h~6rTzXx;FZp^6!F{rq{n!Nt79U5tAPy;yaiaESz3Try3E%Xdme+
z#~Cu5f)sO{mn)sJ;Iya>DbZH@5mHK}n<lxeOq_X&m6Mc=f#!Z`im3-8XPtzLkzhO(
zX15m1miL&W!gXT;W9^iEesyBPgz|#L%-fAf8Xfv!_!CCf6IR31ZdAx6^pp;XNL}aG
zQ6-gcXLZw9m76U<Got8-^m%agpNtN!m?P7vfKzdI1!^~!$9zfQ5uZfao4z_(iqQ<2
zr8d1??j*fvg`Tz;dp!QTQ~>c4Y$=lK)kSZ3qgW-_RiVzL`jp|uPGEQZgWJw~6_CQR
z&eOfxoj)ricggk{=j?uv3D{c#mVxGC5Y9&x&#w&93j1q?8Gaqe7Sk^oOxwj|^6qb)
zHTyq)qmabi5})6>`wWqo5~e_$N#)Y-vFYzcT)yn(S(=%-BG-uy(b<b%_`2>n6nK`!
zShNgXmg380AiUV=Ih?YP2KqC?Y2I7D^t$U-6IaHv(-x*^m8_j-yliMFRyx*SJb$Wu
zwJ*tU-hEx8-N|szy}yvYQbuwm`MFmD9*lnYtgglP`iG-XA<*DCLO|mV27@(HXaire
znOscxzRa^|T)hfM8#3w#VX`fX^Nq{4o?Kv5-kpGhjcAU>=VNdZ)l=+}24^3hpyDPR
zzlik9Q%|ALWsq>U)>rOTsq6i=$yZJHTR-83`(Kait(Wzysi@_rE7xBx4P^l~QzZAf
zm!(3zh~vixP|DErqw}j)FB#ilPSW;v%SS&COrO9@TRT%D<*xeXR54>4Sb^@`h|>CR
z_MTZ4xD8F0mK06zRW1s8Q5aB+54+GTD7R{VA>il^f<5m}!nm(j*<5H4>64y^QRO=^
zS2CaI_Mm$dqX;w0hCXMINp4rm_!r#Q=Nx4r^SrfD;kK9e;j;caA%E9iWh!26ih)Hm
zyt4MBc&?U~NlL#0NaVTn_q%kGRfc+QF0%M@G(L*8A8lt-A+gAlR3=cX?cniR&i4}8
zS(lHBVlbKl`~N8Fy~+7~ZgZHI=ae10qOKT+&6o#Oo)WwS-pGLIj9VRnXs+ZaI}i7A
zrm~Cf6URIK0mk>hOaZQ1Swp96kDfatIy&Vm#W}7D^{4k*{p29hNzXim0&vsaFHU8~
z3cH*)zgLNLN#_yv__^z`iz)d^`rZT2<Xja<_(_*osj8J&FILxi*9mPt{tSrLxa1T(
znA3bO<r-6;ju*4Y46UYv0xUZdb+$EyTvyzF#JVfXSmxBzRitKQs%<e_g0iInryJRf
zyvkU=YWdf5YtcEj@-(n(<e;HlMN{&99CWm<axbWSfx|snCAZhOt1u%bMMBL@G41p`
zeXU)CRgtuNS;Gl>jln)m(RAokO&WmStfu;M*<-GYP@Q5DKYiy;EgOl9OkGv|i2Sp~
zGNDb8C(Y4H`4eZETBf5yec{_|j7b(qt~w@h$E)Y$RA$6&Y_CNN^M#j8+Fn<~`y{l|
z6l2%oVFioEi*|EEF5AJ>%p1ExHc-wZUC*tTp4eKjXHYIihUCAJn;&stnBNYCyZxvv
zq+B<ompLcBBN{W|c20U}Rm8Q0W@~IsA<)3mmPyr8yCk!`O()JUXFhxnDyV7yZv{1*
zax!YiQ=R5}Xc?C`g6hdMC-*A^p~TU$SO35jSkJNP1jfzwda~lu-`lDxi=Sc(0vXPB
z(oBO4($Y4o#f}ksdwUD%<r~O_)`08T{aU64y9$Jmm4Pmc7q4$lO464(_2$z%@=R5z
zmd&(8X>;e!urw;VujF8wRQJ_3+DLV{UM$;-9r0XAaY-H(d1WwUUZ_AwV4&~Dyz*(z
z423)q7pB1i>&@egXZDs#tz!Cqwt|Ck(sIeC=rqf(nHMd+c|0!sPKqBmyQVLOcEP}d
z2j4ycYtbmyJ740uG*aI!7QT2I8J>1uWl95Wo5n7q=wIw;$#KnFBcr{kS*vtwX#kXM
z=@by*ptD9o;cJXEDU#2k*S^Q_3q=Dg7p_9Y?dC0T;$Hszz>hX|3W3IQJ!_A5gOcUl
z?TT?u3*WwG+O_m2#Zj-uv)`jm)e;xRL?kw)q(6x<3N#c~@kXWcw~y{p=*~_MGoQF^
zP{C;-GT+BqpCtVKo|}4Aoe*Ve(1-f7vg3ZEvKssO#o975Z#vA#7)4H>V$aXz>{LLD
zcn$PD&m8=C@q1*Fp1IZd+y%XnTf@u6fcVOEt$A9X9$O~)HqgmrKg+-NTvf3w)p~&8
z@#Qyh#C4T(9}<$LO;>J^+&Y!6-8F%cXUJ!t?0kLkRa9PeM}WbvENxneYZPl_Od0vb
zb88y{VR_Y3HtK^YB(=P6&@}3-Pi$3y%$pjcJ8$6ZS_R_%Qo}?|vJu~9Z#Jz4O`&2s
z)(q+t@zaJK#7-AjWDafYb#6F_ywWV^GuNKq%{+N3*!TF!_NK+6uQhtXx=ud)57Vlk
z@;2W8R^H~Gn2?Ht?kvM7RtYe<Iw|>Rm(P_fWW*I_VeHyZz=rRC3OFUOZrPq3^MZ5P
zV{^;OA2ujA$|<y0SN$UJw!7x2-0r)+eAiVGOnbdq(DCE4>_TB%Wgw*kkVJ;taAVa;
ziH-C}&C{FXT4&O?e?~;A2c-aG+}{5d;%~LvBGfzP+2pp*1EuhVIwX4EcdKW`q;3ji
zxS4Js$;yqFOfl=kR9qx{eX)s9pC7Xs*l*C#0k!{`_HROiL}9UJ4$HS(PQF?p?q+$F
zG+NUk`LLW2{k04F+tlgB@t?^x%?+p1Eie;VD_-%@r2$P0e5)67qmUm8azN5fBSO4_
zPSSF3<8G0pE}F?=OPn)2oq#h`Bj@vXa7ScW*+@upf}Z*Hex{Zv)H~0Cr!K^mTXtyq
z!RRR$%^=Ye+r6u9c?A@!8yn6k62zH_Lk%msIA}Q$<!}hasl54|YP_9ZMXC2aH|8Zy
z6)Bv0Jg;r+>qRN2^Mq|RSDuh0)_S$*uT8HEU!<pAmp4~r9N(=c=EKW39?W{O`r~!(
zV}3@aDqEz=_ZExMhFqLc8i_!hrewp;frR8L*U<60MFx5ik*v$JBYAh`d0~>TGzhMy
zpWF6%vWm$aywDU!ow5CXzqV+;VsS+M-a5aHEl0r17R7!4HkwbtI#s6kOBY-;MVvcZ
zUt3>N)64ImsLSCZ%u0s|O6GSyQ}+neNh+q?=Bgz>UND}jPNV<D&Got7TxmVGe4$Cz
zBV=(R4ze{1sv8YINTUC(!bzh2VePSLFU!40&TGrDvF_hx>?EBfK$69Gy=3_Usn2K9
zOhL^>u9FgTNnSi9t3mt$uh&k^5|%G~iX(Dcn~D6Kr|%?*8BZt5@M`LPVUb&p7G<sI
z8Chr%waA;ctZSatYj2Ufc207jOmZ!zW73pfV(F_FiKOSIPohQ4u4%V)cuolO;Dy)?
zVnsr)wTAp_9R$CvD@b5}JEH8$;{4F}w6|9C5oHUjnPwf4OAcIhjQzh4R7m#o-fFj(
z0d*eX1{xq;WpO(LWd}0y>ztP>MBNmZB!{BI#xF7nh%Yk@8%@<b$liJ)rV<~Wthh+l
zJx*$QcaK@~d)>3<pAp?_gqdjS%WmE%&z6_n?Lzsyn$~lh@<J+O$KdTg4GYyK^g&VF
z8uJ5m!HkOQC+CcM8>X(~pi?ilcV4K79QaO)59JxW`^wnV3E6oxuL!BJ+C7xXxJ=^{
z%=fB*SM4FcMOW4jHTi5$J!Zn~G`UJoyRmBH?l2W7yogW?z4+J^UQlUXqVQ3#heBNc
z*wqk<x-)g*z|$CL#@Ho30@W5I?sGkE7X#Tk-NISZg^P?vD>I!RE)U8IwZ&~{r+qkH
z$CjRxTCNbmjug$%%ws039|XO!(Qe$=?+-}vu@mmrMLl{3%$(&r9S2l%a*ypJNk6D@
zF{Wyu(%pr~W#c_GFSzfutyJ0~MS(=OCi6kUXDu9be(C6O3}48=<NT<_s4ZjhbyIGS
zXlI@5t9LXXF4pl5zVm&i!anakOFFo<#*IN+d0cSc7R&cH;7+YxUd#7n-uZcUbz8?t
z7k?gr4@&pE>A4!Ot;&Vx<@-_miuV_1pb`a5+kGZt_{kR1@n}2Cr624bn2FaHAjaLg
zPD}D`da;$CmHRTBd)Ic-uY7yIGRJFqlf%_vsx>8mYxr_Wgyb(TzvY(lOPbaLetPw9
zKI?4<r(v4KyvX-fx2Dy#X<hFv@x9X78xoTC+W%g@kc{7w7v50XtDY6a=_xrk&PX>z
zPp8gNT3U)h)R*G}PX8pkP82*;r}C8VhYzKgIV~}1%}KGn;#UsPd6#Q=pu}0e1Ev8G
zX`bw9jVRL0+6TWr;@9lkIyx-zt=o;qmTuinPysxOqQv<t{Y=RqaTUaLRzh;~Nl;ng
zE~Q?|#(HQ$_TVDr1<b;aF|Wj!6}V&S;!Z+ch<}=sRa9z9@^;x1%VCGJKKgd9<Gz#$
z?CdJ2>k_tHw8mQ@j?pvKJ5L<Guhs*|7t+RKcN%Q1#A3*GgE(DkJ8liHGL(la1_vv+
z@78vH+HmMIGaXHsLo({dMBx404$WBJs}|e}4h~{P=EV}ogmwly&*rMDtJS*<E|g^&
z?+>UHzw%WZ^Q~Dgk*J+!FVn7un~cPE?x(6cf$fA#Lu5LbHRy^u2HJK;CRz4Q2QxXu
zu3h++<S2TAN0nQLJe+Gv^1?5H)pscp60hCexAKa~SO<}3b12+3wH&Vy-mO)BkaIZ=
z54O(6*<AZTm(#H01%Cbd6%S0XMO8BLIj3%|GHm&hh7;p`36YEaE$?hRd3vr~nKmm2
zg;BNMjwD&erP&KBBJhhFV!P3I;_CRSl}*~4jT2VuhV{waEV8fKl&~3`){W6!h=Y2I
zy(~Qg{`X%?+Lzx4LupSl<YL0>!OgjRUyxuI5btuSXCf<i-xZQ3aTQSSIjze;0~7tx
zLNkX{mDqh>PFBAEalE5fe0U8u&+j#wUzOuEy~%PS$t>(g){lj(^6dxCyK&_u$&$>e
znuVh7W1;(}hhPnwWm_ovs`*`vRa{5SMxAe|n^PRhBaifl-QH7te#W(G_Uj_muSVrQ
z2X^*@Vn)pAkTR~#jd%9tm!1u~Lun~bvBCky1p~5Z(=N(wN6?iYDhniI+KXCe_xeT`
zv$`>Pa%V+RTw<ptYEaT+Ikg2zm#tZ3ueO0QzAkos*tA^av}me8E40TSbYF>F$a5;q
zn(ROtl+N!rhWH0ajJ!rgzO$k4rFCI*6ok|7Tevq(Ym2%acL;u_7n&r#+6m@4>=gj^
zw#jynmli8~=OQ<RHhR1^Ok{DElS!cpt#4yl$KZm&X73L&pe4a3f)$afUPj3E9n?4~
z_l=SA@l?K*Ja^sOOEQ=m2kCcw$As*4b!a4__sD!g=lFiP#F0`rZJjKvA5Iz=EF4aM
z&fM|SB1j^bshqK@o_MTtzmPq6ey-F>sPqM<!H~1+1!6SFG1;Q7zic)*(jtWI28sqI
ztEAt0-P1}?>A7C{9SO!=H>Z9<B>{o;H0`p>n_b^ln0(Zb*(m@eo#VQvA`slEotv(D
zicv!NwC(lo>XzD2hg!iQhXJ`{Gj9R^IaMw#Mt$J|?dP0vfErAi><os@@3<^i`P-p8
z;U578ytCMwKlpm5`NHlz3ma$9hd$-{&NewKy63aiLVPm{wJzCynfp(o7PY+{Qto7h
z92~0f0pOeTrt)%TXo3M|Z6x8R1~=cgBKyUXk@fn;CdZ_k+G*(S=H(CuCeq%}1v50~
zqvrp^*L%mq*|lAui69arLhvBbOE8Gu35gah$}nTJBzo_?M1mxG38F`IGumj;C3^3p
z6GR;)dgpA<_rB-+&N<&XfBJ{py|2Blwbr%vy@hg)<7)+pQM;lD$=EXhG(vlW`?0oa
z^^H&O`1GX?i$B1XauT?h3&7mxE;@Ozr8T8^CW0TcJ)U%#WR!%8sWmgb*cN9y(*WKG
zkzX7A_D=M2qi*UWXQm@Z7EE?0_IW%@gP(2VnFGVyPsP^QG48Y<X?U=*l-Bhz77%TH
z^uI-0H}93qRxCyQr88=fs=G>Z54N4EDwpVJm)^QF-)n!|t$koZ#awrez8%DNJ`J6J
zZxYmUfbAo^9$Pk?&DaMaV&XQhEozDSg*6_7ll{M42^S|}7j^3ibYmkS9=zZ7XWjjn
z&;R;vOTWE{6}LaTbZ32!o>MwatOT=YFF8__x6b77OGh7~VyTS~I^~%J-MW3^`A&5&
z`Srb=^jB@zt?MC=$C9<#y;(In1s}grvUCu@Knv$wHlI$-9pwC_-1c~0$YDP1W{5sr
zZ9E?)=BL%NHYa}`e{FcqUrRXHkCIaI(S?xae(#_B>W!EYr>~Y%|7Y?h@m_v)q^)W^
zzmU*dnybGjKhphSKd?np{dveiwiOf=k-a}waDGUcc3_o#zR`a2k>Al#I{D$o#OPnq
zgL@B+3)zOx!L{bgn<<Icr%+OL;}t;6u4rPTAPYFuch2r_rPl|*BNS_Q=U$;F=VmE%
z&cu1{+-V;r8vgQ6%4CDLLXwsm9nGx>-qmpnDzT>m4@OjJmcwNFK<Xvx)clkDS=^Ch
zFK%E0L_Y@gTl<Pw&hiw}lq8QGDZS_%8>~i-_5Guts%K3^Yd2F-xHbx-WRq?#G^lX1
ziX)aT(t9W9H`zQ1{lL&5C9Jv7FDibxVdIs(K0fP<F&a_SGJiz&p;J8ew{ICsgH)UU
ztv4h!(R@Nu6o<@LhmRCz9VV?FfbZ*-ob2KK`!SmcQ1_w>@tNyj#KRIAk#(OEgZ0%f
zbZ|t6Se%dly=+LFdj&0yaI=e??|obwX>yozX4Xck%WWX_v^Y_#UnCb;v_zJ()tknj
zZno=m{W@`Ou3>&h-JM|pDm<~WrRgn^lo|YROI;^k)y}fpbA>w*_Sv~|511XB+o2f?
zKDu0~TMrwvCH-ffncY14=f!M1u0yCEgJ=X>LuKnLR{+<B3YJ}RH1VwI1q0(p2bSxu
zHfPu2hSXdCn+OAO`x<BAz^jYtx%5&k$Lx?}!mGhQ6uPj-QXcdmen@Z@3$>`UtLL1q
zUOII6{S52>EM@YuyS{I4%gZROs@_A9Q2P0#(GT;cJf53jw(U)Syrush{uQP>Gxj(V
zmwF^5wVL5tdwA`}9>>l7KyO`oiR%=>$S)6>t{yF%XR$l_rR|*?5exe)%?+hcY@I!q
zCcWGtGg5R_gWuZ<ykU(Qo6+(=xHF%Ve8oBX(BOLLRaJj*QC7sPjT}0D@LpGH$#K4R
z?krue7Hb!ZESx?!TD#>7C4^tTLC0((jdpTIDzA2n)9>+kygntd!u3DZ@@K01bJb8&
z<XivP2HQDZTTeCRe>Ft;t1SI!-<wlu$71t$_56qJvlk-v&3Np6Vy>%?-7o1S_NvkZ
zc38tk*wjU3-nrhDm%k74;_tP4QJ^HsNSE9|c5R~^3<ZkdrL6GQyhAqqo{_zoGdH&R
ziCg@SHQkMfg18Jl)+57Q?<Z9<1#d;rii_D|H`Ei@IOW?MbS9mcEv*qlW|Kob<3p9v
zV>>vg_FwU}RXNMyNVB%|m7y=kYwUA#rym4zQ(SHIp&m0y&RSPC<o?C3?T6yYca>Y3
zZ1l5h5;d=_&dl`W@jmr1u)*Ghj}7cZFIuXJ`)+_~mx^RM!p)AjU4H1|wKw{wj?TzT
zY~APAM!ROgIw3c#IlT%~Ih!Vv(#xDdrl$8!rNn64Q_NPz{#?H>-}@g{^Y58E{%H;)
zr07Y7)t5x?O}eV+v$!D8yH-?PU8Z}@A%8G0Em@nWr$QNKb-G6)!_^ze39IZSqfjd8
z+z+RwrpUNo>Nwi&6HA8gixxE`3GIvc&!&{Twtbu40uQ=@1rgfk{G1Cy3*y7Pp%nW;
z&i$4)J6{slKaXkERfg(Gx>*@5U?<*tI>!oQa?YfTKudaKE=d6n`$_%34*LOS1OkaC
z`#BYQV3;Fy9mJzs?)%H@P@!ib*fcpeM|XLe<WC^&wzgDJAZ?8xQY%t?pTmFg?r3`D
zO7F+z+~pF=*?j8nZbF@u#8QHvX=St3RwU>7#ReH2m0F78(TBfmQl}FjE<RjrqE|+S
zXNU57Cy2#z2P+v}2ju21`>I%RvK1nFF1MzRKNj@+tShVH{b9{LjZHuG@E8nD2Se}q
zvtFZ1wcQ<swO_ZOcj1>kIYtEbJ~QIxKB-^tVA=bRtN$L@pC74w9GO1)`%#Lc?#RGj
z%Xv<PW}+|4*~*B&vfpb9c)INA^@seCpRVrtEo6=f){!11nx}hF=&m&EvPY(R+<IAf
z5pF|fY-^u0{`SA$0(ikb!;6Djt9vwa{iVS@x56}b;At4w;-El8Anll7Wy0Iz@ImI=
zOfrTa|FkG0hKi1<n~mK!Rj$@peVtcWU)Sy>UtaEQ)z|*|JMV%dYK#0G!TCm~6a=u?
znkEx`?0sf`2b1V-+T;k(NQE`-ReLo1CRy@nvouk+|MR?)mwsBsa%rxv{PpTT`r$V*
zW-oonWQeA#G#9#x9r4D^LT^}?ITfaZUsaPq4L<W|+<UV^AKDftv^_4ABBnpy^JJkb
zl5qJb^=>(<ObK71qDYd@qm$IB`xFZUc{9O(n7UWkURRqbPlDYLR#~%awPC$$iy)OS
zNb*tl*$#>IK4Rfa&mp>Kt-;sjxvLyA>QnYaA(AECD+)CUa2RU5XjKya1$`T~$nkxX
zz)x+m73%r+TYVhqts`EKxuT(D{oikS<&wVxcc`ggJmcDo0Ac0-$01g!;X!sVTgf`>
z_;|@H@ms-PLQord6QkRBu1ZFikybM=#@0e_dET-5gIX?$RQLJCS>u`hI{A~F%AM=6
zdJDZ?(r$UK1b^LrtAG6R7tKcqkQxVwIHHsYyJLz?ofn_GNdI$K2-5y6ReyFcCQ~EQ
zHCG#p>0bjObG!#5Baw}c-Kv01oF$H|T<o!3G3mR^x90aDUv{92i+RqwrF~gY2DRLy
z$2qi*ZvEvYNUzlQNvFGawSQ!!;yu}dmG`+&)Oypg8(%yVxBTVvTWS9b*LiopqcN>?
zO7*;$&5Y-_o7+ClZHE<C%iq38F~6`omhQh=l)qo>JzYDyhxr@d=wUl^QML&t@~TfR
zKqzqEtnWWZvLJm{EIqMuXO`GcNWwNKelpj8hxOt(s6tehh-l?8@6g%3oGaWIQ|0*J
z(QaLJ9e(V^jFO_&kIzxsNMuGt1S`YLWAn?pr`G1Nx48A)Wzg$d*8ULdtW;DakdkWe
zT%X>d<yNW=*%`sI;1Af(c`5v(ewk1yQ1;ToCX)k1Pi5nH9p-vCP?knzha2jKA3hE@
z;<wKUxA|k2dn`8>;}=~Y8VN60oAR>|V$CL9)ku#M=k$+L9|v6Z&w4hA>csgT&wz{F
z*XsLiZd<;8N3R<4FoE^`Crv!u>`#6;npp(zpAf)g9=yiGi_U@2GpdR~=)b*t(v4ZG
zPcSh%6t|DB^)?q0K1z#4@Lw(3_w?51O4+lj97=gcX5!M9h=q*tq~5>Rnpdd2RTlHu
zIg%hT!c?fQrz4RV?z3OuungrvYv$<j5H{Ai`WD~{=1+FtMdhEyRO`?O4(l<btrMC{
zE^XwZTZ>Ss5_Yv7;rBm{)u_C_<1X`jP=HDp>fK0)%3t1UtN8w&z|qZcluv>>H{NY8
zP^92Od^Cdp&PUl}@qYFO!$ZP=QG-(w*vwM+U>(bifKkL{1NCDZB>#NJ!+-<pT;JHf
zi{;jrQ9}=4EBy#XfA3?tY{ziwnS=JJwE{ZBH!c%@&o`^4pL=gKM9#Z%Qi@=gW15e?
zNAwACj*_{CgoLb}<j&@#JgNwziNB4meiMbK!)EBN^EV<Qf*D<A^#)riYiL+!q0FgD
zj3px4XJeLZzKc&udp<m8nOrDs=OB2p_Kg75?tk*IW}|kD*(k8JthxDlIW`UPV2(MK
zo%q0ct+U-Q&N3#CuyVP>WTN4Geb1$9t^KRJM5er>;~mMPKZwdYHuVrLEotxZw2=`A
z5A|L-eMuid1hG0p$>fa(1~5kOZ<DeraL5=7wyy^@ad5t5L9~_}BWkkCSSGT+tc2`_
z=GD}3m_EK}jZ;NtUE%kTBWi>{K|<CjC|uwpaqMU+Gt*NyG&e5Bm;fazTawQCr`aWR
z9kWNc9{7z5P17AuPk@5h_7o>4RK6=pny;*>OA6U7w591jPo7M+aM8CzXxN#rc#kv<
z+^9Hmai|)?!$Au0O;JBHt{`R+L&x60)e*Nmt>NiY>7?SQ=YZU0HNn(9CI3X{d#IMX
z(vm16`rJY+s4B6aY{ImxY=y+!BCIvn0wN@{xEQ;@AA6n<TVDO;;nFKpc+sKu`XFaO
zMJ0#ygXY9oXk6fC)RoBF<${V^Ly7#NdmQG*6?*TvOLn(`LBljp5>!_9f;3aKWtaDg
zD7<C3Z=n0aSxA!{KGSD22<ce~*=YMbr^}n$*?AzqfPPxmvh^ZZPu#Fs$LK@e3inL{
z)Yfir(>k|(*fJORVRrXubd>~_dPjkk0F~nTrK)tL$BTpIalk>{Rc)Y}^Z^Y=Gj*lt
z(R=>YVt?<Bzg}p<DVvJNk{;V+o!m<4TAja6&!*_I45X@S_hE)Y1n8#q7HnTP%*QE`
z>vNfE*B5WUtEawiKB{*K+);^tMWG0HQ>l97vbt67He;1<$H7rRI+UT!q#^nQ$2w}f
zz)ZU0`8!PeRgTe|V&jjK_EW9+NQM$UdDCh}T%GQ`SG=k?B(P!Juky|WsO7)Y6tHGl
zsbn7Ja+mJF<2M}z%cDax4$F#t^p@Ez3#BiDr8!*>T-Q0Q<$|-<COr1X3TgM$?m=cd
zzf4<j3u=#c3+%`l5TJgNz~Gl=cO+(h4KZ|oM9T>(yOQAQ#4ErVRjY_X!Uk;_oy%?V
zIgrfpVucU=>`zN9v-i~$oE1%uNa5dydm9RR9jz|38IyUWyC?`y=#~xS{eV%a_|;B%
z@UXUlYuiPzA2wExRg^2st%J^&$m3yzgum{vYs<Nni6z`&Savjf1#SJZ0@q05+@hj3
z*EQk&%0Ime<H*jaq-U7wtUQo4R%LmDzA-V$kS<v!OHh|B`$shw;89-_2ZGv~kW4mr
z)J=vQ2G=%)C;5l{aimZ@!*9>ewO2VWw2tdoK3GQ*KH<^540ZRtwKy`tU*q|a)ZD{2
zyH#`{)UmCx7=qoUHZ42INy5j)XuG`kCB{M4?tJ*)YGeQpleDg<=Y{nxH@;*veO7>D
zt!U$Xyg_D9LTKa`?|W}NdQu!^{%ooAzWARfHJ1v)6MW%~klF<9ntg<(uYuR#sLL-$
zqd2QY*QIZFQEK&Dbs-88w7HT;GZFasOLq9Po>RBVvE1H@s^SDOrna_{l6%KkO)Ou*
zdE9VBj&4G?=_hW;lka1Or^Olx!7D#8B)x5fXq*1yw$J;KD{0f?v+F;7-KFK}=C;Um
zkjWTpOUv&U_h+G}W<2gh0izF#UGNA{LmdOpqQU-^a}W~v&}4OQ&^BO{TPakx^3CSQ
zp{b}cSl9dfxFH_g+IvA8ekpRiDTRkY1BrWjGiW`N_oZnpAyq5OwwMn(^d<PujVrJf
zGsAPwXBHGHdkQVHQa+uBUjS$sHI=<bkxn<vmARP7C~j5eA{>`ZuB{1slRpEqNx@VU
zmTBu6u}cf9*Ii-O)U$n29M7K{tJ2gv-6ny>4Q6D-UN<DAF?Zj{&o&vojAWeV$bIEb
z3OGI7@K0fTcuS4T@+3>(4?~8wPKtOdPtN^c=by53AXgRckplw`)0)1%***-Nn9ryj
zbgNo`AO{*saVJCMT*FK)-ceMG<%%doa3{gzM^+cC3ksuHR!QJvVI%!s?TRUzXTv5N
zjWNYg1w-42zc=Yc(NP#tbeEl<wZdN_0zaWzC8)N+OgQstXcpSkb?-)NkVUa347SwM
zlwyFfdc9Lu;VcrJI%-9e=|uty@4&s1z}0boO8|P>>_5E-up{c1wvmGjC1PX|^n|E7
z*OS7=Q>IZ&)=^|<0S-3TZ6<c>c=MtXKd0LC@n)lm?wVBp>1owkvbhoc3^)9PfBhco
zW9MmxPHw6+@zcD;)pbt0r*%b*B~}$bEU~|&D@$Pd+7>?iEO|IcvSM*xpJ|bZ);Ig7
zG(5wL>QXNwB^$!<@lUfq)^Cm-4WxN*FpY8(#4H7z(Wx{ZcW(Y$YN?_9IUnhK2UeYi
z_EI`e=j=P|DeqS*IjV`Xce@?cS7pyiRVV*BIl<dMRlXvdy7=T@SW)`O?N3Ab!gJ43
zDja0E%yAwk0qT%nF0%8^Gh@}h*6=bCSTB1mS4o$mrdinv5h~>~G^YbqWnjYlh-8Au
zw0ogVuJYnyU}!?NInxR5BGUZ2^7wroJTZk7;j5;W1XVs0yW%os-Ip~!XlzP~i<1kb
zrpUSQ`h8D(>2KRQzT<Nt4#|(8?wqYxG}XqF9>v^!=EJClL}0QCV)pesl|<vn<5=s3
z_DtrCrCkr*`Xp>m>%M2nc8Fq_;lq7W1y2R|UKAQQ8R@O$kiZH_D;sHXb<PsME6@;t
zhIjK#NzFKYF7f9xj>{zBZX|iO27_W(sJ%Sr>wK3u5{?s%$`R;FXe!H}#;;>seBw@S
z3W>k2PHUdo)Y9JVybwn{#^DV0hb~pOkQQppZ;pANwZCxd`)8DpyH2uJLjx{-)QZDN
zn9UJniijw)nRo4On0?P$g8rwEvC>APH>Z2Cq^^q;sX|2?uBBY-b7)BWf#o<j31_Ez
zN(5Uls4v1V*xipFI_S9sB!W3cw4b4*hDQ0i(Y0C3lD=zN=khlSzZWo?=zt3~UMg(1
zKUvz&{~>bWuc$)~Q<pqZsrfzKZA;vPR-pYx*l<R?CgtyP(7(EuE-qhVfX2TjH+x$M
z=2{aEaH+EUx3jBb;b!b9A;Q+4%R8zeylZDE;XEqhY^XC>^#ezV*iH?9pvf>^ANq95
z+kRMj&L`Xueu=~7e_={Zqim0ep0cn0csMS(hl|ltI~6nVxFoNPYTR89U5z}NWtbWB
zpS6po_~$(Um(R8e<}{o2R}n*{Q<m)pt6SpnN>%*UO;-jBS5lq-wwfO7b7MjCK<Y!1
zcTHCJ72*u(OOmu=ABY{)gGK(F?CuL1XoTn)ySYq7W}aeXwP^LoD+7B=kN74Sek}X^
zhE0-@uu+auSB-(M0V5*jkvTF9T4tP+;t&(6gZ@>}f__>YWyLWx=aiaz{&SLC$t>;k
zODf;t_>U_*oj#u~s#lv&3Wi=kht@~o{jtN{^Z7tuf_~H!<4_Zny&u<$%&KMQ<j!>3
zd7JHEW)&Z0s_Y9*9cP3a(kco@6qFDK2$Dn1i)D;m<9WPvnQsI@ALy4PmqIYJqO!4f
z-{cN+np=Je5{D=9Pt=KA)1Wx66xWIz&CSLs2!63G6+OkG$;%*;OA)d{6(wEcr8+!f
z!Jzmu9dw5k1tm05Th40)R{FGO0j1JO8fr8EGZE#?$GAt~Vq~K|!LPZPqtiAr@~oba
zb>SX}f_vH6QBt|cE$dGFDxPoCb3I9H4{c>@-QF<P)0D>5ndrdFmAXbUy#Ec!zTH7Z
zD+a1b?O<InR4W{&rHb+zP~(f8`}W_P?@MyP6S`LX{Dxg!_PC^@?fQR_hAO+o`QD%Y
zJUNNra&M=SoAq$T+X<H{!wGP`#UNe3)$@kc+1JV{M5h?e9ysdHk~QkzxJOaX^k;O(
z@r27?GrV>m<867Q?kfh3>n*~QLD&8Hg<Ne}RG+fh;$X8oUIW?#f|&J2!cXOy$MrI8
z;x=z{&gM2pPWJ2N*6970ys!3+JO9}4L#$3>i=(!Pt{LtyJ_$_qLB@Mk(10d!H8W@c
z(Ha0mYqN{5gA*}^dGVIFI@yH}2N^Pw*ERe^^Oh{>A{W{;WK<=D1SYHj{d{0U1|!_v
z&9D5G#xqdRAUp<^ndcUsj(FMB?mbD!Mi&KDKpcM>IuL@O5Q3EKZ|kEk{Km^QP2yt7
zOz2CxG%Jh2dp?7GXQKhwS@FQEq~^_FNuhP12aRnbc|5ac_ntOfrm!cm%xPE5^e&;}
z9yXK|{@8SK4I4oq^8?P8Y{LBLyXQgBshvtB6z_TATZ$mj=eaXMRq1rJ(Pw<j?LIQk
zOBI6|q-o*`SD^f{_;SV-i>^Jqe_&k{6JvblikA+B=Y1g(#ps16aiKlEYw@(vuYc6)
zZq4cLzm+u}9qvHA1>n*~253?pZ&DR54toh7IxX!Fq9HyGerEQgYWzY}3|Gf|fs{Gm
zpy}2<B@+o-o3G}aM9}EJk?!1?kELIy3v`9ntS4;`85}|44CgARZ0wT<x<6d4G;R-d
ze4754(kQhr!KGg^?y?2mD*f&-wokx<ox>rgqiWXg!{x!Y@Y<&TRqX6pf8*z}V=;s4
zmbssAaP)<m6?8M=v00Umv_4rQHDMfOME#m|Hl-Z!^)oz#B=O=~q|Ka%v*_ciIHoXh
zz8_ArR|c}V=^W{;Q{QUCbJIN!w_TP+jV6w#*KgwLAhS?ofFY%lTjeO+z_Io^AF?du
zPzsV|C@4lLn_Fa8J}C7Su&*l8OA^-u1*fGQq&!N5(y6MdLI*ELn3Wn<+sNwRVLI8P
zTT3kC;w)8=%|^0ef#FqYDLNCsVwD(7TNii<1%;vPJ)9(oO4dTDPetB0)!ZS%#i)Xl
z%prs!c?GDhRrJWo;Eslsm3_Qba~wa^INao;rD3Y?l~C@kSNsDQbk_T%(KeKZQmK9V
z<%bGetc3*Y5sMK4N~c3i>oyS1`h(U<pqz8=JU#9`dl9c0UnNqTGxst-YMA5UQaQ{f
z2J;COf^OwzP?KBuqY^XtXs?BPG70Ewrg;cM4~3<{#AzOf6b7`o$I5@Cz>Hk|l@{_`
zk{OPn{`QRk#S$c{4d-t3{!pprr%kThJOLMI{CR3^{X%iS*LIhe$kevudvaeRlO=Yk
zr_(y=b_=(F)2~_#Ee=wiagX-8S!w;ZSrMQ>x2o)UbS?Km46sR0PgDN(mjBboo-GMB
z337tp3mE6g{C$Hq;w}4Y|3bX>OQo%~2uBu+{Ty#^R`tu|I0rY?+>A~)bkC6)hJI>a
z+#llXA9UuCP~{12k3;^cDjIRk^*R2pWYa#QSB$Tk-oHJ$GJK|7*qyg)?|0^0v$G;C
zP-EjUTVRsEeZ%HJAS|*F4JDUvbYF{H9e>;KM&f2GXL0?`-Bgc|Iv6p4ZI2K$5|~!g
zPZq@WmL<>CHV4YU?MX7MoJjA^`=&0O*vG=UB0?P43XYOC)`bPL?WAw@xTJd(HKXES
zspp{&E;o9b#Kfdn1N(AR$<Q7nuo?P`B}AWgCl#luvZV$)^vjoSA!R*(6_k7GFR$ww
zkax-}&EaL|jEhYHcv9N+kSYKw_s<efFa%{p&(G5Bn%t5=CC}2>1FQr-!zoT#aJdD$
zSow!*;r;}_;r^w)`P{QGFSrT$1j&VV!3$Q*g6s(-<Kn~O$RO8IkhI~^_v+T6sV=s~
z?3kd6I_8(A3++})3dV&`db5WX9wDDAjcIlIA?PdXisPnt8#28EPj4?Z?0+S@GdL|)
zZBs@44wMEY3ayxA2j@cn)BQ3vMb-WF+tQ^BXj%Fs!`eFA#4sDWB!n&wCjc6x_jK}^
zv8%A!|7QFAjcw{eL_u}OSkWHbhCfVY7Z!*@865dBo!>b~8xAHp)@XRlup*mbZ`Xnn
zE??{PCXCtt*wS@bjp<MBBgVnvzwq;#NyJyx_P}nAt)-p$sjEv~2va|tdhZ1;C|G2e
z^lUfC&Ut{_xeFM^pqlt(?8Hgs+>DBJ!wv_#y#B;>8T|8~GVooUKU@2y+{e4s@w+S1
z--GP2->L?_?x_0J%7yz{$J={RTQ~l{+Xz_Wk1y~Wst-+nTd&z<%xhGKm4Q1ypg;Rk
ze(VW~+}fy{^vt;>V>}bs;T-_wV#-g(v96BN?G9|QQlKK6;2ZmlN<_10;pvPXy=L-L
zBSayCrs*hS8ddIuLdy1Rd-#xawb^CR^QvcdV@w1nulHND&y8IZgyqW=!Bfe-D$AVw
zLIVF7yeRPWA(>Is*T1dbJ!2zI*KxYSyJn`Wv5zu-z7{Rz75^efNL^?ip@L^2YvN?`
zSu5w^A8>gN$D9)xG$8Isa^5w##VeJAgO9#FskI#v4Ih5_ddF+2Cg4TRE6#%ou{hIe
zZOts!ZG0KyUW$cvoX<pg)Cne$s*L;v8{RkDBjp^B+1b9Zb4kvlBak#mk{h!y<Y+9@
zGa`Wrk|rJjtu*sh_TT5;iwEUue{yE!LV)TEd=51(%**@UPj@LdtmK$O-KSSF&z6jC
zb+ogiU0R`hWtcXuCo2)3psOk8i5Hgu72!s*CYOXLcI^2rF5QoDO~6#YjSvsKJm^cd
zJeY?r(&>9L`ObH|RsHz!Kd6!a{&36t>N{sqL)7I(A0oe?+HVuItk}M;N1#0VkEE0k
z_7#O(5(%@Oga+Oh<U_vjILN`{4~1#LJEhP{{~u>UHKz&*)b1t@O9|2jFK_#pef|kO
z7{(@H1_C~Au+D&{Vrh~?3}`B&EMD@pxVV!gD-6U@Mt+D^YQ4dT@VL3uyCQu5PA83K
z*_p)sd(bQvB#;lKkPiG(ST8+MfUA}Z6c-Z`bC-jQV`4;!T7ikto7ujb8!`P5w%H@n
zJyq{ap*|6lk7Mm;Cp8MibS*qZ^;5Zt4i~9JcQ)0aE#o>=gxQBB;k`s$qiYIrQ?*l;
z#xOf?69N=R)~4mHfKl3r)mF1>?*>0fbjA@QM*)Z9gtsqUPFV@#^{sZGlT_rD;(DSX
zokHLiE}@J2WBX*vKXpPkFxUbd<P27&vf;B5!{58r+Law9(@SHlp<R4I+x%rV7SNc~
z33uQv!5?@nQy=t0UpP=iQ}&l#!X1|;{nmQ=(J?4L)%=Jtf%}>e?xQNHquYQYj~W{R
zGsf=R%gZa~9!y6keqTcE{j(^5w8T#PHfiFxI>`ZkBdG;VH8Yjs0~h}1$^5ZS)w<--
zB?ai<H196I!ToQ|hu<o!b*ojH(&o8qk8iu2m*yt9;RCYC2*_p(9v5xouxevNfL;9s
zYf{R7yKvRP-uW;cZN}ruIk<n<z6c-{&G)6ABOtR~E?hbs)1G66F1-~Ah<vfa2xzC~
z9KnC!;bL<rdG$11-*!6sXB<sYed0aIW5o~1^<3RzxRUa{Ijx#o*ZzwN%`;;`xxl+Z
z4}feTQw*{L_3+$T%b3{oGglT3#aH#NH{m+buJ($2*feN>>#L4ewz462-;{Py;b3!C
z3+|wn0GhKg<*$3k)#6yQ#68sOXDt7`wX8q_%jIY9;QTfjlC;J)?6F)9?i-sIWaKO9
zbAEEm8lfvr90BzBBFmx`Xt_lTZN@s+4eO<q&e&VfM3^JO)CN9v^mHZi%y18;ypnxW
z!B=F(+6oMNsO}#))i2G|3a$?Vw6U@CBF@>+YE7sy7gt|K$dJCWwPLQOb^BA|@D5W<
z*s@8e2qN}V^3+GtVx>gU9GXR-%(EG5ZGt-ZtQFQ)X|peXI<6H}ezjLMhLWc`w_>w?
zE?{4n?b;eJI+u|gnG%8$dGj;>et@7z=`R%-dJDi_@VVaH>!Sp`z=5HJH2+iJ-ZFPq
zJDum?;Wu2kvE<cM!jNTdiftF}fAGGSNY7h=Ce^L2bpL0_k+~uI!1Ku$Rq?G7XGW|8
zg!Sm=UPCQiW~BYmo%|DA8T2{!dH?V)ywGfnsWy1YE_^a?y!-3jS^4PHjRH=}IC*L#
z8unYsdO2TWeiQYar?DUaRVU>y22N+n1FP}p0A3{@LA^BMexb}tv=d`vZ2={0>D8{@
z;4Hd}dUHEE=m5CPKEw`lDH`UEi;Tms=}YWn|5P*;B<+l;22>QFVnnR7ALD^P9TFsK
zTzDr6>{Pf3I9p1l;lai(K6iD1D~b@hy4U&8#5gX))E@Y@hr2KA|EGdFCWeV?k#*T3
zS7BkTmOef)(?f7kaSrqQf}D^Eq0qv9Q)N%fFI^#-=w2c$vcmylk8ZKd&bx~ejPum~
zN>|GFLeEt`aDN(7`7wbD=!qwf`d&_`Kz&TsqL&m#NpS-zG&_(ipd2z?4kAd4;gv9Q
z*jw4ZhD<N)Cp0y`K95^ERIE8I^}gMfk2Kfz?;7I8)lvS61HXe~P2U`>^x+vjKsw?V
zU#An9fi4hvZVV-ZRZUold;Ohdv$@|j*v_5dKI=Pm=r^<am&QCzVNPVvXE+1Ap=Vi)
zC1M9P!?$g1e8M8Gx*qHUcpgfxToNh8!~Wv3TuF7ymUNp+cAMKA)`q=$QM*}Bd~k5^
zGJK~=GIAKm3Z79`0vzldo#*G}z6ynycTHj!OAnYUBc%?_#kPNy<?uB9DkJQxPf-Il
z2%+FoLEZjtnalcEBV<f*B)Ewqyr&!>w$_V0V=^!-5CR{@!pA|13JBxr)V3P4@t52S
z?J447Y_@*YP2t?z*n;;TaNdn^;wWRkg&pW1sc@^XO^Rw|a>v7PFqBZhQ{d}XV3+Q(
z_wZyT?XLg3OI`3Wf?U>5gcuT(Al7OWTvqyD+X}*xi>&P#FRLgM0Y3_kuXhEbp>DGJ
zi5H;MRO!v_g|)P>t^T1xCT2@Sg=i`T(~eS?&fRP{6?KG`b#9$V=a7lplL`?_p~_1!
z^CHth%^dAJ?8UGSPo0p0CJv@fy+nlqF=R6S6DfxFZz$%MOABmJjR#6#z|xE4Q5h{<
z6O40gb%$8)NLW)T9gzJ)F=35(L4lZfllyIYSXlnr@C8)>546{e>J|O))SR@kHjnRP
zla)I&Ku%nps}>yon*l0JHv$BQ8I#()fc&`0BL`5&3J2RKzV*_5X6Myiv{i!I#bm;2
zwr-l1^@by|IL(K`cV)U;#r)<qHj@X8=8vUP2+Yc_P80ThYo|5JNqvdsrS8oJxcu4e
zw1vAo_BeIo^;v3up2Hr^Cl27E{ekRveF1Qzettl1W%HG-4ANW!-go95(y0|gkE8}S
z%+4^S@jR9J&t;o&w*-aDQ~Ff@XwTry#6?+fMIrOW3K+1Mf1*WQLvwg6S;e)Z6x5WI
zGME>YkreoleB>7uOq9&J09X}dk68jLeyEt_a!g(K;aknOMrLOiW<CJc<_ae#2gAGY
z!O2QjS-t4)0c~bn%=(QxDC}h5Q|j2p&-P2coev#i?jnO;(Ih;yVklv~xi-X3fZ`5l
zd+G$>u4_luRtqOK7E6{0hnqd7pb|N$HVC?EF&cQKlJRQ2@!;(CTR_wkGNy|}bEYDD
z4!41Oe2yPIFEAygAv~JoeHwIQg7c_~tUr9^YXQoVHVdZD&DrocQ3-fdK+0+P*@=)#
zb&qK;w5KA-VbCBAs==w<H*#{&3<?}1(US3KP!l!E<8>uH2{WJqA0BdjT)7)CO4URH
z8^y&)y3KvGYh0q8`mkHLr<U8E?(w2vE+yrWa-w>+7&NbE;;ASy2OiK=6A%^Bv_67W
z3r#Hen^&<y)0aLzA6tH8n4TedH2$%2=5%p^E~lr;ZNjy<(8Bne5w>k;@%fRo9Nm-?
zjk0US%WFoMPdDd{OcX&BsoX?Zm!r_Wdxc}G<FQiag<1w&mosO*z3ywk$nn@D)*TuW
z_v4zO`u`+ZGQf;}LJ>KbgsJG{$q`9TPv)t7tCGsjCg(iG9rrN)nQ`2=e8!UakPRd`
zBO&r}wtY#un74R#?fWJx;)xJfI#U0i+Btb<<Eg|r*3Jr{QBHq?zP2UdhsbaE`llo%
zG4_dY{@WSK{_iFZYt2h}V{H@j$0V|Aza3Q0Rbx=W)1rMnom664afS@4Zb~m>^G}`k
z^c-IY7IgKN_3Wl-<6&C&LR6)BCMwMOp4EEI+~^E$$jEu;l-ap`J3L&S6~oQn9(X?e
z<j)FfWVZ~SE<*yNvBIlO`Lof35#Fom@~Xa%#KHc46*gJ(=c=-jzZ>P(n<C?7+x_kG
zOEz$D;-BK7NpUgHf{A1C1D*i`mHN}uYJMd^v>k$*3Rp|TSne3OwVt@lec0U{+@-uq
z7AVW+FHYL`3IfZT{_nCzm<x!C%G`c*&TeIE9evNi&`>JXW7={*J5&8zO%49qq4)-0
zdRzMvUjz6Q34eL(LSa_hdlO6Iglo=3Grn&54;{jEYG~+1IvgG9sDQ6qz+t^wojWV=
zqrmU9MJpm}Y}P~W|A#VtxZan6$KHO>z4bqoS}CTE<>+!oIpQmQS$vFY>8l5@%`n&g
zXT{_3Xz$@b2(6591^!(C;B0-Y`gXjTPt6IJQ9seyFHLs1D%nGeg$`H8p9s1NSgUhM
z1A-OSbqG8?TZNE&oAf|L-wRo7#<@vBb%x(YCcX9vHDA)v2TvChH`m>MQtCn3qNz=i
zv3_?27Xx8%;7&qpa3o<OUQ<(lRt`@Ld9HBu<luf+Yt>U}S%_o~LOW0`-kh?ZGn!UU
zP<(B=Mz-s7U{<>_=9}($pW8tgYwefa6d<+c$i&D`iwnDQ-%EI-d)6sQ(@B20#-7iC
zbi~0!e(XOu)@H3_$eTB%0a&f)T6joMg4M$X4I-(jW?Sm^P_e&b?xsxjQk8UO`uVxS
z(8c9WpJ{pKc#b3iU>d<s@(HeIkRI|WCkgyFy5koXNKc!Gq?Nm~P8};}Gt|Utdzk$F
z;wgA0HRr<Dc$t;8UVOf*!=mhKZ;Z@+?E`5()JmUCIz2lJ6X*Z&rb?j8>16B7MwyAJ
z8J~$dz0#Yzjp<~itJc19=vn%?G>M+Uzn0o79s>X<!z_8TzyT5!CqQ*l6;hr!O6gZ=
zo^D$~(>l%PH{b-Q<l_S1A1stcnFGeSmUYQcZ6M&GPk_R#0?U7enW?0}jL1!v8tO~u
z{Dyn^i^d1QWLvRK2>?4!`5=iB`MlB56><dOv9V}TQDF_<*hR4#g}~qcOpVY#Q-Ca$
zrkH2vnHcxpGaY>2HiA<US8BQ*7N+*f`7BC>tQ0x*=nZ?6`}#0te7bHSHn)?#dQ80_
ztmyQzHv-^i9~q8y3u^!r`c&}j@u&#$@1IIFQ{!+Da8TvP)!~xzc<A5wvE_{S>f5^;
z1n=JUf@hi}66lx#RzEA43IYJVI6}w@U)bbt%6RT%o3A0wec&~7+y2{LV#|c>%2j*c
ze*)8r%U26(nuZA3NU5ke2v)7F6}Rlas1&ZVbD0lOF3#qmbB-A_?OuW6>f{=_OIXGc
zg;rO4?$^%EDv0~|uyte8;Jg%}gNNxU!h7Xwd+qV{&j^=!_zH82Z**#^Hy^{~(IZ|r
z5#cY^6{sq6{Wg`a&9dyRr=6q9+;t&p5|`!7x+7|m`+qN7=2=#r2m(|H<T3@m0{hPI
z@8Q?~6M+^Q%=wm^w1c|)X1UjCzMMHJ0^5sXq+dAwODlC@YN3Dt$5D3Fbc()Jp3tR!
zCY_goH(7Xi<eGXS?Nq(|@Xg^olJrkn5bgv#MN^T6xvt_eZBtdO9xr7z%|?(Xp0<`o
zYykpvDPUT)+dn8?dfhq3$8!${SwZrjDu@U<YGvKIe1edLGw2OGO<(?WH38MBLNWO9
z#B!0qOg~TP(%~R|A%n61^Thl=3`$kH{HxFctMc<Us5;fEf|i<Z8K2N)Wkk8uCIN!d
z!YZz#7!!6tK3?J@o|jna|3<~9%xLC}=!8I$Pln5EoLF`HRynj78LhV^Vo~)vXIc-q
zPu#nEiBNkWt3zGMb_+R-!)ZRW6jp=IE|7=}A!I`Ls$fAtmGsK6lLGK}7K#+Gg+GvS
z_B_OWFAtpM0mkLuK42z%3kaN~Ca>Q&KMwHN)%6~JbEuT;t6@W^iCwy!ZUxOH*a{)B
z$h)Yy+I<C=4PGOq<kbHGVt&r8@~Jm#f~mf3)h>PTxoEpw`)|}Afk290?ls8U?%Mw+
zCY$~H3p}b$P3!}k>!xZtZg>@oT&q&He>w9y203L{CMoIAzo=A{mnwFc)jybQU!ODb
z4-S&F@=G{iZ!I4}g}^Y;ib<uj2ymiXz!&eyE348{tl5S0QVK#I3O9t?v(iM0co*jp
zpzwf(sZcUDm?(c~@-*qo-DidZ3F}By=YZMcVsf1AA6ZS^zOu%GOttf1QsAt{hl3qC
z&3_SWwPz??tf326KB>k8e(6Q1OJ|<Wd2C(FqIf$gU<0t)hM6V;PpCWZy-qYgRPC;Y
zi)=^!BvWYSq~n6)n`S|cxGv>PZJkH1wuuD`)aoUrmG8cbP6Rt|u0Lj>ApQVz%A9DK
zkS%;j9uQX*zrwXV!_Bc^o)M*M9oSO9W1Gq(AObmBY79Z^b8vMHx@Y>J(D$nFFekDY
zQ;ms;h4QAZ(m!9j;zKka48QSyQ$UAcK|HPc*i?}F72Zw)<L69+5fdDL1`jAL*SuH_
zEKSxM|L%8|+mF?x>o0{PaF?2%yJfnnT4$Zk+K$zeCO*xkrqbTRVzb}B$JwzRUz>{&
z$fF$}uJ@HJKbxI;*?)x&^?%k*=Uw1Zn@9}y0odwSXTPQQt9g9PmLIC7UtJ#FwoFjp
zveV;%28~^vaHKlyu4qA(yf(KZ>s~moa4UNCt}-(#Gw}`gcPqy0DVK~YX8C=2eRfP1
zIZ)LnF6sIaU)R5JzrVb@ua-)`!teBiGCgCsU!u?J1C<~{N#Bh(&49KGJ$peJf9+QV
zc1FJ}a8iy!Tde;SbT20<hUWk?BS%m~LeX|+vyGgn$RSv_Z{JGcb$(14g_+lmp0NQF
zTBMD+Ok_EbNubKjZZab=iImTH_+_>qeTiN(K9JC{VNG52`R9F3;^M9LagYg#+uUI8
z<M4OkilM|y=JDI4>&gpxVnHtQ+*D!g(>?_j%q_KzY*karLp!@Fb`d}K#vy{}X$x(y
z)AqbtT|41BnGMrYbiH@($c!Z!7ciD|5un|QQp+}rtkx;TIrO&U_;Gk_AZjMJmvyjm
zi*eSsEna>ni&vl&c&PP+`JT;_01}v7@Pb1KQ7hj+DHO1e3X3B{+zA>9EB(71$|yI=
ze`)ee^j~#<64(V9VGk}YU-%7Nj7q2lH8!9r3BT^4DnkiyYCb|l-`mw~jj?wW7+ovQ
z)xq{l$mq{UJD;~^YcF432X!<zW1yGkl=r`p(_Ka`gGgg2r7gRklsp1*30rWytixM)
zp1D(H5__;R=3Fpg$0KodS8OS(IJX}1uRxmN@4rm#lThGBLK^SQ`W!qDc`-D#yQqG2
zk=EcoiZ>)dhd9LH`r4>i@R(WI`iBX#a-qV1YM?tY`e@qToBDBFtd|EqAtfZIar#JG
zuQC0c*7I27OhdsOu`ZYW<8FW;-lJA!5*Yc<j6?w-goiq8tN|l>#Dc5yRvsdN9)E%m
zsiilkQmG>P%(aAQ#q2^#c2{sISea_lRY(y~zNpF8#KkPeU#7jC-{ryy!MP#g2qFzc
z!sOg15Vx2IvawG|$9QvVJA-y7Q?sBOng3)i>C2lD|LtcyAi_ptAS4N#mWR=A$w4eA
znBs9RFkGy~_I)OFTnRTIjz$)Pb#HXXMn;5QWWFUEdYfcwv_Uo%<IZ8DY{-aqG5fgD
zsn1@Y7fD@W0oOL(l==)nGbj&LYJq)3F`>0Msihq03O)IfUL~VrCR$tZT+K}-zIAk{
z2|td$g!)~gqgUt&3x6N8znGAe3|8-BjFF0?(7%0RxNI*c&+bH1H?m_^f<C<-gkMZs
z0+0j&f({JLfim<@L6^j5)$UV&2#l++|0xLW6Nwpznc_!xx`wYjQu<DpJBNJj8)qW+
zb8BhI=WMjEbQtZ)dZ*-Q;v7UEEf_hPAPiUFbPcSd(0QfrzJ7e_&y1Usrje0UT%&)_
zs~SBY_+FITQyEry$;cVIuDc$6thLWX`n%+h=G&u=7Wl8e@9uVm_e1YB_$<utW2TCg
zg?<0@_p{<!Ck97B3I}7NAr-Vgb(o@0HR3njxuue6{q}#3q*CikUUugWn9kL={kB>k
z1|Pq6IjmC4p)@>ISPx;<WhhCyq4|R-0D6-;=?P$;1%bWs^1#OC1zEjb3)?9%>d4Ny
zy3)7FHf3Qo8LupYN0OLu#~gl3DLdh6iy#}^V&&?x%YuT*8&(C>O^i+RVHFPeEPW<a
z2|bqu;kN^z;CUY4SX)W?Ky{3l#x|_*ex|p-IZ5M(A}_c8`cEMOr~4bF3qUB9qk4Y|
z$hvd}FNb#kcW;05nqs*UUT79%9M1kFAaaY7Fv2d*Et=iUSkX@0BaJ3BC+-cxBlCNb
zT&Ye+3?5x)jJ)sJS{<l}FURIVgxy^buI`8No=DDJQdJM6XGEb&e(?ivC8Te$<u&;P
zTA7VC=Y`qqP3zQkt5S=GZ>5UvZE4S;`GCzzo?nau?^0SG&lxA62Z#ni{soI}4#1S&
zJC>;dVybSOnv(LZ{%9_`#=Ax+G-2X1viL_pgw#vlT5~9T{dd1#gx~HWq9<nsiG^5f
zmUR29iKhCk3$KDS>WiA09(+Gin7{KB&uUwGXQ<tOCzt*DNlPm{ji(Z+PN%%_SS;t|
zQUjYMGSU_)ZR$nTIrLED`+Jm0XLu8asuB{F20T%Wn7SsGlPyJ!(&+C6vu>C=@%{UQ
zR4XYjit8`Yjx3?N0GM%EG(Zv(7ox2i3V^NrZ}uo41ENyUJ0)dRp{MxZ{^Nns4vN})
zki7I_@z_}gbG9W&HXn;Hn=peK+_u>oTzDVv;Pw?}r+p!7BIX3E(ahe^+stb$D*W8`
z#tD%k&!l06vMhP)VTHA$6n=j@`|PFedo5pIOR}J*f@sAHu!#ie8aOyhoM_^DTBjoj
z36F`PyQEkWa|lIa@mdE`!mp;WcKUV*H9#b*>4C1-Kvq1)-%vfW*28C~Nd7`wM=z~X
z5qD@VD3C;8KKuujgwFog=xWc)GjoOTgoiW|hMfsg_apaS;vh*}M3MQrrm7&(x1bgO
z@xEzqMv!x8>zwop&as2xkuR=-;*a{ipBx;%i~x`o)K>sHR-yisdMv5qsF^VkKmKov
z^~IlQ-8Fhx=FL4xy|XHLoiA>`!G9w_1;p3|wV044+ytn*0}z3LrgiCnxMsJ_1Koik
z@ui>v^pKO+e#S~(c~+0?ey*<PMSAg2XRdEF>qEZ$>HlOxRkjCK`j0>KV#G(3`gh;;
zLo$pmUGlG4!8vn@)Nz9MYHfnQ_cbN(KlvKF3KW81VFC)rUfpjYUt#b{>R27!owIW3
zvBEdGLst70Gpzg0Bp=8)kPH19?zYrdYnN?ZRIl%Cbpn9k&j|CT`){`VOfB0`owV`X
zqv^<^x(%@cB!2>n$gSi1elApkRj9JM9Bp!jlAQ0EZlF}Ch09~uK#D0X(SQpu#Mr>5
zq@)K|7bOLr6)_N~p?-YSFU`oPa}IOLNAX{rtJ&Z(!Y8X+>9$t(IUwGU9{_)ccqMEE
zC&k>)VKi~}ruecl)=M^p>M|EVKX3WaR1o=n2l&cwg(k_#11kLU(#5>QD!8-g%FyV%
z>nLB=vL;?5rTdYqR^#|Zdj!t4Vz=^rW(-{n*11Op1oBg3`x@O|n=YDNE{i7=MwPGT
z64lLGt&@T*Xc8!GMb9|QUkh^hG@1o<$Z{g??lEa=RWnTG+8}t=Z)+GYZBBS5yCwdD
zYl~((IM?bQV!+sggG<OSwWCJ{N%${dX~-Kd{QxtRETEyFWk&(bs+wuk4=27&z0k4v
zzoy*8@+nW1NeCDNn(m?`B_)+S6XH6RO_juxg4nK8p<vQ^`4Fb-b8IBG(cv5SzQN(=
zo0<b%cP(Fo%%#KYK_YMaW7&G&&beAm*YYI_#4!4Hni{mVYRqlYmNz`C!}Qq#jbD#@
zvE-p@O_7I$nt{P%Z3H5Hzs7Ay9S2+1FD+*zeTHjm6;GGgYWwdwiOQ-aA^qs3Q7yGA
z#`>d6am~&BIQtbx_c;YH`vRN(S~tKuV`u^joo%*#e{<KIckLAt8^7Wd7LL3p{YO!3
z|2LE6$4&R|7B0<h20mI9^@VY1AW5^oI(I31<+CUFfp$a<nEs3L1?1NeYlmJnuvIs+
z*vBXV`8Nb@g9_N>pHYfV!gnhSyOq20QF+?lR%@loCO(^SJ$6V}eS`*6<@rNl;afV|
zK?Y{sVc~bp(MvWz%z_rX9d+16=LtqbHwQcsE=U%G9d#NIdXZ;5V8X?W_#796G<Ch{
z0ft{oqxssG6vcbwOO%>2b~jDU?PGrCV$=t}j&FYSm%golFIUNnP3-Df1{2V*DCaS-
z80{32xiWxhQ2#xjDpyy0pBfYMtukrh7XdU*oX62A7}oa?sR`pVoe+S+IZtU5dSsKY
z;}12zv}aD&lR}#G==n-8US9)Tot)~&`5L67HAcZ*HoqPn>gM}9Ok0udn2MX5*nqYo
zOV3o|21YB+aa?X!4Mo<EN&Wr1L(3)XL7sk)P|X*F^golE-Nlh%B2f&8TN+*JPGB>w
zH|dPYT5%jo0d3D&o<k7y7cJu@nBU4m+1k7Uo%S70FasZO@2d}s5IGP1OvITl=D8WJ
zyNc%Q%N(`V$tf`N*i72K3XC{CParNnJNeacd+UYmX5o;QNdp_LKlNtq(an)p(g~Qm
zH;+HupUpK-_m4^Qp0^bH&3}71vgi`t<#)kcQe;q-bWhCX=*ym94a@-g-2ZsSD6jN&
znns-Eijmg|yk@zk+p_iJRkEAmVW)cW6)~6SszbgRpdRzURPF05Btl7$HLQ95;k`ZN
ze|400(gMLe;o!(gNqKVM;{LhN?+-sK>`^diNGzuHAeD<nz2cX=Hjow*)U1K|un(Yy
zKcw|-d8KWtCWX#cYS7TjXwz3bW-K&uS88iitJ#KtQo=_5*nE?L)Uh1@E}85-i}^*`
z)!&<Ip%yWI)0B~6m^d<mnQweob?Sss83})VNGFu<8@$p0e^ba&{M~{%$tiDehj)E#
zo59Z>oe4w`xMu*kh(JSnt14Wo32|P&;pzSjDV}6U^*tiQ!KyHBNq%fvr?n1a2IYgq
z1xLwKzkVf+`Q`=AKTYE794+PW=!ld$jY3K#5<pb%;ho$|oVb@)=SO?r!N*WfcxMEy
z5i{ndq6xh^O2)mEIM$|qHQmZcU&P9%<8!jIX$7|@AmEGryrhfFZpv^4W+lZ<ssL9D
z5w*fpr_O+KxWK24y6VCGIi$S&B4cy$<RcFts4700%z{nP6UwfGi{r-t7(7q(-=7kI
zQj_5V)FFq7i%(g0t{i@!e_hcddLD8z9zQkknh{GI8t+U)N${GTje%28xHvNosWTvX
zG%IuEv8A*`Id(X;sd#ig|6sv(<UK4x%I!}5-quv5x-W=lCdJQs+5cN6yD#oj6jwlz
z(ki0nnV~7YJ6C<xii-6{f;|g+#qP6NG=8VIyj)L0<!2OA8#fl{26o!hI7Y#=O;8`;
zgJ?B-$*zr|-+^az#qmFTpHEQuAR~DTV7y<>Dz7MLw4K#I9Kqm1)D)CN*bjN#^o|g*
z0rNtq7(Iw7`7*htpP|%J2v38>gcy7vM771j#RkGql(T30wWez_up`mLV=nz=Lh&F@
z;u(md%O~Wf8jZ~|qkF?t!B-%d)qUbQNgVHmLSi5f)jt!(IWjzR4(@u*P#6)>X-jS;
z1Ol7<vNT24mQ)r;iBrGog8Rp%4SI6W|K$jAknS72PIp1cYBk+C%+9G~*f~nj6Z+{O
z5=w1-m;IrWe8VFOG%WNxq)m1eWUg|4uF-{QC{&$O=5lnkRPM>G*^Bp6If#<kiHLJD
zOvy9S(281{y!gA+I6BP5fn%LPB5o}~0XuQ+ELLYz_I16v1gcA@F9oc0;)@vRga<JA
zp<#s`{mu!mr+u6GiMyqpfrj4DN!CC9wtMudDh1mfpb|vnWg2k;1XmxloXa#dUYn@G
zLPh-`63gGgP;v^=#h-ZU7sp({jAfGI{MUO%#}C%p(@`(&YX#Cs=9=oZ(;5eb5Vq!1
z=hIuOb%cE?Hp#X}KlWC*vKl2*^hWlRo4jVi=W?g~kC5fBdTdkFr)+C)*;cn=w6(Mp
ztjCJJ-<LY)DTM79nTld8WR1i(lU=rid4y_G_9bvJSui2-I{~iz%*m+^2;-$Y`W~I4
z`vc8K_Cl1xYJttKv#;#Ho|F~?J;gkPHWu{yq?Aw^bD&YQf&s*QvM#acLYS(n6wKU6
z7ri@&TB57vBcdSSt*rd+w)`}}b5?pp{jp?fM31}7g-_SL#JL|!J$W+=Y>Gf$R9Jv9
z-pZGVCNXa2&78`d7Z~lm=#Ao^+u7J42)7m()D57kxN&v7J--Y8C(m<LL-kL{19Ju_
z7evp=?RhQ#r(KGfl(kpguQ<dT&+DF!LKDqNpc4gYE5EQyM8zowS`~l&lXcNiY%L<0
zF(e2wK5NAd3;I7gc%@KP<8Z)(`z`c}QjM4bf5N5{XX?Igo(D53fLl{WsdYe>*!xRw
z7cyN=>GeHm{K~pITxxl4G#*SIs8qM-!~kr{)BXTsj2U98ZM8mWeq}hEYUlo40uxfO
zX%Zjy3XFkOSAB=y3sxCnoJs;$kC0q*-rshg<@@x_J@>!I1L~9C5i`yG_lV_l_2Jr%
z-rh`MBh~+dy|;|2s$JWLX#qizZcvm)x}}s*Qfkp5-QA6VhzLk`mvo1;2qN9xAl=>Y
zUQ2IdKhNI#`+mGX-!T~8>mCc{yyn?)oaapJ9<l_*PAxtVth9plmF}zY(#@X?Z;@Id
zUoCu{%s>K#8+53fm)1niFHx4%dv*1oes9_40A)fs9rA58Ve1s&Wf-P60(&n5J38qy
zClNn={@F69kL@@F#%bMnZtMlnp2Up!8sHCe&UO`{I$lorjN;4C#BeU(Q8&fT9CMLF
z;iDIWoZ(5#p)nY9$`}r5Y$I%PY&uCo?;h1v-0A+@QS)H_ZMC<#JCW=*z%JvI3PTM`
zCPlH$&X@ErLj!Bq7rM^Y1n6jYDNBjti)`f4K@&o`+8x1r*n9!M7fLVCGAqIC45ya`
zpdz70NRNfGMyO1G!iVef{k^{DPwo$AVe)qK6yc0Nb9Qy2%T#=8{3Oeah8`o#(68ou
zPTW;wrV1`&0i_{&X;a6zF}FkkR%RWWxPGfFRSg(F94YQV1&B$GsyxFbhI=aEbRx%k
zvCTWr=!<d<az{cCy%l9B%7USI*<Pss$5D2iwpRkk**9?Mp9F!Mx&6V11p(kI9sr2`
zEF7I!eNj=g^phj%bM4lPo;qY~muY}<9qewb)?MTXL)AD<Lt*8+{CGti+qsW7lb!Zp
z(cJoyvX}+>>J6Qm3z<e+U;pXEkzw|}K~GnyTs3e&E2u7f_iO4XTeu-5wrx%g*!;R&
zCfO(|`|94b`wEN84Zv@o;UzLm-~X2utcz@i%&%Ple`DUj<qR{5=Jm2(UU5M}xDT}5
z6-kzszfFHEooI|df^Zb1wbNX%Vptof_PjLBv^#c?o7HZN%&i=mpZx+{_<fkl=SN^#
zm=L5@%LxNG%FezGpZV7}w^+!!vItvslrnNlX~EbU@FG%@(@^LJQ3Ugwp9QSfLtd=K
zHk2cFsFrrUHuyJsfn8CweyrvWCqeyv#dVUoWQ-3>(;pkrSJFG(x$PW@$R61|ZfKjn
z%uCR<8PD2SXpS=(D)Y@!OcR2c2_`%$019czd=fN^@LpF853A<26^)(+i5TnmNwI@2
ztAZVeMmUc0rzP6^Q!<hrH#0`*%S#6G_RdL}Co~?G+F$|qu4`^kwx=(sC5J+5$<skp
zVBEr4m(3D1wvM72i$p<0A;|>{vzGSKH%EK>zC9|k7p5bHcFTU`{TmRn$*Apy#rqv)
zPS2#$Oh@zfIb%<FjSNjps{}T_f)pW(p=xZxO3DLU+0~_X?E?jW;)m~ORNGB{6B90~
zjFnuGL0@z`HB%4|@KloSAwWz&g1E|dUtD`BcF*%xF!%M#^_?BoWFtcM2cgK*4xPzH
z(TR@fQ1}D_B#=JTd-wsh!oiP>*AE%EVOOY%8jP&sgh8SM!$!LHj(SZy@^Y9OUwYCO
zw}C=28#N2fga)kyogcBurT+6PC;5$ROcmuttnICgP>Rwo916pO%4YB5c!2>}WIm|Y
zwCVunVFE+hFl_4b6BwvES&u?UN{*MYkE{sr6V#r5lH|b;BKO|@*j8K67w-RTNMI&4
zNG>(5hl2avk4Ed#N_6D;7#AJgEFD3J)WFzj#wii!W74g&i?A{i8waU8zv%j!7gFy!
zF-z$UUG-^tOy>9ECf-DhbgC%*$PK{|GN@`2ZeipbmM)AMnMYPI?sl7*E^#A3=px>N
z%KUIw>p6jbfL2EH>*7<#*UuN+-!&fQ;zV_DQ?LdergPL&8M{Bz9)1oD!oVO6KvVp$
zk-$4Yrg6E?3(Ogw>hQf*RgFt<W>#Lc_Yc_-=DfLdB&c}AW=Oo$mF^HdJLQJARX=Ko
zR(q7*)Divz6roolb#{7MJwLToS9}m$JJ9QCLo|I{8^3ludnKN`v7>qF&a-wp$WY}C
zj55v-ql}vWr1r*rmy8FDI77p9_T>DhL7)*_vmK{}X*ju@MqAvlKjo?*Czs3QGsofG
zL^w6}YIzXIWMa>kZbM)~jiDo05&5Dro_Fm7$%;^CeRY__SuqU613*xoWnZw>Ny9*!
z`7X?+^D4K&Qkhgx2>^_xg4od)DBU@7-Up)P^Tg2H0aXOAgZ@Xg2$1dIS)wz(fgHIH
zN`mw|rksnQzZo@g#)sYN4!pp$VemZ$=(HECTyfq<WJd_3>ot|3FuLC|hJ-G_wNZD*
zvMZK`#09nMmdv#;c0|}^a5>D1`?0CfmiER4b;c6&)`}TBDKK=J$qM=A((UU-i3;I?
zy~vuQxeexSEXwx7pb$(X?a&@&OWP=O$)ozDNZ7?~7_Irz6%*1G^~5#|Oc4i2X0rCi
z^C{g^{?rQ~ktk==`JQ>BXD3m!$ph`1Ci?VX_<|a-><-}bBIs}YTRz`YKEvsoDh+;I
zyWr-s7P*q(ER?Z&^!7_gR$hZ6yfvgjl6KE2;m-Ax=FpJYPEgyg?l4i>eqK`tmd9m)
z*y`l$8IM#z{zvI3MpFAH8XoO;X^8I(nie%mQYE=W3|ZBBt`C-jQK`Q<emnokv#743
z+IjJsjik(Ftf-HBU~)$CTi&oDJCRxrYJO4Up#UxQxA$nKM6Y6qL30Pzx6>P%E!4iu
zL4Nf_Evg+fcuy=A-ci^di)xlhdN<KNGj*B1PW4z{-*C9xxm-&RtA0U>8T-M6np2D)
zYpJW@@^~tMK0hHfN}n@!fb(0)7AEHFVhm#1%UUH3%}A%l`TGhpMIctW4Jc+S?Er*w
zV)Yci!m%oV;l)-vN1M9=XdJv7c-P(H&hA|yjGT`%#qh2ZM5#4s#9veZ$ZVJ}8)kGt
zU`-hn46VV}p{8|!4&J>7IpVVS_>LBfGdf?>1cq{l_KC(uW>!17J%hAef8O(L$+I*(
zig{EEQZTu3rB9ZT_SOa+apK&vBkMd0>*F-^rRDAWS>YfIWUm46s&8Wm?1A)Oh3G)<
z7MFSBzz>WDMUsFX*@VzNcLYCBB~20T@N)*xbtD$BcmXAUB5$swExJF%<C4#0$7oQR
z`&bzaw9H;Fx7u~}Q*m*;86`Q0nxabDM_gYm4_O&EOpsVfI3oFyc?O)xi$>_;h-*JX
zSx1@Zc|rxoh-k%!n(|^~_ETRUQ)W{dhqzaUPv9n&ML((BM2r)#od4<}M*`rzB8G$P
z(9i{+<V;9=c=<TQFgc~O(Nkz*M~gnpbAt$PAV-T^{?f-HYQ%j3jOn>wR18Oiryqw5
z4N_vHP+=&;W7A8rKLYU%%^sJFtO)WV3UJhSB@8X`j?j-|m4=3k<4sKs>Cl7jY=|-m
z=&hBd*38tUwGxJhhY!&Rw|$-$3S=0_`#Nc$6p-&dK0Z>lCuu3{s3ud8oE8-fx!)Kx
z!BK3|)#mFpIx$SiGCW2#x0m+*;giS{045mGq=bfL;|#_7Z!aIs1kXsT&5)&s5{HHs
zym>GlZ-^y-Pg$RpH6BYCJrD3-^^u=TA#}!-)}jcB2uBXz(wuBaE`|(uAoIL(S9dWS
zWqh#k=%5~<2fmZQ5KL>@Sb#_?mw-RqnvpR;F80*A6q?Q}fx+0B$y!k(ZE6E^@_1A0
zO7%!BP+j1-)hq@@ZE)iMyTKFynUeI5)ItY<m%~o2SwY9kYe-!A84}J(FUufGn|ovr
znB2}`@~L$GUh#-7Z!{lUMXXWu#`$JiFFLaqI(e{mOKHYvtY-&~PNuG`Eb(#8rrP0x
zL@#0Cv*o93aT3`HhxR;M5oI(2joM{dcpB#n=bbDY1d5-0utEfa9)H@+?LHTGfP*t-
zp^Z=WX{zB4k2M6v;Qgu7M%do^T{gbczT~%lkRE#T3VPLQMECiFwt;)e7Y|C*lkx%j
zm$oQVZ}HX|F~SJB$ZcCG5m4!(<>}Fszt`*}>JS*!Q)nZ<^R1~Sz^^|vx65cK*&)fV
zGdM{)bhte>UXpwM?YAe&FPs-x1+(y?lqYL>jf`4IKa<n@R-M@&L=^Ag!B5sqWU>+w
zp?_6T%IlzQb%=_WaH8E&0%P&dWd!be+w+9z^(KI_gf*ow?uhq1>>evMOR4IOS*wnu
zkR~js(`CBt0Cp#;7gbt3p#-I6c5b|cqZm-`3W1-S*`@a_!N)BRBkIlq6D&F<^oaxG
ztm5<%=LN#HPlv#w_YDQWYJie8UaEmrbMRCqFD)_%q|cWIlfxscSro;kf)i8x!t^t>
zVCknkKrw67?`u(Oj44Yd<PbbM0CB24XV!mUySlfctH|N;QD0dv-wT<m#XVo6Z#t$t
z`q24kiaWe<ceqav-mu8?TwQ!(Fq~9AUWGp_)6$eEDCi!LUy8?>G`q5%uuS$bY8Ub!
zTo6$sJidqEtr&kfdE?^aQF}<~vL4$OSxJ;Q$(4L(>_+>%14WDCs`9()&BWqu#w#Cb
z-bLlDoJ_Hqq{~lKvl(?y4lHfKCI;UKg^Xv#_Q3@eNu0y$08s#7nZA(1b1&6N)sOY{
z?0aLQv(F-Nh85K0#Q>m4L1~hDChty)%;s*pR1kVFsmrNH&2E@2S|OzXNq4}2T2X<x
z2eVJ_Q|<1#xt`KYA?>5bbF@$KdqJ7Sx$6U921U;VH+^Zdjlr0mKBQ+M=|j~%DvcxV
z+dS5QecbOF4{8}$6=`0DW=64&EU(~ZM9k(N^5GKU5m=oYzkFVC$*q*Nd-39xN9u=N
zRGJ6Edg*EV9w2pjyL@;6MMytC?qWy{*S`rZk=4nGEF+@w054p%(k+Si)H<c2!c2X-
zH^XVm8K`FqyfB@3M?hI|TD1&FgD$$5(-1+Vz#!O>K<i*oYv&{Wu*=2}ystEkPe&P4
z(7pw4cSUb2I2AK-D&;d`%Y{E?71GwXaL}9T>b)(m5qaiL63MkTDF{YgnfRr}w3jrg
z{KmS9cAV6=53={(%W2J@;CmDigaj~JzdJ!02k`7DWvg{CXvGQn-{Ml#?A?AEAxMv#
zt`yZM*xPuDR#DFOsM2$1dt35J54PH~1+uX~)Ig*8*RADS9K3xTlWqwPQ?Cr;I2}`E
zlvZZSPmyLDXPv{7?!}_1<eFJ%in(9a4>riEDkw<eEJZ3j_JCq0<!d*EE>H>Hhp<+Z
zJC^tFk7}j?=w$5m*|O=-$jsAc&jzbV^;64B)5PEAR+LX>AE#ZNT+o}BIOR!-yteml
z$|tu1(+&eTN?Ozv5M2G_vkM|QbCy)##U$T87-<5AcEKJ7t}GnJkWeo+a;dGoy<Ir!
z1SPaTJj4)p2EvbxiegOX@04fe@!hQCGP7Y^lP$Q5g_32Fwee`dQ?-ALxp9;J^GmnA
zY{9pAIeM}M1)CIx{!3lO@d$O*7`rWQ{1dvND`5;RD!9AKUnj}?mfP?6oRh=AVIn{{
zip0+w;&KDmOKEB25Njzib>@bFf71+YtEK^As8j$I7US_@kZjfIo@+a<9Mx@o2ZN#S
z0&0^yt$5p_`Gz8n@8qAx<k6%&f0*$^I14!+>J?OE34qE%p&ZfxGdY5sO;@~6O<%Nc
znxGG%x_wgyZ|J;i)=OUvxEkiLdk!`RS#*JDqmwAzSpvvd)ulT-04{0y!H1)e!}h=p
z4o-`VzY3KSxlDJocx)lw?i*UQy1llRMYG39sh_!oeTVnvv#NoI=CJ<bEBGrm4jyrR
z{Uz)~zu2fcoe*oGCI&c(ojSk5`fJpj`N|m+wey2|8S#pC-wpsOy8liY9@Mnnjlv>(
zHA%wNvGaNMhm_sk?<JNNc&if&bD+j(u~1UJeycsY?D_tar%zMBOJ*^wqMQ7s=rUO;
zMioaW5o{d|-}OT+XWbpQ7vKRHzbqVPoZr$7FfVn!a1g-lsZ*7YrD_;6xS5TnFR8S9
z%cvhzQ_J@$iPe(5r&*tkO3hRCoJ$@7qIo(I^;!5>!WcOXwzKCpVW2{s_>XiV7UX0h
z8T!IOt(-Rx@+)F93UM%FmGW9$r98IZxR!UoZA|IxIpg0HhQ>KC6@eIu)8gN23luW>
z<EIM~uJOEEX3em%4q{RP)_L8X_UPpMEtfj`><=r0a3)(t)BC^Uux!#JjG*17j)I2+
zVgvn|BZ4E#*SOCY4fccF@9GL}e3m)SH3gpii<kMPhnbn#h?^z=GjcT8ydG9`)1fV~
zzgUfNe6S*^lMq>+&n5mygnQw(9Ba|UNrEHB>N-Js!)NOYo{BLniBF)?AF9F;jxgeJ
zFEDspHV`{oiH<Hn?$fFDkLJMmWA8{Y+x3%3*1}TiUbu1yz;cT`)m}PbjOc>Ks{d}f
zu>tiK<)5Q7dGqenL?Q{lS*)2r%FV+PSSYE?nmI!2i`KLzoxYiymdm>uz>~=Ub4k*<
zQj`jBn&MDoB^!_$2s#ARm35@ds^}}#dxk)1Po5&s-uov-n>HT;u;uOf%;e^UovO{3
zl}>0>*Gaa#x0wwEG>7X{d5~{!;5}sFlHe5fDTitnQK~7);nC5fuLJyf`iIeXLFwtZ
zW`9Evx<+Z5laj^7H9n{UAewRX7iOQ^vBVB`an<UIognYw9!ull+DM?<eyn3NnS6{I
z3u2ND%i$XDmO{VM66L;^dVv^b`T)!ep}sdxQ*1(UC!_@{?4ad)goF56s3%^hgiTI4
zmtom42)Y-XTPv?LEjefsb|ZlNI_~|PX#IOK^ncQ>D8YfPzUH#kIDHpV1RNepYK112
znn0M^hJZ^~XJ_&V<usKTi7ok$Ugxy>VItkycdSOrVM;98XWHGq)RbC2n%cvobMa}h
zPPzcO!{5P$1d9Rl;|H0?`{ykFj2VH7Z7Jr14WttGIw32ZFjKB_AuIjy;U1PJJdzBF
z1#%h&`uhE8Z~WxUUykzwhqR@;W+xNZluIUdk)Or4UW9lK0Ng2G3`f6b3yThXPUW)3
zm5kz<rlk)Pu`R_KXXPeJQ_A#Y5}mG3XIuNw5}%Bh)iIzR`dnK+ON@6U?gbp(fp%<+
z?tOWujguM^*PAPz;Zx9L=pVQ1Mge7EJWEA37Q$@rRDAS6F%OFh;pY3av~M4JJWc&R
zE~khH$sRGaH~+Xo4C4Hr5~&eZgb_UjtH<(y@!dn;X!Ake0*;Lh7?OXUo8FtX!TQ0~
z;wP%i6)ibA@rx~6jH}(;WbvxR@e~ld9$#!eX1mXV+aB?&GNBizCk)2a2=0B&2xP)k
zuIPx3S^}L}T$LxUf2p`0oOj6>SAnS-RXz4K+<l3Bb{ux>AhV>s7nNUnW_pAvm17<H
zpGOdy66(dJ6#hi;4$c>bq2!<6XAe+x9n!iz#f&i0<kz)^V#_h$ooanQK<cI2gL+B-
z_GQAJp0p?TNuYJMqz{m*(k%{4d43iSp@b!CC%xAL-TN^NBPtI|J8*G*16sMM#IsQH
zFDDk++ao4&-Dojh7pp<@z5xs5MEZog=xsE($=D}ES(uGwSXdi=Z}}s?eeY`YN$8KA
zwcS4`#VV~E-@N6AKRLp#12Lblza~m%El$&;1jOC`it}qz26?ed=d4otGwmZqE+&G1
zC<_DYkD`8kwbNIBawB9M@%-V_PAw-by*FKoCPnNuo9_<R8gA_jB&oW5M-wV~azcuO
z)7{{S0D7luk1)T98^Gmx$WEZkZpnHwP=m6e4<=0)7J?wmkDn$~?|^m`)#17c@!<^n
zj(43O)h{#T7ZxPEO;tzV<;!ClXSaAg@_Y0EUR{LeS-LqPaP(QQy-QiptMXi`FnmiM
z1=T$M1g<0@Z5tcDpjJvF^|yZXc%{@|2k<RVl5&e92p7mgmzW-2n}?9uK1lVgCM@B;
zZJg_zVH-5sNkEEaic3t{TDjCkp%MkrWR$R}`)VZp{7EVO%KP%Tp13|-1VM6k*q*1;
z{d{pX1Ml<bJ02TR$64dbu!3|N;z)t=zlta4w8SxJ|9A*5uP+D|=SM+@f$^UCPde;J
zFT?m9$M7O11x}g=TU4~OTR2nnJHQyA%-yMjYRT~TIba!!?o+VxMh^kvuG>J9t8X}*
zd~yL`C5>Xp2k^gy{llYOu<fT*ien@M3R%qx1>>yZuZ$})%S7}7!fQYE=z_UwIgdiu
z$<5q+#&8fSqD$N9BS6d*Ck!i^+Veq9gRvkR1|yMw`Q<6qO_i}vd0eEE!lg{YceJ{k
zo>`K4w2+6S&fS+_wLSR<0t6T6;H22Lr5Wz%$_S1D5=_1hD=-+G&lXlukn@8VL{|8r
ze!~!U&jvKP>N7%0gnlv@24RYFw?#grpL>>H(Ru9k>!&p<Cn0?xr4T=2zRv<beKI#~
zcXXE#M+KEKW5Q<XhIi!w&*Guwi>gjvq#vP0`)CSn@w)46xhOK^{PS<~_`hU_91B!g
z#%0<TnU^xL@vvnTRU++Nd+H`eh98&C2fe6Tnq~lHpzM5Zl>zhqCQ_(<n_m@Wqy>_r
z8P}2v?AzHkz>e%ZeU0+d|2REM$+mo7(;6b#-uWYCi>3TXL=OIL8XXs~`hQfq^Q^R4
z{&D0maCflq$;h(#j;Dj)`1?nQq56NZTm39H@B#qXz&6IjR|5384WQ>-z8QK8x~B21
z%Y_TtMpg|5$YNM!>Vz^Mt(h0anxF|l2gz4fGdMZH(6~90(6@bfZ^b}d(%-~n@e>5o
zLe-x@+rx$n%k;%7W}IcbtO#)`P;D{Ni$U_gWo)PZm?FaCb*4zBf~;JjfS+zOFqrlP
zPJ~}F>5A9=M;=0eCU)ZiO?1D9BnbzlrU9!rf9P368Ml8K*hVR@LPYvZMW+qUF{j)y
zsITe6RP+#-5KvG|TG<w6jx&W8wchYBgDLs{N|MJI)pND8&!1;Hpy329%PH#HFJxC&
zM}XaKAG53C0lM&GV<TgUy>iW>+dpV9sjB#<O8+LpvA$U8DQRy-ff$Ep3c!LM>;pDM
zA2M_NRw^t6F0A$SDE3Nw5>!8G-UtSdrvdy_lvJ%!ZhI7@&T7kcoy68Bo*vV6E%<B4
ze#h(J%(-Q@wV8>4`P-K&-IhPihVVabbJt5yei9=n*u242t@491Cu+gCEeDo*S?MOb
z`e-HEfRmZrJ3)OFFo3u8yh3Pc4wQG-E%N_;xc%E9S$Q{syeP22t~r&Boqeg<Xbt@{
zr!o}l+?`y-R38jCMF?l=<zvWVpN#;yDt41s=<LZA*l7j2&iGMR^0)ELMk%+e9N1kg
z9{e&kAYkZRKvPti$!M1*4I)Jz-YPYoN5v)^ef)W6PYnPr(GM}?r&N;OGcqQ_^;Bxh
z6uXN8rbfWXEY6ytU}8){+OQP-LZ`0H;K#h4?8~WQb&8=oXiz`!28^El+?ezq{6I9a
zy6x7I-HJw44O`qfQ=9vmUd?3~S+3&;Scdz>27(yqQFCAjhiqblUI0vh^*1s9VwqqT
zModgX3Ya1`HmPrHB#!|b@@!2BMZVHbDW9BI-0~jYKvpK3H3nSAlF}I_JsMT#200C?
z0U9tsAXe6vO!=|EMfWR?occXyCZql-odsX~HSA&T-7yEl*HVTgMy8D5A&&RiHUQL*
z;J$kALpX12Wo{TKgl+NV&$SG3AWbppL1zEQ{lFlwgfxBo#zf*U)G#zK@O`p%tN5zt
z&_B~N%gV`NR@<*>eKOi;0?SrSdzf-l5o&={5q6P(1@Iq?5dh3Ir>tslv@<s^A4es1
z-<_{*oP`^ThANMT%S(DkSz;1$ZW>GiVnQ?qo}WQlvFJZ`#w6z+0a!KqAh#Q9T#Ng5
zzFB*KuaSjDsu}ChT?{BgkU)&{&k8HLVwXS$Rx$skxLE7f+~4Q#Ldn-G3xhUM*Eh{L
zi#Bb7_V>kI0O&t^J(n<A?0D7+p#Sl(Y7M?eHsvNa{#2;43!qTb!u@2wxZ{<KY<FZY
zyCayKoK<f9Sidz>K~ue9kNeI)>y25`T^|*%uY5}$o;s})1)LqTM*Eq<z<Q^Ka#c8d
zyPYwizzuJrYYr>Ye19t<v+Zaj0O`%woHEylmQ*_$#vnNrYlRvTLIi)P*Zem-+WysR
zb|PF-m-NKfe(-R)vNYN#sI-rLBj68=V{i2sGo1i%1opd9vJAX=*L51el5IT*@c2!V
zOYx=<Ow%7Li3Bx|22DX%H90NR<*^5FdIToP!^Gh#_lr$F?)_xr+&%B3=7$=eEWEO^
z6xasP!;@J3KZ2A2Bv&o5vO%a4d5a||gv9R#=d9jS;<P1DAgTAg6i)qskN-#)YFIhT
z|38vMC&3i3C{x3F*zfQ%u-A#{{P2FrlLZO8@m7J9x+iAlIicPFP5iA+tPv&OrCD0<
z4E!(Ed);5^51_ey0R5riKE3euA|hL&>yAEX%Hk}E96U+9g)|GGbtB!er$_IT5g>dN
zKQ$);Y~-a)fA;L>B`%Q5?SqhW*bF56>7xy9m$32j1_GQ;U`crRC2J;qeoun3H9%%W
zuJk+!S|NbWdc8r!?u3OUgN|&bYdi7bfKrAS%%ab)koeTEX*Ss{qVUr(i;1bFy}P)Y
zMahq`uETNoySDCTjd#I*oSl1e$;ruxAmDH?fIg9IE5$Ei6U@SjNl3uPG{pl*hMES2
z23f5Lt>;S*HcY5Hxi%s;u)cUf7t2k*Z9ci>funphr>rx~U$xdNLH0~LQuGbdPxE$+
zg-?{6VPCL)gI-V*=6ocAjbfO?Ay(@JofG~b_$rPZLlC%bczm|(EC3*;DP6_;9XPy2
z5ET<!4ag=<2NV0EjCF@-t&7%eQJ*>GPj0#}dFIFDjYl<(t;`Zqz)o6#IATlk1m5my
zvtpBfBK<lp63iw;s8jF!ejv(w_#tgAQ5imLU`gj5$_l?4bD5O`2M!*#ysY<FGxkDm
zkrvPzcakLI@Y}C}9x{1C<gb1x67?@dy6@eSB)d+8e`19+@<#Mn(KLZ2758U#3kL2Q
z>|PvBw%*eN^*g@L!9u^|0XRWzD<iKYmt||0s~{yK&>l^Xq`MJ=_kr(V4H14&e$-Z(
zzEw3FP&sSS=3B0+p_o23Yi7J!-lVFi^gNl{EO7kwpwdP{Obq!oiq3p|TB!<{ctT<x
zh++Npa9$b+Uv(GR*mxu_@v(GFYo0>ahNW>og#><oNNQ_aY@ef1VpBu5hic`5d}xUU
zdp+<9Bk)*7N*p*N!j_l1Jy3Ri2t~-s8X263652c2kFXrY>qe1%CUrlc`|e8vSYYVN
z$iFE+Kz4#|ju4x>;-dd&Lg81myG!RC+*9e>HPJsV4O$t4p2Ei?`T6v;7~oyMxVUoO
z-!9Whl$3@CqSVZ!=B>txBo4Ofz(^FG$-Z%s&+?hWRZPqcigGsyriO1yTF`z|Z;GPW
z<LW%<!N&I?>;f$T5%~pc@dO#-z%~#w2J|XV=stIwS?E;{wenTg7D1u({yg^b!N}(X
zJ_8aqIA{b(*aIdv?-Q#3OhB!Y1?l-ky3L=lF|P>(uw#RTIU;gzH(y3wXfvfzfe6Iq
zHHpt_P|1YxwuktRPdos7vlo3;e~R<Ze`lb91-j#VS{cFG`?-8Qo3K!*rqi8Y4hN8u
z391{3L9!=pac5<5QHl0t1YjK(8jAGKl9ZDK)cA2Fh*U(LMPQ*g-@cVzD-Ot-SIvx%
z+(ipC!cehVo)H&1xl)b#*LCN9E*o!KH9=qldFywus5G}knC_Pu0<7@v0!!c7%N7WR
zhIb9wuU6P!HxUlK)S3Cg;C_S!Ecu~+zNZxFSV=`?AIYDB9a}nLzT8Q@h*(z9P@@mx
zXN(vrK!=_zqxgJ~a-xu{|E^j968@;3$n5D_5g`NH-m{MthZ&2KH8R;pQS+0)|NQGc
z2ij?%$*;fARq;L_fSat8U0JOIl(Bw@tRNBwK4E~o;R&^rr1Yl-!k$W12yy1?%i;}P
zT|rMMeM7jkamhaffP)z5DBz4Dfc1F9asO1He%QF`r+{E|G0bm$5KiAvOMqmF#P@yS
zZ>a%}1`ayirTvthj<O?pw7R&7P*s47Zsfhl&$0nRc+=4N5!(~uY@z#Q!SBDmcw%3U
z{oOAogWBIFo#<L^ZB=`9Y82f6oaadlF)~6Nu;GIKy)*5gMG{Tr@;k``&sz+o92B|d
zh-@^F>%bZzra^{vllvYme;WZN{dXY}d^m+JBAb0<0Fg2)>owc(L-s|>FI#8#YK5K&
zETfVP@YMaDpAV+bumfcRl3y&?=IZwlKj<kZ?7pYff~U2vZOqOakvTy!p^pzVk^uK5
z{VfDHs78joo<C9m(n|vS{_bA_^WhyhHWVr^gTST|Syo`ub`I_44*rSxz>S;Cz+j1e
zrRdCsy(MMAdNv@o41C*9VTXOl#7rYRGKRgk=n|S_Z}P5DqBmp%t2bczWt5d%S?Q_u
z9Y5cSj*#(j6>Jp$w~rv$7|)^ZiG`Ny76=G$fm1rX?E1hD`1qW>1nrNcetQYToRzJZ
zpgcc<Q^<Y;AeMZ*|M7-De#=`0l*l*o(d(&hSDiacWoU^YL1Z5I{xPeU(AavG!uQNu
z&<dy<y2YkhGC<KxhNk^}8CW6|E{0;rFm9iRzxk`h_x+KIa9CJaVB>^wMNQGVN&`x6
zJUaq}1daH2ISDYTOBGIcqs?$@!l!a~Z%_N{JAoo=<_QuCV`B1R%GTH6f7t_XoFb?R
z%!YRQ-kHH%0E^m`@~Y#{Z!iTSgA<IfVGo9-S0;)GUzH7&lrS$Or(ok4D>ia~1$%^l
z3WGqLVhRwJg<EGTsJ+SiMo019I-7(`Zm<#|K+q}v<d}lm(0Qdnt2q>~8Q^C{i*;2)
zNE_V+f!XsfDw{#6%-I08dPK6E;QIn3E-Ze+-wGY02xJ_IY6|?uU>M{m6%65Jd;bn>
zU@^wP&c6*&Y%Zvr#|mmAj^NNi9*UGW?JfKn8u$qNm&nbLfP>AHIJ)Qw+|I9@Mi>_Q
z_pCLwdb*?Jt$0!Q^<f1gNtP52oaqE|KWI+;3}FNffC2d#MmODsE{8onJnY+F>I~mk
zE7f~3aKL2@Wj{B?&_4#}ha1`r2Ku!##>-baivZc8{AkW8Xb9um!~>6<^e@~M2UPLF
zau5L6ij{IBHk0J?+`EV%HbW==9YA?CLEk&TnbrhO^!Mrouq}?s@h<|q{UGpH5Vs~q
zL5}*tfYHB@55{{OSawsZ2Rk5ps^~QX_dRHCk^F6^)S<5?QJlg@LomPrbStBs%E1HG
zC3Z4(#9xjTJmBun1%|xbHA--Ki?Oa~DF8|V<1_e2$Us{Ss_JvTlXTw0?8b^@sQ*K*
zyrDv3Aw1s!``-Y(Mt^&;IcjjC;Dw`d+bTqejK%A9WPm&S+;smJi=d_>A3Br9mFg(3
zJ<MOkOtK~6Ul{fpilab7`Xv(>#DGN8LBmkyq2||a*U$k!^US+n9l8z$@tY6<Kpwn&
z;OG2@L!iX~u4=ou4bs$Ugro0BtMB`Sv=d<wWPZ~P*mnacw&XKP?I2v<F*gHYkPAh@
z`ZL(SY!{R|#o!eMBSF;a+`y-RJaqvJoW&gzSwIpVE{`nDi~Dcuj1OJbBusg_l8C8%
z^{`+){cl6~lhkFAP$CP@(0C6=CyxWgS@8>q{eAH2pH3X*S3dY35_I6D2>>&CV8VoC
zwy>4mBR{o~gUA!TX^!n*NDKAkT=SLk+DDoHSw5|n{_%q{zyKY+Airb+fMbuhaLeG~
zfB$GhUBtcEx#TKPG`^C0sSyM4klJ$?zk+R02GkybI_!i#(84rH9(8J+h`!@q>w=u$
zfR0Z2o0UJ}kL`T`A^jh3K5@snBZ>6))sO&hSiSW6<Q2UYYf;uOh*DT}z+N*Xj3<A~
zbxh<B<Fg6MeLq-uuBAHc4+m0mq~JfC)}{d0B9g7P0pfzwh2H{=(#{`Zc*KC=4FO?T
z+rJF}6ZDlgZzXqoJCXB+A|XezAdvs}`p8I8jC2jG>d0Ij6SMqpg;s*5i#VJBtONF)
z{>SbRAS@GDfjdGV$g-Lf3yNV~d`QfomJWji2EG1};fG3pMyUe7;q+fs5&@#bq>GUZ
z4Sd1{PhSy&asUQm7wn%a2{ye2mW_htvw-EpVuPXo%0VhD<%(X@I#i&GpH*bv#e!LC
z*jv%RGj9V{K+bJZ5ETE{D$?IVdIXo}fW?+>;nnjNOx_U)?qdISGHu8Y!6`QVhld7H
z|F?uSIVR>g{nJ_k!b_Y?O<3p{o)ymDH+BH@B23`Ai;gZUDv@{o5(>5WJFqbWR>YnH
zRp}0>0lp^iIrRl3Oh#zFI|#_^Ppy6DkAA?wi2|V_4E=nT0&D<b`P)|we}5?rWekGi
zVJrtAoiT;*t>0h9Lc8F#)}RFS|4$+2jJ2VmirFfY^>2{_AE4<%#XZWJ(hzV&=+gFI
zUwXfX3iPzq|K4N!FWt&N^0>=Z3{@!(yBMy&Y{@?n0+z-&SU?V4WAif%hX$RZ&<cVD
z7ih}<8&tyYGAYop7%+pjfky5`s0>UfJQ0s1F_ahA$@OJk(edJwrxHcAwZprXjwQG>
zh5CUN)s=n=mDtpUt*F@kPiaH~Yis3GxN7N(6$)!>qjubpvbv<CSz=?~AG^<A8`#(!
za=+kVJzL>U^P(n4eG8Z76@-f1WRe~u7wHcDkQ^l!{?8ZSKf)1kaK%UtJc!!p`7;Bm
zRyY`5?A7P~3L9|6Z-(ri8w$h93Swg*{_`I;aDm)=!W>^9u&~Ns9M&@yf8XTCB{^ux
zVe*1>#1)Tezz26#aj8GwW5|L(CLCMC_F^w~kud$NC<rq$w@xNkaJz|6Zt#BMy<a!^
zaj!mVZ~;;9CK5G71a0)mobcd4@FaiEJ@(NHCZFRSjpBGV_;74Y!yfSadqH7vcT??b
zd6*Hfyu1KW2^`iZ&+~c3V;IxtQvP<Le;x>WFOXK`6AJ0Enn9o4EL)oA@eiu~x|eo3
zpwI+$mV$mV^h0*$(8E99-^&Dl?42kLs|=r4RgS9;J#69i{oxvz{QK-A0|b8)PZ%}`
zT)+e&w7VGk?8S*ZYt_GQ^8Xn1gHhha2+BTmD&H#sr@r?TyqEloQ{K;C0;)Za5g~xb
z#_&=MhW}UE%6dJAfpDWfl>^LvW}})R|3_Ld+@NgPBnINAT%TDn2ZYqr>gaCH2oU<5
zwGTZ|9r?isO&TUPHsL_r*<3o_jcR#n_D71*k5SSDxuEjI)g5&>ED5gOJrwHx&mYXt
z_VrH-eW9R8e@8|2P*&Y+>Lc4Ylalt<L`DAME}7?-%NhsYuV%%tA|fKPLor5erjiP5
zK?JN{>mH2L0V%QoA~#$h9CjZcsvBs-nNoiq3K{;#sUM>Jhg18O!0mXR;@02HPYRKJ
z{z_ya-bTvTCMSSPU-z!2hKFJ4=%Ku%9a?5amMq~-CXeP|PQD$nd5im`m*q7AEz+%9
z#%FkBgC_!RQr!$vLsL_$PC<lNB5P{|5m8ank6QK1k06r+Q8#06FflRVhbumqu0-(`
zW{->*eDQch^=Qy<MN7Y00D~8I#(|-tqKc5C0@hqmN!^7{<X~?FZOTjC>L7AxaB@+S
z@F*@iUdAxV;re5_pg9^ETA#V2ri{k4MwV2P)8(4m^?S~4pF|3`bo&Da3A;1?n^UTe
z=e<Lj60fN-q@iSyE_>w8E-wfJVYP2|)zUSkxFUsn_D!;z+zr<e&mG=<Xk7Q2phbfu
z_v$pG@iUSx{vqKPFFY?skKQ>YH#4^;@1pC^9_w2>>95}OiH^WMCrX|5yh*$`6l+W)
zcp4ZInC)AQAV#LRs6sYiMLg%k6u4QQpJFmJKG^QQ$+_`BKO;llOmg$%lbD-A&Beth
zeB2C1UWS&Qj3))I3Z4~2CH*B4p>c&$5DO(vg$*{^Z#~)HTlDljUR*x&PMyEMzF?bD
zTjakhI5#mnsv3qg8k}(|EUx#Qi(iub)%&v1@9MWc#)pUM8eba3#!bXAY#2d81WsVL
zr56MO{*lz^5p*E&!-DuPaDUrK?;{N$itw%o|4FEUco-(TKBzzH$phk%FrGc=yrRBd
zNtT#MQobb}&ttJr(`_dIW^+?LuJo#>e51#;f2jWCgs7|L@*rfj-H<d>Cff6PJ<?p7
z!*f|Tc-Jb8<BUbaBvCbU?iaPZX;l~JF2?a&oC`!3=_Ib|x6pS_YZ;Yf-P~TA+BD5H
zUTvG&ji}o))kfT3tJ2aa+!(x)*m=-YBx-$=)@GbdQ%kUQEOE{>OU<{KfVKK1WQMum
zM$1t1d3J(Rr7`JfqM9V3*i~Hog@C(KYm-p9DTgy7s&67NpKqokUikkcM+}n;DKTNj
zyPA#<_^rNSdz-kcGXxl3vaU+5f)|?z4RT>}^g@+0c6V(1XNHCN(9%DP^qas4N*JDU
z>ht+t<>I>yd3X%1Ln73k2cT^rQZR)qRp3}ORt3`$N_d57z~3#4997))(Olo*=Ax9?
zf2R?M@ZFuvr-EIoB1`vOKya4McD#e6C`ta(xyz|*qA7yyjQYhrlO5|PFlO89Ym{Ew
z4M@w>tPDPK;c{2UME*tYEiu-Q=MtC#_gWW;KQyY4mbsrwy|O<dETg|)A~U!BAqEN4
zi=Ay*$R$-4h<gxuDa{{Glhy?C&?Z{3*T7PpN&wzpWt!oS(7~AEOUK!9Kg1bxUw@ce
zP;kd()<VlkV5@A@!{P$=+repgh*f;A76GMs8Q-*3_m+afN5}VvmEG%c;x*S_=~nCS
z&Ky>vihXJicSu1Tof1Ms6yYDndhFMDW`Rh;cOY0b?LNQeXgnyz;TYe$jb=5F=+M`r
zps4Xm^{CuE8!YHPS>3Ou6R>U;Jsc?8K}6eck@|A*_(_na=fNWlEe)*TWP94~c-K#+
zVUs7d+Z8y&oI?ej(J?W?vmPZj)0K7i5Staj!+fz{&X`pN25*=alVH-y-^|Du?Oc0~
zUj_2gB!>)=A|ip~9E##)?jVYrS#pu7;oYlLkZ68~8t-x54APY8L8%Q%VgAg>J?W*C
z;oSA%Eb>QR!^1<R);6sO-+#0;w&K!@t3da{fXSofso_Pr(=HmCoY*#J^RC}wauD|R
zDBDOJk3w?=zIFi)r@rAWMV`pzXoT)pBjZIcT@cZxyLKCRSJW&o-k)_WL^8rTKT+AD
z>w!(Uy`9EY^euaXjNGJYD3w(AcIOkG#;5L2<|hPxJkf)?S-4`+Q-sdlKT%W@G@dzv
zaMMr$)^0=9I`Qd7zXz=HXnK28>baCRu4a-)hlS^f+EtRm<!3c5H8{o{H5=Y(mp1ey
z1#{P#hni8>%S77-D_|jA;YF)bQYu{`e{wN>ElFrxoapVs`Y%xp<NaiwBYS=6fopH#
z3#}$wnu+lG%X4mh>Na$IbBnab-=appVbTPwEu)RI-+a;Gwo`Y(lgNF7u*CmR(_zov
z?(kk2`pIMk{D&s62U-HmE%+Ko`jfb^X}Gs`XE`hIW|LJ?U0rs{Y&gI+e`ObXijC|D
z^;IVX5!bv>kCr2>SI<$&!Hhq2?@;LT)!p69+S5dQ)qI<~3^jReqgPgk^j$Q&<0V$w
zR$ksYJR!tN(?@)C4B;d=tke3pFRuCuOB*`2xL}A@49*+Mt0&*E5zGavDDGU}m!(Gx
z)@`R|5`C|T)4yrQQ<>7WviMT5iUZyKqeVWm{byoUgZE#Y*@M09WS%bN(tnuILT!%y
zl$qYDaM5UUar`(`iJ`r>=cK)TsEYLcW4@-Ip-5bfX6vMjeJdeTF}jT@o*MZ3l{oB_
z@8;O(?)?ZHu8E)D#Rj^Uiy;#BhmnHV<d`4|fddYEHyRkGbBS@Ld?lC>rUbS%n{PC`
z^KCl=G={`PhaLb|+-FF3X_P~joy<3Bm@OxP{;3_|?NMyoY|7puWlg(r-9>vgS!!Nk
zeP4m?2W#|ozUmU|wgL&Gkm;;kR^jLCpYRey!Ru{aPxdERuYa=pnzI5}Y4~QO5_iIN
z;&^C!dZ}`vjm#sqa>6F;Rl}k*R}93hLj98fAD_>R$JT9esTYddRdjn3h|&G&ol!B6
zDzJ*SIDGR#bGNBEjMucb4|;j~M&(L^%|rK^%P;nmY8K1^NlxFF>?bEUx7P=kqs?W>
zm7%VfekoI<7Rq4@k!R@*v~L#A(dViKkNaqy^l((sgl7lC<O$x}-JK>pLi9@i(ml{!
zIwrc*J-{kANW;rFNiQ+BW4j`~POSY@9qw7Aw^m|vuDlh*1y?`IfU7pob!%hC)+@b+
z#FG*MPMK8iEygZw6j(r0jfJ;_E9a(OCyV>#ki&u8!orfE!c(UmVQ}Y8I*ZsUlAWbC
z-mIWjI(SLiH(P?vqR)5KDO@jH8SE+e9tDv^*ZU9eF$u|Ng=AK~j-;W1y(@!_l;><b
z3NYEq8Z95HQlSYzDl6Uq)?dLF4OF0i28Tal{Cn()4d|jUklDlVfixKGYSaGi%POW-
zoz0p~O}m}M5asnYX;(8LDJk@*{d3+y-#sE8atOWSwlTe{4o!FCHRhlW%ys3I4pAJ}
zD_vSz`Yh}Q8hJ%UX)uG7F$=j8uc-K1$Y1Szx(nYsAaLDKVN5h%hvjATXk-5IHTRKV
z&C*xbY5g+$o5)dhL70eX5o|`H^X`?KbSH;eW>l_lQn!|wH-)@bmVSYGjc~zjR{R`+
ziH=i=+n*NizvHOxcRuWb&ndSf?&exWo-oKWx97}Ytou&?ny7?zF6Q=%y7}eqj^)~t
zQc`9Jc=@!Z=Ni_#prfw&7i!67fpFIl;Eg=#=#OrRLt~CiySa&y8U$Bz7d`t=R(X9o
z<mc}>_VKl)^gj#_TG6-mNGKNB!xw%1+VaxPtZwl@k&UrCSij|#|C>|GzCFVc3u#e~
z%<PPKeUuG%^tybfY(M?hl8md<v?d;0o!FD}WfzHaxO3n1B9$R)jcN64TA1J{oG3Xq
z&+J_>H1xZ&_RoTHB$yh?;BtLjvuWcd<HtoDK1?&qqXd^t_)qY-@(>J}sVfZ`_4Gv-
zCOuyN-gue+q)2<*KFIepzQLQ{pSP^m)OUj^g)U_f-=WFAZr`;Ua+lTVN%Ls1=9|>i
z)W|0I0Kaj>2yLcp$oek(U2QqRObC3NmTcikF<2tRp7o(}*yEIyY^nmbKmtJvki<ve
z)&RU8Faor~p%4EE5e8z5w_-3ff!>9tj^{Fy#d#_q@r!3!vqGk|8ZZ_cY)ft^+9XJ+
z4&s<n_|&`I5`e{-)p#=-Wsz54`7vGNWI{Zak(W1G(`8v>iN8#Es*a41H0xDE?BMjY
z)K;CDx|9^o)qdm6z%8-{DfWtG33*b14TU()6Pq$hyNiaaZ8{!@V>?2XJckn4E~iad
zs=id#U>iZt8q{k^rvRY_B0NnIhFG;b-M@AL6m)mc>vnz}%wu#jLdK!J?e{{*)s@J+
z>cAk%rMCTR{9vFaF;Nt)lHR%b5~E$;eOJPsBGb?y&WZP$F2{VM50@@Fi+DnkJS<{u
z$WmmxSeGZal`oqT?K-zcV<ET6?c3dD2xo)~a|=`IuRl%K@Q6!%<q;eq0J~T}ai0Yr
z`c-L2oG{j#Y9wJ9B#N%|)_0Ylb50s2xxUwQJ0nn)Z!pnFa@}!>aF}-PwV&J<#YPr^
z>S?P=D8DmQi)TLKPUv?<arwh*8N`*)WlU2@ypZe{GSB58Bv3_Y$wlP~&Z5lx=n$I)
zyW4zY>Z!E>Bkq58aE1Y&2J_A3;+z;JMivp~>sOqhBco5|Zr4Tmc`S%<sbYiz)lu3D
z1_5WLX67vFnxyV@bkvW!^dBNc;k4~9Ky;q&IW3{WLONXHZp|{#t<w_EG8RNs3~&ni
z<2=zEDnKPZaYnP7Ac4t(EvoS$y={X^9s5}!U0GhOXSTwhq_#xvIckw!SX_j-b%}K_
z8<$zL@gTuof@YZ3!dOd8tqXzbk|KkZG!I3X#+zD#DFhgEwpnTP-FFAXs?F|fQJ)nZ
zVNXfC>|K>=)x1cp>|S`3WV%dOY^-^_uP<#FfZa6hT&VUYs^WmLUUb=%;tFB4?5K${
zHZkQGVvnDWf;GIrw2BBGGOb~(K}gSs$^ZOPW5O;EkkjH(7+Pp%(>G+&A(hT#*0T_;
z5)zyWSWix(gEqRxkbvNYUWrilZSCOYy9J&ruB4u;=-qo-c0*)wyqayh#JiQNq+PLL
zl_Ed|^1Qf;O>jcZfie_Bqt`7t7P$3$UhHs`vTrc#5G!Y$Z2`DO@p#dvsxkHTWuI!&
zX5z_A3TrR7=J@Qi!+1RI^jWb@a#etrDw&HN^R#_$H$wJ9#f;3%L9rbVL*yOfPVE<G
z;LXZG>+2@vwZxNHRA$0e({*F>HMw0WFE%&VGo0}frO7<<-#E^9q2O~5EDSD@VMZlZ
zVOphMS+tr+X!}N<Pc3oJM^LPmEs+IvAmI`Dj)<)E5r_?5(pi#5DpkNfcTT=?(Ee5<
zQ4xP>eaYy$FBIoF-P&=S5D;&E&gt^qdxe^N93S6#F4c84OKq7qFyA%kl~T#tEn-pI
zU;!Wgg~gKzL{Av-zL#;4(SZmOhs;}KpQ1H&tQ769KX)J1<XLJcC4-RosVtz-GiykO
z%nY;)#+mEq5PMvB$Hc@`&H=M9%?b~_g2@NBpr+b|g|ZEE2CX}n-=Av(HX`CxDMB4<
z^1-lKtcjauS7%qc-d%{J(Y*hT>X{6VRV}?<HPZlG@m_B3aFoAdn3CC9ZQPPLI!mQP
zrL2T&parAgGlmby80KcLVjmaLrp9iVE!G6VHBmLm)WW5(&nYIr8^BtPpb_sF_7&%9
zUI|hs7{Ydhy!wc<Qpp;I6;8v++6J2kUrzk$maMr`T4JRcwWXSU?AMA1eB9mhrJLy3
z0cWk&CWnGv@)TU37RGEmqV2OTE^rR+;49!*F*qP5X&flSHftPAo{`2C7HX#FV>0c6
z#ID0V3_l4Pek2{>?$zUZ4R6p`SZwK%%Uq>=7>%?Ma=Q-HiLvZT_Vl9DO>5hI_N0NY
z&x_yQ4t?J-LVy%wKQrW-o`?ubguwXNoxjzIx7Ppk{+Ii=icNOSMnB$vbq8}Xorak?
zP6<vs+hs(nxdskK!Bu%@hTq{}MM<Uyi+H6yfH@)o`^#P7GmkE{or>?+i1{>q10y@t
zQAV~@yX+L~<5yq2Cu~YdCZMOBIH0J<LTpw6JpAH(Y_?qs3YE8MhYK80n^f#Va>64Q
z-^8zF@7$zJ;dQmBZC5AZGJbkC?pM}Z?Iq2(rq$uzK-q9{9d9=>g=M#!TBa#z=e3sK
zq7jHYpb<FK^g!K+OyxXb&1OHBV@{OE{QU9IK$<_s{sAg76N^W2K!$SpDM!s!A!5z_
z*47e=POq8JrFu@Km$LI@()=|~IViP_FT!O6M3oj>P>2RQ6dTtEiW)8{c{VZJJv2n6
znc##HoueOnymJ_{FkH!!DFSFQYz?<F?i!-4!pLAU&QMa<RgsRaZ#GgR^#YeMSF8SH
zjs2OtSaU6G!5cQiw=7C=B26VHWn_9&dihU7lh==X!*Y7A+w-XB0-;VYEhz&15!7gB
zju&S$qBEceXI3j#z>-Sna?wUKqp7y6sC!9VpVr-8Ev_l~ilGw}5Nv>Ko&P9jjvR&h
zB@Rpr%)HBD;jNh4kE3#7$k(J2b8DVHDhMH?&$svpak$myg^S(Y*<oL;Kzn;E2Dz^^
zVOpu;ZvJNiOn11sWkRco?%vAfgm*l$RjA9tiB=m71}{g01=YBg6(2_z9<Ato=SmRJ
z7%bnJ_OALy*4C3+Xi?L5Th(|)R;@}P#onCAdun@oE45~sr%FnP;Ou>bom$F3QiG=d
zBwb;VC~QgtIj<G@ljVlAN;$`d6i+869KrLBT*Zz>_!X~M+lqett>>dWD77OfD?<x)
z4@Mt4lPyC<W*G}VXBy9II4@SCb8bDi<4#eBiyAUHowoQT?DhdAtx2tsmDQo4gys64
zVQhH>S4X$_Zcf1G)O+hXMiqI6ACwT8uIqFvLQkuyJH%yDS`f|{#wE*Uu3woLZ!GRK
z9TV%qC|l=eA253_YJqI667IC{Q|VLpt=@LYltYD``HSNo*y|b0R!^Hml;bD0m5eZX
zd4&6#p!&M00AfGhVYGu9z_J6Bi0xY%-kdWou|3>3dinyF^UEL2zI|yKry>;vOHKny
zhr(QwQ%J^3`n6ykzllXN$U+*2qrzAB{Iww4wo;o5k7Q293^6~mD-yk^i&(fV)A&qT
zb2=VI&-H7g0bL;fMN9mlXZ+2xPmJnVGQ6hH;-*^7w&h-k`RWB(!${`E#i^hVMP1i2
z?5!Q?JjhL!=}ofy-Hg#$w-?dZ&4W7wS@C9t5=xKI(9!$LeH^kna&3k!CXBvFt@#<w
z>=_ZLDT-LuAJBI5-C!?CJu|#+Zq{jIzAHFEzfQDnR8?OEnbBsWGqg`m>?<7Rc$7>%
z7XU=oB`xYZx;|87m&W%BEtSKjzG*OHe`aDe>PKOB&i1{K^Fk^?tGV~`mY87mi<;Yl
z-tJeP3_ja&jpV$^Bqm`R;q;Ad`<pm*Q<b<0!ieK*<C_@q7M}{Oz8QV*K}N>kO+T)F
z^Xzeg%@s+|=187Rx#YZaYw6a+xAt!iTt+5?L6y8`wR-SXudo}4pY`y-vcSFNuq6?l
zp?^aSD_0Y^KY{uN{mqpAfr%$&uPFp(c{s1fSs9s7u~fcbo!9|_$OTSeSzj;Bwb9?u
z{HUrjX9Ocy^jeUA2xdhwVKLW=baBazk91)piNj```$-T<i_bl)<~J0Tv{vX}E0iDD
zfFcFE%`!`x=mVHMr9l+K_Bf=g6}BSUgEWkU>-|zJJ{u%-B)g5)KH|mwkyea3J$ch2
zbC}G^n?62XiqEjI#wP{6lQ3`M)h<X1^RD|~cTFq|(njYh1<oJZ7bc?~GG}OL6g3=2
zV?T67Og=7=u#=Y{6F}y9x+pP7d}nGSyC#*}1h_+6%?zb9!H2*hnm+7GlhOrQDCPak
zxFd)+k>#hjDE{*2+}CB&$zs`wZoxKM#hBJ#oc1H6PIJ`wE(7@8&)Rz<qLv%u%S=0z
z`WtR-ekArV5vMIUmE0-J>AnQ7*%&~KPRNmRFw=6nR%F{43y-+Sr<9&}rJKor!*lSI
zXQ`#E0D^^k<}h_dHZ+yr=<PbyPc@Jp!q^Xsgr{Z2{wi5OcRc*=z~#o{5q4&Me+{D#
z8m}79mjh)l78bEq<9lybLVZ3Ge0<+gRI@3{bJ?dWR<YQQM64$x;L3p>KV{U@(ecXZ
zNQ9Qoz7g%g`q^5ez(CckXSXNaDzArPcRZCl!uR^Yh-srXn%V(}aK{W^gp;PXR7Vn;
zvQ5%JHY?<%a_C~9wnXx1%aZ8BP_D@l=H|5>>yiFL(Y^=kl7^g5o4l^ypD!c5!KjUp
zQii<;8w>YZQAF-3CeCt<0CooLN*rWTp^cN!RXv<|2X+LmI4I+zWuX#WDhNt_Gi&DU
zHVE7EExkj|YeuqN?pDdcyq#zghtGLIGn56hUuPXCOeEU#(F*=C9reLP0RC(hEXy&W
z;7Cu&=PTC9g)^iW{9SIZF^{BZq3|92p7U<aRI1=L;p@xfmLgf%`9@+IyQ1d0Qi!Ox
z^&%mx@+_IRZtgpcpdfO0uX!umWB<;I4JWI*Ieeufc<F&v__W-Hxbs^V8i71Bw-#pM
zG}1jO@ilx(CQ)VxBO?!YLAzjNH@@sBtqtfedv^iJ)h1ic4QFd!M;$$z0h&NYGlnT9
zW0l3Dt|mIVCHTnfeCpQ4%thE09sY@0B)EZYGzXO~gDMe}2MM<e@~?JaF(_g~j;83{
zqGriq3SMBPd1-ocIJ_{oAi1iAwb^6!Ve_7smuWb8|Nc_CdsBI8{HpEbQ_LzeTO}9Q
zUGPp%S{f*m>}l^8fzFY36|gE31xEOzRG@q-lVr#D5S#1xl;Ci9G@0(g22{vNykcw&
zKVWvl$ibLfHfE6qCQeVgHj;b{i)Q~ng#C3?)M3{)49_rxG>UZEbT<+Tk^&M#4=Fix
zH-iW$DN2Ww)X?29fPm87NaxVqd_S)Hx!!-i=YHS+Sc}D44D9pV$KFSrS{+(F{@ITO
z?HJbkMPm)TkKVx?*}U)mdP{t;M%pV@(et7iFE3|+kba0I<|HLESZm;Zj1*2`<%CJr
z%=#7eubzHsk9@X$q=kaI?^(^LdV41qe-*WdDcp&iNvCEp&zhw99FxKP+;Mr=Y2O+a
zpTAFJXXQ=)=jAH=;#DrwS@MhGb8F#Lk7-ptRB4gw0;R9Z=27K=Ofr?3W3mAhwg}Qm
zl|<XK`g6O`urM)Y627u|Poq5hSzy+IblN&h-k{-e!%o6S60B?BF`hy{5-5@&6!?Q+
zzjJHh$D{aA8-RQ&9v5%f&#AeCXPxx0@{4k7ELYHzH~unODimWid`!uu7)q`#?jKCy
zKgxZKm7j1v*_wd}JKP3B(gjRRO=v%435ccCMCgkxy5Q{>=|K)V4<DVFVP*T#IT5C*
zu<Vm6XKzH2i_9Se(s5rbi`8=ngF*d8b|2CjCW&R$gnoEY4;DqX8j)e{=xVX}&-a<e
zE80VP+9BpQ5bISld8!nR*3dkL!Ix`9{*GnmVYwc`G0)hk&+CW(PEcf_gu~&OAZ33U
zZ!H}Ds{9gFONyh&i!+OaH|fQ@NSTXIxZ5SgI;I;Y`1|AYN9zNg(e)?5u|-ZutG$&3
zAY)U~=jl%Rt<94ty~bB`7{Bo*B-pBUIi^J@8%?xXVoV9tjYzv+Hw*-LT7EohTa2y(
z(@~?0LBA6MPxwDMz6Tqyv&&^z2H!lF4v=L1Fh8mY6T8HDuxyf*S2=iTuSiEQBglJB
zc>a%yS-vbLZFy!-w7-63O#J=|QBlm72U@-iD<cSPDK?H~2e#7a&G^=<Jdho2Yf(jw
z*4}U+QsO@ZoqNmk^r*T0yxK(X&HqCLcxa>vCPs-a8ey#DhEk+?#tTeM`Y@l1oz2A|
z;ViBlXaAh3=Nx+;!Rm8ywG6!<irtP%)th*43&id=-@Ji&)xK;z`bPsi_TI(XaJO)y
zGP0_bs)Be9Gd=u8w-Jr=(^;wf<mOXy$uD4NQqg+FIA$7|qO=b4sJCOFHC`k@TU{Tb
zRrr?on+P)o{<}WNvi83oaOZ>fX9Q1RYGCJ%;7~}sqx=B_3yzzbtK=TyHR02uj=Si+
z0-T%=cdV7S9%5k>162u**QY-IagSH!CmEqL<5MzyJM7)#BkIGGeSETYoC#lnOZ8Ht
z)8Rv5+9C(9!(eE;g_PnmDeKGF=L?L&&6X(x!)`~9PCz78+~&QMNgrMtB-2*UoYObd
z>)uEjo9klF@6#Kv{}>Vx)ei!P9s1uskW2$@Re}X4O@dol(Z}<53*>r9hMDXpRy0T9
z7n)dW-fRt}UR&?2vA>AUv<{y*e6M8nv+#c<L{rfDNjT8i;jR8hQ4=aUQRRq5A6?xK
zO9;<Yt6Lv_45^`<0tiy#a&Tr|kw2oU8#&~rW4u}KOi2t`$N<?&mN>pMt@`UXPfu?g
zvXkUwCJHL+qPX&l(9-1i`sV%~O_%2+OupB1B#H!Ijcd4K(<bn35iCF@3wI^E>vQP0
zc5%gB;Cw{CUj3FmT3`5B!IpJeRY7C&qm9r}<7FSVOK1euGQw}s;{nMd5-QN-;^KUM
zjs2It=eM7_`8s56F?3mbm2^3c6+j-KkRoZ9QOZ!`z6^f8E(Q#um}iaMJqv@npQK7z
zdo46MUAnmUzRqOp_?D|YE=5Xuy1pVLL>pgJ#%PC#mNs~eA41Z{T<5OSx4v+&>ZdO5
zvOUzj?}@rcPnsTLJ(UN}*E1^tU)nHGp*S8>#{?V;NaKk;O>Qnw3tY-n^ExAJ3d`kj
z29cK3Evk8KAK=8W8~i_bVEg@R_%5y2)!al3RJ?ITXWH%X@v6AR68Vo#VOoonnf?i0
zWwH2vp_A9^ITIxmhJHk1cS}F&53hEeL33U|=!-|q2!4FlvulYYmvG1}ui0z4AWQZA
z_w{)1&PT%9-_4D~_wtrFYj}Ga!Mazu*)TZx?Y65uB<{7;!0U$hn~mNhC+;J+Bjz4s
z5j`d1X+Ql=xy`01-8MaUI-=M`V~cffXz0YylG)yc72r|Nd05mi(ahe``@@T>ii*I<
zBu~aguaA#`<(??5p|jIrc)46X6Up%XUuSsaS?baK-6KZAN>H8zcJSOb4}CEp#oU|T
zAqh^>p00lje){&6q+5sQyPWUFR;R$g1EXg(a|L3u9UMOY$P(Db_*iv<4WA)!YA*}(
z#7Hk96e?}|JF<)LW&(}18sD5D-n$t_m`m!cHYRr}$2r6tzYMNrrwx<o&;D8ei@Ft2
z>>F6|BCfRNXpM(9V$sItF$jV0jQ^C{q^PiDxbCQa%NSVO!hLuDwKG%t^5D@z<Z<O?
z8hjPHJo!-TB`lR3Gv>s`pvkTl`~ZS1oCkwAwQy7V7f<guP0!%s&&>G%81Oo_oq)5*
z_=`N5LkJt|ai?br!;rE0qsixt;-DByoNuJGGEh_u{EEt|@t1G#1>|*J7fZsXZVlR7
zGVBK8wU6hi_QRA8goOL4%tM^se+jGBC=8mzFY{@NMK%87rHt$J4L3;`hJkW^m;dX}
zZt6P}1uebB{!$iv?)69r8@UxO5haD47v1J%k<(QI(VY7mxZIS5CZ3CEt`I_#)F|XW
zI;3X8a=6il<@-|-?W~v4@D>N`Vobzsd7VgQBhJ7Fil5_vJ1KbFN6ub4Ku+ym50j+C
z&;<bVC=7*z6J4-mB!Uk55LvpsD65jiaC=jP?5W&djJHIyzhXU`O7z%Jz1l*_S=^K~
z?>|&ZDUEhkKNArWlJlR>c^@D78NEI)GeZ1Yzi!~i@6C`Md5OEjAH{$2U)_ZDi!Wo`
z-_X6{2V9o`^XD=b6&9AY*Q~FUo67$~{Q4X=cUuy7*DX=&akQLOj8w(7xP}Wf0c(t`
z;nM%W;e)xTp;J+N<y6=ugY>-5DlbO*rc!04z{u!L&WHF;<8GaapA9P64R+pxbynxP
zT84_UbTtx-V@wOw&NF>sRwZJ0RxusR#{mK0B-f>k<GC}#2o~@2jILqzf!87|wzHGC
z$CH7afbVsqt~FvS&*lpT9?;aFU!KYv=L0vov9N7$ssXTZ6;um}y}H4=WTvS|u*7D6
z+4-teJxlntbs5!&4MGK+fou!qHG@i39ljAjwShQ&BXX+Et@o@apg%|`1{`e5IK=cx
zbwzdagYGm`+m?S1ANTF_)z95x?4=7=PGE}zV}OHXlEc(!FxqKj+E=q$Z}LqY6uc$U
z(>6!OQL>An`&PXI#r@g2SJ|T~ksm%nTOveJKdCc*^74#<gf&Hbxv!ow?utuOXr4L<
zHi4aW88N*0DHLAJa=kh@*E(-SqelZ(QlkxA&n8H32&Uo+MN9f1q9}xt3Q(TMRE*x_
zck<HrRU$L)BhzaMkj)+}4OEy#@KJwdsdw6%^pPoU*eFe*i0aC-sLRIXX_?0jp^>ce
zRVU8z@SFa#*eaO9y5u(JqS@T?a%PIo&E@pqEF6~uizGRkdca60Tx%MXXJZ~RVG!Kk
zYvLQo48J(XA+dc7y5Je1)Hl0n!bN-<oTHPpA)`LdAy$)lJjjAT2ShJB+i7ODPwD8%
zG|Y{2OZM6NPJiq={awyiQmo$H{d`E^9)Kt*<jVm7<bPC#AASElM!5R^^rdPj!P9r`
z3p)NiLd;r_2#^~he&hMwzO4$MD^|y6RGv$wPow%;?VHadmM+$+T1*dPB4QbzPQwnS
zN@9{sh-B>m`a&VT=cvCfX03OelY8&4NBU6QjIt5so4c&`Pw>58kTZ$jKepZqaN1ca
z|1AIdXm-|Sq-E$xrAg`k0V>?DtG4+syXLEhv#-AIuZ9j-uF*DC*S22Ko@FPujsc{r
z_Jp*xHTC_ZDejvHyBvI4e-KyT>MBY~@3|nH^x6t%J!iM7si|+V5f4W*3nf(CaH**W
zf?LoewAUReX8>E3sl*kJIkQ}`4RLHgDB^Jb)*jz0=E=C^d^qjcn<)~kMnD0l$tnHg
z>6814ej?0n;A;IjUfU2>A)_Pk!7it}Q|VD(dPnalLASyH53}t6$FmO)t8#OHsVmD=
zTS>_j*SOUkK?O&-8uMEMmhx$GHyPg=<xV|XcQC;8z$vPV?(34nW?*&0P6_CNvrfVk
zTaFncLn>GJbfHbUxJ=qu?;|e51bWac9(Br9&YBqhf*fuTH&a}<SkXdwGQvnTDm5~0
z2S!J5BTy&MPNYk4O&%l6Xv3Z!zIWAe(eb#a=Z~yHsUQt>RI?mE`L;o{^MTkt7r2vt
zgUj0p#L>AC543D;&DM2u<ucE0n{c!NV^&UCaEaI@n)5P!%b)S;rR{|*aHrp76^w4(
z>oUFA(i4v?$QzW}9ETZ<vHLT{{M&uBFTJ2a)4n8YS)>Xh7iZS~;XW>@pg*AFqz+1K
zFXxI!4~+8ZhPwB;KqeJ`7FSyq52-i7Ux*niR8hE;ktjDzkS3~I<{?c_nlHW-oQyK7
zS)rZ@gtfm9DPEoavTRzX5ouNgNOsr(IqCaAm$#3<$YHgS8^P+FvYp<(R8GlzA1{3d
zG}bMHXMdmIQ8GLHiB{i~khn>oC6u!n9-m=8!(u(iy}OmeVJM3#zxXeEwkj@4nw(5y
z)irmQQOLv0oY;IZONrq^&g0}DX4De6*@@nDGC$fnDX?!&H?>gFio+Vkt>t}WqIAJB
zeTJZml}dCRd`L8T7!b0Xk!+V((&OCDUo!$c2ArdKCIA+kAzEBMY-zcc)#?DWAVc?>
zkpF_|8vl?Tx18*-wBc;;?;uOh>0?-4xf)@HQGc5EA^VHxGhG}eyedMU{QxYTqh#RI
zI_3gwKa$oCT-J-+XC=?r>wGo1XH$GP>(1ynI`1iM2=P=Zm-qw%vQ38{&(yV?r1CEe
zBjXoPwHbUg!xV=1!WW8@w*_poj9@Ub4evOIWqps2*RqVU0r8!5$5mD>qRS@n#3q=G
zm(qkE|5-@$MxG_L7T<Vb-i$BYe|=R2-W|)B9ot-I%lMfG)U5d?nVUec?VvI(Ua~}u
zE#PNTOt*4PU3KK|KPLh&MUtMh@Zh{J5SiFVOag>LBW<qzM@b8nSNxTEFjnplybk@n
zt;5V}Htz}A3p$7rh7;G&1rKRAU4C^0+L1NJG?H)szK-MiO-+zKGQnNY?OwiY85pq4
zbV%`W{m7MF2RgcEl>m9RPaP4(No|4VHg>U<*7NXq7>S%lojDw<lGTzg*HiqFG#q>d
zoh*t+63XK@0>z7M;A}PY3HU;n#L6X(+TeETPjm$nXW}E$>l(~Ts>VbT3Z)LL+bde5
z>SO*Ctwq$<-o~!++04tTtD=e>V7s7^5dYim%c=MvB%wUoSV7=76ng<?2_j+tp4FTm
zU+;Bn&Q0m;q((rtGI<5CjM?!b^`ko(N;+<IEOMX2FyKhhDLJ{j3kmiYaT!;?9jH3J
z##DfruV6E-H53C3Wn=@7kB@8WmYD>p<>jmAvW&bKY65=U`UyFwFBmLXr7mXzqBePf
z?cXT+SqwSv7+zp6yevi9%UG$1-#mbM_F;9;h4c$0tr>b&IHje24U3<BQ#0$>RIX6a
zQ)Nm(873f*Qj6Pkc#Sjtv1i61C)M%%U!~JnNj=a12v9y&j%0JFQ@&`t-g4&KTjGro
zYqtD1#&?uJy4hD_nBkx5{+(k$-nl=s&I0xesPRSMoy=choD#BHuaoRcn{S7^G<135
zPN(egpc-5D#i_5?ZA8`!@m<ZtlsxtV1vif?ENI9ZHZL2j?yPuac0v^Q{#wu~rm^2y
zYSg<ehpP`{0f1gBd3)p(Zr>=mZs3qq90_EJMiw`^wAQ<%z=hT;!MP?v<ceP~7Bhj;
zUgS|9R&l>S_{tgkQ})##g=kq8HK?qOG1)WI5E9^kOJ2~IxQWu47ov6m%1F+ca#~yt
zqk3@EYV}aj-W1o)cA<eTUD<GJe4MIxXEE9sC$C^jO6~1;$mDO@qT+FhSu@PG{H^lu
z0z!Opu>{>1rz0|cn)D6Q*+OyBT76-uzHb;7Wb*Mqc_6DQ@R!F%MaaGW#vy`54BE=0
z*-z$B!ZDFS74()BX5Gu*FFvT+8B4$J)r1=Ml~zsP^l)gIuj_jq>GmCs3a0NGinmuW
z3$#{&V!>=QbYUGn1TVP&{yb$J33oE_$y^pvjXjX1j)aH5Awx`ckw-#zzE^T-0f3Y%
z4JEhJ3@W4_*amovTm8&Cwvf=y_?!a^%XxYM9`qnE%^~xK{QYF9Y9o~wPH)I;x4lBm
z=AhAWKp%Py-Kk);b+G)5v~IvvE|md)tL73+WJo#~psjQ#{GcAD3pr*E0{8nQgO#(&
zuvwc@z>QC^5Fxh<=k1P`7UBDKnyt1=P_n;Y3HsKi@%xa|(R`{XEi4(C@!>6&lM|YK
z7DmmlgZE?YU^3}uG!qH){RG6!Yt=3U0FXD*`6f*opvbTgx)YVv$ydsg2?oB4Qmf5I
zFM;4ow!F{+&X%u4qAQeR95ch9n_Y3&M^%;K23vzuD1I%DUsC3@tFwGQH>(qA8|hMK
z8oMn!YaM*9dpEIHvoAQbJ;=n)_nW$H6nA|;0g0kotIZDY8`pvrH_N&hKDga1z8Dy;
z{*f!B{|?%9Zs5JG=>D%>LuY*C_rHJi(-wEkqobqgtX{{_T_a``Fh%|<Xl2*v-})Q5
zT68rI?m`6}_to$AjU!G8RZaeCo7e4?Y2mu3N1+!-8~GOW&^7m$7?{{3HWt^_hZG{m
ze|+-|oq73!;yrwh#s-*Jk2rHv{0u%hPQPgo;u}2$+jTgw$B|&Qy#bnSyK&sFD8P)2
z7z<TcjLxmjkMo-R3L|TExlupCv1)H8U>}cTb)Q)@Ko)BMnEW@^ulQ3Cu68$BIgJC-
zr3~p7d#u>EZobBZc8|AQ%cDU`mN#%y?Fc#(_Py`<#da%ISg4x~Sppp?Gtt{?RCR62
z6r&s)e|uTI$<Jzb`nmT++^;ISpD0>bKv?>e@c3T-Q~lL-Mmb?T(FikI<ZPL&X97YS
zz8Z44jYoUOVgVf`W+EHRfRFM|9DNU;E0&Ku)260Z{2k)FKn-G=XTo!ugeC=S8_6ho
z<5#&=GdC=F6*KdCe6!>m$iwKLc9;~v6Jl?7)S*F?bYYQD?`&;mUXtI~V{B09yBzEx
zrC09F04se~(&2#NAS!2wfHCN3eR4@7YU}8wvoNGkil7|X#sJEwNcD0P-!Z|_fUcOm
zQnN0<TVMrL5L)0e>UWPMJ5!`vBq}j+w1rx!-|48bG_*tlp6KySqYy34O4crtp8g6m
zKV1wuqCy7~Xi!V5Ej0Q2OFWM(NtHd4F##mqFU5=5uP$fi_I&t3JitWQ#wN!g9q<Pr
z>&E}2XqCvk0H~UB`6sG~II#=HzLs5+>_@<0mr|VOpX_AFMS7N2Mg#U!?*Irm#bmqk
zI_r2_E0xzbTrdD;cVCubuDsgwRRMCs?S9>BfG^iXn^@hwys(=tuS4R{j&5s3?gp;4
z5lDT-+k={-jeN5b;R>1G=*6yWS&8fO2q!i}zeC>a>}+*CZ&uruira()E<Y(RU`-JV
zT)m9|H(hC2cB?P1B%fVlaFxO{%)8kUpO%BqDW<1$0;oA;J?l<qdoSnhB}R^=&eTK(
z(+`61cQdT6l--Zpd;2D*h5*6Pn+XHgupNoVk)`nQdv4r!yKt-i_mZpDyn>}V4QsQm
zGO)eo!IPY{D7mq`B@<M)M&6}7sJ!`RtBRrkhK-YVV$3uO_lIAhVo}d9Tp#^`HJt$^
zk@47kFmuFpB<-fdVjJMrK3(Oqybe&&6QRUIe~>a}`JyuR6HaaPd#jWB#bZ%(Nb`Zg
zW8vKb%9<&)WzZa`@d-%bEsgDDRZLB^6w@?oH@gWXZ|md6@weI2eqQyq*x>s5<fS8b
zs1zC8)F+ER-JUz@35P)ch+S=8lyhCc+$UHI&aZNHTYAxPYe;`mf~?j8jRV)L1b2=D
zQSD(HzYf_TLl?83=>v0@Qx`R<u==P?W-9_CZ=BhN$iD>5o##E2m{HsTd1xx9;EF01
zP=QpBq_nyoX_dPxQ}U-QVfyFazPtuLe?+5j#FvM-sI4JBw*#KTlg98y7Par^yf~1U
z+sLg;yDhYqf7kviOtZB{9nF}ww5rT&0T-c`Ht;wTsDvE*PY~&D16dWU+YB`%foKGI
zJ>%{L+4)D!Y@gE@w)J=UIn71<_Ke}ik`0Kf_Pd4U8cql`w=XOPGWy4koG3oJy*Klq
z=y6%Kik}yLD316_`by1wje$4~e)hMTiKO`cA5+Y`9^!|O0v>zJ?ml@NfX^u$X5h0*
zwW`h8vf?GOwXbtO18xJEzVhk<^sZSwQxt41=Y13{2NZgDbCx0SEmeZlHb-?bhoR5O
zIb)zN-jhQkc`A!ORZ}_s&uZ(I#$YHya=TyljVI+ia8+YmvHD|A7B)7`UE;3a#(*jZ
zy(9QsXvsRO@*`VQ-$EX5^^7O4wLJsj1L-5eQif*ToudOaEiI`l`qHd^`Ny{ZWe#cQ
zxSWWvYw-|c{k4Zl_zxVAEDMFe1C0!W6Z3xZ4)CBznX<E=BOBw%dq-%s3Pax`tiFZ~
z7i2+6_Pu12e7>SLPt;}SQ_sebnIaP~2XHj)Q)7JOe1iA+ej^<`Vk2+ZcYhtfPu-si
zSxo|)A~A}?K)G+(fqflYa3IeO0S<p@g~2P)ZK`)xeqYTd?RWMFNDhY=S!y3$uJb&`
z?h<zg=aKJzvAxdq`a&qEj5pPxiniV?{`X<tu)Wldv*EbFME_y?gumY_J`9ntqfigw
zLrkb+)G!NGA?*iHd9fsaBo(bFl2T9G9B(bZJ0ZJHFL-XV&}OYU{L*n2WYFPm<Bvrf
zi`Lts>lra^1~F3y1kYXHG!)nM55*F=6?I%hiU)gB)}5K?XDo5S*S1sICYTVvn}eeR
zS+=S${#LtHs^Q<|XFhL9STenFr){YI3irB8zr_|fT<}paN{2l?yl15k*Z7{wJO>rX
zj!gb$G;09MCH_d1+{{0f=*`+Oq7yxLt@x3~5_<IGVxHt`&)w+abS!oYhx2*|A>7+z
z2Ql~z9PL4I(DX(g>h<SO;tQ0hvUEJ3ZCWkbL`gIId9E?OJO<2exv;Elf;(ToeETgk
z9HX1|-~@<2-5K&C762A{SPr`jw8JuQ_4&vsYVX8k^^~h2_d>*gp{c3vP%_pS5PIeB
z4=f<g;(5u#`)@qtjcq2D26V*yG1TKKSUGf+yhXY<$xizNuWzw$cJ8V_?BZ)KX&L$}
zchO5oO<l+7z0Z6_uL?=&#-M*GATUN6msw(ezTBCJJa<-UewS>2>ORKN&R3iB(|7l4
z_f2hp`}vcuVO81Q%;E2jk15V3h|OW!<K<4PCC4|!^MjdJ_F4VPC&bDKO$NQox6-Wz
zB<L22yJU0P<{GscD|O<`AVCh@n!UV4oWYuT-zvMAi?u#2@vJhl<<w+@rl0PMo5x$|
z0d#j<Y@|iV1o2eecGRlC+2y*M2DB(d`gGEkWzM(3bwg+3+tZAyqM*~nYRDp`Di&(G
zW7{XxN9KMNxbaVvAv=NcDh{9D8oz7TRnS0rJ;gOTpVanFQUd0-TIaH6wSIKLHJ&FT
zPl5IJ-fAl4X8p^Q{@z>~@+rvD%~^0nI+z|`s(9Uja)%c|-sH%B@)2Q<c)aC^MP4+H
zKUw-czS+$+!-XCHtiQLC?bFOJ)=8WXWDBe)c|-xr1M(ATmd4PsBBVjlC?Vr>kfsGC
zyZ_G~#ev*|N5{>dqrG3cxVwgb9<j__a`qgh#O?^&!Rd(T3@=;KR#<tl={QUIE<K7S
zMbE*rL-->(u>T_>5mhs?N$C=bgf0lXJRn;ri)smk3Tm+CVmk-GOE`x*5bjOjg$Oh~
zqkRgiIrt1(TZ(+j$r`Wr!$))idSX2?+h@U;YE<R>!}jj}WBQ-OPB-04Z=yaIAkikK
z7$-cZ0iQN{FBdppjs9zXf=w~@k`83f?dFda7uogbPzGG1Uh9v|Gk$1Mafnnl7<;cY
zM!xb~)#>}4|108^grRZN!UJgeRUr$PLHLZ}5b$70Bb}G?qe=_tUUc+)Y+7y>rJttQ
zo&aBE9D@SginCurgqYtt5UM&%+5ezsVlsgnbAA5TXUf}Kx`dF`h1;-Z0!PE(;0Y0Z
zL`bkKt#3Q`S3l{S3knK~4q{4~qre2!Swru|-G}1=$ux9q0S~1k#obQ`h8P(nAX3kW
z2u)41v>PlxIafh%xXf!+vcze_gzm;g)?#Q~g}S2Zm+xpL*8WC*h)iVtx1iDln?VTt
zDIpXRG$pDEKx=8%-#!tc{ZZ^3QjR=4SKcMYG0Eco@mC+-MUFdj?`9_d-`vb?(qNSB
zk6fF~>rXhAJ2RY`SeOP!(#6@t?3sXwL|12}HcJJVAV2J>lkYP+0*jT)3C~wUC3jaP
z#`!R}>A>BFEAI9ibJ3r^w~qB|mx||MNz+9TGsmNx()0vCf=A2vQ7Y>aI|42W$WK=`
zNNKg7u>)acs`VzfuUAX;Q&plD)q?3W$^`Cp`P04=zLkIDYW&Xuv%u2iP3-zN_#EP=
z`y8Crtm(g^lh`XCd7u60E6dhCEiWjR(f&Pwd9XyX9P6hh_m~Ty05qSOJr|q3zYb^3
z-_IGMjBHbPx>FOa5@S02Gsy30%1sra2c-<NhJ9^%@e+Wj*_1+|Ry7GrU&r*Km5D7&
z+;S;>uMmRL@^drzEnH&a19B_-)yPuGSoV-MzMtc#Fx3>2g)JK_!ckH{Syk9nkzQ>l
zL<i9v52o8st5&vYpR38N{%+ry#GsBWmvgSKq~3{l@qWzZEHL(I^0aaT#%{h&gEAFT
z@uu009J6to?kim=6yp+F@Sv0&BaV?3yCtd+|IH&rlm~mtbML|CS?AxD1rY2iGiFRB
zvK&Ticcat(n}-d&<NwW;Of&<@_|gT^^Fc4Dm5n%sx4QaF9q1KpY5mEdaTe?FIW1Bu
z1S`;PUl&l9@b(epy;uC2HOqEa7cFu{vY|!mE_AB_c5u>{N6z;LL>7bn2JHvI$HI(C
z!E#yW^pq$uS{#}EUvR_4l`vBU8q+X!&+IU6^mnkFK+WmV7V&P&v&EPJxv=#XA)JJ|
z;zu;|pyxJd+K=D7QTwxkaH4cuU4=qOHGhwV>wI@8(VQ3us{92tg{o!5(XZr1XcmYh
zCH}`B)^1A3yaT%}dRwbLo_Y-ZUbbb}bNeqr_ob7kW(1Y($HQ3*v+!V*zLe0^oAN_s
zQ*)K;amCL|G*^GX!3!%*WMzuQw>Qh(NgTt=)zZuavuj6z5VRrynkEy;{}+QjE-6;C
z{sC2Aiu0H98r5xm^~b2yHI<*v<aDoZ<jf59Nx{+07pJVn^5}o_E;n<Pca>D=>KzZ>
zHo=>?*B*j%zI*J~d>IGotzW;&A7886U#+a+zM2KhezAVHtFO`;BF#1jgmzvh0b5AB
zIRzg(HaRkVrw)Cu-Jn-7MV#K}FQ&bE{-RH*0tVJootgU*eJ|^Mel~*}FK>tq(V@02
zJIcoZ>tCYizgo4vc^x*o!`8GXKW%&k8(*zL_YDq`><Id5A@lTiRAZBE8imEmk3AKX
z4q6l=Wa)nNW=dk-E5k6~XA-n#0DU&vkx@giG<g%@^;H`6-BjQlZ5|~d8y-?w2>M`7
z0woAcb=a&BU2vG59JZ`|URfa~<k>bfG6N!*`oodx@bH-5A&?Ga_EJi(xVWf!oJL_a
zB3<M7;Q~L%#^RWFGI;fGRdmckat{~6JT{COWlS5UyaSFd&S#zw*qiL6HM_tqL~n2Y
z!WMTEi;%2?dQF$e_0Eruzu$pvg*>PvapCHU@_)6z7sRr#p|=G|m}=W?a9Du8d+)+0
zm1Y))z^zRy2Bu<Uu>IDRTQMsu^tqdh`@U<Vd|AjOSRm-I{4nO~IrsJbVYy!CdMXQa
zj8!Xs=d^Isu9o4p$33o|$qyN4tle%kuuxD?;q90INJ^kmmYQ>%O`BT2yqq)xgPAO#
z=2-IVa13JT#dYj>kMcMEldZjv4!&%xp}q4xTD&OhmDkCs(F-8qo9sHylQv&h*I4>y
z*Py$7;fLwf(IW*qS0GFLqwgM7501t_y<3C35a}<?E@k*^ATL9R-QPN$uS93s_Gq4Z
zqMY1LRpm9qL4nIzfUk}9i!wzBO=B^-of4v4Ocm2iulxDz4Y@fT;HTz(;ho{lk5|fP
z%CVdIA-7_iE##3M{FD<W(8-(qPec3+El(m=(Z$xy8aJVz`2atXXc%zkYua0}*WM2e
z`ZrQYR{$|si~Qm>&IF-)lkJ;cKKHu%0~r`vkr%Dq>7iGDrLI(Ti~St0`DDxDv)Rnf
zm+5J1FZA5RWR)`&n9Y?!aNa?1=S*d9QO76xb|I@~v-xT-{hm#2SR*)tycWL-_jH-%
zes%brIxFoFAKT*`Q6eD^_xphr?G=^WIq!2Y!*n)CEa4TREPNycGXOPDz<dih<`mlC
z_RVsDZVMVuw$rlTD_S`O7&K?xFQDr~BLnPuH9J0moFV@io^vkOL*!`HbAJktOr^|B
z0Qd`c-(EB4%ud6OCYm4<<y8n2Ir?Blc5)EQC?Xse2JKKRtxz{DefESSAoM77)-CHt
ze4-tfwz){qV!BWA0;3NHPAQh$BT44!J`9i+t|-Zpb7~EET^#kT8KZCztQ_cIAHHH~
z4L1S8bh93rb~>#UEA~Q&f}KkQd;)$h=HTIIkCjCyCrVlU_4ln7479zsu?V;ND>`A!
zVxi#t3v&1lYEQZFMi0K9&0!CU7|BXTWsuZzj5!-Z1LkQJ4nv_0vpL}1V9~Oz*Kdu5
z<Z_?uP8ccK)(!uqX55}^E3>;=h6iK&J;?Z>C9D>7TA$wi%xdx8hO#K?{&3D2tj(^%
zIZF&y&&Sve2DM+)6>Xy?G94DA8W4FP^^0eqTQEo?XuL@+wkw$r1-G2oVAU)&miOTZ
zpvhOg>#U&3M<34rvm^;Mqt^49!qp%o%W7ds=X~5bG}5(i7)XDssPM%Rk=wpauG@YE
zj_{&E{NcWp#(w8ZXh~4CLv&3J{>J;_@8rQ~p;GMv#``fD@rJyd(jMlvAI-0vB|xok
z$dPIvqPCk`D|uo|z%Tg1bld-U#9FxG0OhKUzJ+7@>)H+^mVAqPQM)bz(M7$}CVPR!
z>=QLX?@=GM=wn$D+Uw$$vf6UO3@DAaZGcpi|7%#q=dTzReW_CRyuYZn5u$xsX*UY;
z@@tCi_f&ce>@H{9?)`g$Ij<3u9z~f2*)MOJ6LDVU2Ke1Ze?i+>TRWi2ByO(lt*ul=
zE%K-(PB(;I{$d^7|6>S``UZfpqjmAH-f8S^cCF^S@t#=jP?gqvTaUQ(8foibdQDBp
z%bikg397=o1LNfgfvotSzV<O1v9WN=y_;ji@&C*!o}L;8tTYe^q;fAn^pT{6Ev?%h
zZkLl)!3c$)^>>e1N(SeJa2yEtr_&s-<wHgeImO*(q~G{G5xd>*(fF`H&*-R^2#5ov
z!P&sD%VHM&o9lk71=wnp;`?Ub^XuF+Te*5#2+g!EDwBblzLWN~DAvZcN64=;F#cPN
ze%R%N9>nsOk&K1Yc|_sFgXT><E$uUFS_Z(yr>AIpa!+-J%YfDSrkyB3TkNd&P$~Ws
z;*IzzDZ@^RsF5N`FpdVwX*xlhr<HY|k}C~QAb2+$i-7mYzaLRy7Xls?D7Gv#G+q`T
z&r7N*f8<aU<Xt4a@R&<9GR!IL{N;tAoooO)wmG}H-_6?2etd7?F=`3X*@XN08v=(^
z;~_(jkxjFOk&TimI~7dvRZRF<LxE7b+x1lj-s=?-2AbUI7gi7NRgn+5zD5gS0wq7d
zlFp9OLxLLdzKo>>?9ss~4R|o*!RFbA!~JeJl020Kcv@!)V}6FirQ05`AM`@fspptt
zk@3AUSFPd5db``=jJsWgINACuQd-Vu>>v-#{oy4UupAew*l~(>gg!TT1>9I@wXuei
z;^S{g(T{qu-AO=UV4sz0eDM;Z{clDD)?*wQdej7=j{unq5t;Vdrb0$%k=Qq|s|6oJ
zwQs!(s~bm{L@i@Jb{80=qUed{rBFbUTnCCT3LZ)T7h@QWbyB<ir8lp!F*I#lqOK{&
z7;L;X#?V4cPPnnc8y*x_OruWR*amndcmBUizhS3>aBOT0v#I9Z-vy{xqG$Ykj{kbQ
z9By{i_EG#H=o$dL`+ZHb1urLJN-~9WX{|Px(9mpuau#+f#Txd;G=Z6wJD>cQAA9_6
z0GQfa7#MRS`ms~hr7sp=b_cRizq)cjz#et`hKHSfZV@5EQV|r<p}3n4_;d{7d4+|8
z0!CM}Xy5;rr|k*DtUYaOnn)|#{+i8qcd7V3`48ZY5h{tK5pCs5+kOnx@%;U+M)2mB
z%f>xI+2{?b5j$}6bhMx0WyM(-#`D?APyVHo?6w`)!;E6LH&T_Xa8)`9E{)~9p{Z!4
z{4~QbtNo1I!4xMFiKKZgQ;g(~;4iGY4W@|`4+$)OWsDtUJ!hzD{|<&V|BGgrKVTUL
zR3HJNZe3Kv+N-aoQRo?KIAtB4kDrLExcWvN$+T=bk_-=%;DcMk&AXP}%*JZnmZ^8G
zP*ju?E?KBRu*3T4^WKz1MJmRKqi2$#a1s4JC|I@-w_~~K(<<~tUU%bu0lv}q_4v!Z
z6a3KlL+giubd0SxSlI-Ho)vsmtDVAGi4eA}gZO0&K~6oGMX62INYn5SN9{hn`B8YS
zORdCA)wIM4Z(x$t*w@h?2UM$A+fy^Sw>DdB5GHOx*4DlCpb9bf5(mQ|`~rb;o~8WM
z3`KTIA~|A?>@sfE$kkz4O1W(YO2_Lu2&*GI;@L|{RTYS@l@kQ9#B2KY^;sCW8(>Ex
zZ(GYK2cI*}wq{f*fQG6#ne@~W3Z02v`?9=BKG9^5#gz)`Eg3*5Xr(fK2!M(qMp{_U
zl~zNrKq02v=gUDFw8}+N?ayBCRz>0vYP5ib(2$S%nlVd*eTn9$NNV200{s$4TIlFj
zfd9_HstxgUek5rx@hxm9Sk-XbNoHp$gl~(Cs9__dh5q|sB==}FFqLkH0}$o^ey;~$
zn16t!H%Q!|+BYvRYU*rHi{A;3z`|q#zuMtnFiY9ku=R;uJ-Sb9FsLfEKC$O>?tk*x
zlM7F1c(;6n{yxD)Ro;<#b!A0WMMbbk|Ah7KCJN-}cXF~W(?QoWEYY;>+E%_FO-?NC
z#K2yAp|Dz7{C}(nu2=UGNGZ{s$W?}$5Rii|Vegdqc3x=RVCRK1XBHr)6=1oDs4>WK
z?w9b?NOE4z^wb*ZHC1-8o4)-|T+9k@WcHH|CFhCGxY;Yro!a)|V)_5rhyMR0-g-3r
z&b(DsPw-<SSU*xI7%WY(^`^h8aJrqwdDY|-Tn&2fMXf#D43JEqx71j)uSu7dr`|lD
z0&B~>dndf`s`iR-A!?B`E4wSzRTnET^`d>1%(R3LG_OXP)81&={=nu)CJX81=1(^|
z08@MWlx*#Bq_x-QR9~%$LaNxcSvdu{rE9Eyr5QuV{!xLkx}aaaIvD>>l}jwh?g2Mu
z*%K*7TB)LLSXX4b%tSKa@9OUVQ>{Bz@8f_iP>=ocs7`gEqYfNmcRiC6+F1DdlX^`{
zrahp9jvONnS)RuiDpim!2KtuF?riYMAAnKh^F_3m>Nm2`5;Jl&W`FvoanU3nNJCGH
zJHe82_8|@L*I^DFG;vM905{WAvMOx*Q%+^9X+lAP2<7_`QNpM8;&GB^fis2G47=4}
zY78NbcZ~X;&>ifjgx@}z!QzQ7HL4<BEb)#k1rn7nd8obl40;NS;z=1m=#HG9^Ef48
z>Q4<0!##Z7hNSdjDyW?FLg!PxnQ6I3)R&kd&=F3{pKvV}#!ta7D$yygdX?TNe|H|)
zDOj!{7eZJ&z2teH)U*D4L19N2AN6?Mnl=#CSepYW#*!ldiKNY7Ki{TqYV`4qXgxdu
zO*m7A%A}fuztv<H%@1<Zm<@4EyHm)R$_UfG5~`lVDxM#dAq%S8#!eQ}g+RqEs29{E
zbEXktT>9F+xZzbPbFon6--vRkWD)01kfP2#tXKbEVSPF(grP|)H^oz5?)W%V(LVhd
zaq?z0=c`mVKHuxjE4!l$QAk{Bntw+h=DM~$#y<1HSRDCD9~r8wB2qL+InkN?#mglB
zMX#H__zfTwgK8YhgNy`jZJi_tBb?&-udl-F?x+7HUG~woj`RB9%wBU2>(QhX=dggD
zZGoboLhW|<(MIBW{H9y`$!QgZL{37&kfE}D?Ixbr#!yH7wVcONbUbd?4~Zq<M>CgI
z#8WQG?9``EiGKP$hk1{&Pk)@cPjgDXzeCO6WY?$P->QSZYKn|O2oM+;K6$$+BAjOk
zL4hEgKspCOfGkZ9A0;TM$MC2MUL5ly^&pE3p4!y0Th#6~gm9|Z^F`IlYo%z>I`(KL
zzp)l37;aV4paH~Km|vhYI#!9V(-NmYw(oEl>^A<47n{IFEDwKrlnRL84Wl4W$JV;s
z$OjyA;;A*GH~yOi&=rjow@spQ*+`=3!kraw3Mhl2qtAXaBjDha&rt5*J&g7;UX9F9
zWA!Y!rhz#JC%n+mWTbEpVeIIG#OQjK5^dV#Aq3*+anRGmDxRt>zGR&inaQtf($VqN
zbxLX{)2mZ|^z7}uMAwA+nLP=hgGm|@4@M#h(^-T7cO^g}7!@LQ4gRGVMzp07l_LIv
zV)HWx+X26*Yu<40ai;~SwvW0s2zhxOYhKAFHeG>Nb5US_TTJ1M`AQR#qdVba@|Mqx
zYa3^hdl1ZMuT=GqOnrtJ5$(`lwUk2;KjP(v2W78{^irLeG(o5N4s{(SDNBig^C2I8
zAMDAyoRnt0Y@jN@kYtO?uc1bm6j1(}z?Ov35*O<(Tx0%Dwgx3-71vH$(w!66Sk#Kc
zA&~{|Jpa~TPx}<lnA>Ik!J*I;+D-}@N>IhVX?5J;5UIxo-oCJahA+dZW;Kgs;Ib`{
z{;{<h2$$`0eKOTG^qs1B6#s+uVkBpPGAXdc3H@JZfB+2lf6k<Hz9rP!q5u!Z=e@=Z
zrg^9A#?jH$U`TIwl`5E9eL9Xf>8Z-F*<A)S<AcW#qAVa}V$?NWcCUw3b7Y8@_!khe
z+!vAA_DI)ffF}uHXnRiF+}sAOEc#r8%8_`jFHYNzO4N4nW-5WK20AEIYvYoEf<kuQ
zuk3rKhrF`wtlK)F%ic{5{Kuwsa5S;#xh1TgWij5+Ka(nCuTLd)%U{3oC=SOGQ10fl
zx~(|k47$(zXDiAwv|KC+enLmj9n2fvO7TWXB&5x{+&v?j?o=AKNb^y|y`7#D%vX7=
zod%o@KmdC4hZ?X@FN&oR)!+ucnB?X`+5G$`d7$~QGBA5|F6bd*qc{b2MS9VoV6Dc|
zVEOzZqozGZy%w*&8Rn-qVLooSn5ZrJ1opj%7ZqhLZqKpO=ad5nYC&$KkJE~Pm>4RX
zg0a8f+9JaTXBC7}6s=h)c?Rb<R8-`%Qo?Cr{OmjIqtjD4in4E2?VilD9rh``)8T$4
z!1ZzFZ)wq(+}d(I<BY#uspeIg_-bIX(>qwU)1NZ#vPg8PlLdlw;<h<XQ>%pAC6pcf
zyhLa{y#DLagJpW^@p+UCRhIMLJn;#alw`PdH|)oF(^<{3qZp(PMz98O17S}LZ_lKj
zI^FMhoYn;jWnY2{vNr=E%qenEum^s6oJ1Sl^ALeWg$Lh84Z-U=MFp7^>?nK0!Zs1F
zg}P`8_Rdzxl+zxSkN(H2&Dzp}yXJ9-P<a5|lcKkUmc;2W8C_cc_=uASGRN5^4(~h4
zkIf&F@^+S`G>KZMPlyCliWG4LD2q8xe2z@TvrwwU$sN7keqM6IBbo-9s(0pdjhx!>
zkoB}&3<o^NI1jdQ6TX($_M@1!Twg~l`^hvo8n{;PU0UbBHAO`84%2ifBdE+?mL64;
zeWSmZ;MhtsfC_&~6Sp^25nNb9ZY2F132R9q>6$R~B1xF3r!V1s2RQnF=>WiMChyXG
zP6Ntw-Dk@`pZ;@Bx;K3mz*(#Ye2W@BUQVlk3TTvOKO2uJSzZC^M!MYXZbgp-i8_ny
zKHl}8l0fEFJr65tGW$$S-g0InFTW`B#$sEhsp*naB%e9|_`rK!@6%^7TS3YTFgL_p
zvx6LnLi`CB<Hk6=F2>d^|8-bwoc4+Deym?;WOdy{e%5g&%I4JcLC)}d4ig;%>!!`&
zkc-aQ@fmwL2*fL-LP_9Xih<7>3`S*0s#$a!5t-=vt*f+Vh|*^#Dux0}I-muZ6HYkU
zS70810SoRikd~Ni#T1}k%;Jr=QWtk}EGDT|d)L8pjSG6*GprY2GgoDby|`qY`P9Jg
zA1O)i6g`4V=sC4;nHOGyFq&{|LLqn_oAOq@<M(%5h4X0u8DZ|*?pS7%-;Q86KLZkV
zSXx-y2p<)HLn7K=uFdTtM%W_xRkDO?zC2=kt+8d*^xd!s6lqM`g9LFI{yut$2WBF5
z$Wit1qOIW`oa;5JVQ~--XJ=FYsffHr^3_fw=>>w?xwcNVVt8lmFjto{NUmpC9@gFO
z<m#Mh#-EWQ#)gl<eh|!DyxON2$Vy(2LzV04(W8YMg@m4|amrh9HMIv6Z>}U*Ga~?J
zJNEG?v8d-3*XDLbtQK3%&eqz7ZYL?zU{#95zhvRkOH!NDF73vm3V)-|3rSXMB!x(t
zeR@6x#jjPEVB}V5681SQNxdrQmX&#b_cc$T)QH*=Q+#}*I|XPA+=j&H&+6Fr+f+=b
z`?9wF{NMzB%n~4D+xnMmuv{m-MM$;?kvi?=(7!x8fvvB$7`LUgAoz_Rn#$MaP$&SJ
zHu=}rX4zZ27DuKNs1i|Z;V>4oT=I(hcNd<dIuw;C(hU*Rnh>GZyQC~1OMB+=I%D*c
zdJ!BJeQE$`9{TeDdU#Av7ylk7Vr$)fvxb4jza<fEzNcg=o$F6l^=_CZT>GCGl(uiw
z9W?e$@7GiO%ga@?>u>h_XB6rN*d7XQd{<Xv3W{%3R91FtBqx77B12=VK((1@{;p~I
zY^K|A0}<#BPzxX)-`h?1yxP3cf_l|^Ay_u++JJi8*>5uqoi`6&U^HSQib74JeoDpb
za~W2J-5!k)y8vos*DJRvE8_aS-7c5S>CZq$XjrP9h1Cx_!JmL2*ml~5R7~S)#NYo{
zVAQ0n7B;SfZ%5-K6{u-(e`e6q=LffdKpZyCn1sTtCt7V99_72U{eAQWkax!c6vNij
z;6_3?AV48RZ#tuFk*lNJENoa2FEXUq7bbDK-a=7gP7q?4>Or8G5p!+6h{1)Jq_m_A
zH#c`9V`EdKl=*HdCFv|DH<3MrOCRbRd*~hfiX-b^HA9}0L!dsiN_R@1c7QI9UJx%v
z%5wsBt-?gLm-Ner7*q{pGHB5!I`foI@$<lRI0m^=6PH;<9thENWdaHxPw484K3+g5
zC}Zi`M{SmIKIy^oms4{W-^B#xOviba?=MGwvtOA;>Ffy$dc^h47r<UX?q@)a0Zwt?
zP2gp6W!~TehqL-J3H->y)w+-Iy3mDr3d!b2(M7;MCt9q<SX2bq=P1F1IVE<txHfbx
z*`(e(*jGL)4fmiB-F7Y4V^~miUnKSzuTrXbQM-tzgW6A)FyU`#Mk07CSBprqBrdI1
z3cpnIj4Uy;w$IKDG5F%iq&nDRu0)uvh!G+pwaw`xtNsbu=vtN3H_uesH%ktg_s43+
zy9$1K&Mg3n1F`$!`jqJDWcWD%L-r8(p<X`2!gG*97RXXpEupt1)#HrjYji{2tI|BA
zy#w33xoO1Au7_Z8wv1`@7AE12R@o`ie!NzEL1fXYu+UOVd=fNB1uDx8@Q1TpyupGp
zOi+-_zvsOV$Sw0v145bMEd0UuMIO96i`i%a6uZ8Y6<0VJmosnB)jAM>LgJLASGv#Q
zwZG^cdn2-!qG;8>JraBMmf3N)QGMe?&`{0oFNcEzVCT5#;<_2}65Xp6WpB1fEZ=cZ
zY+P^F+l*|m*KoT6bn%&xQ&H`@lHA;x#bD%|j+(yAUgK?$faj<{ipE)TGi$8YhJ6A9
z&oWc}T6a*^p{O9e|JIZG%jvL`<Sc`o;82?6Eh+=CFGwV-Ox1Ed_>bG}R6HdHDm#05
zql!Y@2|-i5y3zy$Z%*DzI8Ha1s{R}M)qITV?c)>V4H^F4WSH3-??)9IluR!v3Dw3T
zfto=Q$ANg@h$5x#mtYBuPsjY$$y<53D#S@(UCdfC+#$h1*)c-??u^>N5>_f3^}10Y
zdK5iwT$7O<E#iGVUj}*|PaeY*U{Ud6=>|-eEUYJj)icna6}hY2JXGKogw;qy_u{$)
zwdcd?Xtv5?CUxtE4;4VlVeS)hjXdz`|Bt+~f;yroB64|vN#b^=^`tu<#XtB5w~DXj
z_absf@djDmbkn3UqFpe(>cAh|P$vEHzW00_u%C=n25Hu)<46+r=oVny(YCe@ZnY?Y
zKJSN<-1hxO|M{cqR(zcbDn2D9I;zHdqE_{u=&YMof>YIgjUy4@jI{9#=0x|@Gw?y|
zSqa*4{b`W!Q*42z>VVc-aWTpegLB0+RODdAxJUy|eh@6s@wGQ~!ti5k9q{oK)@RYH
z($E0QvEhwL`>w+cbI{gro}+;xp>;S-1Kk8zpV;AAv^}ypgCm@dIuC<H#K^_nSQDpv
zslrqK4Ud2DDSdTE-DhV7GSje&HvyJ=^p7pk8@X%Me$c9q0utt?omCVLxeZ*-E$k)>
zd_(vPqko3RNGYeP=4B9^3r-tEgYLdW_vqv5e?uQnib0GDs2Jp=ZG4l}P%3eO8y5f0
z<kZM!f&J*W#dgJ?*|x7#aINoV`J27^6tEfHRqG?Jm-qBW)T5fVit!Y$B3$m__PrpI
zeeB^@qOzFtOW*yWnQpu0i*5_P>fXu4kMUwPqjf*p$X2h&;2w$E%Vrt$I&KoMngu6V
zvb_A?WAYl@eLXS?122K5^TQD&?0AWHZ}=sReevwNl?fobG~U%JzDzS7IzA@w+WlLT
zmsk3Garm;&oi)ajQ|JsYNle|>_XGJi>H9pcLZGPQvcHEvxpzK45r1P>Z?R^+#fj=t
zihu78sV-Q{o`gn|#7lN~W)R{m%D7=Q5D^igQ{kY6NcKb9zc#rX+W+W#W(!PwhJ*~<
z`md6eks^W7<Ktufg850YO6xp6iRKuF<28Ky!(T45@xz?(FR;}!%axyFcwt>5L)%g?
z6cj#)YJfek&XIV$6Pi#zcPn#5WrdB5HDHf6SLaMq;m2NAchTUBC5sbD`I@@AGUks*
zDSR9p3b)X*rx+6yq{IWoYuA?Q;?_!QmH%+#dM3dd6|cr`s63i{yI3EFE@4?<!ne@*
z`Ui+I9RKrkzLYK%h&RjaCqO#sO{!4w3@_0lex)G|wQQj<3gfRHP!IHJF0zN8aDSQF
ztr7Z8<FV+=xX=AkF*1x)myy}aWuLDv$w6FYk3IF)5n7C_$Df|THN6_yBMTkk3ys|6
zp`gzktjBY2s0Qs=@A5HvdfVTO0`nr~s7NpII>u!9sgu0N#Az>IDW2--DWSTOR1Lf;
z>z@VhAT9;Wu&po+WD5S{bwo15*wEP)KqmRpsF&M^&Jl<z<YgMS>D^HDN%5{3aT6!r
zXGE~PEWKjAT(P1AkNmrC08M-pdR)*JDGVK>v9kgy*sT+2wg1;>|F`;JUcr(76Pcnc
z7XeZ%x2?F58J(CYKvUT57M>qdC@5Fo$$T#6W_Scd#)^yW4~lhD|BrM<>xAd18{_5I
zqmqUMKx3TFA?xFVA(dpk&H`H_QAsGDna|IDw`UZa^j*R5u*~Q*$o=$d$k4i>Unb2W
z5H2VOtnUjIWie=N&wf_ZRn^pNo(_nipNd%Z>(skgv`G-peg$y?jM@Q^acTMubwgod
ztFz<g?oI)y7arUk&ofjtjN8h}b`5^_X2{)nxwj#AwNgP$0MpJ`)+_N<rrI2za~bD<
zZV%+OqBMXFgVJhrs`0)3$e2$jsW_=Faf$bFoQS{`TXsGNW3qYwcV#9{M!JLYX!=_s
z^_gF8>lHn|WH9vZPEP%rml>zxq$ij7cnyt8cPJ!9dte#8<cMse^RdNDT>ZH6!7KED
z&>8g;AzlUEAlolcMLAL!<+CUpQeKBuVBh9<H{^i3u~OjV)6JS=S`{=2m*zGvA?`XD
zvx$GLW|~8%@u*i~#Wfa7R(GMcRM}%?1<o~XV^kMeSy@*4i`rS4^)5m&ZTWl&izTKr
ze{QHv+5ZzUzG6hAH%)}N2a%E=t=gOcNab3PNR_fyUD`(lnr)pL2|Y?HQG!V8L-P%g
z)UMw6hIQ!pMAIj6YF*#AG9DF7jX8Y|kb<6<vo#@`9TeLSM#gyMZ0R7FTtg!$d&0y`
zM+5e<-Rb`yU+)>z^dEH(f?z>JRDQP5RYXBRgwTtMic(b|AfZZ6Na!Gt5D*0w0ULyl
zsDKbcXi0$31f}<o0HI4yXwrN3%QOFHXJ=<;U*%n9lFu#Y+<Wf5=dA1nlW6HOoENwh
z*TJofnt$)cl@jdf)kWX_JK{dHL5Q<9fS#~2;Ea!T$TqUYh}Lpd;-u7tPtv3+zdG3X
zf6Ls@Z4ORyR&*B278q1vsSVtEX~+rYLatwZzdaf4Ksf!1zu^2{U9~DJ_&~pM8Sv2m
z&$A6zf1kbSJ$sLg{XZpUaq!C#$o}1(jy}WwY)`LqntOBotHVb<nDrb-JI<!>yYn`_
zX~t@myg^n>!mQOFZvGu-pRrP@Q)M#YZU@VrPTKDv0=^wxG^eDh@m}Dpa&D+RjXEJo
z?X}&0_4jYjO^%vgM8M#^tw~gi%+)S|*owKi_+G*uN@4HS=UB1J%4VkTMK2=D_hlK2
z=?V{sKAZA8UHsZ13Q}!lUOi*QGt2t<0mx?D0d6=jJtdy&H130~?crL7Z2|z?@ZW9W
zn)1iIw-ZAZ%ub*5e5_81P`X$e5%kyYC#V{3sjdDRa#7`VM7UADgM5&!4X-3rb1AZe
zBA|DnO6l1Q?bs67=b>VFY|C-It*goZj-T{Iybi`G389HR|1B=e+q;$-4gCH&uW|%C
z_VfhV)+IqEFlIkm=9&-3yY}5>rs(1Kqpl?pPSXOw5VhT(uXXaocQ3>poz9O+z4K|%
zTfNE6+o;gTNp>u~Iv|XL(+j@GgGM<fc>ByR6&(~Mil&v_btO4)133!NtHTI;L4}%m
zIXQK4yQKrIAt&<b;ZSAZ)W930zg`~PRPJ(G$_1UnWlS@^-LCV+YMie5d9KQ>e_K9H
zN5n<U#@N_^M1bH~va0y$%=2s7l3mi-dL^{J?rG0gW<;oE!e8pAjdry*s~b_vFA_Ij
zjfT|2-DjQnj-(D*Z#3IZU$|#X=DrS+QHX7x^JOYBS>;A6f-0-dMLLAUU|?e3V?;3e
zBC<fmKkr_kp(I}+SDw<%BQ>SN+=Gr?%7_=o|M<%fT6=H=jH^Yl@Z2K`(SI>MOOmHg
z9q^Plt=$jb9JKD<7~H$&tHVKmoN#znN9CH`l=HiN%>OKwiWhmR6A0*>W<E(zN$vP{
z?nid>^$uqYp4WTJ;mP?I=73FI|GKjfVvszyw!X`f%WyKjVHVGxS{XT3<F3-6zF1}C
z(yn<&m0KmF_B8FrS3bq=`u{Uflxdg+s8f=HYW@QW^{_8^9?Zfshj&=bDgyDC{nNr7
zo;gy^B0iU_6^;2oxMf^-L`1|)k3#HsV155jMy2fh%a!~e{SB!V2U6asv+3P=s*!5S
zx|OvT*E3y49LyQf4>DUK4wlMi0XAASE19WtFk!3XBC9d~HZl3S)wQt)7h#22St${^
zJ<5OT&&B`ai|O3wtjfW^Wl&a)QvBrvkle1%wc6s#`H5RfO#Z5dgWZjTh{IJ!KA2}%
z)C%dpb8z!A6Vq;XyDXy`?X3{qaW=BWfCiJ;J^J-OWMS12G1J>&t}WL*ksNxl@46|A
zrpi5!M?#06o%74QQgpQ+X84}*$+rXW{=*Lpo$ZLzGJ!VVl2Rl8)r3oNsK!czTJ(LH
zvC@bTq4c;lmDttMG9^Ma*-LA5<b=Azix&y>o_J~8??7c>D~osfl?VUN;dnpwIA_^p
zB=1fFXM02ruo0)WK;Uc6?IZDFM|ZQ2+m1?`q4V9G=d+3(oMZT667%N+cdD@1;e2_E
zAi?yot3^8Bf4d&$xbN`DPo+2s1-@wghRk7beo7+n@C^vf?+H6}pYxKj*gfk=MIMW9
zRWI+{H{-5*dp;f4CHbC0#=Hp%ii{gMtl4E}XeP;~e>*DQ@V-B^9=o|v#q2qWtmK%+
z3yC&8lHawyHtcbd{J_CT|E<%s&BoHKrN4{KAKA9t#-`QbM}oI+)L0-m9;R71&xdHn
zd|XbF1&Po*-0q?j&rU~fRNCW}ssKF+Gb$(zdp4Bj)Ar-uCLl6~Z?>n-YXVyb{U2r4
z9y0?1Qpx{JI_O76T3X3tL^Ri0zc(YT{kw?1z|fiW#%sMxRVwbPff|^yxn957JnD3p
zn`HX;gTc#JCNW<-;xRv@W0K2(8gJDYu0^Pphu4D=zhE1LEs6vt*}kkZ9BdEPr2vAD
ztZ`$t!LqW2wN`3-Hr2RGr+Y<KE8Hezt;}yL#e+2LeM<(A3r=S(`*r;tm|3TsyS6ce
zsvA<%HFbIres8db4XAQYhuRb;DD3zi@J7Dk+q|yd-lb;EJ=l;7vLfntALM;~z<Jl6
zs$4(keNcn)HhEsA<BZG--Q-w#{glJ%a82&<8k6xT9nq7wEY;LM4xNqabLz@>op=8p
zzkbfi&tI)lO7Ph2Z;5c%AU(CZ-u|r0nt-A>Gn{YWs5cK;AK~jC@Kgu>T`AG}Wxa}+
zioy#*Z1o19`DQg=5|>ep8|$^2)WW^}DGJmpK0mp)!sX^^13pyIw*5wpv+A$<k5}yf
zY8JW7jx;<HqU^*MwGiaOSduYZ#&stmbggqxC#IiiM6?P097~wv4|w{1U}o?@lTvv1
zZFbUyNoA_kb@7j)BG(k9q-IYa<d)Nli60gJ18|Ou&zrHdWtiqQN6W^@R1OGd9A{rR
z{PLh=_*n~oVf|R#p_Y7yEk6u5M?)3_tdjgEKg!eQ#Os?r?^d}_oOoTxUCz%TKA?Uy
zCww{x-?Z^xZ^#|$r<abgTIm@~v$%P^3*GGweXaP?gq@U{g{CTQF&$SWjb(Mp7Tbv9
zaz^s_*+uqXz1Bn>F0SDCx9>(ZDY*rfk-2$KK>6yW`xbm0*x4K}l3GMk^u_j^3uH>@
zxTj%w(Ce?CUjCO}11;6Y842UsI}pNqJ%d@*N2BGp7-Y7~q85jcDvJ`!CRUQ+!4z^Y
zO8k|=FI`m!t|O8DzcPNG63a+DCl-2LeD##rtEo<dx3dx%+y!n&VjjQe>Fayd7i##z
z9*qcCTt_aFHnz1e{c7+`mj{>K6q7EZ)0Kk)z)68qfm*Rwkoffd&n*(LSOGge|3AkH
zj<DMLo274u5-avI)YLiYk7bUA^Av_c!BqW|8h3_Q7BIX+GjizW?-OM9h9Il7YWMYG
zV|p5;W81<)DGhWnK1u{BIu0H2eXX(e$an+slV7{QHX?@KaV;B5VUPVvE+*+B!XYPU
z%^4*BJ$~dznPdurKXph6wfstB?&F4Lu=ZM1epvqfAZo$Jc>1d6iYPA~<M5;!u@@(Y
zGH)LWPG21=4#8yP#B7hVs?&+q%BV#~dQ;3i1s^-f_$gXnxezV)nSfzQ=To#M32EXU
zTMYq}g%wOS#X4=XN7t!M-mkMkYdNrN<`*Wuyv3ON)U~If9Pp2!LLwl}LwOm`-c=m^
z3u#mAmFQa0O5{IUY8|8|H71tbGQ49wxjd0*a!b{L%^`IXTj-C2%z{w}Xq1{soR@A#
zj9&+2Z-cY|$L&(OxSiAu?dbSu!<d%Ye^k1)Vnwbv{q8{R-<Pg_t*zBhx_79a_y}{B
z!Le?9stWpUmP@gm$<KxtIWQJoIW|zB)M4qvxaBz$`yj8tM=^=VYw?CMMHvp^(_***
zA6u6%Cp<ld?D5QGRfoOq$*%E+dl*I%cC>81)M{Wbtrv8h?pa_vU$WI53Q-~x`R1*=
zoscD)yr=A<*&to-2yP2&EF!4hsy*cQzK2*P%1?*$m*R@BWX>&in}ziGEF=RP0Rh*5
z;{AI}?*MZ?3JClcPDy;bs>XAEf*+~3rM~^az=uO4{;qbl^4Bh8c^x_Vxq%1l3e2mf
zpD0#C=Ul5)C&bB_G`Jpqim!peDI{W|+{484-}&3{pvCrKr5t?QqDD@04k$Fmwo}e(
z>*hoK^ES9pqhx)0dVy7u4P_1-=asB?szg*cUD>vrc=U#h$s^=b7kp#x*i-xiO9P+e
zmGv};@!3LM!-uQyC9dQ;sJjH~K5^)gB7#!d-7Rxede4il`emQB0&k}D>z#hsuA$qr
z@c(P%HOV9EpsjAKwu|r>oINJv-LJ4u-?k`If|-5VvGwHl=?|aNZ>Q1e&2k=d*m5<t
zR_L`q8XkKzcB4tUeRa?7(UF};ffJWS##`K`+a&fEc4{=~{52xJz%cb^b957S<qJ+=
z?}I-(eDOM!+RqMqPR){89?`C#Q9FBFmBzyvk=Con%9uJV-0uF+B(^CwWVbR;D}AX{
zvPFGlJuGiNQBY*HAh;#5YmPsEU_gChT6+s&GjhXdaVLFbKWJ+gtCd=HowcFAzbiNS
zE&z3Hi_?J~eo@c{XW!=$qUyj(4cJKW;oqt^$GGn6z`aJUk^I{qa7#S~%>S@#kU_RV
zC^(6iQuJK*mzHmz+KXyA7Z1%xoPr$&DIdFdf>j=d-vOOE9!$+mC-E<+Sq>P|9#6M)
zPOB5b#_lBAw(j5jDfJ{S&lG1{`_5Zk%lockr#l>Un<fU!cV_9J+h+$V7anKleza^e
z4IeJMF(f7IvACch`u;4WALixOW$G{NeS({L#aF8m8uTMWHsCByVnuoViGX*BrZ!QI
z@XKxp3rPrt_C2l39ugd?{yOVRAHUqt#+q#Z@J35gZ9uIRuQ2V?JFjWpkqK-rKZL_7
z-SW3wB|5@wq%ID`tQ55&P7VngX8ya%mWqZapxSo>E<mYF-1dE5%iY7r3hFV@msNER
z<>j~dGfWQ&E0|qE7>0iVnZ9?R+I^;G684VSmL-<G=BzuD?~Tj*=|gStfSWx`Qs%__
z=a>b6Z>HhakZzA4lI_HFEiEml+^w{x{SEAqdg9Ye+cue*koNU;$H$tzWr{y?#}N4U
zWv;TPMenVE?)9F^ijY@;5_!fJnQ%F&H;Mf&+k1&+5~^;sbJFo&owh>~t6AIrr1R$;
z{gR49wnkHg=M%F_hP9D*s}-*9Cin0D?93C#psO5}<T55qroi&{HiC(U?14Y+!;q1e
zLy3F3Yg(LiJM$P0c)@TAzTyzKMGH$bw;1pSn)l6wQ@k4ga$@5LFgtM8v9(V#L2j!z
ziMD&&*yS(T?ALw|gBRDbz1OfsToLrtmePOhy?t_%UK&aKMcG{CyvhKn1M|;hxnuD~
z_`EoegG#^JV{CNf$&D5V5%wvT2xh%Nw?#L9_x)O7Yc#31CVkL{fSPa725z5FSMs}1
z9GNr|We;z*n3v~Fg2vyD4($QkZMpL{OOLmDba{CNsyCVg8XL5{oPq+LRl_fA=q$3o
zY<*YUh};Y+fMjYeoj;%CvG2@2%8T9=wPpJUGECC()!nCVe|-qV^81IpU$}A~D~NEu
zz6^Q;1)BgCo!(nx<u9V<XSLe>k3=ta!|@yi4~QJ6DP<pz3W11P-Td_cPjZFBen6gh
zfU4-H{GD4QQFyZ_L^YVRy34>qvF)y<wF35wuo{f-Z4kO$SS#c=iql7RMX_n=YlPEU
z_v{w1+ZOhM205!l!-lBP;CFqZ`G%z}qTfd+@P|o0wa(kg!3K=D<sznz&*iJXQ4i!X
zXftS9O8gwt@ZXsi^wHcS77EEn3f5HTOcMi;_C~9kz1KTaI@m_8ecOFYp$@i!>IM=H
z0=Y8xlao^8$EbDmd<sLo?YyXxg{ZXScj^vhofteI+XZX<e@A@J7Yr1q_|6C{=y8h9
zJ2jV73Lf0U${gI=`J_9gIw;#PJm|O|T~xM<=}lErfFH8!ACpgwg3yMnYaiQYnWrqk
z`#k!r)P^A!Z-F~dX<R`UgDQp4&MWH2@NsvE&t07rFy2jR!ewk>Tt^_@v%F-^!_!P!
z4Sth8m4hL>l|mX4aD1sL=lBpVO4Y&&JH0#7R|oT|%44=5-)LWd9#P}v`OKfVq0L8i
zQJU8u*{Lk4<N7@1u{;Mxc;K;Zf)#9Gq&n8buh$AKCyQ?^%(yOZ9F<3>b=l=Ne%xun
zKRa5F;sPxFe8T@)`o|Lm@z@(xE|N8%5u%gxKF^ICHyZb3H!s7%CVTv>>fJ5TAL6n6
zlwH9@A7l3ZmT_Zs1xpmKzPt80U4p$@A7ClUORZOMc`$M3JUhqlAt87TI{C~PQ?*uz
zQi8o^=-POPrKrd|YR*wcc5~(!fiY`^Kizlh$yHK>z&d?=9ePXOR$30V-;x*Wgxrnn
zt+c3Gn}^d83(P?=Wh=};KcXY>m&s&=AVC{IJ}r}SA;jGwUYn2Qtj!hmqt)UB)EX~7
zmZjoXu|<kSFNZG=^H&V56&xL8AKLm|jef#pt>FG!+UKt_$=@!m%yoCs#iAAml=YxE
z%!r+TDmVY7Qx1S9$lDAaPX=+)U1c{D-##(1cj!^ulr>2-mQxTW`MY+$IwvfvT}kPE
z6`orsdb0aC7BtoD9&$t<oR^s)105J7Hdz%7L&2v9{@M3sWwh1l=;rCT!CXHLw`tNF
zZYdiX7&qs1nItBEHZwEHsCwd~x}-2wG@953boBAvUJmGR_kkjrVphtA-#*BOb_!=g
zeLM$Qk)WV-hPJoWymx=DNr?o>%7!moS?E{?ugH%Bh(@TFR9Mxe;S!{oZcvvEa<=t-
zk?%T62@cmXrkfv0Rj_r|K-S_wqa^U&O)DHf{1{!o*i79>c$)ah3&uua$`5Zt4a^4c
zhato^p~xx%YlniT!8R!_+4JJ0KL<JQ#Ch;ZlS?(s@^=A3sW;ilE>YVv5??FLAikP+
z9*Xwl7F(j}bnnAI+#4o}4Y_PVyG6vOkuHeo*1;^}$T}{87&CEb+hhwxIiI~@;w(BC
zaLz)}zCBEU8beUm^ftFm?lCo24e;*0tZVq#m@7CD5%o-z&vu&@ldc%2WJv66&2s1|
zEGJ$UXw`6&daj0+Z=LV!aY(v@SDMbvdGrv0Aolb^5~Ya5rj|kV*Vk5fp2NV-&|`Fu
zh8~o=HrBAzd<1*d&~tEBv)?}j$#TV=$0y87<Rvrf+}cwaSe`#qFty>j@bwLO?ZGU=
zKB!JdB0i_E-pc8ZsvXPpEF>MLZm?#?H%g@gz|eZ}2{V}6LSM#!ZGT3r29!m+wqkLt
zAU=>&1$~7(WG$H;m#r~>hGoIt6xq<Tks92#yQo~Xy(ah3!zP&M$L)b(?M!q_YS6YV
z5|o&cFL%}#<Ny2tfJ&uJj8-oyf1h!Fl8?Qr$3g~O+=N%h3)hz{2>p$=w1(hX84O9n
z_9u;*+DL{-Gh^LDG`Jcys<UWGw$}czv&I$zv*o`+QgR8%A%--F8+lVyV;Z(t@i%=!
zfxR!!LW=I!WKWKr7cJ15D*4CD-ntmbs;+3C9h+G9*%;Q<+IdUR^C?~tEjAKvZ8d25
zZoskKI^)KY?FgCTod6Spir3_oE`^2$0B$mj?^75A(qmnvmeF?~oO8L~IK<6O3PVd?
zEreSbhx?JT;=}{)UlE#^STL_?YJ0?vrWCtGZi(GwV9QgK#s&q9&YoR4W($Alu{2>v
zH__uN0KM|VRh19D+F-(cFk(!|Z0Uzw$~O5&ggHWdX7#PF$4%@557|5zJ%MLFjr7W&
zh^gG&jY*sTh&h=FeLWwLZRZC|0p0EuE5~Mueqv$I)@RoXYv1fGSc#9G+In7_!dTT4
z(#d+xV&-aA<nBzE$eZDuSvzSaEG5qFp0d>S>&_I=puA_}z3}4jM<CN)v3yZPw`qsw
zEPzEizUGNKWX5(MKV>I_m#aK~?RF^bv{AUPZmjV$QG$ZFJm1c5V(NuNuZk3k=$N#!
zGT)nFF9SCEQzdrm^JISR$4TC2vzg?zGlNEW4|vp;ffxg0GF$yI-kko4CZ~WwGGWcq
z$7UubNND$3?w<`Q(aIjKpVlE8)nrA_9PxWl)=+oKi5CnJX~zL^K1D%7E8YF>56vkn
zBSYzS*w;>doI-{vdL##|4TtA`wm0JwW*SQ48A*VL{yp_=&b?Zp$4y-pJ@B_XS4g<%
zsC)ntuHeule8p&y&^O{|P2B!h8Ym2V*aN3dM`?LfD3VnJJYY%~{ptO0X(lzM9R&73
z2K<?U59qs=w*NXqhl-3N>hD$Av|6>Gfkj|;=0KGA|AI^(j+a_L-zUhTlXh2<*<jzx
z+Dm;$n?8Pz%p2dPgL|7q=gYF!3JVaZVP3XnNKjpDaRklr<st38F2X&`IY!AgQ^NQ~
zf{><jKu`xo>k@W%%k~@t?HWT}B1RM-=BLv4jTnpyv-s^{pw)ogL;KSPL`5o|1qE+U
z9F_|yw_=ZIx2hRx#bEYY8=7Ru`<HP1Lrb4Uhc6`?`duLyN_SMPM`P7PICAz}A8u)D
z?fK2l%&amH^bp(a<>`qwk6=T(|IpW8!yd_}R@dh#d9lT(Ik_u%PT8$Z{k9o954it6
zxG1_4p9Jj3NX_8=Y1o#e4^JoATB_@fiIF`=No|#Z)(b<Ve94ZKPfZthB8}%|5LY)z
z{r(m|NN%N1g%L98z)!ie=J%nW<lc7!(S~U9>3f;7r2<=n;QzwlTM-7}$0{#i56_)D
z?>>||1aXhE-n+Ro^Y(kzao6?9|JJU+zCS4GJ~px3TRa8jG3V;YexU1!{H1!O;Locx
zaHpzcngeo-7EvBF%UW2`2*h*X%pM~Qt4}b@Z=Zb*wM7o3NZG<)Y@}2TUHxj$&t1Bf
zxYgI#_h#$EkjU3Y$))6exsC6Vw?n}}aLDP)S8JH1twBw&O71fJVXs;DfxvJ^R)%tR
zOXAMys%9{Mc1r-u3v{f<&Q6u_j;BKyth7y~uYQ^w2>vGOE}|muR8{)Ly3BNXS65x#
z-DJZrIRXn-oLv=~gDGRx7JcP}{+^>#!QI5=?=lHrcjP0#Qf#VhZ~$X(H;gSdQ!<<<
z&=l2MC#Q&(F!4BfVmYgzF4&^Oc|{G@yr<^Ptkd`F@6pg(^MN@(s+XJ=PRAuq%lNl5
z(tA4>W(xx^CMR?Vz1-@~-V$_(BzIgbKH1*aiBVLaAz;eq`t32%%oW3QLZXc9A~bPj
znWe=EslHOVMjaWE`~JP(oO__yCDzx^FOc=B^3<C*9GvtwH%w2}U8w=Rx;6c#Jk%z{
zy3P|2)+$?z8;5jL5&Ut8fr*J%DeMp0g-13Nm$tN(cZYXBo}VLg^8VS3l|wxpUT;^n
z<j2sYhp%-6uSely1N(o*sS@vI<L6bUV<(f%+1G9vkyK|$nVAx0BZq_Y%-q4ITeiK!
zqrR^6b?sHQkx20DpJxNrz&<%W9f$8$+Y`FZn*PJ+1v%T@L1j&JXJ**n9qT3CqJj^5
zcYHSD@yp|j13IP8B*B7J?7GF~7Q;S>wtE0<Ac)*@UTY(|;%*_SYE>v!K{h~WJAB?g
z@OQfK2mVSnmEO?zhU3sMzz~9bo)eaUEXc<OImLA1^|B$;Jsj{pMq}Ts<Jmg{rAq$p
zAB;=_6^^&fd((q1E~Xi39yYGS-*U6cB}l~_nRA|=zf*y#>m`Y896@Ul{Ts)|bq(TD
z*Vqg6YUKdrkiFFCi=CT2h&)TaUY0~3xaTL@jb=ff>V?}kn|>DZ|9LfMdIWjs{o2*W
zhtkoZ5uM=o3-o2aLYS@PTeA`U)FiFyp;}z|lx0R~dGo-EwmJA2A0eph+gs|3N@VZ5
zw(WgaxMi4GIOPxNf5>=AwH6s6Z)^0k1AVdkc|*;=u~UFk$N1U(cM(W$3bz-kf|;%E
zMcpGq(1rarnFRk0o333$=|`~pkD%03L#hLNJhuJY#t7;t_DGGpAy*jF)_|(2W`_4=
znM)I3hauT?gskBRb3Ai4wcUg{-(cL{*gE)WO%W8cGPa{huc9i$URdc&kmw96$)V&y
zoLjk>*N~G`Bz@CVwdeZJpX2_#>g5;VW+wR6{>O{+BQ&MULsRRhp`qS|S@6wUYA$!b
z^>+ly!ABKktH~YhaxE8ELgcIM*q@x3sO_YYE^55bu#r!`(jtbUS;ba;y##(=fu~4-
ze|!s3JNy*Uv6ypFz*(daBmTYjeRk9PC}$w3!2;~14;}kY4ybOvsOtkxa)Fifo9^jd
zTS{oqzIRf1ft)r5x7`ohZPMJZ6qW9+7Yx}K2y7qG`V+K$bZ{|jc`<!IX|3=kQs|=U
z^;lFZ*Jtc>i%>d*y!&^$N+O776E%P(>{nFG$`HIY=5qN%j6~Ku=WaVsak3XTs^do3
zV*vm{-Vkg%$^zNkaG~sxtK%iL*1G88u71z(F-)S2tZZ}D9;Nth#v<kKckiJ!w!}!q
zI@8a3Hj-_-9Sfh-+NfGApEn8^tWPpNw(6p6B`1fPRroY!o$Z5Ql-#cZ9OmH&N!W-o
zLELNT#f+q^B*rwL)&*?iRyMR7|9Oer=HNVlISX1EAYtIM>lv=+VYa~sm%gzxb8XRW
zSMQa9iE!5tX6A5eZE%RGET8wchKQp=I9DWd&{e9S59d}I{RHQI^1@|4HHM`NRCl>(
zgw$}0?DnE7$E~jwKGU5O`<y%?|Dq98Bz*;i2)3D(U=W)pn!4sV?5jARWEa9XJU2+z
zY1e!WV`EcpW?1h;KFKjs{EZ)9!SN+b&sOLV&H2XNuF1_Aay256ZBtPNW^X-1cp!4R
z1Z-vi+>p<(yV5Ia`gYEG=9mYX9kBEC$9&2*V-d_5Ot1yf#pXT==oa4{&8Z5{OF=t7
zH+|67MkgWX&I#+w8`^%~whRbj)1(OY=(Mv69x+6~<B604Vk_Vi!slzQ3;j5{ia^My
zSxvq8drSN4ulszx{YmL#(ol8|0%;}#9wgUUU7~cJ%8a<AYjDa;E+b!=K%)=U{}@N+
zDgP?L|JkF6gW29}U*1^eWYgNM$xI|DsYfgW@8;A!EVDqDeBkWJFr6s@lkIX47&5|$
z_Kx-bqn0tk5JzBok+M2G_*Aw}7ig*}N<`_is(o{&dwhO|VW&)^mEVhpSTCA<FP`!^
zv4h#@+#-?bO;daeV=mdM!GXh>28$|6_V|3<qN<>J6z^zudq$WkUzW2HdVeO^FL!oC
zT({N7zF%YURx)Ia)?A|K0=#~^lEzDpLw|s*F9X~i(G{?Zrg`5=Jaf#z(71X3=n!>V
zv~Ml^t?m9U{}dD!z~(CD)@h`)#D@IkTCS2FanoGr?+D7Mm|A2v0kwbSstqm=>;Xfi
zkIhO<js*WP^Jed)d7w3XzVC;5(;BqJM0Xp{()oS-*xBqhpUG$f8akCh-@&k%=bOm<
zAw$~<N6vvuE!wC219y5WxADt)+1lEKF-_(t-if}NkA4j^KFkqq_M;Wuk!|*|<vxAc
zIO*YkV}3j3LtU^^%d@?78?P<+<l&Cs#Q6-rf&Gnm+eROorT-EGekx|F2l)CnV-il0
zA^mH`nyf(MPszyrL?UpN*mf_Iy}T=)MHEoF^!OKG2+}Y9IVkx7&H?SDW*r(y$ocI8
zw?r37JJJk#f4>SpVpV%*z(D2NCG+QxefWC#Qq_>-#v!G-;t;+kK?nsOg(g^{QJety
zeOa5S+UoKzyba7sjy&JfZ2hPcfqMOl0RExowy$L5!H9)ir~70o^DV%L59DHkQU)x*
zFMh_|s8l2~Kjw_DZ55TlO_=#|+H2k`;gXR;JIj|hr~Ar``3($=6Zlnh^D1Z6(j11>
zEAq36pU)tBs{b7|qz!EenFXv>8rQW5<LA?KK5g&PH^la4Gr>xVSF8Iz7#~|%-Mn})
zS*X~bFtu%YT<XLkB()q@sb7+WkT(n;25pkS_=Q}bOtTmO2sA%qJ#72Jf%7X{#lXR#
zjv<a<KBKf^%>=10&m{Tn>Si`8QskAPD+(wlmNt4oe7w2{_Kc(W^N~))H}M|S7NV#;
zHp}?%pyHL%E~|GoxJOg4@H*-@Y$h3uHkxsoWx=9w32rQk5CGO5Gc8``(tpMwi7$WR
z19`+nlsKP2?TmM*#O{`?^8+Qz*$@WcH+sL2X3$ETsbT;2Rm2Lf^tU?(&=pHfvk~@!
zN<2C-Xui1bRCQGYlLfW?oHOvQ$(#w#`SVJO7qQLI3V|_pQ@;og(zMpV<=@G)!eD?7
z_$f9X@oAx*!$Ky12BsGh@mWPkeV?%v{YC0*Wl&TO_fR~9hmrG*m=QmJ)e&zGPb%i%
zgt!Qb+~ElO3jl|6)8}#Dc?#-bs)+_X+#w+=#*;<UdvU~R^t7f}V4yE6+-Y$06IL4<
zvh+Qie%h7Ts*PD4&x?KS_dVhbzsCA6@2U5DTwr|j%HVW`McTjKj??(O*`5%e0lfEQ
z<cJJ=4=9`XKZ5Y??YdMWt7x<H{F2bG3bd`2w7utn0LDrvhsLK9FjVP@Bm$->Xh9CO
zp6oq>=Kmiu{8}zBVs}$g+hU{ONST864fmU(gTlM?jvv8M8@Y}Iblv3gng`m+dL&0Z
zeY+3S{F=YwnqTks%0X{0knWRyWgF!MYipBPPK?FeUqCMe8d3hMu<jtxkZam1eT;$O
zU6H`<OpHVD8^kfO4>|x_Iw>X+^B%CB#v8Q$FxWN2IyX{Qh8kb*>l`<~CwNO3{0ZMt
zw->GWTR$M&J$7c5Etz;M7W?^*W95xf6RKyj&B74;@r~Zh@fPbxkENf&ob;eTBGFV*
zmCbH2Ca{d^{79IcDZxHp%881I-+mQkNm!{Aydl0xDy3{&YQhV@o6G42ZBg!ov%dEX
zxN}bSs0uPcKM284Ch{5vcK8{35o%L-^m_MEJbUl9bTf<ts>1@N>p$IO8z)1cw5oH4
zc7FayrLEy{a78XV_^Vmj3ePrd1oVnr8RM&A>0}wceFsdwStc51H}tX_AT~u#byHun
zngj2O0f2%#s^(M?&`WSmPLK(@&I}V+w@W%QqR4T+*MIj*8EQ9gFX~1}1i^a?IFCTn
z4}%|Wk}{-Bb{WOCy|uB_Dt2?ap9+mDyH|=YvyQRZ=zW|V0dU*FDZw7ARJvZYj~Uxa
z{!yb2S9>~kHBqmOFY7t7ux<9%KL!C>L!DL89)S+pXqW9il{GSpTyrvae>0ME7pX<F
zHyLl;Epw;a;yPeA>GbtE*MQxfKW^=e*j~?nUvic;P>hh*U#zFlEwRjUwKTUCEp%;#
ztqW=OEB;6jxWuE_llPg+`m?4Do&v}+Qz3v`@1R3mQuUFU$^rioAN4E#&ggjh_J@k;
zJ@#|W6@~P5RNx+b7>3SE5tIws)KUfCau=@UuL}O`&Wg4%i-Ka-w3l0_wVtfrS~oJ(
zeiPIfE~hm18(l=C=&Gqx933aVoDdfMl0NL2IwQdxVysuCF83STq-xL+)jba5;||L;
zQ44Y9$!jZIi(91{+aEC>iJFakv6ZXOw{+NxMMgPh;h4bj#rxq|TO|RN(=yAm9X4?*
zAFvfOi<1&^L1yiH-2s~`4Vo4wMawRuO_l@pIF_;wNVjFG+@yCyhIS)WF8Jm9=vZgr
zbjD*_TRBm7<9SCmm#hI|d2bp%y!3Rdo;+t3po|2TZ28UebvtU^$P^E~9RlQ!m6hj<
zOF%(|Z;_!AZGcP6&rj?=AD?xWrw-EQTZ{TQ{bka7L2Z{b1ra#uy<dcNdY94nBdjQF
z>{rU!Q!K+%_<rt27!3BKeis_x<OdFX&4J&X{_lo?;bV4X&aYzBp{C0Ymv3o-KQf;W
zb=-XQdZ^y~;ie@Y_(viROjk~lB2||8LpMqx`#pBa_}OyT&Q5$;8`v*py^v;AdHJlV
z0b+xdeS{s8df_Jc!@TGT<XoR?F2;Y;Pi<sJ)%orh-ivX*CX!w6GLzMmGZ!M(vm@?A
z8uLe0O|2ldZ5B)u`}J)No0@T&F{1lwYhw_wMMDWt0-M21AIo+7upV<K_^gNaaIaCC
zd|Zml9OrTT`xN8*^Ir{AjAwyx8Q&hC76nid*dHGXDliycnZuDZg0Ur~UHKu%&zI1g
zeG)smu7HYzZzIi4to5yafaF)L{*%DJdx7e<G&2|Nm3pO_4E>?>9h5QPBOaJ?B#BJA
zDy_@hQz=mu7!~n7<_X_4N<W&3)HOIvlW39XSgWXnTHe!XFf!!o1O4`gg>V-RNu^Ac
z_f${^D@^14l1#S!@$Nx=6*0oFn1@pmQ`A^PHu^cN%k)><$>&Nv=8|0HvpZ8e6q6c=
z&g^tTs9RxMj#|z->ztiG(C4QRhES(FMZAqg2_}afG$A`nIMqsB*qRx>HW%^RR9-}x
z_Ff@5Vr@;IgLX1wuXRs)3uwjZ*`TLlZo2_-BA%}Nv=TsGJ>K$tw~ke;#&yIkvPaeF
z3T&3T_6^Lx1buvL9DIDKNnp7^cepobyFEs>?4KkVDjHQ=?}6EXFX#4F^%bf;lJ`*w
zSVT_%_iy<7J0~m4-$K06`%x*<u>F})xgXits5qFji_66R`Qf_lJA<0+7X;Lvw02|i
zoOCbBX8&K?!ml1ci7^>`^=G27ioZAPX**^~6A!2OG%PrR&9i@<JSqISI&f-SSZ5$8
z<%qxb?!IwToyhjXY$U2b<oRZ4&N)=ZjT??^@jS^FzgBFn5=wW8RVh(Mr+!`mpk`bN
z<6oLI(0;%ZBFYqdoZyyEo`m1GhyPDA0Pn_O81DMS9duGiMb&jL08zNo<!R9|h0i+U
z5MuUH(Nw)!#X}Q)L5in5n(zTAD{;jNX~R-Iwjbc1<Lv*Uk|6Cp%wHrDF2Lp12lrqD
za;iMmR@AR_H;8$mGB0>BYq#!o&Uod%FK>7J<@YmwgP`u-f+`d0DCNlL_fEyoK!%3o
zV6F`Ixk!1{wh$Hf`31sq2#Q0ggYgx)XDz~!mZu>jK0r%uZ>{oj`tjmKw8|QOXDxB#
zB>s&)PUzt071KW^UFU?byxrC`@ZVhEiC7oXyZ{Xm)Z|yWT8`fmt}05s>@%?R=2_&$
z9krRNq2#1{a*+#}Ze|boeB5Yvv$K49JkxEQt&)#auU;TeLENbGr8l*+e(Cbv8pu^*
zmR3T(-SCYuijy$en`bJR-N2>F1&27JY!qu|dejD3P7W?!;=b8Zxj{zc&>vdE7~esV
z>`<qh)D|h2O(w28!CmTGcO_G%G41RA4Y0b|J=NC+>IQExCLhH^vOi>}jl_Q4o!c#%
z0re+AL;Ky@x46kijSLc{hNYinx1V)yR}*VEf=(Uwy0KH%)A#r@N|YMPk~cxq*8Ql_
z*3nZfS-ZlY!d13zazf<v=E6A+y*>u8ihD9y4S?cgw)U3H2)ArV&)z*9H`00~9CKBj
zv`Er4B_XsoyY2)wwWK37+4uSP6}I|xwLH)_qy*QN*VuM<^N`rL9RafZl$q1Z!vVH&
z0Zy&4s8#d<E<$Kpn@=Ap8`~bpi#<&IcfNYJOk=zs<EA-eYrU<wHLc9Xt;v(4t1Bj*
z0~y64i=?OumaW#cSj^mKtBoeq63}nMPFIZP91wER;HFIPKk8cUXanh3MRV5w?gHS`
zo_}WiA?(gHKXt9{cR=-Cc-ZT<k>E-735WF3ZZ#YHp`9U*-IBat&a9fgH@6!BcaA`X
zT}V6NR%tnR3&(%(ykt5N5qR3GvT_|@LQLk^Pb^1=@(;J<;4+e1=u_!X#!Iu;F^|F<
zEu&2_Q`EuS|6tma`B!F?s-D;O?r{ZJRC~r3!Qt{)j>YE1Gowv~NlQQQ-Z_wN8VAlq
zP~n#upL98x@An#Vf$xW95rmiifnXwGjF-*nh%O*n-Dwtvl9NYYl5gI#n94dE4t`uw
zQX$m$0Vpe-Oc*7Z5G~NDxxw=GU3VoHAZJMl(=VZq8L^)387q^e%LlA5UDL(?^g*mv
zh27N#?H3Y-HStefa*_3gh8+p|Ph<O}&6SktdL8FBaNL`Szozy#{X|x*KReP)$*`0h
zw23xREjwa5B{vv$zt%?JIgKL;zwMYSx_5C}-;<Tulv-N_5}9YYdGUSBQlDI*K=^@M
zpeAQWSDBxT_D-gz#P_RCV+4BPG^-Ug*^)A|+0`>o=d^QaPl_F0+f2p7TYavUs?MAm
z>~Vk_9=66;%w`I!YdKZ<CJO&vz5JWN3FTuj7*l+P-)OE;Zb(jubujv5ALEI_^!=6;
zXcD}QW>`_lR>gZ{^GJFqiaTj1BcfN=a>PA=Ve!R)L_?gx;*6UDCcsIn7M%=W{^a8W
zr*7Bq1CJYWt^Nl;&{KW(Fzd;gu#X=<FMo(kcL4-wcx&YLB3ruU=y5vd5b+<{yvjst
z`z^mkK;S=K+v{?B6ik8Exy)$YSm96R)%)ICGy>*XPXQRUn~SZ!BeM0T;lG{^UfXSh
zt$%AHWRacDNDYl=U9@ex+k)DA{kRG1#lWaFcMml6?DB-9CP0`6>I?rpDI5J(8ABP|
z8C;oYNoN}k6QVFXeLIs}qCr^VNN@ENez`SUQ=26(9CgHZXK@ovcbF9%-mMR4GD+WU
zT{V>0Lk9)viTE`gzNO~OzPa~_%lN}a#m<PH+7UHfF(d$J#!27e)I|Y8Y#B^$Ny6f8
zr6qq2nfcDC1C7#GdC2wn@|5?=X9W|IThMUUo#K2_yQ5#--9yhUWlZa8jqrnU+(Y%f
z49D7DL9z<pkRJuQ_B;30){?PYfDMAZ)RHq^_BznywRh*Xr@lk+mYq9pt?=zEPgn0x
zD7ABvBvTn?^HS6NCn<sB>wr~Mpu4;GAUCj@p3>>3nJs5!%OIZYu^%rflX?qrpnb>}
zH5^g5OtLgMW(SEkFAC?_ei57Vo00JS4C_lEzo3>+x7S0cvcF`<c&QGL=!Mh^aSBt;
z@IUWcWUk?D^E>69bxP?2B*qCJ;OML$3Wn#DFeii?t`?D4N2+B#5c3+`g2u6JO?|KS
zq&NlD4E!GY@RqBZ-7|>R>AfdisH7aoewnr}9N29N@yjj3VSD{^wUX2bqV{#Bw)VTK
zZc?Xkl_u1dMmUjicc0|TG^xW`f~n_{dK?rz$=}H`7i)c)I%LsX1l#!*{G>^xa-}Gr
zmZ)ITCo_ExvyGLfA2;6Qc)RmHJ};O@>s;&_Zy&Q2POma5d5O%=TA|c&BM=B(0?)q@
zv&_ErQY^raTW)#Q+K3Y~s;)l!L)X_f+9@>~({zc<xeb5hQQr1UdL1@7Y=!W0`@>x@
z&z{ffoK6`~P0cmkK)Rjg^B!P8iuYv#D{L9tKYt*A!iXC&QTouY187TE?{T?Y17c3v
zdpeyfUD#%SI$yc^jQ+&x#V?&n6Vbg-YlYrO6i_<7kKEic&eJJnhNnw!N%Y_)WxMLr
zcUN_n$8f{R<{!+oAD3^G?R+|WH+}ba_9MeIT6}l*^4G{AX#0DH_Dt}a^vIQtvbp=S
zl%xAQ(zbhdx7vSsSaj?V<=D6PC(_#Qn6mB!AW)<CH$MIQC(n{S=npuJ1RjuIQkTq$
z-AoKSJ|!T1hoEky^Q{B5ATS9q+ho51g~i=Uo@?4{Rk@}?tK}Wr&5n*nD0|W`X1cJg
z$;;)SPAXp0{8>yEF#qqwPx&+hasn(%^^o434*Ee9_wCiEG-SG+h45Jzb}+PGc_z7}
zZjmv?Jn4QUzyHp{e0hzTBZ8FRfUWJZOe!jcM2RLOED@nj^?bsDpEB&S<y8>@yvAy4
ziPF2-)7{5`Lr65K{5wi~faurDG+tN=qXbrz!0jJV&9a*IhW0uOTw3rtc6yqrY!D0o
z2@PNLSt%~E8`fTS1Ko2~Vr9jVX*!Fn;Lgz;aT7ji%JI)yRb3S#YL@DG*<E7$fS4i=
zICOcNP0sAt^)M()sv<CbYUxTP0g3u${{14&Wo`4s;Vy=3vRa*as><|_zKm-?n7jYa
z%QFYS?9NTF$p_h^#?0>4XGi}yhC`4&$74uYG;`u{c&B0b4=!gbQtq2shc3_lh?siE
zMtL-4VA0_-uQ$Wgp^Z#T*8k}tyL5&LYVY{~5R&Sg+A}w(s4Pf;F9;W7tMi`ul@RrO
z0B9aOiwf*r3H0i<`+4M^54iFQYJ|R<+bEk{wO08nN3FQ`!^XeQS+}wh3HaFr#hOG9
zs=V9UgcU&m@1A?s$OoLQmk(OdatRL3uhZ1bxBbua_&bkV*wWtP4X+jFP0}f(4+R6k
zrPLI^6CnEfvPSwXv%E;*Tni5c_<%(Xqx|Cgm}EWDRD6HQan`b)|5-2cmdpCDJ#`?f
zFB{zE2zz>v5#!vscO+^+zwSFU9uq4tvfG^CDI2S2O-|VkiZw(=I{L1@e{cL=LVL5n
zllY{(6+z8v^R7lux7_F7Qkb2)HphkalWZ&Xnd`F;?6I|a;m_L0-%E6TZ4NqgOf2;F
zKfv0elz&8e0^o_SLG9+d&0{l}3}Ws`9#5u>tW09_Eom1nCrh4^@>~Y@1zelNKj!CO
z3Vh)BZ*CIz`OIL{573Q>TB(%y=kBX-Z&w|PjEqU)Ge<5kZp_OJ%i<Cj1DlD}RmQHP
zn2=#B*<RBp*79U0fqS(1rj7SWpd5TYSlo4mTH&GyR(i&@*mR2ZNZ>iRp+70Yn(W@^
zu1P0p51jg`cz}0Fe@`dMankc%ds9mMvUyAqiobG8mB_dI7pnYyCc~Dkd@RFVxvqYQ
z$K__(fS@|B@NL6#+FJ0JuYz(AeC|PRf3%LKNL^)?)t!?yNfs9%wbFW^T)&O5P66sR
zT;neF(~cp(_7_`v3PCDE$V0%@`-Exw;GtKE4YVY!V8feFFjFwlgc&biA;Z$dA=;Iu
zFNZ+E?mRF!YzL(l&PXhPuQ7>+$(<8T3dJ$@ovR_`txj{wFG}B6nv_zSUd7Q`WBr@o
z2R?7!zpwszGTzYI@LSjbDyb?4>}d7y)QDSqPzc|A&@+K-pwBQye1}_L5e++Jn|N0C
zCyBE@xDUNKz5C;(qMUS<d?}y1VnV>f)fJx1xNsN{%-`S&2h8OSFKS^$6icpV88$te
zQ=Jy^p6|_%-F$yR3wY{NBEX+G_Kf$z(-fdo_IFnW6jpFt2&92h`VDE7Al0d9*PE#x
zvdl5X8D}R!1n4(a+GM}dtRk)M=7Fzr;}&`N{C?R!@6&oty7Yg4)u*dK`H645-4=Y}
zM}`=5puEW{sH{xU_Ed4ITq6RBt)f33YDY}&y^KB5y}G<?<DCU^r0Hc@%0qCkvR;xw
zNT|H+u^xRqT*8#k81_)X{H7A|r1e!H9B2RYB<kci(U>m`)+l4pHox{k)d;`cH)wj<
zkdHVe75df@ID5n`58li+lLx=a<LvC|P!+JG={HTo7z7Am^^79zT{-AptGil^l0bw|
zvIRQ<X&!)Ifbm{~oz>TT5FQ^i$ph7ofE(U?ytCX5F-VU*nk}?L4b6avwVC}hNv{S)
zq<X!mE{eX-wF#<ir<J_>84;$C+{@uU<we@rR@1npI18$vZ9vg&vn&;JlcV?txda5%
z#GKDl4UD(L*^jnnO%HdmP*&Uf$P6p=e%8^f&x^WKWnUMyUq|Q-4U?%2nbl-sPg8t!
z8E(;8#C-Ok(zUG+x^?-n8t_z^#nDzB+!mL~jwdc~a^JnSG<aUiEX2PqHG@`-9-dro
zZb_9B6|EgpxWawvwpb5f4LX$?Cu9$>VxV22^r6$I6O`kGjvAf3s*A&x_0-s!nJwgk
zPbZ4h<=qVHYLZ{MGo3h**Mh#j^Rp8^v$5Iuw%80#ZNM+`3{ZAjBU`u3^z|0QM^3-N
z0p?Pg@BVxGJ^)TQ`S}ej<tp>kVQ;AVZ)9=QW9|tlHeWtxyWlU=P9;VJv<xX0D5HX|
zUcBAra>KIi2|N0)Z<)6odh4_e?JGmvr{6dGTzzOsgpzSel3&F{CDp2%jH}jJS3oPX
z7C~CW^dZ<jVs?J9?T&yq$!w(O<_f*7tx3NHJ|kD`_5wf^+wC>QTh=<HAZjRnpbuQZ
zpk(%&)ZE%jajBoWkJF?Oods%*VsZ`?XDQR|r<U}*tw2S#mPO{_w6EW)(hk~Quw!6z
zpW~LejEK5D*!Wd<jpuh8%97N6Mpm(5U!V0#UyM-Ve7vXXFf4dZ_$7`(j))>7{4gS_
zZK~;`+0euE9-%c=JlnXgi?LeP?~tbRS`m#L_HrLwQ_bCD?u-}-)Y7I;%V+~Hu@zXT
zeCXH<pbyL(l3EWwV;8-5M&S-H{ZUvW9JwzROIiI}Y=-^cc^1NNm&{<`HNScT84%KL
z*?`UhkZ@IPE8)!H2;=lGIsG{kJ;`mE^}$MOrkA*UV!}d0#4xMBpR9;4rN*TLdV!l~
z->Ny>Ebcb8cXGNP(Q%?>Zg-nM1&E}88fFsT3EA%VIl_HhK&-|xK~Oi&B9w!rX2*9|
zSR}=YEaRuk^_bG;^kbZ{`f19tt&6VbH47gItZ=6?<LWLKPmPF`0mrFkJ6Kwluf3AX
ze1me6aJ}Q*8&ntp(Bx*5TDX7IUARg8F!)G7h-5b5n-nEF04~YR7*;b;rNSxWGq3V2
z&t&It6hWqiR5EDBmFqJV>5#Ub(TpQfD+smvUx0>@c6Vjo7$`w!L;89`-Plipe-;8T
zmd4CS8cKf`0Tmp@2dpJdyK=7hsi$K*vj_f_iBOlas{Fy+te(NCia;HQqPqlY;p_nM
z_?(x?ANBP3Amo&f!FClOE-Q-&@EdvF@iC-IZwDwLXW~^>?u)4akM!$V<h}vmKGpY5
zoB}*ecIkgxCrwYZMnm|&bfB3@6XeaiTJ8~%9EXnGdjOzy$M|<)Q$S5IiR(?|={E_t
zrzYva${R`g_sTIG=L)ai8a#gHLOKZhv5?wy(cC;yUuWH2nHHF$-Ipf@>M+q%@TxbB
z1?ex0&<CZUO78zqH`FgZb_0A^8u91yE!#tRtaExe5L1GRz$ZurlJ;v!hC1k#sZR@}
ztTBQWR)H*R-i)xUd@46@V_-%@H2_t2n#|AaUwuR9v6Byt6LZtD4JSKICmT_F6$^wr
z27H5lCG_NulnN1vrkgYJ0#n6A5ffEY=@+nM`8$8@P0Z-$e2K#F0eX+c=M%k53tj{$
zq4!;(<t(u;YpfM1ux@Df#y|Hea}sTUj)A_UgRE#A@av3MJRPy`+mr1I`J4WhaOOrv
z1o>2ARNJ0Wm<n;wp<04lwtfsoti#TG+ee{Nj!?}XTN>HoH{|aQkIO~b7}yxwaPFM8
z!-w8?es}E4Bj9gM9Ibm{c_`1`>TLZhjzdpQm#(Y#HsWk{{!VzZSgc7w+r5u-gN5o+
zbuK9f;N=S7Cl8({Uifhoct(*AeTT!|9LvkkZ|=+yPgKV8_tNRzSE1!fx{j+S1j5!1
zMd?S~^7QU}C9<$vQ#!yc2Q}pQ9A8~Cx0}aP7^BxQC9?7hxM22kS^KiC*eOHcE4!@7
zeX&U#ta1r|N?t&Ubf24Z>-?>r>4fIuKiq3{@tqgCb-17$U%U{@S9J|#oE@gjCuw9P
z^G-%Dz~v3G-}HGKdql%B@rkq|Fezo1F<<(X>{jzQybhLcCcTFYD)Yy0LLX*A(XuHT
znsDJy5#iLGo`Us%Ce*-=J3F1nv+!+x^py$9lk_?Oo;abpZT3{mF_wh^-+6XOAo6O~
z9TeY$i;~<Ox9qP(i2o4mWlbgwG$VX5`SWbzoY!=)Q5(#kr2NpF67kh1@_p)5USwKv
z<z<2xvFbeE3FE*J<XI?<?lyN_fp3Y)dIw1WLVfL^%5hF^Z{B;iYSh%!r1tjq=>78}
z)g$Gp(PaQGol<(v4}_?it4s5XA%-@4<=EzCX6i_N$mAs9^Fd-FS@%Z(ULyAR74T)3
zmQ)l?4^k6R=){q*mxn)%(LRo6Nl{Tnu}mhczswJiv8uEAk-Q?@M=y<j4vjEBYIq^o
zX|lZ<o(xL*(fdly?cklSA5^WMVyk%1iPe<HAZI2@THE{O3~k-xD*Pmm_Y3o_xE+Q-
zsWnqE!%LVZ-S7-hUvjGLIlkISs$$9j!z%fNM3xj7_GaN#jys@P>M95}S;&n^Y+yR|
zr`}BmG3FHQDc8Vgyg}QIt3$l_SGaZ11*BVE+*N@Od9vTW&E_Z+-?D$%kZ7orMj<(w
zpR|7VEKXiPi00rOZM);DkYQ&1{pqW+^XJU(H7uGQR`oHmJZ-8|GJnzx26jX-Ufn^+
znA<%C^3MJ4R#IWH_{HOGg9{sbe=_47Ls8ut<P;k@qv<>X?i?Qj_Ep&|n(j8TI&b6y
zalzLlc~F^E<Ia4mTa)X9%V(~&`yt8AW6Z)zN%p^KH5Um@qfp`}NOIYwQ+c-?x$=}p
zP{n4<nlLW<ynCw*0M5v#gT+EQ4$U572e-&gphZ!UyMHlA4a!#7j_8f_-I?=k%I5HP
z<oJ2uO*uF*fIn@IKa`sU5|-sY*pB<yf0w_W^?x9#Yxp|#ZE>6w@nsV|8k$*Fn3IsN
zdM>Qya6A@!UoKD^tbq8x*n9JMDAzx3oN3e`*(D(<ON4~7q=urhi?MH!ec#HGWeO>&
z$Q}~eX6!=tohW1(yP~oaWexGW?ipL>`M!RCJbypu^*YYszUNv#%lorl*YH>kX$xXf
zQe@XI*wg;Kd6kG5E_Vi0?7~VG^>ctIJeU+cR|fOAxhzI|C(iKPZ4EUJ^@mT^)E?ep
zx{Nb=b&zJsTt6=TeZPuzW=`73rx9vT8Ra-HL6m!e-1m?-P5FTmo&#?SFO(P_>H1@V
zP_qyE$a~Xzsr!}2D(-V?z*3hXD75NQ^oVr#XwA0O{P^`T_q$rtf;np_)+z0oV>3KL
zL^QpPg#tM}+Px%}SY$?<qe${fXnlEoGjZ*hJj=%i&l)$fP{=tKH6a#dTPHp5*Ah?v
zPA=TMT23Csq;N5Nv@~ALDs=OHM~@Su{$g?R_nvWFhkkZYm#4C=qU&!FLj?=n9)+uU
zsn=(3kJ=9Lp(XFtu5SD?0hZ;j%3Gi_IUtxTNLQb@0L!2+nO8VY3@2l7YwqL^G5kB`
z^RjXJP<NZpPx(<(0r!GGvNo>OUQTRKgyy?l`+pn(h-i^{G)aa{4Jklz*=1_Auf<iQ
zAf^AaMtb%rjf=VJD#v+PYGYdz<!VFgGtH~Lz_N_Y_2;v1fR>wNI>1sn{WX4I^sTF1
zn6-|<)W-4_YmY=GYZ6mjup8=%J={5ZDlziuiDF(ChH##uKc569yq1C@?=io+5nw9R
z#!^3380|cK8Fqn~;sYydtir*1p%eBO!YvA%L^B~fTK~sU7={o9{Y|cg>F=)t7iKV2
z=r(Y6q>U^sZ-SGF&Yy}TBYzmIT+%dH?&xX0dgAvyyT=a|Nc7Np041DBf4QkckZzjH
z$OXHL7NSi$Z)Jx<p*s4z*pEwG;Pfe)Ytew$@SSsWx-rHurcj^AG-+WO*;?4@KpE8z
zYM~k6)1WQlyU;OM#xHGovs>qhDRSe5Bk%RdB}OaOrg};8H9d)oeqKCuLR^e5-}z&c
zeo6oFI}eL5Nn|<@XBJ90829%}Wv5H`-FeU;4FATNaMF#U*8D=IN@;nj;uO0c4k-6%
ziL$SV)}PHy?_(@1E#i~$lAdp|SYB(1<5YopfJxlh@ogqtRZ~LTL(r1IRd-6wu01}6
ztRC&B?tC2ksnr(VbP_1#ZII_?iU>Diu7_ITHC}wD=FYBKoN>t$H@$lG;ptCXNhhgH
z(ZAA3)i|&rWHqV=*BYK7{Qwloy8Zfg$px0-XrMnfmgH-2@V?s}PWLnO>O~&OC9|B+
zso(oC2CSPCpS$|5t`!!_UG?(zij|Bq424b7+X~%m?fYU^;n(yvFPeYwd0|z@Z;bni
z=ywOFCHkjK)ih1saWRIrL#I|xf_t*etbJX#Hvhu49_o{|GWde+5xq!qB7<e9YM*I%
z3;{jZ2|_&uJZRQi5p9hjvS!u{7lZakc=Ur8z>uNfGUYWOcx<0yPqV^2ihquD=ARcT
z4U7F85v<tJeJgV1hf-`z$Ykl7g>bl3Q8d|`ci-SH`tNSpnRSwdNq7vLzvz4d{ek?g
zrlZp9rvU{}&%NO_&UbM?Z%xd>waCMHXGCEc{>6^!!VrC&hvd#%!7?~*C#&Ic4gcdc
z1a9z~7fm5>Tjnq#BCHQu|4FD(^?{5Lq7O)6zGCkK<Pmi4W0H0r43kkykz&i)7`d$c
zrrP(P?p1iSu3K|7*C*pLScHxAK8TyT)*XaPpFU?<)6b=7G0^?)H%7xK`OhhEsNux*
z>~hfE&QtI02#x;;wP<++uI2UM?eX13p+ljX6)A6AgcP98vCm>0+f)NaZvw10!0smF
z3m_e%?!HJP*yIRGax$Rx;G~s3VrIipGDM@H{ClsTtB2p8jI%aRb0AJKOI+qyD{He^
za>eD9r-D1+SD@0j4%~qF5seWaQSeoEh#z_K<6BjvIcxTE&-bXX2>@!TEi``nD1Iyp
z@y<GTk_}JUp>~^th<nuYhDLU`wOgOId>q{P-Pihx$?C1Se2@jbhK?gFzroeQt-t@~
z*KP*OwCvo=4YKe=&K#Q>?8C9*tdknL1KmUH!DHqAW3NGlW9w}B;x%7f5Y2j>3>aHa
zqvMe~SO#$jKV*;y3y=e8hJriqT$mv{;#)1ovPUFt!0rGiZALm`jraqIFg>H;y0A|I
z8L^VjHS}>)SYaP{1LxT2J5q%C1&Twj^UH_){BDw(_d8rEgXKHR-_qCTC@4VPa_w=x
z*FvWo7q72ya3rn<JDcg6=YCbqjf<f@gc>Nq$p5~hKx$`!R38A1V~A^pJ^)??&vXbn
z>`;z~_ykztTHsC19qLl$AS~u*o|$}4yt4HB3zMF$T}Hu7Q;IYRPyoS^isX#i;#dy`
z(&OxG4i-kz8XBLD2Uv=5e!v{l$Sm_1XIO_@S!3>aDr41A)ZK;T^cCSm)+2ZQnQ!_Q
zP>DQyi~$r%%hDrlQ1mT;r@8DZDBCbpPWs9{nFjTpek>!3W!>X09ps_q9zM*j1~`y{
zSfQRr8M&LH%*-N_i_<xe$u1N)i_4QSvqsUmw%Vw_{X{q7O$T3l{^gk4ins>Fd%J17
zkbpI&>_<6<tYD;ts^7OYVHua%I%MuZU~ZN!cSQx{GcJxD-jg+dU?unlpPj1Z0Me*8
zU2U<)?Pj1m1($xtiaY{)VMbnh3XqcFGju}L*7joqr=@jzzGU46xb&GEGdYo!6LBA`
zZ7#Jfd~5bJ2bqtT^seAjiL0Wb#$YL@3XPJP`H8!4O?7}U9FJ5$v2wwaAo?GxIZ(>;
zqujY8yUap6K}ei>dHgQ0mQy!s4}i3pH#)kHL(JQ%L0qN$t%sL>0d#VU3VaVFve35d
zxWw_~{PHi$R0H?H`L!w9w~cn7uiwwONDGV|Tz`H|h!mEwDcV84H@hXENkl`q!9xH;
zOl4x`*LH;n0ra7JK9ls+d9XltCa_XJ5=g@)>h5<RrWq@l^1S=b+}8X6AcvNoPDs*K
zHL*upYHA#>6x<4ui!Y2<%%~7jd%q<C3Rf7<oG=AeS=B)Db)%9m&RnGg^2rEvo=5o-
zVY6dhG-SaWrgh_8JH#P^y@9M!OtKN%Bv?hK$SObqcFuEx1#IL&yxK`w=~<y!&jK=L
zZIEoAU`$4mw|U6Gu~?l)+WK)XvX&28+Giep*`7iI^`#O0c&A2Xq*y!L(+ju_G9R9=
z*@!jfG-mdslBx`BdALQ)WQQu$yGox3NruieN-&9|N=Hz><r@A`;>nysPR_cL(6UVM
z)fdod#b^vx$32`O0}NzTPWnIZ68XQ=Q^HEvGyoYM>MMaXfroS9Z%96}ebQQ$d_~kh
zRvYa}?RmgfGhc^`dEoU^r7nk=cSwz_x(;Z3*|;Oz2R!<l|CVc;2Z7<xk|SUK&(mIv
zdop<#eEb;OU@)}95Bw|#uJ3VC6>#x+l*=dqNGD0R=QM^$*E<T1(_~yU=gkJ6`@QyP
zYGykO+g%vjHkhB{1+VAHH&*Qt|2`!Dr#SWhfa6NIEAk%FggMb#z(i2o75jf=hJ@ok
zWQO7|5G`vI|6O0vEy@=x0(2jgok8z7LToCR0VhZE$3JZXDO&1z`DIUf5<#RS5;M)P
zt_u3H2q{9m_;D)$M80k3&nn|vpd$7xC=q%3K!&Q{vzjQ<9NF99jHh;RMWq-B7w^5<
z?-!hbU#P1(2Kr&Pby@{FUnSio%85W1)T>Fw1~_j6ArUMDI&?eZ1Wa7_D{%Wan9Kd|
zRo7)*dnT&#@H~BoUq5f%RsOn%4T22sf0bP2h#PVrUwQn+0uiPIK9cS~d16nd$iO<1
za^%9rWI@TM_~$34?MH*a43?~~{^bTI!DJ={AS+Z`CQkf3n8><nIQGci00MwW?vA<6
zQ6v#PcUlH5_GU+@L*BKV!C!|qkiUE1^9XqS_+291f$|*$-=+zjE=$tp8X}x7Glj5H
z6{HN9MsW-7GqqP=I?YcF-2dt7b<cBU>4xt0+O^=pJxoMaJp?9_^2Q7e1z1A67MJWE
zPO01if8rQTUSJ0^F`ygYY_Ez+7yLa}UxzaQ*#|Zl;YC^_L_{dFfS7Chr5pnzr~3wW
zm7}X`!I!^E%xzq5KTd%Tg)E?$AlEM7Q6Y+vC}|qk$1f;DM^KO<m(zD23*H{a4)(ZT
zDdbw_0RJT@y+U^y7)iE5H`Z&uBJtDB89Snc7Dd3RjU?ymoRdq7_>Sm(IynQwvRem@
zfnZ|SC1+Dfhor@I^pxOS!Kh;huKvc;a4Ghk=TeZ8%f&3PsklS0*|)HmEBN9<0uJp=
zLJV&{3#R`>UN!lb9sor)SNY!H*Ob^)O)%M0!2w7F<eWLEGSX~QB21r6wWxT;1aiHp
zlmX>_>GeD?2lZ%s?o};;L(8*MVYU*A+K%|j<o3SZ5r<iiy+qfVxHE@rWku?H-`+gr
z2#1l7WwfZF3y|VR_81t51~g+lYaE-JbN-a|nC#w@_qrg{J;bm9C`Zseq2J}<;#K|K
z?cAO#w!vkzwEMWA0c09Ff4c}aFK_?p*xs&dc!8FdS=WAeTGb!=r?SKQF@yOIPP5&D
zp<F}LCIh=(96Jk=#Mi+nF5NsYLRibj?jB=}<(@3&fA4nh=6b60&PRyQtE7W&LvKQr
zpO9s6aE-w&Vb(#`?AZM)M<&2XXk1b3V_OyoKj_LR?nr;B9kKrdr@^(bd*C_C0eShb
zF7A8BuKBvoRj^u4TLhk`HQ6&32$gLqbi3KsTb`+ZM6aai?RbJSyaRA4#d=<1M_hf8
z$)u;5Ze(lp$6U9quntO1yl|%>Xh)jEAVg}im;^N`&~mR4e{dT90FhJZD%||VOSdO3
zQes=^Az>0FCGak}+~owZ2A5Z1q=FGnFWjkp!$)|R2*mK6yMXFaz+FJb<P8qnb|~R3
z#DQk{afCYLCOq*W%Q*CYDTTOQ_ssEseLAWu=mC4NlP|wJbHw#-V-p;zO`fw-0(s=^
zB~kICuPI7jvloU-pUo+}#GhBf_>KDf?n>B1(btB?hLswkK?MdnW&zR{rOIw@7PpQV
zc)eOzx_rr_y1vwF!hc_6!Xq`@FnuKaehgTs(kIfhFzW?%qk^2A9ZL)<b7No=CKXkV
z(O>#QGx)-nt<E{VF=pLak~113ezVJ^?tZ8OB~U9UVHUe~QgX#StL)8>Qv;>h*Zakp
z<h)sxc9aunjxD<Sl*xIA_lqYO_3!@iZx1kD458D~)f1xk`V@@My%JtVk^nwpcq|GP
zME>iQY|!6OzZf)ue>?03;OJwcq`}#0YrDvi>c^o<Z!(iqmwyiEbU1$&+o7H>a*+gZ
z`mVio<blYa!Iv3?0^@zpRFxFopzogGV?HIj>y~h9CGeblTym}Ykuw`iiY$Zg`6~ey
z{)6svt^PZ_@B{m?o`~=xK1n43A*gQ0H!k5z!e<U;S7fd}b6Ru&ly;t}uH6%+aDIpH
zu8-uD9KQVVO1#JfLj(Avh>fM)MJ+^_CIFrqEKmn3VlXDP*69Fn&=x-e$I%;Iw)}s@
zK$Z%jUI=8V*}!Ld<{??m&!L`Ewk#Cgf;r$U`i`Qb*)Z9d-)OFQ-l1|^-%~0Kz;24D
zwKx82i+quZS#ot7Cn(T25E*<;{T*PwX0{y{3VjQq;#EM0Sp+sD8U}8JdG_p?oR5#s
zm|p10%G_7`q1J{C_z?r=(!-QWKkli-dlnHiXyMY6p`9^+X2`GwPGPOw`$msykeyjL
zoJ54us(sJ%bWgkzuE8E3?7(s)CJ)e%X7I)HsJ6N6>Z+e1pz>-@AT>MHA@qlXTJ|8F
zgWW<OIFvEa7xfxRMXbR>jnZ1sJ-WQhJTPP06m~rBD;J=n$^}42)1>jbJvLO6owlNZ
zAcyKC8ki1e+|znQaMYV!E^LyXp1QE!b4(J#s3So1S&VqR7Un;{WiDGQ3>8xGFZfXh
zf|PAq2fjtB;530N^LvuIR4SV<E1L3J%ReIglq9W!>3e<fLRWXh9b3z@twML~c2?ty
z@}0tJFo1hBkfcCeBZx%!^}WZMkHezLP+A9WkDcCm5qSsx08@csgRI9LJw^*KXbl+D
z)N1DiBG^qd#_#l0T19jI$rzaW?clKzL96XWaznD}=v~j6smXZ)B>bk#Kt8MkhYK%=
zqd;8K1`oqDv+GQ*xV6llza*;qEkE$Ty9|SNSz1)^5iP$W+Z<5cplM|L<*gP}+SpNu
zI`v)Ql_AFD$U5Q}g|;=1?#zp{0lhnv%m&aIC*wuY3s!)xNrlG5&sMr$9lT~Q^{zrc
zF3;B7oGSGj^WK;z84!7EQ`>0hCvD`e*!?d&Fq6<wpd4cvoH1;WXGkxsoAP9PJ>mSw
zCEV{T2LM%lC>W(2z=RL;pAAL_JmMT3#ubrV_*uU0p&-&7P}SP_ct>xD;WZrR#4ZaI
zeRaB&BL$qwr!lndbO~hG>)dzuY;j;15l-_|f!^Wnn?|Ox`<JBt06h6v*$na%l?R`0
zmu9d3RydShtRHZQ3wC^+<mlXy8NFD<j{G3m^k5ea?s0!6hJX+q|NQ027izvd8Dfun
ziTB>|fT<e>e~A$^E(Pi{%Woq?kUz8=sfw2f^Yl$$@S}?R0TlN>b-vR^<3itE_)NC1
z)ZY3|Iiu(v{@sQ>yxwqUcwX!Fp`#9TI8Aco_ZLVw5G8~V*ItN;xB;Y+SjsuZ2zvBX
z$b9<|I*$w>LdJ%<vXbx8S&~Y1U%*W=tslmzj9|iT4(8U5x$WUlAOg-}fMUR8%l>Fm
zeO&vN%$g%h+<8}5jd=l+diibZm7els(3dVM5MoaB6RLzYE4PSf@ZCn;4?@BWfP_v4
zpYjPvz~=Due({p*=x(QSm*Cu$J+>FRkQE#K($pxKRsn^5;n$389To53{z1HJT3}<;
z2A2YUo<-6VP9x%JjJ6<G$K6a!Io0nR*ggS{C0YnZ%P9fm09=qFd5~2D+$;;}4BhHI
zUnH=&YPKl$Mbochr1{My9I{wU`{e&{Q>j#mYp~S%q5-ovjcnZq?@v0kcUH{o8uV*2
zU_m1~XMn%0Ln*7K1Ex$~3RavOO{<X$6uF>$f^*jg*CILi{Ap9wh~TtIa{rAb+^wdL
z?5{x2mvqB6_r&)B-3?)N5_j=de`F5KT0XCkZpNn#arZ$i#kMf<DEiJ@t!l&qRPFYo
z4u^nY(#E96`7=t3KF3}&)n=gYn1np%?h4gQkYY7hE2SlzoX?ny#U=oj&&Go4dmMHl
z#$*HE%hQHL!)$-BgJg!&xW4*+E?BDtO=O)B@v`X$lwkzT26GJD*XcDRB~Esi_V|9?
zSvzq1!+6W&mT;n%Jb7%6e6-Fpv)grSfVi`tQVD-?O`rXIt!V<N=@GmiErp}ZyS5@s
z9}v^j5H?MO$kEa6WmE&y6x8p%rHExlX}R+IX~`EPF7Cb!=T*s?$Fzn{VXL!5%ona3
z*|x*AG)Z&Ul5Ps@Ay6{IjV{#VC=hz6P~+(-tU;}28oK=ghyZG^Bl;j!IHG@CcB~S3
zlUs@=Lng(T93Cs(>q#?1MIzl53cI0UVE&HK<SB%JwcZ|odzmz&C3~%lc4!Ys*;K^Q
z*Mif_Fu+F$KmDITfSpSP#q~Jm*$0Z!TL%?<3vOw|xPw4TBmR&(c^H<=+A2ZaMDgZ4
z?GAPX22}l6Ej!H2%B$;!3I~=bc$_TBh3ecNT!D;q#u0IwU0tL?povCsRA*sVxnEWF
z|9)TW)L`7#+V*(ImZPQNGzD>-A{x3M-Z0Zbs!#MnOlJF@z(k=JP8zor&rlohpBzzC
zH5`(A$E_eX=@KEH%Z$A`JP7WR$SLFeC%i$jxxi4QH@j5bMO>z9d|~u#bxhnBxwbJE
z%}zoH6Z|!RyjnyCpu>^ie@In$-+UxQ`uPO}=i{RoymcquM6eCBQ3YVI;_nt(=j6XI
z2Q-<%K}s$Vq~z)?c6UWa4KxPzK_QwG#!ukzSl$83-Cz)008$1n0Qn#S>P5wVZkLpR
z9r^w)hPZ8XSfuFV{P49Z^OnmjIDE-v#}bCAA#1U~gp|czy%AsPsawkY-o?JJv6_eq
zBrU0+q~)HAs}hS$Z1vM@%4T@<q5T&%*!Js!JDddhs#6EL>cS8Kg<(%Z7zh_|Joz~y
zr1^#F$sbx{iu&{C5ZjuV=77#o*H`4LHH|ckS_^-TsFV9202rnUMm+XQ%+-wqksEN&
zmhl+DHqi4U-9&VhLEPW2BOt3w$ieb#PK>;{Ddx6h`^J&&13sa;E%z!?u-oKWJb!^@
z=CG%KcUYmI29C(p=zSohzXJ?xcVLfW`~pFSh3y63e`Hwt6hVeRAAW@X0g@Xr1A&s?
zK+0U?vbA<$^dM-9o8VIjX0wjcc$mAb7Dzpk8b&>obq&_ht3fbZfmk{tntgB&juFzn
z%~&aJ=Vu?tsf>d+XwGlTzws%su~2znAVWVkB#_eu+V~b!R(=&9C1kjA-@&#`vz%ur
z%%g`5TWAZi8`{XD%)7wL_TnT}_pp^!6y$qNX?n9$`JhKdw1t3n?%{+Kg35qGI@-BT
z)|blKCL;7PVck?H^flLfK!p&{u*Ou(VNxZ709`3Mb@#>IU4w0>bL6^8uME+cEj5N1
zY=dFKZ@6#{#&&o<O5s_XKNEnpHwLT+HF?0UlS7jYcW6w676$lZ$++>vR})>pp{>ib
zP;zm7S9B{#sSK8a^UktR8}X4#aPhqaDto@V@z=YeFT!jdLDJUK7GcY+0Y6mITbcan
zO`h(6+B+ns854hT<_#{4VgwfkzruS9Y)Xb-;^i(@z^K#YZY1(ke@GW4h2_!#sr_hb
zdW$fCpEi)OD9y%!Uc&uAZcrVeQ9QtmL6t1mEYUIzrOVTcsZ1@LoZH2Ba9}3gXsWI^
zj$T7;LEct*=y^@sPup3i;f``uMjn%E2`(@I-{$gdI}}Iy120~|0R<vqDsF@Scwu3;
z*i;A3gr@P0o|%v!LW3&zwD$5$pUDuowKox@eMFkEM>}#)5V9JG$q7b=T}~ng;fU-8
zTbXF(-2auyKmdBn3_Ehel)!r8?({y}R{44|y#J8YYaj|0r4V`morZseJ4#Dugy*(?
zqS--X?jiuOPT54`l$k_0t*fQNhY#;OLX;y>HTUOjF<Bb^-fs_6p)Ekz3B_c>jjd_h
zXvG!=dpu=EUEU7l1dRYG*x=zr8PgAbT1k1gp6)?@RuupN#-VB<C%7CRGO(blX7TwB
zHq|NlVz9Zow>as{h%vbV?yii-37c=H`i#Lc=_z)}nv^|-77W#v3KDXfPN26@VADl*
zpJhbcK`^_0EAAK?h{z2u1zOI5d?6C#N3p{pBG@sQx_%4M2tSONG|DO?uY}v0^OM}J
z7yX+$Van>V&I~Zfx1j{*818XXZ(1GGOaD7eJ7XYkz)L{P0bqvOfTGFc+*1T8)t!I*
z4>mU92av1E1b0HH1dAM^qC7=#3ahk<GfQ+j9hdnlAyrg`N>xkrPd}`Z=E~lA!^pYA
zaVjTbifmSZ&mXQg%~K(AeMxhzbW5kr1FtuK-f>OvZ9ooC8&EKE1P0e8FZzCipo8D|
z6RL4jW+B&X2hE!|K+*-^U=F~+Naqr~lKqph3<SIfN$i8fhln3!967gVd5!sz4kBaZ
zpB4dHy})0tM3|Xd$9LGO-OmNAe*_}Y&!xvh6NuafyPMHeyX%KWMMjC;OeTvu$4jrx
z>-sBtr%<T=l&Bi_MB9p!Nr;#tFN^PS27iN%vBIHkkpq=Ny_TDGM?gLXYPtTU)p(=j
z0TupYg56-)^r$Ey*$ZfJ7K!SnInXJ&J9Q3{=N%?BlWcVm%6@MgP2j<9r7RLM7RX*W
zA~V2NhLIA6fa6PPca&})W&1$5Ollj|tKwifuBeAtkfeA4YK5O+e%cQi#_#X2-}efP
z^Bsmy)x?`dXQ?sFfC}-dN}pak{S#B6|Lse7FCylJe=?J0hHeC=uD|4nW)Dr?J3Wr2
z0^aFDXRu9UHl&5f!JrRxfHRC>i}e$ZHtj%jgE-$F*a1<t2q31xqj~4k)5tPn(Ai)9
zylLv!ukKD$@^?Jti!>$6$cUzNYZ=gTMY)>7&RN5$!1s2bac<cH`B$rgeA7Q+f|1yx
zXP2ee%3!>lW#aiN)&?KPB)C!59e1QNaAT>3$>BWFx*0bwcdJ*PEx@gvum(1fN*k?i
zgyMRU7Ca-25734qffHAGdNS2$N8LzHw4rw>K?M5+smuND(C9inHp#A-&FCh5sh+5|
z_({;8QwL{=IBM$cZh)ahjXnILlb)U>SV?OZ+<X4K9-K#WILp_Htg0+LTK!`jN+Ufd
z=GF)o43R<mnJlwk<LJvPq1D|#?C;sj4~>F9`&~t1v8|taqUI>SE>-?A(;@{q>OMbI
zq@tUv_vFt?LmIQlh_&Q9A4Hgw%;_MtH-cf(BR>0DO<lf?qa(ippbG5@oTMH{htyb@
zx(QT^mL)<bkc^F`j-L4PTT@JVeN59!?t)!!jPsSdP}cezTfztq%E;BKM;+LfF25T_
z9v(WNH?Jo+4Rqu!YUt|n;&AtT7|ZOqer}7;Hl}efXbEv>nwy#BZJIesWNxx_4i3%~
zl0V-ygdtE|9G#4Lil#BneClczfnZ}xB<`;CY)NvyrS~f(o5rXm9j^z6(7;us#p5eM
zNv@D+Xlj}|Idv3#RF5in^QPMM3hQ3E8(RDZ!{_;_jt>3smkSemTizq~QJ1QE>9<u(
znwJVoG(9n4K~n<StKJPC{`87SO2b}h2BZ<&LEV7~d@=72;HPH$f?khdt9$mZDp@+W
z0U5z&1Ron8e_5o*$j1kIzA}oJzdP<oEk6FQ5<nM&xKm4u`+aFj3THaDbp6&S$-TN=
zu|XaqVP`Qa|1<XLrAzv-Rr4><R+(=2=h$t~Qf4Lp_vySkqd1^9fNoy`bgSHk!8Lhp
zs-yV{Y%ryXijQw~KhuiA@K{=Z|0ry#!>+U&LIIVPA)`BPp!lW$bZEJ{x=!&!?8omN
z{ekq_g(}P&oVu@wniohnNz->Lgim}?Cec#6k|aSZ3z^PA(BHXaNA7)<2;EG>_FhMO
zy2XYt0C#FtbMq4gMa5BOSmc*ac$C_U_J@;vdw6Bs#7q?xgD2=Yb_;AsbrSaDMyUCR
zhbVQ1NI?*2oU3{@1Fmh78>Rq5KY_ZYekl_ZQKg9jt3hA%LjjZkAXA!0?)Fzj>&gs{
z(rbT43+ykQq---Tv`utsdOA5bSMc@K-lNb**y>=QPTJIN`Ae2eG{Ef*V~jm4<VX&<
z;4iZ-rVscUr#zDCHGSEv@ApJRpHw*m^nuqjIU48}mENe>&PGNd>PC!?n)Y;RqEI(=
zbze<izO<9@C8+-D$()=VHfLvNZ<lb~qk~!^9|#sSu+X=YzDeW*hJ?iuQK!n*L9C$|
zn|f<}GN?A_g8r#5m9%$)SJuu;z`sHMPAm4~AQcixg2?)PX@@^f0N64<bakn>o)i`q
z#yjde>jG1Qer1NEM@{eE?Or%T^VqKohkG1gP<|nce+2d9FGR9=vKRj3bN%P?I!LdH
zSIJG4xhOwPTe<`i;5IIPg+xR&$v3Y_sn<TFZMtop77oQbe)_;E>eUSV1rVzOmR^Nn
z?HQ7%&%gh-cc=EcK|k-I-P+x)k)D;cyz*mlFG_+|_LlT4Py=ukaeu^M<%NqE<-xJt
zJY#GRl{F*<j!fR*CK>SBH8o#s$aUu-Mps8z?%^DsCXg(C@^WP22Kig*jLGWm8_I#z
z0M}=Lp(YqodaeXC$`<5{uNxJ7(|Aova3H9>i8CuOD6OHGgPI~$du|KfGRtw~l$D+B
z?Cf-R{o2(PmQfKSe&czMciFqOH4jT0o5eidbv#7*sSFQSKkQbW?aRNuD0`Ld86+fA
z4@AoyKmuJrUtix*PiRct7s>NEW^E_tSmgoz3YtpdKqq|RX?aXk!l^syw?w$`dkk^6
zUgn!OQeZfOqHQCM+{px=R~D--wze(KE1(^j%F1J5?V{2Yqwb0H##MY7n97bgm6_R}
zxwhQyX_hGZ!y&CWIWAfwzMqe&$CC<pu!W#-;@aubU$Kp_mq8JAi8Ry>w8~#ZtIMEf
zb3i?|FWdH&J=fb)J3s`o_X`UPiA8$Qp(J{Z{V@^1wW2D}BY(aObEUjcc7deS<B>og
zbX()hOh!-E+vH>!aAD7-xwdC`Ssy(*F*kR#ypIWgXTUdhssSRbh9QoMmjZ1JzxAfu
zcx_k<%v!~HPDJeF%KM(X16QXDhg@p2P1l!MrVAY*w`N|Rjb42Tdu44mnOVaIUO&St
zcKI~^8v_1SZ{M#l9Y<F)Gg)9~B=60Rl2IE}W~6duVlZ->EiZ4JzVsZ;g2$s~-eEc;
zs3s5UO&}CyKVihe!a|=}6VnG;W}Z0U1(;0%MoUZE(cT{7eB;p(mQelDyQ728SqQG&
zw$>5Duaz0-bbfqP>$dA+;WzJ(uyAv=v}{^<^Jl{=RQW3a(~hpLAMVUEcsx)sAWp@;
z0KA$jaaiskuLH>H5~j@mmo`ucFKBd7d*Qi@&$gRfwq*i*m9oa^jw!5;KVAX%tmf*O
za}pA~K|w+Br5V}Tkqr&9ZR^=FSVe%hk2TzvI)0NjdQ3j|BFH+I!~C$6^|%L#6W@;;
zSJ|>)A(S~&HS@4%)15EfA(i_D88YZ=0`NQ8{-JUi-PClmozi7U2dL+}ckkZM)|l*n
z!58@j25>DeCujK2duiUcR<4?vbyEc*c*V}_8R`SYMBug^hAC;X^}JE3$~{b8bLIej
zpo}jr-7hbtO~hY`paE<)09|Vf*`MzCwfJQx@^7oCSgI6BV(hh<ec(m}b0>2vXS#;b
zr3kwqB65>G<c4kYwE5-nPUi^}HwJ_GEq+J>4+C(n&!8j2<D<=;ujggnpSX_J0&Q*7
zjla^HV!<qEH>fEL53~EYj4-I0KJ<RA+7|F|{=ko&uo^!<l{|5_PtaS=Y)${q^H#a&
zj=nx^Z9P2&*XcF21Nl0S34EebB2Jwd06p1Iq4(Qasvsh)?lIHMDvYJewtj72HE(ow
zKSe=>43Jz~U*9$EiMPsNN5{7kO3Hu5%z%V}f#HswUF-DErq7s7#alLRDCIPtEwF8;
zzbs))%$i9z2+2dl>#FL9hcX|sS6P|fHu(fMrZ&Qf6a!B}=3z#3@KGnI#}X3i8pyXl
zjICnaM*$?b0N~@tk4=<z&Ml89Z9q@_UI_vqv>W~BsZ<>joVEOEnkIp+KkhPt;7a4@
z=;&YKes@NDN=n4r*7NagLC8rGaDDw$G$pgB${Ml5LC~~8wT?#xo{a6>K@I345mCTa
zYyC6-6wE-Nudlm%Og=d&%~Q~O2dyB;<W^$)I-C}-$eTTdI=NwIu*KT35W#+JdgcBE
zBy!-Sb}A8Xbdj7Vr~1$PCbUMN2Uo`**DYLy5wO}JKjctCZSVgF`I}-RTQV{;!^g(P
zL=_^%_EZj-)MF%N2E^=Mfony9fby7>aH9hDjL3$svIb$jknAFq@Ydp`BhHbR{J04>
z)hi-wR&Xad=!87{x>y0Km<GNFIh;TNw%WbS7ZAhG2)DoU?{jm(w^~eJ6|y_Hm%0K%
z*G{XYtsOEsX{oKNyKre0?<Zmx%6v{rOu3nvZC>%b_v+OJ27lt!-{CKa-b^v&1!SC*
z|H)JmkoD#Y(+xKCIp_1nG1q(rGKo#DT+c(S8n0h=k<Hs!bBp=5!JWGH*ZYYKHIRWS
zOOirY!{DTn%E~LV)qN7^Q>0xyRZJ{eNwm}B9k>4E2d=;oRBR4b#KhfdTd-wiUm{`{
z^cSQrQXlSgBGTR2`DOp?UHueWR>Gh0&zZG{mzI|J%9yf?T|XV4bh7`cdtzPiLBX__
zJ8)Ww&@He5SVo@RtMdCg%4i)Dty5)8C%Y9n!Ygjpo8#x>f#z!(04-U&qq@?rE=_Cl
zl=#k2N4u`$S|07Lq{@-xTkLmmB}QqjCG*gklGxVqg~i3iuwWsk;9IGkO|158&^Ted
zIkT4Ei;9ZQFvuj3!V1W88Yl~AugsK|meNhSfF5x05{3;poBoE?g3u1PCvf-)D`p9J
z*0(e<sK^4&*6yz81c?R~r|Y&fIy(CO3Co-kwSoQ#CD4TVAx3S;?jpsb+SoS@cuF<F
z21>FU?1Zh(9vc|r;ZrFEsbQmFr3_VSE&bGXe@))MbDygLI}#jWu#DjKCPi=@Zf6?w
z0mKi3sPf|Co3nS<iLM*H+?^hd=+b8s&%S)+in;Q_@89R^6<ty@n(l-S@fDIaddl&x
z1M5<i4le}c{mu}~M2}8Ebn#a)jo?-(FFn9YV-^3H+r)#>M6Up1FRZsP3+_%z48zd|
zI%6jS-eEn;4VVreEDg{CeMP&^(ZR6di!GUz_Z=NWva+*#?3I^G^!Ph#Yp*VEN*1uc
zYDPlz=FFKr^F72}_oB^N@D(`M5^7)t<RHz`4;p<TA=n~;Yi*^@gA<f{TiU$A#`;w(
zPKms7TH5Ah2=U$%gbh_xi`kioK}>&(bGyielE$%a2T=t;=zH%Sq1Wb*!rBuYhu;2L
zF#9<-cg5$2BwB|Yk<-04E+PiakcI({EXwCtBZ1R+8Llcu{J1M!LLjbQ%BU#m9^cb^
zt13ot2=9iMCv-A3NS<x3oSYGQj%giPvDpAapgqXyUN)FKev%seb!Z6ZoM<Lv6a<>R
z7#L5`;<tB|43WcntEX_^kQNV+v6`70*f_P!=I;{sSl@>4+n>6e(d*CV%x;6{jt<FV
zJ-!dRoWCg$BomSAoOYJ;A*6&<Xhg28uLzLdn?Oz!*9uxdBQFfja|+08^y?b*-rCt5
z0$>6H0+!-&46J`}I8+JndzsDm_y;~EZFKo{s$2h6JDEltBKxj*++a4d*Pv6e0wpD7
z-+KAfO6O>05c{?gFkb}`A7k^f6kY}{lOl4wVZXq!uszOsBI-y+-{<J5fB*H~>G}Lw
zakJ@t8y5|(T3B%QxPO1pdYsx|_HL=C*Erq7mAHZ8Pt$Y}%isVmG*lQb*hp4tCP6&T
z0;wcyd{+~5RM}e7fzCC!PE#f=Sh*OX_R)`uo92U8bM5-<;e!vmrkB3>s83d!=W9RV
zNCo)B6fA3p_*8v9fUxFOUNCs&w*^!D2IkEHIeo^)boY<;p*-ilmscD=Kff=2J==RV
zO06=^z0o=O<Lj#*caN;+{MKu`n9^za#2FL&WFb8&b(dnd0L5OE6e{AkR)|34*r9*z
zS1>pkJU%|Y<Njp<#_$feOWk~FDosRt^lV|!;*YdE|9IZY+e0LNkxKc#XrqUhmm<WS
zh1r#LfMMJEC>jQ&?#&%rkck2xpP`~M8bX`U?_&-8E~4&_dVBro`zYq4;r~1-B)t|T
zRD=B$qw9)r8M}-#wmr{y_*Qn0Zsn5P_VC;&;G?Q59S4OTFo8Rul)IAbeu@m2BY*mL
zJA1{BuNSX@vmQHpK-ZGiDLQse3iB}p&BS$`EGvnhvAH0h`$HXzlS^vnE*O}N9l_%x
z^qFNEu<oFbM)*&wJOipK_N-8PdksLJkoi00id_WdJjW2!{xulAMEYrdKUh47`L4#w
zdg4SUkTwP>JjOoRUXe;67_%?2kN{)n;oy4#UK~ETD_Q_5CD0Qu=*Dl!pc=_P$~YIs
z@7v0K^x*OD-MSgmVhz*N)-ej4XAGP%N-P%6W7eQa9ugY|W*|}DMF+_7zper^vWBib
zzC#P>k91_$%o8T4)YW@>dM3YpOSFhu+9z+qDn?)Dt%f9?%O35YkbR}wTI7`clt6R1
z697u*o!>YBtV9G_s_p-*G~0^w0-y?j7HUq;ZEeC^o{B0w$u)`w6dzV6ERP>ue_vM&
z;bxo?S7f{B_WG)n&<%&Qd^R_ty*E}v?CkA3d$JAh8EX?pY6h&~lkd2TM@#}yEFM%@
z705ZVqSRfz-kG<TWrA+~9da2JRb4*W(tE3P$eY}%!J3vQ{w}q0`G@q9d&w<==e8A)
zTR9<@xZBl1#2|^i%;VlY&G-yHg4(kH36pTh*wG_s7gb#7_b-@^ss}ZHKO5wiu{YP}
zOXxrM<G(#VQjDwPPjc)Wb`e($s%H;M|2mhdMMq!^a@d}P>6lUQGi>httce<?ZA^Q_
zKxHKPE@u{x)r2=yz%;$gN8^H~K1K@2T-`ShGC>O1yV`QDV@DpP56o6<rBVA_cXK@-
zeWwja;n$~rkcRCu_<rj&#vo>$13vfFzUU@|5O>>ut+4ff!k^I|OpsOd|F8&YFOe>=
zC(db!0HGB$H8o{w|C#nAgyQ!4GAq$Pjn3UDH?V)5-DNdXF=TZ;Np;Fayx{z~V}ONW
zCv#d;EK{@sQf#~Qp_y%2w7xe!o44}QB51oP_yXbSldiV=wNsq*$6W=hHUBa3zhh&2
ziUz2)Jj=<n-l@8HWoeMhsBU6H{Wyy?ew+=4-Y|LEJAY@t3&37OM5XYX`&wC9V6}Oe
zX6~=D$;&5gkc=cK0980IVjHw05x`iAlmF1WWLuzPd5N_rx_WS*D1D&A16}l6x0tJT
z^_|S$(vM7CLC*(KIVia^$vz7egd>DyjMUs*CGRQH_s|%S-ltnVL`1Z;rCj7GwsU#q
z%ur+K_YWS+zs|P(o=qu_%Mv>&W0B;~`L0v?RWZ@fYksML;s67SB-}-{q0TR*XXd8A
z*E*l8mrg!F9C~B;HMI@H&8Rxc(@dvX%c4YQFLc%{16On5M-%OM=+?$U+gNirZ)=Y`
zp|cBp9_F+8C$-pR@|FWlTfC&ub5=>RBaQnGb%O8$NlUWWnOt$jzkhHrHv08zN{WW*
z{ZYqf2lUIAwD|=ErY<K2#N(c|2jAs%xPRXUB*@z05gW;KCTj-xR8c?w{B(AuIB9ox
z_fx2`MpWQjdp8l5vAd_ovuNS8kI&nAjPy=a6#($el@X(`TT?`W$SH=?!NI}k?%lf&
zf(qWhw=gp^dr&I~;yJe6&{|j%$yH@*Z~qFMVVLkgT{e~S<nQGO#oHjUp`fg6PFW0v
zEjnDoAKy?L*bWV#N%+}5PZ42b)%{U8E!*JWM~eRA_&5$j1$ocxozS#9fgL)9oVyJ3
zFs0&xpx|wgmG^o$|4+8*9TGW$tF5h_;24!VavM`#E}5jOpyr0+Iyxo61hqd|yz&(&
z;|VhK{*!Eb`m6w~9hOO%!&8Q#!eZ0Ou$Wx%^_S3eX;6=Pc#H!1-qc|4+zImDb~ZNf
zqrnebrPvSdTUf#`7;yZ}e0;8Wi2Y%uR>Wbgjvqf99~UP=PEP)d)*LDoCJ@8k%p4=3
zJDwA&?e~W4-Q_ACeM2&X5tRQ<3#B^LH!Y`_vfEz_QB{%dbG12(-w_eiDhQ8B|I2z6
zbm9og%jfe7LMOKB*RR~Z{{Hi+si~@`T*O(Dj^no+M5MW8_c6vy>=6i;mQLi^C<H7q
zn3Ujo2DQdsppXAIkJt(a4E|JIUEN0;QR!mY41B(iyqEr2l`R#w(_>F}hv@a{FZ646
zDRUON!L$@6$&8=~c<bmqy<%71-`^hv(goQ6UN@Qm$(b!F1+norl|50QcNs`DbVl&<
z;mv=`C{8dgE-o_@lT#}*^^f$H7ZOR^_T-A~GXvNv4rDj-!S~L)DD(2G)E%GxR`C>^
zOqwM1tHD}ZTgyWI7^~nQ!15oz3umuvZR8g_jmmvx+#no*sR9mx)*)w;v%B&HNyMY7
z&CQB-Q{>fP%;l3O4faLV3DL0JugCI|dvM3;4B}#9n&ZED6QO5kZJpiR7)8cF1{2g>
z0+}MvKxoiiaPF|Eex{^KSE!psS3)`dl3@Rb_e>`>A`iFW6G?O+W1w>_==M%|1d^=;
zTbSS>8CN0?SJwhtVIYuunv{8z+e2*qaaOPK#WHb8$sv!@JfaevhOw~}F-ghb81>Xn
z!4iBEKnm%`+H`iS%q_=jqaUHVBCu(=Z$HR$^Fnfcf6?LTeH-xEzlm|LofJ|+_Jjk8
z$B!ScP98;Cya*)TQ8I`qvA!6eDZe82VBU*#?PQd?E-b?*E|`KwqZ{&7k-VLuD$IhJ
zOE>KsK|c~M?})T%JZY}ZXE$);3fR&Mz*}j(!{ET{-e&k{0?X;r__uD7Br}u?YN_vX
z0NqW_%)%0#nVBhlq{OeB-&7f^VPtRLHo?&8vh)<xMTEq}jtPm@LV{4hpk-)yv7{K>
zO&ik=^;bi;{;_Dhq2fKxe27^YPvmPLVI6F2%(goLw3|1+m^0~#&$B11#z95Np2}dq
zyrU12GM_lHQiIKn%<4&OYioN|TwHwcOqaDPK?|hRQvu99<-ubEI*bI7ol>?u;TZ?S
z%%l6raaPJB0{Egs7&wKd^W=HRKkR+8Bhv3(;*=UE{z=%Q$H*r<AMj*PT`v3;cT&S@
zeuR$m%i!Qs1A&Z})tSct?luS@18g>?eOZMy0Uj9*U3ULnm&Sz6RQ1QD)Hvg*D+own
z62^ECqWlg}_H*V`R@&dackf|PInb4q)YOOn0qM7V2`}DebvU@V(3P{nIg--lDASe_
z9UN_RwY1LV=jZ1>6k-P4Qz1vIxGe#DH8%d*Crid~5)L~9b)0Bf7gF(pa8~pnKF96=
z{^r^-58KCY#5*mcQqSRqa}GuxpmGYzOz*TF%k0-JNf=o+D=Vw4fP=YRtIODU(j)V#
z->_URb~9%k1A_}{YHEE~e*#*9xI1m)jgv{1tQ(G_b^%cb<y&)_?VlpDWfKGu(44-2
zI@riZNB^O`Kdgj#0%Wxvn$lC~P8$>LqYu-`ocw%~BS(%TMw(_FH;CgZW12;c`j&(S
zJjf7K)a?9>5`oHzNHW-)DJ%vU2VQ`q2chl}%SeAM(rnoWf{gz^^Ll!E$`+|~qLo<Y
z-{K`>8^n;#Bv0V%$q64jrhhNK`-O;&k7q)ClqAzrJvGg8`@6yeaB12NsVaJ7j<T4V
z{-oz;K=Tb>P6VAXhlnB3Qz`uJVgbA3gv)lVEi^PAeQ$q18S6}JY^*RZFE1axaqd1!
zSUf_`G}%TsfTEc|nYf@}h-Cd=MmU`TZl$C*#j2Pr4>EaZI{5FC8f0uKIo%T`JYWtr
zZM8+b;ZINnza1|S*WNqI3q+0k%(j2=P;Jsh91pvDNG+_EVBv<+G*=l##m&ebuY~Yb
zb!o7-f&PLq-at&Ty@1HrecSf)BTk^NwjKR<wDIB_3LrA(6DBcf4>=HQ=V0jGhh5Br
z%+<|C4Er8Dy_sOKs`>_3UoRshA|jH)Dx~|$7nY$DDX2(%C-W+19JFvBh9SD7e6ja>
zZu5P9lmgAw&t&ROm<#w9F?CjnFZT_}c8;A`-|SZ8t3?r(SOabCUlcXg`yanZtE#R>
z_x1HX{#g!tE?ylxZzbG!<IvMT&mvtdKuY~nTidpW0}(X>ny-({+!4=?Dd0~Puuh{5
z_9(^XTeV8^?D_MSu`#opQ~xJGn2|EGvc}BL&PtQl<BpLz2Hzj<opaZ2q%%Uj*e&OP
zsH3XC!nKtKkAGcAfD{xOF#TOLfL5Y|n3<hDHY9E9?jAiQck=XpE5{~Ctp8XFCmtlM
z@8oS}mhyr7u*5-hBFdGN<N0k4L3x7WSb@-~;2<xWAHVu{Aa!fK-Yq8o56IsoMj4`9
zSq(c)rRa?amDugQBAwxjlE5_s<<bd%9RkL**9r~0kr*p$sS5yyCAg*uRL;K73OjFu
z1Udwu3d@;`LIkWHo&$2|&b6O*M6i^jdMIC!F1*Y8PocPlN>og2(qGf{#K8Mc_cPSX
z0|vf)x$x-GBh|QDqS_}-cbvv|Ab_6^>{$X4YOoz}AWp>#<>Ti|gBm5pGbz^o$)kU#
z3CwIr0+>+qPcaz1NTTkDdeeaSct_qAT44Gq(q7~#={?PS_pu~vi0AE9f)E`B_Z3X5
zxC<z4G`-~VA<-huHCP-u1_+$M2X;4*m!hq-52mQ*Np0+GqP`>RIY>1BOHd*B6ZIcm
zG_)29KIK>#w%gN2S5Hq^NJwZKx*>!(4eI``e!TWxUPBYzUjdGM=ohGg&Osw3K;^s8
zL^3~Yzi<yTh+e+@6E)&U`D;Z}REve?o9n*SbWr#9^$8w2bf}#r{?#iXQ1Ar|H1Z-b
z&aQgH5fv3R5%&SmT>C3YqB-a$dFq=LmRT0@TU#?r?`FzZ7dmtyKr@#1m_mQed~I6e
zmecPcKKFy9M1kaV49E6i7J?NkMb1>q15x@<Dfum5PHCz2^2$omQDe}Q0KSg=8fBaB
z(oybPUiS)h(XMZF3AM8@>JQ@u-hW0T&%ZR$gHtg+0IWQjFvb=Am2u3l$An|!=Gwp=
zH>e@sA_Y7$%hHU%J1#rs^Bc*93l}~$H9fxP2TCTu+x)>2@ULyz1a>ONR6g-z<MjF8
z@61RiB!;)$GM#f-AE@i=kf3pg`U56ws-p7D>!pRZD=Sy(0pZV?0XOWF7O^0>|M$4M
z$u<#UKnF}g-*ja1ey@bMvI<m@fj9q~vdb&{Avo83aGypeEW>1KvEm_$BPe~@`0h(+
zkStG<%g9xnBO!^w-!+$k<W7~jz^f5DLd6&icG)hvGDg#nG}FI*HTtFl)C!9CDV%%w
z<p0r}+vwf{y`XSsW@W{5Nh)C9oB&10X6EKz4Gj%VR46JbEoapvc<MNl7+2EDA*IZ`
zF8+{gA6z*gAAm%`vM|`fN$hq&WwZf=`+C_C<Et4{3{u_H+016p1(Z)!fHEL*qv`j%
z4P8n`CMLBL9U&Dd7<uqdg_PUQsTDkETb)%AF2jHuP!BlJ=mu+A`Rfl5q*7H)okRm=
zj7J@Q;@?{Q$KtOiY=Vg!-#v@J<Zc|c@!S$L0TDc<8_-SlI@3X4_E$!cuCVLZubWw0
z^NLn0rJA_x@7wf6dcepyc@nhVo+-o7_F2qQiAqX}3=9m&ex){H0{?<>(aWTC=_Qya
z*k&VD_X4ju+KBgGp!wf>KY6=_Q+$wNqNk0&M<5NlyR1H8???zl<WTCsa`hk0&18{*
z3TBxds{1sr6@G-0(zCiQ-@L{ry(9%=)6vgC<@vxQ1=P)rz&F$6KN<whEJ47z(5$~U
zhN-t_U?^XPW-fd3P6{Q`-J3#z(Ybp<g0&X!jdVeqFYi87zS|!GS%`L08ylM_kVcq0
zTzu*6zs^)zrZ4O<29rJ&lN+pJoS`oCXyEJDiy+`_Cod{1vq?!wNql6E1nLxlY#-)9
zX}&7h)Q&L&@SWM@k<4VRr~w~>wkQkAw651afBMH)wc?=C)i?L{{_?4%1&5h)`RCyV
ztg*4NeBNrpuV6DhXYOlu`<F_3VEaT;6qS`<B_}6GNgV?pU^=Y=nqp*9r>q`+Av!CU
z1U&O@izNn%T+FnMjrBX&BpDDf6(ra;@!5m>kp|tcV;4<L>lKug0uFxP4|!B+kA0=F
z5)u-!T$%NS1er*9QjQrszP{N``kd@aCqV8$u!nHX^pgIK6%zU0vp~N^^j?Gdc;&`#
zd5Xvf{CJYD0=Qjs`B#!-cye-cZ%gB%KydNt+c#r1QZ4>{OlRU!5x&n&RD%unJRW9{
z(93)Gj!>e9J!iEftc8y8^m`ssGU5vhf2(eZfJ*_agL~{1UW8NF2WztFLnv|yuwPQN
zZ1)5gWHy880wo!nq&~=Ic{A+cT|zYs6YCD**>XSiwx=mpL%!?l>t^@vUGyl9jEMNO
zxahJte;D+iOd`0e)_yd-oH(N9DiZUAm^v*Eph|ycXb{V967BQ~kM<yQNRH^hR#S2!
zCU&p%fDDoPnS_Tg#2JrS0r%9*$?3c>V>aGdftCfCBMP|j%0hk?jR8Q!d!%&k%0SC_
z-4qlQ-g7oC0Be#{m0h{XG$UD!W1~L6rs4^xTwo|;&hqIHG_zT)Av6edoK#KMWD(z-
zw}a))WD}k*`1z)+fn_Xz_`Krwzf71qsdCyPjWxg0@cB}Nv_N5D;nS>d)SU>KMsDCb
zT9W;6zV%mL%AvsUVI}nqh|tE<%E!$`hSa=7a>K9R1AZMEx(&r^C&Pf>4j}c>&!g8|
zwcAx*y?%XBeD%hDU`Kn9<9#vX<KgE)zC;NUaWiLUA*P3Oq3!C21Ch62hLzqTAblX#
zWBvd;F6!osJOzl#S;ABh(k&Z}N9z}m;S%mSUM{<{QHb`{aARJf%#4hvrlzK9vl^}a
z#{C=(lqdqpRzAMm>?@%Kow3o(%*;`7ad8tQ9i9qOmcS(vmPdjr*{Nh+)XQ+I?ln_O
zDiF$Rd^uE3QO;9hcHG@|p3pi~3z~hz^$b&XPCnr0S)%!TFQKzj%{~=CQcF$EgL{ky
z`_nt<Uy$`U9+$u{z{$z!F@j4^Pw!P_Jc6!-Kk-YZ4>JHkpGO-=Xe5Y%$Pi;1oicXz
zm^^U5qQO=b66;sUvZo^KwO^pNNas&T89Zu)crFHrKf1vPE}_I*2mFr?YEjUF2(Y>O
zh;vgTBrpUigLrdJ1D!}Oh||UxKXVNiF&<mHoIV#W7)*N#58zfLdA^nr63v+8O^~O>
zwFahxHboPFCKvAF8U(a7>?DL`eO?r7&3$$&!|&Yz+*~v*LmU4OlA4jFiNC}M`}a>x
z@q{}`-ypn7SVL75+*ny*dhQD-*??@`q|cK|YVNZRPEN)kSNl+N=>zBBqzgVZn`ThO
zpyApw8fob5SY8K|z_$w8?6_$EpWz-uAHMQoZU62W1KQI+bYj9u0Vy6r>vS8<+iiq}
z_UoX8{OY5mtlTCU>2vPlMRRrZZrDIz8m*|f_<3DjU4QXHU`*60UIrlPVKN80{8F(h
z=1jKKAEeX!ew#hdU*A~h`~JC{Cui9_P`Y+O9ENzO3Dm)}$IHG6RU^UsUGnUcf&!5w
z-M*A9=IiY}JevnlR~ELSBlR~oR#D-)soCavIxDC$O_BQBr5b&jsN1Y&FD>a`^DYU7
zS2WmUFJ5i)*&O#dIJq_Mv)MRU;k91lfGTcST&np*epwY|_~>tOhjFeg-+QN12eX|#
zMP^oz;a-ZSp2?^vIYYI6gXFHB+df%~tR@3I{#Lr-1K8V@hcGkNJOjL$v+8Rx9m_n)
z6-U;clUKCl2D*Lz_V|dD44S0*AF-nxC}^HV$>GOZQReYdwDb(Wg`dvzY_hF2kC*8H
z=AOn<Cgy8@mr!A*`E)9eCiqXv8gDrCF_y+c6xXYva?c*nHy3AE9e@4A6>s5}FJFeU
z+><x;<On59K0S@YY6ja0&aSTZmfio;!M)1ViCOdU{oB3JpT2SB+%wy0_w?24sO5qu
z#`h}Xt^Z;xq24AosIlpE*L+XGf#iX6x~Q!)mW?jG5*w%`SGp`fRps<-oh^?Ohq0F9
z>6o~Qur=`+7B#Pt&detfa)u^_n&Q6ehFeR9QW0C5b6XcK+J7lKr-vHAMpYO@xmR;x
zrmW=#uwmQONy#hkXcP;tNO@N-m!5sbHv87j<L2cjw$p#&>M_eCeTDJ&6elmDw^pBT
zodbqq{Aks03s+YhfNCv+KkI7vkMRz4=NIXrDh=NfhMFZ$>FNn9)I75kZp%BMQEvFC
z57XbMgeNp$UHu|z1P3vn-$iU01Y*aBFqeKd6fW6dJC^@;zxG}`BVLF3JM`5X6yw_#
zjt*#0Dm{+Gto>y-^F$@S3bz9boz5xBL~UMCG5dQSG_7|*_eK2eY5(k*#!|GYixbMQ
zGJk$Ty)8Q$b9Z^Q!)Huq^a!0qig^~wE2Nw5Q8}$X3L+L<tL@9FT%Y89`{x<Jrr7G5
z6meyZ^xC^Ng?YyR?RN4m%<Z!;NDuSL!gxt7oetkRWW22Vu{qC{kJsYFm2g`uEFB`Z
z9Z<Vj^54(RT~+P__eMfNZvDZTC6Vyi@Gs2ii{XHx&z(?Ply4U$C6c#^o^F%fTX@9W
zGrVK#z%Bz+3{j3t_CD*c+MCRBXJ-eB$}y2l70q7-dJE$-(HQT_8<w89uRWlNa6w?}
zw}9-5;B3pQi(^3Es-^nuDQGB!k$@F`g_;Lkv+UpU6ahB4_6~IO=&x%W^#ONI9Ds1c
zAvr?-^eoX-O83@ELT9FxdA3iZ%jXKe1}rA~j8}*f5Qy0sNXO=)G?rv^UVl|zW6CdQ
zuVU(FH@q*Ij8`B6Kl=<sYzI6XKdR0|19>soJi*<aA9Pg{M-TuJ{Hvw|9))~qRwpEO
zJ}5F%G1c)5^NiLCluN1~KHn9idt3wELP0!R#+3zfE%}zzaMAp<scas~tbAKZU0xgA
zwzHUxAX`wWG4C`U@GuMcn>>#xe4aZyRC;f$KIo_qMQh=bz!SMGqXDZ=$?}n(uKex1
zB2zk5Iyc_-y1X{ucIo%w4fcU<^knR*Zr6dBzdmnl!*rH=i`noQwndP?nXMgGF7iD>
zXL^w$xza=zCE>}OAueEmYyFZ#sgd4;S`tY<fCQ2a<m<9-(ng1}@6sp9<!rpT@9uWF
ziFFhRbk@Va_1@D)c5iYq{YUQ%cyQ{EJ`V$%(8Kl{SUv$b@S<a72Ct7+y<T366CuTp
z-y8Z4wfu_Y5l`2_W)nmcNXg=t8_5I}1(L7n@jUk{K)vJZnK%zKHIqt_mubuKU*VXg
zPbm$B;Fq7?>I2=qUVm(wF5h1@+FbqqeCGCCMRP?;o<JIjG8kx<ynoGOyp_dy?n}Az
zoLJ985C$yxY_0eJKd?t6Fnwx^cv-iNR&!|!DfcyBZE8AUfY<gb?wuhfLh`5N@Ckra
zMxZ>KaUemkIokIw11@iUvoe1i(|;y+Hfq_-VC2e7lty6R#dOS<0|Ysex~H(Nk-MVo
ztx~W6P8gQ1#*fNxxw8~zj!R<P>L@WNZi84^NITvMMBOq3sN>U?XDd0UT7RlA6MA-V
zpgV{Yb*a`KhT@J_Gyxgrje*L)y62+Afsq3TX4+(3Hp215Y_^A)+lvCkW<YJ$7viNT
z_p67QD$a1GNQ1-OTO82eQ++AW)*2N$o?2VD^y&M^!$V_Z{~uv*0uJT={*OnbMxhYt
zh*lce%2Eo0v{*;xF~Zo&PLzEajFJ**IU&MGwr3doWF3@Lmh5{{M`S0Aefhr!l|I+^
z`v0zTovw3+=6Rm?bHDHReZO9>`@Yi+t+bg|8Xe6_muI>H<J&35f~ntkfbR*(&UYK_
z?BI+o1&5U7O3&(|-=~A^6geBUk}^sjSDfp2vm1ueqbuR^pT=kgt3AtaC+W3#X!^K?
zee#w31^(16yK<oUI8nU3p)ORw)`gKz%CH(vuPSvaNhtt1fy*}Ml;!c&l?>1N<t*VI
z_+*Pq&~nGijQKolZ7*yTRI-wnJDnHh8XJcodp@2FBb|h_@6vyvukE!10(_(QGHHCe
zg|e+$G04vI?Go4KZy3u$!gpcVmJRGQOE))}(>Z1tey&7#b_-s<RPH8yjT2yvmI$*_
zlR-OfyQTl6;9LAN3)s5B;deCbyHojk@gBZ>&~sb(?TURv+te@_zPNTtJI|nww)W+@
z8r)j}0Rby^@z3lz89bJHlRFj+_SB#Bf|8<ghjRc<YXKaisB`JuzjvK?oeicMk2ILp
z<z{7&X^N3Vd>U+|J8TD4J7D{+(hop-Z;BV3D(f&hI<+j$Z^cFoSIG6EKgX)>WdON+
z$KUL;poB65F6t&AVo$#Zqp4Gfc23GW|HOabzY>{dW@bWeWNBh?`UVCk3zH8@h!GMJ
z4g>m}TYj<qsc?eO2miI;2)s0UV?Z0_jUFSYo5053)$(rrE865htM14D*pUaSuudr|
z3h;%rZ35p>rXLvP<~4-k-^oD6kO$NP1_6W^5(gID0T4SomXGC|T8BG{bU;;L8*s>L
zVJZ?_DdCBw!p429e`rg%eS0e)XE<MoK64B>zxlDs>Y2@Fdlt{WoEQQb+p6wTXqi4h
z<``dU4V92)C4NCDe?!o@^d4x{dZ!<3F6Mf`WDZ*N6uP9UB2OUc$=OCqL*v|tszIc<
zPW&T6-<E9;Q8u-+s|F07YHhGcz<Ei@jiS`U0LYiy1JnU)f4$6;9=ghV{FRRaj22)h
z3sg?qe@^V&@e_oUzc2Qd8(ptWC_NNP66R_!Z`WZ31YLA(ZS4T)MNzjOFZ&ByE(0wL
zG9R|Z6|7~Gxu6$~ojUg1gFnq5{84Y2&BYbfT9WRT?$$r|J4*nhlJG$C1gwR6;BaRd
zuo5?30IK(Lj)It|=<~tB!I6Wr8+RkI4cz)QlvVip|AQXZ^1qg3?GsI|_U>+J5DI-!
zjgE|zAdyI4%se)A;bLIAdl<y`jjVK<&vlKH2RZVZ2}%O=F2*!<Jat3H&cPc7Qk|dq
zr?B+<B!mN^%VB=M|GUks8G#Z0@@iZzK1p2)_Tv2YUf1%T3nE1P44s??q@FzJAO@02
z{lg3;bwK2o;3akTtR0a3zr1Vliy2L!H`JjeX{_HXfe0@Bcdq1*GH1++u*JAWgG{9&
z{NdOpu<Q{P^%xx&9{#kh(d35%E&$9G&&eyW(K^hq-S(pLIy<(7Q3Wt8a!i<G>+Cy<
z-k|N$y}!1Hpfn*ShCc!H!x+pC0c-caaNk|QUyyIIh6f#XutRcqKe1@VYf);}5oB=m
z<buTi;&3gfZlfo|1K`l^3;p{Y?Ws?^M3Wb4KE3_G-=H?kBg|(UGioep7Vq81#K)Mr
zk(+mZ|NiPKNJ!;=KKX@?CIFg6PR_1>-G<9dz(rSIex(l)`JIAW`}-r$3=%z3bQ+Ew
zsn{&h!HA%blqH|36D}^yMBU5iY$<E56wWLuaRA6(f)^;n>GEE^xT^-h#%ni@z7O7p
z8t?Npc5@5kJCOeGoiexHe65t%WuHDhZ0OsE*M#i<4<!sn7yzYo*#PT!>Yk&!fLt5U
zgORnhnh7F76}g-7%`$rXmWP$k3)Zjg1YGX$8MXtzHzT+w)Eh=QUQk@H+bCee&HeLm
zvs?g0EJlq$d$P|Q&xJ*fflSCk`(_yG8WV;9J=4FoAIpCKnfdAUyRQOPE$T?G#-=Zu
zFkmS1B=#Nt>tdSB=IkNPTQZYG9^LrEpGs+=uovs0J?7EmaN@En1PG>j4B-&>ecE$<
z@TM?_ZwwU?`qqk{{w8ng`M?fNzuIy_c$0?-<w0}rhjM;O^Di0VaJ2uS`OpMZgWA)m
zz9(-;r%rL##9S6cJ2EgAaZfz7In`ZvC!qWHjwOQ^^=;wg25OiFj3WKSxpjNraGdvd
z&=)>5G}JWXY|NRa!5WsJYn#bv4ql_L0|OuI9UQo$wqVtSE8dmeX9d)76#ZR|XG^9x
z4Z4(8yP0pZ_{G5T(t&e-r;v5aMC}8QXEDwD7wk23=$8VZ`>KJ#f45#K9o_cFPEn>#
zgx=m>V-JX-q@AAk1H|SUi`8i+zJusoHOaWA7t-AJGSW{uVkLMYyW(2|YlImfutBci
z-kp7Y!%peOntR#Q+q-MvYg`841frfj<L(hG{<UY;e(fj|M)S%u>@|{_tsY>FEN|Q(
zR~YT%Cb%%KdqIbnXX_g$v!6#r1@C)dwy~XvM6j>{raRXmCV)vW>66fZnnKXmRziz`
z|DT@r_Ub+K*td4F$1;5!L)LQW_g6zHjH-^Nc{Be&US()Y`m)2Htlym|h7Urv5L
zuk?wn8|H-qTI#fS#k}iXehF$|L+HKvaDLO)Mwx~%ZUCe0w?U=SDS3JR|J?)ms2XVZ
zLb93%9WLwwM8#6ARdVh4-te^v1g4ST8G=%)bJxQI`k+eJvI#J0<d5wiIh@&Da(>W^
zSk*-LKUc3_wtPOY*=mmihCwj3FKV5CJ1%+%uWFjY2pbi*EZ^AQ1^j!>$cX*O*PV2F
zh5og>!6gqr;$>P3SO_q9dwQZ((|<kIzrO@3r`3_oO#icrOfJ$)IPQa#<1Wb){NS+p
z#9CpDJF?%-)3bxV$=9`f;Ohuaz=hNqPi~yypuWJA|9t4p%@-nyF|O+(3_;KZXyEvA
zk3WMMz^g-SuNVundivt|b4gH>xF-D&6ha^2AdlxSkkvN;RDv!2&Gdf2tbemGfJgE;
zc((q9CD$^!+*iffHnbfR5~}?_)II@p<_ytwoUVn?anjoP5LLuvPW@qd2oxe(`uZw(
zfB4nh;$Lul88C+FtiLc`5M2xtZ-x9?+qDJmrBkLd(b3W6H-78we(y7Qx3E{La||X)
z?J<Zl{ryb@XNqpfa5L+3U;h=r{0(3d2;lM9Dk?8+vI#--RziEQwj7#ltNqLCth-L}
z4JGDFp;y7APN6uke+~pO?6xjKHPr3v@$OoAXg0rg>wgO=|K3>}hLX4YUP0PR<T(Hy
zHz(D(tQ*X_)%?p0&Zyd%8Mk;<L4EAK2ZY^o>Vh+`G((9`Wq5daLK%C1-4-v1CqZ@_
zvMv-v9S3_VagKN2+ShFSQF(;J`|`WZr_b6Apw1AK-jEQ@wKX;WMoV5hTyM_6TuJMA
zU<0CEOEa^Bmgu{`AXcCQ)?-CzuWwuldvJ}ndo33>FPOwmLc5w2pfHVK7hVy6n?GSo
zt{U*PDOgY1^t6;$0rx9i;zQu6ZnF-2*TmtE%;dbk{NlFZsg1TUKyARjzBT_R1YG|R
zZD8u`+%$lS&Ct};+{gS&!nyG`^8IIuAm+*M-;a15TK9QkULM;39R7MkKXQ}(k#}I#
z`!gH|)^CpkNI#|b1edQH_WvnAy>O7YbpVlhm+zUCvhrq7+1~^e4>AA15Tq$t0tZCi
zIRTASg>m3{UAiC$aHu7Vb7v%uY&e=f0c;sB{oH4Wx%y{;z)61`@W1Y$%joao%8jii
zMpO?MDfR+Hk^ISTEx@6kCuaI155D(3V6_JKD}VEp*bsm@00CrYe_mbo+P(|{MJvPY
z1J5Nld%B&%nFR%A55txt#33h$;qQ|1oyRhpc2)CpZO`~rTl;)|e!kqY5^xzDTxiwn
zxX|<8CL=Ep&t15`aa5cJahaE8Ih_ImwiH6Q!4E0VcW=HLMi8i#KA$z^iQ-}z`k%Ek
zGzAz3ASQ}fK9neXNVB|AVY+*Sh)9Dg__{#%17MLFza1)y1Ux9ki<UF7zWIURPfpCU
ze^dGdtZ9Q$)NH{*|5I}Pjw$#qmiwXZCA!rm?7p{boc09(r_*GulV{GHiTWhDKD~@-
z4_!byQI)VBKn?;PRnxt@;ZMJ9Ae#`TbB8V+=S`wxV`csin*0Q#YQRlC+~OBR2J*;7
z&_<wP$H>S?<n7zHQ}*pS8TMNrxf9SkOdBhw1Xhl>{`sHLJzzO^9sv@;>wp#u=ym(0
zC;si<{$mEu12yOfJ=E!t{1SN(^aJ}kJ>6`7<Hk1aiJJcRv)|VwZS>#&49<scnc|IX
zu%7PbLc@3b<+tB4X0bF!L`2krb`<ZNt!{1F(o$GcKfj)lv9Sx{L?jtmT;=O7wQuVo
zbOCDQa%@Kk&-%GH^N2ollpY0q04YE%VFFCS1piOap`S*9C#QbjH~m8-6VP}Bv{<<8
z(B;1bob!es1Q$iU@E21dS3l;l>HN`3l?A6>r3j#6KkbO?#hKKsomoUWuRmPkJFqsv
z2c<%fid^1hZ|2*iGz2NxJ0n!>+k>q(or8CgPM{Mv<@IaU+G{s&Hq_MAaPb8ZcB4!^
z7~$A7K|77!S9QEc*PWd;ePS(z>>0ksZkf_!%lB1vHJi}|!7J-h+5ekYt@k3dKdo4Z
z&u8*1-R5@~%}xO4t}zELZZHzCO>~&-+V7y!07%30AX0ST8a<u@yliV>+Kz=kQy;(z
zDG)+KcRAm>_22$iSZ1{r;$KYDS04IF2$-Y`<*(b5%Ay14UD;CNPz@-#xE~AYDqd@O
zlY}pD*u5q!(`&&RF%UeHVSeM)>l-hQ{)+Z+-jnBe&yZiCccS|bSI_&vUu&nXhqOz8
zzTb~udM_Gx`-TpI-)KFm0ForZ^_{N?<eHt+(lwK7@3xt)=NHAY#%ykmKu{p86$qqk
zP^R^!o4qQ^jyc%a)(CwEYq;oUR?f+V_J@>OBa<dzviV6#$=w^8<n4m>9^jcmP2QbY
zyE2L&SVQa0^!i`(QP#|EfTtY<s(L|Dfb-+`7#0XC-TWHA7MIP;P|ln?cW(97j|NcV
z(eR87EbgO+{>T%<YR4o)>pVjCyj}Bexu8(b&ahRgdM(F5i-1e#8SwwDnz+R%H;{DO
zF+S<`kle&yierW%)Z?m<D8_P`qQiBE(C#1$xRz5;u&-N_s(n#ca{U4B_#+8jD*}xz
zIUp@KoFqY20>?yM?3s0pg|1zBfK_;~iTgz{g00&@+dA<5`*lY3^P8noyd|g+U)R=C
zWT!_!bcBjx1o|=XtwM!Uz-d`}dCAdFMIwR$cT;Fup#<Qn`aRKpzN<If+}ukZc=uI3
zt9*e;UuN!Ou^(Na4d=~`*3zgAG8*F%=%z`VGgG2&OG_T-sKOKAhpcf9qlN(Bt_LpF
z=%4rtbwGa7P(>73^CP1Gj_Qnct$niTtb6p*pPB;_Ew7?a<*wrF;(vaWYqY+ty12gT
z8yThH%LLs#0Z~msaLtcQ6*vwTT`#U)p6sjsx~lCy_IYqQPU>MSkTORBQh~)UV&Ug|
zf%kmb>5cup@5B1NWpkq)ftb1fXYc#@<oA>9G^!5A>da_Yxk8D@&o?Q`*3@?o;{?Lq
z|6t})!}?42-1t&#gYhShfr%pBZ5+#Mk+1bDupcjw^)~4?wh%6CA3&9ZxXkHl{%5nl
z<ogClfHoXEglj=Du#s=nH_GmO(0!T#pWNy`9GO%tCw}5Y#m*{;?f>qr|5yd)(Uv<6
zuq!T^ikVQ2ynJtKd<Eo5Yc+9JTm73Ovwn1=v8&3vqVT82xeoc>vt#W%O|wAF3qfyb
zd4T5pviM0xqh^ls(_^gIU(_^h)dYi=4g__@fqCZz)@+<l2zZv8q<@(=Z9SqSK$gz5
zbS(a3>R4lIrL^w0={p6v2kk1^b@UeQY1>g8w=wig8f2bQDk!sb0RNd@k}&LC4<13}
zw=9sT78y?|EVRAxIe#}_+GHDT^#=)?5zyptrA5o+G^QNQeC~a>&-i|3dzFJeJzk;v
z{61Hk%+3$Lx(}#OqXB^Nzpj~_oDBRiJjVpoo@DNYH7E7=hTb?CJ|YGdgMH7<N+T=g
zHY<6E>2#aE5aA@+$n{3&=o$L$g7|poSjQD{F)^^;pVP6#ovNtPd7rt7gQp#Eu0Ot%
zc$a^J50vStHp+w@gGQ$VRX}-P_t}r{EG4RbtSqf``^?QX$W`a%<$c{T)<eagic`Sz
zdH4+9J2xNUuRQ1_Kzj{vm?_X#XeHTpS(c&IAmf1CT4GX<0UkjUmve$=QvhVcT5-U%
ziLi5-<8Rq&DQm@;`mFbE{o%H+j!aQPnQbLU@^46LwnRe5!$e{#tR-uRK#MVS+BGE=
zIR~s+<u<giP+57`b9DvZEESE(YvMt!0CTsy`Q*Vcp40pOg8TRv8hqsk_QuHE{7(;`
zV?^7Y$=cUv-N$%Gt&$pnG$=c10Cd0t$7})!0%UAmvn4hk^cPSO(^YX<j)tdkYFaF9
zf1NO<HS2;%<oWpOQDnXnh-xfZ2O2*i^508Arkcl{xN<ah>WVWMCSJg@(^X=wT$)(M
zh2AhluhqE98u6qds~VRfi4c*0;Gq#jW@~)G7g?Z3>hG_OE*G=y?xft#>SeL2|BoS7
z(eH)}v;T?=8Bw*27hVAC`_g>pdiP8eGdQwDP}lctx@$o+;B-g>L_$XDB<#EWS8lgv
zIR29B3N~xS!k%CezG=G&S;pGEba66tAf)@kdeR6o^J!xv6O*vm5zvzM;*9aqWZ#1Z
z(H@scmzA8RTsVg8G|<@iqyWF@7JL1BSl?=Y?fzjO*MK7A#l@(Zr?ConTmJ9B1@<>4
zs<*azoILRrHh5tkXbxIZ(`q@^?-U~jw&ATS$AFaU&#fN?;JBw+V#<^HkU##so|hqz
zfboQ8vqGH=(zxCptpA75KHk-_XG71Kas`F$_M{CxbA3V~rXcNL<^IfQIFb~6eP#6u
zBnWw2Vfe7p`U;MrqJQSuwbeWm!7lK~e=LOpJGuS&EiTDjKBt{b>!|;6%%nrFv<q1l
zWpKDGie5Rjc4MI+>+ZbQ@<Dk$m0F9;>V+BjKY+8IUF<0=GElZ{6YforVHG}2MBfdN
z%>rWlwc9<neynRWx!-`KK@Jo`hn4Q_nVT7no}V6U3N)iB=;}-P?Yk8y#QpLgH}BPz
z5}l(TeVVL5Mt5p8*M{yrQck}^M)BzB&EC&2DUGU&Q#A3o+*JS+F22`_1vzIcK<}>F
z_hAC!J73reM{XGogg$bvFY8VqJ{X<|eg3P5;o4Jhan{dr@!y%HlSB#CF&jmOYmtF<
zk^dXgJd9P~oJqvX72gHYY*2P2c83Y4PNrueYAQq|0qm-)TjS*ll+Ba_k1uu!i<xDh
zXF*-@qE*+Tx2-LVU54VjeAK0h5hiT%Zh^tHPOw=+|GDA_5;=U5Pt&5-@Dn{FRA~==
zv+`)Y<a=jD@o?;|1QjhmD$pAS0(y?+UC}!BH+BaM#44p4UHj=%_>27sn*#Pn6x2uy
zYj)z1;wbvbUc?-%cO%Kxxu{1R5-(wNq;QI31~KEcpsvd~r+HkFT|nX7tWgWQafz4f
z!P6wqlu4j0=+EG4rdv1qr@d_1%0xo~T=4#6iB(-JZo2_|IHC~iQRv%SslV{=f(EYq
z2MhZF-cjcy&`~%kzja`3tORNj?8c`ifhRT_b?BaZ@>@zfmv3HWVcqONav?#to-<SN
z!RB-k<@QSe3m8yF*9*P9|4M=1_yIRPe$|ds$Yb;EtKv>*b6qMd-F5Z^TsG46+HujU
zW6>M1IG>B$>x#kH+BbHHAID#{{oBvV-Bai)GXJi5MvFnuu*h@DGNXz-Djn<03Jh-=
z^esBo)x&jOdtP3}KhMu$jR^)8eVCp(9<sLlGu;e)sKfwud=Pk*8G61&I2uv+Cnw3h
zjEazJ6{P^p>#P{Vr^}{U<~xIconWAoeg$qlPedY{@2KBj41e5qSA?jZKYV43k|Y@a
z<taQA=?Is}g^2tdc%1@b6GM?VVEOZAeOKpxUZVn0t6q=wCAzK81qt{{M2MSEGnZ23
zzafs>ow-8ZEBA>u(O1orVCdK6n{+Pd=he};I*HX|WpWz0q;-PLUj>w1ZM~bkIg~a1
z{wu^gZ30vO!V`hg^!6QW9(%glEjnT(D2{#=mGfo-1cLLICwK|ggpHkM7*y)F>MM?3
z9&Acx%>bvLxA3@p+tGUNW?vwQ@SGis(HW5G;WCEq<=N}{>%}S6_D)RH|Klzac)(S}
zz!DN|2^$=9uymui9|~Sk%#b@j#>!1%99>#kDtL$K;o4rikT#TLz(!MV`O<RHK?vR{
zX&W0AbYoeQaM>Y3S#$hM$?T-&;ssC*GM~)ib%G^bJ^kWxWvX{KCKV%7;@UAv@&Ukr
zx8By;lx>G?@F}(#;pwH)2iw7@Qoqpu|2GWkm@F40|E<zd(%QDR``29n5!GOOA7Lqc
zM8~x~k&t_04`VtvT2MntDlo&G5371#$DB99AK22er5$3=5D2fPMmzKD=yl}t$?9Og
zPe?Tkw`I(ViL3(m#u|UQ#F%26?7MYwW!c-&bLt>Uv!`u(weZ~Z)wGud%I_9NHHVKZ
z?$R<w1b|{@ea%U{j$&U5+OA_}fo3;+c^uJ(yuRPo;{B|qB8jgUWCwjuG)YZ^ywLnJ
zUEA8d+glgEo4vkri+kAn#Q~6#rq&g&8GwNZ@E>`kSmw=ir5>Z4Y0|h*d?g|K5yvLY
zuM{LW6U^K(DRPO3KCfYsZT}A_^&`g6g`Y3Y?RBlw;0dFVbNk5q7(q>Z&fP?AFWq;#
z&_2KU$-clqFt%Qju4S9>c`l^jyVTD5xIa0bDts?l0;r=Lr^IKGQS1hJy4+_VGs=e_
zqslBRKPx6DvvrQPXLGmag-})oPLYY^s5g{CqhjSW)u<U&E^|@CbUh{Wu41qW>;+ej
z82;)7;5+v%$TR}f$BScFTP|hwc3BchmyR#(ca}chHP_+X8T$on|L4on%YHwNTCmP7
zPU5)2X2Z6QTZvv^x^|27#q~t*2_4dz9!j9=IDh#nsSAQLrp018P~XuHd|N*RZ2E}-
ziok<?C)XArQXJ*QeWES<=Q$vv7Dwm4$r0PFg`zId>c1aH&LwRjr4KH<EY6G?U(zvq
z=cAifwKzNeBksUlmT!>P%2I)=Pv8!2w&jU$w`tdh+u^wR`yyN5vIMRF$nc=-$%1F|
z={4L)y#dU(CUBnZhj>Jrsxb8}3XjCFj&>b|*(KrfJUQeXvuoqr$}2OYh9h6gzhREA
zeu_DJVH|XsH=OX!-jDHZ-$j)Dw#vkq=IY1NsJI5XTmYDr!*^SY_&<R?$0aRPgjQ2|
zHoB=}=@(*5H~-Ef=-iVp?N9$CX^wM*a}$P`%uA!~9wLy(g)<Njq?pW^FnvvW4Vd1c
zD?^2;>8mS?fkO}BlXBKAO<&GCuNHewReG6U@@vt-W;#Cthlzwe*>J1;zqKXav)ka{
z5ms)Kf?J7JTvOgSjrWie_L<8AnLw+a5^pPhO~_kC2vi8zPb=qBc2tD)D8{~dKlC8o
z++o$}_ENgTAV`El85><45S$`&G3;i;B`+V{;^bp!J(i{#zE(*sNSEY(Og|~NsSFO)
z%QT&kOpU%1#dfH9{^Dme&^7&mzzHuI3ysLid*+G$j&hw={f%D~4$`ZU<NPUS5P9#U
zsL4Qiu5oN)e(HxYbK}U()e`s~j39MB;1N#~I->}zJ>`l;M^bP<BC|6pfVkk7Yu{35
z-?^}A7~hTNc4dA8{lsveroFx~bo)&LAY4j*;^V42p6_#BE#I0TVfPpuSR&}>J*)N3
z3!h1Gg*LuJCgZL0XXO2^&aY6d+gZ95?lLAX_YOE>^K?siren8D8@@w_a-Q{-!H+&2
z#3xwL^6V8gv<ht$V8-Zlb(1-07<U0GuEXR1nU*%>FdT-Iz820D3}k~T-N?#yoOC-z
z5V!`$^T+-|lM<Px508ENq~*kC#3+5KVpGS9U3-2P@AVg%Jt-Jl8>O`qNqnUDxH{0v
zEM4ixdymoG9?J`PQ?qdbeoH?ys>4Wc5=Z4D1J$d8<;V3NH9P9eCv8a&$hC!_QH)0m
zk3ME%x)Wr%++S*Ek9()#83I`x#5yFFm+N9#yBC$;&EKS5Exp-$_jycAZE3T2T3LE{
z8#c@Jkpk6=R+S>>LQU-~Muy+*1VLANyzcTRj~}06>IX{N@^H;Axgq3Z5p)L(e=WM(
zFlDf}<UNk?y}fU;_8M=-;HiW<Eh-JG{i!tkziW(X$H~$QYu56JJ`C_X_8{wThX9hI
zNk+*CVN4(k^pg1J{1>d>#sHnu&6C0Ams>u9RB}oxoq-=g?IyHyYUbD=|4phQNHO^^
zf>gfJ?aJLRXAzl}wcIeqBYVVArKi+S7XI+uaiM$g+uI;Nhz0av#*0@(36R0j-&UM$
zBPK3B%NVZ;Ck?ez7veHPqBL`?KeX{6KP8>%$kX{S19FNE-A~>$_2ns?&E*!kYottD
zFRz~VaM}KB8ujM`CUIQ6t&;V!jlpEYqHxlnGjTRj<g<~Bd}U3}h=j~m{DEAB2gO0v
zGuPUCIZgQ~5>4v|L>Xwx(-QDTcaujHlsL(-{AgrR=j`zIh@-y+9(1hG`ZfrYsYnyg
zt#3%4yAObRr>lgK?5~ndIv$tJirXjjYNYlhU1cN>g&I`(Kw4N@6L?e60)<LdO3})<
zfr$j^NZ0yQ2OX4tF}nJ#eJB!EhJ#}$UlaRrN6tMT2XD_LRGCWAdj+Rdx(5a?CZ{74
zqi#IzhrM8%@9FraXT9_tcss>_{N*gQf4`zzL9X@;Jq@$Zt<~k$hmu7*ea7Fv9L^dj
ze!w<<tNDjcT=g+&kct~bpIDokjXFsWRj)!WT$`N11w@6OYXkf1td@OzJKib(dF8nm
zOs%Zmd)Zv$*&^g!aNPq8l&C^*?PwaF>_E&maAfYtS5D=d0YN|s`kGAan<fOR->?JS
zldK(A^V+dz@~QMZ@(Jv_GSZR5`gZVs<V0e?{h?CdscdQJF(lmqmLv<&UI^!so}?*+
z#RH#U)yu}0+d>V2i#nrb3=f?1F!dgM<6LzTKo;NLOnE5-Px&lvbwuy;vT15Q=_k;*
ze>R+5=xWIoi&OL)%cXiwB>}qnX6ON*FRy)6kuBS-Ft_}{ofxO=74fEJ*$9aN)yKT0
znaeuRyN#|6yT{l2=g0%*3^5jU3*^r7D-Kvq)w9Q2i0_Wje6R-T)ARf-32fm*Nm~nH
z@~h~TRy&w2X=}4wdwBP-Bmd4e0*0<nkhnqU?#3k`u~|U<M$ZKO%LExa{Xo+k7rn<d
z+D~okf#p~+7N#xD-iWMk#gu0&E~U-JAaD0aYuW3W-guN`3nLD7B3~jkI#-LHireqk
zr8Qv>Le;5NaTY3m3r0gv#wc#f3$!nNBMuof#UF-RyRb46X>cN<ybJWCFle^;0U)c`
zgFVyyS`4k|{jGCRjvc{eS9>6{R?0Y5=AUTI(vcDo^npbMk+Z8hVcPz#&HvS`^|;+a
z07??QFWdgw4Pp%ZkLttv;xDMCZbVO`d(o#M7AIFHOu2ZM(jf1_z%rK|YPgkf3A+$p
zfDofv7*)mE(mh2!BnWDBaA>qtmjk+=c$E>cQlM;2IogLnf^IKUxGP`ucIa}W9k?&}
zEes|TR(f)vN6iLV&{o&L1JXVzL&?+!DdTeY#d?kv30W(SY;)qKro99Waunj`lg6bG
zop+<eF)uRI_D6+}x|)2D5ip>HX8bVv_Nm>%B{XB)=k<;5TeXzgVyYqCeaeN*l;-Y)
zazPfoKQMMm^BIoYoZnsdC@w~@vnQ8*A=7a1_5DR6lm23xl;3)a3Ci$6p=^Mq%;xoQ
zQbM&bPhWFNxj7-SF0VqJWp;7WXIXIBhmPUWv1lULL*`ewCD)7rLGKom=H<e9duzgk
zC74u-)*yb6QR_My_!cuCd)J>Sw}%`IQ#fmlAjl#9jHY@-thiV9bMbrDtXCAqx2dq7
zD6fx%<KUAd)0A{viC4>j9^?$2hUPHwU(r*6!K49_@2swWbL%AJ=<s&#i)<SicM4QH
zXNAtRIg{0>e1eusAgVg6UHrPlaV6?zx#GWVXluD1mw-g&m%a7~@=#8sqiZT#^f;C~
zY)7VE{0FJ^Xh~QYoR)&Tw>Kr*U<3u@!tUv>U(3$Q^Un>HhD5uYt`}EXhx#KuNLNDB
zk-E>e%L&7`Uo%y}7z+cy9`M|g&l1_M9WMbLIQ&oeeR|Dr0>{01wm6zf{P~y=H5C*i
zRWO0HCy6AN0$bX?I8@8soD2PIo@Is5dD2}I^WTgh9d2KIb2`<aZx#{pcwzc=>9S}~
zo^u%f8=9u`%#!<#Xp;{^qk!*Rxe?W;<Lvy)^4_J2s*nuoFy8d6&Mm!`i$%lPa6jUH
z<+jJ9p&$o27!@t9fDSTEPtSnlFZ$;pFDI?%z$p5xQ|3(GP2LfJ!JPH%We9=5DA*P>
zRtVZC&Lr&J;WIz^Za@Z3+Ug>QHqLEqN?CaC12RenhM4-qugdniDd!oYvg4n$&r8y~
zm^|7s;Jwt^8ZKS`Y*&+ChT04!XPn1oyvNUt^u*T*bJUf2AMTmP1HEl6j@s}ma8#~h
zT8#2CdU~c0_$|&jtm^tL^TVA5K&^-2ZfOmk>5>Uuauz$hD;beS#WS0v=nFj|Dcf?7
zf_$}qZf@?)E0>qVb9hZ`=iKz*Q`bjy6!-o)i%Rzr$L4))-mRSt_k?iqHYFG7TkqcS
zomL!ei=K}-=AFDwzewF<%KuPAcb)et69Fe=_1g!V_khF^LOW6yZhu)Nx)DSl`FeKy
zAZKH_VK-NCJp-nzPaWSoy!sL(0^aP5i<Lj5fy*sB=G0ztF6#}0YSbGN{NEZURCy5X
zQUqrFIvo@|{m}PR-A}~8<bd2U2fNv^?wr{C5m;>yZnur5%q#;Jf1||qHtdJI7wK47
z^%k6!Q`)l!g2eV`WF}HG+B@HlC4QYUyV~WX8tcrwQ#!PMDObThB0X&1>q`QCjztR~
zgovo24Y!p%^#a*@$LG(*5*qf*^(T8veV04E0v^LXBsqs?&;+e}dbY=}H1mbmp<^j_
z{8<4)CdD2Nq}b1j$77mPzq&sK^OBEc;KJA7KOzMjsCGrR18c2VHj=8)z4c)uaua=a
zuoMwy|Gh$_fF|)*TcZ|MRpOgQ!WGL>IEKG`F&-zrTG7tt$Bf1$t>|s(1!>JQ<C#;6
z?DXiun+fBf4t)uh(i%g)e3uChmlF)5Dua8QQuz22nwQM%mGbRVA+syvPko%B#1ngn
z&bR_4A&UHvF{8pNzY^YwnTKW|tTABl=@7ov$2?lR4DOqX;TS`351$PSD1`D(a_g_o
z^|B8;2K~mM+2p9hCCU42aY_T6YWgH{S}A(0x>hNr$oyK!e6Kb^M4i8{ELIdd`k
zGXT#$N3-qMY$FfUV;XcpD(^R?Th?j*NK@fET(&V|VQ*sQ=YNr#^^6S5J@H!~QL42q
zA7p%m#Z*(bMyW=#t-y_qV`F4@3^wuD_@!bxO#GdRE2Q2n`I59X%-hf52|l{Ujdrbx
z<n(X895@hlz=LnNDrLSVPoR`ay)kMb+@AVV%GXbK0Hf51Zd%Q&E9w!@I-#Ttt+)ho
zI7~GcD?^Gjc~vt_!y+#l+>k!hf3{ql%f}_q0eYs_;|W_+t6s*>&z-{$ix0a${|P{#
z8z8%n)U>sqMHqn0$K%A*Yv@zV_{s%R@JCHYCjDsY-Kz>~`KAHLH`DuU<2MJBQU*XY
zpvcRyXG_FIhv_c=Ksu9#*fDVB1sRr#LJw@Q9;x9nhZ2vOq@2Li3cDH8Rdb_UXrl7B
z79YX)$?;|W$_jJ~0?M^cY$HYEV0mOKy*M*>X2$?i7B<89DvuFXGan=kG--JNOsL!C
znc&{wy}UZl#2R}5P?`4K#)Jckw`ZQU7sb$Yp%#E;+3nAB=MFNvlaK3ptXzH(U~eEQ
zFUcgkDj^h7MZ^b>oHx{EhI;M?AwH7$$m!jsev0|>4KstFq>Iv^Y3&n;rJtQsCD@=2
zS*(P?Gf!7#s0nO~qztq0^=A3u^ledKFtFD5Yty#)u&}$U4WsjRR)ykdwB7*AI^3Ue
zkKDu{;t~eO4V6X=K8Ygh(Uy#+zIlR(JJz4^FyeYX#fozD*tCW2w=;mxzwJ-4K#abV
zL0*2ZCT({b`{9auD!pYOxgQaKH^7CSa88gM3aRSEMJmf3*w+_;5bmlhUFRTG-S|d0
zTEu!EY(I?PCK+UFwUXe1{)EBB*4xHy_XAJXzP^9|zA>|L_hOWmTC-@6c_nrND#bl4
z3QhPgmFg{05wqH@*X4*G>#PSN95d0J^``oHK>lM;1Stn?w*6dxw$5RV6?88Ozb-f@
z%xs^7e+&>~*<J;*neJ`zYDu5T?UJ8xu#@|!48^%<(~ZNNnQJ@RLt0?_L};BtmUd7Z
zc=v3KSy=s#3!tIqxqk&sWbk9dLK9=%X8~z$GujSD%oKB1;tp1#BQej;()?~vQxR~$
zQ*zSNc9)UQt;*0@TrYejje2%x0-fs}I2Gv_-{%q-tO8k1P3@3(tG(D8*jfU2bTUqM
z$~G2mm&R_Fw)BaxvyO#I$)kOMo&=&0cQ5!H$<&1!_+@qeo31aIE#H@Sv1bi(djj@-
z)Cio=yXk~Da-754$<D^+xW}3NBMbv;`cjk`Ll2>@zI^!2sm1r(7gp6+#BiD{dt6bE
z>0o~aLikdGI_G;CNL%+(9Q~7K917a&a8S;$l)Jxa7H{Cq<Z_g`>*IdOXA<0|m`9R5
zWTOIeGOj4xuW+{Abuzj?x&D<{^_VUBtGR{=j!<m|H8k(|52T~5sydJ%^x9P#o6`Pc
zC@Os16Z=SCh>@J0K7T=)j_m2Bl{Vuj!?70C#}=jsb)9{DUdS&EuYd#NLeD|GCK+&t
z^EW&wrvmUfBi}Uw9WEA>xZviGaNYZKHgP3#i`|gjqm{Kd=?Gmv_p#-|W-$7a9%w-}
z@h#K)xspi}dk4ILqQ7M@1Ba2Uer+hvOfTSP?dzf2MFxB6q%D?sDPJ9dXdAeaPT%!{
z+ziaS!WesKITi<rahIi5jTw}gcQ|O8m3b4?qU3(6M4YOV#U`SeC%BaJVkGt;#1<Ii
zz3PxlLv|U)B_|hF6?(W(#elI}8Eg#0Dd9AKf$VOd-f|<U4ZGaPZd+p^DNoyOyO{5W
z!W^j%_ZibDZd3iWUmfpSRL+*LE0ZZJNz*TeD;m&wpZ^V)Ov>2Q>WvUgSM%<y`o78T
zQDw)80t8tZnHL#W;!df}zvNdt@{zLxd7zT^<8^M^>HMmst@Uyo4tBlyFA~xP&H=Ya
z<7pqhp+0jWV%C-BV`*6_+z!}P(8zHQ8r|Uf+@tGO3NlfdkZZ|0ryP#ZM{*3<Arx0u
z7RPzEHC#Rb$f=Tv;)mXTYq=s_>Hu8Yg;{cc*DO0E)gr~6o5yT*t<shDakiKg3|Gzr
z4k`vKJsB9xotqB-m+aV0@*-<(cag^S;dTjdCQXNC%n~vX86r~Yo+LQE)rvFPHwVf*
zW0FS+?eX4`Df5&6)5&#J550tC6uX;$Q=b7KEm+qXH-+^TrU`B^g*)aL)2O#|ENDI~
z?$=-m?wC?GzM)B2&Kic55dA}fMK|OMRJf~#o13+9V*2<NCDZ3pKUc?_TOYIrfq%p3
ze~t^{W4`EWj;N2UI8sIotPmM&B9U>mLG%>Wl$UX#6bK=Oyc&IG!;;k8$^eke+ifqJ
z^dzY=2V!lZh6dbQu63Pv-j$$U3Hmi<6u{cHFCxFb9DXwUcKa4vKW#C}P*Qvqg=#t&
zbJiVs_I{<i^aG%`*caH28=d-5*AE~H9^=;8co0sq*8PYRK1H?1wU_`~vvsjEcgE|f
z5PFUo0NC|E1B>TtHepMj6+1(^$M#3qB3RE$h*U=my|>08=psbmH&DljNVSDs)vfTk
z54O=Oj-|_PV}mC!Fv_MwoiOB|v*OsCecUNB!_E0dWj9Mya)5)}+!*P=GXe2weI-uA
zK$qH!QzMQ;Ic#IY{@DRB^GUY)g~!XDI4&p}e<Q%r%B5t}I|~8`k?)JT5ww@Lf5^?n
zI!@+|iVT)a&o>D<*V8`82I@niYP~I@+hfM<o*v-Ym0{a0T=P!Owz0_HLWziHRHfkW
z%tWuQcue(&>X<gRn%}-ju^Cvc@_E$2je^=C=&XuR&>S+V60_{{^FLL`IEB)*x2J#B
za?3Oqt3(vchVJKVt`(0P&7!smo7yc>iE2}z%Wn2sp2o?`?FG$AH-n^QoRI>TMkUWA
zau?q)a8A!i5_7a(2IJp<m!|z)&a`o~@-R(bv##l5;+FatWFe*zBDA*l21kjRuS7ox
zF)_=5^IEToVKxl`kCC>A52DDvPn(q70=XW@(3IjeaBexlEBWx@J{9Kd`b<Q~LKK@?
z(OsQ-Vz9z&U8#M$V6<L$>x1FO<avZSf>q>udi9ruDCPaIzLCXThioaOGzslx9W%Y(
zW?8tnYGDxj%@Onvgiwn+$#}xj$>T;TPfuCba(OIFr_zpyj<WY}O%Wq#cXPVr_PlUh
zUVPRWmV;X{>aB>K=!c1XU2OoenbFd!o;^huR*~N$^lh)=dJZdNQ!<$Yay$nY-vL5D
zJ7{aqqH=b;f4XHM2>f=H8dH4=c<Oh#rj5*zXC3VQWttUB$h5hk7Sfj=DrPGy(aLoR
zpT#<nt+qYWX0NNVs9kyKyG<Rs_^dqFjxk$$W4yg2g4QNDsNMtQIVX&iGk-cV@1+Yl
zg-;MU?y%(+c7jteM6C9?a#OiGe|;Ww7}@E^uhGmfpB)hd=%K`h)uv@pKO(O5Ao9q*
zCaz4tXS9y>fMVAB$f4H@j&`cZZ7nxT+S!iSomt$Kx3pk?2cESpK6HRDRwf_Spl)ra
zHL{g`tTqzh1&R#IrMY=|9lNaG(Ly<|_P)5Xzsmi%Tj12#my-Q?m&nWLz~Ss=Q>^Jp
zHw7xS^6p-oP@v60fQ=b-Tt<qq*9s+Nke!k$+uV`(*T^Oxv;QJF;amaQ(!8@Bk2!Vr
z8NbOXH>e5vfMNKCjH3Dpzi_ad=WMlqi=n;vvRDU+%Dygd-SPBozSjk4`9Qx5(9G&a
z*sP-hUx7$s$p4!Sa6M~B8vTzH3<|0+YB`v_@A!!XC+2m}M=17(cNQQ$2T>_vefmE*
zNXU@^BE|OsDSL4B6JX2Ojp8pZUkN<aJ^Om)b`SM7iH`k4Va-Z7C^I_{nHLK$l^R12
z>>;tfm+0GUCl?KHZ4Vagi>6b*48t->-lDHT-&C`KNcEnDG!IcNRM+vqu?JGnlN;Au
zNrx`%1k&ii9bCJnazr&8`GdSh;A0s-gE0%u3Sl$zlbQ_r%osf3@+iCI!M3Hj<uE)x
zG<{*P$o7tycgFH?wq~42OmSc5YSS!Z3|Fr$l}N7C>C+xP6>dWvX9LB8{gt8nzkGBA
zZL0vzVi@E(J)q+hmpU>RmDQgy*lwU9VBbqqOdh|y;A>|XCV8-D#pc;^*WTjT5#KhC
z_B=Lx1oG^7;X`fzJhI(g-?alpieB%VfE8!mROEpYWtx6FLT}J0j=}BNvsP|gZvX<S
z`kkufmvB$AZ$x};C0xc`aRKgs7@jg_IpO+MpQV$wnk=Srz?tzLe5>-G7j<>*P`T7u
z^y>1WyOngyQtmW;f0RUv=o=hKGmZ9Lb*2&tVtCkd-XI1numf1&nP<7=yf4>ZupcN2
zm!&L3+WEwWan@V87I`<e&Y#ZrGfIzEQYczUourrPqS+ai{Spl|nm!64z6{2;?qtA9
zdy3+Otvketcynl1?dy>WVXRZ`CFaW}Cf8tJ*pXTl2aP<i>4CmMweMTa;pByxxEz}q
z>|$N)gOaxU=Y|qmuTtN|np(1AYz-D3CaY26_1t_kd)%2HA<4F1SwC3zyj8Bg`fk|3
z1a^yF)sn1Iz-0XcY2V&r*YZ+h1Jv9OP@UbEcCPEbH#}w{s4zAdd_Pkd_)tys^x-vw
z#vCJVr4;^~0EXAg99~v@$&m;z3h$H~OF~7%*OB*zY~><JnTg8#DT2{#TO3`rndYbG
zbMn-}l1TL=HW?nAB^Cv-3_-gaxu0O950sFpHZcRl<o<LpwuwbR!6#EMy5%G?6HT%4
z^-^qS`${rlFKVIq>~%E}CvUkE!0Y8F!fU#C;)4R|d#cTVbAsNHBUjwIb6uCd{J?x`
zF_OL(7lh0j%vmc#iaJ3Qj2vA((RI>J@sg6F!6_#DmhU-7n-s1+9(qWr{xW>$DD$ZO
zv(-GmbhYPMrIPat2Cx20nrSeKAEnFSAie{+^U7fcT9DSR=L-RaS4$T%Djv!6IA`Dw
z;@vYx<LrE5tW#**wqhzBA0?Wr9%c;M`F)z9R`uihtG1EHFGo>Y<EZaLkRKd})f?)x
zEE`{W|G#L4>tLHfiq{vTeC;!)665grHBbl?1#BNMO<}ua8Go+Fh_)Kc_6Rv43vczG
zUl}M%UKj=y%c~0fHM{ujTXVTrJXQg6<BB<14afB_e)ArY;~)d%yRx5DTBZAXg_s_$
ztE9h+WTE5Cd`&u*tt#AsJZM)KkGy(3ji)V9+w~&^eX25fY0NTB^Q{Z=&1FxrdH2tV
zc#&4;IV$C{fw*K>Qq6r4_Un7-t?ZhZa~+yjFD|UgCS~D6bkwf#8cKW8j224}nR{(0
zLn{%5LTR<Gq$ZI&5sq1AAMMX!O=vNPfWA+LpWpp8?P7+VqJH_sp38b2E|arlWKM@u
z=f&n7KJk{UL$Km}ot3qpoT5Nz#?u)i?2CKy9a>Edg&$@wPCb|>>$)wi^koO0&1qvv
zO(9VSiz3DmkcG;ptE=W?v~B|-rvCJ6FRmrUO-g`XW5(XoYs{|TRXPhymXrIVq4P)W
zVMLG@d|%Y=4Y-YY&a_@lu0V*aHl7K~n1I>(k)L@u_lyd>9_gWOtsRPh&HJ|oNlxYR
zm$iAwm5~uTs*FX2*RNC6o+Kr#Ml7m4k^4%n&K;VMOuF4Bhl+KSL#;GvEB3{Sfha6e
zab@nU*DVc=cPU(Ju|nbXRL0b+O@&n7<-&$3&}n#pSgIg0pZPjNc4T(F4;|=b|I}$=
zRz$fvh4WN)@PF}Uo+Yu2ou$pbN$I<;Jnq?hta<VLc={4`#Qrtk>TQ%X7@$7Cz-LH1
z6&>rS2)(uT>P&83anoq>y&GQQw<@k^{8%DUG=;QmHL5$~cj3XvwJL4==kD%W_w-r)
zYA<?Y5uviHEF%i3LwRxx^{wV_Vl3W|$7O_9@13Z*`?x58Dmi>*8RURZn=Uo|<LWex
zo2~e;G@fS={<25tRM@d@&i_Z3;3FXQv2kUUhKLX58)T*U*E`%=Q~lY<u$N{^p?m3_
zfTwc$WI;Ro?Kyr+Fa3hpJSzY3cLnSn&Q$`yx|rxj1~>i+HfjE5J--J`*FfrPA?uL-
z!9w4mcTo(_SNOsTF|1lWQaEi>8pPOPAZ`>uHL;lXv-9Tiwy~#a4Xei;rxOqLGKBV?
zZQoxm%Pe0&U++n9h;=nF2F{qaxS`nz-1`k2yd_&qS1(bj;=OP}_iaiQDf4g=+a6>y
zl>k33jPhN)at|`oGkN+AsIrO|_jP8}ub9@{_v&P)0CC^)B_Wj#s>y(7%n6Id6GKIJ
z7Lr8{e<yiZRwuf?T6q_n`=h8T0Qv2%uk4AlzOCaUUuLM)#!V%k^Tcq~$>R<u8!tyv
zk6CG2VQOjkTaW7cQx?uu&4U`5M472|jrLaofFXH`YzoKx%OsdxWc-9pUkMOhoq{(~
zhcti2YlRghY*cOsMA#t8;qlfk)gRyBC-5NVrfI!ipjuOFcIq1)4c%u)XiaTWB}MMz
zY%Zy~hJix0>MU6*EF(Dl6$!l-tOLtO$OapsP0IuJ8(!-=*lge7l4&&je8}bb2ahq@
zK4kW;L&b8jv<f4j5>jA<>&YBAji%L`x5vaQG~&$eihKouMS*QkBlny$4atS5t!#3U
zUOrTtXOeESv#@9A>^J0av=-b%RdQ=mAkMhv`Nj9`g52BO_XQqs_||BDV0o5|&Vug^
z$)1T39Dt``l4MF;VVjlyqM~G+1uf&lGe#qP{R~Q|JkX%yrvt!5{65@mll#z`+?rtT
z!kVrUsyH+O_ot3G%%jt(CLi?UdnvMvX%2oYnM-Tf%r!dUx!27yc;gJDCte~<Tt>Af
z5349&jV}Cd=Y9~>G&h%<nY0M>NV#m0A)Utb5#&tz;$Sv3vWz5XMYTBthIhPVJ9ig}
z7-Zsvq(V~%{v8iGPz2xGo4O}Djyz1vW#b$6CuJaYk;AIoLq-u=wdc0&@V(x9%On)l
zFo9G`v;F)WG{gig;PJA{7l>7%lA%2a^M8lVgxD#fOF~m$JvTwNQ5}8r(b6kR6JBXm
z31rSI+Xn4q*da5B!<ARF$1GPH_X;S<I)hq$gWrTB?DnRf7>_EYJ{9IQoW7$3gn7)@
zxHDU(m230FuDyS)X>tHa`^XhX6_=G-ule$+3KUW8QX0nqD-f(je*6|}?cZ9VA-YU?
z%<kUGA1++*5g9ddl#!;AE$;M$yhVOZKENC3&vt95F+@^Gvwb1KKS_)ocCzUZBn9kS
zgOvoZA12=m_=S+4TpzYubsjDS?YIi3s%4@6kb?8`zz&NoEmWS6ZS^FdU74zW^`3k?
z-AfeHB9ln_kG0eGs_RFbsJMd<W7cB+Rrb749q#h%t_XWCa5imWJkI)$>swPpW@S8_
zlKS+a_272v(rQT4m$Ls~A6}iyO_bbH_gTEO19ty)0bMg&T1)Hn>g$>A>Rhk}Gt}g{
z1>E(8&Ioipy4oPO1E}#twGMWtLAzTqyn3KWo*H(2s-?scSMg#C7Mw-Y@2jml7UUk2
zVN~{K*S>o%8G3w5w|S;XkYTe~+4P(sc7g1S1$HjRwB>QOmGx$jrsu)#y~tE+zbQ8W
z6A;AY_rhr}w=(w5l~V#qw^ixC%qLD1B(d!g`5^Z}$(%pGsl4Ijs`%iQkisJg>8US6
z*-m3yjJWTbi?^gA$Yg~2$$WrkrIHJg#Y3hPWr}L_@MMf6i;=E@I5=b{8+|z=W=<@8
zN_Cq9ohF&vXr7JoYe@)b-K|PVER3Y>5h^)GYyBDHf=SwwWY>c|E!i^Xa1Tx)<24LP
z=6?E3&)zSN-M_}tJuySnBwWNt)H^)lEW^c{$Cx?;y^VACm7{ur|2RBD*X^?QB(4me
zCn?Q%`wSoIXOi!kv(T=o-kTSU%2wD4?qPXBN0u3zcVkM^tW!z3VSZ4m4>Vm)O1m7s
z*1boNUYvY6T}*CM?IuuYER-9XJx2FF@&7dkL>Nh2z0DQdJZ>D%dECCKRY^4v#gZDH
zG64^-Dnfaw*#VJu#**B@7}Wv5{!!kI%gcV~!%lJP1|Gu6N%u@Xi=E8qI<Ux?0w{Ck
z_hKToB&}i9<(oJ;DC1q4;jWAOANq@lr#YRsZ<0AbUaJ&vENjY?-Y7#5Vqi`+-+Jp*
zH?hs!-CIpv<!c>KoCk#oq{oQnh$oO(@@H~frJ12r@y_X(ZvY=^ZQ!bCKKg}Zjd(O9
zpTSv@w=+wqYq03{0(wSmH*jvBU8-ei+IYyc$@Pt)%)=RXE?<mCUX43{+egQ!Iv`$<
z;4*YuviDS;T_7Ldk8j)AalPpZ5!)k4JJ9mcz1Nn)$(Z+P8h_6X%z>oU1eC5D7cadz
z=VP5yzehm>qcQ*;eRWh7zurQZLXNxk?ggnS?{lEuk;_lH{XC0>C+E{36D#xK2bfA7
z;pvVXtJbZJg-hwkRZNEhexccrvLtm)OmZ9%VQWB9)0p?HI2T?37k5U9L41p=rEEmf
zf8nCv_w+_Jdi}&LV2lexMg_}lyX3wWm@|5<_KCmdiwbx{Ql%V>A6#oGRDXnFd6m4p
zJFwiGPpGsKi0crHow6<7CW}>Gt5&k3!^bsJ{I9Jp=SN&77{*j2tQ>Hg4bm!%!;SW&
zgmv<?wQz4s&6gYNgUweuWoztn4_LgyyQWv$<Et)pW!#iq)*^9uP>-ji_gLCkfqhqZ
zVs3qA5aBT>Lgn8leQI;r6U2zv83=zFWEn@l%hij|0=y#dC@P%opFfWT%Da9QqYSR5
z0_OH2OTAA^k~w^*az<qTCs51s>=^WVGH)GI)Qs2-JZvxpU@zSQ_X>7e%dC!fBaH?4
zp<;97yQExW7mm+vSGBKJq_x$AEZQ=2T|n2ry3}N4{eqhkJpGJ5eui*!hwwxnoMJQl
zG{6*5OP?Y`e@kEnW2@Q6lel$M;s5F(ymd##fjch)s!+utYo$_XWfX%Fv+OnTtp{|!
zof>{P`Xr>o4ld(_U+nWf-e4b<+>OYA{r`1@Uvd`S8H$#5Oe375<y0Z#z@tb}>L)_?
z%X&rd)y~SV>I=P12__+-zGyKB9=v0qHmn+9<BF@)GaHh_I3he{M``WLohyCEOj|O_
zK`V98P65@zdTq8^>L~fY|7O2K^qVH!0<WNYUQ&jRY;IxPN`D3SLLaX`-a1lJc9=*E
z7EOC1U}0gAm>03H+HiswJUhLM5F#56NLA*HccTqK3DFtHeHIqSOBc88>#&pjRu80A
z;fTOWu^RAtLgDNmhW64rfoHgfYGiRq(+vq1OVpkFO@{qmbb2*d$U~y1doUk$tJU|X
z`v)|^JN1tkk*fzlHG3!}p@!}gFBzd2S|jl%MUP=`UG}kP!h<^?_Jf<ZqXrBdSi@yc
z(W{D`OR_O*kFx$ph%QQr8`7APW|o8t&t*9(Y;;=jS4YK5;bK?RWslg9u1AF?XTE};
z41H;FxqlNvq^lG;|9CjN3TEekFx(C!4-^@&FpS><VlvG9l_bi9sm8Obnq9BcsGjV-
zdG%fm=i=nOEptE5Cj}Q8SauFD<%*LgY^~!cr5BBGM0zV^u+rv?o&B9F?75n%LWqGo
z4D`qstT+U^`=lHEJGg#&a{ypZn(_Xo@;>0%3<PIRk}%1^$1Fg{aPUP3SyOE1=mBy3
zeKe#Cx!{4o>XA2}?0kJ<KlDxanZlHVx%nF~PkCQAwgps9118i_OydT{`%v{;l&TJv
zrWeCBHSz6jiZ3vI%&6|On-1wirdbXL&bc2W*5`gH%2GmxUiP5XgwcH#L5XR4m6(nw
zurpXn`uc=Ubb=4*+PvxkNzglV&1?Xh%+K*~V^?gL4U)+5=tevxJNv)%>pXmM>s_om
z4-$uh5Kln|h+VD(6{U-TO<X%&r6B?A*K9V;h$!rbrWWASu7gH_Zr?1JmBxUe_}lzR
z?KvcIWx7fG69+tV6o98TF*G1tuLTuew7jLK$J2SR?e4tg{}pqF)v;RR21@pKr7-c*
z+d9yV{wojxS;w8A*!Y=(@>w^hyX%~mAP^1xQPE=P(7%^%(xzfBR5UXe*AAR56wil~
zi~NoKm%W+2kusTLh*yW$p+I%eWclIH<RCdXZYV+d4#KFg6C@xZH|CRm9#Hgs;pats
zAEl?kx@&f*MI@)F$lL77+gmHkvpwF!l8P#j4rnG_tJv+GW=o-LsRkXOb)*~H!yCPB
z(p<sg=$Fc{CD&DgJaYOar*UYKIsNqus)1G_`kETwpk)e2=j{C`$&Hpg^?=%}>Y{rk
z@OmWa75rP}ayHXE@r(#Q2L}h{h==OS%<FAytYiE$7y+sV8tuNlL51U@UI(O*)iMG8
zBe4)8+9TxyF|;n_vfzt>=alcbt{;)=_w&C%X^sK-)ew9h?!!-fCFqz+P!e;EzZ82m
z71`r`JMMCy_*574K8a^UY>#o@s}o<O!CNSE0>d}nw0@M3D-YaQ$-f&Ead81snj@rq
z4c-P%K!1#~;~a)rw(EW7<&xjBu9?~>C)!#=>7rqg%ixm&kgbm<s>SK%VIfx6Jm6=d
zL9Hu(zPo6(?n}wm_mA`N42n-2E>ka2d<?tnGDdNJs><ijbE7@BG9Ee!fB1Mg<&Zxz
z+W+1^@I7kCp`(Z5i!pdECN2gB3_fFgxN8AvIH^iG5r1*<)7VIgcajzON4!)w5qrg5
zd-hCelQHe=)Od1S5}37(ABOjuj{figWhVER@Sk$dIQMH9;BehmZmTQHT-=`CU7(t|
zNw&wQsVIMZ-19xTv$#TV>~ld5)-&H71v>SnSJ6s@Ip^?^!G1SApw(j%JKVtdPl6)r
z`J*fOXJp8=!MXVg)kPOXCcU~ifI55&fj*@5;v4t18KM%ZVCLg-^RvH(Zh{}*Wvy5(
z<(+1Dss`;++yRO)8Gtz9Joh*V<t?dl2X^g0NVUlwP?<hTqIrK`23p-l;3l$-!;f+A
ztUcH6ANcdN9Q@?}BkQ~4sqWwZb2@U6qO3?(ArU1bga{>xIQC50J0rVONJcaWC8Cg>
zy`6}bnY}~F9@+bMz0XnIpWpYN`*A<QIj?bD*Xz2T*YmorrGgYIrnW2G&4!geu}Id!
zzC-8zkFu?rPywKG)Mwl&wg2U7sQSzuVRMwY%@~ddu3@+8y>R|=lzW*CL+9r@-<cjH
z_uAj*E&z*$#t%bgktt0^c{PjI%Ld|!BS#%!80<%2ffIL<0M&qj4u;VDb7z3)9Xu<V
z<2Fs$Ds$^TsEKP$^d*~W^gw>uB0#2cJbBKd6BDMAC{Nm6_Wab=kiZrP6h7Z{<rH{*
zh<X2d=X%}l4R;ei>qHJ64c|#GdEw?VpT+43NRqqQihk(sQFv?DT^d$4kXQ)~<hu$>
zM5CaxW~h#W`WM!^udwAMsY~>;lz!&6>z;aOM~<SjD=KWM2R^E!g9=s(>0y|+TQaf>
z{0-88;`jJ^(kHQ$o>0FnqX(PnIo(oAnBf`$BV03Dokw?u)grgoP4R(jn`RedtEQ%=
zMjDgfjdQSFU0&+Jnj&_Nw1`8f`fgvo;7Zf|M<hS#muE8{E&IlOaRuz*0#KCeIt+^(
zOax{li=96CJBEm9+6N0-Gg48s)vV-f8T!uGiyoIve`29_erjuTeciQBZ&6slhKaoa
zBgjBC=E|CKa{jT_aaVWuv$4{?6`mJ;PO2Gqj{DFUNteK#`PxJKH#A0Bk<IRDeW}#s
z)cM{8=O3RQ_1E~o#^6@`VID4}dKYxMhhKZj4T}5n&AET$fGu)mHhhE2f?QY_Sh-w|
zdLe&=<HMDW$G@9;(C6^8t1tZL(H?NXTfm1NVNV#kj#iu3?fo<dLto4@kK}t;%rvaA
za8@xf2pCR!e`fUwt89TRTf>IuxzBeT`W-oK)~okRPcAw_);eo#9JqDcO}|!dzS!j;
zots*BIpkDB?5MT<iL|it^+nHaN;x`r51GP<kLqsLE8u&hT4(~T{ZcffMmGag>?0#1
zuX$M#X89U}+PAB<f`5Q)E95x94_xuj{yU#mY?lKh>}lKD&mh9b7Je*zIc2p|<Ot<@
zpWDEjqC?jY@TWe8ehPx3haEw+X|W&Xb^UnZ|DJH%XzoeynD|L^BG7f_M3#q@jr!3a
zhr$L!Pc0R!_9-S9tp`_*8t9MDsNsZD4VDTjJI~o^XnL>yz8OT3UY>DLuy9$pud>6$
zFrku$uR+{x=mkU7*vn=opZ@M{rMZFUCb}<zpRCO^3T|fe!|J<vsOhxt7mwko$ZRDq
zhakKD2@|j*hb;t%TjhbRzACbT&OgXr5pyCFAfvJOtH)u-nWQ<3A+;mhJ*BLb$mV5)
zNICEf>`i49dUHIhm<9Qt4X5=qHbW?)bV$C6sra=I(JbBT7O32KJXBtgzEt0pJGS!R
zpiUYE|AZDxfyF1G)UUNZ9(ujTPGjHR^w+%E+JcI^@^Q;@3963Uhu7hK7ux;erba-<
zTG<C-4ZkOzdip{JrLOh)>H>99l^-jYF<B#<Zd}&Oc2!@ly$eAukS>tfaVYI#aOEp#
zS>-7zL)X<WLfAz-Ok(eTGz()kU{}g&FgqovbKjpi-E1=PuTXQ_C-(U7O89N%wUR|N
zK0Zjj++}d{zV;p6ihLpM>m#rbRoYB_BH_R=lmxH$2hw~Drv4DW1Qd;h(dNXudXCpn
z%H8&=I&f}T7!~EtMbi`*ZvN;?xO)L)*p45;N`GF0CzaNyd}^pB__&?lXI%!-3NO&f
za)Co@%c+f*^%ZLlFBcTK1{Jq`IT#r3<)@XK+Bd>dlbAApgAcR?zd$-<@6k`CSYG~s
zIWFNq8qpR8(7>Cn@U?)r)uV8QkJ+Y((n`3&%cMb4Um8ud^gQk|!jMvQ0BxYm*rw<5
zw<S9Vp{)AG#$@$ml{W`V>8>bdOtN4ZhaUkWId9+!V|4%~@v%h+dzw5(1Qp%9&B4D$
z7jb$0+_>Zt!}&%I#D+w_3QHjA<M{Zg$IRQ?+n%p{qH$U?3ChRo6x}EjF&mLs+rlqk
zRM?k3OqadnXUF$Ub&tdi52#D}h|dg|N5XGL2Hk{}N5#r)6iQ|u59$y6UOAlm{DdMG
z$e00GlnL=$YlLa-`Sf5c7Z=7P|H$SpTr}l{w!GU5Q}OhJF=}!O_m*rCYl*at$kH{R
z;YrMCe`oq}Db-s3X8U<xbB+b-!Tj6OHqh0*g1t*jb8;KlQF2(%(Co1%+*dtH*Lr5u
zjxSdEQ+l6BQjq4<W+v(BH~wWW(Y?uzDx=xO|BYkR5h?`hu5j`&na17-w)TfY>Pd+U
z8cFpOv<mW_DSP!a)5gm_tW+JF&>inBzGVr45#QbR8Sbhy$6;)9L7pCo+vk?uK~7x{
zK@`;w22KF7yu9H0p+2vigJ48)J}_o`(>a|uVf-LG53$tgeFs3_h#G0}0BmRwrhCC!
zt^DL&d4fTv=Ha0B)#5-i;c^rBd0kIV2gvQ8+{2M*W$q;(FO0H|%}S5I(Z9v1eQ2;v
z?QX0)ov_5mpb7=SQ>k}r20n^uE}S~@fcbpwN{@I-*4!FKjNW$cQ=ekkk*OZZ7f8{j
z_t&q6)VJ1>r8nO;*)h0Q=RM2PKg4+PWL|D&XsVdN;DPr;>DF&gl<uLq-CoPUIP$2)
z@k~eN@bjMCa2H(1sXHz^3fVT(V`smnjvFpS6(D=VdBC{z_FMf6G048GPQqI;Pu}Xi
zV|3u(glGe^uRL;i6vQp`;^=)u7Os$TG%bUTc*ScIA>4|2YFKvL@yD#OhD2y;%$%DO
z*w`3fp&yAq6JsWzU}@Rq7bxXek9}odq1ORQ;4M@#d}GO*Nl|5vaQSM7eenzm)ZYN;
zH_dG2_ae)nw7|ZYw3?FETUW-sk%sA^wHA!}LZMUn1?zkVhP&+!bkMiaf0IBK$S4m6
zgjP5ULNfRjQ`pEu^3k6J?IYZhE}!bc?nF%YUXS!!!H1{_R%Z<ZweB2H!hcgUWpX~}
zk(T_;mX_qJGgx^RckWVwkXb9V182OpW^m=3=0fPU{mShSoo()sLeKHmx3oqr7Vh4o
zQm$w+PD#nPn)&VzZmmOA<9dLE<$Z55o6)-~%c6Ca?^B8nFJ<a6d&n}<lc1n<|9R|C
zK=*m<gv32fgHp~x2}Cm%4niOPWK$O8|EZ(G!KLyuo&vC9=is5o^H6od%J#u~G5a6v
zA=iOc+9WWPNy>NY1;;1d*W=6a-aj*pbaj=Wv%r<P@^pIN6Pz!!f6V-hH$6GIXQCli
zTH0wFI33Rq%?6IAsrkDw@$=#pj&=G>L60BLF#DOp`l5-{GXguNwMX<dDBiSx#BxS<
zd^SFNuq~y50siBYhS*@4b7+pT7?*o0hBHXdgSm;2GE+ThsY`-dqy|gyQF81UvhFj=
z5TThIv=aMw14&1zO%mX5_DbraNru$YiE6^A#fGw+akYP`J<xd(1_QCUxmo%YCX7Am
zn;n7PHT@l(5_Mhg*Va5dfH|ld!6s1}6ckQl7V;%KQPV%fK@qK;i_|@a?>j6Oo}apK
zbC4QqIp6)@Aor5&2lt7uhEfym59WG-W?UnTwJ&uTysOBvoUnIp9S9FW+@!R&G`gW|
z%XwS;v{TQfkhj$scD!9L?K;`n8L>pR{DmIbfT|YQ?~;ZWK7=<m1MHvmId5^oJrMS1
zY=)wt2;3jECm$Z6u){@%^6V$b;lrTfTkX7%T|!``JdIUorJ_74gJxGKZ?K}9eWn<A
zZ&6E$Rf%zPhWZ*56U#+CMRS~M^th7Ksfj+TzmMg9G51@7&d15F2Wq0$v5BF(CiqZ(
zxiQb~_yT~Fw4Kg(T0%Y7U*0}veD8^^QfiYVofn?5QY(bZ7$&Fn_T_k(<Hld)87e#;
zdVYAZHI1;Oaj<3BIQC6~!YhEDh&bs|1^pE^`~^}Du~vaQ-_EYU(5@iGg&lwE8;a&(
z2=xTCw6!;Ktiv3?Ajn^#HP-xnuJFv-;lXdCw-z#5w9c1YisN5h7Zq3)anU}w{jwj<
zT|)~y#2oas77i*U9Usr^S0XW89%M%)O*qR!2#X2>;*gcy!9N8rJQ+PD_)lhF@>yOE
zRwFE!*NG@Dh|R@aqPV~&S#`NOFU7%YwCR<J;dMPkRZ>!9dOzh=R2UYyIp*4;b%Y7}
z)5H&MM#dn3mvE7S$KWE5pO^TLYrh9hO43MjOOt5b3BPp-hvApMEzCPgZ)=yw%X<^C
zFs+L5qxA)`G;gc=cAOS*I7t@r0pi+eK`4>~r&Ry5b~ftwcUHD(?!_qnraF-G^3M?)
z>%)lcDVX}^CD5(WcVg$$uYL#1bG#xb4@lQZDYfTBMYV3+BE*g|lyEG1f}aDRzc>l1
z4Qxe5|BF$YKh^<y{ZZ0pSPVT%$G(*J{<DczBR1JIKn5;C$2xy9nDO{@=rZBPM<~jC
zx23>YebclH8VgpvZNKoR7r-@*pY25V65LPm{e=I;?}aZnzcU^FZ(mk?vk)EU6&H88
zq1DQNtjrC27ruM^XLon-DX2M(JD4nbDxMlgKP|<!C2{2RF0<J=077?lt}x-^{PL^7
z$F}hKP5a<FT<dbxkhfH(2EOWq2z!Yf!C)g_A76!<8@#&V8+hK<(eYGG;?9*4O#Bn-
zz*#HFL-7{3ymd9cxWf7%!0i1_9ibg8a`n-1;<29512fb$Z|#gMUsVmhEl4HA?qBqi
z5-;P2=HL@dS^aJv9=`Z@lZh0x?i@1973YqW=v6l&pB;t=g!Gyho#ouo=$}7-o{^R|
z`g1>WaP`dM?*a(EYa8MZEp3bvjX6PFd7-PZGac*NVQHT-rM`9sf+Qkx9Dvz-P$7t&
zRot1UrXEWW@I3YJ)pm64jiqhc!DoDhf_S<RpRpc3)OKluiSVHs8nCB?gNb^7SBvK5
zf?n&f&~{5STkA-pc=)G1e}Be_fyn;c?b+{!w}tJpzY$I~7By#BTf64b-QRT_o&8TX
zT)`R?-0BY{JpX2V5K|44JKX-WToRNp4FLJdb4Bgv`FZu_+YS&OW8@Q|S{YRxpfya>
z^zk9fJkMwj7v2Xsa8sN>DV_GfjOKOz?uSRtKHkUAN88uy%1;xRd;q|$D>w2aNO!mE
zkcCae?k3xJBO_)!r${q+d7r0V@5Q{FoNuL_Gicru;D&U)ZH7VMa1A+NFP@lpbP~Rm
zAahT-sqI^Rp$=na-|&?&u)oWFwMzfiT#cbEf0UZrSj3f~6qVS*O;A_k0#tP`hQ?Ph
z^4YUK^r@cXX}!%eeWlMh_8R0b0p6FKA}&3#1k(WX-o1O5#S9LK%CnOO-G#j<6qXL|
zcf4+tf$+-d!c{c4SUdbZZnP3jpyD+2X0ZES0bNwo%T8tdlQteXHoN#B=C=WsG=>?n
z;igeiJ%m@DOF;EUZLf;J(C5>0euqM3FkYK$!hOZJlARbG%MX&Y^X4HikY<X3fx#8?
zh8J&T85VIe>>$jt$|6u@4#)5lZZ2}d(*EB%Vt7>Z#<5;S2U&kZ|9j+)kkhKAV_bUF
z=qTBdIGpN<c;zuCsKYFMx3|2_KAp5~g<dtsE6$)C`z3ugikzq&TN?Z+8O-{#z(t~k
zk*=;=8>{6(wK@}goT><f#oG`hMeqrR5e<;8*+Z~Ugl{vp!QD>uX)^sbMB@p4q*&Lr
zU5P6|mcn+I+L4OMBr##?(<4qx6O&h?BSim`p5nv6v-FQIeyOeWJmzl6{0a1Lr8#WA
zD-dU#fB*O#?RH}8$~pJnM{`-B64lW=^0=u97QQ=8TxgA;eW8e=EG#e`{%0NEkpigR
z0tdKf+T7Cd6hDiUq=N+Wp98^Ak8)Fojd@ox`*j}Sfd0SB;?9oC9vVbDdJi2Wbu%e9
z4iw(`J091NRZ*zQmYP)?DvY%TyhE8L=cS7$#Qh$C=~vi&sC*8kq9y}Qlo$;i5R5Om
ziG&Mj(uT9DRms5pM-t@YN694SI&;9<M>;7>5WQA7Ig4bOUdcs>UaP{~_8kkmZTGAA
zdMo@pqvCfE?c@D3Jl}@OAKq@1v(CZ;kN#S(@sl>dq^?OuSkO<^MGIN_`1sJ@->N>v
zdd?%yZFA|qe`)1~A`#gFCY(4qIQNzX3lWGQFd@Nr)Y~)E|1{+wO(4ZVqYAIF(wW=2
zlKt5of29T!!ke9|=O~<cZg{Ri{`stx+VLL3y%*xMeQzavano3D@8+hSc>wr;z^(7R
zAzNRZAS9y|WnU}+S277+w&jyc5;!GFDCzL<a7N-RbPO-7pfy_f<i8aRQ+{~f2*Evb
z5$Agx?t;jU(8BK7KtbM48(<E)5Md#70Kf`d(BhV&k`I+WSEy+H43GGTYYUbm@j!l$
zseq|QbuP9#E8vnl1E^a!2pHV?#UbTGlxbktbbod=ixLb<Iv5nw<aYdjHp@>P))M@2
zoXTpBr~LNom;bO$V_KZak)Max84OwEyR4DFh}VKyH%DSS+_w`sn_tcd7?xdx#yy`8
z&%RYpzUGx*ToXD2UiH_bD^N^QZWIOL8i9zbq{JHGQ$xX+*iN=GG5%Lv`)4#cR!@JY
z$%Mw*5UbvtH0^@oVWJL0L3jWa^g?vzk*^UVn%}4Ff^`G0irhuF_5hL^;b^g*g2OjT
zZ@=)o<)&d|yDt2h2;Oy9M2GmEpfPU4v|a(>v=d6IL_V_#1H!4GoOu49M(`NG!~+R=
zI{)*wP-j*1>^}#fjY9&o72a<2{U9Ymyo?T@>Fg}Wxmn|>%3?R)qWT|Md|ZZfSMu#J
zzO>ER>iuJQ+-{vT-P}nK>gWz9wTu;r<ue=wn?}IP5HUX)>W4^!)ls;V#LwTb|D-{k
zmWPRJcBSmNN|4+i%>jRK!6R4bN6H3k$ICebqL$vIK<s5kRu)75Pxumbv`)SmrPtQR
zS){t~R=66?79c#)6Wuuuz+jfgi&iWbfJ7#PWG*36`2~?mpCD%fLK?#ZQu#qgnCss<
zhAC;^N*x%)MMOl*?Kj&`ya-rx#sPQ@>%0%!(_fHGJzJG#o8=UF(-fvv0L;osZBhfF
z4sCxlvj?Smn``y$)6Fo@>GXPKS=oz*IO(|JOn%B?v)3v3n6{IKWl;|gpM9MF<uob+
z@g5cyMhW)o3>NO`t&p|;->*a~F!1QQ-}wJ-B|Zh8P4cQUD_m90fS{LnF;uk%S=e(A
z&JT>DI!JxQ)`q*Tp5E8Pz0pGE-^RzSMoLQfLYB9ON+##0L*<{B4pe%rKHhgkGAg0O
z#)}0^hyBm>Z1Ti(=vbRykyY<;r9Ee0jd62hUaPmMb<A8t&QM$XlgF6GGk*gwc~%K&
zMY4pfIXdqU8T$pjv;t76{9lSQ1O<5oPBK-jb~W*xLUtk;Ak)0x22EZovvlo`SW}V?
z?cM~I`+niyn5!28Wr-KtLLFGCKDV5Dal-Fgkd5{8HS!BC&4^qXlsF%kzn$}tpLej*
zW0AL}<=I+3#u6$MBxA)KIp%fwQd<-vy88>VJ^NgLj<@yK$ZZ~(27c0!&X1jzXt~6&
zIjNhP!S58f5(?!pXJtnd3osqEKAfLQ^YgJ5qA;JqGii`_!!XchoS8gZCAOD@;N#15
zm!<?!mYkmgTz_mliXrCSLlfi;MfOQ>&8Y)Lv&qWmnC!1-rKf8oR(qWP<H@SJ<BBQ{
z(>@(#xqv>9s)|i3G$JBPBNR6F_Q{Zv%FE4Fw+Mf!q8|9xmAPgEN@*qLB?G^kXfS5z
z?Rsb7knfgr{RNPOdKi|#f!{K$Y3`rmq=hC}tNk_pNXNTj!=k0?`}_S1X8L)y_>qi*
zQA7)j6FXbu<Jt4`>oaw<(tTUCo5HebGp^NXJ*3+b&7L7C9}tr{ld)8#@!gH2okIEU
zNn|rJ>u3#Q+kqF%FgIjpdw_wdonw<qIn?SUBXsc-A)|wA8~0E~-&Emtz6B$XAp^Ev
zft=3y;TQqcpk~AxcLoin`iJov^mWLSHX*`3w05*A%*6`m5xr>^;wo{R4({--mm6GY
zl0a4H@bf;;%*-^)7%!b%6{vijAENZu+o(17^xap;bWGMv_Qbg6foTyd%-Pi9S}h%Z
ziqP0|o(1WBU02CL%#N{jlM>d;s0mn*_NktK>420Z8I8Q4EKKCXmLaOOvX6-_Goq=-
z4~sd(dp;rtpNJ8{Odbrx%lK(|-rKz{GO7FB?Cr_D(nx56S4Ia_NFRs|7Su1hdf;kW
za|}B*oe1;|czHJJ_QpCS3ZE2b22uKUQ3WV)#fQ+Fe8m_j__qRFcXRqTz?q(+95*xT
zv>7`B!F*ns8K`X3me@#G?eh(LR<Uj;@PVoATH-Yu`(W$(8P~$&-9udI4qnUC2F=fC
z`%j`~)y@{!(Rowu&o*O*wyri+&d&(%Cp%cG5ce|_e{P5b)yJCdESnxXQ$2cNu`MOM
zElb`(SSqUdk9;CPQ{et}&Jb!*T{>GJ5xucdL<IB+ePFmD`g>5G-2HuTFbS6R)VG%=
zb?mfHRi)8f&+rJI$i@WJhF;jzEo&^y&JIuTuq@*)DlU#*?>F|7tL({;VqOnP%`CU=
z{F3Atx&o3|Zn`v`w!ZA&=W9e+8eu;?ptEqQpKNN`Ua0mUN!zG--A#Muq~Df@XFfmS
zMm+ZN($(r28e^kg$fJygRwz(@U0Ewz&o7r?b?4`8SNN%Gy9C#p8@Kx$LE`9<FvZ~;
z6_P0-NN4;bR3AzEG>I#+`MwDc--n_%IPu~s<aB%g6L+%#aK#j6a<Y49_ckaB0|X+3
zzcx-lRcq2L`+UBTY?>-jS*e#VB*5nGE{Z?Y!H2b@F$^`f@XMap)xRb0aQbdXc^hER
zOlR*xLUqd1z3ilHmd^W52l6-${)cnG(x?y>XOVEV$qLiyxPPj4R8Hed=<*rQo-bd%
z7-D~<B=z(_7lvooH{<EOLzHsef610f-K~Vca=Nr~)Mz1hU_DdKU${1{9ueSzt%n3C
zhaYhg#y&73SpvdULI<|rsPw+wQ-0bK1En1`jq*!0J@Sifw-a@Vb`$xvaBgaBYQm64
zGgsM8c+4hv1y@948m0K0^{ms4teBr?)<?B}Qe1FYg>K!^5}~}$p~K5peXTeCf83bK
zYkt_PvEmUbFD0XkD?Clgv>37a!TsU15tfOvwvXuFH<jJ76;u3_cQIZ_HVJHtwb8q{
zsK$O*XlyRKt+Kv&>Tu#?YwcRcpgbs|og&rAU88Ng2|m5<4bg(=c)&T)j#GqSGv>rB
z^f7)YTvQalo>sY*hFf3h@m;r1F56#BR<Y8^+*{(3Hkw2T5_V3(_#*VbX=$*N=va=O
zc_*2=>jsu@w2Z4l(E++r{Rb<O#F<p59VvamZ3(^X&=`&L#!<`q9If=PBt*9~O-2+Z
z<k0M#MNw@D2S$Ofdrf2eh3iDd;~2M%BHZZvdt~luE!h!L!{t>e7bQl|Rf`$>X>ooK
zPbv4=6fgH$J$)-T#e%8U(OXP8nA#eBfh<3P{Ra<v>8n8Hjp>sk9BZAM6;>kwhbR-n
znmds2$$h5O?7gyM^sWiocPs?ZEryet1Q`PS_V?}*pG}Vg#u*!D#@PN|btq}Ts^A;9
zs5vw1GWX}$w`|ruYW**!`of5?6TuK17o2pl^rOu=V$h?^l88LCxDtvFo?M$pIQ!3?
z6g6|UZk_q%Gx$X(luNdmMiMe6WieW$+mM;|#L5LvCVM{jF=?2dg8t|)5@6mgy|?Ge
ztce*$tUqpJx)ka|6sOK9G{@U&T&lP|cYWsT_N*r@NpO>$=9|_|hu(P05b4ZlPrb5V
zOv4>!kX{y-@I<miyKqdD7jC=s@}{>iZULvM1*mXIjyxX`4JPicNeO3i50%Iv56#vu
zD73-M?H%#XB@HO&3JsS<pB^eD`ktwL)O4cI=`D_<Q}eYvbv+ec{&i|$J$P{6YHJnV
zi2sQXao&IuU-5t<*%4Q0J2D2@p6H1nzDb6V(2m9#&10K`-TAFq*K9T<f;NBnzXwGo
zX;IUA6mKgQU|!iib6Ct}Tq7vUQCD9`F;JM`z4m+7-;Mru`X6X`=4$+ayfIcmBKRYZ
z#?8sKzfZi3F%w`QqzYr|8Xtr1;Ql$y@mg%DmfjmH@7x@xXXYvj6#0Jr)+YQJ9c|$3
zxZwL*%n&~xpN7NHlGdx=!ME_g_hoZQeWZlreFMCclTh5YrY~iuQ0esZi}w3Zph<54
z=>NHI0?Z9$X)hN~n95g<7jUb*xTwbN+DjjyK99<IH<NOsXJ)e=Jc|WL&(zs{m<ZCW
zs_#ADQB@{08^7f;RTXv+0Q=ZosRjh_O#+>OvevksVWsY!pDL7SM7#^Qsw)Q=m*k$R
z)gECj2~j6Cd1~rG^;bF<NjZ*EhiM*3lHbK<7ft||?#RTV1IkURpV*9_DYX<Rf_9Rr
z`PQWoSIDsGNPAO5nKNlK177o2#G&I!dur9!H7r$VY<gy9l8|}BLZ6YLSW(Cw+h2H^
zoX~7r!*z(8)(!6|+-zmE)`YeyR^ra1s_m(-p8dqS^ACwFyf1?(J-e(;c$o>=IGi-a
zh1<fi=~!F9xML4({&hMn9^=mdSetblZRkgZ-Y3pc@y9plK0)19G4$w5bzY)kSme^+
zw&2HnBrA`h2DFCvp<;Oc#rZSOIh5MExOgWOva^-=?Rdh*-`?v6jOUvEv&908zQU|i
zZvo(Mb^{f$rOzSSO2*jy$}ckX+E{TM8OKy8IOK-3XMM5W@C?~yZ5aGKC*iKOX7EG@
z)S`=6w_W`D8}-qIF|ykRL0X5WQ;?HyqQ>!RnbdnIpO@>Ty0@b+;FsM*Cmk}L+FNq)
zdZ^4!q8a&ZDV$p7`Ex48-oGBuz{cVqplF;!D(}g6BM|<_H0w5oPn2}79#W#B9jlI3
z1Ds8_f#*>1F<5mG2^5R3L=QGW?cQtfkj;*mtGax{WSR9X&?eFFhVrK0%=2OYaT|pP
zB*<xhi~Sa7854VZPB(;jEx;qlv3I*kc5|5pf42gjXm9s)7+D6(-6TzAGRAu6Z<py@
z{-f_Q@q9S7s@*qPB$hbqbd!?2{{(fZ0@Q>47|dREJX@6n%@EOFk?A8Hn)wbf{h-MT
zvv!nK60?-Y0*^P07|7j!lZ;Vl|LLJB==q!s?E<{BPD&hRYP*!EWN9BfI|kXHrqY$d
zfyC1`8iDmz_hjGbWQ`T_rE*H&o@KlBWGD19%MA7hRjS{c^bA{5u#R`9vrJUQyA61E
zl)sHjhA2>6-sV2RmX45b0GSaeI#_Gy`=$g8mMq=Eh5P?5Wf*P7Vm!5n&TOiER%k~z
z;@wemm@Z6K?Q#OYRESn_WlAI=y#x(cXnuU9lrUSAzUwjf@`0uS&WBEcGhRnCqUkiy
ztr9SXW>^LOb;kvFlE##5An?`nnk=T-Fwv<E4=CtN!RnDdm(iucQVK@7x|O^LjbRLY
zE*$}8_pXn9@e2Z_?}z)j@ZBd)_YIJ0Cr?Zf;J+pr9IvJc%gFTl9+d~|e@-5<jWIG2
z;7i=2|DVNgq2^xNYlQHwb^c&{H*2-|s}F;C9&CDSRZer**EOC;=WfsHNCs3~-0rTp
zQpx-3NeW&k(#`N#W9N49tzX~1d{NT5ujISd5_dXnMiJYRVi(h~hAk*}ozjhoi)-{8
zYx+9OmBxMb<&BC=Bh2bEBcDq!Afn!@?+in&FK0q`mIyPT5?w_SFeeyti5KIou-bsD
zM8hDAW;PSKzi1hossS!_k9KK|2GiJo&i*Be=5gR1#by}f8#VOqGtnEcNW}~KGDFJ4
z>4c0(Tk^?aUC2g&J6=C&*A<~mkSDm><P?XPwhCy%`z>{=_KGr%F$hp<N<ZLQ^J}Lv
z4}v{@k^lA4vvT)&E@*jkePDvjKb%$ab~p?iS}wQirsQxq{NB`71aVg#-82w0Vi6@1
zG2IDP)r9-m;9rnMLpOe$L=#)c>%B${_TeY-;WCn3XOBG7&m+&GkH{f_{jEA|NBWLn
zS%ZB<#?L*rYH;;C!nqOE*6`x&lc7_;u{Movta6nwzbea`Cb9w^h>D+yCr7njxvHv)
zWI0Vh8uS}fASg~<8=3e$;;4#Q1^4s#7Jp+2RjQf9#Fp?T^bNTZXEKcVjkvd%4VayN
zocCQri9w~$xxNw?>-IheubpQZ<UNBX#p#alkw*+|TEyHM@>gpVh@DGG)u5!j?|Pz+
zC1d8!;tPUu>}97Gz5OBdh`gR8mn5&ORU6I9>aRF;{h1s2m!F-)79?zd@2{>wGHrWP
z>vvt6D)Y>`{2k$}8qY{XG4(g=MF(EPZ<uE?y9|PHKE2JqM9IFKc2dGhTEQDu_^{+^
z)(M29(EBBl@LaKJu^}N#tP9eoz655=r<V?{5Pm|iLAso(KX+Mcs5c?9O!$}a6SGj(
zLTe<ihjv0BnAC+2*$Li-gp)_Y*Qm;80K$2SuGhLj2ts3w^t-X6>$C32e3RPH2H5Rs
z`_sIokIfBlwiH=z0<Km3gz?pP44HX8V%z1TO4I4-G&uR5W2uUbFlSMtfN(TU)>cis
zO!ZDzwpbc;ycBmy)p$~OUMC8&95I(ocj8wSV_k-;n;sD^YMu6;6MvTrK<L%@R1(dw
z8fJULa)RRwKNGaZnN*22ccfI&4Ys8QNSaNJ5jNdqgG=!{6s9Wx82rqfsQUAAJd*Tg
zv(OB7FLC;*)Sjxu2h4eupzmh(5}r#oyz@!FA=6>j-{cH%JFQ7qS)^96aKSeCfY-|0
zv^Akwi-E_|WLHI>ybp)$C-<{KDK8I4=;i8mdDn>t+-w8FQ$~aSC^@3Ct@>=d*$T(n
zb%fir%#Y0!{k;TR25mjPG+NxO)te+abK=f$0Tj->iIJ;=zV~^n4!ehao3d%yJSUr`
zCO-k#VPEhjk@=>}i6pr=vbFL$!<JQ29j)LtL^gka6^M>SMu`G8@>O4S!r$@b=Gax=
zFO#)^{I>l5?KDzi!cgnZa=t5lehnyI-uF7)Uws>`j_=sl(+C#mHB7Gc7SPkzR|Y0{
ze_>f}{J@6d?X$9Vx)Sgn_nc}}AaFv}k!+)%ws{-8(f_+2m}S^TCTJ_o92!S_5~3ny
zl4Y$lq(T*oBHM=4Qq@9JErNqIA&~STW@6&&QNSGJeFv1D<@u&*(=Yj5<cQl6qLVSH
zl%(^K(M3n{(HJ;_(E{5e&+WfKwpFNus&p2-=&_n$hG>D{FG-ucGm7zN?!M8P0;zjr
zP`O0e6(D!}N4^h<CY|<tYfQ2Jo&4x|D-Gn}1vzm#nkMxn^HvIb_x<NN#-gy~*^w+S
zE!vJU@$I}@#u!L_J8MPrPKeude!t?ZvtkzbAQ!61zziG4-@13{5w7+Mo7(YQBTV)u
z9~+?(JZQl+jhBs9*nNTu7V{8F>h!5VlIjw?OVJYn2Dbsvr|r03&d>Wq!T*~Nf9mS?
z#(ZP+^9wh7QXKRYJb}s(l$9>RQ^$;(heVNi`I!iv&m!}?=rxr9{k+!lN(k8kjPlYU
z)y5iStVbtq{}m<|`V^%*iys~wbTMlsGONKwvPI`qouauOYPFK6DLX|~L;s%IkU!xD
zGr<-=m(e&K7BnKSt6>~kncTfVy5=v#sehPGVb~MfW3;_!WbQfzX}>XWnPKrdodUgw
z23s(%maOOOzazxD=NIrIcMFCKihRl|nREL3yFT}}0k+lxe%45dHsjz=%qjDH!M$Hk
z>%Op7n_9+ic!_6w)*tDZh|OBDzeDYL=*#ew+#MH5=`18fB0>35uZ$(fUGvjU?z8JF
ziO4jnl$xp*KeBTf$ZwRQu$XKGZ4OAw?d%)(nR20YO9B`wP3-O9vQ1;1Sw@cQDLy=W
zNzI#(<cB}s;-U7v+R@RW?$;i4X67xe8n5qjA39l674Y&S^fZj?#Xk<|&VuZix^03#
zaojHEixom2lDE6jI57<W(gM+Nj_bMB9E?AdcZkdj%gcUpr1AnStLs33R(aBn(@58L
zgol3G%?11v+K#qv8^~^$Pt1%WO9huhM+01r(E2@(nGgKk5-yrzfl^R8(NxMJIv~gN
zk16({`;=PIZ7rl6D13K6Gc$8ENnrn`t4~<d`ARFz*eL=pnFM7^$5@b4%q*AWn{**w
z@UFiOe^oTiw{)lAFR#?j=M~D|Y@Dgwu5g=Etz6E1z#?B%_$hP}(m_gUkBSQAixwac
zAUELLRvzcmrfyoAz}{6BZmYvSl5&ChRzyTHkfR3U>kR>VS-KTZM%aQN&Qi++9(&|9
zQK+V+`j6M=jW#=EOlO$U=$?>FycroGbdcdXU9n2={%^x`*)%!FyMrbRM=OXZ8#;zB
zyI8OMx2X#0*K|h#0fA&f%A3hjXTv)zYo#Y+iUHafjTye_-L$?Y?l!HjtE2N-7aM)E
z(Jd`3^QQ)DsOk+rPDM+|&|N~_k-hr0TR|EkQ-_y90LP&FXsprptoI9w<mQin`WDX!
zPXf*_eru$T^<nhlS4cj5gB)m%<{MxaLEFjOGaeEXyP7LUlSMocSE~_s1i1;B-K0ZR
zj=KC4cCRd1dK`)NnQ(O%-&zE|vPnxBrEV+#CyHYj+P4+meNWDtv|zFncEwvT=T#=G
zzau`N7Qr$aaUm2T^4+icmUSLRE=XPe74zOxboDp1VEtOY4|#-iA&=neNZNj3^mNrT
z9otq13$JO`_f2BHzjZYRAt~Y1KQ7G|c1yY{+ns+&$OgO3G1w;752jt+uZk?c=*Yux
zOU+>GffNx5D^Gw|rq>G`eQH*cqbC?$4%^<2-DS;e*2RdR_r~KWXd_`7q?G=|4*a~U
z;L67=m`v{2Yyz$*h03MKt{rau&-Tcjt9YsppAv8uSB~d;$S`>KHtnCVi<W`0pxeEF
zU}{KF*>kXZde`+{ufyjxr`(V^FG&ziZB)chB*S!9XUL&s9&6h;l{$eiG;(jz1cf;K
z5M=Ka(~6UHf2_x!cPrkc`rRgPc&+;(tV-|_3~Ih5V59qEj6^=IskW&4RKtUG*TE|P
zSN7k-ycLRWdwZX=e&+f0q(RA#ZgDO1wG+TRvY!ql2rLQ*_YmmvZ3?D-jY0pQCsHAs
ze?nbECl!t9N!m|Ksg4O9P5XPhr_l=K(-Y;c>o7MbXqQYg{j0m2iVqQ{#*Sb=lkuB^
zWNS&}!uF}H5qhcxmzm=a558~fcZdV}*0(I_<+PGRqLUYjviI?$lHGr`zmmJZRI7Hh
ztgO7eoS~?$N2{;~0m(T&=;qa2Q3s9u(kHnFvjvMQI%3pZ7NMr;cxnT^CE32i7o|65
z<sMyGE`TBxB(Lr=vP5I?aEs2H0=u!k{_~m9+8$gZc)vi56ACjQ{GXs1g|mG6JgoHo
z-wOoEH9H|_6>idMxV(o=p)aiCZ{!2l_h!v%xnH8gp?aFTYCl4)?T^^W1>o38hiV@c
z;a*z=E5<2evMeST9*5pBZk{!09&Yn4#mLoaX;NmHuv!n4#yLvMg;CD~lI`hMI<tI!
zu&L-_Fy69~`O#2Wh}A2a15<X7gg-GUYPhnrbE9G*%$e%ntcc?jJN&*AWB>6m<SE@}
z0@79r4@M~GuI1Qs`x;UYhknVF*PC1i{L%Aco#z#_3g_*Zj-df#KV#Dun`<RGIXMi0
z^*v!fbHV3|4J}P1AUKpn1SeLb^zGXCYl|sDmVj`_cvX}d%d5hYT2%?g>%%IuCV|g7
zpAwxFh&s@?({{Q+f_TA>(0AT`TFGjBuh1N&L=QQFo-qmKu|ai`Nu1y5))$B;cx{EI
z8Wug%H}lpXyOf#mIzs_q-b~`S>9*rJhF|L3hnY;;Fo6p4En>bNdVYqS&fPr;Ok>bi
z&4Xe8M)^e<=kF>WB7tlchVt#0ZJ6v<@{4ZMm+C%Zvg}vRY#AstiS)CEQrqimx!o<G
z;hJX94^5=ZT8g`;lSyYB`=-Jak!G1hQo!=r+b`umN2NbW$T#})Hj<#^$dymv#p~{K
z%TeJG&LMFh-lRcj^|fhZzX%%Dz<4>Y9c}~82_4|RpBv>w6FJclG%c`|^l@FhI|~Jp
zc?r0v8GIk%72MO{ojl*u(=!GRfL!0}R(IR>WdM0*Vo%VFOxik1DGVrB(kyvFcdh~6
zWcej#QB5Fb*a`44MVRJx18PD+hA%Z@rPBbz-Bq5F7nfLKgT9w<1xXCeTZRh+5SWQW
z@H21vy=gWp%qx>WFCq{c%OF#FqLwAlie;F><4>y5_zcdHOq-LD`usDKBL<S)pUMcI
zfyukfCi`SgY$1Ukbx$YEI!w^Gj8!AA`1q>Z+w4+s-e)LzSJXAmvW##g08xMzd(+e=
zu|UiaEjP^c$F*E{%`Yj5Nf4h*;cwVRoZ}P)Nu^+l92!)pF9Wo<zv_OK2ca@3?z5?c
zP{@AZ=1ul0;W`d{Dpm`;wUS$j<^(GQ6iviiv&DZl!Ti00P?{)(JJ>f5YhRq)BTERs
zFs-U=Gu5k?sA}>DUf<Xe*w^J0Pv?r}5;B%&ey4~Q6rEbtn!`{_gOu@Xw-yHDfwTPV
zzSJ~$>r1lfa~Ic5^w6@LWgfr-Eq@kpRkKMvH5W#H>@QvS?oqsWhBuZz<1RCM6GB75
zG}VS`HXo7liW(Y_wGYmAg+ew<8qC9Z+o*>vP+PR5&v`oyi!cVe=M&wKb*tXO0W^PH
zJ}`gMb)r4P8E8H^Zq~kkw*-|(Y=UFEtjoHXjQ-{vpddtn>TO7O3&gBj^oEQstcHX%
z8>HWWhd<+q{yj8v3%y+HzCT42(^GlB-hlc2=i3@y*dDR4n6T7WrwT+%je1I@_gm3u
zhZ^5P%a!&3)_A)5Ii#HUr^Jy$DuJWSznsw}o+n<`t{!>c4a|h{)a*Vw%i(+|y_%l>
zZ7;1z^i#!Z;nBb5XUo|nt}Nm7<CEcckqYboA!@g38y~=GdkU~w*CkH;+nAMrV8eZe
zdwT@R#Q!CGp=>Tm$6HwHh8DY3&b;Le;n(9iXF)OQ!i~+nmzOb2wZC$QB{`(-X471^
z^$ezXBY(oTp^A4ze8lPn{c!Ly<?xBBZ?SU<JZF|zv4)(COz%h2mmt7NukplvtD`%{
z7b4}_FvGZw+fC-Q%!KPeQmC0>N;#(rPU|r$L<u*<X7r_|8x<7zQ1&Whi>xutysFK2
z_VRzHDFAMaNBy&Yf-R&X{gPRQFvgvSYeSioMo<59Kg}qVdGX`-Ld{+ZDC|@lwJI7%
zjoS=A<dw2$q&yW;YM(_cokK5CI?D#M@ExXY6Uld__^{e8K&#6g;e&Oq1cd0_ZoE8S
zl@K5f6z$^z07Gn_J%d6FQ3_5bnn9&yLt0HZzD@q0X%b?H(zw%hpGhcAmxXAS(7GoD
z>&Mg1XRP^ry((5ssJ(kjc|rbT3fI{TdOGco8PjJoD#Z8UBymvG@*33EJ8k$93b=1w
z2p91lM5tst^#Euk>J?}_tFCdKrSK1W)7y9ZkI_K%?HGkJ2Y!5a=mG9enSTr;Ck9>}
zE4O7o?NZ?lVw}w-AXs0y`m#U>To=Em;42ns#hz&>%t@<2Sm_AG>&aQWT4_KGM#L$}
z|EG3==Mn*cVJYk@a~J9>ay0!vD|pIcOsC7^=rl>RSrD8i;LlX^l^Zyp>pU^EQy!~>
z0|z%5GjgQ_*cZB;TXNsCw%4+J?*($#C<F>u0BN%Y-dkTi(J%W61i^^^;m~+P46^=P
zn-I36p=2w#+Oemhp`oaB_AhAxq(O<EM+ncGuKN2&C(&C47x4lP&}14TorbUa41de-
z;sarLwJQP^wyf~AtGfl&1==dmt-vg~5&%y|zW!sI$<x<XhNV=Lz=zn+*VNQFL%PHJ
zD?gj+1u!W@!ZSQw<iz0rVYh}63%21u;Eu9peEP05-osB~xsjSw!uw217j<*7ZCZ-r
zo$C(q4Wq2WhH{_lT*Pc&DOp{YvNT!WZi(A^dZ-pCITt}P4jmeWU|<ZaWOSA^@L~=9
zVMHnY0Y)}}w0C{7B8a1EB(NMHk7)%1i~i3V?o`7w&()*$cM;S)M+GOw)B0j*o&KV%
zJVtQSj<<g2#V|)DAM5KMmIQF!*3Qlhbs?fPB~sibn4$(@zU{58J?jkxcp9|_E$>5#
z#q<BN7E&JI#jx7RbDx4@1jo7lsi+e9QySyNl_I4pZyR=ALw<Um;qFWusq@cr<foA8
zXf$SnS1_$|y`Ri!kIJ?0e;{PZ4`4aI!K?cXVpyS$<&(Yr{VHni!WF-}cYx`BtFPpH
zX`wjp;*H(J!+42LA%QMkU!U*x{F^XhQ!T(3vAU+DVwXZXS$CFZ?2L2Fno@vj8ZC-<
zOUv(wB|3XKsj*ta_C8*5@&}D${XIM%uI`Wydr1`Ev_jpGGn69I&Rky7RDlP?dJVkn
zwb?;Am=$3VL=6ccZY5x`h}h@<g!cWIZ2IdtL~cKi;`ih@A0?XWECm3?o&crx?tIqu
zw~PRw*W;LwgHF_ju~q1^=s!!uATrEe@Nz2&CD0=32ECF1f`;qXgtpmc;yj{Bbx$kl
z$b13EGhE60Wc=&bFLe#G(0D5^I`7kyk2n>-6%P263hdJR5mmtczoiqTIJMMl`tpk}
zWS3d){_!4R6-RJtyVIr8M{x@<t)1{B7}uf_4Lh!s_Q<BU(7QpO6<9)$OvF~Z;!mYe
z{A)BvAe_N)xl-yAv04Obfa_YioAso#(!1a?sEWb7Z65MDsw6m*v}|ZqfS8g*)VU6r
zP5j4hp>xm*z%C@C(}{`v<I|gQt1g0=p5|TMDIP{+_R<HYrm1=7^VU-x$3{OGS>g=3
zAs@I1^p7`GPIh)DW2L;sGcq$H3$99VK*!m`M6)bJ9Y|T4aAmPA;o5&F2ZGEvHB`FP
z>!^DDvxK|^h$h=r<EPdoW!_gzi+4?&dCEda)y1$;ziPu|X=b>ezS?H?x_I-!{5C{5
zmJrsZpFeWe>1gcPTU`7nPd?0N72s+D;J5p)<s-$xxVKaC$J);$^WewYGxY9><o@@{
z4^ix8cBK}H8oY7#%+6`EDMEUr%c&$<|MJLZZ31Nk9<IIXFYC9?DZ4&Mo>y+~=-=i+
zUg>hHbhStM7E!`gsgNGGgpzXkQC&_!a(Fr~rF3%>K9G@(daw=iZl4v5pi~yM>t)P~
z{#O@)#?+}AN9~tG?=urq+eat>g)8|)!#Lt`(wyO-(WJQ3(1(2l<3)8arMmw3%chp>
zCz%S>U7&`*mr?<*x^F#bVEBY=YM&8c>%vSCne7PAF;ggcfN<%axZ>hsoM~rQ*P)_N
zs=xOQsj3W_X8b+H>U!6ghlxeQ2+IZdpeJV*pXi?~62D}yP9Pp6QM9s`F)j6<uo^#P
z0p!WOz;zZ6iL@n>_#P1L?+75%!~)(OQC8*0AvAZ^kiAw%C`JF{^w^-GBc0i;?^24P
zGMD|dhIcp#n7sn3KbbX36o)qx2-QqY3UG`f4JD@t5y~-yZN%PQ#)XgJHYHF`2$l?I
zMNUhe?Qv8;e?-~-&*oTgss4IsEeWCF9pao(yp`{-T!kO!68Y%9g7Q3p9QSjx9&Ka?
z@lL4C)a>cWNsY`(@e9Of0{LjX5AHmq2E6<1%?J=Y@~gZk?Ar?7BHaifS!v|UATf;H
zms2Y&<EM=zaPp9Y&k(ZjB^*3C&UZ6w+a*XTtsF$(kcLoDPCT5HOqt4E&?Cp?*OkUU
zi^gJdF`44~35SYzMh|U1U+G~TNNWXp^BLwf**kbXB%l3iI*OpP-y2cVn+xheyy@jr
zAk||a-Q~fXL}4X-q6{f1kea0Kq<p_I_6IDCzib>yqWQip^T8}9K{lfj@O;}_zo>+G
zvupDaiUm#t;et7~hZ4A8yvKk`gUN9%ghnmXMmuQ(;-~u~pAHm>6o)LAzhx`NP=hj#
zxtpfW?IuGoE#b#i->{`|uiQ|1<PXP#yxYeP+7fmEnZ|zJ^c|f@vAe&B6t@$$2CI<9
z+<<teVP*Ftqd&(JaWKl&Lf#?YDf!Mmf`P)FnVP^!{w`7pTz-rI6nRkbo*$ZPS4TMf
zvxw9Wti4_vx2N^laSq|5R4H-&yV6n*<wuFc5;N<F%Lr|M@22rfH}55&S61w*{%mQ_
zUs*e*jvggJ{bhAnJjegaC<yJmP5x8>UZ`y#R2|>ktn@us(+IK3Fgf4h!!wJ91RY*Q
zWp2;grdwvoptXnZJ%mOxvYx^rFYv6S`p>tUs|i&Ms#G{jKMnB?|39>AbgF=0=)^rA
zik;f%_|K5_yz<h(lvDMwjF-%&yS2H!{c|Iq0Za3)nadkQQB6IT?J&DMUK@PhXG)K6
zp4}sV<PzvXN`MS^RCjTM+munLdov{*&l&mnTekhhCuc&wF1qhDPKipw1KlU+c{o=y
zT8sOYRUF~`jXeOj1EIdKBh(1H-B!r13{64t;eN*itD6sHCcRg5Jy8&B(UJSNne5IL
zEO>s(7m4jqgYSBJw5fPHtk30c+Oer_JHqb)WI}Tz)FDk~Le)luU{z?)90-}^Qr??4
zZ)pESd#d(09e?esFT~XB#mbRp02nv}&UklnToQ$|RN2yd7j^T_BIFa<uF6CSU#*1(
zUNKxvZ*#`Y@{{V*=MbHAM`boY7fn`x1Hz?ZlsUpVKw-Pu_7kK_H4}d{lX-1X5J{(L
zB9dzh<>$67Hq0k*hjF1-B|O_SZ)xi7WXO(Dvp!Ax(w%x-R2!8+?U1W`BB_fFG!!aO
zO#W1$7;~Xu^z$1QEr<LwN)kkeCxR|;d<ynE^912LQX>#2P6T|B0?UHX2$?V$ufR<!
z?^5%(Mg(o&g`=jv;R1MZ6B<{fV>^FY>19rnU)PyE$cix}9b*jy$BI!gKAqR<ZrX6&
z-3}r<$AjXj3(F~s1<*srya&juV(}C#TVhg+F^2Y_s`uNdCmF<B!mQlsbq8meg;et9
ztB1KsjmS+4hTNH0Fv+taq_9|Uj%is6*gQ-Ykku7;(mz0ixkRRuh)S~#U5eFGP=-t!
zbSZu5ZE7Ej7kl5fy5Q0{f$!BE-#AP;((>c$k3zeIy-|oBE75eSkS#Ce#_roFsLYZe
zQ(vB`%;1@=e*1GZZ+7A&rH$=D*qpMF@r#Mg>HgY9AN^&;iHfD|MYoP^Pr)rhS|H%S
zr&5uy*boozBUz!;)_JCvD}4smYqsHz;W!WD9ILqQrkzcpC&00|NQ#hK2B!k~G9@@Z
zq=JEn=SP+rZ8>aHF5?vi$L+~;e<gdZsduE`8jZc5kV~LqYv>!F;7?MkN>7!<dR=!3
zlL;nODDIzea6zTb^||;e)(|47s3aNvIK}mx`H5wduqknGA{82nkrUBZ&{{q2nT)~&
z+r`5x_+?T4k$0S!W5Or10-#mMaDvfhJ{7v>e0(KdFl_&npQg7%-$1J_a<vu@@!71A
z>kegSZ`mJ3$8ZSNE&7C<&0I~askh2pU*_4^k9?}eMYhy@1+1p%3#`R8XMZ?dDjLZ7
zo{&87zO70_glNSw7@{r&3WF723?#@Jl!6qPM25bD@s84U^!m1ome*&IE6+YbeZD<`
zF3wLo_B2A?WJ}G=^zFSASLjON@=@5Aor@W<tx!1{P^=P`DRB73<>bg;ydo5R2t@>^
zLrF^&iOFp6NIFc!`CFk}XHnr1O|9^y9b<7Gj0IJ$O-Kga?R>+@>dBNcXF=P7_Rn~N
zq{|cn0QbpTus>r2>W7o~RTmWUN1uHk&oloBm=r{e2T<}^EfODHTXc3z6b5&`O^Z}3
zmK#|;tn3hq=6WB@&Rl0Q_eG@-kGcc5%mpdo?FktZz}-d3SAi)fJ!MOv3ue&rtdXpO
z%=PhJ%{Y460?=zVLFG2=`?f>M;c|!$;XjZD873<#`e}1Zu^@gHP8YL~7Qj`c8+^R=
z5^_mwsuDP#4pw=xgLK-%y7EBmfOg|BOH8V|wnK?zuuW5?^gJSgcr-f5ODyxi1p52b
z<6Ssq$QxAX4m9X@lsY(0SKIw;>too-R=+~YXSSJ+%BEADBY}Yj0I_0Vru1amU9KW=
zbo`Yalkf;F9-+-yC$0n`rF^|LnDj(YZ5Hz@apVg$JimF=Sk0D6@`zFY0>&o!p5?7y
z7aPAxZ;i{%Nqek>?!x^h4GPdo93LO*UH>g%97Z_6_ym;v-E=$gw9y}9&_4m41U1!<
zFxjp#->v>M(~>dPMI~yQhE7Cc-dVvPS(L!{wwQOW=pGZ~DI2ez)QsJ?hhQ>}QSMzc
z)(_0T;ZVvc^Ia5ozGF3(YJa`0!jFpiv>h-@7<DhRO@bPvsO4_5fU6jicZ5#HCA&Fy
zY9opF3eHVQ*5#lhMs)3j7$Lp^wAbb3IdAT!V}he{wyb7uCaaGS%Yq5v5gfhe$Ql@i
znShomKPdK=G=wqKhFUq6OUD&BE$>i1EK2b4){6}*2Dxs89!xS4h}XF!3(_$aWuHjY
z8Y}~&$Om4$?&6^~X%zYk&^P(znx!yx+Qv=87qEu0bLg{#HY{h9pr5Qow+fll#~-`r
z^qEcoapanDlZ($}L#UNpLN|e)!^EG>lK;u=;R4HW)%#*+EBDM95zPZ^s`_k48v8B#
zq}?J{3GUfC>CmI5X7Pb#dlQ0RdBz~#B3yV&^FkmN5w0hQa7mWdwlm?*W25&qmRpDV
z<A~<o60<=0ZcWCEN$5KxI!1u4tb60Eh%6$cQ7>dFCl<xVe-9Qr+gu8CaS}3ayh1zb
zr#^gd$s%^(xtOLYJWTjJQjQm`<hicfl2blngrvB#R=h<ZlJReuib@34H~s?WuD-`j
z40V%oFGbeL2Jcy(=A33CLZB-kn3D5^H$6jIeit>P-uJQRQx)r~?)d^?5rkW0vwc&u
zaMS#hmTaK#vswz2Co1-il~+pt>LCKdRr#v1rKRPJaqLWsL=GonXJA2lNa1<0{-to=
za=9Kc0fJQE^jq>s?7@*!EUX*%-0wc<S7?pw(V|?Y62_6hx1WP=ziixe#VT|D<Iv)D
z!Ve$e<Ehh_8+DyeGg_J8FliJS^dmX!h=g-Az5T*lCr)Qa1~v=|Pu2|Xe;mN=$aX5o
zwz_$HkuH1F%spFHtHL2#!Ha|weJ4}7{{z-JX6}cWBrb+xp|m!Py|^K3?87*rZlF&2
zk4S{UaO}&b^1<jeZ|#1LJ#xq368X{M?ClLw`_JC_(+gl(*IAbvQSJC_8AIXrgWM{#
z{r9QhA5=wQ!zJ}mTL(rDjB0r=&i0mO@^9`G{wgcQ50DN0()z{iqP>1hCLV{1E4=2B
zUlA*D8pcc@a){VOBQQ{tFJCr2YxojCiOCf4x=R(d3s*}C5*405*J5)AoMVl6(N9ct
z+KGgAN;od?@<kjqL*LS&HhG0sjZ5j0@0=$9z4GXSmiKwZw~pqDre>SvXkWY|^AMl5
z7`xzZ&3!AwdPA9>l4!}<kuQC>o4s8&M8qom&UdSOTrH}wp6nBBpT^H1%Mv0jkxT#U
z{`}`FQ?m-L$50VE99VHQWhFdOeB6HHfXfqn2<cj1JiWoZpZ}q&;njq&Z;Et}zqUbP
zhffey{2llflB3U&L###JO&5MCX@FQ0R-8&WBEsGUIfyx2L<-7hddJ*@N!PrKGES=p
zU)?K*;D5Mi@`ZK5Ua~=<=k#P;s?4x~<x`lBmHcQW7Pz!sxFAX!q5$VUBkaAC4F_Z<
zS`vbrh>qcB`_MhPDh#xG;5f6lr&JMh6fs-?IOH7?eyNH1;f+5RSCLdxyqqCO6eBiO
zVO$w+x)dg>TX}3hZk&9<v*hlq)#AwIFy!vy`%#;+>0j^v`u6TkvB!SZ8S({;bE@zn
z-x2}(IioKVo<Dd{^3|Y=o$G^{*tlWUKIyBYO|C@Jk=3y#@+WQ;iob@}E;ECd?s7&n
zi$hQySGK>%yXahtrK1BuHHu{_dDB6L^fFC>$M%E#N8bzjp3?LDSL?xfMpW)4{$p%J
zFH4bY<C}L00jSi>c871yNC0?@0`o31u<N^lOVwM)mdn3>?b+W!B>O>E6GXz79~?<P
zFTr4J+jN6TNdhzg?|pmPK!Q4i*uFwTgKg&Ctoqk^%lGOAyyDg+^3W*2T{Kxfi~g6?
zWPtX$5tjm?A4GD?1)Ps)+}o<|4~OgrqBy)b{JvGViz2%HgB+7H@;T4V{g*B~+E25`
z^9Um${8!dwOU<o)COBbiPSXBfp@2>GIIe70+PHE=3|B0{U5TWynLd1_XAED_O!Q>V
z1v#^ZkV3>4?q<u%_cF8T_mk>bM4XL>Q0^Vmj>cGR?uMCN2WbPpTkZ74i`SD0%-2gS
zmv+0GCYv^Ojx2;=?9Dj8>!w$h?y~k}wI<h4Vat+zvcKqrD3%By@Y9ZJeg1s^JHI6R
z-e~+T9FWMaYBAn1CwhsD>hS~lrM&5;LmsPjXg@7;g&92DLyG^M?-%%!EU(8p#|oa(
zl|X_dq}!l=*iCivY_n2rrTE9FIJdYXYgXP8x%N`u8*aQKHX&5T#t+>8jy$nd@87z9
zd=H<MEmJw0`n-i#(y@f#359}f@o!u7OiU`FyGNsBS#yRNLR)k#J#`G@^K4fMhfvkh
z<1HoxdBNSW&XHEh*)_p>ZbKpd8){SP2R#(gwvG{sX!9<z&B!@mU+6j?VC2Q2P?=Md
zY+ZzsV~nzP`~Z~&CE2fUZ+{k(FXN}lpK`KAU3-{Vj)*!x3Q{i0(9gp9tAn0I1A+~8
zVE)Cv+-x7#)?Z+<x9kSFQ4tKE*2DGulfGPy-A6D>!RUf-*Vl4#i|jv0?HW+LPJ(Nv
z_+ijN7HGZR{*rzV;b9emc!7k!<d%<%k3zYVHmZiyPb*ljiy(?V4Aj>*`w|{V%UigZ
znkGJw6CxHQH}Q~k+^AGZhM-Bs`krNpOg~wl)DOG0I%Wb!-FgY!S(V&3S!grPa5n?i
z^0^!SU3CwL`~XkVHLS_Ge91WaeFYu0pVHt#*4;e&O%4tb+7%cle90B^7|>@8vHL}Q
z9*s4DH6Wc?-`x#7Nb&hvgUdLr35l`!_J)cI%Is;*cSP)|PMK|Hw*#HFxyZ47|Btq>
z46ADE!rg3AP(e~@Q0Z>z5<$8<1nCkG35kt`w9+9VBHi7f2na}bBcQ}4BsLv)F7TZ1
z`|kaHe|VmAJh0YWbB=t+81Ga9;FRjDgY{mAyDvisfKdL*s<xhSi|U6Nv^D|)m0Re&
zijWM?38F<5o`$90kf;{7`Nl_nfnWo>-#uyx&u14~xmK3~_d*+Kt--eycN}(8^S(qI
z$r;{}nT0*_#;|Q+n0x~2uYbJuOHYTrpCPnS!#5-wE{`^vc8(br%!9USVZPGL>|8g4
z9CE#6QVXGS;uJ8F<rTkn<{7$kO29&(Y1avFW6(0+=r;Y<p6#7(jsl{hEh_h-9NH%Y
z{9T)J4%!VSZL@_z6@&BY^Bi0k05oajtY2b4#H7m}*Zl3g#M#UDuQ<KF<|rfv0__!j
z5eUbcxYIXMEUWo@3?-#$H6R4-2tx9qV?76vnfq^|?Dvu;pnY_jKT+2B!lvus_)O_{
zP=c$s6WB-zZDJ&6G)b;^J7&JLEz>5w3}Z2J?-bX#@i}IpAJ^V#u8sKi;uapDkM6F<
zzJ9?-rA#99Y)wztvoBf1J<0Uv@P)GmZ-oVXfjicL_fq+&jJ*J(B!F#)mqhro6n})f
zh^gm$Fdf(Z5FiKN>oS3nY~8(3Ivg!MTF&O$Cr>z%4N~%+^tu-)!{IEBiH;Uv#h};?
zaLz|p3dG@s*H(FTy&qmk#hV*8lkQ;3jmtXF@yZXixgDK{MI%+b&(q-c|H_3G2;F!;
zd6<Er_pyWWs1b>c$9w(!|B)Lz_@p|X?~?rQEl~x!sMfE{csSWgx2ArAE$q_>5D+h|
zEYxhMsE7fLNvjjSr<e8z0}H2|8N|rKbB~J?CAGmf=J62y9n!)AgZ|eAN-+Uw2tIac
zaI{=#zcK7i+a-9ya(7O+5$ZQJ2481<(+>){1A_3%*WXtVVJG*YfpDCm+`0}rC2*{{
z^nI~OA>iq*Z7bLTXy8-O5&4%(AR+wo#p5-Dj4nupLCm?v$U>Po8Jg%!vYJx}ojxq!
z*}sPV%iolBkG%>+ml)}_2A6p$6j%lbXdfrOS-KPck>~i1)_N55S{yCSv}=N7SBiCZ
zrUqHz$Kd<+-|Jm2=|4m{yd>Z8ia{(azoS6=C^Kqd?ottT%|x7-$M2Q)N+aB9f-p6S
z3DgqkD=)Yenw{Z}IeVx{g#F&j)ja+ruIbC~w7@C<`I{bXgj<Dx^DdV%6zkfFK#3UC
ziVi$D)X3VW1^gKDXN`w4RjCUUCWE9Dq8hQQH5k-Kiy2X>fbs!g8630swD0Z0sa)L@
zFT*16lW(r@oz^M=syN2{pL|dcNsXKRV`#a3qTpq}yK`>bxT)KWI;nnPa!I$wzzOO9
z?Nrm`R3B{00Lcgh;vxRq3t-AD7kUN1b|2yO%1gO;I2L7mvE?A?CbT&M5^0~@Bj@W_
zfxxdf6g$PbcqBiRj*q`u;Q;ltMPop`S!C<7aZ2nxM{u!i2+11(_4dFL(R)`i8%m;v
z|0zJeA+hnUD0(Dj)zFY+XeEXYZrX#6$cnLV5eWtc$CGu#mCTqxbW?A^NPSP3_;c7r
zBnndaZSh_43p=cG@&_dG0QwdXU(Y~Ah#Y$}Kni`)ML^4?i8i{;`^)1G2O3(;KZEE$
zFcMAH?X8M$Q;t=9!Lc#9)L!yCm+!<%&VDoC05;C5x2XRD87af?S)R^6<Rgb$;sBus
z*)C*CLS@FVFAkAb?FGXAkdR<KofvIcSMgCf1alEENu_lRH$I$8nBV}dg>vhX7aNgQ
z3Ri9b=A&SZIm-ex7}GW%J-~0eJa87ggTA^8z8fp3*h1m);8K2C{+0ANuf(t7gm?^0
zv}rt2Ms<*?1boCyG+MW}3BA?W+|ADW%>w`);N;bA1Z0}T0TExs7`*nsJr23x;ReYy
zeME3=XxgAtY5DRqmLZ`q78i{RXYWS&msDUpBqUH{zA|uu<)-lkWa=EVT(kKq;_BA*
zDq#Jxo;D;u2ZC_^RmYM-aP68~DGA^$#VPLb!F_t^*N6cX2fLD`448WHtZ0l9cV1tk
z*!)=24e+52L#MxtEL?x*lvX!^(P%O}2)eKh&=ySAJn`i+^nU<F@@Q~vLYsL=`eJ&x
zeChfg06E7G*S_3Ub6`72k_e{hK)Dm>(fm{(Uuq>wpNui2N#KyAA;gbUB;=S&%WV3A
z`IlE17+MS%_EpetbHz$((&&nib`qQB3m^Y8QjDWzlokYeQ4)!jrxB9S+x`+w5@a`m
z1QN9*kAFo8^f|dt%!gmLCdmOEpz7|<>m&mE);o{_o-LVX6u<!XP1lC!`6M7N20htP
z<24NzsXZFJ0#cgk=oPMj|DkaKS$^|nmfr$Ww(G1`&o7Sj-)$;_=N1VQT|B)Lu6$Kd
zYrJkya1{F=7CnefV$g|ABcOt}tdS_Y8Z5SzQGOr#d4yyf_%E_IG*<}5z`Nb)FHNa8
zKn_PNQW7V+vI|MI|8hNFkW-ES2!<gYrl>CHj{b{~iJT2Aajt{^qDj=|19<2{<`4oW
z6wm|;3w)%yd~6PQtjg<gDOU)EaUIdSbP>69edWcn{94ERU$1eT`sQECxFfM1;NILC
zj?RSJLoS{i+JggTfs2xo4Pf)MzeqKsA%+{mjOoi4TmiDCa&v6M4HM8CV`yD=tg2Z8
z)m`Zghaq>nsV>nYEn{$ctGpTh7~~LNQeO~18?>V~8Q`(Evxd`fLhpiglcthgqRKhI
z@T!DO1bAbJQdeVtE4t7pg#a+4kqHolK_az}zTP9@m!+6h`o3~|9uhsI>+cn7B!F=Y
z{c&Lz=9?Tc-!`RBWB!+s(M$;}j~lJQ=P}ywuw3TOC6tpcIrx=OGlSw#4OBh`y&wz&
ztS?`3u&@I_$<K4i^#*~LN)q_gcERhX4AjbTdySkTpdbA81GgQPO9^oV&$bN_F?k><
z^!cx}Y8gWss=aA$aa0BD`8)&JKb5=xG$v$%Y*v`x4*Rl>VF7kET-gR2gB%Q^PgFDW
z(_Snl8*G*gV<lD#n6CeFXN4YG;@TBTk!Ni8ZKRXx0T01q7*znIY&b*OX$pcQIn4&6
zWok`^&{Jxe1<jzRWP^CuK8#Uy^oo)^P#x*wzgg`=$WGiE+5o*9S;T*PH?(BIPk0mk
zB!Bdu-3ALasJb<13cm($JICfb<Z$SH<#OPB`86HWFmS=zNi#1nAOMi%fJG@C8b1GX
z!MF5xvYHCxk^w!647B~$m)yP-rCOkABksR<lO)5yA=-<2)n23*1wcz2r=uyj0zlT2
zj~?W3X--%`1CBwEt&K4wIB>yVSU|D^4DcvLJ-P0a=s0eJAB_@xh5>!>f3cqa=i9+6
z)7-%i6(qT$GjOSa&!l~SS)`Y|3(k|3`&t3=8&sr21Yaa_7^_g<QG-6AS#nCn1&9X7
z2_W%uY}<{KL<he@!4>r8Vrd1yq&s$NQ7{F3g*#p=_5&01+mAw_271sw^VQ9^<p{?I
zjQ@iBQ{2r0@u`IQ%Gynx0C^7R6~kX!$QKmyId~F`pTiG#gf_T^P1iXTo<E#KBnHVw
zz!_W_S811K#bFe;xMyUx{}L67!AyKACQwy2nHyT*47C)2CJ?1d!;6AEOs~-jbAauY
za(=)rhC+5?>&3;!g6Y=Iauv+>g!JaTIL^V*X#}`&7|=S=r`-#w1hgnKfVw9{2H*V$
zMBoi(Jg%b1DTuQ3fb<w!7tWl5+;snB1?tP2VCu_gmW^2gH}w8P6(<P*2jyC7&_}dh
z1AvDAm5CZ46F;&fv2nCi(!$V2s!jL6G+0bh$jtR_p8By#vZgpjf*57f4J^Hoa?o`|
ztgUC=PhU(NW1csa{%{KnI_6CQf>1RGL(KW`Oa~lZ1#NWqg)!!Vc1H_~|I=-F{w*fb
z3#X0-0MU!JxN8t)2Z3KwW_T!g8Nw7IV0nXJQ%wQ{u=F76DCj;BMfI9l>su!IlyWbH
zwaQCZrlzJ$gm@c!(?RO|88i>~&iB2Jr~w2riMv)dKLaL<D<C;aK1#SQdPe=X)}R7E
zllc17N)h2M+!KBo+pL0JLV~-^gi`{JrXB(-@lOQ<a8Cnq7j~&tHhTegyjm=$-I2|p
z^NaL->!5W{hW=}^JO|DFMsRtjc<X2yX$<Ih6U`&l4*q1|5;F-dG|~i!$pmQnnTSm&
z91+6Q%j2i<zOYa)F%ya7Z;DQgJJS72W&u1nnauzy9^C!gD{y-Ik2M;aPS%A26J$q#
zt?~W+Q1yzEB6KVeKLf<_6XKb%0I5~7sF!QTsJD6rX0VQc7?4o|6O)t<GjMllqDg}{
zf0PBjTc77`zT9HF|1ZnI`F&rqsM9g_XDdq`-$!RKz^nv%+0g^R3_&EYCRk2_LD%T#
zsH8S?tDwnvpl-Pyn&&vtkhvoNOmz*I3t@~{W$4_~2rr}r&X+|5&%eiYS;$0#=O~O?
z!1GmX06i$sm=4*M%TB&AfNQ#wgFv3OuM%btSh6McPy$_l%!eIUr<xwIB!SUa7Am19
zW(+OHptll?lzr$Z38Ch5_$q(9j{zLBK=(8EHc;%i2={<FVq$=_rQ}Ah73+US!wIrq
zN=6m713vmEZ7a6}jG<$>49))MSRBztfB<F*V{k)MHh||$s9><!B@-eS24ZRiO-V(2
zSDbT!8FK}wO}{B!S`n~!4uZyH)}h<RbX;CwK^+t#U;P4vjRe;>EAB$}vCk@i0h1wD
zGy;%Kq)`2(-Yp}!kQ1as@7)KCY9KYM;EI88bC4?k0P<=rjwyVR3*i;ZVUEy8IQJ%I
zgKib#FOBr;eII2&OIFSI%!Elmz)(8m_Y)XW&?(r`?83&z_G6b@aZ743o4t)pYMP#%
z<ywSyVK2y54hC?_A=pQ`%s9COw^+xTWA_3B3BJO|%%$$|t!(@u!d+k^{4z0LrTwc-
zA6$;)%|OC6Y<uY!R-w>3wPrvQK1gU|h;XMIeUw`THLF2%Mju+d9MLc2*L&9{xJbA%
z-6FK)e$05b0N?~ygQ&hi<-QXfIQ!_}3}jHuwjohbGO^#i4LtHch*H|hr9p8#8n^Qa
zgUtO8Epl*$HgJQI;2D@v4sXFd2;eE#_dv567|S*goe-sVDZH^v>Ipbqf*&@%G)V4E
z1uyS}$O9;4A^J6tuIGbv{X-(Kjzig0Zy`7SkkCfMEd5So(3%{=oj(8B<+qd5U4FaV
zhe)h`EJ(zDlyYCdb(&Cw!V}ddl?G*<^RZw`M>#1e>9xrd!1N9=e@ahIWK#hy;u+*<
z5#F^uFdhnsHXHjYwI^)ixjER`KZ6#07I#xq94#<DSh1}+^!+;Szr@;Mq|j<QiSGV~
zc9NFMFo3~0;!1JPo{{U*i#uAdHBWz;o>?Bvo*(<;&pdf!=(9iVv66be<1gMqEwr0~
zadz5tzQ1w~{werm-+zDeY<f51d`p75disvQ!6x|otn=N}v%x#hj910a*PBkOj#+X}
zp`RG=KZ!VZnR9{qrkf50&#mU33D9!cf-hCTo0JGR0`8bJwG0eYWCC9508T(Uhe5y(
zpN0dSR6-(=(;+<mg*%6uPeZx?REvWfQ=Vi70BG+qh*tp0E36Nx#?iz@=UOx;q@#zz
zzt+_e6{3oN+i8`FE=}iPkII5=J~*bioKq41rOk}<WB>Ebxog(dtrCZf=XXx)z*kv~
zp$Dc!H_x6V`SXf_ImNk++aC^9&sQX<F20lOeBLzU{144p3;50naZcmf=(FDQLy6<P
zea`b=O>Dc)OPi++O>t*C{%5_%CK5d_vSDO&<TNJ{pT-)2>#ua~35##01#6a)ZYqpu
zs<~mtJ^&H*io*R2*r^rHLF;Zq(X#cvZhna5V;|6Qzpnk-7<5(#UZ+abdp#!PM_FYW
z(kPo+Iss_A_S&{VuQf5vTldN^@j%C2|LBo%Q=iSViJ4R1ecC1}Mrucz_TZv}ntX8g
z5RT_{yVIW3Ki?CP*?SbG{j&$u!^$m=69vmRKbZn?W*ZjlsS(=8s^~f7v#HBRxy%sT
zCi^?TtYn{9@;eUkecBTwBq4l$wlJ2wL)X~el*H4!R9|x6fBrm6*7R%MU~13Q(~||!
zF!5I1lY9~o{jvXkoaYK`P8X{Dg6lNCUNQ<!6g5hIisRDVR8qoybiMvBZ#Rh7FU%;#
z^Tf+|{kV4-Z~<s&39=ta>7F+zJFT;|ghWxqh=G=J(bKS|EkRtVlhN}d)4|yzL;t+K
zN=xTm{If3-^5;nZ)1p!j!_~91eu<+8E1VvA%=?x82l(fYjv!&)<Cxh$mN>RPX9F_=
zZnN9!WG8Xw+ol6eN4n=Mr^BYF!zPlChE6?=A#7_>a7j+d47w13_M_?O16m}wNA9%%
zAc6r#NTCuZ=>AQfBNXU#e}A3iV@dT5hQ>}@5xFLC2L*Srgv*cY=J9EBHo&$wi`VGR
zxq0d})|vd1=)8$-Pr@Ojc@{J~@4YBnAO~Dt-g9H={s8Kq6tT)GO0Eg#ekzSfcK4dK
zaB8s~Dt4an!)E6cZYvfAej;u9T7|f{(6vue>@PaNjQdN0$trR24`Ev*wpl94EX18`
zN3$_AZuCb4r$PRlpq%KIAs^!JQBvg6`)kIcb<2Wn3+1(+r|0Z9t9T+3a&9H(X^4a}
z#@Y6X4k+tvL!FoHQ=7#RTh92cSDbfQYVQtON<I1>i6KQv@Cb(e=sPW8EZQA;H4IAE
z9+nr6F);41OTA;e_1NsY{PmYI1c4vqPU@!+b+ab3Rp<NS4!ygR&K{#hxpk_`JEEhg
z#-$G%tGQWz+SA6<?)!tWdCX?G@$gJZH{9|o@ir=-SMO0Y8yL%UeIe$;R6^5iCbr3g
zJCaA-YMvM|u|wG<!?B8E1(}P;W}mcN>movZnE*_;wZKpA2QdDYPR51ZBQzehRw8cP
zYNIetoonMnz|)i3V3>{G!!^_g#5nwph?Rpv*@4={NX4nlB&Wm~(bZ#QQPaj-z2{5G
z9>VEJ@juPz>W5=;EqMsE{Fcc*9XHK1c{Fsrkmy?tMz0sff|Gca1731-Ei5O7p5A}@
zpt({w&CpC3^XcJGmN@@09p&mS=lM40fG2@z0J<;C1U`hu$CINo43iGZrJ(pi=uccs
zCNX%5eJ;~H>>##8eru^$EWJXtXzdwylg#Q(y!Ww(s3nPW{TDT8kpV(7Vc(l~HB<W^
zEG1Y|o0j%?qpIOgLac6%(jxK>h%64;&vZw*gYD^7rH*y^SKm65zOT?z0E?|C;qPWn
z`!JfsI_)ZOxshC$UrB6;xNevnZ#X`J+3%NEMqX?%*yjK#%{1i&Zgf5Dg8hUh8R*M@
zDf{n@TYIG6iOpJFH()44kg-oFI8S~I8t~taN)<{+9$odk^|pp=Z>_Ai77T3cr7x%P
zIM=Q)RJD=YhfY|vh2C=d`s&K3Sd!CtFl9+0=w#Gyx9JL-9aNQ=PJT9FTlO=Y%44de
z>_=V6T`o)w+?&mbge{GUKolN;-L43S)uVmLx%r3uo!)etCqlP8PhCi+3!55!Ab(z@
z_%2scZzN8Pq_a()-23hj*#!2G`nR!@uT(zvn-b0bxzen`O&<kkhAWPs&9=dlf{Rx8
z=-hvVG$-}2{uV(L!__l?uDo*{+mFT`t!~tD?#pc_Il>@tH7;iID#6zoAB_^v-KfhQ
zaYwJTt9cpO0~?XD&3Sfc3$w4A7__s11h$!rDJ{G`P%4B0X#*(XR}E$|5tpLeY{uG`
zxfPF=|8knF`<PCn88))rHe(rQJcSxHHBHHGx7Rgtx$n^{w!b@u$J%%WvvSH+(E~W!
z=VddFRnt>Jj48{?qp~kTI2*^-!8C;OV`IY<rF6nWK8l=`(k>1+%}k}O*p^p2faPyZ
zSvPvFux?{j*4P&{toz{Zy@gQTsp}$ZTy_bkT$ny!S64N^k0ilcvcQ=dB;`G!e2<RS
zvMNB&u{~POz47z6hC_yWv%2YH-?@8j4`7*++$<R#&zisZkls>fM!QDxu7nAHcKhaA
zZOrE@5;W%rvk{Wb=O*@412;r{Q6a`fBkxZv=mzL#mu1e6{m(bkhd;$K{@Klb{S|*(
z_lV_v=&(&&r^{>K_j{jA+vSYA^QiHQ;rZ=)#<Y(5<CKA`!Gwl7J!u8J2=_jNe5y0@
z=85oU<pyAT5zJglkVRNtdd7>WNHuKt;r&O7z4IiK+AOe&_bNH{S27X#kg#f?1vc(Y
z*#8Rhu73v9_*vEm*M|`e#q&vOW+knpQS@TT&o^qEkOfsvUoo9iBo4mdPk~YH4du};
z3`LHbjOV-k58A6?o_Gjknfs{msImL7cH?7<5u#g%eIS#rntnDJ@6P5q7l1wG+QlAM
z*F%~JzYq4-AS0Ar5c7>L5ZF^k)r>C^fcoX^)oo@^%i}EikHz(H7&j7Ybh}f56W#oD
z&02zjB>6^iU)~QOx^}xAcQ{S&sH5E16#TTs(axo3%%u2+g@3lF%?8lg4l=N3gqIN5
zzCX87JQV-rj4l;OeoR-KW6t84BV8pcm+6C<qJ5&6b!ENX0k6K3JID4@0n8(yw);1e
z84O9uzGk>j%!R0UZeXbJS1wUZeGF#l)b|rRT45trPb-X+A?pe$zW~#vygDww*9rWn
z2IO_#ib1+-K7`ZcLz?Qy2lo+ur@Hk@B$4xvuv%hTgC*U@Z4&0XcIxLp*h{_<YE0A;
zDaUht>5k|AwBcai?F<NYH$J%a+=^NP@Y!@(uegYn*RwBlfs_M5X^F-ryGhxW)+t_A
z*le6|D$jKmguTPl^7K+iuVWIh;!{Tlem+cT@UO!~@wn~pqqc*e`v<vcypm3F12@L8
z2Oa5=uJakfZ)i&#%)MNj=Waq%?-0C`&bAU_;&puryM8(3M7ZreE;!0R4~8G0J!h@H
z?Pws#m&mSFa69ovK$Qx5Hb(xgK3w&9z;g6_)c-VY*Nk=&?fZa)52>rs)-RGezrvc|
ztFkTHRn|1OJ6)@;dXl{zb_fTKr>FmGqq{0N?7FOqn8%P6KrpLCz#ZWXtLhmEMpw-o
z<#fA-|8-n1|2nQW)VA(7aWSu&u{&9rO!u%(9ZypOp8l#IJYBnWNxx0g;G@PK$&*0v
z8Vt9NRMIi>qBdu)q7(i}?0-#a@SWl_D{YrtWQyl}kQ0zZiWtGDDm;$rGz*?dYh6>{
ziX=YUNKSq0QyF}*#Z0Ayd8?ie`iXuq+Bz;CQ!Wo|$qj9B7n#jq_9-ltKZtKSfpws&
zn!wI#CKuUZ|G63<TE<W3N@pQTpAPqWlgK%5D<DDQv>-)^DWJ5}E8x~E=HcDHwn_J1
z!rGZ{8}mDXnqWT@-`CH%5x9GqzFmIUi!Himkv1Rh;|p6>Df_j{PAXNReBTUllhU*A
z1Oz^a**pHmDE{*RkDq^)>6kLD*qp9Crv7BPY8UTpxvL!QI4xZ!lIBz)>_?Y7K7rx)
zk~=G92l2axCwN;W9ezp6T=J<{#n(0LE82C@^(F^nb%-v+_RakO0W_l1DXUPV7g2D+
zrRlx2!1|aIeAK)M{>j?CN#bSAi;a($I6v&&NcNavR#7W`lhi`tT<@X~d@oPO#LLoS
z!Zxd0pWxt{r*;qlQGCJO%@TMZjbHWgVXyxN%6wj)xSztQ`b$z_5Qb85<8~)&zdoSX
z+6$L26JJ0TdQ7|PK9w-_{P|j>e`w$r?3DURGuq1i*R#DMo1$Ly&s(kuK8+CFmVac@
z5iGVh)&iWKONZ()ALe7Qu$a%KuQHqafX?PM<=h%&#V>eA^!_f=lWY0>B=vkSp!H;?
zTS2M@ks_<DG&lU1ok%gXL7XzcTsu1EBse{V;V@Go4_>uWUpgC-9@w`0N=_2o4^9h{
zWSG_BieBI98lB-5XFy?}+|K1p)&Hbi<MhqB)%>UO-OYExxpPGt9Ja9A=LhW)4?8R#
z$&*C>u6@ZvjCZf_@s0&emg(bTt`+G$nWI9&YjNUouZ&4dFpV&UdXZHJI0Qc$GZ!CF
zlfEVy7Ux0NBf7g*mITb<gmOgz+h3z1OblWT^+0OnUm(`d>@;Zn*FDbt;~r;e3b16-
zf%)#{+by>poB~`^9F~pyGtcWR!tcpFv=4goAON_`S+S$#Pcyiiz!h$Mza6ogiLAm<
z@+NGENxCCW0j{)30vu+X`n{t>RAIt55=N}ajGhEcnuoCabT~9HbIAd9ZI?I4QwsQ~
z3wdG=m>KE|HjR9mwme@;sYXESTc(^BL5r9|*nL>l23DcTh^=UD;=@<XZ(tmV(2_TP
z2rq>pxz*Hzj_v$@0ZI2<mBp?}>;twk0+<>az09`a@n={T-5e9S#yJC9MtHCloj5!W
z{UwV)ujtOAbZVpHigoC)Z=3jc@rAM;7fXy<?MK^pnwqErG9^x%&f==@1J^?CKk?LH
zNM&hOG+0%gMFmVRE7UO`J14&{*m8N-4Pp<chA*gT*vJ=0k)5dvi~UGDO}SZCqKa-5
zNg4pW<M;paj#+=bV<C-xN2cUEV79P2?lOv_hBT)m{C00MpWcl#nirUUs>xh%m;5?r
zwF?X<r#=w{c+5N~9LxKguk4IjMAV>03{|(E19RiXnBtipT^Sc-;`tM^YQip0fkPBL
z%c=i9S<HX|y(Vn|I6zzewK|}IX^<;EMYxb~<(OL*)#z5L4sfAmi1tNh;Ij*2oM_$V
zo5xElf`7W}$CxTv1#|X#XBWw^$-79h7LA4xM^?ha>5Pim4c_xV>@pSZci!n_HpqPO
z&OvooePYNuxTsMycqH(`uCOH8Qy;zPMM#`K!Z5qWU#@+-J~z$syUX1zvOkFwO%G{w
z_~|x#{r1W}OFH1tQsOGOeb8j6m)Q%HEvobbLB>ez`ldHXDQ4F#W)dJPZiX8QZRxkM
z2~;m3y54aX`;SXA10v+KSz?<(&mXW6Kcw;R2xc|tD>1)n8P$WRpk~skPPx+(@FoFj
zNEZzQMLtSgQ9v-}6vjXDjs=hJu%_2n<>91iP|v+3N{_KefeIY&p8@}<F=4_`J0HwC
zmGXRJ#XTTs3*3v~J*W@Yq=nqej#i0fX7dwPV6?rC0}*ERJQVW9!Dxs#^|>O8F~4k^
z&K4xjJ`rhiH{>tZ!GGOQzR@JJZUOGNS&Bh6+Jue!$k0bb3cCNfZ=xLcarIOEj41Ki
zwbv-EF`c00#1Y!XI)evuim(x3<*@7Ibw#gsEBsH|{deW4KX1^rlMD=cthB895zd$4
zGwB?Yy%XZfU%icjUuW<)eQFp^<XF3+JZ%A_Qty{T9Sal#-4~l2x%7EyWVmBvB_g>L
z%@b6~1;m$@08P`3faG!mrPcy|@2IhW&*JTF+#OJ?+n@EHO**XK=|P%!uiSMOR^&3m
zHS%8h?6ldizo&DwlX?y=X|{MHXe_}n2HfK`_`_HuS3Yt#R!{ojWS1;9<r75RpRafg
z9Qh4<6B`ruMX1a&j7-TCAoag<%)68Ve(FF<zo+|C$aU*J4;$yorwY0v^9Z!I0r5Xa
zPU);iN@z6NbG*hnZ1oSR>5Akdyeu2wi*O5u_r`;$hyJ?T3Rw{WY{R3IqiA|rzRHb2
z{xba(?%hwdJC*q|mm$jkkm((BJFHbYoOO}R+u^YH{6zJEmQgBN5`3CeUw&5`^Jy>Z
zgCL>x9bV4aN)8aq7O+pwqIeJ$O_S~Qe`DI4AfiPCl~f>8?}D&a)i9p%A7d%m#C#c>
zosQJ~pwUc|1k!=`DyR4WcruqRj=KD4^dhzM;Ud4gp9^mHCpkB+WU3^u!r<23iNjto
z^!?A``5tQo1yw9Y2<JB*tvU^B>&7r{OZ)nO4X*Du@C^GYand3Y+L5@dGivJJPzQ|f
zG?aH7S`a4NRI(OUr%yVRbx$SQ7mg=HQ<s%kf7$fguT$|WYS>GB4iXNk)RUi_Fj&;{
zgYvJqtkv2&`mG=o{5Zl?d%RW_Q3sN2Q4`@Rkc-!W#j*)fxmP0#>!x1fi;o55*gB^#
zz#2Ge79*W<KF7KuMhu;5EPu&c)Li!@4X2SX36}1ZJq4*bHSv}2nok+c2@MXeW}`K1
zvlVR;dL52ir*<of+l_<BG!~DE424psSUNFlI$L-4N6z>iJMNDdI=hSCyS_zH{A+>c
zyjrGR)pu2sir_%e^hhIXQ{{tDKN{VTrIHCN(YkC93rn1zcRQ6wwe4W0`|67xHj8&k
zsmezjzD?PVtGTL8zb#<)O_iaCmbkkr;0U@ZbU)#bpy}NRdskAiE$mtUd+Nub#E9p*
z@OxU{Oj!vn+VZFOWI2AFggSj}6QWKg#tXnLJG{F<NUPoEex*3kN7qMJO1e{}FpEjG
zg2BYOC^k6*FXt0nhVhUkl@68F)E_4k<|j$z+t&D9JSX1Uh_2{nw-&(+nUo%;W8Rvz
z9iIVzZ9)1uZ5B7e{hgun6JJ3@#bM>bBZ4!bBJQ4_Q4(!fp(2s0;Z>anpS&VaghRD=
z7udzD6>TrDmJ%pr4YnUY<_F@|c<l%JKbo3m`d3r^)-8X>F~3s>$`eY<e^UP|)^KWX
z(wXzuH`XD1(La*Rjt=xD+J3+ZxSO>B?t^<m6i)eY3Y7$&R^UVAk|~P5BrG~K-#Pq>
z$2nC~l2qosM{m|dq$=vN=iE32t~cJOUI^cjD-!!RU7bv)G0LBPI;b2zIxMmEjp%-d
zYuu;)T4W*e*{rVzHnHCDh@Qo@eZbxLyzCwb2&jtf&6TK4o_xXFm~!iNhlK{Sm-k6;
zL~E+JAoI(@BkN=NBx6F@E90Zd2)4rnXP7=~6D9i{t!x1AhGM|}<Gc9&L0iUc>G2nM
z9LvkR?h_n!Yx64NhmY@dL9yT92=IMLWEj0&(Kc2<uWF9Z_M1!<UroNeF8n>&|LoA~
zewe|t^V5A1+KF;?>^<E*F^1<pSnr+>sXwRz%2`us5n1%ZPv05HP5G<CN4UEYz$TG`
z>s~0A(7yyLCX_KOR?I4GFNtOFGYXyyl2B^S@$o0x&uiPrc03jl*KSfUB-y?j!9oh(
zYm>#X6wMLUyHDj)6dX}tEl+ika!c<e=)nl}45&=cPG`@3-{+OZ1ybso@4J!IwwkuJ
zdc8?yQKLa0XRyq5{JzD3v7xf<Jeh@-?`YruB|8EwA5}%PM6z-1#!8~ZFVQH^FD36>
z82v>>`<*3OQ9s9e7#E`ZYPmO*R<Y_QuPuD!X#ErDmI8&@yG@Yv9O*lT?-=1H{`H<0
zsn9#%LLm^TtiZlWIY3++2+tA4??8!@k0R^kgBhV-VM0Yj&R^de900<Qp)KK~T1k;~
z8juS8bQ)9^ELh`tFC{qsn8;bYIo{B@!JU!ny_+XW^j&f9?_>{?eQ?Soa^6an)?edo
zvJf7d;Np@}p`)nmS}2!X$)oJzv6iOE*0SYoR)MKHu`EcyXxFJN5TVwozRx~0nc3BV
zCqzJTVa6h?7E$X?uEtAH-dhQrcsRrOQ(3OeWTe1u)(@Uf1x1a3k!HqgsRop+<L<_c
z-nfQBpkH5>eQg;@H^QKtxcIt>Ipl4L!o3KIGf!;UyDz}_UirYo<i@7&^da9I#NSQc
zY!-gkZKaX~4}+XtNj;0+{p*&rdM;N!jb^J8jpttHigH1l%ju2J$M$0@lQ`Roa9z|(
zuS2(QBd5LQxWIdY<&C^M)?Z%K%qiQkn=tU^BJ^qQa+fIwH@to1dqj@+0zRGH@2AZq
zvRF-s&OfM9Pxtz*hd8<k`wJ%-dStG9?+&)a)~L01=bv9<^2lpuR2d_75k*+VBcrjQ
z4MHBw?;Bz?ZY{t{T-mTs)?)5Ta_rxU*@;+X+(%@a_8WQ*`E(AroNM{sWV$oqt)EcY
z13Y}9E);d{*tN!ikE(xG`T3uutMA!m##OQ2FuXcS4)U6UCT1^pP=lCev^)U<@P+%m
zW|qs~Rz{S{YIEq6r^DCA<LS*>fG4$=(Ur&ZAlM`B{l2-G+5AG0twh$^+#|`c(nU5|
zD|9*Zc%#nQR%31k_>5{Ie(>pY57W`#?~gX_RW!3FL%_}S5wd7=I$U9G)Z}>q`ZVEZ
zQoX9&(>ZL3C$KSP3U#@lw7i?bENNwtx{+4nmT@ukLxc&jIH~&Rx#GKhGG!sG=L{39
z>ZT!~R|w}OXHR|$-dA8@pEY}VO_<9A9{1*Po2>X;g)<@c+%5#PWyrJu2Pu>hKUL0J
zR9{-R5H9kDfiMp(zh=4_ph7ZGINaJ@^wnii4O=bu1;U?KV@CA$LTj#BCT_8Y1oZ|>
z>ARrwTs2!9H9eAO_FU)ht|V(=m}x;bGmXl8*DPq<l&AT$kPr^MQXoejhN+_UHp=(C
zy$}>)aH~I%p|AJ*&6~<x&!Br7S*jYPnqQ*IO6!|YRAPxg{|scx=6Tl|d$EdjoMpnh
zMW4*qEvbLL(?%$Ipyuv#a~{3@33anZ8$I2j)u3x?P#{Ml;^}Z;z@MD8FA@2@AYJCd
z1n`>XsCYwx_IZpG%>KM0$m=iC0aQQaFQUQO(0RgzDGH*$)f-Gt_yzfbFtTO)>81g;
zOQk36<;pOKxaCFVF}MdJli|}<-KOA_HIQT{*B8B6YMTc>ea0&?CA)~%>c_j>)@R@j
z03U4G?~@1{_ybB8*(DUx3yIWgQ(j7Ps_iJKo)4B9Pj>6Mw^7`3ea8uXsEc(eNX20E
z+Ea$lXlMafllUYbcdCazGcpUnjLy&?ryt^|7}C%%pl|(MK?B?8A2quD>m$QFiIsEx
zmK@!y4vbwuusaRFk_@X`G2!y{WG0@E{#1f&E!5DyprU@V-+F(-p0oYz901$igLzj}
zgnnY|H*ET<DvS56Ts5Ow{>{6j93TgwYkE2);kN^C_OTheF1b(3aw~JP9hi`XW`Fgn
zR>vxavu78X6yV0ZiEdTqDPN6wjc7<c+s*ov9+K1N7Nc7qw?d}TuJ^V)-zWVOy!U{O
zR7jmprJ0;$UMqrCQkWY*?~SY{W-U8Bd8qN%U}GUlJEFw>upjAj)ok4z@2d47IAePc
z>YMZ8AX8Kb5uI<OT&i~p^{)=RTHkrI(y&b^l3TgIhP4eJ^@w)6GLYGvxYAK6VCDh_
z6vVarOx~Qk@;K+;62K#^OY0q2f^C?LtpTDOq+{jm`Pu&UV$BjgwS1;c5F8evR}Wu#
zO%fBswuC|f)XI2>XxH>;AZ`j6?3l+f#|meHQ%_z_+T|5ca(%RWzS-dM=&3FPWl-*|
z$W#L-0V<+c5c2yIAZkDu_>8ancg(4B2Bl@GU|sU2;1fo5r;aA(Pgf;1Qqc_RL4MHq
zSPBV{mS<J#m6P68KT%e&&t6ejYYS^gcaVq{{B~+UjZCq5kxaxII_Zo2NiiJzE)CNO
zSEYLf0+SkWkLqmQ6<XmNx#RdqJ_f0`CZZro6E0itss~%xWyPJP6p(UZpHEipt7XzT
zNn=Ri@U})BQNv2ympp|F!<+X>dA3YZ{Bta7Z;LFSn5Y}C8c`GWvySNUAK7YhIm=Ta
zSF02#T-ec@bM@Gsz{@cSR?FVu)ULYRCEdefnD4a~m(*D|Y;;{Ups9-(()MdwgyP8Z
zZ%+;ZDB|-Ry(ryOkWQ5z<zM?H&=clT!`L!bLDuFgKz)*fXZ|ZC!GKJJ43*wmprlEw
z0>ND_xKFKF0sQ!>EXMp2el)|qntrL2!f(a;e5fBn#<yy`sCJd53YbpCgfjr|JOki&
zR`f{R+m0M(p9KmN+MzhrAKvth5Tq!Tl&j9QKW<Ia{%uy(Z=2|zf3pnj%pt&HehBy<
zw9ruYOCaCiw-ZMj6!*(f)PS0UXhp^e67VNYgX=!Ki1_RGa<WofLpW+}Zhx)^w_ZBc
z{ECg*Ht|12O~>e(FoUoQLcBH>qg3}8vZz3MBFsRgF8DUZXnzs29Ugu~{}Ti-xA!wl
z^U%+T11Bv-z^kqeK>*LXTBlr9K<uFMcyua;-2l{CLdXYm&2fh^fRR0ve$(utl%d-|
zM?}b9!h(@Fq=z}}Q{<=1c;<U}$1ld0Cl;Q#n}FZ5<7nFMO|o_^XeMEg6~h}#(rF%z
zw<7$23h#X;^1~T5p_CA$dOc8n5ROwO4gj!k((QJyMtPQF?QvFTICa`(;HMgKxqcwo
z)s~tRhae>jEjKErNShJ&*>m;!pVe0u6ZX|AN`2MI+wwkGd#h)atA-{Esp`Delj-p|
z<*HP&H=6}`J7{Un9bNiWGdUp(o&jL9!OO%M!r@DC%WXxiVD^>n>s8EsSx{!}+(P-Z
zPih0iym34YKnJFB^9or$vnzg!+L2YfGhiLct=^7YPLRj?6B@MIfgB20)2iF)5fSM(
z_g(RtK4>K~rCb~g7ui@=0o*s-`kGC{x~2`9?cA)2q)&L=w_3?OWJB+o4}mkC3i@%&
zwG0@(B6s_uhGz=QGzD;KK%XJ^v=7utW_-6oOxF&M!9wbQ@iqyUlN?991(@g~5<%Rm
zhLy}DO2-TUZczQc4swILIUlS*;QcOrlQdv_%^LEkzqW^7-B(u)l2rO;HVlgxCks$Z
zSjHx0j9dee`SP-9?ledVl27j|_m-@IRcl2>C<GP}F(^G@%`cX=j>P)@VY%mF#>}0v
zP2bJu8?T5|<ozo524N#30tMPXh~GjvzR!yET=kfI&`P8Xy?)zQ&z0?iLb*6LbT%1=
zGi0BFZ-Ez;r6mgYbh^CA4r5xl`Dc1<-XEUH(P3vIQ!SVXsn8X)S0K#~M68y0--ywv
zVOSy=l+5=cg-`r;G~F*96Ud*8@cZ5iP#~MvKX<;sM*av``+U0>`Mj`!XXC+kAJGCr
zc&!CrVr_~s|8|k^HWNi^?jaFf+*YEwCB7fiq#-#-vX%>>*ts^(NY56l_|1xC&c8L7
zM;d>vZ_bi|F}A^l^=(v$VyFS|+t(y!L7ITh`1k@lSx3=d(V8zxe-5uTS4zg<ft+W}
zMqH`B34kCQplV!$UaRHUN}?N`)_kW4+-PPJJki;$<Rq6Xr<D%sHEd*XvDNHPQwi27
zIaa^ker*u|yrj=k556(VIqri?X6k_c_KNNN;QbU!cB*zeXa+=Z$-1p%zced-KF8>+
z%KkC3jL~kp13(!$##wM#jmMALdQ9N7U+oGX)I0iig#(1!s9DHagyf`qveIT8gxd_$
zQ{qb>++6AG_co!hUTY6u{2;A-7I^)WjnuQ1R5{0_6Ixd{0Xr_DyNHhuznNjZxBlSr
zX3}#Z%zCp|Va5k;O5^r}`?{JAck?5dc`E{6D4dCCef%WelW|~szv=vxo9K@$h76gR
ze{16zs;JKN{Al#yK!Az`3@Is?de0e`4+5DFOLL!48WQ~sW;)YWdVM3{25fSbi@)}c
z`=@X($jm>$P(h)Pz{;D5t(ss}Z-0@;=sG9m31646<C`emBbs7WB7}1aqS5BUp0PdI
z9&PelK0}$F7Zjg$1i$mu5G(w)N&-)bz3+NGz=Mb?@g)Ctr+d_yJFhda*Ey9jF#zMY
zPk(imL%oTjT+kTd$66Nj<X3-rTrmE;utWHlCY66w9J!-0^XLFbrX+VR+96B|4hXNB
zoyv>!9CN!-Y;__Hc>;|_TiCpFVh4z`Ghr5d;hd)qe=xM$KAsv?J=zZo?7iaflNX6D
z{@Uo5;K-rkvI*`#)haEh5dCmFY$BeBo*>Ru<Bsre5Crkr9mmrEqpOOo^mtpHn_&Q|
zAni?inC^F|`jtK<qUVC!5~9g*o1m^|=ZpbAyMo}i2xAJnNYGeT2NXG{y~OC}*kK!$
zlTIQGlZ>f80|iwx-mZ(Ulm(~D(Z{R;zCLX;>LUyy^6a->zAn4^5-^>J6;<O`$Xvgd
zfqsYg(BLstLZK5)n8tDhMe(V%c>}*s=!#~Y|8N1UqvMOx{<<$~#$bgk1wbj(?x8r2
zCQX!}R|2e}$_qA78hE~6mU^nxQ5y9|zWVukMVz46G0%HPw2rRO1&kXuS;|Q|u>ckj
zP6oba=INa|JuD##JNv?#%(~_D5Xu`x!J+cxvLrg;GKfRYhFuMHodSIj{n{rEumE?H
z35kyeBtD~C-p@#$X0s+*;iTzcy?i6-x2z>F^TRo)Ur~EmfE1U?*x;myz}Mn9g8VeP
z#Dof8+-evnAP(f~4hbu>cBV|orj?V@S+D!0u8!1j-Q4yVy@sLh{o>048Ru5+_Va?y
zzG##@6kd00jz#uO&&Bovf@;psoTnI<SQ=9V*OdYw#FadgdjHsSPOf3};YR4D&>ruV
zP7m>WIy+{r+wER)&)YxhxGNEF$09^$BZbwA79%Vb8V(lgTdYI1y(Ay{-o$C@q&|7O
zHCf3GYQI)c%~jtwYU-XJ(Sdn<*p8SRKHbu((<;faRfN-#jb#E{A9Lu~cznI~aB@TQ
zspk4d>}QkPL#Sdi5Bt&Sfs0C8MV)W^Lte~u@GO3VT5bx$Ft>t=5%MxoXDO!dv2oa4
zu;xtFRFiV=Ay=mlgxZ8c>J<;Dy}m(6(LgIjzcrL_Gb4fF7hQJ$t&j;QbKSuI&w#?n
z#SS;8>qH6az72;ANe=S>EhJ<<2T<j7LFI&9xIC6PtM`2$?>fiI@wRD~cB+;8Gn)@+
ze4jGD_$>HS{sktPky<TX$)Jiz4fvzn!NYVd3Kqgv`d$7`hCj-w3Y>jyR*H9L62~31
zqKsLn0-MC8pfZ_@XyfT(TbOyiDdyY=ejxX_$D?sU`2pN1zK<-RD8YfL4E?%LGZla?
zEETMZ(D`O9BE+oDIgYjqoPG1q<46lsIT=g2`-5d1cDe;ODI;K5K9#^T*Fkl}xP0`l
zP!)0J>B|(Ll2Xo6JF~>uroiOy@N1j4bYqCZ%(amM&7GdXZ?S@7l*jS}QPQ+c^r<&z
zVeBkz*LW;Hq%D#}$%QRreplb)Qc)kLGtfd43GTG6F?cZ0CY|AsWG%_jEEODsnoVEt
z*G+zfaeYs0Dk1t4wXXT6`keL~v-WY?zT@pSlbK;imhcKItYQP2<uHIxy;-3qEQof2
zEfFwCkf57m63=V$&vG}h(QE{@RZ9GF4c9`p$=v+Vj`%3eCSZ5ZGW-4MJ^aHLxUUWz
zY@zVR3v&WPiLXe<=L%MFcxdl~9>eBmr#9L>?@#q;c5H=+acX9V74NS$_6~Q|>WzOQ
zQ7gKUh<lT3BI(Q7@c-2^b3~pb|KfPFsVVvq&Uc;YpF=sCBDB{1M{C<Or^^pC_}bT=
z$vQNwm3Ebew4eOW{GC_SxSDJOI@U((-_y507B4jeC73789v|sW0ZenC!Z%zmTGj;&
z*gX%>AcA#Y=;#Z+-yBEN$+m-zh2NlHxX}Dt?yf<+SOYs|LHm*X-SmM?S$l1>Z+D0!
zXO>c)a~$d)+=9!JT1A%4gOKQ1UViDrp2U(680GNjbi}l<e+P(vMgkaiMtk&eZ~85S
z3HIo#ZLd#z%(}~J>8v##Z@7Utt3L9n7C8e9Ar{Z2Djv0Yl1W40tHn)^h2C~_wQnE5
zBinb8`PiMOs3L#%&v$RAM+R-=!oNZQ(KK_`hxu-rcLzTMY4$QHb}>Mz?~Rvuo+)_>
zOoFhECdrI>S8Yn=^#HUyxjvkL9UnxYw`S2Qt4WlOMtd!HAH5~)m6|mok|py+L&+(&
zL=az*-td`*)*FKdl@X2+>7~eEK7(j~`SN@GrN*F?ro+kqH4nd5n=y11HW)I|9J|D7
zc0+H+z2tK@3jrRN08;z>ch8|dno>>H7a4};yB|rnX$ie{ij|hf-UNO}b3M4q-6rtC
z8m4Cv>LzM&wda0rt7vsb3i8iKT#WpYF9QHMlx%>!T()k4w;L$euYKw99^PLfJ+{L4
z?}`0NY@-tJ?%257>t}CGPGIZlUBh4o5}X>jV(~fWAc3%UsEwiOGZ*HOG!!h^zX6_O
z(AcGwMB@#Vry4$bO_EW5KS*HeiOhpnTCKVDgeeqNh(}Y1-ErWbCW7P*VmAPA<WaX)
zs;D2yjT|v~zJC4AL-})pmL*UjEp=NMs-jYzfHmFt%=gX4ZKCme^_L$RI})dZ5;Z{C
zE143WAFo$Y!3yj^MC^yXtUVYNF23JJ;p{1R?{G2d<>dFI6?r)S5u+Cxd+bVXbe!@_
zs|fKUn`c|`vruj1c4>k6?xC~)@#IW~609C1T>V6_8TdDhQ6smo;|-4{q_XdKy1;6v
zR+1EsVb?^z4q@rzz42Go*PGGtpF(AB!9y$x2U?n!4GAb0I4E0IyZqqSOnY!45C;UF
z1sq(wcfM+~O~nrJ-Qm$2XDyL-T5UyO1~sjyQa7q2-oz)p)o&(9dsX7Or|I=p&UadW
zZScsBLg1Fm{nv3xZw+*GGy0#-f-)GgO+eO6C;cUGSS;Q-$AN@DwL7}7tF!nkHc?Pu
zBPMLX@d&&&7m2ynf!-3V9W?Px@9lAcUHL%#)~e~*Hra}alZI}OsVKn5F?`xuql-ch
znIy2duHAZmOnoBHSF8$!$25@r*p0}w5aUJ+yZ^rK>)cF{XXFv9b<6%~y9{e9@y$Gh
zca!~E?6l#w;O+a}ygbfDQ#5NSx;h$ExUY<E^O10+g?sNRQeSqA{trxLhJv!EhRnw6
z@76(!-IFK=<;Z%AfgM0v?hz7NUn@4EW9sX^UpIT&Q+N3O0rd)~cQg$=m8BB{$E7%!
zq3gG9Z;F&{39Sk61}E>4E|$5&dIa>kP9(kJ4Y?#!+AokF%^n_~EJ<ueHer(Lr4ilI
z42paLJU|`QvoR@_6pA85JaBGN15t0KD9)G!+nsBEkqSNn^vTZrA93j;X&fI+j#>^;
z2<g|{a#{Ht_fY-eR@nD8S*^YCPS&C|zn!GngGl~HYAzHgneN2Od>aInhVi8Epkz=G
z{R*VS=qllOtW77~UbnN~;I#kw>5Q^;vxT#j?+4&$#GNSJx`~(H13Mp1lA>GY+M-ob
z+pN?^zG}ZT^ftol4Bb{E92X-xAg!S~C+o#)+_bpi2VqQ|W0c0hY4^)9&ouLuW=q$#
zvoo$ra&*mBab$#Zs|6MLRGe|&u-57$rjdcEpsEQehWYT!;%u{J=QVHROk6wW`HVER
zhS{Gc8ie}+Z~|o?oq-c{^D|{gl+TX1O!)D~rTKS)=yMcHGHu_cWD2{6Y>*0GAMrh3
zH{al1=={bBI%WPBwOSS4*Nwi%tK9Fc`8tIH$v*AMi#boMw%OhK%cNIFS)9!zA~04l
zAHK@}0)?jh^TJdNPfTefz{Q{r5bs1p2OB*eOOd64?dO;&V~=U=95YnR1aT=S1-P4x
z8h@6g&m_DzYz<o8l0-lyN-^rSZ1^uMC<>he-XUi|G(=~<w_?=9u-tpk)oBQR$Wb|F
zUKZzmjMuNPDslQWXDog>0}L~HK=EbtIe<w-qK-7?5wfxazN<M|^@cDKf`aHP$l5h<
z9bw!Tg#q|6OC>M>b)fj@73H`2eAbQe!;=?+#!**H{0@KhY|Q~6WsB4ebP`pAPFwFm
z7q;8A#pZ?%C9jDU_>)G-8vkHoug#a4p3IXu<rP$J-=#P}0r%iTWB|5q0z_r*`57$L
zt+DQ34Cy4zVv-)OvbN<U;b&-mGSk^2lNiW6q9JEy#ei=~eVm3p*M3)(^Olv){i<Wg
z)8}Nq&MaTqM;AaB_Kc_zu38}|Mg|QlVmfOt>tH%r(D{}BCK(%NYA5}YQ7?F_*`P3@
zz!Abn+>N!DBQ2;bzUOA97!FxToV`lHyBF@pF<0iK*`63pL2jwzd-F|w-q*IpM^*sJ
zn!f00@rc1=bsR$*d3P-Is8dJPcvSCGEo1CUW`azh_N;89-kR;AY{o^{v4)zs*`qj(
z&s&ra1#J#1A>ag=h7#ZLuz}*)luZ9WU$B3@4Rc30tmgIA9OA^+fKX2-cUjf{Nb^b~
z`fsRd0I$p3-0S0O(#YH9>ka!e8}Sz5%s+}8Fo_Td=P5SSE$?mbW0OR3%Sa|w&iX$u
zEK2#m6#_6?B|~pkKsHi4ef?;=qtKcVQE6Q|WewHhEmCs_p#b&4E0xr4k<I#z&v7P@
zKVQPa?knTDHN;*`XgULw@;XfE=^WI#H)slr2bKD}!y&Sgg;R6;x70Y=v0L9tD&CnO
zfV$BsPo+v`&-SYNi|Zo&n=-f&6{ZGX0q}kVbx5~YzTRGSs5H;d|FGE>`>sj0L7{Dg
z+sqsXL-JPRa$0Va`^=Cg5|%AB$;3sOhGjv^Zx@VjZgT{#g4Q-woznV7QW3uUi6K2U
z=h#Mm{NpL2_H{E)Zg0trSnatX>`YBgrPt9GXzqJ8_4Xp+c_;5V{SUg%9QGjdVW7JF
z8r~@uVsbDXVfjXuBN>$7SZHR!F&pII8^2!c*s5h?@f{Yx4X~B@^n)js-aqwqb5mn|
zqCxMeYx=ncO=FhCVUK6L#A>8iJBx+ou=9pnZX#(+*WMJmRcP~m&#Zj%nbkLsHq4;&
zsZl3y9|XP;O`7et0@W7X)=MO1W85uwvpOEdi7d9T0zA;V-Yl!vU6<qyNzQlVwBxNM
z>E4j(z1~h<%x&Vi4>>cNos*4*UD6x;?p=(mS=5+A_OIfPw^5!#dNmiI8`2CVw)5=m
zh3vGQkN5ih4hOE9nb%~tK#uK4*Sn+~kTl3|JXRMt)onV`h9XESGVF7P+*RN`Hm9BD
z<-f_%3zCk9-r`-<9po)J0maID^kd(~Kn}e44C=xh1o7#Faw4C?!%10sEL1u34F{jf
zzj;Y_oWl=q)bQ3ag4&(py>3u*?ilbrn`2q4d~@2gI$-a9Tp+PGVo1>MU}qQFO>y0g
zTm{ASp8#cb$Ij@S1=;v8npTa1(J(A5)pt*ynIhcsq3jB{f%G2jgjyYF=9;c*I(6K%
zqGWtKF}d6ATy)!59=L5X*-Cn)0MG{v8|lB+hH<r@iX@Nd2k2_CBeT6{?Lzc6$f#8s
zA+xPXTV*megqJ|8F(=(7hq$+x7f)#U(Y9E3ol)u4=#6Q1RkDh32PC@R&Nio^ToT$#
zmdstW?VsK(80IRSRy2=IxAZR~O5D`kE5byF7>+)q-U}vT)M&3@kI1Ar*6`|0`m7xy
z3hy5tRBmPg<F%)0e>H*=t9aG1K(2+MeGHp)V1~=@rwMJl;4IC8&aBHj3qScgt|-y?
zy?eVNs0EWsa~5JHF>N8~TSTml{O{lFEqx$=&KYqg*)*3DkN;KcM0b*96ODCM(s+pb
zUL!QakdIn71QPW+@b}FoW-O(UH_hf=nW6oCsU^Ysz88V1YRr)vIUsgwD9kbS@(=H9
z!1Lz-fhj=oR$rD+qwE}Py(|(+avVC+m<e3N%zP#7r~hAX1IzvcqQYpNJls-{4EQ>g
zbqhpw3ZMLGnMT8=qy=d1)8&tWwV=(micP_K`qdSpDfX%<jrfhfo&L;5sU}-5X-=9?
z{{%`XapE2|f|j!y0Md@sUF(C<nz1n<*(K#+@2Wdl@^F}wZ%3{|A>n6bMz|8D_wKk9
zHr1ldX6-uYa(IGG?U@$Mj^H@fO0EP$8r4gw{xeCI-^FFl(^C&a6|T{LJYpaZ-u{`6
zPn*;P5^&i@1=HwM=X>pOP)kr;ei=1WT*r;nR=E_AkNB^t-1|jrx(BrsK@IXrg2oht
zpat}ePPuSA90lqsNE<O3dTVZ5gZ-OoucfyP5~_dwrg&ctW6`>8>hvu}`SJd0rU{PL
z1K%z)u{L?7aw2U7?x&B;$M>5<j%v%)mN~c7!=xu413Q(Pu1`czaAXCefdyqE2qoXy
zNytwGsFFmh2QVCwdbQ~h-7p!xqCb&<bEnf#eCR9$OPuQ=re(F&Qv3)OXt}ypAmr)J
zh0t~`d#AA9M0M}Czt!T{B8BeqXI<4>guXEr;`@1tmAf*uADo4%KIzX`kB{-MGa~5m
z7npPeVznxr>8~x|_Vlxut?Zx~*JOSy)K)^{FSC$od$cP;V$^-q?it7Zc4BXQeXyxN
z#^vFU_;)_RX55ycBL%0-#<P|F&O}`Oy^j2AFl1Bc2gNgs#SiH>mwpI`Yd_S__-Qn*
zYH@YgSy6Bb_es(Frke|XbQU*SZ%RB-<ro?IKdilFRF&Hs_Pb~#q*H06LpsC-(jZ7l
zOGrqk(ybz(fOLom(p}P$DlOfO(u)#U<RaerxcC0Q<Baq1oKM@~Vvn(Wn9rQ|eP6%p
zn&#-0XS1HoS~AUw-O)CF%RA-?GygQo!|OjE>a>9qSA*RE6bbi+ul*Zzv8KDPOTG-a
zL(`M;f`M~TP&DuZDMfpxO1{lT_3;2SlN0V;4Mgp*zj6cZNP)3?&z-(GE)%6{jjX_P
z$BWZ_XJ9#Pv5G2#sIt|T>&rdAK6A}WpbTIw#;maY1`CPf{%{cZtv7&i$>i2U+m{g4
zY~r(;IPy$pW?RRDM(l23tGgvNhi(+PA5aAvfOgxpwI;7&^*f7z+A+helV%sRGTZX{
zysG*q?rm-`_Y9IVk5CG|Kj5%@zoQS~Hp}8`U!aZ-?d#1~G;NXurH&rLSl@u?>QQaV
zMckp+Bv`{SGO+RF$c$-8CXPGy^PgAJZ1VMXeS~J6=#iGEbQVvZpUPCnr1`>p=H`m~
zWMSgH@>GcUIrC>~IOgBX!UZacs-HXq<qlc|`Qkga;l2y~iO{ji!UAh~6}`^2F&qZi
zt*UshF&6UOM_b=p@)Ucu-*Z>~K{qOh&DPyWYJ7vfjFdQzZMsZ%P(3!u-P5ie38K(c
z?0@&-l{u)rWVvewl`w$g9Lryaenj2fD)L)Bw_mjCgx6ubC7h^$V_7l!uq7-Vfuu7T
z=GeO+)p^uypiM*7bxQn&&<Vr4_|rqVzHquQ&FGn+jl(B$v7g*hXie%$_*6bw+xc&K
zr$lV!6}@>Ac`v@DD0=vV_uVRc6Krr#Dul#SBHfNxpNbs)(v7~ME;S`l(rDbQ9wLQB
z%}_YW+k4sEB<N`P6`H*usQqe<dn9Tc{^G3?JNAoeAuW)Yg6Nk+rsO6WsrGVET0OM6
z`6RDN_EVZl({HJUUvUF0$b04ps2ZN%zPET5eGlNk_@e=rTV{}_>B+Bis}9nKJiqAu
zwkua`#@7EEr0vz}vNZeR6O$6BCgA46--SA5_^i>?O&B?xRqd6q(>jt-Ez76eamm;R
zGYhN?7+wpq*VlXl@=U29fTv-)fuxw#)TQ|-ClIf`RCZmZfxqQ6Yu0ByeIB2`DTW6z
z!yc;^VT<?zW^A9Av-#<qR4|Pg?#A_prTv09uouI4EBM=z1fWv9TU|9iOpg2a*z*ky
zc8l~uP;=+sU%J3b$o=NC>9loPCS#c}+Lz{w!1ST>W%apB|LeSaasjNC@r``7PeP()
zvtyFl&N^Cs!D4^pL}qsO6lEq_>FksksgKKxP}DP7l@>q*1|t-A;XfL-uk}Ut<Z-H>
z1^s$|V1aygZ)vIOl6OU%_|}eip^kI_0FpII1*BRE$lAYWE4!)7MXRgu-98k*62jif
zJ^FsuY<#58fc-5a21oh>GNUDQu`*UwcX189Ei$~MuU^$B<xSvC;co_I2m>CI{D$?b
zm2Nn4AIZFVuW^D9E5H2Km>YRKO6rBRUdCUmicap;$Eo*W6y}6J6{F_)=crGsws=+)
zntM7`Cersa6H3D_chjNn32n&tRt;2I7ccAry<wvelzw{2*8}(VUI5uBNpJ=nXY*Q0
zba!%jRpsfgF9xrlKphctIae&cjf>`=&>O{}RHpSpJti?$#}+bbS=wtfV%l9%x7g?B
zii*hKz#!2yQj7<RYP`C3>{}}hb2ZiwyXSY%!`{5w@vXM$CVlvbjXb9=%+d@#eI(D5
zMdYS4Yy)vODA3_9KcuYw#8IelDVRQ-^^T8AVaNKG^KNGH!Ha9i+$B0=oBcv7cM&Rx
z>VCbs<!Q>U_n{&raW3ahRgvKSx619GLW4-({ls$rj(H$-Exee<gq?DiR%?5@?Yd;~
zjs|{*-efs$V><PayP$PV&!(~@G~F+tUT?}XRp}Q;3)iJVakLcKRgt{vt<`Zs6v{Xn
z8v1OF^(-|x$tCBqe-4-}68mY%UQz!@i{&dCOmzRPY)!Q7_*jliI8lozu+J&>;sLe!
z8@{@dcPTelYEexVMwbd!!e_PU@$D|ByTI@=^!AlL&cNBTM)b-qwP+o+H=_H0B7QfY
z(^{=EVdOTM=4qL3Mh7tsPo$L)#gL<z)?1tne#&Vgrao>FGUtp3q<@#=|Ev{~HYVc3
zp>m&Ic;DPg>|9kkc^H_%GCbDmg~6R)3Vz$`pX^!)v(cG|B*i>h9jQHBbkfH`kzDDX
z_5!c);a|Vqo9d=q5iH*VAcl;0fRXC*JQ$;JSib;FRRfT54OER2Yym?1LJW8dh7r?!
zA%Y=7#YW1=0i8z@xp$eDfgH)#`r!(UVBLVU8}51eAH!UI3F)Tc6Eob)vNXhT8W|nO
z835<*yF5s4MOyEP&N>R=Y#Y^)G$(VkyafXAKkaec<40crMFI%XuLEg;kl@VxD{lC3
zP<jsnMO{9zGQLHu!%rkQc}dd2g%2A*%QWE(&|)?x%Swiz<6Qs($60DWiI{7;IOzKd
z<~ZdXvs!&2?$bg3wa`>2I{vdK7$-M^u|WS<8nOBildulJ|0E^V`hGxf1n<JY@LO<u
zK=xY^tY>W2#qn(_=S3Mz!>pXe49<u`vTwT8Xl%cp-KuzFq5i5_>O#Ibpp!L_%tayd
zNlkQ)6PG;=BmW<Z`9Bytga&AgTSCkS=*%b{K=T#rkCK=UH{6Q-yjdqRsER3gL_NLI
zvgCkbn*d<_>!PH5$RiMd7iG%eKF83!s?<svlXytdRpCtC<-^>>y*{4T)uuivw(^v5
zCiqahJnFgYXsrII$Hi={+n)4KAr0Ty6F;%eRXDpWbJ^%5jr1_X2f<x2^wHB^^9=S<
z!~Z*!z4a_uWaYE!t8~PUS5g{hOn&frE%WYPXiF+vxs>q)AC_zx2|@70Y|CHl^T@L<
zAx}mFYN8r10Lz_w+r$;PfOi4K@1H9Rk)0<?uZVmPPa!Sk(fy;xE|O+1zYIt|47@yp
zylX9|9sFz0d?4@=NQ10iCcaGZdjK>yviU90EVY7y8XiDjvO0Zp*h%|vTkp2_`DXsS
zSj#@)ox<gs12AUGNDxgApKSk9ItX-V12Jn5OINjY1THaaWO3;T1PntxP>oboxbkTr
z+mOWbJh4ll8Lb~rSrWNOl0E^YkTcjU_Va+x$y^uGA_=euBj{^DWi6gHNm@zHn6|9u
zn}ykJ8lnvNP#c`^U7@VoFw-C~lW)m^YMK{N=^|z#+Wt9=9x?D&%M@q@SfUfowj>WY
zcq*!^$4AMBz$5aA*87+|w!y?imh)T{7xhLOsC?IJ7XlmK5Bl?N1{`U%&W&0ArYXoP
zym6`NO<^*AYps&Z0I6YpfeD)$Q<tSMb@tU}wEA{;cKt9Aqi~4Nmf-fLkcjpK5WjzQ
ze>cBg>*JH`y@f(^%AyXC4Us!Mu(-JSdU)(gG2tE~)A7BI$C_-SGnK#P_(wp|jz3<i
zhGFm>6?|^~z;NKBQi#Ht4nq!SU%8`+GI>K@R&nx~{<<XK$a)`Vmrib)iSjQfcb@5s
z4CH^@I?Gvfy?VC&2=1@X`{Ji&&EPWky5m(nL&RXUZulURYmH>yqpc3=P-*`k{GIX_
z6d{W_x>;*);L0h-JuOt+Lt{0XZV}%bo~3|DjCaS~m8$pi+|?cp5{4poW8CBXC2Ts3
z+@qJ{&poabTdo&l_r^jR|0I88kWf1KI@@`M&hRDZG;O2b#+~oS;FM^0@vT)Z%2~>>
z><#}EKCwavUqiY@&J2{>TMrc4ofl6_`pxo#qEA2gSKU-6HHiyUl@52p&%jnSzJq#X
zYKpY(v_*0bppBuKoyi$rS)4n^Ev5v#Zn;;*&knz1DIomY&m_;3Wk^o}COjj!mRDNX
z6*M}*a=vu$e90w?EaSWR-?_6S!Tkxu6lC};U5Es&6S(*Nt7c4Tw~#6C6)>=omwsyY
z52N#R1(ZYQ_M(6pbv>-}65!=0&hWjaLr=z@tdM@MR+NcXzsRKbp&_6WA?Ns>x_;6U
z5ZRy4I@OsN#tlefbICVtugYN5?*Tgb&$*=YoVZxP`3sjuM|8F~R7SR+2ZANP@}a)k
zugp3I_PCt??iXA9c)@eYs=Ws$hM^<EOxzLfGOXGi5R3mPNPh&q9KG^9k|P)J{0+cR
zdLKnoA%J1oF##~YIsk@vnLF`u^+w{>%YQqXmRSF|%%<^a`{6{0yS}lL2zY;_07gJJ
zrK|c;wR*vKs{z7IYFMwiQG-CS`qWw#`jF7v>1no6qFTsXNT5)Xp$NCY&srJt$##sU
z%5HTN(u|lB^5x#4vNT{@3s??zbVjJ(?>thM-sm{Oj{Ut~_(+b7(Yg~=B!G<q06FWO
z_W?#`QEe1>cOE`^&x%*bLMuvFQ^Ljbpm{UDX^o=)?j4Qe01@pZ-zTXK^5q%|@;;Ua
z!GWJs@a8F3$H%VTe3~1(IlVYFnXvUK?>Lk>>Vqjz{73POuYADQ`;f1CCK#>pQA6BW
zPh>y`=6rkbL*sR~fvS%;hFMC*>T^wAFl`SNPaBfIzc|b$6|N&(md{^Aw5dtdsd&Mu
zxPbUBJbm#et)<_r)-0BPnL`HF5gd@9auBo6v-+EA5^Fom@VipkIE=!g^cIm~=ecP2
zEN8&en5{|v79ydxB6yP#_C1d;baK%FOp{+XC0*4B0=mW5TF_#sPlCmzUGLwvPw0^-
z+w}9@Xg_@`y*eXeLNsvyqnEdMc2UO1?6H0S?fV!WLE!-@_e#|lyv|>qw`p`!vzPN&
z8;%@T1|$elpRf~svF=iSOQc|DvFCHA%WpA-9oc^S_$mFEewW{-Z>7uKH&z*CMX|n7
zF=7ipybSP!wF%5N!%i1G|LGTMPxOk-93T$XNT)@Vl=B6|9SNdI>6$L@_C@O3bAybd
zUoeT{Dd6o~>5h=kx(|$T`0rRGS3m)$T@N>WkT3z%E%7s&BOhQ#YIF(MGG1^>t&a3L
z633_l((fWK0C}B5uqX?JE0}+;gCY3lkp~!`Jf|}AuLQd+nwFc`g7-4y0dF7<0*dQO
zTAHOGhhYUU={G>vNV0Y)6{j!;0iP20W-9Lr@Y=b7p}7Ji!4V`BN>h=)Ep1r)K&t5v
zydaHWg=_STkf0qyq+%Y{<6j0ZiQWpF0^4I~E<SGX@L!3AcXba8{uf>Z?*K|94*CvM
zc=F!5=1IUR_06fG9ebL`2sQiv0MjH!Le+@H2%in?_j)YhIOn*TF0<L{K6FkHaE@qb
z&zHUFBX(4DZd!ex41JEriaGmjhir3#3hHjpu8{D103RVo^RluFJ>*|GtKr?f@p?@l
zUhlL!%A>RMhIr3aE{uBnUK{q?!mh+A4j20s+jG&S7j&IRXk9r&D)o-jr#}e&W|&qC
za%#y|MQZr1wnj=9u|aaA9XESvu;j1wh0d0(<(I^zAJF+8Z!lsD-Y7H^8z~~f`1O$I
zhnD{RF*mC9p+WyOA=0I9SKAmwf21+t=C||UYVi|q9I#}PtZpZnCi~ks64`!^+}BlB
z8;3E3?{*ku{Zty!^$~(ODM>s#;(}raOsx_9yl5W~{WaIm@k1Vb^)dUA|IwE}%-^Cc
zTQ+M%8@mgBtb1e>v(*+8Ccu&XQ+(3Rq&&$iN#B?5^3@iyarc*7|If>p20DXUKi!Im
z5P1PNrWroqVP}2|J5|rHY<2v$kv*4@bD3EA?l*=d@$Lh+_oYR@7I9cy{_M{i4n$*&
zqaK~+R|^EXnnn2QZhR@(oiqNOqKkE`S57i=A}QBC?nw8Cs&&7$bmH%L#c3y3uY7_N
zj7V$P?r3iSZxFM!`wtSOdH@xhsTwDR>sKDCdS<xA?}AR__zt%TQGzc>@JP;6(Ypfr
zpBHe=sUJKaW2b@xFt$MWX%Mh3HbCrcb}iB6gCAYxL6=(#{q=3o|MUunD%r#{HBHc3
zl|2ai9>}AxS|`d(-1FzF>Si7>-*PZReZV{&-c?Cmc$-Ul0b(ScLx_vL%GD$g7>wR-
zr?q<Qk3d$+*g6YvQOXMl!3Nba1~DErLWt4$jx6Wd-2$w#$80ll=Z9dBv-8OpQK+ro
zFoovLc3xx;zCs2@@G*^8ddNW{eqiPktOB;Ti1NTAZnI$!f#GC;^}@`5UqNiq|1hd2
zyA&V9960nDHLHbqgA)$0Y0f-F<!KfK-SU=oQMdf(VCxz*N;#Ly7m<s>I2UJZPe*5;
zwE~2tXu)bQX$zG;#}OUj+}`itjGL`qQut4MRM>~vVj-_oJkqIP{aVdiM1nKs=)I^?
z(0TCSP^f2K^B1u?U6@={LZ~zz@w>swKQC|p^00D`-uF%Kti;`sd#|*Oaht({JxZ3j
zTeyaQtk6=~6u>M6)^=ME^yYmB0D(kG%pKRp{@7T??)1xn7ROS0F-<QjeRo;nxwO6@
zKKvLgCRl#5YDzu}R{v)wf*-N#X4`_DbCK8n%V|jY#&Vv4`CbftqyXC(1%3!^+=Xl=
z6F9#jyL?)I*0UEY+OkNW2TSJNM6(=)AJZm0LXG6@K{lxdlQ*EzmPmSiJ3GzUVW30G
zeDhxUlG29H-4#=`GYm&J!V-GR2JD>3A|fqq&zS<7beLhmO*^yRmSy%X5#90^rie4n
zl?U@Lt`Ji%D~-0l&utzYv=n<-&F1ZrxIW3eOrt$?*GO)m9mOH-A9D*j|CH=o9xs@H
zN<VEgD7le763FhMCq3?fITP$VGJ(7-nkbfdQxsS{TlcrIpFt!IkZ)8%jlBaba|~p4
z824gMc>sDVZY1eWBM{B3h?Df=P|g?RiCD_@0AZpkrLXxY7_3OcxIW!%A^#Y=tvm|$
zLYIAQ!T(Ub4s=rM4T8_6g$AWYBOXaSQ)ox$LqxE>%dqZ**#aPkBPyv6W*18`q)W3g
z5293{h#+f)wX#`Y4w(Z@WXe~*W>-+)B%<7X?=7C(+pW(gb{ufVCs+9~A{pg74+fVD
zJited<JC!H<2@P+>n5K9{LBTH*v|%6cB8^_e&YSqf-0sw#WSpPz=8(xTK88*26Wkk
z(fbzM+sJ(7-_u#r3S~dRQQJaLED6x;AxrC`HC5et9a>4LvuW{1PU2k9<Z4wN`LhgM
z&b6)24KlQzSuwv%OWl-qej!x*nElw#w1M`vGV)iaZI+gxO1$m&*EhuQ&WhbJ>ao3e
z-_eq1rrWuc)!ANSo`OGt;RTVc%NJh?8NX<y&C4ij>c;$Qar*tQ&V7D_^wyk{+8(G8
zt3d1u(ZaG-69{fs=(X*WfTI(zbtyP;^HQ8>MRe<0N9N1oc$44z#ejZpE5eYj8i4z{
zGUWWOrs%=g2I*JSI{}_c_RD0`q-eIi!^o?G?NKJ;cX%mmEur?tHY?&Hg7B6%@JNc0
zR#M&>aXl5p#MU4f7dB5+mH40EcO9)T#2upW<*_sBBVHWG(H~oWp)FQ6DB)E+8LIx^
zvt5uZy@7J=!yxzQHUDlAH=Rz2S6Ae|*Q!y~<+Wb5f%X~pq+>e2<j$X%xa6s95jPU$
z)DfONnjOX2z!&Jm=-$?VTLxtk9EEJMN-yq5Z{6(G*d1h>9Y3SNsC*OoYYK#ed6>?2
zw8R!Zn*Y%I4n9l?=Jve2c1O0&e;22Psqy9P;?+dj4KZdLFbt$g@h0;lEx5}u4WU)L
zr_1k8R>VC;Ff5o~x$7ubW=Bi*?tI;A302Vmjpj)<!)1YMK-J5QTnNEA5IT=f^8xI1
z46+vqloY);ByP$99+Gwu36P!ZKxC5M|IdTE9=5cVvWNUuntfY4J~KjNEy!H{27tEq
zeVqm@7BfcQ!cXlR;eo2;k2?TH=3WQv5u7Tk!t&qKMI4gEn#)T^XbN0c(eZhfJ^{Zd
zGB0#-pTsPn7MfYaKa%W8c0Bey{sm&8^k%4z7yMkjehPH`T&Uf^C!+#MtN<P8ECtQ6
zf*}Q8SMo#t=4$Z$EkKRqDKAgY2J(_pjAjw`c(xF8^M74D=Q?P?t4)4H^U>(@gdV`<
z@}^f$Q4bBvv(MSGRf)R|lRds>j;L_9e!WZH$&vglW+PQfoX(PKia7pcG15_Zu-o_t
zdANRhb=Uipo;~X8ugy_-JYn(#1R=6$O2Nzt$Ewv@?RU(^rijIvFqhOXR&<U;rrByg
zTKS=P^dK45jn}XBnE~2FVE8fh?0KY$xHC5_6&+Q$p7_Ho`ns){E0_vz=+5fvK)n#|
zX`*2L20o`5*-M^Ay@5la5X!@eMBc3<;}5b3@yW%@bW{TM)0UEf9?4_y8gApv3wB;r
zw$)TgSH36Z6eI6FI_hUD$ElhjyCbqP!?8lkWUNQmI{Z;o_w$ux@3!8*3{a`5<!TB#
z1!%cNOl7cZWa2(j2LN2-T?0faC#xB0G(gxyu0D-Bi5sx<ezi_ARP0TYmwKu=)(fKL
zRA=wTEO{)>QS($mtky1YmGc_i_d5easpY_{!;HZzlhr<uBgfTD8aR@pvWqA#PkPII
zz}Cho78anGhOwMv(oM3jgNB`K>T7oby1&!6x4)Q%GEckCRNL+L0WvB@s)!GKAKsPl
z&%h7onsI%xUQ8+BhXNCZd<>TXQ_X|WOUx;K0p_>RGFr$1>!<81qNuoOQ~3{wXlm5e
zHyKY8W!2_MRZkUEz?KU7ch1qf^&Og+Ou3NzttRSceF|swtwg^*U-IebdhigS@tHL#
zXAXG6<zTnzcW}J(*THL!C!8-s;!kl8ZSrIO_;XP($$66`R}bF6Hx7E$SSM<!1Z(YQ
zjl7gI`t0$kJnsV@>f>&Z72%(#ODu3xqEi)VnIyWSIHQU}@cy97l61?8m|2xI`Hx*K
z&*I3+5M+Jnkiq=SsP9<)RVv+a+7_a{BFhYeE@}0GYbJ;3i;rK%EI*xgQ;kBTpZ3YI
zXV6D<cBN^N>vVCbnyS(+`mpj73BycvgO{3iER#az9Uf;du@6~9N+Yg_@hFN~UVrqH
ztJdk&hkl&Nj`~_qFLz#+XRlvmdIwF*Cx#PATTu`&Ee5km^N!))@;gY|qU>}pf+J4F
zds-tjJhtcMr`6Y{{}zDi$K-vp<ONz_(ze{OQZo+Z`^JQJFuUYLbJ2dr5^+=d!j%Sj
z0j!NPXu>r9r;+#*U{0tW7$ttjS&oa782~yO{|+x^4@k#dc%k|d{4TVj;ZPb7#PB3N
zL!lP07f9U1_yyG#-oT=({ZfHP`q3_sig_N67~*L9gY-SWQERd}AaFQ?#E|I@%fLg{
zQ7~XKL~V)FO!2jx{*Gop^*;s)BLmF<XZdTEYdL#{^Ji1YG(h39&wTj>J@C<{f^85r
z^3J^#V-Ir6H*8hmZ|a+!exriGSvFOHyFwV=8Cu67IP@D2Mg5=@sj-k{8-9*c^bKD?
z(NLA7e*rBJl_zjW{``pbTZ|r$@mul1kK(Gmw;eatK>80(Ug1wIolFO?70rkgmNNbm
zCJ^$0g5xbCIlA!pws!V3$XY3AO7aOo{~Vu;H9hq^0ln>J+lj}k5`m>q(uf<A#kci!
zE12%YUWl;1%oViLXlK$gu~tGcGM(&<<GOL#(xUUbU6T`YjUjxGDrc@*l*_EIvISNP
zCOX5M#u~-a%fQ|<YNXo}L=6y-%iG?nsbPg9*gdrg7(;o~ht5CQ-FR2OWO0;iv^AOF
z)*E7fe|E{?t1OVlcNR4fsT(Jac=KLLDrYR-zZ+vi-RTQ8VVwIAg<0zN-x@~()22r{
zp}_&eLY!iQvd3XlVR8q(>iqa2L|gtcoS2vzs5Jk4qM>!$>zGT9Y50pd4VuWFfKG7^
zt5&AgtYyrtF$cntyr|2V0M_B~7D@}I^8(8sSqFvED9zveE$G{CwkMgcD9?u9_sv47
zRW%HLDQ8xAD-cx~&GDPr)TQ5{i~<GR7{4JgmRluPnCTA>P4q3X0krf)1#edL6`-{J
z`V@F>*MmbE#UQ-^6-l{EEK5bSXva{?3#E8G2{e>#Yp9tpD(30g_8{<$xM;jO-x@Sc
z@_(A?{x`+J;3!X;#GS!=32iTwltg;bcdIm~;M*XW-FNH&+AwtMo!-!1!eoCraJugT
zBQ#ep8@P@Qplt#2J?2oxRqMqne`1dN2LQ)TKtT%&NSTGUmZHL)P90~N2J7L7QESMU
z8(q)<KUAQ@f?@GMb(p_lzv-X?CW%7>&CVCVN0_|jK|u`tm%Y=2zA|=qw}qAz^{_$U
z5Gc}Fy4bFLbpg8T2hR5o=gDm$&Ma+s++F0~pin(DHglNU0jwgXXZTrjiI^AQg2zYQ
zM*$mXZP#E}RE@576T^0lCYA$vn%{CPLW!`{HVsITE{!@jDJ_?@(`cw94nsVT-z=~}
z|MsVc;Uw=2KUJQ6rVRbh>$Y10L%8r_64O5Op_sseZ(n_Os7D6t`Fps1`#)$wN1qVh
zcszF(C9L6TRgCTX`LR1lDLVA<XDk@*YStIT?xr^){AmtcF==(Y{D0naaeI>Yp36n{
zPC0S78l7A$KlaL-3?CBPP5skC`yxc)IkooQd;7!Tpchz-M>I}kw|W+n>x`5Rel_)-
z)fI&vYxQP7p>MLdDH5VjCM}-ie*e#}?ljt~dxjfltkM)#Y{k?W_xXOBnh4Xs=Ol|t
zxiz>uxP5DzWt;nL<^A*1nR`~-NxaE|Q&fj*9s5+?RD|Tq^+TPN57Q7<u;P(;-YCu?
z9Pm2RF5*I{GC??67h2D_UDLNTeV^jaV7yEM12-VoyUHtJCb3j)fQiV~E~vr=`tOQJ
zV<Vb817Z~@Ip<fP1QrNidpKGV_bvg9YFNDf?9JCRwu`l%^+&(QD(>O|O+!D#yhxU(
z<20>OtO4yP-tTNRxhsd)7#4mb#_*XfQAL3P&(uRqgPCy~`T08*PV<Vb%q|_#AW{v?
zcu-KuWsky0#y}N`f)2Ik)r7j}^bc?pc0hR`>F;i_**3WKg-(Dv>~4|r`63ubDf0HA
z+Jn;r5HWH$-GE>e#D3$Io%sNmN{yHRlwue3_=B_6u7=8(Pok}Fi}@de^06BzL8ee7
zBt|@$^^A>tNx;Q^S3r+Z-2xc)h!pB}lNUfil!<q$3I26dH<rN2q|~tgq>5yj7L>;i
zIM4325}NOvP}=7Qfl7a|ESM1nyAX&l>Zo7GU|dQoQSXKE<@#rY%1f%Rj|*?;VDsi(
z!YHv_HF;{wR2MvQe$90;>?B>dnZ0i<0`aja7yx4sh$ia&;jjE@(>+9@o(ds!?ngs#
z4y<Y7=u@XmUk#*3uL?=RaA*=9P1c#U)`2)p{iywSmctcjB}~KgU#C4`W*3E>XR=Y>
zK47<tPrAZ&J8wqtGr6(`k`QY3WLQcc{`C1{pzV1;;||yA)MA3&g%62tXo|w+j1dF*
zgJTY+M;{+!GM-;(o`mHsNuA>#=JuW{jsMhNkMUGJcxeWEVf9h#*=?P7yU$mgsH$8-
zkEb1dZsSn1WU~Yr2+~{o)VhS-w(Nc<wHc<ez|;37CM+M<^!2edrF&G&Kp0&8YT7q{
zbVy%(fa~(m1<hHh?AOe*f6(sQ1-m1=Qc#$5itT`OqD|m0+U*aH7b$1g$NmKs=D}R-
z(M`vu0S7!acD!Z);FQI2T^C}k)zP>=4jecW6LeVQZIt1aX`S3#gW}5sF0nHGK-E6Z
zD@H$tc;1ozdB9{%IsuEhshKR<ZO^HvP^e|B=vT0Du7)?Lz9HZUsZPwt`I}y_UHpNT
zvxcYjzcFBT9Lx#b<qh>KC1ys*6g@(?p49~A>OMd+KcN5uz{hvx3W}K?)@?VNT7Z|m
ze?jlE>VImcKY(}<@=3>Rj)s8hH=fAUqtnU6hV+C7@_hh;f%dyhZakQ*!2UORmDmn>
zZ|>gW#U!8(y6_6#z5?fPv*((r3VIdSl47h4Q~We2@bNlXTMEtP;@~UsH<kr$1=97q
za{_pN#PXF7>>=^nZe7WmZPG5|oWzaSQJ_U}WUBL!m&oG5smXCEFa0|&@OKy-suK@<
zO%I3wuXIVXwgZv+&+px2X`?0GsZ4WH${2jNZMcSEdDHspoz&W=G>%t6d(>3!eA>Lo
z`Xc%h=>xmno0|FOS)cIzC*vcBVd{wzW$!O8R>CtFlII>jFc!q9#^T};Jl42)9Eqdv
z?`mxdUorD^`s7G<FIugZ|D2%Ea@&B_Sab-!tU4~+mupt&>eFptuyZ}_tA%YzdDUy)
zzwOC12}9mL{#teQalmZH>+LbqByI#zWFieemv2Gi<UX<PZ!_tDzqqi2^byZt2RR26
zaYX8-s^|7pMqa_%ylblyjWewR!g<N&D<hiv4y1mEv&>zg_RNy3jwQ2NfG4c^OAu9n
z9Ty&l%qEajo;-Fe?TdJO2H6j3k;MClkc%ft8brs7c_1D`YD|_};3~IS58uG$B^0d(
z2Fc7`CW)aSjrJ3ZONM~*M~UapN`D<i5Em)l4+QK3T}8RQz13{h1r&-V1|*?q)q^29
zB1mNS9;<S`Gyv(e^B^gBjrV3ZG!H+_v#fX|Z_W2sHVUp0^k*7kQlZc!v#N<wkPGFZ
zZcibI#Ra9wS>NFOH|r^ck8=sbI=t;WtAa5IbE~a&44UkNO)OLsokXW<Mxhy|USQd4
zme>W?s0^{QexM?HTwH!zH@lJRTu%j~O@<+ppCiULv1(+tsQgZz3%UUZC5B#XIqk1;
zoL5Dc6<kfXvsA{b$mhc()IqXYptI7NSQsZdcbB!ujAh+yKaSAanOp#@J)siY5}%$@
zlO9{SSDTrf&F+jKLXY~OLP7ft-o5jIR|ttvcZy)Xeg3nRxuWWby}2UAb|M-vHu!<c
zwHCw7pR*4GVk>^suT3sZA1E{A(hFQB?2Og2loHjm5gzBqhDBeM6VIPyk1<^4yTk->
z%&ENyJfe*|3+RQS@ld&lWxuuvDY-HdWrmqNu0JKGs%NkM*<U1Wn+GrGjKC`w<=~qs
zwItO6QM_J2aOPIY9w`{c%N87T{9(Qhv;xn?vjHzbhl3zNnCXjQg<O3s5elq?_6|sx
z-b`FSs~JjyVq59FDWb@An7R!rl5vxegc)vMpc5rN)7T8C8c)>t>X%-Q^sfRB<lKGW
zIoRyy4r&EW9&3GUJ5_~CI30kg5|1IEmqO76T7vUn^h^8uk)6>@GFsDMl8L7wB(9&w
zc_7p;18PCCY&}S^nu5S$XZnJ>0$P!}%06ljFq*(>M{|~X4yq?8)BG0cMAg65Q-N-X
zAjfMJA~xDtf^z0Ow2~T6&OWurGU@*0U%ps{;N2A%Y*yKgeUl=U$}3AM0K>i__23vA
z<H&~F3Ye7Py>f+XWjE#>mIL3aLIXpWO`ZDAJtnQ+L*!0!>R2TKcME2&DoHltd_$Yw
z)Y==Wq#mc1L!oyUw8vfA(OTazE40l-vaH373shI&6qxv>M0aV|<6|saX#)}^9@C3z
zt!t0AaR0HR$)t4u_<k5>79d0SLEEb=Xuqa=3^#>|2s5`2Z<rao;!(0Laz0<z_p2nm
zrZ$RWwaQHUSvNf9SbwuPM?Y&8eF1$jjQZ+1A7Q9ICs=|J)$*78TU|LlM$^roS$R>o
zEzfUr33)^+)35ZL^5&?I!;L)WI1gJFC;yUA4y`AmhlAv&4A9Eh!fT>TpUmd&+**l1
zpGnwfJpn}TQd!eMZ{FLDl|IH(P&dbC@v}vPzu|TUP57h0q(D)yIAkL_Rjm39zdTDk
zC;sXVWgXe1d*}^eQ4Qs}SE`w%fg5`&9FQ8dN7K;J<_vOcAdUfYl&q8*kd?ob27}Bw
z;2qiHrLQ;iF$s`lF`tDvIp4Q}%_awzX^R(msP&+$^_BGk4eam0srVMGm=i_b_h*%$
z<Zc8*hvZ#IRhZPzYA2<bumMJ==C2^)&A;cij2KG306O`c0a5eExwHQjnEO9psS$hb
zGg`|V0>y`E6@w5=6R>)U9c(538yl3%46krm`m*g=u-#2NX<Pud^-_I}K6Sv@>8a<l
z=?HB8WUVEQ;@<yGb)QEizvZP6lA=xJN+1LAx>@oUouC~9zT1znFSfT}oWi)FN$(Eu
zP0GIIsVgODFTKujhEqSrdiurXtLlNi^tiHXq~RDxkNtF#b2S9CDNdHO1`^(CE81P2
zcg}6_PCvrMq;z0{C2K39M}?YZ6b8PQYKuG459vv{hc5L~=xDC179oDe_$E>K(Bu#i
z?`Vd<zK3p?Hy$kYD0UH1JXwgbzR9Lm%F_0994CP~IaJ>K`2LgS(d<VsiIvYR7g_H+
zWPdX)?^Xr$=W86qJgItbbwY+ENVrcCWN~bF)X3&3jocjDI{K$j*;=q#O+(KDmC9RL
z>$p()`vL!@i1&QH%78)_XF*MnYy0kVZaHLWp7h`cp410vrqBCDc7YkK%quM~D>x57
z5O@wGHRr)#J>K-m=Dk;c=~z0CF|7jy94ylPzv63eG?pJ44?_S_%Y_Ci-0y*$yyi_=
zGMMcM0|khd`vZC2vKn_=udjB)S)w)PZYQpR)5=}?tVctUS0{+L{Y7sAXJ}6Z4<3wG
zurjva5rjUt%YR;F4&}&|nX~TfXa~8;!#*?RJan-})5-pxz|Pbg`(f0F<kuO12p;nH
zUJeK(T5jF_0Ip7$Lg?9m#1pVk`i?4V{!O&J{4C>J6{CVzmLGwO>nQvW6!Riz9E5pP
z?zCfyl6~@zzC;DFY{88N_6y4_$xpmfL_V&6`7a9~Cts@LalKqr%vk@VQBlQbA|tgI
zcs@~uMaFSn^BG9)nbbk9&Yb(}s#mu64lsoG4RMt-A9Z)x8zGleYj4iQ^SpX6ZIhsX
z8+Fi=ly-6}Mb@X;Q#yFW=c>-m@b5{L{1n50;<S=#Cl_9=y<*HUr<Xv~Cy_+DA9JV?
z9{RC(T=|#JDmRJnwP()F>$`(eK51Ss#ns#DmuW9WpVRg6JRS^iq{LXQOmCDHrZ5!D
ziS~%JlsmVj+bKss?445IJgK&`fHJj_vrdm&Ig7bg(oS!oXh!lXFAbW@BIb!Kw-!ow
z{&CeCH+S|5U~xeaMIVEgyWV>V*$g0^e_9b}Qe(t8Q<L04BL%qzY>ULahYq0Qa+ALJ
zMKljw^4duyuJeE6)@O`TmV)%uK-T3vxGtl`Dsl4pGJ!WVHcWC>Or*da!*}c|9+4xQ
z@&*dzzH=wzA=pNU@N6{l=DZESu!!#H2+(~d6A_QL9#S<1f=$E|%rOhA4d=^Wu8&iV
znKk_K2C9EOq3D#%flzw*yE({PtDY_?(rj@42y^rX8CybL04QnhxmJ@>h@_JQtbtQ%
zH+cEU*i(?}6Hjh^GTC}ng90tfrvc}&6G+75ZAOkjw?-^cBUkx@8f-m&9e`SA0-9=s
zZpBkTlF+?N<Y;_`+>sq@OH-sycY-_yPzbtlJ*5Ap5h4xH%0@{Ul_K(nExm4Wf)-8D
zsz&WT=x8PN7%AqKTlh{45rQHk6sv_KI=ZL9%g*E7x^Kbiz+6Ha;yO|b+AVJNSk~Mh
zIUf?8`~L7MMM);3x{&rY($GT|PWeb#x<0P#;qg}@Y+aTHE|_xd_O^>|e68YiFJicF
z5$s65h1uoXU>%LyzTZf?e-l+*QuXP%zF;z0nuhZH+ukMrA1zeN?|gp}NnEd=6}EXO
zSkjj%(O_`tQE=(?ay%sa%}o^Y1F0`!;jClyx-E=pIgQz5ypnvjD>`7ry4a~;n+$>B
zkT7_K&r0uLZ+J?$(tkC<jc=#(@_uNQB!W8OyqIY1NVRy%{qICcq?T&RGfyTN8i7A?
z<-_#8{A$sJcL8#NG~*^dVB02b<jb2Q6-<9p{%m^&@-a4>m;->&P)2TN4peIoDCDp<
zT%a{#Ooe>Zc^XU;x59~i08@dZP_nwV4}zi=B6w6@_ZhJKUI(G9JM;bkTS{pA?x+YI
zSdPV0Kwi5i2G9>~l~*HB2yJvzKxc5}u6{e2wHFW?4=Cmhuc1LUa6oFPrX`18rrDN2
zs?7pIppSZtJND5uG3*3n{<s2{S)Ldz_p4=y6xoG5(9@IFm&knSofV<Z)SoZE-@I4y
zCE(fqc1Cb6EDye{B03|yrr4$ZkazW2|A$rXEDQiR-OL7dg2+;54^gaM2vvN-VC?W;
zlorUh1J0v|4+)YPfJfHJ#lvC(XCkV<!9PMWR-KQljaJaj_|9)bpZ>KH-8NF~F!=}C
z*%omw{Os@L*c$c|udrg;^IZ<icD``Aety}hE3Es#je($OR}6G&0dLiK!*=`#RjI~5
ztM|=9z0+3$vbLEWFe-9BA*QbAuH)(wJxUooV_+1VND;zFIx_T(jzl83=T-XTq+6Z~
zZGNa~y*m0%0)n-8-iaEo8Fya|jhzatwDWoR>*(3kynksqpd*J0i{w5ycWC5e@c$EX
zd%jiGkEA}Liu_&FQ29z}o>n=D1q-5Rxb$77PYwO$$FjfRCaNJn)g@0x73|bH7S+ft
zkm9!!zSix~iY9ipd=G;J`ximv>BZbSd@=&B2LwQv5eXEGxLJ|}?1IH`)3Jxl=3>8E
zib{(B>Fpb(90%dqEC+mIl>KTUCFoGzTRwlKOEc(#(*p>m(yuTW`xsDD0N6%=^R9S%
zEw>dKHa=Pa>c<9BC)4=+7o?d{8rd?5*^T5pS{WP4?^4CDNeqClr3si7UQ6K|5(4$t
zPAXEb;=c$=Vn{W8;BNT)1LP4YiLp=kIn^^zc_*+sCqm^{OwYb#mOjNeuVL9YCQz{U
zyw~s;Y2j*1;S*Z>ibp2YL&%C*Uql^qgBA?WDVA1CO}261#aV^4{bM+4p~!u%wphFe
znTC$l_c9i01EZm;V{NSHx`mLejn<uK6Xz~>UR^=3sp*2QsRTW`+*+c^NmbVKWXVqj
zwCz>VVBk9*gY$AEFcdbZJ5ahQ_+?RU;49*k%~<i^t5DMUGDCV0>(MZVqQ}Qqk55S$
zKpz%^lT)Oat<NC;-9}iut18Fk+gO0)aY~tD(r%cgBH4MI4IN5WrzLdF0p?I(k+krS
zt@~KnoBQ7=?l$sp=pql?VMj8Z%vESKe}G+!_;-J-h9;-RqX`(gB)~^1nk-4vljQMe
zCQQvLtf@>F3k!`MZSO-QM_$V}gLLH0)M^{j=H&PiF7cd+`<o41R-~ktDp*mL?I|(1
z<#1}@9HJlSd|-qfqNU<DZF3(F>26k*kNqmP@9y6zQ-FCuYi*ftOZPd$fu@S5abQ?m
zyU*-oGY`>k{18XWr*)EB4>Ioz1i|rX`120685(;=1=BSW_w4E9I>i*OUVmJ-6zNYY
z{g&C{7J5EJvZ{|ZJl&!{shmJ(&$Rq~sM72AyL0T<f#T0t;ggsDh&LW5H~R+vUmea}
zEL!N1V9VF=sE43IR&X>IndgiDj8n{Qp><>Xp|PCH9=0{Lh8to4ppedYF)F`^z1dh_
zjz4+czv@lsKt_okcADAoqm_80jw?7mfd(bvFu}8zC%_m^8_J8hr2AmmKz-|_D6ufB
zyW2MR8@c1p1_hI|5<Kl3f7PxcgN#dRwqOw}Y5hU1fQgUk%JVWIx5adeStR{<#EZ|V
zKk)5|&l67ZjtyoZnU)Ll+MDt^qnOr@WA@c!^OypVV9Zcr*`zoASb6HCGc0B+tf-66
z<0p;Kr_v%DPgIP<>nR-4@i0ueve~Mmjg!THiqO60{tF?jE66rn%KdN2o`U`=8@w~G
zM)lSTIfr<m7b<B)FZ#b1N>d&DaPg*%aTlPVwhZQFnM2Rm61&zuwZ0a#!_UOb2vt<o
zecGNgS2Ua&=RcA$hA*9Bbz&Hv#}t1I#^{4)*3EbpuV2cp;78^lZ;71ih_$6Of|!2T
z0|HGF(&@++P4=-eWa(4&QOJle>zV@71G9l{iK4|BQOuE!lSWfNI^Ww)Ms-ckop9Tz
z@xPAimOGyoebP^(7Ru7W^)HBa=|vK4W_#4M(l(FQF%*%2*uR9$_!6DIqHOgzK}!I=
z0RI9LJXB_{(ghY?>L*tB54Y%ie4D$Eya0;vr}*(j{eKZ`e9(j>8LRF$aKu6j1<jWA
z`S5@FeAHl0q_>6L41M4~evNF$*}Z;C(i;x%07RT!qySp)>k3*DUf~&C+?AA5jTeH5
z9}W+TsjV@}4kqO<$9jSgnj(nD6m(<yqiYXDtXGQ|IeZF+mE>T%2I}Lu<y-_s=oCzn
zF`}5H%=afAYM!$Yy;%<WTaZ>hMKh3)4!G;SpwEN6U9vJACCs$`?nlND&a=3kstf><
zh3%SMk6*(cdVb9dTvs5{M^jwfnoB#7NOv)by*KKU*IH~zSzE|WYuD%x$RSoIx?$e&
zu;wXtn8DUv3etgh)F1iG`q|4D^AELJiZg?B%)k7$j8kk@#HI6NKO-6uVA*eo82oE&
zb;=4e_>?Du0qrNj1xf!m02sPvLX@?{+5wNC0{ro&>vHPWzZJh6#L~!(&jsihf`p?q
z*{GR#M|C7U+nZD?Jwo#}$okQiu8P^ux=1Y(?VhlauR`N5s6r&u{lhsNZG}|gowRwk
zrp{-D16}qVKRN-8Pyh_d6jmr?wc@1~oORmI$iJS9xuiJ7oeEX9vR1ra)ooxxv7Hsh
zP6zh{Gx)#BaC(X1f22E^##W>~K0=7!MvGp2f{{WoQzT#+oD(U@%&EsIy`McW*n}hb
zm_cq})Z_f)z{9AVTlmJsMq@Xg=WTU)QNUT9w!aHIrlsKh?2HbGbB`M&R<7SpA&UbM
zpNBMiQ|$ZY8#;7elV}uFXPJEZ0sZ&rIjjqau>3)wufvh}Kj&=XCl@=l5ID4i;I^30
z|98V3F{ndy$$R5c(dD31Om1vSPxoIDH3V|wg*dl_cz`1IA`d^6_|baX579Q7Ab%V8
z3~5Gj#?F=Z7icT8yq=^92NAwEp3vIEf?&7C*w3sCwb|i?L_x6Pi!uuYrl0byVeHcd
zLX6`cjMRu-B^2r>&Yvv)HnvQ=@Iv!DLwV?W=gcoD&L}~&%aH^o{5!wJogjDCZ?5zo
z`{C#bGM_$EqSqE^*=_}Q$!-bYZbBu@mxbFlatwhR>*wTWdEXoy%i#o?kM-)3i?z_-
zUHrc2*(#UV>-qq!g6L=_qE2I>zPaiF#4q>hmJ>`r&|}4i#lY#ei)hE2RCvb($eeDp
z8I6xw%5?j*{A8yHWPM*{84dRP%Vzr(gU$?@&u`tL*FNOx18JabKgyF(#6!A}<-n=H
zWnOLZuVO#HEuojhsrdkGTioF`Y2YHce{KUZfgT|rzH>(^ItKL4V+<*;W&O9y-G!0?
zCkTB%ga33Cg~<nT4dk|nsKJFI=!AOSQgMMO+AcSV!Xb;+iG18P!cC3fL^bdH5T-U&
z1VKq=aE0BG9E^w}azCVY^I&vwyxaM6OgO>|06m<r+e^=oSl;0wP4QCWwq8uc%8phQ
zKk{n>YoSZcL}@95b??K&Za+kQHj(>v#hhVjR++w%e?I(h=ph!hCBwo}Q~z1$bK~>5
zPqsOMaYU~977EL;RZjb{hlLipC<QGVCist9rCLV{OzV3dA3yN2ob^)&i>{2?v{**t
zed~n7l8;;_N(`qJ8e01@XXgm7Y?z27wAQB_(pg=OXhEGCXLkH$^bO11@>VPp_H%pw
zrwb)}9@ox)t)Pv5VXHQH!q93Yyx}nYzh_AZsnQr(MoD>X!C<%C3Kq+3aQUZtzAFs1
zSHkM^`V=C;HT4p~nBj5Mc=(j-22ScccT@Ouqsmej^3oR3Zh*2)ExlU*ph!raWGYk9
z>mdr=yl3V7`WBih;Ny|Cn|noNOy<@E)UPz`86H0!%K5}aotESBTW4NLE^DY$5!)dv
z@G`*$+8jqjw)!eyCHB=_jphv{1L_xR;@_z?LRS1&$%>I*VzuykjPI|7(w_tbhLz|K
zGF38~pU)-3d_Sh49i6VcUxn*DH9z2_eV>p>B3NsWK*Ohi=g@mR7-VYf{080;doz}1
zmy8WhVK3$iuC9a>0Sn3}kM<aP0>80aT4oepihBm>y|+76d2MdJcsyQcHu;ySbZ9*m
zJnSRyh8~q7G3xJ)3(!hLLX_pP+j5FSp3HlQnpgT}T=~CyJ~F|F*m%!+93VZyokot0
zqwjf9ZSBBhcya7nk<aZG5wa0juur+iV4r$`hs{E*I<I9_Gj7|CwVAfr;VpF6AHf0}
zWzdm4l*5b01(Sd=`dV{UeE!A_Bl2jXZP51>HgpD$jLoCy!^vG(iJ@(g+LxhaZ9`M_
zvg}76S+@LPT{t6&<4OVIS=+abl7i^A9@~-zN8{kjs_j@tzM|ekv!+b-y|Nt{{85)j
zUxDkh6!!c9I7uWX1m0+F13yMJ#<TYV=jf{(#2jbIQQTvfZ~co-e;!8^TGmt7OAz|7
zudW7+)D7nn;OVw67{H98rfz*<SQ~H1Nd9NCDt#h+*iWtuG1saDDEt5QWDU?`^T9~<
z%ab939ve=UaqRyd+iUQlV)(PP$KWN`Ykkedvoy%br!Ze`YyB<F6Q^LCDmz+@IaysX
zKOpxeLwNbFn#&~8%gnft<nv?c5EF7-+0d6`EoE!TrAnjaaBP_~A#>&0CA?PMC>0#X
z-uyu@C~d8WjIGE!TQU+(=on2DH<isBF~fD4Ho-&OezzU}HnH8R_jq3UyBno9g=U#^
zF{zKX&j#y?_y^$YFoz|&1^y;-jno*Ir5C&r5G;pv_-7m^v}idz#kO7b)*aswy^W#Q
zp{FD>lnPgG+A=FG8GCQ~g#V<X6V4f&pul>3B#mspM{%Gi$DqdG9z~2VQ;d4?Gf<fh
zr|0jC$Ro!0)0yNL^y-cEyCjPJLqbqPZdJMpY#}f85I$%f{>}OL@47!)=qX~8@V+w#
zKQ+#Z;fh9EAoL-%-0E(<Mx;EeHEF%Gr8|{5&Qf-A=MO%T9hkZ-kJSjAb+O0}<lya&
z;8txsLKaD$lfbY@YPtt)>{&G^N|5as3Rf>!z7^9dly`R_-Ot%Hu{09~$2jU%vK8;X
ziy~M%tRdX`+xPkrfVgZ$zm<<tgSZv>GKgk-odJQipz1XHk6{#<pDv2p46d*Cu6Iul
zQ}-UkH0|^al-i{v?u{`Gb}s|JNDMvRjffw`iuOO)SLce*U#pth(LHA5pYFubXWO)Z
zk57(G(#>nrVQ8^0dh?erAmA||m}G4{EE+MUQi`$s$lP(&yC)?ju#~>eKgO$DM3!f&
zSkaqMLXUL^ZkzFsf$M+j58X^&-P^Q(juHas9ldFuo!XZt^Bt;yD%z5o|2s%D<H3g$
ztU1<X(5Bh=q>V6`5ASE*`iBhC?w6A;2h%xPR0#R`Mr*Yk481>8cx7zxH!!9i(fQNI
zS)-xyDDDFq15$4a8JSR~L=Nk=dw5T7VK{42QTS&rW?Pq_^`d9}ICkjGkKO>HtbMfr
zQo*JJ;k#O{J&~Df2c=8Q5P^q^9>Nsk%RiH_Oy_~Npv{Y>Ew`kwDwV7c4~SSUwD@dY
zu=JS-@fd}!Nl%>4Z|~oIMlW;zg~jK*Qvo5tnbTTyo;&;K{(5emR!bO?%*>B#HFxxN
zHI>t#k1}0;afRLQ_vpCAD5t6nb|3vSf)KgHFjv|4#&}C*rYt{RHlGq$m8KBM>K$yH
z2><`nbvV>Jt1Y1a79nX)h;U`INlnntq73zu_QYpa(`I1XwG3&kY=}0MHA#`lcb1{h
zRZp)jH+s~4Jf;<p&KD3K-eO-}_=BhyhO4Z!s@qP+mV(ComIt$hAoN|FpspE(3{%gS
zjrenz4Oy(N$gwn1U1<ZgTw?gB{j2VjFlJ0d6hYpESIlV5-#bXDv4eG^j&Up2Ug4+N
z_pOA4R$YuQJH+9vTL3ndo2h(HudOjBayuU{JWI&qxIHA&u%J$mKKoMKEAc@-Qw&qf
zFH6&mrHk+NTq_~$M@{+m;m2_AXipoStc_%+hesci=Lb%VLy3CwBQ}x{ucQ(NTV4@W
zo5XfRDs(5ee3+~oSuG&CJ6=eJy1lB+-_gsccTRWtKCpngkz=Xe7i<g1zw3N2OQfXo
z#+oxm|H%>m|G1yZqz4y2(Zm-rKS)wh3l@f3{?ahVlObhm>w|sIyYnN+T>46uxqkI5
zaV)}jA7`We$8(cBMaJS{sXGja8$4OGz8LkepQi-(Q*CiDyT6I8v}X+VGNRY&wyVx)
zVR?Lk7n&<OzMgdSxxj9Fc&ycuf1-mxXM9<^?N|MDM!8&(;PF$Pn&v4GANlhDy0tjg
z?E96$j3;QE8TNGFadbUltROasTc%$xMxM!swhXo7C{o%{kT%EqCWEK1D;_lR<}Jzi
zr?6MOk%t)Tg-D+)p8N1P_Vt^>SU<iq`0JoaAFwlE{bX@cHeS}D$5p!=ik7Y^OGp<5
zzl#OMGkWdTsX&7@9HJJE<*FC-J*P~YIJT-Nq2o;c*Y+iC?JLv89GM7lwqaZoYMVPU
zk|^9s^^4FH+9UmD#c*&{E(4M*gRt-4x<8<K2He0K0F{~nBgAWO{@XJc!PZ>N7<Wei
z>x~+yTEj}(OB??^*)X747sl)hjGcOLQ;#qMS&!Ne!KdjbN}R#WGI%}gWQ{#mUiVGM
zlJSq8zLYr2e#G+-{^dvofypym?op(X?)zLdI9c8SzR7MIQFh~rp-bWSG~<!?@o?k3
z*R(gv@N(MVSa%aeL}<-Czdk*i|J#B`F2|xHkk9FQ{W173=C*AP6{HA5d&G~?uH2$k
zZmlyjb8~h2e3G)@5!U8em+O7FRJZc6C*K}UIC}OPk-8vy{1ttY&8K)hm-T)IP~1l>
z@3nN%2H*zQ+yK6SUT5aUJB=6MM$M%5jYbj8!OJJl3npDXwq7eTWqQ%k4hKoBxk_;e
z`8&{V>%M>5wzCafApi87el9iVHUCbm^ho|~jF_M<ipkchIE#}QN+bw*Y3TmXM*xk1
z0x)M-euXs|cpN<Mwyr{e9lVX0D^rp6aY($>jdw7~JLtxyf#0i20JkSyXE+O>QQP;;
z_W4x>uRh;p`9no)fd1;)7I_v9iqYJv04)WL^9`)vvvtlW724NL;my7IV}4B2jzMBq
z0h4mc)<bi`^@2uTOn45F7)9>KWqM-ns~4j~iC0Ung!fgjO4CL-kyAPfN))EKkujGn
zl-oNUvzSF2lgQeC_Q@A6l^5zE(BQI$jfwZx|Na^H&_4q!wiH*#99$3(?9oR1bM9ZY
zo*F_Ez~QuK*8!Na!VA56u&Cs@V5c|Q9*{q{x@x`7X#V=tdB$KCR`NOqQ`wetDD~=^
z;bcJApPckSL3u$+LJ5Q}P4p&}jw5DL$0B(5x@uk)oE|T~s=t4FvM%!Va?`GmDOCMi
z-oBSBCLiUjXz?s>w9x9_Lp-&WCZb#%1C|_028WF24k*+e_$MhYv|~Gy&!Yvnbh-vQ
zFa6RmmzkSrnI;n4&P!a*rcx|VdG*sw;Ld03CRo&{H~N;Jp4LXeTrU=Uju5&OOlxJ7
zT^*A{yjMJ(89fQLJ-3v!&ljy_gw{sujBIY|%IGYv#Q&c6RJ)*wZms)$p=OtyoUEez
zeex1jTxuUUI>&4ddddaWMtU-H-b=@t77I*FgLl)a_)Idvun-z>tNnm^Ja4Rw1{&JL
zC-a-^;BV2;S#ID~L}N-HKE*Py2}C!5heY5#F)@K-JMkIWT(_EUJ)qF-|IJc>svhGq
z)#BuZt4icr%p9CLS(X(2AI{zbsHtuJ0~JIK*gyo7E+_~}la4e|Kv6oOH^oK?)zCvx
z6s39;5eZF^mOua@^d<->DxeTLi4duwLnxuWmBe%JJ2U_L=FM@&(d@w9Ykl?iwY4iM
zhFWbyCB>xwTINsWb&M7K6<Jc^QZCQAIq$o*{ec%BmEmApPi79wesV@iQW6CT&noR!
zM^d8XuRx?2Zw}r!=2K`yleUI=m#stvhwky^<m5mjq<fta57Wf9doK|t6}6t(6`X?%
zlefxRO`9SYxAeCLS{&*$#+PRoJDSRN<18oqLZ*4#%BGHo?tUU%_QJbmk`EWQ@Rsq-
z=x+y|+QC0#DfGF2#x9<@sC^^`+ag4zNS{u$AeAC-s1&)KDe+SCD4+<x<&iUVim(8R
zJk=n+1r({-NHlP4WHb(!KXae``ixEg`LvhTZ@h-%!4aVmyQ=2Nn?G3bft#za`KWN2
z31#dHMt0?Sn=cGKZ!d=p_O)iad?T41m^GCtG34m+&(z#PVBMpOg*+7=>~T-6Uq<$@
zE_18g<_QY)_Fh^E%5(nKz4^|>#f*8l^f5GoSJ?A4x4r#ZW^eWQK+d}f49cb@y<F+Q
zsNX6Ok*!aati5aqYXhjJ@F(txTedF`_cxwy|2no1(tAQcBlvy|#ySLF^%0-DCE#Eu
zftMqXe@9}PqWo*#lVlirgbc1lCp`)S@5uJ;=VoRV)XX>zXkg;|Qw4HJRIouMB`XaA
zu7))z>|?Sl&qL2EfUgx!uCWU~FVVCi|IAiiJ8VT}ZpD~BlN9&YHp<Bh994PMm)v7Z
zL7dqq;*CeY*qdLy^K=2e8lWsFaH<N@yOw8N)vjBRv;U-%K573)m-zJ{=~W?=-Kv$v
z_Ez&?ZWT9amIq=x<Fv6UeH45d)Wzu&E$u}xvhS)G;as*>{KU;r-B;ZluVffN)FBXZ
z^nE<4=RraE+NB?M7UlT`#DR>dHQ&L&fw}mN)&SOt%fW>5G0S~&?M)D0cgj8gVIz+d
zb3%PQy9D0ebURpTy<auu8+q{srj^OkNA2sk=!O@7Ajh5xQ0Wn-*}}+}f6^l^kL|=Y
z%`o_B|E6O!sYwHu)jsm7KLtN47^4DC5^ZH<%imm?GF{5e``D>If~&ifrox0X|01EK
zZ~WaeRrC6VE2j=59#8rla9!_6(Q4kRQV+j2yk))moOMLWXtKoWX{^KnN7HmJC+#HZ
zGx=*Xi}M8<``3fcwM4PHZt)GR`rYo@BF=x!72*yrZkE2=Rg4_snq%uE@!XEB?{#vQ
zX<bj1c@QmL>?N6#1OzA8NmBn5p`@gwT`hj1E@V4!^3Dp2Kpb@VLi-OT4I<hD_p2yA
zATlTzcI=kH;iUNiv0$Ok+zw(B#L;VVSJs2MKH?KJgo`ojvd2Qr$2)2EB(>?JYpga<
z7|!BY&P!CoA<M?<nEFM>MkJh{N|7R7J?d2^o#U*Id~BgDmk$=T`!7qRHhkJ=q9I;p
zf0yaB&>_yZaVn>|!=oXt+S&yWyA|e0i6>vDWd__c3DEGtB*WmL8HK%;FdyXTHdTmL
z<Chg0O}NADSgx!~>=?v7cih^x-BsfYHPnGTSUk7WK6Ls}pP!w~>m-YBQsY(~Qh@Qz
zwxj1lIzIJE?idtK91pc8qSGwYUN1ydewuHf_&E^Z7kBQ3Q+Q*y;|m8=SKs*-dJuV&
zkce5+-IJKzl!#liCh4!e+*=R>a{K5TA6LHLBMUZ_I+AU30c;R*!yJgi2b+7NOl2a1
z4OQ~ieC#yAxCAuiz*x7{yRbd3LJ3U}*3SmNwzh(2;|(#FRoN7*a<mslK^6Jxk-Y_|
z8E%9&76b9R@5~4``qNys-Iy_-Si$p(N<zquOBpmJ6-)6NzxvBqGYscUvrJ6c!ay}s
zYcH5GRv%+^9DY^mMOV_hfCI>lfYm_oFR3zslYx<V@XF)DT$d_$2>d0-r-Q4;#u8Zh
z$1ve5JRCQP=p)_PtBPwxJ*pFX&6uw|A6Lmn+k+Q<(|l{T7gWM;1C_rmet<6aKfvyE
z35-DhQ^EdxZEk5XQJ<XwR)_toIn{;}tmi_}95ZVls-fJ2fLb4bMrSyiT~||4nU=rJ
z1QR}VqN7klLGdAav9`w{<9)-GUEKWKNyhx@5`|;bO|vE?YhLShV$3(axcSYm4D6(2
zIPf6VNrf{5i)`T8b>mG#BGnol$`7LcyrA@Rpn{sutESEfHVj06{m2BleRhFN>Yb)g
z0!gyb3(hr0yIUK}c&Fi^A+rMq4ltr?$CA^HOdQ_@JPsH-*O1(*p0tnl=+DM<g7bDr
z`v`Rkg4>0SO46S3JP+(Po5#uek6;rz>D!J3mye#0JOU&@<wRB-g!P2+uhG$WRW&t3
z1BX`E*3ui%Y+AS$uCrp&GIe)14>4H|!c?_r8Zs_v^pl*lhcwi2my{j@ws5<w?F!xG
zoN1UoEvV^e1q96MQwQxy;7!O3J*sP2D^|=!iFHjqx{m6MpsO~wPHn$cp#VDd2=2(y
zqi7<LI6XO;8^w}u%}<r6C01D4<2|k=(LuBu?+Krt`fit{1Sv}V@Uq9a1}uKj#x0!s
z03$#|*GoueF{b@Mr1&5vinPZ%egzD$+24c61YZkBUu0%YDr(r?M!<uDY=%|$Th)i|
z0_2w`p@r&5Qww4#(D9TPFLc=eU}EmBA(N#a(d{^$N7~^u`<mmwKY95);NHE;Sx$W_
z9oRX5PEEGFQ3#g+>~&|e=%qhc6YQ5k2L9^2U_<haF-=A$5%GnE1tV>E&wA86sStwJ
z(S$Eve}!{)^S&1TETws$r4OFZN0_D{M3#gHY9b9PbCtIrFn$3$_+obCH0_(rgTSfR
z?Gw=yya?_;Q}!u>ra78_wpR|GR&~d5n5xMQzo-=4-+Hp>GHoT=G_J9*pPdT45r!>#
z+2!2^mM-DvQ4mAb);4zV!NaiNX+t)6Ad)3eohDL!v4FGgDX~i>;NK4Z5Fx4{Z|$S1
zT)sp@^732~5AEkpSkOh!tK&>2`&FPt`q|!s^l$8d7_3N0Gcfi8vfeE}BXWhd5^g|6
z9;>0sJ76Ocdr4{3MeL^uno@fhA4}1Zr+MdSv^PqkE7arEltfbu;A3Tw>m3@;)4+#-
zAQx>W1+bH0v(9Cjlr*>lbObn;kPe;@y1KwlUB+)IpfE!BU<^Geeyu|^qBT@7(hyZ#
zkmSi!%@5#S7hdh9-(eDvAk!n98Q4C}F!^c;F?X$_M~~u~o3#t!wZR)70#|3O3MZ75
z1j3h>m*0P>@n3wWqNH?HrRS2y!65>{f>4Lp+-OfsH!v_j)z;P~>JF=&0oxRtHCOiG
zaFn<wRS*HT>%#`r>aXQA=A!YMi{m;ps<d#>_yZsE`7+7$0&L)A9`9A!H#%HEt`P@s
zglYPM)%C-!d9edEo#AstY*XOy;9%R7W?s(YAKQ)!sGpV~0}IXSh)7^5+1}nhT|&tq
zkx0{|-a>MGLHUpQYQK4FfwhKGK&Kq6L)JGiubGfqdIXT^n=aL)wO5P$JJxFJpM4l0
zpb?V)j>R>dlfyF8<-LMhI1-7R{`y)fl|4QxW1dhyuZsD-cUm09b^!sxg~BWyC=n9r
zhiz(VLcI@_p0oCtia$uT5dj#(F!>II3{48|b9rtLy376+X3W3rG96777D&Pwngw#T
zn#jf-2a<2SFmBCF{o*))e%3>Y)~w;NfP#u5-5*)P*UxUC(P$1`IgQf~dS@;?4k9|u
znyL?k%mwj=N;ZmV<=1bo+Q1(?=yna#2;H$o?C#VqE3?JS^2E)~bTed9!wVe^QaAw9
zwcDJAKnbp~Bv7%?UI4oOh2p+XVs4JMN>@i%yQ%@xgT~h(s(XCYoNdD)D#LiZufZ)0
z)Rzcm>8iP!a^~^1Xevd0eSH(n`jvKyl^PqZPXZ~pGehh)Kh>au<&$*)`(~xdlRL}5
zlP4K=y~7vEB$U+c)z$CXBNH`Uio8=%nO!f|1Imn@<;5|Q7N_HWxiDF7ma2~|z#EGZ
z<D-4U!065O4Bp=bFbXb0gWBCpRO{d-^)E%}##wPscW(a;aKIqy(W6H~s^cG?0+BKU
ze{Wd3oAt%&Rr}m$vyNSGiLiV<_~VB$$4$Jt1SMJ=W2b+HDEW3uO|n6yR_)x)7UYh)
z)W-&Hs<Jy;Q;nf_BA4U$0KadsH1UZ!M|WTq6EA)+p9Y3i#8mk?{ToT(4k?^Td%|ac
zij)k#5E5AdZx0r?|2FWxHe|a>MO_{L{$R&&aRZqQ2d^3HZ8z@CQyJ)YesbVbdN?FG
z1PBk@S5#CK2gKe+z#~wQVvG4b@L)(~q%S*U=yg1>HR?e!Id4GV=3HJtMN4-eG-=ZP
zchYowiCwSYNI$mIqR<|?n5D1#$BECRER2lYg#OgHB`LK&GV+!sI^nsqQiN`LA~&mp
zDDU7s{<z^<VA$ur$6CT{jZ;riwTHD2tNCTOu-Nr0l*n9!`MG$4b~UM-ZibiDUl)XE
z0pVjGIB!Y~HN*P>?b>&a@6r6l1&o}-)uG~WO{TR`;onGg@mh~^l<q1A&+d9hx<+BX
zf^|pHis#boEX?~CX?t@GhsWFNcLnf-wzRjmtHej|#n%Lws)g>TPFWt%zYH7)_omsv
zd8nfVOt&BskZJ57jZEeLl1x7VnHt`F_<XM;4eCLt(^u}6c>}ppbb&F^PGX0l!~^#O
zqwW)^it21he~c+>SKa|j6o1$#R^XwekY(5!a}LM_X4h7i%Q2PIZleh3l6{WqS0?OO
z|D9lcF_>(P7r^DTPNRnxn^94}?0E?|riH4Ar2tj?nwa=9Luab;10-g8B=xt9LtSv5
zySux}L<q3=R7qT}Xx?kmR18odP9Suvc-@S^1z?|bgNT7AGvLsWoT&&v0^ex<y5`lt
zgUA>9nX{g(#>K^<Aiapq)dHUawuWdY?AAUE27?0rul*Uu6kb}=_3g;|`ib8L%=gpN
z(#)jnYi8s(3mxjsdwY9RJFI}P_2=#V<HPPM139sBuhs@Q#qlRiGx3mr=b7L9jxf>a
z3HI=q&lA7RD{!d>Lw(T;l+7Qv#PyVFBC4%t?#;O7&F<{fQ5Hrn|6KZyg!NG}Ry=2>
zoRn6zx8=$oQ-i_}f3e#<*+crI@a+K=2xN#;{j=}Cv!`E9iyjx?6OgipV`*CXirc>+
zety~yM-+P{P26C^4F3ims5Nhb+o?H;R2mr>DcUqRIGCfC&X$~CKU!QhUlCgfxyH}W
z?~YA|O)GnPdz;h-_ZLpzM;fR2-1J;K@w6_~)(^&7P7diQziAX&K&n%XFN!PXv~f|o
zn6|t+JJ_7FvxzXvgSp6<yC|8HM@2qP5kwnQw$)NbS%B-Wa2>w^)Hi^xQ=<P4f!_9J
zkBXNy%**C}TLZyq`%B9|Rs7VNkz<}86QG?T&6tiD1h5Gn5b$QJwCL$H64A;+0)QZ=
z^KOLbW*K<%>R8MkXF{<>EQgQs#fvuZ&-L*IrtlSls745TIL`Cw;Ml_Cs27Y7c_|`5
zm>1#c+39Qfa~l9G^r-9P>fCU3%l0$*9HuX~Vt?okx!eJMIuV<0YNg*sxM*q>9YBrx
z8dPZ>sRjgP|0YDdkjJd;DZ}_q>{8=;-#YkHrTwe;T*OI+CP=OOPm{f6GCC0#4Gj&0
z4s(6PL5i}=AaOcROA6ZVnrZ+yB||X}fK8v9i?$>#60L<lDPMUmkA3GJvkhzu_TejX
zbSB#<FG~Blym%u9BtndOpD#ayHwXMMe<Lq1&GYImk+<s)G|wp#0uXZMg)(hV?=(T!
z&<r12MQrchul)Wsn1*ThgfIRHeRqQ|>;<vI?%Kvg{5N#^`mK4_?E)LBc^A|a+za&Y
zkiy5~klP^eOYVPi!%ZbGyb6NR34<3ScD5>`ei2ce9H)gBDx9xx`)@*gcNQ%l%gfsi
zi1PBdJ|%zBz-u>1XEh&uI59DiY9NM?=UbkUxv@#{axj_b>ed~4%{^)-`keRFgfxT%
zEA4v;k<i5w>LkuY43~FgYn+1%07DjlYOvWI@~t*ttuBySn*hOYa&O4DI|_{XKK;%l
z5bkIy(=7wX|FjHJ;bnVBKk#?34#VVWYT!)6AFE6QjQOFpQ@dVY29a55Ae7GnE>05r
zmHQkDqeI4F0Q6*y5l4M}+X?KG$m3&~++#~Vn|eC?x*)qCwY%V8hTmGU3|~H#)wRpd
zzU#>a)i50}-HrE|ThgC$#mOL<lt>|_YZtWMf#1iZ_XO~8+!I!kHyi7R?#-SH8rJ<L
z*1r4J#w-G{v2@3&TtGeeD$19)g~a5|a{zwN9Jo#^SgV_eaDxi6pv;JhSA}U#M4#<{
zIgyoP3-A1-BoELtG{#JG=ttAzZ<SdA^lM8zk)X-Rh#4#CdveV{NWS!hfT@7PR|#yO
ztC@Q&DgjxR5LHM%VfVJ*|E(m2#4b6@E?!er6^K%??zqQQj%dVwU4ABbPw%swc&d((
zT$VN*58=}_3bZJgwS{rldyt2-)syF32P4(P`yny9SepV>AUsQ}4_M9}b4+cNd?QRn
z2j{6^*wWU*op7*dyi9ofGA(3TVxt8!^6ATMHy{sK{C`xx{LDb(lH&s^>qb7>lUL=`
z<*bA?9pk_jCMrnCLS_403dlm<(=}F>Z+u`p=2Mxqe~$(9z3rS2uEY3;oP0zH%H%#1
zvvAFTsAa$CiGY9rD?3};eCsxIephtDpuDBhl{=jYiQM@y3obLz^f1r1b+Oj>`?H<m
zZxudq2LXu3*76H$ZKYKiN@p9$h)MW3_&7kP=i7&RZ-!7;CoK?8OMoZuac!@5a;GoY
zmYx7;ReK#{knvh`FdE;n=Kik7rm&6|7*Q$>+;lT$_jxe%%=(jFHJC9CV8-HCCDGf{
z?&4piJNOR1H<z{J*dO!!)=C%7{PDHwwCXMY2v4EU$v=}(MLHQ5#(AZ>v&z&3^a-N3
z2jzBlc0xGbjwBIOMmi=s(k(pjHO|vj<hpKU-J+%8YQNZ#Z_Vw(tUM!=>I@^z6Rk?d
z2)TzXq!qS~_}Zgip%UZ{aO!BHKy+<%G1A(_adly#NPJ4*Df0Yyu)`pEYbv^S`uBRT
zBFne_wt+|x`t!A$7*aP{#KX|rRPDv-I2>DIOxLI5e=>-pC-1kHa8y);<hB>`hgj9`
zAxWK{qo&&!7&DpuKL*JK?q&aM4dP|e>=$qEyjOzpRLD?NhJ{$BrKV!lw&u4<5#qau
zrJss<KpF=YiCYd*-!#T~PNhu>W8o*yua>xb%C`7#ERC7omu-9vkKS|doBYFg#KRP{
zRx6wkT~4$5Xmr*bQRQPNBwy#%;0Y%ge{K@S!EBaY<w!^FRyC?Q`Ss<-JPs@2gj%JJ
zz!Xbe)t+vXrd}~0k7)v;i`7$2BNibJOJvN?n$0CseS9#T+2-53*2*0}=&6A{;a*I%
zv?<>N?*;L2EY+fH;^L?87j8bz$L=SerrXhs*I`^WL0-y94Q?P#xL1OEbY6}z$e2&I
z@h`MBlNgaWn)&WGic>(1z=4UWd$M(PMarShjIB}MIa(lqFcI*>FG7qcFwJ>63*9oq
zGZa%qoSK^I0)69$2>@69me;K>p6gDWeqr)VLH>|UhlExJn;h&QqNlYPmR{%7VS*}>
zTosVQx1`4=aK5^aWXwmW@!XsrYjEpYMC|>nkEoDxVCY@mnA86v3rcALeg)LP=MFt?
zjr^Ywx|YdZKtpYjxPc)0*v}wfHH1`}3WPPd@5AuhD;}8?)&+^1YmN%Ql9lvNU*hEE
z5XpRZ&m!6-X%UArxr}5JnPF-2jfHC9Mekc$80l}XuLj0I!s`N-MU=s7qj0{%JH&uI
z4pm}bQV^4;skI(NnG&!~A-82XGr>SsFzNWum>r?p+{=eZ-94h8xIgyg-c23=a5L>;
zqg|`6r#xdm!aCi@_p`=1#Q0?2Fo14zE&XRTKpe6&Ga^c5&SzR~wjJ>8f4F=+aE+D9
z4S}V8R<joI%og;RkoAOq#%%LkQm2E*sxI<1$N-&i08z-6T2k8~lf6&a<YHOU#9ryv
zhiqHhIXL(o`=sH|$ItJ}|2j}}y5fg}*^yY!TQ1RIx0udtGP#>Rs*#DDRHV$?e3V6v
z>pbpE5Kqfv_&q7Bl_Lf#PKE(4X*GJeH!J_e{h^>W8XF0(=^Vg~29uVL78s8yjH%{b
z{$WRyQs)oV8BLjWAw@V<Q&#-#8DYIE_~(he>aP@d7<zvCb_W7IHLBB0C#^5Zmz8S)
z3)DaThGvp(*wM3cdFip^8W+RMxa!u>0=OUe^8NrzkdUL&=^AyvO^;gRKdTLYbw-VA
zg*C+O8^922*<h_aGT|d8djk>bjjC9oy9AdcyA;I3*LDaA^*RG+Cl#zt=SFYmQ$k*{
zAoEWB=w7(%GS=rAu)BjGeGszber0Rgi2ZTRLcX^roL}H7IZjzOtGhzqneB)Hb4&J<
zM_jEpwoA$llzhE-2@_JCzWN|#u#49Zcmk5=cr_o8GjC9(M=p>4KiF6vzwd^6nxe%`
zL~*a3*!#7xG@40bf}B2Rt5)N#+7mq-dw%Y;^f_wG0b3i0j^)Z0%IL*W_D`CeyRO60
z-PP5F83|HL<7T-rEB7#N@u&|1{ZL2xtkx^BS%CJ$YTkIeb;(@bXF#fpWcg%oZ*Ts?
zLNA)7lx@_mT>I+k%*^?zDdQ=HI~toSCnv5FT!8fn>}75hxukTK2RswJ)Xkio%`p|{
zYjYluJc^#Ac>=nR{_mt;;K6*BA{4$G*~Lz`zmAM+xJ&Tmg%8E`<vE+UkxRtObEh>O
zMS%9n_D>#u{pQ$*m_7G`Zv-<PGPQA$R?v!I6XE@!&CvrH%QoMh;jT6u>#r(Q|Jdr^
zE`qZFYAxQOL;kUTl>(I*t9d$65AvB&;#DvS`HYhtg!dE|wGgwQ+Io+Wz3zw`L)mjv
zYx4xO<z>C=UUoC0?SCDO4<C$dzGzcN%^&=HRV@oruiqayv7{&NaUJ2Yom?7C7R3v`
z{5h&3i$5*r8?DHlRhK7*AA);I?`VvF;(6Xvn;5szs`A8Tal906v$cEOw$Npap8c@+
zpEk*rxwLk@)?qt0Zndremm^9m^Dr<X!R1cA+8y#;xb&TpztoU>!o?t^c1=O-1IK+m
z6n$=Ne<s6G8rl1mgs-0bSpRm=2x<wCI=@5M{O&tH6f8feYZ{FmCWP+Vg;p;qoH@_)
z>V~P-LG;561Y<JN+@XLgg}WveRWJ52s+;8l>02mrq;H^U_5pD2Bm}DQ!K!DJEQe$2
zDCW&F4hMb3egDQbq8^5$S@~P~&SJgJV%u)sH>TmigC`Igm2V5uD>TTad;^remK?Rx
z*s+~q>c;zG`vNl|MVN_kE1IEoJVH-Q(@OoLOlCJF+^<VKr7AQFYek^{a0QFh1H}&&
zFB_=Yse9#PwOqVVJ>ug$sKmnnV}v}aXcd-+lioDP+<2pFHUeG(<zxaWDX7Oxzk_u|
zZ`Okteg!+7L@8d^t*;YMbI|ZxRFH4r=J3cAva-2ekjB&D!0};{9U%DA!*aXbdt9ge
z9qL06ECzD1Sbu`bso&ju+Cd_#xpE_f8^~Z+U(V0FVhz><aqUiOdG*N4!kC*rxp%pH
z-y18Jp<$$0J3FGJ27W?c;cG{1I<d+(mkVpU6Po3Ggp9aswqCgDjf`wCnlR@_fAQmF
z%-@)ceM2we75|B3Hr+0$hs!gW@3Vy7wA<TlO4o`fj4&y0-Et4ZHFVRWhL?L2N1zH2
z2x<*R+;Vl<w8;l8?&iy!1u`WT86R9z%36t;hNc>~d@JMOjL)JG?=fl*KeGL@6BVpc
zvQO8uvJ3C;*0ZoX6|H^>|F%86`}t*;FnM_pbbJ5YBs!b!Rch7M#gPahHbd?NuCtxK
zu=!Z$eeS+G*N-`Vzb|{^jFlkS4`FLl8@j7rNr3U4@IXZ=!m~<GJxUiNV)<TLhu6(+
zEb8P{lns_@;|6l=tFPIR@1pf7<e^1sbQ+V>r}klwYx!To^zGUH0bL|3x8avu_k$Qz
zImex@iq_Y1(ySZ%v5LYYC}iY#yzHvbT7<$+GiEodj9JPsb~ABAv=b4*C!EA3m0Re-
zW)$OyuaeOEVEi!;FoS59uHLvKBh6Zl7+@U<2gUXGUXhfixZG)upyZ!bsK1(9ms;>}
zET%Fi#CGmE!^>_U{1dk6MhhwoLv+4lYM1>(0N*!ezwq8Y-JlX_C+QlC2vI!B@ovb>
zGbU;U*{)31SAY?(;07!3L#0{v=diJ|zvb@^o|q%lQlr*kQda!ghGh4#tM)J6U-|ni
z02-u{R;0u13Ex#~4;e;O5ogIOPFlT@9S|Y>V&a(wmBsJ!2*$mD(MO(ISy~{?M27b_
zM{`M`AjjP^v!0wK6%+TZL4@5+*sz8bqbn=#0~g<I=!=n4Ox!nvyIswKV?DiXt{*=5
z04k$jpf$)50Yl#F+Rpnpk`VuLmR;!?iwC0pjrzoAAmSoCYhx0fzKHn&^?3x6G6QlZ
zb&r;jq3MM0K*fh9V=XUFt>#^={~{`INS-h$ie*F$CQ-Bb@0O-S3Oek|V`V=fe-2Q5
zcm1iMY>Vj(zf~A^@G~1-%`tz}oP54)PKas1o+-XL@3+|}P8%kwYrZYnxjO25WANb6
z8;`Upw!UJ`L2NZ?mCxhK-6rj<cEk8rDx0{|!*fDq<WX-kwpf>Uc@m6I7jJE%Jn!i_
zAk@Wub2GHk;{&(BnP@hz*+5~)SgnlwbXSda*YadgZ;wgS(aZa8P$K-R$N63L4yWXs
z-pMySo9Urc2GbZyFV`HDuOn^Ntih&B*d0?TN7_Ah5EwrbeEx@nAJ=_2>(@-Jdyz3F
zl)jZD_1<EbQ#1BK{+*YJ6rEhC(;;|lrOToCS$j}S`ZP!Wse9Z}zufyY4R9nO>1kx2
zi$MkDXTzaTOQ*N?hooGpC7w_%+=b&*3#Wpv$Cp}|x*}d207VVZsDSM&7`}fKaqfk?
zoaN}tNdLcr0&+nXNxWyEJd25^ni9jc`7X*?FFGFJxZl|laEI#r%?QnEElv=8=L#|X
zz)>r4kP~hLln85+AyfU{Ji!!|UQok8ss!#R0cj>ybRf(adMeWyx@<zH=f^FrYQ)6E
z!{dfc3M13ho~RStPf&Po6(I1pyA<qe#LnZxO5AyF9g$fz@;Gke$Cp;lM-3we*|@VU
z7<z8<lIb;az2o$1>nGXn<hy4)y|#@~9prnR`U^u;pIFv^Z)>_muQy_t-1+UHYtZF`
z(kR(k7p|Dgjw)2s+K;yTUTUc1W#NNrJ^7*ScFiOoLu9VVKsiW}*F?p;5#E!%=2*hB
z+ll8<*&_LClarHE&0A$5rs$sRV7VFK*M=3o8Ll0Lo|2I7{>d>~Ao`kHNm)&;K<Lvz
zPF6d4eZ7K3pdgqU(61@Aa)3l<#kuiPy<bEk(kbM0jj{;YZyQzo#Q(hdhM@S*oKlQy
zX@dF_B@rO#y_RV49Y3{lL)-uqaTuOj`~QpKSHpKVhwQbrpJG2tl%J)l{0U&Tv}XgY
zQH4Fn+?iQ(LBY<Ixg4u$wl9|JowpksckIGswnPt?fO7J&aW@{<E*E_SO6TxmBjr!+
zrEF~LL8wLF1<JFXs)0o()>X1ceSxamYla?m0YBt1)~PNBJ^9`{xsZ}8xmjrVtVQp#
znmS*2nJdD>1li7S;FS&F<`8zHy|QC|926nNBe|fPwwZ^ae}#0(o*vUzU}K#_eW;&9
zc9{?$oKSlUyZMP@x9|@%RCg`Hd3W4)RnSXwZ1mbW4Rjx(mnBI?_a28pV$K$!SX^(A
zHt_mzqv05(%iygiz=DT+1AXtrSWG^iwQiJPV2lRbj^?hLUuLA7u)b_I5~JxDVNq>w
zG;dAF78u0m447{{a)>yu;9NZJU#yV@N2IvB6kRxT`!DN{D>$?TG#K`iVs`L4^JDzb
zkScU>Hn~eh;IBc^uo45MGS_zg4%3X;Kmt4@Z4=s-&t!SM|4Tr=Fxk)N{vj`zOvLn`
z1Z_8twKwA0UN~=p_co`;?W&L(b8B1=;-$GB8Ry?+6F~wl*c4w>>axTC6_ooMuGF>R
zy3&i+FW#WHEr2x8L0aQNRZVq>h_o@osh(%<DbBQJg!f>--!NPw+VuTW+cLfiEpIE^
z55+o;W`AslvD8s<sL}5#i5|{N?FpzvF(<cUxrgV0i%PhON{}8y#hIYZv<0Z<Rj6U0
zhw|-W)-6B;->$GrgyrgUpLo>s!uudb5!#@*)j+K`fa2Eo>lw4j1Z;>ss3N(6eGmTl
z(EE~7t$bXeAX_8h_B7Tgrrf>x=i71a?e{fb#`~SfxJ)9k-O;^`+_N-fTIedA!8_4}
zO1%Cw0LQCVmPYknWG3I`^Bn(oYX~^?8U$I*q$cRCf-^((j-wp_RBrdG@$t_<0a%$9
z7zUSri30f}XV!josc&0$`W<Q=Ca|A<a{1w|<D=D?`!C}IWA`{kc$%P}XWu9|H`9;P
z)gz-OiNMPlp6bEu4Dj!Qa-=C7U>dIZc~o*>P|)V@iuIJTc~dP;F@Z}w+aA`7t6N(j
z%~$1uoHks`NxLV81E<%*SEa}uMBv!cIZ2V%m`m-}4i*`>@Q5l}G4y<a_2-MG0NOn7
zDcDh#^Q?I*hB2)k$nH(G+s;u>TM|L~6OC=F;rp)k<_V>H&w{B&js5ql#V@x+Pa{Lx
zE}@V_UurGvR=M}Ku1{(w;hQWC$!Jb7da2c2V~ZLJ2Izi}ZTVEuTg}0PM0mMYJ~o1$
zkbVwaozUv7qoK9^4qHFgfK^xrVX2B;7+ExXH1w&S9zeBY&CBZta&se8ZbwJu+DUn~
z`Xg&R38I~y_h3jfUHyUz4yZz=7H-E$9$hCP4>`H5vnyi|)7vvD>|WitXK_f$P$;1j
zNBQP4tmll-DwiQ7v=w{Vy6g!^)vL{$AOWHzRV(NNwuCbDIL}R(-IYkX@GA8Jm<-+?
zuK6NA_WY-Dtu+3A!cU>+Cwq@Ol~){zA$^2Oh$CCbw|nKCrsXZv%uyD$vi1%R7Hnm9
zI1{`Zc6tLS3P>OL1rb$l`t|5gn`ampO{pD+Z3b^d!{4wBsdIWz{6p%!$+Yy62f4K>
zf2QFP9Utg0Djo&zpPcS*<EU2~E<AG7oPYEZBhy`Kb$XfoSN+#r3YpXuT_eUlm}{1>
zWc;2y)D!TwvV(FfCD-MoPn09f;yN>;jO+!6TcxHul&WoYfeaicWxt}Sx{iF-H1vil
zye{uj#H4Ja2wRjLM^P-1(`Lqr>9OhRg|ye!2yBOPwE?`C4*RqP2!_|eUaWx$aocCA
z*Z*Y&{(h%DhVb=rssCQ+mc72S*Wu39CuvE3HK)#HX+Q3SD8~)IQwcVEX6THpaTd?o
z?RGN3-)1i>&arbPZSHc2^}dBGRg$bx>XPu`IAkKV4!wHr;q>C}16mgcH95!mG?Xi@
z&?K29KWpYaoYj)`Dsyqm2ue*NV<VAfY|k?fSscKvMP{}yp!9BB_Y67xr<d=JxgRLQ
zZ;SnU{b91((?QSSYwP=vU>Ab4qu#6B=E_ge{l<sI#TDSSllB@?>c^Z@QKbm2=Q8H$
zEbog8*`%-Lp?DBE`@J+m){VBWLf)(}TU{9|?&eb4G~+!?0Nt^kR|}YWCOY)Zu(Rw-
zQ|t{>gMRtONYI`{da&l+CJQRWOLGN^YuyBLUcGGf-5(Ry5}5J<^{5Nt?k&hflYy#U
zcQM48vIs_A_*3%FCrbt=L1jU#cg72GtXI!&^T))10$Ja1aXc+|y&KxEK>luyKChZs
zNFx#`)BIo3bkNpT!)(IhXetXxP4g3#(Hf&!CF}>NMUg$>jlckx+S_L@On-Qq&dhor
z<a}W--*jx}2{;J|A(}D~$4xKCAjAzoe*!|S1LCEllyQVdhodk-{C3_5NTfCoCg_<&
zx9Wz;YH^`a&s(bM)yx~Gb~NU9$tlMKC)q1zeK0F|S9oOOSSr2vyEj+rp<DCSDq*}n
z1~9ai%vZz;^OyH#Wp*<f*m<P`?}UmK1j5U9xjbhz(tR9bUa=I#y;Yw}%Ig(DV7?5P
zCvfY<O!(P(keM4-3%2?dcJ=2CYj=i&cqfO6^IOo~P-Od=u?;bg4|#=#qt@r!v!DeX
z%3x%k#S3;~q(7mptTH0WV#D7J0iX?emZEMNhAm7Y(!iGH2Jk&&^Tiy;&guwakGY<=
ze2z_mm9tX8NS`LihD~Qn64K@@A`j@tSHuG$s|TURj?0CdAQO8_j9Qsp)+C8|aHuz4
z>VY4&TiVeDQp7K1?-sw{V&;ajNmn<SfUemQ@OZpBRIeb^pfZ+gf|%(c{Mo8Qk#V2#
zl=yhcu_`-WQ7p=Ndc))Z7iX&_84+<q_<V}BgaRc>W;7-L@aV*(=tJq7tegmIrIsCC
z4Y2}4B^5?RuaGPIi0gGbxxXu7H>ApeUMidulIr-<5dbOO)(GF@%D-tkeIB^E;r>-P
zwNf8di0PS#6@Vd{H#mB=#0p5?6%hCY4v#(8wo}tDl*8kmk-|V`736Bp;CbbIuU9Hy
z3Jpy#UZ&?(bC~WmWzR{SnMuB`Jy^U}+P%2X(yzQ^aZM}OnP#1UNLdTw&ztWe;Rr&4
z#~T0cM1kSkr(%V;A?9!9fQ(Bbte1L3IM%4aJa7VQ#_?MtcYa<tdUO@#zi90*|Lp4}
zCdifraL`-#=RXV-&M9%6XWgAS22D3<j9X+3t+`)^8Xe0v%e(mu;;s{R6M8-1WAMfX
z>{W#cy6B0qS#VU?EkfdwP!K`gG=83a=*Dm+<c`kS48!ZpS5~G9JBmpu1hH4ORpXtU
zI@b>WI>g31ot)Xa47x+VyK0PI0IAc;nU&q1H-UVwy!BV>?L)UE$+0qv-&BroxJvC-
zi;iW^5+}<D^}8fzMM5(YHtH9mcO6k;tmlB_^$7{tF&lmW6(EzZwNXsa8QHeyq|7Jv
zD?>U?eX42u;e-TrX!r5niT=g?jsAPn=)HXqfNu4wIoTZx{CXt98}~_K1W?Q9m6|{%
zt4y_)0G8Lqs#GCNLTg5t*K6=X*Kj4bA3_T2)b!CO5{L3YZ(`D8p#SH~D!u+fh+plI
zx}xYS*O{8f&_c<)H25Tzt5fJu=LF&h9Gji3ZaTryVb_~ym{j2$N5XR@E*_1_`}n(C
z+?n*`yh$T734@&tV6%_ae8A*HDNQiau?U43<T0dR^d8s|gMz6Y*j<Aq$L^kQux^xG
zwYh92w+p%_CSF!yzL>*1Ck8~vVnw{Rxjeq<IS=lbg(oO~l0jgaL7r&aEI=JQ5950c
z5JMnFEa=4&^Zq=X1xebiZ4oGCIo6O;khUWb*)+#wdv2zE;3`d;1pUI-cMI0V^FViS
zDY8c^<8p?_Q|z33J;hjUusSIJ5cx7Zm%AAtWzbe`AjpXRL3v_MdQAD;NrTTMPyxVX
zDr`@zY<ymAcF`HM4QPuVBCms2Y~0(PH7s9z2(KyPCtZh$Nu}rt3XS*T6!IFmx7QBi
zeZSws5f>W~5f+<fF|pFuqhNftmhvH8PKd_y`W^E@4*6<Y8OAbY9?_NAAu}E}1bqX<
z4)2v_Lid8#An%Zd1TZkpvle0{9C~7RL^lhBvmV}Asc`4`+Krl%(P_h4r?*X_@fF93
zvnX-^(IEJkmTh%x|LA}yW*^ZPik?V5c3MAR*+LK3Td_ZMZO)FPT+Bn=HHiHO3LfBQ
z&6ow<ZnM)6FUsE9^`0Y1Yf$9_^vw8xr+z<728y+xk+k3Hbq;@c&wVy`9362<GHUSe
ztlhetK8=Dc$D_b8_i9@X<*>-AbYRU20A~y2v^AbDX?Y$tvXDiE;(K7}nvUCz>!Y?p
zmM0lH{fkwxS?0f{m)XjZHG=#C{X93HBs{-A&5ewUZn#^M%OkavQ<lK0HQX!mvF(KD
zp?8f_3N{fIO^z?6uexXtl)>dvTY)4cg)+&P1^_*1cdhraD%j&Hd9ipfAb4XbD~gnk
z=~=1HCn+yhtK)gQIU-_0Mq{~Ubb95lr@Ia+df@ZP<F7DqGD21UG_PxX#zLP2h{K|N
zVoCiNy*j(z?>}^v;Hl@LPfaBFoO;c=+!tiMv<_PEhlkfUPif`<2R(cOC*oM9_A=cS
zXFb((f5HMy_;S&d|0`&T0)&VUhkk_SFfcGSfi)hvr~E3-#6B3)`+}Q0H=eMffNh*u
z(#>g&9$>SdH6@=>zfjkqk(*_H^Y9~m#*{@ZM9o6lG43f6-`j`&;TnyMc9))y)tREK
znteDQ9R$v9qtftBnfi81F`I3iqi_0jiN4b(`{n?)a)b@iRBuwKMMXs=5XC>}XWMFM
z17Ov_rXsE%pmF$w0@81Kek9vv)J{0(iBo2Jg?Y4V8746>mD6K5VC}?yaBNPud<da+
zv&QQj-v9X9!D5>>q#Nf%@`o189#^JONhv7{Nww7rm|7C4D#7Pw>MwHJHGk=g;p)5T
zuZMq&DxG5JVRlazqsO5VkSlM)))jkyf?~JxMHe-uK$b($SnNd6pSikz76|5UwY-Q9
z=+k1%e~GWdiV$*KeyhBVz>1IwqS_Gotflc=ud@8TR3EY$*UDj=HL|r?GYtJtQ49|+
zzBl)^lP5r!ulV0i^}KCb&&CQVr!;S8JDCr^J|_5dV(sw$LT=gi$GI&7IjA|*&Mo)F
z_*|r!o!y*9d$iK-sOn7DK#GYLmrVO;dbm1K#dm;em+<v@?doJdf?4l9{CCE@UNuCh
zK-MZxiC%4*9<yE#I>t2&A{94GQK|{vxDd@1PE0<J?<_@095C4hCx1gD3x|jm`wjBy
zswUYxrcjiDRgrhE*vY?sgKWBA{hh_#XawG<YV#!bUo?ct+E=EzrC}TVs)rgt8k0^H
zWot57dGKo}FRWq+(U)A0Owc_dXvzPGqqXE82hA+j-M+q(*&WeiPBjhb)(CHz&gV<F
zC_*>PUd1j<t6XaD4ui!gn%&9C{ltAUysx_M)R)|c9GAW<M8Q3Nn)KG45bC>K(>$T`
zT>enwJC6*-9=`p?#d7ZDKW-Tq^PSgf%?s-O-7OmS()urV9ujWCAJB!^-w|+|p(kK2
zM2}VaHpQID5Ruv94gC(SX6<G6N(HZg+nXrX(cdDI$KmcYGiJ!&*Ai?(xzS$@3Sc>U
zyYNsuh92mIVH+~%-MhI#zxkb7OuTEeztay?ndKQ@oEJZ`jEX+jzzpCpl7~*5-y%lS
z@=1GK-R~uDuzuDQY|Q`BUKn8|+jqp2hB_r!y5HhXj4n7v@108iZ>Oj<TR23qhoL?9
zD)+}1lyh4AY@ZA2g-TC`hrzX~Dt)dzSG4CvSZ`)F#qX+|=lL`sT%>Xvi<3kqbuIBX
z+sl8KSiRR}<kcIjYEK^lP<hP3Tx4+bb(w5yZb(0LUu_3Z+UR$FHoY6pUoU-zc1(56
zV>IkCV0g9<F|JP%RzYvvkHV8Cgxl;M$D+gT4}<1Y^SVk=3@+LJcbqFKVH*84{C7g9
zYZvnAG<ZRhZpKuN_&xXr=9B#8x*(^!bR#^-m}Ty8SdjskPc@3Dv{$&wH<SwLlj6@6
zD$e|Mjq0Tg9A=pF)vv7|W%!??PK{?tm9G}^6Q1AMy56#>u{&ey?jk6oGHr9J#87_c
zt@v+0$qHiFdeWx!l*{6i6u)>5omTfes5=47uB^1A2G-e;+y+VAEZDCj_yog4pU-@<
z<*6Kw1FZ73tqz1f#$NwSq%AlDw6GM`Gg*FB10x>|=KI{|ce=J`Q^gBx9``6y9c#XX
zQ6w~TFAmy!cjXEg#`xcZG+)op*(zS?izxa2+*vQHFUi#GN_^N@pTt8n+sqAT7>Ax|
z+Qr{8Vo>+Y55Y`&TsFOUIp{*HOW_E6IojH+WOuflu%mVwt2g64NhTZ#Hcim{!Vop2
zC@y|V_c`=WGHG1c$eWDo(`M+|Ncn0`pUR{8H=vdDX<rXZnmg<?1^Hpoq^1KPuI7vI
zdXYMW$D5073Y=<$u$N)Gr&AZV>ICNTqK5{|XG>uC!K&Ty@$9JSGO<}&<}7x&PQ87N
z;)O?B*WBmB>2nR{7^a)=?@!h$%=<Vs=29g#;VQ`i<BAQg=L2qcwjz54Wb~q5IMJQ0
z6=Rk|5I`;PI_tw!BGRHQ>VIyZ1s!c8*-7-Nu=}ha-qQ5y?b&C-7-N$j!Jxx-^>C!`
z<MY*8G2~Gp+Y>mMOcNKE>&y~82=d|9o(>+00*YNnyDNcHib<EFr`X2g3@(ZA<;xe-
zJpo>rbd6AqP{UA9;@&J{ZTXfc9}lQ2>IU*yFf0&{@={f>3;%ifc;$SIcz)&l^9_1E
zZG=g$u#Ve=F~2EQDv+Lv_|I}<f&HLX$!VVP&zw$4(sLTvg#RV>u{pa936Hd}u)u9>
z1Z)%A1~GaVeM1AV+76qXT}tI;(1el)!DpBH&EuhLOS~mn``;iN%j{fZi<UOm=6CJv
znSzAZdvMg|TW#&(<{o)--a(Es`<aflE-);_=eKKildqRBN!P5`j6M}}#~g>pPTo2H
z|0XGG619`>eEIM@s)ji}1dC=LDrL+DAhkiny(nTmcXR#oCUo}KuZ*a89|!k5oE$NL
zWZrV)je}ZY?i{y(m4@%dix<(2+303lr*^0EZt-&cn}Z448=yv#o|qI^cZJ$p@>QZ)
z9-xY)p>5Tg2HuCqo6v^`i6Gm|;qV7p7-2MnSuStwI!@__VORLd)c>)_6aN`_qVDGT
zX&?rlerJS(#P)&xsg{0X95S!b_j|6#=p`?1VK_VD_spn_`~*`w4?>25W9qkz$#y;i
zJw(t3llu+@)4Qmmf)esn_Pw6xJvhEeoi*5FW9As^^J{u~so2`XkBrOKD>R;61jqBH
zn(3b!Y!_8_d;tg(;D%%c0ih!&ouoXBi`RG;<s-pVS)^T=&Oa9n1pve><PjYa{27-#
z0>oEEaGa@Hub{5dc3AFVGTYf3d2&^AtyOExk1#eP@JWeiX^RLIQ)@HXK+x#e_SQyC
zBrD3rrVpeZw`7t6vECtU;;{gd1kKOSTksE>&nlj|p9;dsR|i*qIf5lVGIk#_u6c7x
zYy5Az#x<lgqKjQYe4bKmPA{SStx#`36n?i#CYwISmI!?HYt5|+cA$}|()TW2Wn#%}
zbGER-M7=Qykfp>J-86FmIaGqLkB_N##f7W_o)`L4)g3Zo;q6uR0AQL?rx8MVXBD#A
zU`P)=4m?Cd*GR>!%G&IGY|)JO;OX1dL$A}n0;T=#Dqwg0H&);-y`@osEy>1T9^}v!
zm7P>y(*Xk2(@{14G>Ae(1eK|yT|oUoAAa&jk#C+XTB5Q;D_LiB?|jSktwKqdAJpGg
zTATDxUaxYA8EZ9Z{EO_Pa587k>FFR?lm#&BhSSqv?!a|l&`T9V)w9?(m`%~jV7Ui0
zxWI+YF>a4buW}jcp^M&U-$h<Kd4c#>r>L#7>Miq+*Du=qF`n5Htm#i#dvQL1mOg`C
zB>Is6f7CrZ6*NlCr3{79MS~i`VEa^^FN1#%GaU2})PsNJlCn1g#~2u*V|_%#U3{^*
zL(3r7h-tDGFys?ec^aQbAP_ueUAc~`f<Mrb*g*`Z)FIs>pP5AKF$GkvPQ!yrJ9~TI
zCq1J>l~q;NA=6SCt(C_nzIk6i+&_NomVH`%dN~*ZuHx&}59GKte5J#OUI<%f^f_Gk
zq-GCkeIotje@rR$Kbj*zVjg=GjnVQ6GT=kA+t_<fp$3(_*@3p(rdm%y2fZQAOt>Q1
zyM1PM7RnYlblNP?*VjBN;*te)ZivP5dJaOo%bj};_C{;I+7va^Vy}bk%jW#p4Vvw;
zBLj!aU5=Wzet!E7R;Yc^Ul>p$cD;=9dp+pPj(Rs;48x}&pLWybYTvl2oa=J~g(EPn
ztnd%3&pHV@N@q`d(<S4x7HEfzh9wQ3HfelXa`{dFLsPB14t_MU4w3Io0V7549Zk$!
zW809VvThXe$1Zi6Nx)0P_xfS$7F9*^NtXiPLrDwXT}fby0@qvUfaITs6U5^uHCn82
z-g)<{UE=t8sB_$w9dCo8HA?J4-6Q!;L+N~O2xRm*TKFV+4=HdW?jFqt{Aa2E9Evsu
zwn=v^efAf1SeX*a6%rcifLLD`A*2u1J$rsr5BvS^7F3eR)Q<Yc&o5uToF4o7`r5Yp
zaz;YN9km@Wd}6FU={=KZGN$0xRFOv=RR%rY&Vgq)>T-Yb-~uy$x|(i+P85#taj3-W
zs512UWbsY#*hun_j)zwMpb<`#wzw1Kf|zBW_1zaYEpYV!TkYIUqmAkR5nb>zfgoI4
z9rdQSubt2bo0p?l9X;QmLYm$6TNFF>5yGw0heaP|YmdorGm``DW{I(#Gkp?R6&RB|
zLCw4bcF=9kg%2PokgXV|c)b(D1y%Qyh=&b{+SXocCSa5URW$(fw^rXf>uBZci_g(@
z3XG!Pm&Y@S)KJoEfydfSk=y$ZD|*%zz>tN*Wwad5Ssm~psUW3Wi^)<HYiEOWGy4(a
zl8h{au<2y==nn#VqCqFJD0~@=0sLsn0Mn&VGg*D-%VxRyCv!+iz%ij2zZB~hTad~y
z(jG34d!atIe(q_n%faXvezQdN;-#KDY#MZn?Zw1ofgIjviL@KKPPasVYtDXZXK##&
zE?v>lKxu5oZ~@Wa9tXdDo2#p-$(NLrRIrBk>VC}e<-gepypWmKAZ~PDA1#1lQjTQV
zaIYFq5HDwwjt%p)sjjXDy$v%}bmWA^b}Nq?{V0PSo+HrlX8AB$kW}`V4CW&Nr;_)9
zb=ge^?W0z7|I0wCDmh-KuH_+)me656VF|eCXf%8VuvSEdBeauMU|;=o=J@8GRc7s$
zR{NF;r*d_MUvE<s?0ocI4PwF;;srEN;4eo06{Ho++LlHA^0A5bbW1skwgy<u;`<M$
zCSc=^cvOAm-)H5Q2cyA=q!LZrj@}WR^2G-Qc47a)#s49hBi#b3rP7pl<|<f}Zs(H?
zaBK!yG_HTgGc<J9jQqeZ3>1l7ay9!w#}~&dMR2CSK)PB`qW5G=>y?F4SU$D+Ytd^>
zOoC#`F>qr_cq|F>v~2d83s|>HF_Ou$ni8iB`k~>HSaf>(5nkzQ;blHSFQVTpz8B8m
zcVN3uPvYzezsbb8mwL#61Q_Fo{f7KQ)&z_G0zgP7IE~(V?n^zuLDprj1aLr-j^DNh
zbKjo~|5PXO@I~m>qONO2iAN}q_3x73j=Kg^n=?&%u&%S7VF%0~N139B($dn**;rw&
zNT&2mii?e)Qp@!MmK5Np6@=G3bO8}AVw_g3Bdth-G84DlXzP$Z6Rz@}JKexIR3mF+
zLK?I@@cMq_{o7U3Se<bn=+L|J-cjn+3_<V#yir5zI%tIKybB9JAy7{x4aR5y{4mZ$
zT_Gg5*ksd+EJH>{D4Di8OjJNOUs#W=en%=o^J@#T%&*yngw#~<f9!(J($6Qbg@5jH
zVoO`qLWr7r9RRai<yi#>qcmMhDP?5MqcjBoX9b<NUy}^cc$DP<e@2siTAcH@c7S}W
zID`2;kOBfLPI>|;Dz^&WhQU&lSe8jD6m5LS#y!*Z?jZ>GGPR~yVZ)lgS)B@}iNNsT
zzI?exJeBuKizmIN`C{niY&rGV0<Q?5w#M)>R}X5Qp+&}gxF3p;PutvBo|pz87+n>R
zJcw$mIF~;2@fwg$gTT!jw5fMMq35rFPMQziyzmb-F?t8CKC5=or(XT@A$d2M$#R*H
zX$OvE5xg7mc{Fo6(uMTxW^S<sxn$aD8npMBH(R*Rf*AoEm?0pRnxKYsl$0N4+s)3*
z<VXGTa)~yAMYvjEC+C|YkEU+7REmDC(EBjdIurEwTs^g1WJiSv)<gdPSdTRI(1Ctf
z<vyz2X}AK+w`i3Ydpelp_@wCBFa<Dy#^e2_)i*XytasN<6MOO)Z8ZFl<!JFIE$MF|
z`0;L`3T}p;Y=99~*JbWgs)X-zZ|io-wWoG-as*YY&&i1w>g?;ml%X!T_xh-*!@$#=
z=hORXRt_-9o0_|KR{Zvu?p*)Ct|;mVhqsMH6!j_#^@FFWXwhkq<Z}CYBxik**g6eH
zEK`MBTHADUO9~qA-8&$0fSQJ^s;qPlc#u-<RDf2`uJZ`<;X+$N$K>RB!7)ZA+M1>4
ztTfplhAz$B-Ka9-FY-O8?}k7bLW10z{}3e{2JDslb@Tdv5J~e_J+N&C`{;^tn7W4<
zQ|FT7)EQPq8$*|{m6es!z{Sz#yN~2ms|`<l7@4xEbcIe{XsnZ&7#ct=I0I7wfwT-%
z4}d@v1xzlcDUCmLd0d|iP626mGDQzyP%(qbPxp!d)1WdnD;w~~HfYjEiz2`LSHP*j
z=@}z9^<W}M5qIg81w8ZEcEK|m{ob<-sn($8(D&+jLnyZjRh03YV<CR5CjexDLz=xQ
zSD6)CTI*X|8;%Z-I!$IKJG;}ZzC1RUljkjgzS653K+djl_)<sawV}NjPTB-qDQMc5
z27||AZ;iJV$8*1f03DvT>5lsk-GH5PzYI<PC*2$`{TijbRjH?tn>84E_MIls`zH<o
zs4v?Wanj&Y82ky+{R{Y|qza&`pA<W3i59B)J_#6cxAbK8KSPE)ET#J_|1`W`;DSME
zj{{Mo#nD2Zd)uoI>Qz+l2Y*gwQlK9Cl4Nv%`hAfTU>M&cp140UW>f@J@FUXo@1hsY
zRtP?iY?!r!B2?>l?_6NauYX?gi1y<#;(#IIyKV<S^>?<%MhX0|2z6w*zd+XOZywPP
zZ+OQ14?L#n3`FM7KuVZq9+hGB_?g#Lw@Gc906{*|m!^r+B*-h$Pl)-$;d6jC7Qg&y
zy}?vFOLt|5PIYoR#@0E^Aoy-U5PvT7uuu!--<!U+*wfD4Q2ul34DC?0R6xJEm;uc{
z3<)0vsvS+Zb&#G9`1@)xxY~+mAktBXJ0O(1u&x{3Lj=+$!Dp!o(P2(M@&#CtO7OWI
z)>`n-KuL#fy}n~DmdHPAXTFKEBRc)bJ23f*dRp*72?B8;Cl?kR3j>3y*1m4f2}&mb
zb{oB*(3WaPU8>%I(%*|(0*m@ea60$Tr5<8ZPt!0f_d8nu?MfJ#>zE&n3gO1oL7p6`
zRn$u-h8|;uJ0g!*=trjk_U!{V<}7`a__qw5pdMfI`>?bso#lUM`|WauL_-z55&iq#
zkK(kj1)Q-(lPS@LfzPAu3}8hEK6P_Ye{bdrxQXbu{nVvXKYycY7w4ecUw@WQzqfSR
zA93<XX^E~aj9sgKNf*Dq*aie>8&j=u<DDr~+@yZdU<5?v^0jH|G(3|p5QwUC&cwf2
z-v-VIkqC`1pdVxK_tgtjdVgo=q4gUD-l%Y)KfK{AqaV(gygf4cx|mv(Ezb$6ADTbH
zc$wN-o0lg=mDoON!BH|H_HPWH1P%-$sjl|Z_f20Ub)Gale&Q%@cDPAO7W6in=>`!(
zDhYgl9^+1LZp4*1?7xU8wn*hYShT}PjQexW)JYndfRw`ze17t`1b?HFO@s&b=AUG$
zYiI^_z!1;_ykn3=ciZb$zotjX9e!JDIsYAwkWK=tbWBj8Cb`1-r~(5Skp6S4{~jRt
z_v&e!Sz@iIMWf;;)?!~O4^-!`qFeXM(N)$l=MR~3y}kjZRK(94{2LOnQ#&7d9f#@U
zx$q{-nJ$tW5MZPX9cG}StwGD-ML&N4mDbHvq=h&6Vt~CODLMbK6<b1r4U~h=F8){7
zsW)j@{ae~&_tx}n4*1uDbB?H_44;LRKDKa@16j)?64?SMtb_g#EsqfZ-1~T~#$8>y
zSh6NjkBm$3{c219MY>pOIxaDm`$5TzHI*!+<yz!)M%9}wZVCFY+|YJ}hLM3#np!;x
zFaWU+e3a)t1rRyuEx6So#o-r!-^vEK?crnjpt<vJ_EP@?UKc5z54$i&JsArm$Js48
z?4by_-~ZFzl?OC=EOCgzawwvxP%mP&U_orGjVKn4NUcafluN)Pf<PsT2S!9h`K)Ix
z%6lFa5sj59hFgWmAp}cRd<ya;s8Fs4LJi9CFcqQToBgg3AW!*U{`wNW-JSi-?9A-!
z?4*kyCmzKYj>YFy3Rqmp@NJ-WHTNKyic@`S<}89UB<<5&xns&~t;((;RQM|x35-N>
zic_G4*#eZ-w)vtK`WmU->lNGdh_gSqtcf;`f*aP<XEYwr@d{GTGb(lxA)J@CAX~yZ
zwm4<>wVS~xMbo=L#zEL@{1#eUBwABpl?N-}^XZD95><K4fGPU6M6{uq^NSebl%mi#
z?cUiMf<0kAi_xp8a9vWEe*8Ncnty}tc$_rBo}3y9*w8U6-3};-EQz5Lmjw``a1|XD
ziulf+Eu~8?b_POmt3K7AAi#D)PH6(RH*o)1(5(ZMGlh$g^eH1joZ9TMKz!-eX5VEc
z9eB^8IatD>CrN_NriXi)d?&F|QG{qyp&ZxZ8A#<=dUoT+8L((TWft>nBt9xUxwnMx
zHimFIgeOWiIub4$&zq}|ZD?70^|}$?QW%hg%J@77ZF4$X;!dSVJWU7jN&Y>Ol1vhU
zu}pWjb&<avLpN&gj+j?QtN`pG)BS+Qr2v_SRlDM)0>FDBY3CtIjFDNI5ORqkb18BR
zw|bDi56Nw&DVdXP^L0^ZUT2%JPj^|z8EWx-jdjIu=xM#CsCjG@CM#@P(^LmoI3g_M
z@))E&G9dDnHQX(n8l(Z%t95a>Bv2I#UQONGMZ&Nr6MVvRLk!bm9{6vx#({<;Zz99b
zvu^(Z4^#{b?La5`jK_W1q4;^max;S4Fy3*HKqu9p11k!nOh@by1A#>(<jVtM(xq6o
z92bpU58x)Fw@EvA^x$+g+deZ!-Lc~U<fyZqNI@cbet?dktGYHT=&{g4)ISJ)D_eDd
zbNP#cvnBq~y6A15t;iy$6ZfCa6s+J~;{(zA;0PI-ILCv#baA|ZxX1(=Xe3f+Tq`2?
zpX8-BWS@2H>~XHF(n-sBdlO|PFty`!w;%8z_2AXYxyPhs&{DEE!53lq6sf1vd?BR>
z`so;)Zq{bdvAgrO?K4kHu5V+ZUJc^2ZYLc2BurM}QtNhQDJt<8`tk=)gb_CjNX<Gm
zg<gB^pc9k-YMX|)qe*?5NdRo*Q#m(B6TK|b)~uC%ma*0SDCBX{xB5W5e8yYu!{-9f
zf!!30t>BNs38PnYO#tLXU$FU`sDQSDGK{AV<tp<#=b>6=Ur6#1Bl#Ktt)_vHGQX@=
zI8Bh-(ZmrC(Yj>fpGAO#ydw9_9U_NRv>oe`i$F(A&GG77Y?L)$lhTxZ9b0T7+VL6x
zu|<_)(Q)q5!<^2r+>mzT%FGv!(|vKgxFf+RmbmOp7tAzI*`X7<dpZ!BRv(Eos0o&I
zvPEMk-4l`Ry{C_^jn>gl^Us)k88=9t+HvlyBMWs?{L}nQOTf&PGwOm61Mfk2lT(p2
zb0+!#^Od4wdNYZiDS7K2eFvZik0$N6y@N+2=SU&smVubB!%D?C`_X;(R{rgy97QkJ
zmb(?i;rC5fwJ7_#7=_CstE4pH_=D&IcmK-blu6=>>_bIniw|?k7b-5mIm;Y^tvs%1
znGAmP30N2-74x<>L#M$Dh9n}feheMPR-KQYNy-!p+2B<ncXIHlkg@`zcoY`eZ!S^k
z&ucF<k6qt=<hKzx`OC5S`LdNhuB&b4j$IS`=Z@l_aw8)nS!HG2yi<gC!X6179@%(u
z1EqpY;n=|%bNuRC5-xI#)aj4R3cMCr-A**WRyGbd#e7}TubCDqUM}RIWm33oD+{A5
zWCE_(d6*1TiFKkR_z~=I%9qxuE)iB#o-}J=S-1SV^tD%CpL(YsgX%~%m_3q|2U^C-
z11)QJ1VTS96*Jp$gQ@A>NKakGomHap)6`U_!|CS(UHu|WA9)?UiSI5}>)G)Yxx3uE
zcXkwSs%~>z{mP=D;|~xAJgpp&>&8Hpkl>J1yyzRspn!V{o;)Y|KBmf6&=!vS5*7F5
zTtRm*)BDoZGHM(l^RqZF2~=qGwo3JSV<-_P&j{?;BW6Gh-i^$D1n}<Oy-R(<(K!f*
zMH6k8oAeoF3O0FP;-{8(T?y%3#xPIrDX2ZfU^X{5i{o#LaoK}gs}K)b_wxfX<%GpX
zN6jx@o{FaUN<f3HVeCu1b(5$#5v>QQIk^ijOHf)y`S$a8nZPN~(Xoi2B_#W~`2f7u
z=Hy=~5hwdGFjy~~gfFL)5Tw156V`CvytR12ySPd6Ie1gHSPC&N;g&6I`GjFK`<)@o
zE0`O$;d9kV@_$7-va-s?)vEekaQ1)sBXF{@ky`RcfxKGh`91})?AOV_sgTb%O+fuW
zb*(|a4tqndnDGBlf2}CFId60>wO1lncKfKq_fb|!Pw>1HnKvFVuAgdv$-aku9Me6x
z+&K7Iv=rT733<~IG=;dvzka&GDUVBx1f>k{rvacBrz(h3JOTv}QqvjEpLqFxy8PGl
zpylag=0S{Z>15fTjeow~yDOo^#ZTz6y7)pCcfZG!0+Lzhw2mD=p3s5p9ce#@fm39C
zGH#FZ8ywqV%%CwtWAbNse+EMxG&JC$DjR;FXHVbCa|Z_pTLF+bJhN}2`l*LAv9rZ%
z&gk@6VB|2M(Oj^2>9~dN#5C*8Tf18F8m&3)lp!}b0|vOs&Z_7JZPrw2LN||K!~D#_
z0$_&F5V2nDk2qX6r8EYx4QzIS)z|8X;If#%bV6w@4&EZ_lC-UDD}6SOmf>XR;81C)
zk=hRUju=YKd>F8cIQe~=EN#hqms_d%nie&-12BxN5k_er8V39!Q^!uLES_cx({*j{
z;Gi?yClGjcZQ!Vis<JDHU!tP+6qM+g{&CP5J(6Y-GHBQSdK}mXK6*-+j$Zt2>)MC2
zgn+_moDoJ@U;T?_gfVidUQT2aWmG8!(-H#@5GNF;T8}{ku*@`N9>L|qgDKfRi7HrD
zo%b3^kJsmcy-w3@rCCnsWdICv`(4*sZd_!E#{{6isA!nG|9Bt5%T!KTsdaO-T;ca8
zdc19*+ifGA!#O|4vPX~tz|91m@w_?dl&a3?MS$TLIG){WY90I-nRJk17~an;i3ozh
z@UV~tbe_~e!}GL~Q&OlEBsGSe(Xop`xZe&yN&f~3ZIm>+t6KP8eB^QQ`i9xrF;bo*
zt}>SzI)|s<n3z6^ngcRiq0L7<)y`oSQ67$v;Zz5}pE@Q&B;<euH{N>ZP8?(nAOq{C
zi*yBdVti37Wtua0XS&oeovaGetK|AXY{&8FdE02Bjn9a0#z2K4^Yina?tG=K1i817
zr1?fYuzWFy3!9s#5uqG@3?LZf;!#aw<OtKJPcG?idp)e5x+Oe(_3u9u8WJ`#IlVVB
z+S?&$0&d+oYQTO>jKa9C>mmcmTw7x=q|QyU9J-Zws~m(61O$IKrk%3*FsXGH>7F}x
z4wbiFw1Wse5l!r2BKACedRg`B=%+7P1=c;2@Nm%5QFG?cPyUYsbsZ7(<v~z~#_~HV
z(Lp81AT5bs^acVhd#<6g5zyoZw(7m$z$WTyr!^Z?I0LwS1wqOLF*3Wk;j&suHZbrJ
z>f^S;ngPEd5g)2g5htAut3Yy5yo{9S{+y8NGxx6yiP(sa21ie2<#;{v_rmvQ(4Pox
z92m1pMhzgkXgCe*Es$Ll(vpN&9L|LF_wVNtH>%*@d?P?T+j;g-ikN<b^N%uYsc49<
zfx#L}zM&;XzU3@}<&VV#+V>JSd`zl0Sm4O{(Y|&ki4ea)3=#^kAA)N&H1ucL+bwjJ
zLk3q*32``#Q;X^=U4N!)Na;tF{_t@(&Jc}jYB;zHUgzpCP<>dj()z3MyL(Sd0C*(p
z;HkXR>}ud*^p9VXC4o?nMF0q0NQjz8@8-<e;8Im;6uW@kWiQ0wS0M6bH_4-1^nN{D
z+B@5&A8j&VW5gx?5ZD_IZ~X>UgEbuGEEL+t_=#x<mjMAzO!cw=rzD;MsfDMPL`bJ=
z{ZcLmA9(tcUhycDWf%KbPc%~a1Iq*yvtkK|8gndf3~B+&R3^ZK3i-kxv;B+IGzXCy
zuEq4UV!qxEBm6X#b<=uO&N|u)848i<iRWAosc-#4+b&80a`8f7eSNkI^zpz!q@Q$0
z?6xZQNfqJu0ZJm2p7zg>C*=cA0xe7%rmNp8>^Ul|2Q@MD#gj}-^pb*}d7*oyNSNSP
z1(1_m7v!oAiU@8QW2Aqid$qrf=Lt|I+{p~{Bq$Dgn%;+#S$!<EJxF(JAsO!wSNykF
z(T#7oSdOCP<Z+Ut)mLmPmeaH_@58>q($^%33LW4SD*p{MgD>tQ6_y?`Mr$=%w{)S5
zcO}3}`N|HEt*qc}Lsa()Y8j0yuLg8>*wQW8rFI4|mU0LjIcX87vk<2sC}vL~`QC^3
zThjhZ+2Cm=XzilH;Y8u{4;$+YWX3e*ys4JcBKHC9=7CgJ&dtQbIyfvJ(54-&B+_;I
zfY)(^_>Hi9=b2ft`eE81W$GJ#6|`xu+MA%<A@vuHzTdn=f%wMyq3Z2jf4Bz@{`Kuy
zwVi4T;fFy7g=XP2Fzj6tmGtochajLzMOU3-PmHJH*dNk{y&2ksw&clFV%-$3YKZ-~
zh(J<5E+Qm#9~TkmwLvYSzxQVE;0@8xh+sd+6Rdi9QCIspm827;Hz&2Bo-r7$T+Pr=
ztnL!1-FvC3B3w`0)0(g{cw3(cpPH3UC~a)B<|kz>-RXnTuJu6J+{{6lKS{)prZ+w1
zgV99WfUt9`24gB}yrq~TZ11bVfSegIMBp@IFlx2cvPRl@EAOxO+I*#^#a2l%j+xP5
z?0Co6E&T4PwZu;&eTcRP_iRRu^y~@MWR>?A+T9?Pds<S|d&B)@hh?;d|FBSNFiuu3
nNM+ueCxfwfAD7FZmkXxJkuKmwv4^>9z@PoMPIk$*{C)oe%Po~6

literal 0
HcmV?d00001

diff --git a/docs/static/e2e_flow_part2.png b/docs/static/e2e_flow_part2.png
new file mode 100644
index 0000000000000000000000000000000000000000..68be0eb1aa3358efeb2d84b9c1e5bea817c9fbd4
GIT binary patch
literal 265822
zcmeFZbySpV+dhm4g0dwxAW91=0uoBekcx<agc3ueA~7@!onnDB8vy|cNr@S91{g|I
zK#3t|kS^(xZuqX7{p{y`-dJn1|NYj_wUB|i<GRo5jN>@Yb9kevu5|Vc^BEEnlC#S9
z?mQ$RIfEu4A^(l?6!?v*#`0AXlHXJj3JRLa3JRQ>&JGp`TXPbUdv9Xk6h_fXEVb@W
zZ&T6+Jqs<2<K*Ig7D}u8gXNa??cX^=&(l8-X5rN>w5O|k(7~tRq$3|pg|W`Ox@gS$
z@hV0y#Bf`Xti97=ucmov@nCxxdFY)yRqf77vL;xgoe*M88p-oLuKv_+$rYaL!h15$
zC_nxRJgHhEFF0{WDe$D;>)qP8o*t64c_FE*m;=cJ(~wxrOH3rs?kKz$d`q>$c|b=}
zrNbFBaZ>*6?I9oC8tpedxAM7PP~SF6{~FIXko$Fp&&R3#ifk;^GB?S$S)ZC~^dw=j
z-%8Gq#cKvqr<1Gy{y~qlh~ulQr>DqETA}AZPW62fn^Ey~+kwO4{k!gSbo^WuQ7Yt%
zt-DQ4+niakCwXWIJ8=Krtn*vJ<Fk2QvDYr?UJz;NPk(>mu}VJmvZ1oqQ--g7B&p?k
zH?0c3wp>%Z_q>T6L-(yh*z(!w<x8IStPVjDj4LNUbBe#bsqhEO1=*)sZ!c0m?EAF$
zfpN^oMEa{2ZBNk804D|UMstxTfj!l+7ss7nZ)N-RrqZbFw*|i^3s>Rj!vDVfdhL4S
z=lrcpK{>P(3_<kV7m3eqK1`-(5`P+P@UA|L6&uC-B&JAD{u;gV^L?EiJ<r$IuDX4z
z5!8@nm2#6-Z3$uh9Jf+3rl4K%nf>(Ei-RwEg|bmEqlNRi|Inc32v@v%hElseJX-OO
zmp2(B=9E|W&2*4XQV9FCNSQ^Urn9;$7PO7cRAaBF&i(w-n$y{+nz7xn%qO?pWb0>D
z+Qi|*K}lgmOQI)#!Up#4L~%fQdRY$BfmRsV3E9Yi`<$fI3N61vGwSG0+m6d$++yRR
zi;QSl<zQtDApPdgT+b)DOqp%XCg0Hh?%`z$>DM=DUIrL#nO^^R>B2H6o%Hk2Ee`hO
z$BduOJ3rP5KlJu{xBuCZlV0}g)z|Q+9f1OG0=|+wp}Zbs6~ZziTh7EzZ78Rg<Rrd$
zowbq4`?J|?p3xJdd>=v_k+|}E;!Vwz?d0n(Uav$SxcWKrf1C;49UszU;~T#}Kyq_L
z(2<RLkqYki>YDpE2XkG$^wPs~b#S=VxA3t$w|LF2`Y|MSh=|RL8YyYNtvG<m@tJlh
zt+cXTxKJ&-nKw`Mm_xkp_uX?+K}mJ$kERNB^G_ERn(2uU!`U8;MX_yKIX0dxI43o&
zLEU|!+Ooz--~7si`ntM|I){$gc3SUtQ(}~q0!--&zNN|1X@o`L>zFcG__!Wk9gilt
zIxLsl*q`^VZu87%+r!TS+h<9Z%ub#>Dd#(SJK{v)Fq`b})c&KkKYkI?PJQbALi#FS
zzJ9dnHAxDqi^t~7NwY`PwvVLopU!%mkfWu%eTyN8;`<}!HCd`f<b`+SlL7UqWN!m>
z9?5(pGpuvdJh}1gWa{bC=kz0%j_gKc@H)G4Z(JR+ox<b=4dwGlTISF4YjpHqe=kyc
zPbWV1f{bhQ-nBnMGcLvlkv-sCjl6vCLh-4bJJ^euZ+<_8ok=AFUAQEocJI-w@T{=c
zYr1Mvh}}lDFJEPuNPTQ24P$J*W105K>N<`TC7;(ZXvOVCDidL%SlK>hC3i|#Ec8wM
z6YBFU<4+#worw+jUP!LTs~fIkc2<w73LjS_n9t-LNbhtC|Cw!sn!1kO@q{eB=`*25
z{$=JWI=NS-4NK#`Tb86@kM0%nc>M11^83sCpRe6M{o#FKv}2GX^N{M`%bq)2QOc!P
za9_Ny$G=m1uWF<|aDPBmT7CYK?4^z9dzXCwkolg-pg0!2qI@|cEMqXkEJHQJzSFRn
zx%cJ#eQK`k$jd*uoFyy5ect-K*?YMckfvOe;qfr->g^`hCY2^?6{-o+%*2&|Tt!Tl
zm)3YrZ+Ct78S9hlqU+S_F$oC?@d<$jp$U3+Q3kL2WHBYyn}nepo4o!UBteV7ILqJd
zp2GpJ%{d6Zo37unXT@9U(|5)|VByjN`vU5e!j}gxvM+Y)eSDDF@zF_noIL4vSq5^t
zYx>oi^Ukdua<76bid`zvdEa}CQuQ-E^;U5fwdWLUp6kBVO(r^{U?`-421dD0w=baY
z_QI2eg+3k(#|`1vk}sNRg=2-?gw;iGu0b#&OghOn=|++aj1A_C>%$4+-r!1H^IRgP
z-L7BHVvKHVF-JdTe`I1-!(k@+TI8;%Men=U*W((hI#}|ivUxiB3H^EQI!o2Es&blg
zO8ywX=mX=E1E27m4Ub~$&b{b5Rc+?l;1$LgD!}IbXkI{}yB#k~bVQH3eR2EZ$8DDW
zh&!j_ZhG|H>W2Gfa^tq+t_@0I-uKU6k-hRH+Vx7~{p2DSeO6t;yyvdL1WRix<|nzr
zgBE>{cj{XDuGQs#vn}W~M&?TPOMmf6@=WwhdG$u|WxaHWSBPOOgDTcMcH&gCNUTGC
zKI)JBSOYPA84R&xQlH77$8fmlL+@5!OKA?a;)!ahdH>`Odu+8;U|&U_d9O~daiP+}
z;C%f?;(}BoU4v(6bZ8#C`{1p?fN{+c%_Ya-sG0MNdOv^s+<H<~zx8%GuQBDqVefYW
zZx14{YvFVs{cRowHLLhv*(FIOpDLQRo9^^|O?^YfBd*~y^JIz3xp&O@OUx+qD6SjR
zx*nZanb?A=Lp2V5mTC2k-gU)NOC?ml_a(j<8C@!BPbZ8gWhYwJOr2<xt75Hku9~e%
zRxeJzlu&Bcso)^uP_rq%B*+n~k<hj&Yh066<1=hMOyM`_ce^&pPva)`y)E7zPvy_!
zAAfl9P{K%K(Pwd)<QnJARMAv!O)24vg*SegMCxl=X!>fJ7TWw87#Y9#GO{p|aIwep
zuJnn5*dC@?c9`6n_B$^<BR%sUFB~f!^*vO{nCX~{#K+V#%rh<(^Pai0oJPDm7={f`
zzOb+L+x083EWSyn`IkRDi!8^^J9UlEj+r#>HWq}|COwKyy=SGG!IO1`c%?@9%sqqX
zZZXfjpWD%GJS>+&q7$|5@xI}e(%Q);Q`eWvlp=^>F0J=z&*hY4Cns763%K`1&8*Gr
z%}{hvB9sxX2#)Osd)9vbFd<(puasx}KR7)E*XYso8$nfyHg_~`REZFuO1G}zjS_pK
zClYm%3H+16{PjX53dLm>wcp<~^~Q)qCcdqdh<G0t>#mn3@IC5%!eeQ(jZpQR>e4%X
zVqM6|op|43;a+t~t`t58d`|$!&cYd%dWqm&a#?a6atF)Hc-T!t8|+iJUDis;=1FPZ
z-}v?(3(CTU%j}Y8s_Iu4+ooEEu_XGDHK}$Vwm*-(8Vq^PM7WkEh}Yk<iPGvwNUM##
zB!J)*=QGjX`;|E2Fsmx6^7L{~oR`4hj=%wGt3TYFKF-c)qe5G6M>Sqc-?O)I;`v0a
zkHlzY@X{&Wr}@)*Gg#+lzA?V<xi)#e@Sgk*1FiDO(Y_!|*qq*+O3yyVZ)XQNAvj?u
zp($}y+(qXlT-2fTN4fQQV^e-pp3Z@ex5Nc|1MEzz#ptA};T~4hR;<qeyS~3Uw&Y+-
zHAK|2(=o0|DzARDJI?k-3cvU1;DcLs9lkgz#ZB4GmGG7LKG(GXg%Zg()Q=$Y&w9IM
zFV>XvJkmhEQ22taZmBlk{UlpoW4YV4VJb!Imb$>X`{+wVteidU>rL&xAW=MG-loZV
z)>_?uQJU4O995q;(XJ6Lw_q)1hk~VfKb?3m+cB1YvhhsBI!7G)l1!B6*yH{+Y(EcA
zN|iI;q;}&>VV9*p_0IOs3;1|5%j!04@~X7^7So21+SDLk0$YjY*deU<D6rYHg)t2X
ziJGpJ|LBy=S)IN-tjZ%uVRW#4W~pgAFA6SIaM`HRNoL)v=j>=$wgl3lrb@?g?#qIr
zJEgnIlJ$^4t))l7jzs_PhFgUzTLp(>?f$KS7yUHkG%0d_$nE?v-g~!EzW3&PbYC`J
z!_fP=m!NFoO8#!e+IHa3AHx{G;kD0`^%4GC`yE3P6$QJQ^An#^noVbF`_|){P3`tO
z_BTzYst<l;t)UM36Wr(BEr)oj{Z}3nl{y=PHLxiLvVp!eB9RipoD<DkFH%U)YqHzj
zAlX7Pk(53qIsa?mUQ!y2gZkVZ*DSU>BXW-k7n}>rPqdTN&X{?P_O!Z^Y%Gv`Iy2j)
zbs{M11nts^_BZrOv%mE1e+}eZyW=6gCA*>JWdhrhP;|Yr-?Y>rqnV3)*0Enp(lq;g
zyW;%@;29*r=6cE&YHB2W;58))*$HM6a`5T|_>w)r^6%GoPh2HAdGvcy5|Tg!3E97n
zQ3v0lf05t|I_J;tC;xa&LIHmI9ejDDlKyq{8FcE&zh0C72HqpNrKO;(48CibIh&i?
zBdr`<<Z3f+fnS_<yr+*OAvt#$`Z}Tf@X{}E{T~QzJr_N-`!F*HJHf|K9iEsAde}Ka
z*CCPifPt5G<}QypJ?w1lkuVP#uA?Jh;5GDXAui6NLtJcRxb)OCITak7%{j#dg$0GV
zWY2JNa!NZtwSYambN64TgP&x$tXy0iVM0Rg?(Tx_B7zRimO|GhB_)M~ZwTGEApnjL
zKziD{JoXT<M{@spk-x5U#~f+qjBs>8IM{PS*M0oN!PP~EiwnBZzyJNYPIC{$f8EI*
z`LD+U4=4n^BXnI*Sm@u^2B%6xzlCWcJj`wN?;z}e&A>fmuiucoA$@eh|9b1cZuuXl
z>iyTLHzY(v|MS%Uc<X<js)IClR&cNbH+7NyuMPXx$^ZH0zfP1Ef}Z_9Z1Ja|kA4d*
zEqg{<=-<00d*-|U!5?5FSrK<Mw83}aX3#&<*Wf?EexdK+i<If<S-bPpBqZ`A%6D#Q
zdz_dbq<GI}ULp5O;^H%x-@WKa$)1a5p67HCrtQnTsv|Fd=gw(=P2Ad*hZ*S)wY}o_
zK5Sywu8`fPxJY)Jl5=p+7hjz?IG>EPz%R~QwDm6SZqLh1wMehxTih)ItGC7_eXkt2
zUwT1uf|QJsmQ()OabCzXQLWJ#Ej)SLMSsjQj;{Kaj0`?VdHmaelLoms%liac+-@Ih
zUH@7;XZbAqKUo*;^tlst1pCKW`hQ>pk`r}0o5wNMzmJhGqohQ;QI#Ye*UU#}QlfDb
z$KDv|44k68BgXLE!pnc(_!uwb9SJhW+xvfAtX+WgdEVe>Tb_TkozL?Y|B0WG1lZHj
z8ZDf&kh=I!7DsF3O7o9w>=N>9#JWtl|MWju+_RBf?|<Tz@~MWv|0`ehs{f<y1R-<s
zAKCc-h0Om8ng5@KOojW>(}8j)V`||?pPt>`7}Ya8A95q?LS-MJ2y0ZvHOx5CN9d8m
z_ZFS=oG_dm>wEH`yE5(mxCd^>y}9U|D}g5^`)Uum=D?{t+;znU-pzwnRK~Vwy+ySA
zAk-R$V<vEn+vq=!z=vbL@eki%>NyvZHpFPo+}L$=#K%0@ZE3{{xApaibhrFy)5<hi
zCjpgW^W?PqW)0|rLFasd9@IDYKaW7V<tv(O$5xbM^%&OCSG#T|A044+y#9TPw+WM1
z;LnONOWNyWTz_Np;17XS26JW+xAmo1GrJ0V{iWd2roOm!5c1#nIm;8^D#n52K#;+$
z(fqMRF&}wR0p{a_lE}|CW0Q1#I;SACx1W0J#lt;@>$4Mj<1|y{6gcOv)dpWVUah<2
zrz=IMFL%Y5ZT%X3b>CE@(Lkdu&kIKM@-(SGYbx~bAH7TnT}8yM)!gK8j7c&)85Mmf
zIk80iE)%@-bBUOC$#8OciOk?yu+P-+X@;EM8*!F4A&OB;(uN`3d&3prn?%?J8N<p3
zLJ7vkNX9V4ece`INYrA@c7Yk*MnpS7KZ5r>y54m_M|k&@i23;&L=aQPedpRxb5%U@
z&*Y;(IZ?D0|7JwjcXfs1_WGJ!ZckUy8Isby&y4GhNE!0j*%`e#-a_rao<g@xw~bhC
zTItNNE_7vf##86N-XO+i2iF=JLJRIS$gpTOQrxGpUSF%q%{E)NwX1;3{O5bgD1mc|
z)gk^7Y@0T8UrI2FV2$-@-`tZ?iq_bciC)N=q}qTLcv2cmT%9A*WIeIxE=z7p12cIu
zEPpS-P}XlCJ+N2_-Y3cr(2A@fl9aSowg6Bx)YMeq1xX#Rb7|A2OO_jS*Z#`OJ{-+X
z4ky&!6BtBi9%^-SsIN1eLS>twvOhhPVY88uDFBZtV<=-d?zhl1YMS8|hW3v#sLF%>
zL$pjU9a;0ptYgN&(*Mlx|JoxDuqk6|W_R0&$qRjAN|w5$WX#F{Gen^+@JL=JZM#ZD
zl>beF)}x%{aGmnp3G_Mz0^09Ax!og^9QHaCU7a<KI&4`1*5o@fV9lznz{3)A!8Rfk
zH~(p&bzq^Z-@i{S+a?X92WbGaUd5&WJ69{ysRGy0w3Q3AwDFF{3ohF(<UiV8kTGno
zbaBhEw6P>_c3A2)7|Ik;l`)h`hkF{f5u3!5^v8SqE>t)5dtr64Gt<m%#PBAaVSEV&
zr=iqyZryfa`oK=<nfwxj8_0Wbu9}!_-{h_h3Iuy*pY`4?gGBg{wSVMfOfCxjQSRPc
zP6z@rJNd%gj2=1MFq!_pJ&k`E6v6mml%le_Y=q_9Pj*G$6<Yxn=M_(BL!Qm6W6_p2
zbioT#zijOs9)A73jmX8&-!|IYH<VEVo=u8h&(FJ!xFVQjJlor+U$@fljg57mX?fU2
z#82xC5lb+|YL-L~tlQm!6>Ksp#tw#SD8ZyV6UtU?QHxz27)6<rPY#!BYa3l}0LY-J
z4)*B1%8P3uk=A<(sj-FDb6N#)a%&-b+!|n)sISgORJ|)QdH!g*^7l=7czBv0<V$nB
zzZv`$8BpMRV$}~aHlV%usG+zYa=MKe%RjaRc8zOzyApG+H5SD4Uy(C;h@a>^^1I$X
zF?2G@czhQ8m}hCToOM0j(x#`}3+omJ{RrNxPizSN^N6EE>npvm=Ny<tpd)}+8&-~a
zGH&Xu?i0j5TU?e;WhW<t&n@TbNKWEk>lkVncgx*0Y@3le9{d{QZ^teh_qRETwqESQ
zv+HLzTxngEsC9Fb!}7?d`azf8>{ElSOcq*SyShmeqx?#&=8gZoEegdjtESV(0fuW&
z0;GpsF2rX{C$q|(Izd{k0Zgx6;E9wMJD_?sxtSyrvqf<WsY#GyfaM{)kHs3QH8?dK
zF__><FO*mnPrDSrf^%yyB|S_|PR<vlVb=SM+6%%T&K_%hv{sjC)wag6xfPyaxUI1l
zHB&(LT=yJQQDUnj7~oK|9}OCr`ac|toK26CwtgT?_Jp&dNo<t5Z52{$pry@uskxPU
z;?UxOI*C&G>f!-3#{{9%qydx#cWZKD8+=eSV11a^n`F$Yz<&6Gsc%u-{Ykf8Y8xJw
z@)sT#I}cu>y+{mqd(8M~AuHsm1R3rDxEM=O<rBD?np*Th9@(Hy<?SEukGDLAi|qpe
z7|^PuENrmy6BzSox%KSRTaYZ0ZY;i9z*NMzz0^H>to<aT?0zAS^uTP3EnTPKkd=1G
zfsvAVeFQ{;rdpUf<QSX_GC-JMJFAhMAIhz!!%nA>V11iN_mKwFj-7J#@IQ`ujkEkm
z*AQ?|!=YleibCc0PgA0a!(zy<$Fm8o)xChp5$jc(RpnW1-?h;g`F$!tR9D4VCG3r?
zt*uoQUjL?i^3-qBlhyrf#|u%iSq09|dCT0T1{^)j4}Sj>$>cu6O;RB4GkzdY7BC-k
zX`Gt+oC)OCzw7ljGLx=f0b;;e_%-(TbOvEP#4rA*+YP=PFZzydm)ZexL*>?)KZ9<}
zByBGDkU5nrg7LVE0XXF(u&vu@eW+mGvX<Q)E3wacAU_=Y{6AMPaz-hRK$+iQLp(2P
zr5ViePsEq@X%On<rlZovx@K`52r<&UW$WXlw7-t=dI3B%050iZr4vUW?NC!ZUKj?j
zl142BkFpdaAMsvne+8{!R9s9f(`mfH954R#8?CXfNDRYYH~AZan|d>VsCIhXu$a5i
zoR(AA9ON4+$2NL{^+JA<K89l&^W%e5S1XKX*Egi%6v0D`l6Kkz#ErU#QXs+Oqq(a=
z7{&XI&ZK8p-eYbLjFYw(ZFOG{v2|)e<wh+1Gz?shy3azU{fR-&9`#sX=rO~Qobu<k
zxLw$3s%PTl0nFgpY(7~Fwz3$6iPqdYp0Q7mYN^Y6xHk3niv&0WQ%`8;USpB*atThc
z=7yoppmgbr!;iU`L7qsS&CFHnO=BAG*+FnEF(ZGP0_MWEzaLK^OQksd&3`>LWK`1&
z0~`n6y!0W4Ugg3uZ3@yMs~(gN^WacQa;!*9Na!qg8gH`ypyr}~j_P>Dj<Y?T>?Pd0
zd%{t;S`*~{h7c3MD!x(!?lk9PM&A8fCq@apK@L6DCgA*&W%6^sa@(ybNbHU&D+cgh
zqaChc(=W6(`xbc-@#)zKf=WKOeCl1`BFuFO&Eo-#A9QFkE$9l4>%2l>K|45;aO`#9
zAS~lB7}YT!g?9ScvtQN}?Y6g5>A`j;eJVMwgHv|b%IkWF)x>*)XIS@7!#|U!p#>=U
z1XJC`V+JlLm5k?)98pEV1M^4d1erBGtr4nKRqU7!K`HtXtp0_GUN#{eJowR`9@Au;
z!k5X5Kj%TUsKb}QDW7Tv9-j?a!g%~!%V++YJtE8J$tYcnfG3Q*VJ{t1SPVGDXa!2)
zctcpCiyI83p7!gtd^UIlsd`JZ<8GamHh@MALG8J>p2=SatFOPA@amXxd}Jg}1$jrY
zli#e5dp{_|1D=q1**UtdO?M#LQ*YH@{fBqdN`;?-bC)v9UFWLe`;_3Ba`kw5<IhCr
zVvyPcSXH2I;`&Q?;^nGiCY_^`aq7^y|4JBrZ>Y};r*?aanH(3K9eH%X7`c~@BgUwV
zVDZrSA1~l;Dx4gy6wa#uzzGN_j6M3tPT$aOwR;Ab&>Io#Fsl+F7yhOo{<pG_L^sV?
zN3i}t_|#>G5h;tbJ7$(Va^!6?FGWY!pWmVw#ZH}NemmCqPqvG8+92RH4O({&%U9Zm
zk%;U4CwE4XGsDVZ_5<bJ;NOl9kGGu9*01lfyT^<#5XHf?L0KUHXI|ZBxSk?ODH<%V
zKmm6(w0qm%?Rm@ul`2b?Hu~gg&zRVAC{yG_oOFLnhEq=c@FI^}Dg0XVO{?})28hue
zGwEEto$C4sv+hG@6h@K<n8M*1QCmlhL75H>X_?${uflMd_5&d+E33F`24@gk|JmeP
zdtsf<psx3_@j~}8P2Ao}3a!DW;zREfNycWcJb8sv@H|&THd!AJhiW1|@wj;ecTc{D
zAoyI&?#pS>r;a*hgx8fCNwmj&6tAjh=scN&-z7h>bGADICmqzK_=jGmNHvW!DE+w2
z{2+Doc^(cWK4v%j{+QvR$w7)k6B}Kf-)gC+et^zauVDF}d`uI{b6z%v50aDRQi*Cq
z4?fG(Z*W{cnD#nh46hve!9EL5eGJ{0xTH4y4cxf>K>&^1o^bU#(Qsy=Y*?^5{DR1p
z)|=y@h;YftdnIkM-ZQQvp8|6H4-eP|Uo9NtLB${giNv4vijr3#hmYeFpJ5ixgI(@d
zl-0Nu;6CgtvA<DPoAg{M(xHd@Zs@({YbEz<p6Ix8|C-G!$V!iph4m~ayL2ieCgUyf
zI{jK9;c^FCqSoCX2Lj8M8(6Z{#CtEf`?{a=TdrrC*_kWQU^4Y_^4jRNRDDeFKinOT
z4{R@U7%tsgY0h@-F_t*XB7W^G8%$J9X1zPUpZ6H)#N}?PL61&67XPgeJ4DWWrMz$F
zcIjdb>?ri^w$YXE%;t5`_-}nlM#?jWUm^|f$my`U7O;w!653zOmTQ&Hnf|do<h^80
zT>tr8iQV%Os(dUMG4}OM1r2g{p-f{c#oupn2Q3(CR(p7`+eOY~6e(D{w<7Adx23-1
zjF+6czq?fH-)C1g*y+-x)-$tx{}?IgDvu^=ZWgHPozG63Y_hYs5b&DG>Kh=%Iw2%^
z?baoC+dRWQ{cvhz>p@a~Y>D~`4~<}x!nQDn%o>j{)ov;7jB^~m^JHeRExd&TRu-A_
za<0qGLmQm&B|3+8#IJQIaiGkj1#|W%6CFCg^Q64T10P|yxPm^v+9IL>`}OH$7rJsW
zAuHY@0sZ5Z<lnk<fQg`H&Ybm2UG6Gt+UYRTvus8SVN9j$c+VtPqO$vdlTw6i_j-@1
z+&);?bVuX#2<!@NT}vZ}zch0E3$@fWHm~Uq@vbtMkzjuGJwy8n^VUF#@lcVh)AUy|
zWPNwKtLz@I?5(C8-j`Y|Hwz9g8od6Rnk^xXe$5EkN?@xjq50d;No6{%J%@vVDqwPH
zRQq%(Xnte$JbKQOE@OuGcQ-XSeAgaG%%jFDZ~lx_=o}5?7+OAU+sjQZd$_kM3apY{
zP_x6gy2Vw_dScRx)zoKM(ZFZ9zRRYdn)u;M#KJiv$2w}e{`j!8=GoIc?={c-)+p&R
z_0IobyGyLcD4Oes?J;Ub@b4eb8HI)Cb$Aju+xsCz+RvEsc}fa|%fnRrGaPp(7aht+
zUzd))X0agheiRA_WcRv?s#<BPp!S;oQG@_t)27qk6&wz%R0_P&eXGzOH<Q&pc&OM$
zB~+z3TfFn@3yu3$xm4vSaK<>n%K73_;2-X8eEr8z=dPR<1st2Q5X%Mxk6*dBQp*61
z+Q9P5zG~ZiP9=CxYQFFbgKY5pU<8zPB&Xi@zT%rz8R^#2Q1f1_u$;UuRQ2og%tV|i
zK7Z~F`BL?!iGfRpV%N*l^e`U}o@9?FecnseQdPbv7TNV~EkvtW&;9YnhyvHH&vTaV
z9=~22c|ntv8E1m~RiSq8zhRXBt9-7h2Uvq7Sy`dCR7Hx%WkX9X<?kG66nXMB$fXaF
zy*^!H^eBM5bFQFvC_SR1&h`EyD4v;2JRVOr7&=tD;(q?2dSlM(Nu7P=LhJ#^1+KI0
zZoTGlF2Kz0*5Oqw5$rNB6mB+`_w$&H`5njYC?)oe;M!~>+Qz?yX3X-B04g$X<AR~@
zPU*amclaGpA2oO-#d{kcHE$ndZw+?2y-}L37`RDqG)+g5tLCF$BXu+NOr|XZI~mdH
zD&7kixP`F>zX!;xoyE<9i8b4kiRx^9?H?4n_BV%zb0k-6_cr<+;%?^^RBsq0uM~?x
zUVf5-`aYFl`J){uX+y5fU~FmXG5QM1$i@9X^~)D=b6JV@INtSzehG~V=D!WAXYx7$
z08B6>!TZB0QFlFn<0e9m+eKJBF}1U|+6Ki<u7Z;Dd{JYTs!+9P4;IRpJB#kMiFsJN
z4pwAK6nKPWY=|!!8L-8?vqiE0^$op9+s~TaMb*6gVio8qg9;~5WkY>4U(RIH$Zn-}
zt!gK7PMZ3z6T0LMx7)1E&3jr!yY3?@7qF_(FY*qOYgd~1XI7epG(e8=>6P1SQXjG&
zHIFln#SS<(>#9~={`)NKa-Z{d9-WDRgp092_7i<>phAkT5bO$(A)KQpX`~}Pb+y#Q
zbb=$tLPhZJ^z%|TDF@v8?GQf-AII|y6qwdRSvGSfJ4Lnx%fmR}F&>6U4-@B`j~w!x
zN)p{1Kr)G&&b>+Fw%wDJ+xzte#bjBNVv&I81ZO3I>y#z<)sA~Qjs#F-mEd9gNDdTL
ztbujT+FF-JHpqyjCiBPWPoyf4LO`=JX~Y`n8!UQ&WCjS?b0_unnEEGKBzsP-^;)Kw
zC+og!9pmphONt^-Gjn*!RC3p4)_3JQPf3$k_s-V7p4Uuf7f2tGo<>yH3gx}V!z6CZ
zEtZdmml6$Z%!#fU|Bi6AL~7QX!p2VZjEGl^x*rjh#Cps3PInQtbnjcG(#+=08QMmb
z8688kO-++`F$%-yp_F_?76C_A8NM{&RRNTHeeeWP1@<SC49QN%8N2lwS(bLGOJzdU
z8jeaE;x6p9NX)cBS6o?r>Az8uk_mYOs4F=mz-$`c^F>ON7h9#4s%Bb5+U^54M_Aak
zY&V-8+$cd4pBI@mX4RiF%<pEDT*7_{q&b2jv%|IiLu!1)B)2{U;%g8cV^5j!gNR#`
z*r^ebzlEvoB4k{p%%eJw3CT_}to3h!I+5hOv0?N=p6s;$!D`A>A6E^vbdAaYXS=~8
z5WuR3J3X}qLVUXi^CfNSAUUh{y2?0>ZY__i9uit9ID8^KJ(!GL9vIkR2oGJ1TbZFe
zY~8{Ayl(0}QhgB-2P&rv$g5e9*KLaHzv{TP-o#(f!k1Wj0IF}Bxj5pa!!bY~$fqB#
za+VuJH3TPL(p3Gi0DMxdS*X^hjP)SS)KC8mVbEu_6#-cMO!elFYR7{cCOr4wMOuJj
z-|2txdcSQ+=Jr&I9F!XoVPeF49rZ;H!!@rs#(7eF{*VRE-r_lx?7b)ovV2*d_c{Tt
zMJAErw==UgfNYC-o=mr8^fXGb^EHdT-cHlnmeCw#2nD+bXEg}v%oK3{iZ$ll-LViM
zmAf5k$Pcg1sVD?et3jz^CVSvI5x4ZwA0%?s15d2)Y)*FPjpl1zXi@wq(a=FnV$em)
z>tK7T>)mxT6}bmDJ${X>B`x`6udTk|*yB8V;YP;bhB4+5Frhj?gd8`rO_8l)T}kdk
z@mJK}zq5df5C|BZK?@Xyr~<(nLV^LjVF^sbqu+u3Jp9=wy4VGQ#7#`I*o=S3kniT8
zsN=||&gwYJL}Z(c#6s07-cyBe3@iY)De@wixH$3DwT(6?)$%28Nkdu9I_lx0(vP3a
zD)xO>TP1j5a1&R8&J4)&8o+*tisIa6u67(05vIVEa=34`t3)pW*gx}<Uj1XKSLe#+
zu)mz*JFF*IhSbc*^l-jcy0riRPu4G(q-$Be)W}Y-&UKq>5(s)`?IX4e5>=e+!PdC*
zWyZMrp1viJk~7sSAsSJSljcWPOeU0qcr%Z^o4N{+e!~17m#yblI;FRyd8YpRu9K|3
zJ8Q~xrLrJbsMJlgoP|B0eLQnHR*y@k(&D;rt>1oUw1#YatdaBg&Y@TnubDOA^}2(|
zmv_f&u3F!DB!2rljm(-Rnl~E+pG%LiduEKT0WaJarC7O$vzhU0D;X5;w~ZF8*&371
zv_76&e*+R@D@n0e6V)AImsouZWxDgN%pI-Q9fSpK(9Uz9R?WJ!-=fF_DB#1uY(kux
zNUJC!kj?F0BfGcltnEz^H+Ew&$PT%UMZZ2%WmCQtkLb6r6tDx)Tk$-TC&}euAAp1j
z5~wZaBpD6a?Vm1R&Px1TMC&7p%Qq~OJuUh`Zs(7ADi~qo)^fe^DG`P3vz`ILz)O$;
zD08N)cHa&Mitvpxez<Ut5i+xOZ$b#MzuqHMhKn?(YY5Y{CkCPO0a_Z%C@vp@C=!n^
zdd&jNBk{sU&s|S5T)@qt6TNd^(8!iEoX1z+3VRhHv!Q43_!XnG9b?Z8T<I~JT`rI~
zz53c>`bog<Vx^E`s&Ly6vj~~aob2R;?9!|R%Ik{&cYt<rPS(Q8Ise`MVRg8Pr+IeG
z6WJO+ncK-JJ}b(EL3<2AccxQSNPzHlPQz~{dJVuo-N7rmKtSWHKG>N<G+eOE*ORhn
zc~=T@Zw3H>Wlz+U;CDVr)D+9$0*SEKXIWyoQWM3}PTISugrz`ap(GkX^l_2_Myt48
zIV-*-f{Q|9hz6}3{55!yHfcon#|H?Ax@eaS`|V~9A0BK*%fh{ohx?mxxC~tb)8>`(
zHoV;7o>Af*rm>ro)6e>KxcyAI-by|G{L-lMyqurU%qBm)i0kjc4<vK&o#{4q6suvb
z^!$xk^y4<F=hV3%!4$fyEh1d!%l0?=r+8b9kzHyMnUvnd9i7bz_h0_6mI>2P{#Rww
zvl$eh<>svDeyD10@AdgK&s*uktwy=5LHA*qdU*NNg+Ny4doYkO`D105ztSV3)x?z@
zYPK!v6Y%J*<p_VHGjbaMscmXI`O)FRMjjJ`@MRsB#Yqzt!@|V-t{VIAuPds-6L@aN
zbqI*Ilr$(Z8F!-%7XUVo_5=0N+%5qxyF35zkyMFr`UnVY)eem4(o#FbVzI!lL-nO<
zVYtz7R>>PZcb40d70>Bkf}@UW7%IpxFq4KJco{q0qp(K?d*{P=3R}hd@6XaExVp8;
z9r{2Vs-(%eAfn(S$Mq+7b^srBcIb-#oRgKnr>H3odr5?i+03{D$kfuhSTU8%P}k^6
z)aTjsRFm6Z%e2pfa#8Pg0Vp&NM>fDtyZ5du3Jw5SLY3{oDt;RjiLAO86jOW=^0q%1
zWYS9PUZ#XFdlsxG*r4MVK@xPUtOm}lmEX(^JkK2lOkC1*qo;AZamgupd4I`YP6pUM
zM<Yenvq?&4HP3XPFUhIlLdB%V^oPJsDC_6x()}$AID(on<g<e1202nDFX66_P(B~#
zJk?wzeI{byH#9ER#O{Bgk-K*7*GA>=z95_9rxWqJ0yxf^8tLcWA%Zw7H7%vhZh!*w
zX2t13!#Jk^l}~_BWG)5;Uo2{5p8*uhuG*?|mpl9>7n|FU#}!g#>V1VT9L89=KGgug
zJCSe^7Vf6BiMOVp-;EGVQw#;E>5>5U$CLOTfK>fvfCg}1Rj}e|<zNkPSp+DN4rNsf
z&qu!m#y#)0i|g6(1gKBYwYarp@D-EEyR;H}_t0rBpPx}mlYKfatznB5$5b(s=&jz3
zK+1-T(ZWD=J9n8M2+J;r1<d^*ns_g`fYLpc+sYU0Ni=pJq;?+;)f@r)WO(My<aY25
zwvm1l`4Vn(VVSTDWi^6YtlpD1qHWTv-9H&leA`M`1D;zrH~`RvePE4>?Cpl(-J#7+
z09N8aeaU1<a^{YVcfT{$JpC-*avt~-qe7V{He%NSLMf1R^<D59*VnB!{{xY>$;^bC
zJs{6=x%*;1gKT<}&9(ahK}BUQ*Hty?rqh!I;0Ri}fdl1}5W$+P$z}Yy<hUp31K<py
zNo9_!bicrVpWk=RaJVU7AZ_Glw1zrF+R!;r>M4a1L$1!9zooGdQjj+fz@0&dvq+%3
z5k&(tcP!=8m&ww;ECRVKW$x?7u>YY8U{{m5C|!oS3czv10Vwk(H1(kX5NquOtC%ZY
z>r~AKEX%WVM`GAVWDrPch!o!qWwVCR_)_UPH32sE+O4q=z@bFUU!TlQ_L^-;z&0{I
zuBKeTu#Ga@`Vk?!^Kl_JIEDK+ACROnG65AS#+N(oIW43$+f}uRaAhQB&&>j?`CjU0
zpI2>{hMez=*J9;TO=hI!oGaaDX&@=7PIY>DW^Mv>Vz&d}xRy)ELQ9Z00^+qGjPqb>
zFQb*hn00VGe2jjZmBVTpa{Dfsgv<#DMR54<IVC)PeIb{qW4JvfcPP2PHzik~djnyN
z!Pi6wpYcI%jRwZy$fx30Akt@OTcnu$Q0)KG1^zem(x&^EH)8Dq3r)eAfnF*vOq)53
zht^cVAH?`1tSAqS<2x$v*8Gf$JWT|+sSL=@zA-9&0ulBJ+3%fI5S4EHh5}nap6CRR
zoXkZMXL$`sfHMF!w`v*8;&GiS{1dqXa0WI(|DCRsEFHKpru(!Q%=E5O2k=xuKyAGc
z9g0kLWxa=cZHI4R5m>_q7Igp(naq0OK)!sd-(P$cHb@P`&wAHy%s^+oS^>`sd4_ly
z1bk`L+I)d1P}+Wb2Bd6NK-3&7U0bOjIGXW6A#idrbQhQeo>bsDWL*Gwr7><gEhIPQ
zEm5%*9B+tORFd0y5Ih{8Pq+DKAcTz#QrLF-hYw<HR;N{1YBdJMAkl-t_{C~yqC-tZ
z_bW*a)G>5{qtZwvddJZfH2Qe`LL2CR01Di7R$?G>?rR#$1ds+&@~{s(AayJaX+1=j
zq<@5~k_7tkjCC!Pijx<>K-J9d@S&f@4B#`#X@=$~ZkY7}D39t&9KJ3FK)i8wfOO+H
zY;(!2mruT2btvD9tKBn)0U#xk9ga^2dedzJ4k!RslkMg&U6uf6HQMY{=1J0?Z8BKr
zJa8~~`531Dk&O+A=8nOOMfx9x#E5$7-J=pVaulqN@;P7Zbd6p5!_bv%Y#lM1fYY=M
z_+Wc2RF`VOs*Iz^J5Fo?TG1*tp+F<^R@ca>-Ut(XJRth<nkKxCK)D<SqI$3wXp!8A
zcjSO<z`X$ZxY5Q#8bJ5k{Cv<Og8@s=2Ck56e=GudnW0gyIS5?`WE2;)U@G0!u!4*>
zW}vz$;6|QP6*pZmlmjwI26($PE7ktKu-p6(h~4lgQuIo5hx5Z;O|sF+<LT3qtaEcZ
zAu7go-Vm`jqv5XtgcHL|!a}Ul`3=0(QVW}KHGrU<R}yVI?US)oT%3CVwPpG3?_i8$
zc31iG^8aA>7zxN-zwYlMU~HX}nM<s10)(QV+gu_~m=xW}ioCC@-@ASkw4hvTxn#F8
zv)GkBSfsAeM@|?+sV4hD`rQe>h)9<Kj$>C25T>(WX0JIJ1>}raoaq)wfY|{jDJEeN
z(=E&wKjTBEi!1Q3xt|GKq|e)AcWnb-*n;Zr00R_8WD_7nn;4wG1>@aF(Y#%&IZ3X0
zPmrs#0Wq#!A2V8t_?KupmCFW@2yEi5mNNk>7(B<`Q``9t<a&T89IBQZN&)PL^YN35
zaHqywt^w?&2=8Ll)w`(SnKS9&ziZeBRC$rPsdr}KMknS~=z&IIj+jH0p&|AK^0HKt
z$JiSHN4=2{PY21Q+CUj$OomLScT#Eq6)$Ft9WS!-x^%TArp#hzCR+ofX?+XNy&9!^
zUO=>L&DZ&R;p(VnxCXqYL^r@AX+WoXC*Hu&ofJaneNRFJoY^*kQW@_D5Id+D+6))*
zDx=fb{&`SlX8-}WtGu~6ReQL<ga8b)Ek7c40Q!O9LzBulAbBc4MQqzUvrX(*8bQ7|
zD{fVNb#r$j))3uI5V3hNJ-ySw;?O-1B|a$w@?jUK14#hV)pWLjaF?6$y_V=X8DHXN
zYEav9qd5cAqbu+QcJKKpb<oZ+!n7&^J=+R47Q~$(r|V-3qCqvui2t0n{xXQXIM_hV
zMxTvN?!z2aTNj!nfbesPVg){%gYHPzSYz9wdS~~`cFC37>ySKJd$3-RD5vWiHsUc9
zX+wD9jBe@gmB=!5{(f2Y*7|!be(qzLF*R6zkPO}!#sXjF9|)x3FqvRL<-!B1jFrdt
zxEygqUURNn+T5(nricTumF9T5K_+faJye$^@luhmkD6!l^1<#>HsHvpCkTP0CuV<u
zHjub65WN|v@~~q-%T}R#+9Cn~TOb3Qa&~tRb-a^WEf8{B6oQ23fyGj!)_SE!fgqcJ
zuHNXIj9@gC>hl!8vNyQo7e{?_<XJFMq9DkIxd$6dcd^GYSA5Lx5UQ+XQ8sM5^CcRv
z(U<hjb{n89XS_ORa20Mxr%3m32<Q+<H4G>#86iS7H;)bHbE&%3jwUyF{rbYEOPSf=
zVGZ;_f-#^Lx})iLLG^<XTsNT-^yT&0W=z4B^%lfkD?r)w1^g8O8WF0?31TLY+6;7;
zU~|tGVb|-fm9+fvqy`|d$}t~;E-Qdonf4zE)(Jf_JJaci?TI*tgC7e80M9rW0J#^r
zu(>rJp;5ct>Hq~N^G(M`Uf|k>kYx5AiC31}pV4SW=V2XN-d%?(sv4AnFvX<}%r+T7
zG|017tB7e9thDt4>Si-4!B*b|1?8_RhOtu$?^hwYBU?0#L$1cff09oy)oQx^!%Q6o
zM~j%&UN~r{`c+sn(jBAa2!`X0Qx{+4y*PDNW!X$L_7lYQ9tH{Iu{?dh4s!WJ@ouA#
zdp=^mFK?`d0?F>O`!`Id4?U0ieJu?cSG0X9@M%*6^B5gIwHQAjLuKU^)ZoT;i2P7r
zhat&U3I?eqMyBxxfT7er3H%wpSV>$^mtOul@VFZ+Qwowe#TK}5^6<Hr{a(e8K7R!h
z4zi0_lJ7>ZjzmcKM-A!aJAuzLp;jAiESNtR&%rMQ1V;u8CcKIbG0s{8I<DOy`xv-)
zeAtl~^59mSzUfD^8p_M|8IKJ8d$lEChdyXec~xVzqtP<H+~RCO7$2CH{Rqe6+vdP-
zH?w`^AG4`~8`@zQPITm7|MHti#`Gd=p|r~)M%S2Q@bd2Fk|`$3a{|)d(spe#mlquT
zrJ%lcjIM?Odn4<K)~d(N$}9)Ni2&L2LQKYvDQ>?CG`+HcNP(TlEgF;)bPY3sYAKC$
z?{HmPZscgow=r}CNi7@Dnlj^o#Z`cJqp#e5r@1P#3d!m>v6N1576_!nW-_94W3-Lj
zAuY%(Trz8HXOa=fKzgvXc7;T_Nx#-zZ!u8jGJs<WZB``-gi=>}o*V$zHuVDkRSIbL
z_aaOFUZB^MBdvK=<%f>p7SK(#f1cM-B;5JaF3`o(Fsfl|uc!7v3|K_HLjB5ZZ@Qtm
zmUkfOJxpFiL$wqK#1pBKyiTl8?Vj_ZdL5xAYaifJHK>7$9)A-a-yvC&4!W&dN_~!B
z&LZvDF`&`qhwel38Gs1v0xp#x>FY!8<HP8K8vn)}aUW6|CN22$3vYV?T6bfv@7!+y
zZw>;v%8p56qXG!Hys&1x^lD4AK-=ypXb-C}89Cmv@Kjn#y15DDv1`bKX*ZS+vy050
z5&YqnWrJ?2mPxL<?raJB{~L4v&)-zv17Z`Cv28Xi{@KXvQ&!nEh5$$dao4*B%S0D9
z@v+IS3Ds<I9nmSwK5zE>KkkN}kIKUubjWNDL=*MQ!mKYx6BTc|LaO9i#d_i#x>C@t
z`1=(Ula7!7OlDlx^zFV5I#YcPQ{xn|EFg0}{8p9zxG8^oHJ?Mu%{Bpvmt1|D75>^5
zIQuvx+C5zyhg#`JU~<lY>1)+>e~k+e^a`df#Dr7A0v&)5SGw%|gN^%uJBSf(bbS*I
zbz6;+T#*_dBmaH^=9fQd$G7Xnzu7f{CVwZO#C?Jr@$z3lV_Li=(>9;}dp}(f#Lc0q
z3lXZo6A<TTVB=T~oyIa7!=<GD>hoHvcY#n{10^Vv@<l8QXcRcYW<RDkK^czhB;bep
z3`yovu(7!@0Caz~w2sd$fW)}mf<s>mDjYq<VjEczf`4gyq{#y%uEiJRZGUBm2v`^+
z>!4l{)Ovz?ga;Y7SO5B30F#PZdt%QAJEF=vef4HYxTjeIrligGww4h<SpBZmH=6K<
zo+k@*FeM=orD9Ugv5s8JMG3uLg;YZa{jGhb*TGC;^})Gm42dg;QP@+@OD$mybXx#O
zsG9n+2ejrFK^OvXRe(olcPvwU#TAvlOLLRP)3wacf9pqy;9l!eDWL(knu#^E|1SL=
zFb$DGV8M7-!kME!E)bM-`FT;hqcr~S(4dQcWRGWdWOgNYm6lSDlHSMbZ64sT&fit9
zMP-+2BLM_s>?BBRQX|g+**OHNF|GRhwdS4$3fhgn(zZVe6DA8V&>}VDw!dpQJGkvF
zH)ap-O-fYEF&<;y(3<WegHf2|YXCKxwXIKg$3XZ48u~k@>xj9gYAh6LAH<I;eTYT|
z37ZdvhsRv0g7hmgsnt+u76-J<jXYKOiFY_9CbvMVpPwjN@B^qHU4U{D_KF7QfFKY%
z#_>phJcv8|UPlr}#0->AjTk=~!?xWJ(><;vfX`4&uDiR_!QMdeu~?LVJwE^pp$Vi;
z+PVRdXVVtO+)~oN*tz_^&|l_I={j-ltITyUOk>njI<R3}F%OhA<wV<JWwpwn;Z|Y1
zNZQF|pim`dmnw)s#h6*z!!ek;*|Xs{k(Nk+pHQN6`6ZLQaD~5DLOw#xKZ_eIqCsHv
z`-RcByRa|=nEKsmVFzLKA02G&15reM%OsUN9z*t9SOB6Nip?>8<v{u9g4zT&C6v$Z
z(v}WD1H+5d??5BOpBd(2Re^983Q;csa@bRg{SSfc33>g9$va6`gVZr*jp42DM*%8U
zm0Bp(vM}y{4!SuKiW2zz2R7OL0FUt}`K)}`?^2Iir{fEAL<pqEYHmSP?QR%z43uFE
z+@dPoYWFu(Apni+Ib4aWy`P=p=e6kd>hG0_fN)A}>r2_=)=HvwT0$Tc)}1rGI-C{@
zzfjMBVT*6B4NwW+8QQFggJ?8JOm9JZwFr8AKcJyyV|q-yAp__E9MK82t8GfGP22pw
zUyjRwKqxX9k)0&2_D=XB)Z&Q85YFftyAl{q{K%)P8#mpbh3f-RK@RFjfC_pa07Z{r
z`#3f>Na`}M`tZux?f_7QOsJUyx0_1?+=?F(l~7DEzO{gP{iIfH@GS@P6Is*W`so`%
ze<}r1y%MMwKoL@><HC0t-@F0^5Hb*FBN<ulFup0iSRic%CIQr!D|>nun>;r%U;llI
zfIdP{y}PqXEGgI>$$jcMK8T|;3dM)$n}I~kPkv)}eJ)PNz;z#t93($MOQ#!9bW8Wk
zff|kg!Yf`Y;S@FNI}?B_gE5|!$cBTJQ|A1O^R)n(j1>U5Xni@;Rf*N<4h&Ek5l{l|
ze7gSmi&G7xM?sD79lU#u*3O$ph}GQ_Cr_0Q<<IZ(qszJMDkfshdoU(9ftZ%LJl>dH
z<GYJBdB1%CdeIsQ=CS%m)LWmWaV4E&|7wZg8Sz1vE|&#N&tz`W?}~rbU+W=Pfm>_k
z6zm{RtCPp|vyTAsm?-|^(F>!VJkNf>cR!dN<AXZw1k#wJ*;8fD;v2@kK9fA{jKF5b
zAFT1zRCgkU*~<a!Y<X`6kZuL+nT7h=@bl^XEoj^=)@^d`OM0}$%fn>QnQhs>bIXTu
z-@$J+5!gy9brGy)<}1BM{!NV`MkqXX=1dP0^x1FK*X}Pk#Ji%X4uH330Q6R|o>sgx
z4y(VeO_i@S@(VN~uU7iby#hUY3mni4427E3WpSl~nC^!a*6F)*z_s7$dpEMVXFxiC
ziM`6XJMEjG0`ifE*hq%|o0e98hnh)7oBGM8)A<+gve><q-CygHp2$o99S%_$Kz@=I
zHQ##&o;k+ong9T%c|!gLGTS&xNM#ii6BCQ6zDFRnHJ2zXRH7OH@iaprw{;6`27F$o
z3!0b96VJQqKq*@D`2fh__W)D#C%#=EasVbb1JW+g&Ig`TF4g?2zjdt)rWn|{1zQD?
zkw3pfqyms_1!{Mdnsk5I1nuIdFfem=qs$nQ8Pf@r=6Cu%Mzp5GHBkI?q$^1X<!&(>
zTcxus0lcbJbcHkrqFnXst^8ag%t>N4Y@P~OfL<(_MJ(=5u7N=&z?w9U5}Mrr4Wv(k
zRFreWX7${idp=-hLV4I{Rc-Q$lg3?%0fPp}qN2cDQ#g3ylnek3owq31y7!6{3g}J&
zAQYxGFSitAUkg-YB(u1!-jG`NF&Gf+GHpfqw?+&b42@-6u80ByK`b-Y;-4y5!3f68
zr;{`-u2-Nrs~yn6f=oFLjfl~`Y!$(Rir@lL)KA_dZTcjc9x#T*U<_Xkr7YK_dIJrG
z&3F&*nk46RLhzOAS8uOVo6Keg(CoO836zI2Ah3B4M&re}L@O4s{YT?Qd8MVYx6>gg
zQ{P8v3dEuOikfo=(3GLvPDcbEUI$SRX|~WCAax2vsHXt9v!BrxGxQ#`7c)n!GS^XY
z9AG+;m$Y3m;?|2(nP31x64?iaM{=yo`c>%fNDP*{VM3vlIRnN>6=p$0MIbQ~i0-B{
zP>~&FKCxub09d3^A2!ym`xqDi#tj_uf=oX#57fD8lZsO^i(4woTh`0c<6!>l{xW7r
zF%;_KLoBc2MJCu%{XXYr0p!9?00sL!fP3v13-}}K^E!M>{SOZqr{uu)LgSnUPQI(b
zl9TVaq4q#4ht&EGxZK;@A5#1eJSU~0`3W3QU~kNAfHtoSke)1wigloYX0mf;(|Yi3
z3NS}0Xj4ukEP>LZ3JsB=`-p$$E6{y_rdDM6eOOtb!J$m=EdbsHq?G1fL6YW7&ByLn
zWv+IpC5ZvYFKZG0d)&y9XmuDbNO~smu69%n;cSVgXxQIFqaoP5T)%KTXiE6uRCn&H
zL*s2=yNvO0DYT2+#LS%mx0>l<X4K{`XnVTFv>l_43WBMdg&PL+n~%W9qu9Z4@%V>U
zP>Z1XXuR|~rR!Zy0i5?aG3(Q<4YKL0lVEr=5}JT34x}BF8_%0gSC|Alu8++c_zcYz
zL6l-bSIyuY^s!NkFv?3qfL-aESM)T(3#O8UaPi3?6d?eNkT`?{oDGmmA8Hm3Hl3kb
zak&?UPVN{Kv1tMQR|JqKpc<=W<qnNTGdkkClGdQ^KMV*T{R`Ox&qeSz(_PwP410Rb
z>F&yG|BM#N212~C^Pv00l_nOfV40oEZ{gI~j%9Z+$ffMGKej3Nys1?V49Gp&0V+we
zU2?^>$p|@8?rFRKNw@wFv*EM=x{|^y<YfZ_vhkLG^rlJxff7A=p@VH1!p~X>l~-^A
z=-Pvwin(-Q*ll~DgCjtxQ-$;tME_A+2}+cosf6wq)E;=Lt=9LXr+}%c_<o-y?_pI9
znRRUo<79M7d~_*aIq<+PFd#l;t-M}FM>zl{EIUDyA|)+)9+C{%{kBG30B0kvi7k%q
zPNzp$oQmPT?*rhSj@-vX^nz9DCV*-x`~_9clY0+njeRT=?XbZZAkW^NIr!dHCk~@h
zl1GB!AM{OAOWi$?W$xE*)eGIo{?@NtHgE@0T0mFFI+*&a4B{FzlL|!d`%p>OfL&|+
z`w!u*{SG|I#Q8(g<Wo>fqn)<EXTczSu5>0VaT4|tfGuJ7>?R}n1Je$5sfD)(V5o~&
zto#^5cQ@?OPr&C5UGZDYYtuX1KzfFwLSj5|eirJTS)9-F=pHSg=>mE{y5jZ)EwI*s
zi8K89kw76WYQcq{^5WK(2E(f@+uXlxLoFRtKOpB_m*b2c0;R+}*}kL|!{!+_G6^P7
zk}42nPTZ0G9m`<SEu;J{#)Wfnx@N_eDPW|$Y~|GCYD>=F!z)fr=nqi|7+AAFf5Ynm
z`svB{ji5Tb1)n8&XJqLN$VLV<z7Mw(P=uzBc=a~H=64tCXWMYgy93QT3p8Vek!Udg
zUfW%9qvTgDxxO)glpWYBu#~$~Er8FbE#!WdQ?gnIs$pVxE4Gh14T&K0f+muz%`;u0
zNeFA8cCgq35S^)x)0g^Torh8}Hs>cO%6kIH!i$Tv2m{Q!h`|b<JJ+%UX<zOhtB?!=
z<()uxrokZKn5&{-u!Fko!PnOib;3ad|3Jpj`sy-y3^C6IQYI8^#dDEh(_yvG!d$kX
z6w6x`KlPr=N@A&Mb&?lVais<?`}w(N&FAXL@6EP_^To|sQQS&dAkIr#`Zhw;!5~m6
z0OT0c4hv-v19sxy_m_`m{J<pB;!Zfj#?o*tgMqPq#RNds06}C^a!+0W1VjxQa7ga_
zZVjbJ6EH0CJvL_7aqJCG7D(ci1G$~WlqgvMPr+ECi4%|wv!|W=31(pUMFkqanY2$+
zm@%+H#puIPoUj7>!n#v4pxKzKOT0X{vo;eAaCxl@5PP83j_Y^X`zn7=!v6XzK-^%S
zTD+5xKaPBZkM1x=0@@#Mc^%l=)pJAu=X2M+by~1D#tiDKgUK!994)J%{h#~6+u-)F
zO?b!Dp!*!|aP#oM6l%19;xWIUUxGI{gMvOgQ86VAWUtO3I_?{DOn_~y0Rj6d5hD=f
zEwb1lZTxTv2#BS9)_Ituw6$$8Tcig1+-kk9c1-rA9e1G*kvLSAtI7thk4MNQOKx7U
zd>`dD?7P{5%YROpqU0g=d~8sx2B6ez06&HHM=0c`(Z+o=e?P^MnhT;qhn=5A8+gPm
zA=~OCU6-Oz`&iEgNT5GB*sPu6UC>r@nHT^f1Jvkj&+%-sV;vNr0o`v<%mCrS8Y$PC
zLlYg$fQ3Q`P8}$XMoIdKb5bi_pybAFEQ6fj{&cmt|60-4-;a`M#~W;H5g2>Q040|b
z84c#e_!K=#iFA)AAAfmmZZA&I*2)C!`KztMUw&J#P7hfEH9Oe^4F0&y^$7-ff?j@3
zDL|4~W5VT>)l+HyVBR&Wd{HqJe6-@NUn3ff&TwVr-E4%E0jQ<G@c*&*m0?k?d%wic
zq9B4wNGYJCNVlS-gd#I^NXL*4B`FFPB?8hSB@7JREeg^SL#K30OP_lbaJ_rK=iO_c
zbH1GG+8@?pgn91x=kFi){nQ_1+Ik=##{P|K2z-{PfN!<2-<>DIK~U&qp6jCFHI`Gc
zdvq%HTrsFJcL4hoVHFPGd+E8IW_2B@dyn3UfkOfvz$A>!_U&vgY7@_4+A1tS)-K((
z5**)8CLEi*c%1)Uee0Ay1(3@%gh)V^*K#wa4A;r%Py6OW=sbXox@!-}3F-JPA51y1
z#@OB3*~s#W)$A!81+_PM0=h@4178*;xbvEMldCPtC=Ye*FijGb&dhusAfpo=ouU~2
zMI1O9f3sF#yFo;6TP2={3V$-Ax*I*R$0EM^mASw=T(hhihvcp22>3=;R4KKYa>l>b
z5eC&@ASpM4Q_|RdKuFOY_R)7SxEi#pMgFRD4Peq9LkH?3pn+YT8eE%|Mll0o=ZFuE
zro-(ZkC*?6m^~>#a99YQ^MxuoFxs^UuI=2!S(F5_-&vUK3y5lAb34Ky;3?AXp(Mey
zrhc%R0(HlTOCIa(QBFCSZVybh9}es$28*Ow3`~8;grXo$O%e*sAZKg<xp7Wp#?a2p
zI>>kT6lxDU)u@2xgh$}OQoe3X-Rp~?AGDW1<$TaacK{D`uj#(z`iu#42Gn&ox8Epo
z$+si;t(rmZbr!^U4cCya9y(>9g-Y<w^L?PLcgZ`Jz5+G~cbG=Q!#(%L=_62%dj}W)
z8{F{^<#L}mOr1b2>-G4Y0x-C!E`Dce;?F(RBjCKsEJ$!F*@8VK#bbK45B7H>MAE>5
zW0HG7lUFLxIG#JbSw*i2&4&RoW&y6}>bsrV|MP{x!>5YlW@FFJD`Pr^F|a`kG#I;)
z1gte*{edZMgJL+ZIH(fOzF>`$<E~i0fAu+C)nf{lyK>|Ups86?vC4Ku^!$($^RK$d
zubT7VE8c(IA6WhNJZSk|?WrbzR0Tw0D|&$WU)z}@0h0sQrE%@H<bx{GHU8()x8IY4
z>q2N&(nVPR^}HvU6R9)jfQI^<|HAk;!nPAuP-E`2A<s&8WcpiG(%%bSm%`v{mwU8l
z|MnKavHAaO>WG{F;ne@F_+e}<CVdldNxYO}1k_U+xr+Wq8Rn0Ozc(WSC2q_OSQ&#q
z#%i1X{l`J%lrcYMezKFl@qrXvtJt3%(f#7@DyWnS)pJ`WdT<$1nKUhMx70iaQe~4=
zWabc{e=@}{TYXNn|6hEV!(8FE#1)ClB?UfU-B$Y>VdC!{`Dg)KWJReqLI?t&06WT9
z+`p^yU9rFp4(aj|=y-z<;1cz}0l|-!RX_}U>9v$fa!fjD?3xI{-?f7uMFC|>%ZyJK
zgIki(IAluy@_60}-z+J?g(B*AJ(w|7xlihkPXB8U_L~x_&VVuq=LT9kZ14e(A?nG$
zV8+Rmgk8V`Y9Zh4$bhp7@TbTb+CP8#pBeOi2~cK!>5cFx4){PK#fSHIxkC0)9Y_H5
z`bGc)kVZmSyYT-!(;o~ZH3R~I?x8D=)p&qJRNm&qf0ru^s+jy%=EFIfn;36{`r!C?
zMZu>ObInVc;*>WDAQ2~4``^8!3HTc*kN~YOU4l=*+{`+6rvGUFpFRDzoH~rJ5XF8y
zp0Rv*7zXW_tK=NWnG^~nN}%Oe)nVJBLrJ~&IiN6aLQAT$nH4jVnw`~>6H?Shh2LUJ
z{>B&lMoQl2&BMTARjsq9gx#BRmFK$^s;0{}`$ab2MaD*Y#6@o9KXf)TiyPmF4PyrV
zup+GB4(yUQ*GI`9geX66ISN7sZ!Da@{lA}-;MQ^2>+w(qa7PP~y7B41{Um0ZRw8g`
zHOlyu5Cr=Pl98bU^7kjkJno4{h}xkX|9P2^Oh@S!WhCyu^SHMo4g?m<ei8TdO~4|;
z=X^f@#<m%}z4gJ8J--M^5aF~!U|Wj=u&&2jOG9_I@+hz&WKvjv`+w136a6}LbyQ*A
z6gB9NEGlLH76}Qv6fn{~F<TT4_G6W%GV*Udo(A|A)!&io_8kIK)AeKt`ge$+%I@Q_
zyGgm|Hr*PF*|^XD5hE}&j(TI&s1v;WOh*21P!2=p|4jKmYwLdq`#&n<|7YTZu@E64
z<b6f9`uAFg%0Sw&P5FP^-+ya`${;aBsHMKV)Q^K8ajN=AQuN=|I&8?oS%zXunD_<K
zf5+rvG(A`Y*v%K5oD|Z3-$X*lvNfe7U$`3^8xN5=FAsB8R8-7w=HdRIaqs_~;fKIN
zRqssw&kFbte;thhhHhG+&Rd#{p_m$nNeSb}{=UT?g@M;E=wA<1d4g4gzWg9W_}_Y5
z=s&*x|JK+4hvolOUb{35Y^+o2nBPA>wnNoQKGx2!qH)c-{z0r007@f$79vAS0U)DB
z%>}N1lzV%kj8loN0ZP+lvAX1{oC~k4#MXU}wIk^!!@y8fyy;q$6mp4mBFc~5TbSuD
zYmw>)_%$W-dov8+DF?cL(hDg)Dc|&QXF5s5p|L6@_3>)4uy-M)g<F#ZXxF*!N^)MN
zKY#f3DGPwA3I%(eH(+#@w5Vphf3&FdIMff&>S_o|b*Rb)c74L}roByYo-wc^bG4us
z{7yFUYgH~l^XIT%NS_7T$Zvne<ks;c$6Gyj{@eR>o6_`aH__i^7VaF|$u|tDgt@s)
zR%g>2X#WZ@8D_y6L-h=&V0Qr$yiU2v_!qMLGPz{fP<16a#z_2Qij%2INoQnyrX~yO
z{Od?qKH!E(RGs(T^W8*36goo~H&gz<aWfqp?|syvP^C4>>cM08;j@85{m_K6dxLA?
z=JBe3jc<7sL|)-L>$>dNtWS^ypAz){fy@vc3Wn@CtuGh2PnKAPh28zLWtRNE5S;A_
z80hV(-B1ody9Tt0%|FmCjhrDnD(e1?d&lE5@L}U*B;4yDJ0ABJZOAkLr3^%rAAz6g
zwO@>8{$UtGGL1><KS=Z=)EmpH;7QDX1;>!{y?{XNq0UQ#niwA{_rI~pNy^^UmU9ZN
zPfy4shX<|-Z&V!r$5|P&Z-J&{;!{h16>JO#N1u56LH#$EoDDy|{zH)J>tJtzl&{DB
z>Fe(?X!=!M@bQdCH0)sK$=~vB4p2%x?;Xi}A|;<e_LZN?ROG+%j7*9l3<#E*=H??6
zkqA-Y!{j?5IySC!GOY_{C%*d)Td;+OIPz`^S5@NhLYpyEvYr`uYZWP&CSBFMP=fld
zLhbWo5%c*>Os1z~Z4s%_0SP~^+-h#27f!MTYi&On&?gvgE*i?O0qb#D%~|3e)JH(h
z{CXNnOs1ooR<r+^$XpI#xMVC8CT01(vFYj2&<r@(q(xLXnE`!-BJbrPWQ3P_3~`Xu
zS|%q8C6jtjg#*#BN>Gj`d`l)oc~`epDOSu|)sl$K={F?|e7uQr;!fwA_H$eylg2QA
zfgE5Q70wItgh0nRGm;ck`5~%NM`GdAMRM**Mn+@Qjv}@<HBok>Wx(hx)rqhg#A1!1
z5tkRF7%usQ-BiDozVfb<<hKmoBO)^nPzZM-m#V%Au+V9$0LCmThK$mFU)f`Uka~-w
z)F)zirJL=U1&z-QoQzzzx+jm1|B8j<L`bGrka+qv(-j<+>?nQpuxv{O;#R(2?CxMw
zO+{wsp0%P@Y>NSN0INI6YX_CWMUpr+eQHc^4G;D?;=MO`H*uH-QI3etZ9kiW>Tkoi
zyn+JojSClPPqal!1TS|elQ-MSN`$p7gZ#OcceZ8Mr~KcV;2rz>`F>4$nP*ryAz-S2
zr(rUQ=QQ3?L<;(-3mj`97Pcrv;~6?ogy-c1A(@tvGG`>w@f5)iut~G#=8%0$;YrFN
zu8d?^SUzZ%idoX%w0wmJ9{m2DhYxU79cb;x7(S|G@C`PE1<f(FKk5Pf-0;iy#!65}
z9sd&WDFTA;M0!>ak!J83ErE@L+(bVm|7{!%USMHE6^UzjfRytBCWN$i*lFNEptWz3
z=#Cf7a0#f_icqIwE@Z0C)OZgy4yY5G@!~qo@i(x1K9kHeB4ejsfyKH5qp{)h<;Vdf
zX@ez|&bKX)%jIIA8mwmpl-!vB3*Klya%Vb4f4oe&G+^i6QpH*9Qhob2_icE;vTYo4
zG66Qknw+8BQt`?Ke-fOgS4K>VYh0(ot{*A9_Z=Y8oY(NBZ({kVV$wIC<d_Xfnw2Ru
zNC)0-o~WG`ke1A6;BCQ|rOeUEme-*t!-H$KpTe4Ef6(H{FbH00`n8YWj}cyza^e3-
zJI(0r9RREVJVW7SeG)RGRhctY!#nN7b~K!0sE%qb<wefn`E6bbF3Fjlqxpb$GCnqh
zgX}^tKU?1t6^YCzGO}zr1J^NQgD`a{=QU!mY77yo;egCGJwffv-qrGe6*@%SgdEK;
zn%l^=3Q`zOL5>MUs0pr6{`#J8x*TwMTJh^&CILrb^*En=Lah^<n<EVQD%Q-Vj&y}A
z5~$%<bBhbukcVgOn2JSsd6^z>E?iY`sKGmb4n$ARkVj!?JPM5#&e9vEGB1x^Faz0L
zhE9f#cbTDgS$el)o=M$@=$y_JC@_VEC9HIfr*x;N@4B8CP=-+@15Y<kv=0e5RphTW
zu=jHJnMdJ>X_>Z(K@W7mzu_m@b3Fz@ghMiV=J5xDqm|1cr946>a5E4A7L*3Vz{qC<
ztL^_P;%S1FIl}3sIy6)jWFC)K^po6RLtRpfHk!}pMOk1|@wS5@`_l&lJEBQsstCiu
zKW;(pO?B4~V^0xkbHtUe3NHNeFa}2=rtESdmfU=ix0jOWT2JhJIbrrr`uQt?;1>fx
zeEOjw=K{=X$}QZ7GxEXv%1<;@8T%7*Hsf)>+2Sp8_1bg*cmlF5`?EBrjvb-^am=ag
z)~2o>PXlU2#Zyp=9vv2yy<~D>)vKQx)S*O~Dd`J$kBlP?gfOdL_1UP=Hx*{?!i~*M
zs(}^>$XQ0<(8*06*`9q09YS7YmN~``AIKQWsh?eg_j6<)hKpv<>M>?0sG=KJdDxBx
z;C+(!A|vz@@`_?Th5R|7M4!yhn$^V|iGMXYSbX5Q^shWy3w_LAJ|WATm#ID>?^O4O
z5n>`ywnXhvhWt5b#Rbme{gM>`q51gCVuT8t2Bv)_+p-B=BXpuob9gC!teHB`!hTq8
z6eQyjKnOEMR4@BI|3xk-5wN>bO|vIRo9=*nFo5t1L?l}`uL8wmz2JYMHdldCN4>d~
z>JnA>3`&%d^7Enb+>yivyI|AcX5g0LUl|yB<MNp0-F@s^$g7-Uoxdqktp~QV*`3n$
zl@JyF#?b2xK)Wm@rQt0B-_lL+426z;1c0AUVVvxQwM0q)pv(AeE}hA&u%u?n)(W^Z
zeS#Nkh<eW%v^W(tR--a)uz9s0<-j^`eE59*Xc$#oFdM&A)(6EWNcB<s^gLh+VmV{A
zaasQ>#Z=kB_X^&mj<6k@0k*OqT~69wsrehuE+XN+$JE1yykX4d5ocZNT;t^zySGM^
zGiTYNSdI0GiXor6kZth@x=MWotCz+P$QA~zYTrBZ3&6aYoJtP(GUoik1;#ALyOg2@
z-y2s=2`YxLEQxT9Pa(r;kQv?g<10^)k0``i!y`-`wpdJc;f~9Z4ISf`Q#=_10>)sL
z3V1IM=6c_ew1Jt6J7fU2dGfYtYWPqbBvJNQ7|EXNzAwpC=8fzvOO}S*qReK@Z@h*~
z2!C65vcYM*x}}Q(?Afho>r1)=yGfnyIgF#Fz-0BXfBpG;RdNwhx<)~Ax<;iei@nxF
zC=n=+AI(ePB~&k1B)zTff+V2t3oQJZl#Tmaw<hcWEACFUgU^1^;JrNZ+(yfmnOR`f
ze$Sh&_r4pMb$WsNEeO3fluwcQyum5CswtpveY{I=MX<|76jhCS*?jHH2Y_s-1K2aE
zeel*&7PkSFbxs|B6APyX!b{53lKB+oJ8KWk#Ir2v2PdDpOLx|f)t#`HTeazjWnq~*
zz7xEF{slRc>Rs<|e+fOjNpLol?)Q9K{3NF)Eb|1J#_@QLRmqNjBSMM~>nSwRK3V-(
zdl}#usAJKb0`G1XB*H1sf`@&xJd3*Y$MSt<29sSwqUzL)+=%oITs_(LWGqfl@N@b1
zT%9Z*^sT!=EujE)`4k&IQ0waqshO{Il#QKUhCw@_&Qq_BjoIxh-v*(qk#`?tc5>m2
zk#t!WsNX`4^}L}v78su-k}lqIk)Q9@-n2IDon`rDIQinUHLo871G(rU_VuU0_uYw5
zTKY`*7kmKw2vs|WCl=OoC#X76)qBSSVnaTi{mS>8uc-SOns$+atVD_vs(mG&+EsJ*
zM6Bd8sz0sAydJ(mySsM;w-)w07;$_c4r;m9z>*$=&dY>d{G^u+sb56l)}U{Pg*LdH
z1HmNu%i40HUp_OZKV6VB@Ycz|Kdyayn;BY{(UT~A+NYnW>mg>l1xP{h6H_El{t?}X
zJhC_EWTrw4d?vROAZ>wZ$GX@Lnd5~s?R+r}0RG8Jp+@Q<n3I~>iMli@iXlJBPvnN|
zF*5<iZh<4-G<1D1+qqp`CN+r6Jgc>#M-zDaWJPS;s;_=n_H0Vb@&W18;H<VpLL>ZZ
zjwj>sDXqH{Qd(!g>Ij_ynkdbhd=r>h6fm(czps`^)PtAyf6N!LG4<^z?fF4ku|(x(
z7`oC4c`07Aj=X$q%Dtt;a0&>sPD@OcyRgV|6GF&=ow*(0ctp@@Jf9twG^-gW!=$te
z%r)o-ZzJVVKsQS9pZeDT!;bGb&T+gqENm~FjMBNbSBc}41_ggXsNf3>)IK?n{Y*UF
zxT5M_<u|4y@2K{g1XQo?1@jvjG8}7`R4*8Sy3qW`CLs#HX#B1-u-&EFqDUEKJ9N4O
z&xPZe7;?b(qIx?-By)<v!R7how}l6%r-$Ah%P=TD#o|a;iCq||J`xt|{dRJkI6MtF
z`UWMzF*r;FqgX195u&uzi1E)R0s*~{6WR}6LzDy!cRivv2qlQK=h9;l^1C0u>%a@r
z_}PaBb~=??|02Fj=QMcOQGromu<?F?rxgmzuAr7?2(VRfG79Hjyg0V))%Ms>-GW4K
z2yF2qZsK#0sI)8}ez6cRYRS~pm~<?`*j9KN2y}l(l9PdbR$;%<Eo1;o`CqVxHwb-<
zSc*k#aWd?!0k!;jJ${}wC{Wkep?!U{|I;L3#gt!|i!JY5yl}f22#FECik9<JXejjF
z)JdwPn6Ww?Y14I;Gx7C};{NWDtMGj~iv*LnV`gCC@Sl7B7>%x}kAc<pb$}NN0rDXV
z2!f7Q%FqYMr?tCtRwvVg^uo<OFwMB2%7Y*Xj6z+R<zyNmW-v|b+iR4#LtagEInANp
zEIFDVJvm`j_ALWTm-_%QKo?#tEmfm#HaHdC?!o3{9#!{7LqTTgIMlj)$6Fm{r3ai4
zKQ}h+M<4GSm{fnr2Qg9SC63bg*cHONN*wi_<Q0F(Y-P)UXL`JUWV7Hn8r|T{clP4&
zpwJ0;7O8wfZb&!b>!BMQYn_f(n|_Bp14Gwv%L@HQcsQ9x)eKzi?;2YSPixW!9<R5U
z6Ktm-lfDMszti~`4v7IZcRxQpcB1Tl%PWj=e|*yO`(WzCu4H%?4uvyag#8-j2Jp?6
zhW&rO!geLw;1)8GrJTB60GQM7Gky|eZ0y-$k`Fdr<4z31*{fhieopopbku66YXDI7
zZbAv7q1=AUv*};|<hg$9O4;QAck^ZJNSf$CcLfNHnKcFXSZT0)cya7AOGUD+RC9+o
zO=Lc)5#Htqj(%gZ_T>c0Cf$3FvS0}4EPMz`wwY|WzRxv*ls1pb&vHdjM8;|<H$Hkt
zaAG>V6Mq{sArTk9SVD~BCEpeUR}U-SCHNyml#uUQ2>#z>g<c?4VJ3^kLT1XCDK;H_
z$Dr!Bw@BQ_RT?Ffm63VbnqE{?G~?;S6pX2Q%YS@GI+e}C$}1^rSAf6%=*2NBFv%cw
z7|g&<(CG;AzjR|RrY_)FJh9z`F67UR(CSZ+de>^MhhTVQoX>ZxCV_-qg7Ui3Ma;e?
z??7--3XFFTyGG)QiV~StCb{^~i4`TxAUB`S(9ZMsC;ZGz2D3wq?s2Z%eXjRMhRE2M
z$$HX}zCprS&1^2jK7_z<$vju=Jlf*uODWw>Z+2;u7%)#Un5UjZ<JH)-15=(Fs7M>C
z#Q!1JJYLkm+~rWss(5k2+ng9g|6%Et2AtpFp~#Vo1CZti8)g*-J@1Xnw8a8n){+sb
zV7z{LojK7l;IVt~9+e}TglcbZzhMm_vy%sTJVkV_aR!Ma)0!g$#(9;X_GG~O+`pWl
z_1s0Qk3LegHRw3_en)R3o}TY&$CVRyOOgM!;r)9d44*Qs9>+h5;ue5>rvkpNNNE4a
zUV4Z91~%}?Zx_zt5MEXU@{>DvvB?^wO+Vdb{j<?ac)u_d;!@BQ59Aa1yW;uc*U?!Y
zi+t9KZV%!8g@p{Gnhb&Ju)JSM7UcAGdj^~Y!if~)K7bpKgTJ)%ph&-?h=m3D4$5xS
z5s#kiL`DH01PKdGJ23|@$js+27e_t6CBpYY=m`?OAKTGAG8RlMeUd;XlPd+gSLdg7
zZ+4YWHTEpTAf`;F*91pYwPaK6;Zv<0o~6cybTEN<j5F-CMO;bD*M)O6=wKlW{A21%
zF<kbUDimojzGeB^l<WrshL2*j>O+hW7;<eK@Z%V+m_q;<4&R<FF{hS9&mCF6eu4nz
z?E8SD=9AJ(C$gMI_0ej9Jk9EE0d}Y?md^}E#B5_eUZQGV&Q+^0Ilc?v!_+hgc+x-K
zJz0#Lx0G6;GIbu&J3=)(8HT{ox$150m=%Nff0!`~TzXWTR;on`1lIWgK6M=ChaDjs
zjDfh#1~z<a@Uj4asV~$`l#ieG-o=T;51Hx~*<$^4Du(>INO6BxRM--Hztx3D_0LY%
z2|3=Op|UOM$a|oX`8Vt*dsV&qgoFEaT?b|C37eFU)RIElBp9d*3aE>-6)ZHQO_^KK
zCWl40^XiF2V&Pl?R0vNRdqMas17*H^K&U0rY5Y5^is`EnKbapSTF9R>7e_7Hg!$-d
zb4FgTl`EIBQ3!82PjfO{^;JxEg_w|m%ol?Nf<wE$bbWSslTxd5%r9)n*~{O$8(t!b
zuBD>YUN9H;8$q?<d`ML8i6{~>7$jDI<31xJ!U3{os~tbJz@S!lT#l^{p`30f7MR0Z
zDhYT@=1C>JaZsFqshK`KwrjxAjauHnW^pJ6G7kF8GQR_7%wNeet9!+3c_qcqYqEl8
z6O+dtf-zpDWuG|`y!%|LJ-y8Ld)_(VrGQxE9!LrY+!r*2|1vch#ZlS0yvHD2isAZi
z>wVc&<nHH(#}?Fq1^~pjEu8`<RKdbg2WpV{GANXjLPL+1LNlt!`oXDVl_2|=31|g;
zp(u_8DBDE&UGwLY1+7XqJ5HU9AaxnDQ^VwTa9t_v)%$FcKWd_mqgERV0$uXi7y^1n
zy`;rXAsjpmzW$_Z^Cvz~1`C+H4|-WXVuYSE=KUrSisj?GyC=0KIgrmsL#WUlSIKn>
z@_A1EWd;F2{+xTA_fCPijigdYjwHfP`6w#FaN;(OGPv78M#i`;PW%oLSMlhR54(LA
zE5VpQl>P)#QVe1~Db}%krnOc<;bd%Aj!Fd)Zl!bkN|~Co!`=D_QNCl7gc<h%4oRmY
zuUnhlgO=$5lP_pFR}1%NU{uNrgC{oUpZ9it>h{!hI0YYb${&;zd>P{j(^G~V8H+8Q
zJucAwA?`YkJp@MZ8+PtAe3PC7G)g%*i*+1OfZU%B$o+Ahq=y@9UIUvv-?VTd)ji;m
zQoWnbb@T|kg3Kzl{vFXlY{R5u4adSs0~N`r(l@Mbp8&ek)noBLl2vT*ApTPlmncta
z*PKk?wR>$g8H0bPjf})Xfhi8U@fSP>0mD!?2juOMEL2UNK4je%@*Pb-!*TkA7-Sz`
z0P;j-cUqjoX(Guj=b^sSlz-yzg*br)8eU!O%aeWi42EfQ0J)7!yoxU%i^MNsHT{^W
zc+Q<D@>q`;g3STZUT|fphXN?9E_~rH5=n}IQCP8DiAQn%aY(QRq-30vu?7>pw44Ty
zJ9X8(xCeUhKHNQZ_E>D?Fe2X-F0uInV9D5+(|-h&18mSz^X3I*JMd`DqR?@t+u7eM
zKdTea6Fs~D^u$t@F6IJWjXG=NXNKd)eY$|UD#2%s;)QC^y$!Qu$MZ>5V>0mJluySX
zz|T<+2HrS&grWV{a=HJrT#Q`&hq@Tq{f{vGG7|q0hW`iyKx_YB+g&@5=HcbN|G@fp
z_wWsO;04B_JDC3XeivZ>Yx9zlSHaJw-5(r({;~=@GfP!nS|spgU2mga96LBkFvdZ7
zx_H#6CFs{!{s0;#)z2G-3Yh|Uk#WuOBr*Di8K{wPLB0nIsBLDEjsNKr02S_0Oof|1
z8hF9pkF$hFZfXz{dD&KgIB#Cb7S!K$K>c0$^^?)`B3@2zZh5YvnMH#tSu}dGO=!Pr
zTNLp@5P{g3nxDAg89nI&P#MGX>W+>#9Gu&Go@SLQ{KnM2k0R0?vz63KBCVf;{YigL
zO3TIUb5&zwV!b(^R?Pit`t|LLcMH?x3*kdk+i#_1Pd9X}=TDDsRCk9{_2s(0%5oIK
zlmP7H4MuD|Ih&>q_pCiCJURx3#;4B(-eEw1;nZNO6Uy&KEgh_ynvVd{`)hzm>MPq4
zk)!FhyvpDWR{&g|yN<d_rnA8!E`EbCaa^{7j<)9BGb}3)4;fyt3AisGAD_ID5tN!H
z7ox*#mnskGVB-<yzeW*STbY8ox0@%hxQ<Y!K2s+Upl;S`2*^V!9U=g#Nje)JjO(wD
z>;&01bsmmJI-O#vX1ioJvfC7AJ2bc5Ou}6vXS37V5*O5i3tre(-_Vm)HrylpE7w<i
z`CCPWzUj272kG`pL47V;w+)lZ)-eM}2Mb^xoKocnNWQZa7vDYV6o8}yw4)Uecj$=8
zvcz=_3~2wQE$4cQFjx$}?)<1_@;%G!g5;7GcZ8f{VP?meSP%$S*4A!ptE=QHWrl1@
zkGB(&p<dUiYkv_C(biHf1Ozhf=}GAW=sS&ivi_D`L3xmbqFq5Qxoj`1-PS?b<l`bw
z{kX$H#YGxg=3Hfvj6hs5lp?}}ox!(wNy$Ong?9`$rS1Xp-_h&^xQ`JaB2w}jvr6PT
z8&JamUnIL(0y5hPu})#2`{L8S2E?J{&P73XL~FCMg7dU@eu2}M4(`~e>{7+NI&EQ@
zhGqACcL`kpXqp>($&3WxOe<DD#tfW~&H$&&FpFd65x>Dn|MQ1_qrZfGrr26qTX37l
z-i^&ufgu{~;M_-l2M<p@P$dyPDL*e6(0g=|Wa%W-V+SA-RXqyY^loF40cX371r+Si
z+Pb>LC@Ryg7<gD5O6k6S{MCi;R6cT$@Q8@Xr`s;u4Qb@<yWn!HfTtqiGDI+$`q%JB
zh50eoVABn#ETuevRn_<#gPx6Ay3%`uk6M~A2WCr;D(dg&mTwH%M)>-lnIc#(f5pWD
zK%_+mJphsOil4FQFvm>H$1ZHTfpO-QdQbAN7r?)D@ImZY0GRag8AX>wjk@iZN7swf
zZ!{TGCuQw&SXei^MYG8=f_$gx=2K0RjdwGaNOr*|NOu0gQk7!fQa3}ISWZq>ZA>a>
z-l}r}gryGxR*e{owT5NmuM}(bJ!iILw;O2NYMdYOjNCJ5%S7VevO`c3oN2_w9=^3|
zgbzUVx`0?rxd7yY(seiNjQL6ib0@;Xn@2>~oiyi~i|6O(SM?*+igw-|32Ou<CeabE
z3-qP|S~~PGlrr&h@m%I96g~{$gg_uV1}Ze8^5DZPP4@_0$TT!!LRVfG@d`?+t(#+{
zC#F{(tep36telz0-CbjN`+$8SPk%3lBT}`xKVWoDi~LdqFlbr|e*1(Ej;hp!a$xay
zzGPdm?IhUeIlkiM&oi)bWJz*k`8bD23JBQf7<?OIt>(Ku5It<VItI;}cBI8AB;tsC
zzxjd4dbf}7Q)U((X!)^I0pmR8H~LIi3=|bz@DgoT4w@*(%4l`a7rW7DMXzNl3rp)w
z0mHys@1It8+*f8%rj1COT{$ZoGYABiBM7Z>7WEn>){9A_Hh=_N)WS|bpXd{$fO_Jd
z2FQqPwVM&4paS2YyWmlsKR-zkznxS*%{^>23=zJU>-YqD#lqzwC|05Q8N_ZgU_wg}
zuisq+6z{IYrwWj&O;fwUTASWE1(kL)w52v!v~E+7)n;bw&bGJUcJOIm5x#hdvr<(l
zt+l08K6h<l>Ap%H=-1%@E3ve<zd((1q}X-WNuMBx-|C)0&2h}n-^fj{Ri)+)7-ng?
z2U4o<qAoT0LtkaS%$rhWEG~t9j;(*no`|F@Z13xE$i=v?vPyxLz|nLiG@B$9c-g(j
zy5<vPSbz|dgio~Xc6j+1o$cF!t)Y84YEO`qFN8+lf=m$?9^|-m+bsp;mGs-<yn~^=
zyq~P;#OL)}*1kwVi%KU7y~Vk&Q!t}|Oe2w7?}@?wLGAt;&S_w65ZUIZE@IbX3Tn`7
zt<w>s>4N*0AuvQrUkX*;>KxQIbczk4Ow`<>5>06z*zoClxf#V1WL#Q?Xt15hqbuOT
zn}1;sZ*%{c7xiMc-CGlE>apGNn{FjUxuq!V`v6zuMTA8b0@(80z(T+itZF4%yK8)P
zHP@WX_Otu!z7{-oQ7Jc}=ozJkl{(hW259m8Rn9sJxS2zxsx84&(1?0e4aQ&wC4q$(
zitExO7bJHMd=|d8fupD>EG)K8GjbXN^9a>+#2IUxQSkYf_UE~tK~Lf(@FoTHVx<TO
zvR|>I2`F@w5ZjUNPl0kWe@>ot0Sv2~hu^bRGew|{OvBW5;b^~1Mm27lUG0{UNowm0
zr;ViEe*~NRz_D-}6!1VIL0gN(&zm27%Dnn)AD0nmw~Rb7s=LRm`Aow=i>TOqg;HGN
zeGG*2m}J$tsN0eg&>9{diupy~MuCMBKql!j+d06*EGM>sGL-da@^+HFO=kMbMayNi
zFj=ri`{W%1P+jMe3=L8R;_$SXk1h+W!KH$87Vh$hrK%(SO06dU>!ns}&keM?sH?a4
z6|f%8tB_hL1{Ofe>o>v6_^x6!?EClKSP@`4AKvsuZXh-~y1I07L-z>Y#vHtTGr1=l
zK2smg!Oi^wA3vfQeoh-Ujc;MQ82G`W|L!|5-&4x2+DC*iHz{Hl!b0pZAx=yW1z`7Q
ze6SaRxpYxtY8`m1KvSaUa)|ntJ{)&Cra~9xap*55=s0%ee1p<RN#ELv8$%7I%tw1H
zBHU7TVI<f-=0I3w#ubqKAg`c>yWa04EOMQ-)-+i?y66&+^ksOC>+{!~$(R|nTvB2&
z`N%X*aSB<6->I>(5pu9C{!?HDme%2<9=^jOR~_E^X*ibPMaIU5M@Gs=>c8W3czdWD
zK&r(1&8zT`LYVnCa&pk*8*!vMKkcDht{jz@DbXfBGS-`tHPtLc3nm#8>QFENKf?m7
zg_+Fl5KU8@tMl<YyS)xHQ+wkTk|AT`wUvGyJp-&~Tt}CGiun7I6JmT!?}z-N`=e9Z
zl_s8M;o2q0@B3@5;wnzolBwVAX}zVQfTX3A><~qZV(6N`_lPBRYVvE&>?(ogs<pmz
z-a4i#VU0O`qsD)M1gD(@<UohtT_Te!1B}Sm$Cj8<u|v~9GeK5XHkGkE2Y3xp!Gg`J
zBSHMC$QmsHNF&HLa;DZg{=y^nz=H)yM@l>ZCR?=UX8#l9(gVK`&?N-0faRG>7%adA
zzJf?lc-<Zf43NrQc_DK*(|e~$V|n6@XIicCceIj`i4C#XH#$Cpr6{?-h-AP)Vvxi4
zQEY%5Fvmi1x{?Is0dg>b6QQVNL|q@=1_qy7?9`)yzF}6n#R{L+$)t5Ki;_xaBqsZ9
zfCMvXvxk=3lj|T-LC$_CjgncZ2<-1sPkbM<w|6vP_D}{*A{W3V1%wK#PLtu`lPFw@
zTw@#E{<-=2i3Lu&j^H$Bi{97#HQ>7xIyxzSQsjVHpe_#@RTGFocRSt1i&sTfhV?!@
zx?{-H3)V-I4zE$C+vsX8ejRYeHCiep5jfzE9!F@1S?{yzi{NQ9j^babK~);?j{<uY
zqb$tYfZ8})ev#|MDDKdP*(S*9r+^Iz&ewf>g#idp-jwSy8|66+x|b9q@&y}G4xs1#
zTi;P&3JyMZOcV&;VsI<Ie<}zP&SCoFskMgk%v9Qm^uayG;8^9az-ag`{1j^LYfu1f
z@b>ma+fWV12LPK3oLSJwi|{AR04jXaKfHnwi4n0(@w0$>tN)UExlWv%(P-$F%5zky
z)*@6N#!5=MqaLr1SI|Ca%8Pi@#M$)FMxN??gbAZp*}1tnl(t}jqN1a8LG83VBppnw
z#m`8}@XI}=HhwW6x4REyDbxhn@}3Cg=2*mET$(M!DqXwf5`8-)QGhgtInvFOjq6q|
zN)2$P<lL{I#1hc1pqo-o<q)%6{(ni(3|%7%M^pO<1Cp|Hm;1G-lT+E}*~Q!*y4{qi
zH#2eKf|;}Y$n=BqgU$k}OpM<z#aR!MDhCseZ=?u<*aeV2K>dsm=+he>wI)T)&G^fn
zZXDdpFM5$7Z28_Rnoq#EXCYvEEJpLHlc`fjxf-IT+zN3sJUpUVRFkHqOauI<)e=zx
zZ!J{x@bI{dtHpEvaAEK51l9Q#QHS#_WyX%FHW7E@FH+33OxUUn+Xknkm^KI$D8#x>
z!=nn5@L*Pmp;`XQY$03J*7hEJEJ|Nb3)HGx?J5oso%8I6R}idOwRfc@bmFcT1q5iW
zp*c1X?d2?QTy)#Go2RNIryQmbDE+AdR8gsgd6h(B)&~BXc&fZsE_{37vdHc0sh4}_
zXicY^t8k|_BAX_`Pq%=HW@MWV{kB(7^L$(RCN=NWj(N9N5br(JjuZkQ(3gURE}sKG
z6L{)62y4(9@1&QF+xHd_oz6Dl@dsOQhtVH5h3$TL)AAMh2hoNX7CQCuW#1Es+v(r0
z9tla6+_uO~@RFVx|5#Y_qCtLps%qr2<j!o+#7s`2gYnGAQ*<<M5~rYtyAIW_T@7lb
z4xsg3OPh|94MC6J#5`8skyv>Of_7N6`1FY5=%wu*uietYibES=yBTj+Qu@X!KQq&m
zwVtv{rw#scj{&EW(G`_&|AW@$s6)>wGZ;4|ZTvf)!ozF8H!|Bs9Ui#Mynp@rQp9ka
z#F~e_lmNV!%?vJ~cxmmqY!k($eHROO&b-kx+4}m4x@g<C^asX4w8Cx=PM@J`@KT|r
zp$`i%UC=JF4$CxyhrzY+C)>|>y%qbOa7JZlxu;x*q>xtH4jrz*6PON!3#w%9h&u(F
zbLjDTv1j?wvp%hAci!B#kpLP^?R!{h3(RF;P|E{4gQ4raVfsVpWig>kK0J6-R1wCW
zHToB{^%XN&_F6y<atT=G0Pr#vi-|9V!^6W5%liDKn1Cr|`S5z>F32<pnnn8}$0_Oo
z)O&{!)buK6B#}{JMxXZH*i3JT`zY#X-u#wjnQrX-;a8y>k8iQ0%G~x%3@a3&_+|y4
z4c_ctQpGW${t+7)%UdNUWG_+<wK&Bd-y@aa2a8s!R;uFr_V%q3u8z^T^n6Ml$5f)-
z-QJGn6oC!Iq}OcX&FsL<)x(=ptB8m*Un1vqv$pS0ye6@-;$v(wHR|c_h&<!skG4sm
z+xK*S*f_m)ZjI)pPbK^ri`a-|utt^tcAwj0fr!{5e6>_FR%16A-<1QDE@?~AyJ~kU
zD_Ebz-fQQ{9Dw-CI!XpTJap#@#<oVVDXt1;l@;#IqlA%Om%H_wGDlKU>hDzTS?^b9
z6MlhWF&ArLKTnm$)Lp1eCP<Sxi+ARV%Auaw(@=d>8GXLC#HP=gT@l$c2cz{_A>5vm
zB5l(Mr$>!NRZePs<6b*?0~7R>dwAO&uquw)djF<NWvlX}6^oufq$eU(N>ue8&62dV
zMZ~hl2W}jMB+5=8^$*W)_t*|IjFfHcPEBhb9(s5Umu$UB6&ri9*TYP|Nw~IVyd59$
zFxG%Fc9zEb(oT~9dH7hMM-{K_W#nGoVPj~SXqmCy{Ai=@{8D`0BJFm4o4ftcL4oL{
z)t~;TA@!A&dA$|t?Zdb=0?ME@hw3)Z6-U>V_=>Kk1Z3d$y6gdT=}>!1yCAE>mqJZ#
zwU>lme>Pjat!gYRD`Hyr(Mq}pJH5HwE>h54UBXtcYUD8Mu(@j1VRCJ9X=`hvsWWc<
zfoqK;cZ>hICOVq+5?Qgy_R6d*Sow^}>L<m+UgwC2g9eg`K>fqUHP@iW6GoHil3rd7
z<NRN});LERy==?JqDOcn<D0|9oE9lKTR2yL%1SE7IgaH`mbC5dM|p6!TPar+9X18@
zG&y_y5MNu{Y7l&ZqO;AZ7cGou=5`rgo7_IH&*aO}tYx`7#JV>;E4ULbVmf(XCOOXJ
z+GI7H?{Iz#7r0GQ@4Bl_AYv)V<6;c3G_`3j51G3CzFPop9u`=bA~lT?x3I9#+@z1=
z^Qj6YQOoccZW{NISS!j8?C0PaH*u%^l_Cfh0|srS`w^&o-sdPUeY|DESWa!rIm0P|
z`Msv-2*?lGUdb0OPREYSd9mRm&3$8jUYMP}dL6t+e0;a%%*e1;2&zUI?lqY*zD_f9
zH709u!^!q^K9g^tcCEc<o&HQwSEk>){=3CWz7g^o&s3x<O5JQ@qIVF^r{6Aie3@6~
ztY`HXf0oyzJX{;PQ>t3aBi$9MmdI;Zw`|tgQ>z*6v?F}QD+A@^>b@SFwWg4HE)$76
zzjc9>7*=K>SJ48Q6765#pc}q+vo}shU5I!<fxky;?dL>}D(Z}GKtZaNQM;h$-M9-O
zFDUBSNzKq}(F9JHzmJ5dhZ1jNgSL&E7N{hEoZj$ti-#1B&OM9Jd8?n+rNYS9wZ1Wr
z+HzDl=xrL_X4(Ea;@-UGS}`Q<Fmt$hUi_diemN|nYDvXp`Ebv<eR_YPi)>Jo`*B(M
z&u#A4{7L-$;#cVRdihrqRCKI{_s%YaD!*)5lK?l<!t@R*_Y^X|#5r5U`=R>@%8ck%
zx3@}*7WS7^u5I>}_Z`-w^gO<Vt(tkQHok;E79RDNJV+4Rxp?p?sej4Y_NOyN|L|h+
ztIqnF^jMnZiXCU3)OZg2Y2W2-64x)U^b40XNlmMkePNCKUK@sMBW-ApJ(K_n$y#+7
zyBzj-@yFqf@zR>i-u8-$5!k4jO2zk<h^A;gkG_}C@*y<Vq}Snhv*FVMvf}e;=Nl36
zJGa`$4_B-XFGuJer0l&+x^w17&YI^|NtO;`dw1<7ls;7*@zK-rH9mCYpt7lDE?qX=
zQqgPJvw=kK?V+cJHDzBnXY5qy^>P9qy&Zq<kRTm|lDg4%<6k+y7nls-yZcnpUq8Qa
z6&6`ItZLhR9M!VC5%r4yqDwsLe#yvFbN<iN##V5fV9w~hLuaetN};3X1Ca8fUPb_<
zqG#)tCk;Rq9m4M6Igm*SYnU3f<oBr^UQ(JG4-yq)d_coMODAc0@J(<mE$bn{Y<<$M
zZu>pS16TLe;%(_B;~W<0zSJt?9=mA#9KMCAIcN*w+@n@dS0685;=3RyVBfVj)_lm_
z{DgYWwUpN$ChH|3r>i9T%u)9g%u+*L8cD53>e#7Titmd+jPeLrx3T%bAE!*Bx7LHw
zOB=U{D86>@8rsmo#iv?GJdl-J6gs48KksToU~L+9+?ar@eaEj)qz2s>Rd5Pr8NAYH
zl@-pORnp%>>>g%z<%3UK)giL&g<rvk!SyN{iNl~nhUM~AVqy0QJ7e8hSx+l({<-bj
z0@$5AHRz5~E_|5RLDgZX{uL<f6{(|@we{Pc%02Y<sJTX!s6A(~oBKp@`J7T#xL4(v
zm0`!!KnEI*NFM$OOF38>j{j;kvg5Yh4wpQQI9<xLVJ3NC;rb2tQgOQO6C_gT;bTB<
z0ZWmWzl#9;@WY=o8LwYI);GUHfb^;m-daGZS2dAXon=iqKk?(+gV8A`89r1s?)Tf6
zz6+n*801|9l3f^-DGEGy|2+a$nVTT=iL^eAvSf2K=IA9R*jf49$Fl!*yipqfU0o05
zS~0XWb+eTqBV$%HYC?$DNof83{j`G(=DJ<C!rQAW-;;MvIeMM-McV5*mqsl=*A(VE
z?_k%V5)d7wmDHA@ptDF^&Gn2OF&P$$%#b;++(SJx7nRA0_Tu9#oX?ucw(cq7*baKz
z)iXKhzJa_=X{En48-48&{}22;Vx$cOwstDv@JtQ*o4iH#Q(!61@=z_Y6l;~R6%eBi
zM(C>Ep08NF@&WWT7Hn*;H}+ILsu25eP{uTSOY&gnO@zeA*0rLW1fdPatMu^wO~G=0
za|(X(pixT;&xj|;ojf#}9;oezzMh3drfKDRQo8$85cf9o_D=$dvyH6U#piVPd%VhS
z>e=@pCwhP6T*Fh0M<uk;G;hi15{bTCj7J?#?`>^;M4cfO)IX?m{z{{_UD{d8TI?3Z
z)GZ2HUM5rW*Z>BTNz+~{JVPJNYx_X|2Y=v{wG6)CW9_eBV6~~ID|bhewwFH|kg&(V
zp%-l}Pc4U5J$W7fy9c}jQwSQ?0-X;3(7Ir2k}F(HefhH5yN$YoyyS$0v>(|E@Nc7*
z!9h6O0>MhS({d@53B79bn@UPS)3w&~anD`+@$q++T-1H<qTuo*s5;l7mPkryP!Qcq
z&da(>{T)Bj^?cD82IC6F4i>H;XLtJRlLKk0+U_BK1~{j#`o>eZeI<`|PhpI<*4uGr
ze`CYzJM+w-Lz-r%aOyCCc-3}w%7;#!ptYw}(jo|yJ~BUSw)&5zR}^T9@?x5>x+PI}
z?9^eF?j3pD!R;$K8@R--D$ZsR?&D2@8QQT~{WgAqqz!p-hqT+XZ8pflt0U9%vO4;^
z2WR}w&a4f&QnG?*HDFo+jB&wpn?~<y{QjqD1r?UhW?U6N&u(}5AC}Hh=@Oyl=32Nt
zTAChi$JXF3J@(q3g4yudRxY6WolS7#f3CAmZY&o!yEis;G!BIfdTnWE1vlw!?6?nr
zR2n0ym#qf<@;2=#IPankyGCgqvqc-lXA9jre->^9f18KjkFzm7nZ$ssrs^Nc%^Bi|
z8C_h~f96>HyNQMYlVW@CP}2%JVL_+OAP7I_oc15mi32x2C_n&16sYSW_`epqj_R~|
zog+D`gXZb@_G3u>@S!&B85(U^VQrX^JDVJTzka5^aBCyR1ey!Kig+Hj8w%crvsS9z
z%=wN|ZK)w^!CcW0VWO)0g?DD^R&g$4=jGZ&0uzZ(VSGJ178hKkY7bJO-8#GF5%s-P
zFydM#lct?g+DpQ0!j3dO-MztKo)mhqQPdRs&R^SPKq-a_*ghFr@<6b7JKAw`Q2a2N
zEcQk2dahZy4(7$NQSZIB+Rc1CBJ1h0cBYwzKn3Nl2d@(GH`7_=C|O$)MZ&NB*lu&J
zyR#Y@<k6T>II&2Y;v-7Da{CD~`8wc8<;tpHlmFpPVlwO5nj7)EKg}jw&+F=_H*rB=
zhm&>lEyS(dJd)8rNxC24u6>`blEdI)Sm)<-$1G4gT0O8rX%%qK5qLSa=r@qWZMido
zKI2C#pbd@6*)Yo&gw1puQCo~7C0@6v91n(7+k?|09PyEd4>Ip3#>6%?9MskvKn1_`
zT+^jn**le8TzpyW2FaB3yrOHZj*TW&OSIa0;qcyRu~6adWIZ>@fp^yv`s?=g?>iQG
z95yd}xEn?3cAm=7l=1ZykTo`0b2P31@wf6&w_+KQKu=Fkp9E#y^i3)KSDkqzxy9xv
z_?pM9EZ6<BYQvupnMF!d{WezcuOn{e0^QP&PVb1c1nEv2=*5?)IhtF4Y->xb8JtsS
zS<F;Yu97f%mYmlKwxgo<*};Dl)2aV363Af_@xwJckf%llX4ar}Z0-e~9-%Zx<C7A{
z7TBi>VmUqt9!(cOvFk(2T=&^#wfvzZYYzrO$I#uMxaMtv<ftzQp~_71zNc1lQBfuC
zUik9<yfQz#h88_)VZii>Pi;zF=S^3f_?{SeQ&pj_fH&Nt#1c-zId6H7RX?IVD_?6S
z&kkv;VQy)Cy$V8ibz$`pC@%7XyMF#jXoP%`k1IWpVw;~>8xMSU+0SrHFb^NLZZ%rz
zAIzm|i#x18U-10C{Dr!llYfR)Y-eSa`|wBG)ESk?`~DgQ@uQZr4#i|TbaeD#&R(Mx
z$*kn<H=+e>-o$$>3(PJM9@tkD0v)29e5LnecZ%6}d_UIbKzXiA|1eN&!lz0Nu~E5>
z=5C^|`2I}2XuQbB&kuil)eIFnz1QyOQE^ePMbZJy?^!nf6O;7@=Mui@0^h&X-CFyV
zpCP@5t7@PyPo((+bNjxtQ?OK~-<8K@xu(}&npSnLxbKx~#yUB;-ArkY7zwi^iRCk+
zS!Jvepm-S2p}H&TVBNnb_;zcjkWcWd-|)t(h8UhTx{J{pd}gGJPWgiJ&Su?DU0Oyw
zWlV|Hw%n07zbesu*e@H+zSxsb^nGXOQGp?;NO(Vsa&xpw?)sr9!b53$h)-^z$9c`K
z(EV%i1AXcrG4G-x<ZlGIQYdfcS^QLk886L!jpA{%V3vgA3p+V28CPp%4Y+^nHe#OY
z;E$*3Ws9BKK?j#ea1{oqv^M=rs-m{->#~usK;8EJB4QYS15jX`lk%Th*EXOm+8~Gz
zt)F<RImG!j1&MDnm_4+X=IM(pUHyo^n?AIDeu;XneX|i>K&Tf^qmoj|SS4cQ;jwKW
zVa41!Z8_G{-EZPa#G~pIC7|y-9$GuKA*kiFSK!vMJpXu72z~}8AYj^3_F;eDuEN0+
zJ=}wiM^Mf%&=gLh({niU#Uu<5bYo6$E<a2Nu(a{r8vv&cazR7hKS^3KXd%yp=bEf(
zI@D)*sk^F@)3y(Hvs4|-W+fqS{A`rpY41^SUFw{aJXk9uf6b#2y6ieoHbI)@uA3cd
zB=HI$06S38K2v_kRkAq!SW$%m!0w%X!6wm>pPSVcy|g;w%Y%;_YHI!O3MK6bIuc;J
z{aikXbKkWR#1r0F7j|B*(sq&@Gvt-HZttca<E*8vW#U#hLIWj2`KdAfO25Cv14QOz
zyY)y~h>tJqjN#7WP2Xp};Ob*-O~($%G}T>iW$9pQIdqk+#nk+|$J#WL2Upd|V9x-X
zAZZn8P-~Q6zyGcbHEF}fmVj*G{p1mYT))%&?@AnKL?p&VlVC#n(}JQ^@ARJ)X1C2R
zZf3@YJflY>_l~?n`yp2FCAA%)S-Y#)ouFRmnE8`rer~dCZNWxTx`7^vZRtU}+o$lX
z6_Gre5Mr@bR5~Z=p)}nI|Aed<Y6<ZOViPd)h`n@U)3EubZxN^=-Kib45+t>!7u5GG
zr1RCyn3^MKPB0=u)oFt^>lL@oXgaXf#gD!eiNN7y-W9-y@teDVfN_~#mH38DYhhFv
zZqd0*(DDr$hK%0#^|)G511)EWqMI&N<i8C~7%RJCW&`in(iUkhGZyUQOL}7@uV7a&
z0r8NyH(QD{Eij6gCUXDjH=NmF4E0_w>$`+n7md#jvW3s`Wz7fpM13g~)8;Si&qd{D
z9CDQw!g+05zjnzMb@*Cc`cemM)jQ%{a8A3J`k5sk98{_ns9|;mt8yPCzuRW*Cy5=F
zMBp#Yc+i*LA4Y6E#)+r@@}e&#W6-U0YqDs`Bc3hlOo0+`WWw+>sPId!Vr|wVg}R>G
zwTDE5ku5do>QLg9&jVX~w^}cWiK@OT(NT`GYY(05rr(FXU$a7VDC+%qxIKgJ=}zDM
zysl`+e?8fl38efzNFPurSi>!NkPi#5xKZ9D6|y9=@5*>TD>yN;@u~eQJe6pBBQjW@
zg~A4_sDE^>eavDl4PH}QTKXYFkJWO<S?vs|giOwC%p)65K~mm1%a}=l^S(&xby^V#
z_<_Iz_gC%KoAI5LG6bLkQjwX{k)SS~wLKoP(zl18+MLg?&-gyrGxYG&ikY9B-NtLY
zt!5flUY3O{ed`>M-N2mDI_jpizH}OZ7jzD1u}BpUdo42oQmg%eFO2%^YAO0!alhFu
zWD85VmW`-{TXuR7X^(ROmBjawVRza@*DB;T+Y8~m^zjT=XKRFHFTgWbcF21RZ6Poi
z>|+N)P{gw<V~^Y&9g<RKx|YMDxkeI;zb0)beGrS@@lEr~KJQ4fO?hVnq1V#g*Uk;%
zx5{Wcah)`FJ=5r@WPo`h{bbfoZ@R6u&U`7KZ(ewjUTJ$Rr7-noEyJ>3ec|4uMnER&
zhsQ*(?skvrw%#?#=)<k*r<EH8X-L!gXr}OHem<*Vp0i&ps~|A;9+2Gyy&i<Jpadoq
zXrF(UueiTskV(aJkYfD8_jCz~A1I`;UDIf~hvy|7mxenIAnm;A__Ft$&X8L-)b)q0
zq@2@|5X>pg(dM8kajAToYx@iLA<Sm4yDIV!id-UnuHv>pF}cI-j*d_n8$H|`J2N5Q
z=Bl7>^v$4GE#Advp|?_6U>zR(`1Bxi(f)z}z`&a?Q5qK>spTCOkBzj{3#0U}UNMip
z7XwUUe)@b3`t|ny*V;>~swEMc;t%x8%p%cYLA2sb&chz5+i~lhB~9gl$f3$qdW*yN
z{t(N$jnTP%uX#_0s<mbI>8RxZ(N+o8s@$}w;hk~%#<=(eBIDfEBul8x!K)xo)!~C-
zXOuP9w|&xmnu%EzPpyNUzH<A}?XR78gdeSE4|>)wt_Ii+UD&ZiL14IH7DMvDqlRSH
zssoRTg0^-RZ!ov)dv^V7^y4@08|i%L={1~xt+!zH0&JQ4U68z_%ld84$sVDp_s9kt
z-WoaG4Ze)bsL?t5yiXZ^*vP(}$J$9l8KrJLHxIpVJ1DskXf#_PuB`G`0LQXY3M54F
zMcEI;Ym-OQ@$>l0FKsG(vNEiIc=mv6V{=+>!eTeHRk9Z6?WwDWt)WcaR`)?WjVu1a
zH0V)4yKv+EcP6V40^{!$Fp<D<{r*`_eT<z{XI7TNs=8?&`U*_qCje)oCyS1Z<vYyr
z_&m=CrAs}%m^sujJRE%{G1JZAi*MSj{aOf9Jx;}qg5iu0MLAxNCHC?^$j>jewzZu@
z=!AzFDpcWiV`(MNE5ee{b|xh)b@R%#$^QOJe6^d0T*{=^o!`wX`69y#2RlB*2wkWC
zY19S|z-y;_!D_>Hv^sknqqjSj>An<Rp|I&%P6*vzPB@r{nctX^?KjdU<M5#A+I*Te
z|MPQB2kB#%sfj8A@$G8Mv|2|N4b&k%s4(ge2-KhpnC9szbaZV$#r>{YQ{O>?diuTB
zUlgMyw_7ijEN@p$PJa7PUreoo4r=u5L~@5t>#h&J8B-*!t~iWBPA;Q%cRx68<*NC{
zN;}i?+BREnIQ*P7TA!ZR4RXsKtXvN4+}#^=t@c>vrZ4_}&2_z&UVW91G@)WfojZ(v
zp`>8q`ed9-kM@Di@J};aHfOn(_|DOlk~5Xg?e?eW>01fVFC{b|nmHC~mX<Yn4JP@q
zRc)Yc!_CK<mrU2LXL}YQvx@H@EU4(sZsmWdF9St$kX}*buDs3lcyfMn(9!8!Y;^a2
z)8T5Ed+|zj0`8rlm0YzdS)G-srV859r3)}$WYFU-qe;#z*HE!l!ypa8)K91P<5mi{
z$`jKmRp@tuN5ZsGhfWFdZAEJ&Yq@JR(@o!U7~7^Z#DD0CI=!q6Uk|{e_U0<Ikn9<8
z@hzX!wGG`T*g7xzc}wC6va;c294HjBk%;PIj=eubiv_t}FS_g;6?8YtsT0cz_PBd5
z_QUL>Vr0L7mFvNRPHVaR#O)b&RcKTw*PPI(p?aIb;<>mp)H<ZA<m=BQV8d}nPvS@;
zcigdD-0JjI!ON6O(<)|U3$hk!m-q43>{p%Xet5MwN2=Qs>|FEWjc2b>Cv~^<cDAW3
z6|8pK=m~?BHE;Rz2<{&sW@a96ID*SZplgmfdTpR@HRHoB9JIj|`Tck4AWJ$Oa7<>p
zS(ZUXIUq93fU2CdwE5mm9JnDqA%A`<vO?e;n(RhoT_}<<DohCxrbhaKO5$un3vH+F
z7;}k#;0T2|o|vwDR@N5BTGMmui)lAhI5}FIJ`#PMBhK(FLIsjeF<)ss9BZ+Swx{#r
zP1>dz83GyUcUXoI%WK_n2IK#Wu<wj&s%y7>UmF5aEPw(^2MtY>B3)2=lM+G+ARq#v
zhAK5GQUnAALNC%Gfgm6dy3%_Oy@no2q<3;R-}$~f&ba42<NjwbcJ_MKeC9LfTx+}M
z{%$S)>+j0%ECCp{PCz>z8PM~cd~IsXBxYaqZgTuG^ag}*AZ(&grDIU_7-C{>AgfdN
zr#9!u%$frv*GnVmeZdUXM2Cf(Lu4XOe{ZIPH3{Q8X{Ud%f9s*(PsEdT#It%vJ9D!>
zV;~{12$*C*TFV(w#DeDUD)9pCfOo{Z8Fx@SFTI@@cV^fwcBe1}IG^hOT%dkCw5(cM
z_PoD>q~^9KFFPUTSf`zO7R+!WzPMYA03@eQ9KzqK{rT|f<?j1bhbDV-G;Jp`@3M)s
z)@Dv=lVzT1M?Zu9=nEQ&m*){lKwM@)^6n`RD2%;GKBnLJGK)gA>=50Zj>ebk*(WL-
z4%|wvQ43-ZZMWAX&q&kHCEqRS3d9Kd9aE+r8~J>-`;Cj(_o&=-s{d+s(`N%3DxI2?
z7OiG_eCg;|W9H$$TeF|E$&|}s-1&=Uv(pau?FL9)mc>anbssVE*y(wB`vh?!CntB|
zOI*Ez%-)e!9Bg36{~}V=@jw~Ky3uF>w=y{cw=!L2Tsv>%>EhWsqM?f=s6%+{#n3^7
z)&MaPdc?d!zN^D%QF?b{YtCg-k7T&`ifXoW%JezYcPK&*2n_VpTxeV`F|(BVEAd82
zOmD)-QwbjO8r`UPfV@b+W`(*o4&x0~hJBBw%2ROP%)CkmyZ~(=iBUwIc>|Pfm(q2t
z<gy>z)Aw<M@wtr6#|m$zk(`+cVf8{@@S6LA^@Px<l|M1P->p3BUnXV7KNa;yfR)CK
z+3G|1Dpo^dc}QkX-Gtb;3eTx11^D?FU!WM9`diH%<z(t)!v9JSQmC%J_7al9SGEcj
znarO1RhP=YM1~q5UP*q6{zM&lNaCu&bUo`6i>K+1WmGCYV{{q(krXt2YR?#Pe`RKA
z`Ho$LhP<=L`kFwSom`QZ-_+HyU7x1nxwE<#gH;)S44FKSHwVg`t@@t-=~^e>2}^CP
z^V_{*f-9T&1UYjY)u*SlkhGf~O`k~$uxB*dAWp%i;p?(DN^GY49!q&YCM|`r`Z4qX
zDbTME{Q!#lld2a8-a3mwdmkDDwxeN%J|Ny6oo7PKcm=C=1CeBvOCck58++TIwGb}d
zrcN~VhZQ7N2I-B2X=)kwq3G0|J4c%|b<1na(ueLv?=)m$77v<;zC?O2!cOYk2~GQm
zAAxeaAlG!ILXtOv2YdX&Yxn5`Vm19t?c9vjL4fCpgp;p@yy&##Xm4_0gvS)IVsXu^
zYPzPqqUcBGU?B#3{9Z|_%@_2ceg<hXU&UC4QN91h^$~V_Vv1t~v1PX{S^Z$$4n;{x
zx!sm4qqu+Gi#U-ea{iM}s#Ws#=^&YwINQ(ZpPT^NxPa8IyKy%~RaL{fng9BWx?^J>
zKzc7@|NQ_^_Lo`==`Vb_9}nlKRbCjhD!y%S*wwSEQZ)}Fe+&yL&dz45H!|nEA2^hU
zq44f2_z7zq9+|SIC(k?m?7G;($caU5*uJY6cUWv~Op+z<NFi(KCL+!P&4G;Un_$B-
zFiG+Da1Ofgm`YOA`sovFW#b?%^g4z*vL`-Gynzz!^HGSbtV}quz6^O@T|VNm>pfs6
ziNRSwBGl^B%HA-&d6PU#P>mCw;Q{jcd%y_wKl1ulsW9Gl($krYj9rpv>LDdPr)g>Y
z$_7qWC&!l)g92(WHn|^EsN!QMg!8gKaMc@&pg+LAzOy-WoI%(#uS~qvZ_htZ$?;z{
z+StO7K^p5eg<qmrl<HpBc@aQ0o!mB?R)a{bfGhJ94rFH!eqKnCXeiyW%OmL6z@)i9
zd3pY0x0wpL`XUi)<DK8$_4h4|4f#Sg;I|*7r0kHCT+Te5Uy!~pBP+tbnAX!UKjlS`
znbbliII%|R9(zC+L`%QBlL8Q}75hfV1b|fc8(oDI0b#lY5@|k8|H12T9J`i_#GSsA
z_62eh!rAXX0xWwW{fzrXjJYvY@7S^`EX_*a=$@3Z|NdE;x2cM=gCt^mJg#%b<lw;0
zGtTdHh(|`@{D@cw-M?#`24s^po!yrsTo+Ho{6}i!1V?#tYtCwkG4+QlWPWC$fD`;=
zJ1PA+V#t#Vi{j-b<rez^B!xJkq=j9T6zc?R$2%*~dbSmovt1>i{-i};nbjiz*LWxG
zwEFony{7kETAe}NVXqlTY8TjUI5ETi+rVcYtju%6fXUaSAhAejts~L%e)6CDpj}*h
zet>&+YwS`>w4DC!ze;VdHY6X7ZdKE0wBToPj(xtuUZv#iSEo(^KzeAjp^BE!?@l04
zM30-AOUl6XCHC&^54wsu*hEv8dOO{n05~u6W3=1x)TwV*?FO)|MSjwM=>1rUX+X>E
z!$hgZ?PlxrjcY4^#R*HVSz0!OSqviXs{*#cN1(s|58Hr(k#T3(yGF_3G4B^|sz?m8
zVc&a5I@Q@-CzE?Z1sa#Lj{E!kD<131ro=P%6j7|@63d4LcF4Z}Et_iqF961lA4Sz=
z3jJ%ZUKCVq;~O%_O9_6ZPK){uSe=PPvv`p?>=|#;o*TlFG?roRE}O(Vr%J`;v_9kL
zuX6V^?y4MwVBb~$_pH5a!I5Qgq59H@e&c*_#CerVqe8^WW8MtU@)KhXl=4$<=u`IF
zJP`~&9fLqoArt<oN3&zS({_4#i<0xum}^thyUR}B>|~E_&g9mw2O`)<YI=QaHWiAz
z^L>HUTd8KDva)@~yCUjlue^EiXC@X%0rhIUd2;V)Ps=e*gDIfiywla1jYZiRmoiJ3
zA>o!6@YXUsf9M`R5d}?bA|j5)MoARPWC(Z#5p3%I9T<Gf{^O{=HkQ^7*k{BZ9RD?&
z@}Ii^s{Q7iWCVNtk4vS}_G3M3HDq=_+ex#SJ$nU-IU^F!hH8ZRNIcPZ#`}zGBRr%D
zzcXfd1MIIr0`dxFgJ%iexA&icfZp5RaKyB~0Qj>{)=5+w=iY`0w`lTy+Yk+i#Srp_
z$R7i=2E?ea85Fa)gqAZq3pxJI8*xm9iDe2)TOQZwb1NlJ#!R{)bxk&gi1fptlyRcA
z>ldwfyQ$usxe3>D4-CaztmMr8EUdD)bqi|k6Mf{PXE%$<c}w3lBXla*bO+n`RdWa#
z@HAnzexBU+uJG;ux=gB5SjD;Q2DKKKJ}@#{s4<;40TT674M4cb?Ed5?@iEX1MUD{_
z7GApicKT=SeZY}_JDuRsHSwD_f<T<I&~GI_ZwwU8mdnp<-He@#I*@H!VQ~_37`=H&
zwnwKMvWMyXjeCfZ6g>3yTLFa!f(<7$Y{s14xjD$Hsj0cVYePH}Y*VereBur8%{nz2
z`JS$1A`OA`?^T-{8+H|K0BN}!k<7pcj1oEA6o?v3J>;uC+b-ubpUTqrL`-6R0d~XL
zy~=YPlbSQD*#vB2j%(D#UO=S@*#YTormrB;FsJhqjqNVAGqM+?KQyMSh_iI9J9Z^2
zb^Hg?#u1T+KJ)Dt<M&a|-VA6wH7$j)3-=zAwo&VZsHi#DGFw}|!yCbcB`7-YUHJ8<
zD-$H}9)gMNEab@S?2rVA3Ezo!!+_UP{)m@!VkR5SpHy*}I@57`dOy{(?V_>qdU{on
z@@YtAQ130S)CgR_gM%)f4x0T*!qH*F2cl1_&%#Bko-+qmTv%ZXRz;-2=MF$NrKx<A
z6F7&WJUWNEu(5cTeI~1JWn+{L(HfUO9?{y_W&TVmLZaOjrMXSW^&nRY-wsAbJBgs%
zMTLhxW7?k8|KKd$340<I_Y`q?r$S=B1McSe*6M{*XNO5DaRh{|^7_ti)>w9#ijkU{
zV>g%g&9qnVCnEAmwM190)4mtUIB)GY*l%jJY;q`GDD8*7;JqD#7p=$c7T)OuI<GQ6
z6F*^PW$7+ly2!&B3;m}(^`_nNE|pfL@jW^+H4mCYf0{!Z?aZ{K%7It`ti~Ns?ux`}
z$ACjDz!j~}geZViWJk=WSrkSXg)Y427i=l=8`l%zzw_;`^z;wu2O>{AnogfIoPb2e
z?JX^bPrsLUThc7jP?iv22%`S&M5_G&z+!)SQ1Gt;t6s_CttddN!uke!>E8reK^l-r
z>dwNJm$Gn<RW7A7zswb1L|&Hk_59*s^`yRB4kAg#aaiLbD%YA0ylRt2hNm*Wad?4s
zDl_0&4|BB3fWj)VpZtw;Fs^9d@bSNSxZK?kPW?dU;j+xibYO6*Q`$+vOkDj*leP4H
z#7Ujx%gadr3dHex+=b4PI5RkWUluqO<+to8OmZNeMgEFBu2t&LFsp={7?%@)u~N|)
z{9=aj9OE(gBRz=v%u)8_+`$D%d2Rb7-sZ)?Z1fs4agP6?`c0lsS!$1s`XA@UIhdQv
zUF(tTJjFP)bk5~Q+S=H(6;af}U(c`l;U*IjQ=>{*e!S3BKQj9k3gkDot$Vnz7uWhm
z0I31@n)lPeMRJ{&gL%*thTg=&({INIVpK(dxv|vvT~6L{(dXIDIzAuyyq2T~UxL==
z&aV?~g%D!AwTT(mKDsLyZ}7I2ySw_xyjeb&Gy;whUcD`H`0iaB36Zp$H0u~i{zt!b
zRTW)@N6k1myDG`Ft?o$y!#d+D+}EG}NQy6Z&TjTDJq4SxcK*}{pptVeKhs1vPuMZ(
z%CF+j;^LxsVtw(*K4xcawL|qq0!~XL3+=jFEkPWw)0g4KR_SmU9$cu^TK^>d03>NI
z^XG|Axn3E;^3N<Rg?usDa(XIuD`;aYkE3-{n8>+vATU0>M7_F7y*y7B0KILJ!qg>r
zxk|dHFQRdh3Zv*cg+qakl{PqD)C&<&dk2&mtmd{14aj3@4M^t=OQr|ntgbuf{<g13
zq*2M+hsr3FQ(D%b3Qvk(8fWQmR!|0OSQ|I%!=(4@H6=By4>u`8N<eKO3Ji8@juHfF
zBV4+EJ>=4*%j}^gJu=bi`+iyyJ5z({+{i2xdUFFsFrFfzkKEmHg+5x+xwmqv(`3X1
z(_)3!A4*G)N^nG5O$?4G&fng4VniuV<!5Md=H!_u_kpPJsHY+!=$`PtMy5-&zzL|k
zO~B1YDUZnbF{!6>(JMJ?PHxm)=}PS1zK7C@40L`$%>Kz-jYx8Gz3aFCr@Q`K-0!$E
z%@sE?xhku59;Uy+N^*L>bGK!`$A>7-B<3WXDj~D|WYR&<$zwg&m@EW6M+-6YKUOfR
zlsX%MK>U`O+?vZEDl<X7Qm3BYtpZMQGJ-egAWnxpk*mAWn$dOTfjm-MyU}hdWHa^7
z74tiGf+TLgb3RX;8fmL&*|xrs#*Nw4Jh*Y@#Q%7zXwwKQS-6~bI$*uRP;su~eIo=t
z(8j0r9t-<?RkBg}FFfpSX%6!aHjjE71S)cIS2Z#EkayfRz%D4{$TO6E+pdCk?)Vce
z&xAqFB3ExGJ`kg6wOW*Et>>HnrUQ&{&BcDTOnOPDJGPXKWxS1h)ETJE?3a0qM-2;2
zh(ZK4iQF@Ls18n#aY9oWUyDZaTVb;E9?N$ocD&Iv9Eu~ZX}5<qfOdkkfeb?!a_c47
zu%g~9({gZ#`^p=R<*?V1>$4OMd|x}tsR{!u0u?KJ_rt{v^cGcrK{bXQEa!afMwCk!
z(G#xg$8yjzj@##Fw2**qwkF(bFH2GB>(8M$4x03kOL$bZaK3Wrrs94*gP?ZL04U6K
zRTvCM@`jg4EnDf*ed<s}H&YHVYRM-gGxEG;A5;zPY!<^$g1^Vpt96t0Z|_hxg-M(^
z4F!Rrd-HXa>?}*-hs`?+L-BbY4QltPK4+^hn2l}|{k6ZHEWUns{<sa<T&#n_KrLFb
zYo^5d1Y)(np{KiMlAT}%T+%%Ms=jJu;AX<7onJW*yyT@Eb!a0sUKlufcsSirqiH8?
z1Oe;gI;|Ok-f^D&9C?Kmb9{YdKAjCCahb{pdbUqDGH?-sTK)yy9W_4?(>C@=3QKi0
zq4w+bS)HEnm#yGv9&W8aR5`|N)NA%zZlx=8%Ac)OHwUMzLQa?aBc&H#?9OJ=@TWd(
zPA%)LC%`JVrt3_%jLIaNm8Y3Ov_zqG?2|pv6<Ww10|X5M*{<;#OI1G7%l=b;zID@k
zB$XHy!FB^rD2<fTsIJ=s4qTM~`Bb(x(l2n*(ODa3cIYlaq%<>qmJEyvlWvz&T(>G?
zTXi;0TeyIa$EBTHpace5H|q{O-L?&LRny4eV8(<+a#{#~@oVe5<j<j0mcs*~Uizv`
zn&=D*qrXR!yL3z(z~P{dg+Q?+w&>2(A_jIYwd|6@d^XK3i=z<{>5M22h--{(!?$dt
zh1Z_)r;152!6q>MIl(UU^P*vOOJ~6WRd^UIIeLf>`{&8JhsNTu7au*ukP~dnH|COR
z#bgFV9qC2k$UtZMA67}QJ!oohHaHeyHQqLQr_8;LVR}~Fz~9N1FFWsDj05y@V)pXt
zr_<%orAk&zqV1azQJ~~@$l)Re)A1TK0Br2Fy?B`M9!n6=FsFl1W(uM5VYe(Y#>3d3
z-Uq|WgiX0jS#gQMsy<0vPh-2^FsWtoMSAzYYxgj%GRc9<U^~*1hR4sVk{oRh^7)Dw
z1SfgzTglN_LaU!OWqamjK9r`0R$o@$c{|;69&ROM{gLe_J!AeRoO~q%(fliKZI=`2
zHP4rD>bq@FSy8dgg{q?doAy+<@>!-zG`d2vQ4%A$54!L+>4)+PDXnICv$lGiHZnAL
zkgoC+D<)?tAanXA@bLH5>XklX3F^;m;CmReNlm3%qVm5=ZsV8q3Ub8Ez26nnd4964
zL^HE9I~j4um=95Wg?lho&_uHcb6(W-=+TL(^O(YJZQ41jRazh!v2syU0^irjuxYw`
z+TmoT0WtO5%Q!P7<`w2=^OMHDx)_9@kHgT_#40A~y}sLzc2@RhQxMoB&9ent$7(0y
z!EDOGpwGUf^NDK(lQ}J<+SG|b?P^?AE$4*4$&|@YH^>nR%YaywKOTn&l;0omoqcL{
zE;Y5gmegGhb(kSd$PTcPJy=H-O=zx(7UWjc`9LbBDh>j$RreK)m}nt`4Z+dw?0><*
zx%OA+Db+0Qn`FkkqLnzKj<V9G-+05NiN<0FKoBU>0curNthu>!$&wl)QI+rT>dwU1
z+jFqMl~$y+l~ENQ1VK93^0}I1M_tv=t;ti(0+nR`4plIxe`{q_hdo59b(%ofL|Uk$
zu}0jWLeb%N$hHUuymt<IBtZMIbh3WKSn_2vRC^U%z9n7b_PJ`eYez$qtBJV&%IJw~
z6L_pEFjp3+IM=KHSaG)@l@|8}Rm`|iVcX>l8enK4%H~dqjklUPUpT@U8ypnm!?5Y$
z+mmsNQq8n%AG2qXfAv7{*&7hKJT#>{O7kEEa_~in8iGr?gZPx2(`wD4Kxc;IQVkbk
zka>&78flxxoibJY@dl^TP`mS>yE;<W^fAJbOxNHd>h_gYk09bm2l&=Zt16tvYbr?T
z*yj19R>?(Q75eAC>J0{eEn0t{Nu6Vzh8R9#*O1=#8L8WCBPR34bKfEltr$hXdxaNj
zG-68(dbUw#r(*TrwNlm`j~p#~It8#XJtRCNJhwcO7P8#e6x-&P*Jka%R${k8nRYli
z$!cpay_0;7Clo6&zo@TW6|;pdPUh2`E%v%~wX-Bo%(<+6klf4+*hfTmPP<OIF+gey
z-b%^{Y5LZdY-G3!d{^r^L7@jVj}ITY_4;jsAW3BQXGBF*K1PTL?B5wC+tJF;*Mftx
zT0UYyft}?~o504x&uB#f5NM1Q>cw0A{!#0rS75PpUdq(V?Rht3QQ34{3QYGZm@O)}
zl7h!9SA9N`0wNs8gMQYLY`rN7YMRw=CwvR+zs~OzdlLQ%%qMJNB^S@@;yv{);pkic
zqkMDmW!`4HSI9^hI5r+q_>z$xjte`9cWtYTaVR->0(og#tx{)0(F!*C9hh%X!X`kN
z;RR6~?6$Y}F3J59UZvAQ?tz_(%HHXlm=uz=Gykh&at5nF7rB0RDg+LG3_06o*u;4I
z3xYp<<qdbq))q7-y^eba9~G2-BW%QJ%G@EC|5~g+=I|=M1O22h-J|lI<*%cwPn&Rt
zD2XZ0Ctjwbal9`yH6sRNzUuNs%Wfa^Gzd*e715P=e9J1hf332lszjS_g5%(A+<n2=
zS;L?>hcOT)=rccrXOn<58;&6{8FHgO_)N9%C^jWMcNl1thq^0XgX0ozdcS+|7ak?X
z9B@|wD0Fn8Yi)8(+(_{bO6;?$Aff29!4*q3^_;8x7{_<!R3f6n9iMC_4*uMZ$Y@PH
zL~p>+mmQmNsnZW&(^i!@+D8X)_kOXBhi32@$G*CA8SkSq$U3$0rtIA4{3>vss$o0c
zi>C=E&Ipv6!Kj1Z`q0x=rI8LWsf=l@-TGXUD81?D5$teajmB0DQlnRzdCY#)I*wiD
zk{3=$_~t{SstA?FH)XC0M#^&2(UU3)5do)h2b1dCn+F?OBwy_amL{;+o0OC1Q1`c=
z9<Z_f1sCD`ye-(}uZ@h!=EvmZ8>4UO7!_v3h>9nC|B?}!VZWpLN%xyrrOTUwwzH0}
zt0CyXeqXi@@6v6&d<&|<QujqN7LQS9N{Y|nHx9PaRM|&bIjGap!^=tvlnd+=Oh2%L
z(}j(`YVjIP&KPIPr#d;r^_p{<we@7cFbskDSe@;bVL9#RN}KMV;AYREBFb-OI4+Qf
z;y=ifeiO3y3pt?;JaQajsu_2BdYz5|siUG&xg3=zrwnGb&oiE@d^s^OBT&cBOKO<J
z#;VH<>xq13Sm{wSc>Zs|>GEsD$#HWl+4@=tAGP7YPy0*2Q1=s`g`lIp5L!quD~7S4
zp-CTnrx0j|V5$Y)!h7NC4|qN)PZY8a$OF_*qJjlaV5YP`QUj`?-nW+71PpaB9Z<JR
zi!=T>-H8RaQUqYft1-F-Khw(>7UTt#5DNx)=1$=XJaG1OxDRu(!Tt27sNa;pDmC0)
zz$$?rLaIA{B(X5sxOB;-a<9UNCA;=ubi#@_=6E?Epq&D#!}Gbv?6_;pZEpk<Bi&t6
z4+|W#r-K|!I?#CIwOnr1agB<3#0sM6%|0Q0oa7Xt;F}6Zlx#_6&@_<!q9u{^=iBZG
z4~g4drV0EATAsp&8PE9r;Rn!o8Oy_uZVA?F&B#7e@#FguN(h!H^Vaq%%jl|XYj21r
z3*yczwYHygY+aTVKz}urnTEYW0@v{(g;4aej>Zyrm;+b{48BvDqFR-vS~j6m{PXNq
zd-jH;k76^y)P=Oq3kvTm;V%2gVtx~1$ZYjNc&c1Zk3SYEUg^C_tu}?gd^g${q7)zL
z%B?WdGoh2cn29LLoRcrZMMkCMpj5G9ZwCYZY644d(}q4|#Z;+9JK|xSI$sOM@6jP8
z4L>Fq<~<xf`cs@w@kxUUEp?<He>C8IY!og3-OJ3Nd`kc6C#*!0cFLxt*uh<h?)`iB
zzi(}sCw?nvS$pd{CgYxghndssL&22-k{+neYHPb@+~Z>KnUgD6A(Pf_X!=)ab>ur)
z$lT`oSPUv`5ojv021^^j|D+*HJp?8iRHU=?14f|T^s(|{=<nR=`}6jQPG}v2$LdDr
zl0ES1+x)TU4=g(YQIK;vQl`n}#+0W^^9VwAORM!U8>WY?<0tm`P*<zZoJGP{fHlro
zE);E6KYOccHf*^voX@>t+4PWX1JUH8<5}`7u@FxHIEDHFX+M%4Qc#Ze4)$ie&xDjP
zRD}9<%2W>=e{s1*h~V}7PC7rE(GjZL@NKxqk}fObTr{!S?oSKJb{_Kp*nZeGvIa$9
z8XJAGWLNW4{`LI_3AcEiG(s~T4%YQ7dN`YI*HotK74YfL?#H~T-^XY(GJd<wNXdTG
zP7$GVd(17B9?4`l9b=o#B|ll<DX?M@o)5xo=Vn3kpRi*_igMWhcEK3F>ta9(PYKgw
zMjRg8!R;@;S*s#gp!gus9*wLR`s?QI*)N+1^$IFNRP#y@l+O@+@2edg?sEt~5nU`l
z+4o0*T`OpQyneChIeZtGspQyC9<X7qCFzEse{Z+gd(*zhqLd!U-@Muc_O#VOTC!){
zf~gdDT3tRwhS_-G5$&Wfu8o~$8bOC%St)&g&M04X4`+rd>sq}l@)6bf=1RR5kFV)`
zZhj^<7zw7M!fcX<pi2{U+RMxiOi(_-fo12vHMP%PZWxE<w`eXKm~`u`g1TOC_+?zm
zpVUE|dZP2;NVhx`-P1L@SZ!g{{<W?KR$w`KZgH14W}XQ@9u*;7f=Z$Dq4LEB`C+Lp
zCONlthx*IpHaYv5fNFX2PvqngMn5J_w-xQsBUiZ&KV9V+@S~X`mK@lN0R<EgDf6;5
zb(<}}*nM?!U`XEXd@I!Q8PFPN^Fz=hP;ZfxvwXoWs;HJ>ORZBRwd~x()tevhK#FQl
zlXj0vWq9vr;>c?XBq19y7v0YP-#S8cv-w25W3D12W2`YuPZ8?i-Kj&^AeN@g5PnT~
zjv@7BPh)WDKMzulj!IX=Jf}e-)c*h=SLp>IhHpL~7kl#`l`WRmQpEB;E6L*4mD9=A
z;p{Bt|1w?6QspuK{^8`DDJsUq0)WfCV~N6TsT5i~=Buhzl6s&?otWXPSlgNcDYYQS
z#nC{^U^ys~?mL5N=22znUp*}IMMkE!54acit28bTAXBXtM`Qkur*^cze=E(5Tis{U
z0qD`KkHTwNff^~Bo;K|yN2AgF2bMh7-(3DX1U>e(`90=uJW8?;1#Ea>MZO5D7rHmE
za~xfjZ!=syS}eWW^zqeQV=J!|gN*T`K&mF(*gC;&#&F8%v>Rdy^S6nYorIGVzu*k~
z*E@~iWdP@Rs^x!=i?;=}ZCS1lEu^_=3|<{|ShPc*aN+7!S5*ir)A9cwz-Y!1P%xN}
zN*w_^1x|j~qOu!Iwt%`*1qd*;Clzij*0OKK%7#y-T!OF?af)>CJyemY+_L|Ea;4nB
zsLq)&T^9Cu3SFm>CbJX$FQQ30Cx-nzNGGNOM3dLJ8AtQLop0*6)T}ydcCrw@{B|pF
z?C<4>oCi<vFkFX(w!5n1*j$Q-fr6mS(MMZFqNo<B>)!5!&*oP~T0H8Gz(fx%#G!xo
z`6!@mP#L#8xg{8ehTep`*(WM0aOwNk%dXJ#hH@@~#dc8ontX!%SwZ8s#B{NQ(tL*y
zZtg|SXBfRzeUu&@Fw}?Um7_*+B3XmBcFWhPB0KyP@9~0Yy*zkmDm-rR5LFWH4tB%u
zHsL_p8s++W$h{2r{qX)@eV=w;NftVv`^J%h>5{{m{RZ&cGT+GSYK`?^^bK|P0a%b4
zpVS!}CWr?Ta_35eDu8JQPvbsd*)UZB)NrJ-0xMt0%lvf5K*_dSwGDj0{=(_l)^u#a
zfUU|tuv%vv|MR6qBG4{uRoh_a<x(KN@Xt<&NVR%+Y#|;N@RgSmm{4mr^w48LpEuf8
zo|g>3RcYzTcstjc8Lm$Xu38FxS`@%wyAY*sn3}-W7JznlFFjZckWjoEg+jFTtbQzU
zb^qKyf&^Ue9~6%eKML6GGdt%KdHWR)^D~ilI6jcbKh$vtAXy{#nZCN;S_-=R1vF(o
zmmOmY@3-1T_NGaSDKi?=NNuy;_atl$a9nwWF(q{q`wesbpc0C}jb50ZT$hI8)<J&R
zv*yzjTd5smsLB5R{k&4NE~p{s_}chkQJKy%cB89a@>G&@kQLL>S3;zO<5H<2K863)
zg!{_Hw=-8#+MyP_)4OtbM?;<S5-%9|&`hOKo~~tOIhYSFFabkZ=$YJ%mhLXE553Yl
zz}=bTn25rT8$jf(;7$~#S)s0aZ9Rn+_uh?_XH-H9IOEc`g~4;*tdwFOfQ^Awm0&B>
zr|`ms4Nr+F`gWIe7h)wIHEn*8{}bzgv{J}mjTLjjcx~4GCMRqnPofypXy7<?q3Uur
z%v*>IT!i&I2e5-B-YN{nU-bVQO<)l?GH!dxD!0}V^dxgcC@%t{Z=|u9EfSFnygY@h
zD7*SiN!NkHq!E+aq(F5LsbN?uVoDTpo1c#_C!^sO2n0$$t??ZnuZ(#6cA>7hpk)1|
zPnm^^+I=GMZKZ7Fb{+uki^Y19$VFAQrqa7ag%{1ZqdP~P*UZf&MP)c+OYGASe+#5m
zo?ZG7mcHbk5YJ5KbpEqvVtI)ir~=jhrwUjx61vnn7njRqxRZRl#UI8=pWcCxcK=-7
z{Y^Ui(W$&kXi<}mD5t(9n*##?eI+mC|5AYN3qYSbIFHbjS=0L$pd(zSXja2@Wk45z
z4*a#Q`05MN3o+6PX^E&lpD=?b0PIq+sK}Uu&b)?GQ`$~4s|P-D^xbk=O-uG9{D0vA
zIVLqvpHA5LT9n`7g}gx)J_fnU@fnx6tquh#<=EK8)jV!5c_YVJ_IOpe;^-L!W%XMp
z2S<6YNM70Nq7*<JtyP~nz-fT&s-S&a{2C6Rhc{*O6GNXH-Tl(Hy;P#tDDglyA<irj
zW3-96lrR4NrgmYuhF&4k!8EkJ_H2HL!~ac^F&ugIke?z-9CBl+<F~08cnOfidp^m`
z%RzBG3?WyplpukEweK#V8Mz9_-Pa32!|<RmPj?*uCac=6g;2=V^v9x@@{WNR-2kkF
znz90PZ>{d>azO<GeYmvu!z*rE6!8ao_Y0Q-uE7TGA}Nd5N>aY)pusAb<gmo+IzJME
z&OBV_HTTIhl=PaHpKN(zC!1%?2lX(bN`cA~xfkr;y#?4j|9uj?3bgY@)@EF64!zM%
zBqTY&Wvo#PzL#&EmIHhaVaST}*nQ1pM1`w4U$*Z8$i)C4w==7Z7dRgXbPdQV-s_xj
zOxH@@vHjQb{$J@mqMvXDP-OFy|Lp@L*FXJY?H`6FWA>tzKIvV~VqZ9TY5;XVuI3b3
zVM>`PpOLibmZ*ebXdz%_K^ZbU!Ge4Awho{SyhwcJ*Qm)^&c$0?(j>tSa@=+;Vx)Y}
zYYcjLOXZBK>_fT=VV!*0+VV+f4LTIfYxGiK@MCjY;X5SH&a>Lf^1kcQw^_tRBZR;c
zqY^KpbzQEi*W|rqyaq4(mm=y!k(jp-xw8b2XgUR}D@476{sv1FJ0K7Sa+WTOH{sUX
zxiD9*xN!ke*GQMmT?T-$seHhqxG^qeZR3Quo?p4V^OXZm-+Cv6spj4?f9TGC2W*oN
z_TSggCC4az@L3v*q23p|=4hPWQ7Wr;@ld|Q29y_s>F^7vsPjm8m#Mfpk?@r_<%y8b
zWFge{0hN8X@Os5mNeUpdpEI#d9C{Yzpj7sSThA|N=xqJSGvJ#5w&v{sETQYVbPX{6
z;+P`j!Y=`<`=kkMrzlu^{G@j0du;(t&Zy6Vxl&)9Pral<<ZEib&4S*Lk(>FvyTCx%
z85oK^24GqZ0(Bd^(0>45*<aP{m=Kq(1gM(ShKr#_+E+C+>9Ok{)mBdh{hOz*<d_mA
z+{}(g5G053`I>v8@V&f9<`<Etd)mvC#(nc!CoGw@9y6}Lr*~7Ssj0LZdo-HRQ@{tJ
z&`*A@p8)fxbpQt&2QaO_A*VFMT4pe=eWz6kR^)C*lnz9u@xomcdh`ml+M=eSO5UKh
zK1%6p>p#@DaXYsUx74A7K=_NCq3I21yQR=lCQ+Iwdx9~eTK+Tr*Y{cuU$T2`#F9C9
zaAz-P%X{~Do`<);4O!TH9D?RoyHd?==aG-;Cd7B_Z9fBajPyAb7!kPbrnUfNSLcYi
zTbu9DR?~?SZ308$<;TeJu!n;|-{n~KfMys3GD)DK2iVs+Ed<vDu3z|m{(*Yy%dnhh
z`_nxmoq7&KaEY*c|J&Pmf;~tN_=C;rv5<0YpOI@@4g}j(A1*<`G*vawBU2rLI&pqd
zVPAQK$N<au(1-v79tI35UwNkh!UIWEx@`QE>cpYK{`Tkm1!Crz@~{&7(bXY?`hnxu
zj6T&q6(O)$OW-{3|CDnsHnCL*dN_Q1e8MJpYUYjK<7QKO#iHs{<44{ruGjGdsDNG*
zuGjx`aCd_jlfuOLrO>X9#D9D&5~mgkl+OJNMxQJov3#j&p{7W}^Nw_n#EGt3rxRik
zRa7|`SyY|cBei&A2lKOnbi6RLa>gQ~<IVgJ{uq5nyy5G0mSpAgERG+FnHh}MuE5EX
zDL>1m29vwSUbbu^L&rRrB}%w!s}<dcj4@DbH4A;`bmvb!W(l7bo7c($^;TQ*7GpwF
zIqWVa!qqUZ?A;+0PB~5l`MKfw&DEm<&6V5rrBk)r#Kmel$dQwLT*ILnVIJ@L@~D@l
z5Yu1d1TzX5HeQg01Y==2@g@_rkW$_>EF*2-H((6EUz%a7P79ghx`s!Y;t74qMTgvW
zk<|+c-Z&hehJKas#(>AgGQ!+$Lt0ycKl7e<l%Jl4<jG93^M6ZR)~@7X{Dd_EURXH1
zzZ`beq{1cJOFjhsmT`aLiG76!<~A~9F;)|wP#ddId5gBS#32a^ej{s9%)>Mde0ioZ
zsrrWkHC#mM9<XbZc`p_$CpS0WF_%kNRN&xmBuH!R;pr45+&!Ww6x(s>LD)OfpMs|E
zsHgt89%bVJR+tG;i-hQKEXs&&l*SOa2k?a3WWSp?S<qRIM%Kdcv4W;lAU5%~ZO@mm
zPuN5zui+I?tHRY`QMM=Cw@O5wEekZLgs!dMqqCS_m?UQ#x40LXEhVOrjfcr`rs)f4
z@Sj&D80Yk^j0%@|+~`bZ4_#Zh+4;UkHLJ3Cx5j_xFRr%>n`wG<(C&Fj2VlT45dd72
z$R;qjcxcsgXttmsx_1waCoBxzaIg==!WPIPE$;V)9Qt(0+OYn0iFNiiz=LEybhnrT
zzoZk?1g>queg3Rn%&dyOSO9SBNEj^cxBvWraP832VN-}60@qU$?#pRW|MME9IiF>_
zXpzAhHwLArx1fqH!*$!L4DvO@o55oj+9p8Lj=~uU`ma97E6g5ccF9nFbntXS=edCD
z7c>>TOiC`5fG0sGdZd(Ju3r58sHUP5aaxFb@2mYLGGIX}KV2*cxPO~BE?H}2=8$8V
zTwU5I(a5G-)>LRi#c8MMsb+?()E}jMxqs{J4_w@Pd}RKZdM{O4L-#}^_-&!`Yow#9
zExonY3wLjA?KHCNv5|5x^E+o%dg8O$lwCsNh|a#@yFZ^SBXf=YkHZ41k*Tf5pij?O
z54d;)mu2U|Bl}obun-B45cK9(IjH**CkIAmZ++11k5I4#P1ScL2MvCQcjjLX2MW%7
z)F?Goj$&p=qgFE&gH=>(y8ERP*WtL(&{LTZ^mdnXP!0fHu*CS+jTWC{&Ys6!4X}aw
zA>-!tkq}6EOc*I=X(EX6EnLKuIXmZ?XH-lmmXKpn$UiDf?M$bJdHZNEcIY!Iaq9>y
zQVD>QGtxFNLzU<f461c()xF6dfWcPP7>1y=oj{mlevHc^6!V>Tf?%hbm!a-Rry%AU
zuEiOGD0;&LG`L%oS_r_qZ>M9w`r*edK(ia}vSM`ve&csE#iPLfyKrQ$y$$G+IlLeS
z#T)m|{|NPjOK`BK<W{23B~-!FN0?*x88}ySc|_UfTy1}8!Oz4FHM^|dr)l34$>_*$
zg5|mwHY%)89~m>>7s|2kW!{+ho$hFXDdA`2&p1xBD#;z&2Y@0==x!4@;L{mL6WB-e
z8J-^~#_8={SD-KTxB+_N(_`R{Bz36atMan?aaH8v+#!3`df5>UQE~a;JH!+Lh8@zd
z?64i<sOn=RS~0FW0-gD}5XZ7uzzw01c5e0ac%iy6vsQc37bbY7L}1>$@gG!u(}erh
z|Lu(eA>p3**2hfjNt|cjx8VD8%wNMETy#wd0!J%$r4mcoglksU+kXxPrw6(I<OKLe
z=g)UH??7_Yugkd^Dd)FvP-eDxY{R|x?~Y&!@<X-V6}rOmO}?aq3btm|;$n0P+Ri&!
zFQE3L`CVgp!F#MkUQ!M_X8YE5O^k1!hQcA=?EzTkS4ekZt({&?FF!=1qP!{|)e+X!
z_|ORrRqDeNDA-m@zOO3)Q`jQZMbpaI0oi67C?+n_Tc~qCzW4u!s7B4;`YZB1MoK{E
zYiWw9zEanZ&ilb>c%(z%OzPpgwY0dbn|f#_Dh4($(Yf9LXQRlS(0lV3=$HAnTU70v
z8Ut~9##8bNfz1QU30m>V%$b;J{v{I(FiJ^SQe=SgF7&d1mjtDIaCdv(c<+;noCkeN
zc?|VQQoGo^OVgRJu1;R31k|>M^P6~-G!yeyEP(k=UdQ5$z+h8F3)#4Lw$x+1+SQw8
zHS>GvI>c?U1G6fM`D=V+MhTkzcw$15W<1OkxQ08w^K@3bb)Zo8q-;psBgJ#dNle>M
z-*GXtqSlJRdsDkIv_^l2hKfdaJ}D{iIU8gP+4>RqT%X$(u=m0e_$E0xFx!=&`cmIi
zNQ0PKX)v?rUFoxeaUyFIxJU7r3J*KJA@q^^VuMCqCpOH6#-vPT4yfhF-C=m;8X##t
zfVLTNh%(zwS$>=FEnBgASn{#JbTD&;WWnCKf%eOg%FQMnIyhJ{eDBsB$cRb3)q8_H
zj|uFhKh$cxQMmU<%$R5Oj)Sb-$~PJYR#b}{UUK5Qtz!V|N<jf{6B^p&c;qTu-;DcK
z{7Cz{66T{oYx4l86Ag?k-vF93lF(-@1(?eVm%hD!UJmTn#KMHVxhi0I4WNL7!BGC&
zbP%Q~x!85w#Ehop{B|d!^HnJ3Q<9_Q2e`Ml4&THrI@v&cvra!#WMI2r43|6_1^A%)
zys;Abstix_KcmklJ?C$8;5E`k+wD4Tch0OooPMuN><;+W|M!-Bm9C3pM$q_T`-#rd
z%QobuO?w-%CFHf;SLL&Zjj_CJP8(3c>B;CKiY7#LB>^T;pLQx1Me_L?pP=cd{U|~n
zs`2;omlyvq!vZQrZ-{~-J);#9<n{vU<7)W@o=a?nM@Qia#-9F^-RCuXUs@|(xr5!S
zbZuPEQ-f>5&UdyE*?4h+pVELyJ=TQ4T-`(V!0&qDc`K~CG4^Dh3r_I%LmOy{)~d>Q
zo}LRF&uFDMiU$t@X%x**ZzEq^U^p+v)N2aowpdZ*@nAHgwYLs&ImH|Qh+b)uShaub
zG&q8(8#*JW^p=O3{Pl9{Q4?6f`I(07MKGdMCGlpyfP0GIbkYpm>jy87y)6rUnpu0j
z*@~V+u^FH2boP(aciDLzhO{cgnF`w+!AAzMaaG2bOcbEqpT65awk0y&#OW+jYzX68
z6}I9GRT8q-3sYR8GQl`~jt5930E6>3em0o=PTl%!J6_{HI`uurbPJz%s1ElRF&#8t
z?A|ohF7$d;X9QTaRtw{4*WuukJ8aKsuS)~)nXYB-%y2;-?SN|ejE3D}<GRR!4BAHP
z&a0#kINpf;PQlLilb$>ssi049Y|XOK)9+5Yp=N&HF1wLe5Pfszh9>DUB&7+A>qu53
zc+#?XD`wqG)Ot1dYxxCKMEB>kem6QCYTE@sDeJdm?O2DI=aOF{+7aJAWX^W<LD`J5
zx5VarP9~!0AmARco)1{q*B^*az&c-3ssZLToN=mu#05D3c*;=tzPP=t_na(Ab*de|
zB3&`5qQvZtZN7O>{f^w;lwtyd8^Jln8Bpc#bpy9i9qQN|o89=CG+1=@pJ9hzq=ryy
zC(;hjeV_#hTHkT$F(;{r^|3e9Iv%QUXBSwMhom!&QH8l*sOdgn!i|>-u>en$V_wV8
zi@})GM|g}KYzzm8uP@eXM^2qQthH@TVfHp+Ip49Q8QjWEQ9eD%9B0L#qLL5~05T)>
zhp*{k_ITzsoWA1&w-XEPh#d~r-CPVs^NC)=NxZZg{cV0k$|-(r#1o6CutR}w$6Z$`
z*`-n$aI{a^M~9&O$q|m&A6Z=`CF+)+E7Hq3y(k19^;RNnyT9O5BfLDdfa+A50mLk6
zX%5g9brsXlP}tQSAa9}JQ!}QATxA1PK(khDRtzDYuIb99F$F-L^jI7mL4N=SLm)A9
z)&wqor&!YQ08$<80GJSX4T?R)AzD?(pWj^2=j_SZQTO+9>dI_7uhS>m4rNe16OD@e
z>q*T*2oMIP9PE200@k?0t3wJ}Xj*vaeozidFDNpJEx5+#TGHXZ^qHbj;|uytj><lm
zu8)bJ&$;NlO3tqdG&L60yJHbr;i0fLSUrdDUiOwM>S1&=q_Tk*@;Wu1If>@g+&uv9
zZT<lR^pT`Gm-ZvKvoEqPslSFYv-1OoPv_}?O9MqK86QEokhUkac4poSo-~y*i%PO5
z<S8d*Mc7Rzw@LG6)#GKew9JeKcFVY-`9ya++mSO*HG!*-+%r~A8)nYsoThE9#|EE_
zll~pf&<6$8PFFHW`_GtV^%Sr9wk*qNR!qAmO_@)er9C^F-wm*<v-X)>{Y7&=L$g|=
zCg@Cf>%)vk@h5tb0kUYL`O!;#=%Sn+h>j^*Y)Gsxz;jygtbzdCN2J7Z)|FtZf@Z$l
z1m?KCDh*&>Bume52+-@kM9rBzWSR)FanU({nm+I@CUz*lUP;jBDpWceZPQUs=(vju
zVX4kBYA((JDdOn%=f}I_^3PQ9C|cLbP}`hwz`@>fx_5y7sIa|b6Kq9?FJtSk>b@-e
zbl$W*LUG4dq4d}~SwEZ=W29|Z(_4t`u*OUXv+BcK(;$|jMOND9$(~a=a*1<E8YN!$
z!xnZ|HZRmqnTF;*U<6PBKn>1;<-WiS5TJ>MqF-KqF(oWDuq^O7#}s-N#jB0d`<;9z
z>XzE4i92;8#>P|ZGP6HP<pqyk7K$2An8ii#(DTwc{owm1<1|Mu@fnRmkm0%LGBPaB
z8q{3(lAG=8fD1Gi<NnN&W2>Ca^){&<g`hDyFG|32UV1<FA{~5|y|=i(o^Bf}zAVm&
zS|HlK)a&$s@j(x0Jha)_NK2)-QCdi0Ue^p6++Bu7Y9|tSr=(GDX+To3&Y*?pJ|%3d
zWz!K2vN=`!_Bt8*A-%N^_pZ<@S-*X|ayY1!B`baUzPW#>n)=<r`R;P{Vy~Jsiljty
z(l@sYxTMM&dJto!wN%8H4DDq^oH$k2_CvL-k}u5*acN%KzT!nH`+8M7G@gSA^6?tE
zFit>f8U?72tIkb`)9GUG%Fc4yh7?vKvSXW~>NtvbH9T5YwT4|A)q)5UtRvhyK63I;
z=iC)!X2KKX*<rnG7!<tGkP+zMD07_w8kMrBM<gCwD>Vg|%H!Qk=LhDNXj=Q+g{#JZ
z=m>m2o{`eV?j_D}OrKsbtEFm;kXo|*HUn|D8EhJq5@#7_3l%}i!t6J`qKA!)!RlbT
z{e#cyHx$i6(APc>MLxlUmfhXd&!1A})?d!&fcm;A>meK&z~8|D^`e8#JtM=zo^5}6
zD974$MV<q*zrSzfg28Aaylgu^6uaI8Y9#Ed!R9NvVS~GBo`&9?@1Ok8<@wNuJ<SKa
zsP$<ZDWo^w!-rW$+T?>@vfkW~;^*XA`mVDmV)W`I^z2D^VWDN=;a|Vc#1y{R739O{
zk&1;gH|E3);w?F&ydT{L{Bs=Pdsk+8m7#LyFy9SRN|xvWR35u{Ga`>JsiOu^V15Sy
zLfWG?SUE@LWqIxmH)@bVWKE54agEMBI)*r|K&PGH0>1q1nfLu$=Gr*9O{%s#y4*Ct
zkjDP<3eaNyTejxkVoXo?h3Jh3AxgfGzBrFvjT`VXJ1iN>Uq+nCAD>f=sHIrC)$Li=
z=KwZW!IrRaB#Xqxl`2v%A}S(o%+!Bw#G%)?!dx1@XPoOX!a_{fmD#G-oZ^cl9uHS=
z@ha&<DiM)Uf%Sr>hg@4mkn_D#@$3I3L;y5*?5+|Z_k3<A_ip{$r!Po@Dcn5ff#(cx
zVa8sQ?n*pI1UIJ3p{9=U!M*h5^CRXh;&MuTef06QV`NK(1UVi>M|b2$3t3E<yP*L@
zOmV_OtARMdg<k?H;(hVO83kVnb_>&)Vm(N&h0q_+d-~bM(2giuRJlsHG@GG&`G19$
zb*RudAv$=Oo*vXB>USvmbCYPX@aglCk0|4Kz&2^WC4TwErtIZywFcnL3)lgsp65*b
zVFl)7lJVxdvy&>XwI7G}FHFBLz5@a+hV69#Ss9Ddh2FfrqR4s&4^l&;Aw}hHJP+rB
zjW=60iNJHZx8A{{Qt2S#K7N-s@Jx0vr%TSwIEvzAKb7L0D8?FQH_~e|4J|Zy6pgZR
z7KyBud@^dfVUiJLE`P2-wZqS!pJl+83LQ=vgD<`^9ZtIX!$KR0tjvM|K*J~C>E@tJ
zhuILKcdNuZeh7m_NVPRB*py_<|NL4yXp74r@Vmy^0@6}H5CiRcqzp%9uC7mKK~qKv
zu<f0lN0Hlus0EnFW&`kI8EzS#GXG2Ao~HpS|J-@c5^w{0^nkto)O&FcVq0{u$x-((
zXP=SyLWxD`!XD?hQ#rfZoIYn>wd6CC<wRPk?vXRxHK_FEI$LgMXo@>$r&rpWb`Q#v
z@?JBkP$6q4QJ-|R$|xw+6CaMd9!TfA+ws<xFNxr1&U{#EWZUs&)@Cluae>%ali0A4
z(rp~(opUS%;X6fRD|qt-YJaFyYY;b68FYR++L&KeDFe``3&`$C2K3Db$ZY@ElUf*5
zt`d_I5fnt$90^qrO1S$E=3JKvc5v{iJT<f1$XLe609SU#s3O6Fkv>;tL#L3UGn&t7
zNpL9l+_S#pkWX?GTcG3n?Il5nPm)P(d^s$8^9-hnhe1Qo?(lkf7ZFFFkvs$U?lWtN
ztKUu+2oZd>RSwxQCOiO4-urqJ5`1CxjD%EwVAzG-#Jvl%TqPAU-cPzk=ZCYH{mP0F
zP*$gx2IMh?_NMIj@Bd33xqH76SS|rxfNax2ylht@Fke*Z<i4!Cis)f}Fz_bQ@qGc&
z@_|a8wINRpe(E`x7uBHIBdg4t>69zkZBRK+Jd5+<4NS)3VFrtq_cI!bQ0g5AU@u#K
zWDBpua#}KDE+9n!L`t{6xTGcmFaO}bm52?HpeAlk>o5NjUi%x46KDGe!g2vhAwJN5
zCxd^PScjPwXWUJ3o(x{S9L%C{vQaAtch@}kM383xs;%31_r|aCtX8r32YY+_@b!39
ztfd-nW^qtcEi=>z)|^@#Z)(*MH|4p!i?4|NNDnq}c88JO-!b(*9<xra%9ir~^EX*P
zdFul$-dN1{MYXsv!QP00#63IP?kW)#!#yViLTd4-gba}HI4)>)Gz#0n!Q!%RzI%Yv
z64%PmrU4`s&dV1GL!r=X7sKt>D+u|~0U32*N(>ZzmS`iK7AqS2Sy29n!zALmN`Z#<
zEz6s3fDjzfcP*$%^^^2=r~in4*y3X6pqXhZ@3hO}gpHiPP6<C>vfl#eTj0l{t)s;G
zz^s+;?3h^c^irWlJZL7)7jZn6$fT<9EqOPvB~S<$qm-MDE5orJQ3uD}0m2;m-(wt3
ztA7^cOYx6Mu`SIENxU2+-=hQ4ogHrl{&)KwYz9X@eI_-abXk6X2elZsm{GAsx?`$t
z(EQ4*RK12R>YVA4z9m_4QANE;&CM)*oG94$>Q!x6p2;^9<tjI3+pp!oSmFyBqnIhQ
z)uNgHE}-CfjZHFLR_-UxLQwN~vo3v6&UOjo#T?0oF|siH2?)>ZoM9eU06FciRlPY=
zx4)w#4>b&tBu4<-u2KCjT?R`AIiGMRP36^QPEC<h*Ba!7GsJN=gM%>`Y8Ia+q1}lj
z|9MnVM2f#hC#iqA=OjZg9S{+LeCIQS`4)j_`XUaorfO#K$L<v{4z>Xn;ZjTl_86~5
zN)G_^%`Gd(JwX>qC7YQ5Qfh~O)5RFAyL7z?e9veFEdrpIQ7%u)?6qK?&*%u0C_P_g
zV)_W(3$I6x7<(H%PUIIsf!Hc1m*Sz?j;LK`N;5$~a{;BHzRa9JTiH`-@#{u9HX5o0
zH$k_yP0~O10k#@F1-z_Dpy1cO)18djg_!YB8cn$;6LkDNyvh<^EZqTyOowbfdD8@z
zF)pVl@@nZQVK0Ws6??_4Ih>m~tTEp-tI~@;{qh;;8k{A>n|Rm{@kLzQk+nG*gW*1x
zyZpf(kk&+)N(qA^K=&pC1dnN;o8(MM8#jghhI^7z{ealkgn~L?my`QX@)Z?NqC1Cu
zq+L>JKP54GsEZdk0;X;DeG74yTL;j)M(_eXy)+YcIzZ0$!~%YtYsV*Shf|x|LD@i-
z5;!cS$fcZ2Z6!OSs<<QWVeAl*b^4iR?Une6XC-AU|1yL90W%m}pFFAnu!xARN&gVE
zD_?TCKPgwXPf5ljbb#SiGLYbU2Ug&cK3N$Y8W@V|d3;a$puVW)r4MsWg`kksR&M=3
zYW2q4Gto{@AC}|I@Wq2}$qn_Qnsbz8@)9*I<ibY;6wXqih%7*sx_cn)CY$2iqVy>_
z!!)}+L}6*`!q0WAT@%&Dy({dpbsM&2$z7{IlFoPS^AfsXW(lvglrN5&*y58L-`Ykk
zsvrfwGG)4oGzN`h4FY?U4i<uxa-*I&fYJx!CpN#uRW4i2PW>#DSDqKQGB(WrDrtvX
z)WpGx_&Q6RAJrWYQGtfgMc7X$ayU|7moAeK8qe|~>?7@Myq|j|Ry++I+gW(n`a3ej
zCoWrctmS~Vv)WV`Ck1@An=hi=BM&lHcn2J{_Ok3vLJJ}|z6kbz*n7*cD7W@)oDvXe
zL8K&9q(MpPMnZZR8YDypkOt{ekOnEGLu%-hM(L1dNC5@u?uP%G?RM||JkKxQ5ATQn
zhxdR3XK!Y1*1gu1=XGA!Z3f%ZL*8YXB_%lR6TJqv%B<?zqZxNeJv?60_iSPy?LdD`
zeV7LztR8^CHMBwc=DsRQuo5+ZGDQ|Un<hz40-Qm=SvB1M186JK5D`TL0X%}FIqu@d
z)9F@7V;rE<?KHd5BFrotLd|O1Yh%@RfKCPitdT26@ohd8>D7_Xm9s6+JS_!urKnJw
z`SOfQ+%rR>5|DgW6>-7a?(S~~fMmjkAM+s&NG7_G#{Pr*u{QaLP{h<m^9#D^qbbn=
z)UBD>4JMsKlMiVN)-1U>pE~xAtBKj5ADxE#8kZIJhZC<-6N^#~AOHO9zXCY>R7hHl
z+B{I&Uu$t}gQWZj<hy*|=+Wic7wtMS|5d#&jmFSLxWT%~MNIGDZQeR3A=E4=y{QUm
zpc5%L(B^~l^;~(9+wt!!JUdrUV{EZA>rJ_|E0x!E+me)#;u(omV9^UnhR@OL&B4ms
z9-d?^)(ov>7aC9OSe$TFXh7R@WzMUupWTAGx*i@RV!hVdID}0f%%3^64eeGiFJ>oz
zYAUmULx*V_M8u(ia3kmDZWCX7!Tq*tBP!~1t6L;j)<$-2@;{D7-uIt_5{BYkBzXoi
zQTe|jOZrvAo2t7%D3;Vyq!q-hZU)`jCdOx*3&V70;zFF%Qd@56C<jToDadQ-t9x!d
z0<bcDzGRmt$TeBpoUo(fY5c8N)9s^sB_%iPcl@dboN__Tmi|Y~ras3k+djm6b+LVR
z#I5X6Sf3655R4OI;pl-q2j8<!9|5k7m^bO87~svKRp2IrT06NAI7^uu?jBbGYb)o)
zhSjz%GAXkFUvS(FRPOHlW}xf_cyKbGW-fG#1GBdDT&X=5O;YW7Hn%&Ul<lsy_g;F?
z4Ku&}v{l9;?9nf||4lSC^X}CWx~9I>k+|N<=Hu?)vj8fkxwZg(#Fd{l^%Y&w?&l>v
z5B7_n*_5nH+xAPUTY~RiHmzs|OVI<)2?opKTdfc|qvawFpuMMy?f#uwXj9c@Z=Va5
zp(`k4kdTS$`Brkm4Bx~yz2|xOA#EoJ1Mj-FlSgx6zhZST19aGN>bQ*0N;Ue&?wfl(
z2z~7UhpAVMY#S}|V?B_^HEIk{eWxkFN89CbqtoOtZ97_icY54Bogy3vkfE$#P@c>i
zr&4V^mS$!NQ`4^JJaGvYjpwB3`Kjmo;o9lLh)V`?69Dl22S5Iwy<nhPN>^mhtG&9m
zI?c*<R8x2J+W~XvZX)he?aF;F=<NmhOas2f)>w;;gz!1$4uQu!DFxe!efCn$V^)<-
zDo^ZqVij5wpLx!;nWsX?raVa(oVxCRwH9RMN3nB4B}~i#<iOAGoz2zs7C1w3a=jpP
zef<$C5b2h~CeSVQwCm{A%{h37*ux}bp{VLbg&+Ve9^Xf5t@c6ns^DxIOHo7jstWB{
z#vr5T73C~l5&wI(jX%uto!z2}IQvRtyG`@{^!!G*Hwd~O&xp$njv=(X1u=H#D(=dG
z`J;<Baop^5v92JR@?ot7)@1Q#Y_$Lvmn7));_=+W8Vf#}IzJ)avXi|d$#=1BE|Kv;
zzfmh|ZZ)U>{GR6#+(yt}JR$}tadxY}|1;2u#iKZ(77UTDaNr^eN!CN<A?~^x*QPaT
zDjvsT0oR~(N{C)EE{$G_wOHx2U9X2+*RGP+NOVewXW?@`2p#NvuLGIb9g=|MCSPpT
zO|9LitL~QATP$4dY0<TV!QQIZ^TV7vqdl3Mls#w)bqtt<n_z85m%>5Jnz9DBO|QO7
zl|5Q%zEJ9ifCRxoeM&{m&4pri!|t+Sp-Fi~!`_JtFlYE;nkN7dP~z%eO~GpO6+D&a
zZNA%2I+8y+A{ao8kO=xX^SY`<u}zwKJ@##<cq0P$Sd#dlEHetJEJzI>xe)G`_;js-
zbrOh7gMnLJS-pWrbWJnwbNx05{;OXlp~?15gzqc6#}I5K59Ozd;rHKYe<%&XQOK>T
zoj73nOWB8kvUhsdVFuJ%m{!a_HVV3<_pB10p<3@N4E-Pm8X{oh4=v#i3bZk+pz47`
zCXgcz@K1_uG!ar@&22#{6uR#AZF`S$<(-Y5JZN)p*7uk&RM(dTqZh{<Ki3@{nVl=*
zpAPn?$bFjjtjnSE_$m2ds2_~p7<n(+aB?*WWfxA(&K?nQbm5vf!xstlI!&fgRX0&D
z69gs&M)1v!hPvX)JxP##85Jq8Avp#?`RxPVh8HBB8XBrI6=u<;EE^rK<dTZ&&J!Km
znP`&v;sBZFjj~60qtgV>Ui+7uuE6pABZ;4R(<Z^xV-&4^>5<o5_e4EH1FFv|qF!bg
z%Z`{}_RDb<igVCrHKQxb<t)=THY0xtgH;930~+gY*%9j)n+<z3ysCRAPmc_mVO0=)
z)3lehe&$e3!&Eyu>!~Opkh(ZR+7N>~7BEssNXsa|uGvgB=igMXro@s7gB(bl$mDex
zFkvNTto}Q|V`0(E!Kwj*na_F)AJ^%cnrAEvcp}H>#~9AA>SoYZ4Rh(gwbN^C6W8<%
z-z*Cu_tII>@fP&)^SDd^`Fm=ICvD{gm+7cln_f~9>k5v^^^d94CE?)UY;g8Z5!gB1
z!Jm47Bmi59rukRHFt|h>N?gp{z+1VzF!oKl8jWwy4^96h3J=N8FWc<FpGtpK0g|x0
zk+<8CJP}!`Nk_ncO2R>&v)aM(`s&9$j=HxXNUGA977}dlG4Vcvuf5RjdDP!NVv!a#
zNF=a1GQYBuld{cPaB(ydai?)fd}Sxab(37+<YtcQ+NkD=gL<+GMZ_>)(<R>Nc%FIR
z8YXg)Jz$Y+rL2<^)ehxa*UgOvFEs?~fh%Q?JMC}WrmEdYnHnzoSl=NyBPV*b^RxoA
zO5M^A00+I$?-^87f4nPg@+^=F=#hQ>fUXHRa2};_m-Mjf<e~8;1ePozvTv*`n&^{<
zox+swy?d9VF8ZnCq(PaztC{q9!wb0DOWwEna8lvI>M@P>T%Ggd2@oS?=7V;KW$Nin
zZhoPam-G?tc7^w24MCCT&I5_eA4rNi=#2l*HU__H3MISP@;d9O&{uQ=EOF2!nEOoq
zIPWaaxrB&;+6NNOy}jMuz%qMxH@A0gSd(p^tRD!~h{Qc|&9kn{2Ij`D9D9s!K>X&-
z8I9uw_u#DRM?2BxcFH??=X`S6vBB;Y8TEY#puzgj=#fZ-BQexGb6RG8?kL9FTg!9-
zR`8NCWLEFu{nhhQjh6_GHb|^{7wpn%1`s?F%k#%70S}XfCNIOcIw81k{g3|2Z~I1r
zyCD(-ZYzlRX~+1@y{b>^5@QC3PX&&B{6F^NO<iX#_L^H)9@O`)?}#3NvKz{Ah+bq2
zX-x}HJJ#l+opl=0Km@#h$N`oI=f&~lnnha~=?wy+R)qAETN^&rwb(%m`1(M``HN~#
z^98*mn`$q{Dqgm@nS7czDPWZ8pmxGdzKj}v7wdc?OqdUf^`~^JI&E<qXS7An-2)t!
zPic!570a|iUmmMfA-|?rFJ9Ihm(M=^)++T)!<RdYdkOpWAH1Cl7$pD!pm%m<R~wus
zk_tP$D4utewy|A6g3!Dng@F9h&tW3y$^6^V@Mon7nJ#U<-=unvl+3h=oQ}e3Rz!;X
zLG>6+%(u9VO5meUS(X6yuH*xtYy6j%niLv_+yC|6yA0wUc~<t)fdnO%(DvNw>QH%O
zvnpbBf%!Er_A4b^{3Awad6-N{Zgp-<ut^pZi*JCq9*;fGV;**l6_K3`^$p6IYf+4C
z7zA;Oy*&|>^OO-DSBLvu5G-R<XSoY`1)|a0W3NC>57d8i=_&oJVcG4fq*d)TFKJGi
zuAkQlB)?a@q*l0>9UZ|nMLcKYCcf)ZLQ8*V@8sx_(mCI3Uf#K`ujof>n3kS?r$v#T
zAfR83JxZxr13=K@!!j;V17kp98BtSr&duUMPi@?$=dxGr(U-HKIIW(Z?qz>j??|PS
zZ8@Y#@2}}zQx-ns*0()rYmHTgOzvj&tmGb1i_^Ti8nn34)Zeg8P<t}gls4t<B8Z3A
z(-3ZH^+IuRyCUM8V*@<0r79kTjJJ9Z(FviSGN06>Cjz_F<9!!2&*gpm*id7wP?oS0
zH#*VrLOdp}iZu&K$({TrfgBp(c>b^>go6`GkuxRIXqKvPaUpXg!AjtWfEK4Yh`NVw
zyyyQO4(ygo(f|tvvTR5zH}huM%t>J@ql_kxvs=wP?-k7uC0#*-WlVs~BlWJqRc7rN
zU4|kKV%2E2a&bK~b_0#^(0Hl5Jc9=2Vu)A4As7;oQTEDEV2(K=j!=SYc2-?|#Z#t%
z|IwQ8IbXolsG=gn+bg9`Aa7-@&BMT!m(&0Y@Ncq$C!Ij}u><4ysguE6GK;CwgY0)b
zMdhtAgrXsDMum130lHJf%F0N8i~Yupkf8gL-1Kog+L*lM+z!v2<*qAgF#hbI{}O(`
z<n4IhXgk`s)}QZ<?s~P(SG;Q6ZZwXHS<qPI?D-gzk&$ti0^3LI)%DO&{I{!^$!cVu
zy|F0PH06_{LqN0OqVXt~LoXqetA)DU5A=hSJaL+p^v+l^coi;CSC^}B?&#>Grp)18
z%JFc^e(t^<%<4tj^vogt<i$qa@Mhhn%-Kdchh5tjJsZo>!mKlz%bOP~Kd_b;#ti6+
z{6P5>>YB}cC#QDO4PKm|gSk_^wCRrh?BL1dLa)sM6*bf!G<^7Z?(cNGa9Df3Q~m~!
zG+P6M)Vpf<BYIwYe5!C|BA;7-hDFV6Fsu!oI}#GZ#YTJl#Ass5B~5AP6C`_jJDFy9
z<v}uo1J0=q=p2KgUaM=C1KP>I7bi3Fi+=8Cb4_B=H0o;)PJ&)nX@lkK09o^^iv&4L
zIn|<44Uh2bOPd8NB5210VmY~o$sQ#Y-MjEv(5ooeyb_!*bVDKEBci-@)qEb-r-%5E
zFIYZ~Z--Ex{6UG#s2~4lw1zxaQy&a1STd19)7~lTi3EFv4qW)Ntpq=!>LZHc+`%o5
z9P3X%b+I{Edm~R86Xb9TShxKY62L?GuwOj!VPPl0byARSHw?%v)@E>0Vh4SF2_f43
zUwI_;dU0L8;-F1P_*^y2PK_zBipRyqs=HczIOY^^Zz@@GnmMj~W$2x%)n@!2W(mvt
zSlznD^s#;3!`abUMOBpu0);3fhxCDR<I2t4sXWzM;$3RKSs5Ds^X2^q{X0a!q8{T#
zK8+^;UZHH|R0lJFA-d<;-lGix-l7W76ha@YovV=SJl3`g(_P{W3-9$L|5{XRc;+f+
zcZ<zLdZhus`<7koV;dNyyk?!ov%YtG-B}CFU^E9hlJEuU;wfFZJ|G>r>M7pLu-zmj
ziq)iSolSVPQ?OsaTEw1Dc<ohv9_|Jej~fQ^3?nN5Qia(=S-t||OZXjEY-tj}d5>bi
zxQ+&H0r{Qw*f;%$0R`1&RB%~t$!l1CVpd;Q8)$B7iFPWA=@2c|;%5QV2=MwF0-lJY
zV2J(kU6v?TpJl8{YMI00wN4N*AmZN8lSdgY2*hU<h4E)#M@NU`ncGte;Z}%+>4bgr
zNX0Rl+7V+|n7Pt-z0P;}k($uf+_L(&mf6Rn$2~^V4f7+S+&`wMoYBiedxqd-v8Ls6
zdenq9%j@LjEphhVPG+I7R%Jq@M0JBeRVdN0saWq>>^0Y0sbSg7MVpMRkjt|-ah||7
z{a0O(2$hf5#r;sQeg60!C%k=UgN!un=3LnOT&<!?vGcbbxEj2hl*@#qc$n516*JTv
zd4x7vW4bi0GaKNNFJ;p&Fuk$6MZakoEXeymgYzPZD!RC+e_itUiP3bx!Tx-rmqd?F
zT*FRzOkBuD!YT!gxxSDih|VT=k_9<LzL%KKH;t-EdiqOpP&tE~3K67I9dUGY^nl~@
ztHN8O9MrYlXh?>5S&jPDcZ`Gmh>#;ZE?v(`Rs+VyYWA7C59Lg~9F}0=$-<ef3W&35
zt=2+TmW%}Wdvlgvv*_yXqgf;*-E!aV{#19Iy|R=M-!O=TC4)K@>=5tmOdXk-_>><!
z57n2CIIq)E*9KKq>5x9?AGG)F^&>Y`mGLN55aao`0qOm>`6(2^+;mR}QBZ$<Q=&~b
z=(Y|CgfvxxF%WcRw{A<UQAV5#aoB89cJN9nY=DknDfM##mLR~dmjxV(ATIlImR7{}
z&uP}8gv><($(C(jaA*#rC3wFDG13wv<<+U2z`p;Mq2t8PyJ|x1_`aJu+Aq!WoF;~{
zMzm%bnIF0yovzMcZDkU8?|a{Bi-O6zYLh!PR`Ec{s2qU2!xdEMHlDxDU)&BGgSBU#
zXypQEGC;u7;97s#_knE^JA^{qV}BTHWLq%KJH(@!(`VU}p9k(8?1!l~KXBzUAkM0V
z8wblYoVlQscQe?<76;xp?t7y+e}5*CV(wASM+6y=Ko5YT3URsjW}2uQOMjB1Ac}aD
z;_!@HVj=5ISL&12S^+q`dUfoeHZ#n?3slEfA56CaJVO5~hI?5mNKn@MOU<DGhvJI4
zjs2%OiP55CxSdW)9rzHfeAwH&JBRnP`WVyxl+=}&Yj|X^#<wcys;eRao^6WzXz8ah
zD2o5+s!gtj>G^I#JOL8@q51Bgvh5?rPJG<al#+9SFRF4nbR+Z4$hQ&2rrIB56(GiE
z^1N)m*;jL{ciQ!okM&#f?ukL&mR!W_l~%V1|MD*n-#pnPug7B;LRU-?v1pP$6;Mr4
z8*@U<38kT?N+Gl#=YIM$2RbppJo-XhBo=$3<YTpu{ObaE&+cSB)yeWPw;iM-YS2Rd
z6WqkNy3bx!x~hO%p7ra=VA)f>1^0+zxooz)2=zQde}B-;H64X7@zZqB<CSSJLk=-F
z+ok5t*82WFFI`&yJr=&bEn2AUV$<WDcYYu5ZIN6=5*km{$tKtK3Z^{3^(d+ij!XVS
z-=Y7JF8sT`FVn1(*wo^WQ$1}+ob}LFYciSancgRGd}|{?ke%{%j<J8k%#1#Ssmz!R
z$mqvGIj{jiJL0)JFGS)%yJr3e`Uuy*Y@Z|Tz|5c$i?ePPRk!q#o>+X+5oBTSr1gMu
zY*-L~T+%~@0~))IL{B}z=#!xY$_M>OmgBUGUvxFB(aozcdw7k<!3s$`t!<9UPbLns
z<`#MU^ri%(X<p>DhjDGMw2w5x%to-U-ogWjRIQU}LU8WNJp-T)JTq_Z$<l3Pl|#{>
z{Cgy!8r5D2yt{j>$DYa%1pM@OwBPN?YCc^`uw@7F3JgupskYpF2kw;DXDse)rr-)^
z=f7o)RPd*O1NLu&xnPV#uWA3fNh@qzyrW>)bzxrFWEUueJD4xNCkZ@B^E<3q?*LLI
zohhvW%2bCHN$bE=2wB7vL3^QXGyxO{t==>L86Y#<c3-i6Yj)aAUvky9JS*+kNa#qM
zn%AC^;P9$!3Nc~~CzjpP(JCff^g`;iXFftM)%%EJEA1|Upv0+AQptOuEp3Wr77?L9
z)IaU$usIU5fNbZ@tC)MAcbTtBI=c|^=4OcVpP9$_9;3Vl2}vvhyMAgOz32XzXta^k
z7^j#Ia_gW<dS=f&wWCj$7$(Ho-HXwXvE-ZoGM2peTZ??~d`owpt!~W197bGS3=A3x
zpTy%>C~dYtc1C%^!tvF>%$4`|oOm$v839?m^_>nvGqA)4739e`d|sSuK!E(HG31|u
zDIMl$Q-3;I6ttQrMxgXA$<eq^v!Ecl7Xu!SFm@^C1_{AS<Q=&3I>mK6JTcE&Dq`fw
z0lkp=tg#gFB4iI(0int1VYJm`CVf#t@oXeCOm^?#29O?DJTV5wAA1~0j`nApppKj!
zDi2>wcamQt9TKz~H~r5k5drj1v59|Mp3ea&P?7P;8YK-eLQ+%`-4w=n6)Kj@p?C6g
z^0|lBiCQw2eli^aFRVPCXc(&GOSSItj24o_-YBVv6JDzUT_;Og%Z&@5(4l9-07u^N
z@;uS+Yturn>+N0G42~7o2o?6sx*`&n9n3uglrFdBn9PR2sF%~}i>92}Z?2RVo(Jk(
zaA)S5-YZ<@!wADVwFQkN6J*G8ErxY6wx}8=^Q<!;81(nIK*vqx6LdeMC-T)}7~o(|
zwm(>WA>PQC6eW6gyNk?l7bi|$_9$1Y@}(MVD7Z{QbvsjPmC6wx$%Xi`hyzZ){$b)B
zU^!N!0#&3??RZEmBqIMhBPQ&9yov{ALnQioG{$+{?+nFGh<5J6OUnoo3H_KA;P8yq
z=C1ksq#D`=O}2a~Q^<fBU8ZH)AUJ=qhf4&T=T2`&{WnlpzyCD!+HVCQltHr`E6&tE
z^sIZ3zGs;~nV<uMX-OzhfJ*8}(I)%q>I#DwRcd7ZsVS)jH$@gS<%EET!=g$c)Ds6R
zlv(V?Ak!azU~vrQ)nvfczXStw5?B<Me;xmK8ef2(XP~t2XI#g5U0<tj%GRlSuWE70
z-LmQ>j4~rgu7;k<3DGvk6{;aEa!db~^J~E7Ll{N>=g_Kuar3?;7z{b>ZGoxa0dxak
zpfV_Fv}>drh+9zM0WM&4IW2cnD`b!R{8_GQ7@~eQ1XxM~mDbyT?d7uvwtvoPpb75b
z|J{izL1d}r_qv)QPBE`-CB7OaWm2y>EMW{p=;O7BU!NtX9~gZoao0qBs9YAjlOsq?
z()yHCIp-!<#j~EYW8x2bx1ZwK1(V4xC`oJ$fFq!=g8wgJ?sqXGqmqyS*)wW4vrA5R
zVfPXcE}?S8WFnCLH}V$$p{&DgyuU4gSP}8~P}LhG=@#&q1}VfrpdozlJ-TAPo4O*L
z%jyfzE8X^=a|gP5JhCQ#$fg!8kWKV2p>n@s<n`;0hoM8C2R?cRlE}8sU8|Tc!<mEN
z4q3n-Zhtd?dOckdur2xoj@PYc*aGy4D8057qP+fELeFfwp`jt}{MU$voFn8r`bqBo
z6>DNB8%<S_g9!>xf?DUYT>K*1-P)U9gu?Q5hrG(W-1gT&ix+4)0@De3I$uE$SfF8n
z<j;KtyIZ65{Q=*!7^v?QRoy;DKNo!27#8kzr8?Pud-OBN?0FnE=RiL;kF4o0eX{}g
z<S7~A`^z(YBU;{|$+@$WIY}YihA2}zh@GmQWPy6dT1&qn(izoYaHlv8{5RS9dn{4!
z#`*l}pDu<r5nEANS<S_U<^J>iXebDJfI|tTkMgsUxYJn)s=*lL528&$B!Xq*K?oB{
zh<I!bz!dt|^M6TKjnsF)9`=l_i+wB|gWWggsmk#wS3GPcH{4Y~@{;mpWXBwQT(+$k
zp<z(`p~JQkP#j1Z9MS#=VYeebZ!eQrZ^V$vhP|zxTLIi5joV?j>-2<QPRRgZQe0oy
z<Q{L9?o&u8oW*!(>BsBsKg6u)e-pEJKH<Bd-%TD7tH4OXX75V6{2WP0Rg~Parf!9B
z(Oq(m<hH|RY(9b2gySCi|4vGNGNVragcMbrX7wjM1?{pQv}(CUp~G`)PLg^Dq&DqX
zV*uEqy<Lp(h}NPjqR8FB{$=^;(57CC*S_4N?fsg&oLMd&;(ZBfVv)=}A#YjICwbx^
z4;XSRUc3qpkYSLvBdC0QGCReh+bxZX|L~#CD2PiatiZU3|1m+N6{n4Qp8-nL6sfmk
z`Fm1}?zb(>J<Ss6?r8~x!(Rg$=(`(Wv>&)RR6b-hnh^Ai^0x;-!FYcC+i_3o;8;<u
zMtwU)C*!;J0GZkqEI#D;zobF_GEaLzyi0zT3_fllX@InzF(71T&TI+#b<i_JFShQG
zK3e(s0KH5@hxYZ5pP$Fh{i6Dhgo#hAGNp`Vv^Df^Ye{QIX+17__2Z>b|059Jl(VK+
zQxOhC0>}z4I>Yh_XvOQro%?n2z;Qf@|2%%oiHGYH#P>3Lm|Fhy{DnACY^<g_pj({k
zC2=C7^b;XRuk7+_n61Ju6}tYn3ej?=ia}k-kTBi;nxGfgl^9BYuu0o~)cjRoQT6tk
zhORp0=g=DAYarI|Ybu(9e-P-&Z(rlx^I8EGa;Vc5?GGd4bA-|UfVjeSE%FHcjC*c(
z(VjUp13OUpRV6uKjqv7)(b7g%0_A^h4QpruUB)w9ZEyb){!_y7D(isucG=ecNG)db
zm{+cML@7hyJMZL6tq2-p*GbKREsomvP68i%jw8cEGY?vpKHyjV72t^(J@h3rJSCXE
ztP@=B6aDsdjSmc#{L&%}^4Gx!qHed6?RHl*^dTERI&U+R0@s<h{Q61@^tf@Ec@;jd
zH{jZG`B#Mkd$RRjtHG%GDrhJP6`?tdaXVueBwvi$*rXT|$l)VTZpH_dfUy;R0*e@b
z=8=S*7{26mrQspW1vjHjxP^s3od58Ihs7`c=!S#VJ?S=r9(dFf-&I@w{s1vAalhSN
z|KbG8oA}N-w4B1iY+l99A6PCqE7n$?G8M63NbXG92am;Ni4w~EPE<j<iia(9wdFn3
zK=4iW%4<a$43dktXvq#Ut_*o?Z`!MnU{O4Ml!oNeZ?JhCPM=NB9YCa9g_3e*XtC`o
zcMA_l*dp?-y)7T2|7^&MYr@4`A}?0}49t62D=tz6wdIVSKc}<?ZZ^;2pr8I6^CnBM
zih>DwP=wHcy$_Hiswa=wi7*~1f*lCBNtg{99|D+k-;(}Tk<XTBLFBhK7}~H3hPz+|
zdg-xdnqJ)S^2Mcv8+MOU-$fV;ii%1^ouidH>ZiZDi?#LhRdV#3`O<2EhmY$)1mf?r
zgb`q{yzim7=YyoF{3D^Z1_IW;Qpr<1jGU|X{W}U?MEJmVCudmbSCMdKMHLGnB~mj|
z4NXmkJ3V>z^?uB4{p>bgEIhp2&ne%j7$_6Y!Mfng!7(zDU0CAgDL%-Qu!;yEx6=OT
zza;U?&G$(O>7$3w5|ox76wA=N0v=o_4*kg&|1Y8B$eDR}#~(6b|0DtO^Eh^MpZ(Sx
z%<bIvFDDC(pHCAI@zWl%%ziL#O`ro!_b(9#FKUnw*2_iV0%-3pTs6#TkVi~U|22l-
zF9-WbK}^<_hoU#<zLQ;P0+psf=lV3!`Z`E&7Q!aPXvqMlsJE?v#Q-!Hfu1M4-y049
zELuWfB#@pO11zi>@7Lvi{j^U8N2b?=-t2zCTH2T245sVVcS-$3t}3z(BRkt1419}`
z>B#2tiUs*Tvc#$Rz6EYit}OEz6?m=N{MqQfR7eUKR&<eD7Z^9u^+V_{*aU>Ew8(Km
zevcN7zzXbWegRUye*P2yi>dL#dVO^ohEq_Qfo+|*dgJQa51d~MD|?6ZSWcjp?r6-g
zy*9rJN02^b4wFSsrMwB8DiYiiBcYA#MOq98XW>SGoZmrjv;F6GrXbM>CMDcBKX8vE
zwzhx456CTf02bC8#BF{cT~^&4)`sY;N-t>C)T8>tR*6+#|7tZQbN8+~_q}_ggQZNw
z%AVF)_f_Gn92s-t>)tG$$+-TOPr)iiSHx{;BT12~kf!jj0i^LSw(YF{Tm=mL4%s=d
z3;ylqY9asU@BZup;)*W{c!SVll?kY3?k)sV=-8)Gsx^_@i2d02!w2hDh*n2?j)gr;
z=KS8<qr9qmA^M^M3KrrkPZGmLBkfAscf|r!eLepNt^i!}*GXU?`;SyUJ|y@Z03v0x
z2rO|mfxOjB+9;|3wh1_Nis*l)b9DDOlL^t*e&X)T^QwkBJr8)BUr{#D-5<2eXjq+l
za&rD&mgrgju8Fv~2&v57)?H=_Y%L(+FzIV&;5_Srgdh|Wv_)>UB3P9<*$Ms@P6;Kj
zkj|U8Gq!&l&%ed<GZ~N?&o9B^!uKN8G<o^~Cj8feklR>-6y6QS64ZZfhktIOY4`N+
zZH^Si(9+AQ&s(oaV{Lr5vSJ~BPpVO3{J5pRacR;cOvpf2X=n10;nL^te}4uk{`kJM
zt%%@HBkC3PjLDpKMfAQwLD$>3xZEk44CZfzv`LZHOjvik1vEu^39R2T@B0m@419ax
z`Ix@6NS5C_=guWi$=SuA_xSxDRKiYsv^UbOByHvi>7BdB$NW3WT9eK4!ihBQy<-D(
zMW?}J{(nVEKwDmkA#JnQrz{N(?RD{r+Y)hN-rh~?OynC)+dPRHfP$7~o6hz7B*ivC
z=$0T@(;n+5mW`Bhk`ux{5F@{qlkEKa4kIPOVFx^z0Q8)&RUyq-H}GFe29h8Deg_KL
zCAiQk0aRZG&%Zh$t^kH)&HncX;5+a(-*U8|RH_7qVD7mXUqN;?{)-m}*Zym~^N_Zl
z)7}rjHgDP@3?=xTIf8vp69gZtHD_!%b_7+?F-s4p_ISMEIyE~m>AHf*80Gga`mQ5)
zT5vBo9}P7b8{`oi8yi`Oe5kIy;Q4k7nD+LcsRVK>Wr5PVuwLAe<Fi8?Zx3%^r4mBH
zGr%}Ses3RA5jK&EkdnSXHw>ULgB<O`fT$TrBUk}MnbVl??-d{iubkNjv!J0)gN;V8
z-KFS2w}Z_8q~-qo9;D+3$DfiY24;<GYVr(&yf53=`X9gc)kEG#U3n4M<33B?ymc|X
z*ycCLip#I>8Zc!Rw)v9+ii7q632~_Zl;r1VMG!LJ(futWV))4Eohhau1vr4K5dc*0
zn<W^6_77E}0jhNI1KyMSff$M&4e3pz1LMPu{t>xW-2@eOYH3=^dWy$atX2pFq7_V<
zhztW;0Tjx!77&U=eA`O?S{Hbcf|QTz?P8eMb-)b27Qis{{l@Sf;~#%k>`x8_R{Axj
zB8uWMeyjPOfIE7AXLNuWVg4rNud6*q+M|*cga3hT8X)Zdmgetkmn8z_-~P!5pk;85
z5d<Q@e*Curj7(b%a@vebzjnf(5BzJ~fPyv!6m>eBJ`xYyfKmIs1hAKIZ3#zwkW2PW
zh+F-&NbmwgLJkDS_lr)M@)K4h^mv9p|I@nzG#UwgY9A@+;jIGAbfztm{~=-i`?P((
zA!CGbJ;0>>w@Ie|f>EJh*n>`c0L;!P*zw%_pEdJ9O%DM~qdy>$|BG0S1GBp7OyX;W
zOf9(>2ElYUNH1}Q0~iwN)Q4}3{yQKA4go1R?w^5yh^F!S_reztpmXFfB$}ey&;$TW
z)f>#OJ#4hf?Wtr7Mn@9t$ARtrEvd+mujB~ze}P)XXw8v!QF#^82AOZ^SM=Tn)9Zzf
zDCn>KV@=zEV7=betB>Hp;EyVWv>BiF{9ib@PGDJp0D##A{|p?F#y$io<}RaVV5p5@
zxttj|c@lO<%-<{Oqy`7?-^=rVdTSuPn`Suxclj?>#D8w)>b;@>gZ~@nrlg1069{Zr
zi$gJ;+HXNauG<?}q=UeG_DmhXbX(&IA3QEgXWz*t#R6t@`-kc8xB9Mw-fo`pZ{Xzr
z&t#Idh=Rr|V8tJ3`;VG2LZ*M(O;NCmr!A0pRp2OIB?BK>rtp8^9*x}G1jq|^=w7^{
zPYokMPO1%f^><<iq6;MAV42|-#wR4CsLht2U<c^1|Du>y4*;et7%avM;0!<V=oet#
zE&TcQ!N*|cl7Kl@sqb%80yqdUy*6P&WB@N7)h_gxXoDBEK(*nP&k5tX!7u;HYQZPP
zULsY<D&>E{6;RL~g9*{FzHE{08-djn{Pv2!AdO$zlSU4%ns6WEM=mhK@IHL=zwj?p
zWLwCWY%tvFe*|)ABg?_&FIuglH`xL+cDLj8KNtU}Nh1tL2HmUcwhX^dO-vK~Jqjzg
z|F`)6xAXu16&ne<qE%lUz-w+3{_Sj#(w)Wyq*=iHL7g#(o%Byy5x+9aUq3s6U^DmQ
zn!f;83_LqXT<b4=_yFt$&p0kH&;PB(qwT=9nyLy5kZ~i^ce0QpU07P;n2ezQE8je*
z1^K4i0{S5GZvpJQdM92qvv6Z$kNxWXT~V>Rh7IbyLogE$4N#d!MrULSb#?P93uCLC
ztJE#zm=K6j)rR9d@az#Yww~OKdZ7a`ejK#N$SK_6_k|KUfUfhJlZ}C*-mklj#02+g
z@mZZ8kfqVMlZf4bH<C<k{>~0QU|aA|y&5}IIdowB*tXq2TqdLyizT*b?)L4~><=Ga
z=Qln|-re106y<mqv#|S`vttT$)dk-o>B5b6HoSF$9DHvNOCk<h`B_OZmY6C^X?Tw~
zE2G(%IkcUTgTrN^@k{z0`LBvokIZ*Kt8(ArD?%*Hwu^)(c1?>xw9L$_Ov>l|-vI4f
zYSa8{U6qY2{WT2(o$?FUNJ<ZHeEcK+OZ+$hH2PL6Cr|OhtPRU^r{0}Xw{97m4tlMl
z_*x-P;%_$ThhT=NCj(3UqKVI|w6EOnc2=_soeAkQI@Zj`D2wd5)Gizv3LZvpd@e@s
zp3BnE)|P{iLNv5hqevPKy_RNtgALBN3Xm<>!n?<Yxz?7HPL9rMvMyLpl@!$=;H^+i
zKncIOQ9dS8aaDKtRNkU&EP?I9`~If?gVu{kxW4n{{SlSfNO(wbhnMRV+y0Sxs?y^Q
zGLfCfZfkuuAI6rz(-UNxE~dfRen|D$%`_hbbhhU+q~nLFH16*=Pv?c1mfVrm-ig#x
ziEfehFJR_pOp4CuWj?;kU=hcCI~g(|9YU=-FY0OMew&q}qbuK0Yc1K9yLWFjEN+2z
zlM29f8#*I+96IB&{cOMQ)7G6}4xAb1qmBLXXzyh2huP+(8T6+!h}nl5s#8K+LpNI2
zzR^`iqYJF%wuGk<P<c6ul`ph&6G9#C_CL0Z1^?3bR{u?7`Nd$*a=>gwI4=MA_Rr~I
z<UZj{lHzG#Ix4`dwCjVrdtlTbN;^MQIux3SatKPj7J_PMNR(!%F^9*xJ>IV`)zbW9
ze14GX<f0C3XQmdbl9|LQ8wtH7JJ0ix(H|Zh+&l%u_FEoI+>A=BZ}zsd;O+M2lGDM`
z`T;VhZ?m9vn(7GF%`W1)md5p2nW@}QHu=@E>fV4{$rh6TQdhTw!mi&Yajc=nF7{Q*
zhx*<d7|LR_zk1J-=hemadUq(lhxK>^s_{xP)<&$|?W@#=JroB}uH25=Xn?wvr>A9P
z(9>r4&@&rd`{IXJVj{i%7OyV%Ee_+`v<xFMRl;l6u1TwkxlI_1&+LdA9+#VPxiCbV
zGJNQrnQw{yTDX)V7$o??rO_WNY`4l(-BBY(!En=U`;MFIqGS9<C=6v_?c+_QkLCUR
zAu{3Bp#oJ~FGdEQwojC87`j=sv+PgsrK&5vR6poqz)Qwg5-NHyZQs(%ZM@9sSIpLR
zibpNhbbcDL_%6Qws1$Et*veFGVWyzL(Q0e{M5j*PAz)+e)3}johfJ24*~mu4W{hFv
zme#l9#<8G=7bov*JiWro=W=M4{Zv~{bkb@E$(Hy~2AT}ZG)ftkoDWSxj}BaB#|f;9
z4Ox$4`qrnK<UR<|Voo@$__xsv`bCfp>0o|q;1SzCn)c$;cRGnBA<kIxm9#N;Z1Ohn
zx<fr&hh<1+iJqnHy_MaHaWR(KmqJ2Hrn)$|krcw_BIMF8=s0-N!nOo;aDL*K-|Kqx
zaqB5P?H2^Yk4UUXX#e~=#0HOVy>tD9`7Z5UBTbBZ)i6y{bX&daMVQ~SyYG_|`zD=J
z^Fov*G53rkTaR(|RT#hb`DJ(-eEq2p%}rux&DsfjHve*+n|oyNa>yf|GmWL6;54qU
z@md{>g7BcS5)xxrF}9$i7CpHW#y<;RY-aL#?|Q8+H{}T0L*HzoCCs8f2xg9a|E?mh
z(B8{4`z2ZW%;9(uD1Xa~fPr~OvE}d^&X;%mf^DDcn0GMjHiU|Wy!F9=>bCOg8b=Z9
zRkrdTPY1b>ea%{XSvR=lC1!0uy<1s(&Od*Sy1%Dmt))69c85DSI5Z=VKrwx-xPFw=
zsHC7iDdp9r9A&63H0OdZGp>hv(kbl&N4=7#lCXZh_U92gO(uOVZd7^J!w<5l8HvS-
z-{YMOg`ctZ8diuoy!7!$flBjQ&R9{nEIrL&)}2U#nh$2Ruxl3b)f)HOST2842!t`a
zOH3cuDaWZTg(o{IdmlU<8#<4eu^IA0jImh5(w^ezZlf9<*3mSMWjo%;vdY9eJNT|o
zFmRvDz;xUtQB_2#dhM2*<>nN7pzdK8-$)`PSD5GXuupE`%S5k}kZn(n-fHC0Rcm!e
zol~J+FFJKa|GEFqlhq6Z+f-P~HN-*g`#A`_MmOhpY8Zq8eM(T8ltwOtva(dZSEbv$
zw;vN;>(f&fOs_e`xS!wevx-6y5Ll!6#(v?28H7nP-xa4)4tg=NnywW~XdY?<bI{7F
zuQwKrjR}IhrSfbwK*c|(j4d~Y1qB$xr&FunlW5)!`9#C(>XbE3L6az<T2QrigN428
zep0c{EmES6JSX+a1njk492a%!OW6x=bdRtt42wr-Y;0)6de#<#n@tDuwg~UiPeWfn
z&A15mz84<eVh^ja;%?YEw`9M_EiV4_CAf%$RUiMS8G3H97r!~`n>TJpMk6$od;@Qw
zp=s+>)=pjxn-X>hmqAB^o}Z>o9v>@iQS4WpT@;Hh$CSI*S$S<Nm+p5DbJSXyJNj3y
zjjGM=^*OqRxy+=|?f<ZP_$^rRZVtXsvTe%S0_(M^iXR<L9?3W9;Jg)9E$yNf-?zVb
zOzUI_yp+%rV!JrD6j;oC3AdIar6)DJzC;~L(ue9HE4u%)g`HGZy42~@dg$=kpgY&n
zt_}6|O=q60i&XC`>4rX$FhVTo;jTKzfRjm)6GE}_a%U+ets})%uW|;5R4z!a!e*YG
zrJ7hp<cTd$T2;9jhm2o7oBP$msu_mqUtbz`X}>@a1D!bJsN|^rK*u5eXcNQ%QQu(-
z<7PE7E_Zz#XWz7GZ#r|;d**A3$3(%EW3OG-%B#Pu_V+_YEzV}Byq{~}1|yBV&-(%~
ze5rHsj`$HCs%7QkwoCGz1LfnlF$Yidw-nGxQlgupZ8Yl|yW-xB2S{jlL3?quAXNbf
zGwFbSB^`S#v=XcA*b;hM*9EU$Ci>>g69)5u=aiM*&2ygTHAPkh_;}ZING?6(qKRHu
z5JiIZP1#))LjCeDLmFbAZwgm)TpV@?G}V11<45~Ew#M2|dJw9&jL0m?7|U*$+lfS>
z3^edcXTV-w`TlA8)eYg30S)Ckz7Q`Jqu0clEdFR4L(+ydu;;HD49va<Zh1y-HXOV}
zoOo+hzQYXXmjw?9se3T|acT=v$d_TfH_GNXS|T1}n0EQu$WepDv-G>VK+RHDFjJKD
zTuI9amz2=nZu$P_kwA*GbnC7n2^_qgbAdX$lIQ1(TfJ8UPM>DJ?`<u!CkqUBY<WrP
z3p(w%@272_O%u$n?V6mAQ?Ar74Leqn@=)-e(x2|?&U!=NdZ@BcIxdRo2-!sGRI(m%
z0%1Skv@J_KK%Uv!M$rBf8L_{<J`;l-g5R$a7ofXKIDp(OF`MGjkm&F5(w&&hYcd$}
zJvZ_S>N~eWeC?UU6oliVKlxMOkE~h1+$hEJeW0kNwU(r~sGH`u2VzlQ;Qnw;6Ps8q
zq1Bx{IX%^Z=NG33U>@*)4={Y>^8^zG9br$7TWDjOtVRmUSJ6Mn5|<`3Dzg*}eKag!
zIrH@mF%yX#0vA@OV$IW&W{aC;!q#HW|B%iffBs4;u7BIwRs~yHrnOAq1M!fPrUPWE
ze6kj%>B*K!5wNKqJ!RSc^k*PzG*O8g(zzT^<4|4Q1Ie}f%8EP;X33bPfQcAIxCy*|
zcCnv*ZR`dM#p3%A-{(R{%=)e;x5)})5WoxHNOn27=0UAlRN%<?xZVLui9H@3%fmG^
z%)}y?$ZIqG^{R?6jTgli#=9|?vy#2mo)6(W+ogP<ls2)|YgZFK5~DHM@Z}S^jEL4b
zQCQ=Se0*d27xOKS?DA8*0W0^3@u>YSGKJUH8T6UU#i?FPdoAUG9k2ZbNH)JUMEBJj
z(V8vfimu}<{7_!>lDarc`Z2IKFy&73L5h;^!uqTLms&_FUE{p(Y-{M?Q-tMuWL$zw
z-R1b`D=Y7E%YOERqaPk_5myZtLyC0wEN!N~8G4_Zk%rxNDAhF*jByckSvN&js@rvu
zUBXX3{?Vb+-PQYpRq%0z{ek>stv)$awID6!>{542wQ0sv8X>}TX1o&5on(?WW_#&b
zv(44eOS&<6XG-;EpQhus<d>g8(JywBqt7`VjFg$aAU@B`-l`P1UR0I45f>6m6#3WJ
z01a>&s}ZqQOu+Mh*9M2Ps{KvJlmooA(>gxHnFy8bK<%?F-ItlHCdY@KCOjxA!an!K
zdO<u8c0o0ZQM!9ijMrsD)bV>_W7QS^wQ1ig3M(;2qc6+>^AvhMQG=@2aq$@Hc&yp-
z&C!0UbBW~)CS3|Ydenz`mRBh`>HIMxur{aD&tDS1*^`+wJy+R*sU@L&Z-4rAyK7Ry
zw?1=)e3KIXVlhJ;(T2tij%S2b^0>`tx7tqYRj(j7l(eNE=47#|<X6R_7bz*dD8z|E
zW5+bL;uHK#K~An9Ug&4t_8#3~qIbvPO+))6Y6040m9BycX;m?#u__5T&dP=L$|flD
z7l`+k&()G)-6eF@VUt`!7DS1iD~kvS?VIF!#(IxdGZJFrIs4akE;CZ)i@mq1{F|4b
z-09G_eDUHtR`aUXNkc$zNC@L6+K4Kvi+Hc|lLx2HZI3ReBrn7t`WWkaPf0zQEf@=a
z6@If{Nctv5z2kVBV+&+#*y2GdT!58C*QRla_Y}CL*Vbv8H7`$e{M?LbC*{zU=spsS
znLJKBQuVM(O360(lvk9Oy_u6LR(Av!b$p(RG3KFtwN5AIr&DDzhA&XG6@*JSik+x$
z*Tv|z*GAqfV1rZcP`2{*1{U!mv^*`1HsNYfPr!RyrIKOfpf&SFf1_}f+sCvf$K(5s
zh)$L~*-x8QWj2k5@=Fm^qvKbt^KL^ChD9aRCcQUAFMSp{zu~+e#<!dm+0=BK6SvH9
zveAo7w2AXLU<#|*fn6%WohP`2Sd(N7-L5^YcBY~pT(Cu~Jv<Y;vYL>hVbhl4==XRd
zFR!rC)(jOJWNFe;lBKbWDVh1&Tw5!!I&oz>2}1HV?gx&dDInV_W>i*I$e|58%l|zK
zAi2o~60^qi*<(-C%}`mrm)AwuF#@JXlX`yJoWyR+<?d2f8g1B>r~(%+u&O+~DfZl=
zGGc!DUbu}(lQcvxUK~eUW5eG*ptzccQej=AZg1lGByillCF$pXymi<671?`-JD~^O
ztjrFaGjAVX-oO{Q?J#A@GJ`G>XGieWL99q#Canf}!Ct4OkF$@^dLJMo6%qFZ7iI9c
z`XjbTd@W8il&g`n4iHN5#wxSa=tK0Cq|eIVu-9ZxGE<4EyuGm%9DIRcrgQf6(bDrL
zh;XeR?U{EZSC91oLwQ6Em4<#=KtuCj9Q86it@>V|jTHntQ8MTzp?w<pQ1{)2`a3N%
zrr9U#h-av0kom|%gPsmXP1>*sg<+U+e#;Vf;1A^_QF^ZV^RY}EDq><8rh@hSECIbf
zF=iA?^Oi=bfDScBN5748HaivC@QA0+c(R``o0}P<OlI`cjOgBUZ0&P3aAmz~w1A8#
zyX$UhHOkrYlpGF6BkD!g@M^7xsGEyah~6aRA{1|E>Rt3kIG&ewkgq<{pnveqlk1}X
zkPKm$^X-ap+BKR#JVS}h(39NrG**k0&~_mdJQM0h-($lOh$`l?^QwdL(0spedamRb
zSO0*4z;ZI|wFHM}()U@mXi~by)aL?^lEw~O%x6y&llNBQvj_c^h1S>o@V;VFExl0b
z_*M<`H;Gz3>xvM4GHl?gq!rPWhw65?Zs%7r6W!dLAwltZU^UyDFW<SN9_6{LzK~jF
zZ*kL=Oit>svKB$sg!{{ekm5IU*Hf+Q@F?w3pQaw-G(0qCXgEB??e6WVgz_|^&73VQ
ziBd+OFZ53BJ)iJ#gf8(mvb?N5bxYuMrV@vY>$5PjrUj;W#5`}{OY|lnHZ(N;T9jNn
zpln$9as2&lmz-_*1q+v9mLLs@sL)QEpYqB#g|;-u!|Vojaob|5;pNak;ztp;L|G}R
zNu^zN%koJ5xrYkKfGyUsQT`}<2PtNEFvD}xa)ZT%5-Z+xn7kF3v&o_jIM%tiqDkwH
z{H}TKZXTIiqic5GtnyqJev0n=67RX%{6Hk_<yDzo2BVgZg)8-ylAbv_gy)?ychT~9
zoBl7X_{55;M08che45>S>~~Q(EB)s6wIMbkb%Lokla>af=sXOWUthDV7hTd9V4>{9
zt|s?wo`X%f1UY<qyKNL4HtJ$CT2m}k^%CjDryHVDy09_i!D|Xe!4-ceAU0Uyaq8Up
z*kW=dv`L+51_>#XavBR`j|yWJN(bdgZYIA7_D0}-y#+@pe^0ngMJphzscB$}{!H3B
zT_DlQALT&2<nSR14_W}Jc&E7d7v7T58D13w#N1n&k5Z8)Zt_@|rTQ$cu9P$=ttyY4
zd3`!njGd~E$2EeD&Gdz{F?}Y_7#>treMvbqu`xgmxfRc7Lo676y^~^q`MWh+568C_
zi?@}e{z>!bmEYYoMTZ}KO^m{6BR>-1&@t&2AV>9<1^a$E;~U4-1aiwhgZ#q%NnM+?
znj1^k^9@~3rE8t{wVow6;Zzz)=i)D3B^D}FBJ{7)-T05^=-}J1v#Jeil;k_K77MF1
zE9*b}->{=dq0?f%AEa)XZIEOaOl>^-;r@)zCu%dCiK<iLP5x-X;{Jj84dLdR?*$r<
z_uh<I!(*E9F>is9;i_P~y}GumYqV-QhIUVIqx2bp8JQS5<657qlV)@k4D0qy6BGO>
z@#LerHU(+O%Xsl1hk>^a8VHXKbP+x?iZB}Y%nOy{QxLr_e~3>d9i6xlA$<CtVYSBk
z(G(%==We*X`^_I~{R-Y0^WiIW1(xA&LYnj>;tewKQB9s!k2YL|pDmA4+WeRm$!IWG
zg!VLMtBys`c{IVv#ZIr;H05Yozj`e4pd)Egf5-KURD;sGG>eG7%ynw@TzIYg!=odG
z#w>MZ0Ss{#iuYP2jwheE_jhl+;SytVTFEGW?Nl~!g^X>lj>O!IRFF}JDlGwLNv-uK
z{+3u-^wnhyA5y~mm#C|It<Gk#s@8>#fz?9fvu{Q09wwo(F*WC>!`3K{ZPo<(h9Esn
z`T3$&nJ(|POK9bTBfg*UV{!ScY>W*}LNv$rF2a}_iykdfp;rex2&eR4Pr4d1#W<%%
zJr6H)ia)Lsz5mdUs|q}9VvD1Y&SUI#VAmG8_g4A*IkBEoXn+R?5)Y9<3cHL3x}ze%
zLzdgS&0MKa4fEsO)^jC0{OC2y3P@)^%g<>n{CF0HUl`_jgXc-EXfSTx5bAbK8M=yY
z@09o}CtgO)$)N^!Y$)tYC6k=>N!O_D5>w*A!|y6l-K?Wbe)oDsMDa2AL^0pG@X49m
z5ZFt-!kyJ)DW~CW1i6_>r^M_VPWIfr+bTuo%X+4CU(WrF%Cr`wM+^!T*Xq8^V2L@(
z8|%iyzpC8o>zaMG_53(Ls-);gUl*zwh7b}c5ynnfpHux~qsP(U!*-tTa5z&!y1}aT
zc7;(}w0nx83W6JO*xx!XRXTMCMshwNLFr$gnqAoUXBUXqJm2>(nf^w;H6Xo2KsH*#
zEJbm6vyWd6RWXBRDDQ5e8|{RGO}&JRsAI9QoLy;Y%!d@YCxM$UT&9Jh?j-KNHHl){
z>X>!q5`Q>6!CtdXuXEfL*w?oIHB))8ckHQ3Og`yXFB|-6e$|GHdcK(~BFVr!r!fe=
z4-sueTsJ4C+xBJ`_lonv9e!nd#jQIPPG`JJ#**P%Ah&Znp25N+@0s<tnkr3Jq8>?<
z?}-@;ah|1bzPr2uow>(2L}8)QMhz0MZjMeU^=Lc+m!ija_JqqtO9?~J#MNJQ*`h3v
z;Jh_m_+oFhB7P-770S}>smgh9@?d2!CkH#H*@d$)BukqMIQz=Q#wW#pZYRY=%)O%p
zUeD#uOkbgO46~++pHDu;h+Uvgxs?eO^r#~wP@+$yV*`An`!4Tpc3mgpt^Qh5be{&D
zgq;yyl~<5Jge8`r7Zh~|ed_t~y$-7nM7hTN?l$4abxqbX6|w^sr1=s{WSTn{YnZDe
z?0wnQ(~mMOdm#$8h=eoxhId5RAAy(ViF6+RSqaSUPn4b?iTW6kwUjvF^jzu<8r-Qf
zW$WMpi_14JxU}d-V|O!WT%|Tvwb^dMv*|6{1}tQB%vB-LkJw0i094cXBEn{9W*WWn
zSj$OtT0hm~EUA7Ysa@`5#KzIIo{%$qeq=9~Ynb`A)y!7p=8OpRwht^o$r6?bZx(y_
zVAy$v>bcG8F64%ajJXSmo^&)SCOdOq_SLZ{Ps<W6r(+3zC&m28&Xtd)>jp~j4)Y{m
zWsTIrdp=gyZcKRKLvH+K-GorFG$~+weaoUp4FdsU)g=4e4V$0&qI0yFWbipW-mRR0
zM~lcr2?UnHXX9KmxLajgvGc{**J!+Ht@!>-_-?GNzwuE(Z3<qm7nfXanYbYZsqJBJ
zJbiQu5G|4o)Dg4-ynB>fo6L0BZW2fHO!V}AUZ-Y|=!F!~SBz{)JOF<k#G>TAl*_?g
zFFaPf-~M2H#K16Vr_5O11wj`zbWtJhsS&G^etFi>J$r0p+J8suwHg~r`xcZPdc3M-
zyN1U%tWF^ML+j(I*Kkv!1rN*5qRRuaskNr5Pw*;)dQ{ANDf0ut=suBo)~Tk75pLmW
z)@jV{bkD$jn+$=qbz6J2M{Eh@kti#P&(^Nall%B>Pz;Mlu>%8fHbq6REP~;c^RE*>
zy-dH^zuq<$(T&9;Sg|HX3BCA2poFQK>d>E7x#sP(4s$0Uq!OzZwQ7xxA6T08pi7!e
z#Jc$!y<0*Oi4#e-Fk$VP|6vREL*(Jw+GUfOjWSL!#44w}c_&x!FnsMH+jn_oZ^KH9
zS%LNqk{uuWQkt`#R`2NB8}4ZN%naqV8Qk<9w}SZ(S6whdL)5ra*Yf0|)I1T@k=;?>
zLd72DXWSy;X@CaO9XnGyJzpjPl@T4u7H^HuIBi)ASTv6K*I!CgPcHZL<+<Qb^qnCC
z&a>OyL`XoZ0=dME<4&DG<o~6+y;~THBAb@>q8ROCIaWL0YRuupegn)m6J=sZO<<X_
zGeooIL=b{tM=e4#LX>4(JeEK_)x*xpL8(V<7W43~?z$?YVhT{I4WhrmB^g%RX%$c)
z?{?O#<PpTIj!M!k0caM>vq=DID>=O{#1<WShU!ymsgtTNmbG%Oy^XPmp{1);A3?5r
zkeX{74(^<DL|>SPv3+#(QL9b|Cri^PBLC|4bu;K!QYxzM;&cor6XDMVIgMRjkI*i|
zf#tnuKxZ@e0{L`O!>z*oKnRNkZ4MgQgxrH9DHhQy17vgr1Y4=sn6$Y^R_{67dykAQ
zE&o9%X<s^4oZH^?r{(Orw(gveCAJK4b9|EU!cT<q-YVw~RV{)pS$LvFF6=KyJ7iPc
zSgmJkBufKAIBtvc@Kjd(%+F5SB+|z>Pjg7lXo$MDqz8sM9w&J$-8)^+?<Xy>u(jn}
zu<n}U&e}A?)vh^}6>vW`f{f8LY(1+zixY&bA(&Bc44gL@A=`a3Tkt68kmay}-I`2F
z1Bbzl5FCqx$<!5dOzrfH`pt-gf{*tDq=|15uPomU&v+?&r}zIO>@DM>3cEJm0VE_u
zfsqnW5T!#>T3T}GZt3nW0fC`Jy1R$&ZcvaOx<R_T;p};S@AIBd?>XQ2$e!Qc_gd?^
z{_DD*n#P{<M}F-1v!u($dutSQWn|l!zUh6OUQB<Dz0R9$bQf7{9bV|>Jw@s?pUbNp
z?C~(W6ZpV2@gu4+u}%Fp&knjX(jsb9-q5F7Fl7T08OmsH7oAz&@4DpYadb)3US&_2
zwtDZkF%Ba}G|i5BxoYHy^Mm|Z1Py)pcRIQ_Tp2g^M8Y&sx$p)qEs*AB{~SdP`>V#R
z=1FVh@WJ|m!>hZW{T4wNI0G`yHaP!Gj6mI>;7WAH$$NXbFW$8};@H6DjEfHy@lB=<
zi%Vi}KeqoGpo=AT?h+0t)G-M^?35;|V%A?F9c^7S%oe_RO!b_;xokU~Y(c!XEi(hr
z2z~YiqLDw986`ugEHC1$W`rq!_U`6AJy)DEx-kKI2s}f^TE$!g`EdEGZ|e28W=H{&
zV~3cVN+^0%T{*K)*!5noIF|I1`vvRbXo|Zu(mv6?Q&L#c#;Q@ArE<Q1{Kbc=k8Lam
zN-#-E{?57rr%@eeG%=f<%>-dltGnW4n(B7iOxge<3;|&bOq03TkHq53t4x&(3Us7y
z$~N^F1+<IF@7esydgb@gz?tr#NGex?X9ah1cteadh-il6m$UusA>T`os^iER|IO}<
zOgt!&zq}-K9l|-kUmwBTyVr1o)Ao-?>PV@-5_q_oID*$I5h^WCAfsK-c<B1xaeHh%
zxPk@p-xrLQ3D&vetb3pD^t12YjzLe>4UK4B9pkfG8ejj9Z54R9>^jdM8<!&MxY<6D
zEAak(Ahdq#Ojg11F+XsC68<`kk%tc2rdJg%M`8zc1UnzOFqGc7)MjhTcmCch%M{D-
zrnDl#CzJIBwyzp<M4{-%Wyy9Cklrc#UqDka##=sAN2|*d?|IwS)|Ot@V1Vs?8idCl
zXt7^#CYU8qkbbyxJd{oGR#qs{0xfTXV^H<X7WKJ>EH-2NcCqwMb-5s6<ZPqS$GHlJ
zR)f1EzCTsq<*}cG!>&wqWJZUAKI+rg#BDd}^Jbg8wsdnQ`KIHS7g_`xCWQM#bJ98<
z<g}@17LA@ybF{FSpeaOKR$7TWj)j8IextrO7|9oneEG^DfmDjD>x>F9*;2E6&A)L}
zXt92q!$--NIF}2g=z9p3P;6qsacj|pQiVk{XZ7`H-XQxu<3l^HZF>|fh83^F^n&$2
zl~#gEjPu27B}4F5$ovfWU%!Dv!PmHbB&_{{L<Ap6uamRu4nbjca4!Grnm(}w`{Cvs
zn<5}hFy_@LsehWMw1$kBI|T#N2Y5c(zC|hu!+jN3b81i)34v_Z8a9Wi`4klK@7DtH
zI>i1$;lST0_G+@4F@Udx342qgA)XmIv9wi`+j<q}QPk{Dze=#bkqXuM2K4V}>8nE3
zIK@eRAH>jT@a%HqjW=w-#TtF09~G^feyIW}i@ns1_c<~}*`*5lFhhMou#iG6EL)wM
z7cQP<h4pe`?0cqY^4y=w-xXJom%UqGbCoeitFx<=3u{tdCJfU_-)5{hIjQ3)ij&^Y
z#3V21)_<afhi6UED~8pMgt8(D1_zN`)zH}dLecEKicUsFXKNYAV0>O)EG8L`t_hSy
z5;I;P$rJdBn>^RCMru0h>vcT>#C7<_32nC1QRpH{n?ome*NoO_JSTJ~Y+bAu&bco3
zndK(DZ)sb1=A+uDv`0{LeoRa+d*_&;u-F3g4#CFZYoW?l0};b$EG{D%hAY#J){fk|
zP4`+P9ydY4YRg{sXb-J76ds3@gaj9mv>=DPF|@pKpv4Y-Tx?TeJqIj{yuabtS>uO*
z6;ef;K*zH~Gt=n#@nU;IiKFx`E+Hz5c%-%1C^taXruE1rnbkAj<j((LBp-K+L7(NV
za&_90ls1=+_k_BK@0jo;lR~rtXP$yr8}iu80A14zaiHfZYT~1UC#s+mDt9ErjPR&H
z94od1G>#@lJGY9aJT=EgNA<&c^`5K<Ua)%J&O6N>i`a1stjCb2Fj!$hC_37hagHyH
zje4J!1Cu!~6_TA1Wqj{2;{5Lr;y@hod(|C*Zie11O&LJ)?M_Di(f5?%NkFE~Y0r-a
zNzRbGLl!~+_E(HN``BZ@d;9F*4vR>F`R5LI-MVK7bdp1A1=HFvN96fR5f@qmE2Ydb
zQ4mZug#E$;`wnkJNd3(nQP0afdKA&n^TkVoCCvlt6}t}s-S?z!(yXZ{o>hbF31MbE
zb}jhp-K1YshF)lgp0(!g>o161Nx!+1c9!Zl`+e0G0%{YiKT?H0=^wJI>h-y1(s#QK
zF1<PNHWa#B@(FHA)|+ZZ$mLBGY_lSONz>7ac(PWv+U+So2ppSdCOjfQvc6C>f(xeQ
zpWm{y+eIOZ*Wf01>60pkq*!YT<RTILQ{J@r5$5DqLMa_0ZR9r=L(!ca8L!rmvU_a2
z^-bKrQm*^<;N?IjM{OMR21(5%-+9&PO5=WAD=1rls+8^N`roYtqnHFCY7jQN8kXN?
zMTO*JC2LHTWBmk@|F5DFM{!F{p?t_OI3mnv6}Fa=E7Dt^m6e_~$$$UNsddVUQ%oN;
zDo!kb3t@3V3(uikCn)Z`)?Q^>g030??yEmJ@O)^uFSJa(fpKS8_qsc#>?66D=jFjG
zxraO4_OWQ4sFzbWCC4d83F9|Z!Oshhmbb8P9ac@dc&M=2H7_}I+<Gxqe?qcTuYM@X
zPFC8tXQ6Bp%0(SoscC<Lg0wv>UHRQ`TlpND3==2h1mfDXT7XzbZLD;+Ra%dKMg4(?
z<=0NcrEBcxSNtCB*-H#7hjB^e<7v1{rHRb6tf7xLH_S~A_mk%v^-?UetOt$R)sf%P
zGu#r>eaw?9j7wBY%>ZY8r@_brV~-50Kqf^>DLrjhJ=ZPDal878@a&@49=Brg?AZH!
zEj%IRFRH%JD|&P_6$(W!<QB{gmFt&gb;mKd=6@SXloL2kvj=w$5^DVoCx>;FLD=YT
znW{+3+tPItZ&M2gN~-EN+hp+%o5Z;LSS6gRi}2T5>gM}1nDYnA$&3Z9PHzDLbL<bl
zyp5vCW#_+sid^&Zko8aQYwweRCahZL=ep-B;K%lO#Wy>tiO@pk?-YhXW-jTcS4P-@
z=O>UA_Hj^+uttrYZ!P2=<cL}cHS4dd%omKU=Pmh*MhKmnj-RLx4n_?v#%3O5EQF)R
zAqUEa;FxAI^yJKdavAi+rlo!i)xh$;#A<jwq6Dh4fxJTPv0)DP{H&nwA<gu5>dXw=
zp}191;eL+Kj=eMUk5iKg%#|Em4%fZ3wG~BBdxOig$o86RqRzHG2kfzLmaY*m{B`2M
zD@1RTjOcA-*WX34BkEVg%J1UWgh-6F;<-c;#rE{XZ|nD4tcwMAL8{Mc%<7D{Y?M$@
z*%XPPP7O(vr_{VrNaAQO(uP73=M8%vPaGGAyJP<6v@bjmk(4AVI5q1RMBb!bk!VQ%
z1&?Rui;#AVVzsm=u>yTq;wAM$QpXgUn6)cgNj>Qs0IuH%oHU*M8;8j<EJjl*3|u1k
zm)lo#w|CV*fm228Rbsezw};os=V@pVP~cd25&i&gmxGrlLfMHD9rPR;8qB-o@9_=j
z>Fa?E=X*0f<zG0%^97#X^WUBmtk$?LJACB#Snfu=<&z+>zxET(>*jMg@|JSwzcDM~
zs)_UZTrZD10kbX&c#!7Z6etpdD$Ck{^!Ax;8^kTB{Z&>C#)=L6A_sh-bm$v<*s}9N
ztdR><>@KWmp0;1nKJ*j)Z?-4_F`(m3)}&Z$dmdt*ag<=IrVwSbco1yU9v_!5!P@Hi
zQecE~&r_4)b~A@rOeMk?q7gJ#9FOGlklfFz*m-)PVLNIalYA&<Aw_4cUF)yw?%0GZ
zBNr~83C{492Mp>lhgyxv$?53{`v;Hlse}1IA1ZRU5Rm0ntvNr99eh<{{1)6!va4tg
z#24|F@@^3R!|H#qyF})(9sT*ix&7$^J<Y-8=!5ZPz;s5MoLWT7xX*UXbSEKh)`no&
z%i)WYW{UC8rZ}&s{s>zl+VQCw^qnB2|GeE_;EK00hR$DUWReXuI~X?ENY_N5d)CcT
zfzsUval;2|H&<!~wOK)+e$c6f20fa)QVb=AP|+*Zo>7(#14ijp_GO4OjuT1?x}U~S
z<~<gwJ{9%~-CJW0EF2ueAfu70@uCRYLE~qC!$IU89j=YlK_`t1a_NJ^29-UP&w#X1
zobl(x{(g}{)ktdfHsF$d=N&w5!4}O28Ng4Ubd|i_8pJT84Q~3r=(SVe%~Tj7EUOF%
zZP@f5>hXct|EZ3jdM^SBD0#zG_}DatCgO^E$#&MFIhRNsQ6b2?*w0YDC23ViHxLv~
zAy+A*@C<=iCY5cdx{R*Thn+~(F?~}R8Db~Z@wIpfo1L-MKSvoUEN8Yz_6fQCRAb-v
z<;--+5I%u7T5DTjib?eG5_&poYpO~bgT<h%`<OK|Mm^v?M|PUF54(_P=Y6W>K@9eK
z;A5<9JWxNo0Pu++*Q1t;H@i{Y;(G7j<m(-^onHh?(LiQqf`hvIwPo}ez#?u~OFmId
z+*@7~t&KZ}T029o%Xq_Q@NW6hQmzFCST!MKX)R5V_g?r^jrF35CtH;6AU$2-#EA|D
zD6x9yWT-JJE(%E}On>Ob0ncc@-eb0&?^A@FU_plA^Bm^Z?<Q@>P1y@6-$QX1#3q)#
zWLZU<IS;l+GNvZ#2NPZiX_*E%m@maM3{Sn<*WQ>q;XP`Xo?aG^tBr~u*bkO|Jqs7W
zeZ!qO_jEk0V?O(F86xEXwIFq+2Z^oSp%<-^4V4LLDQSuD-(|o+Jb+ma49|LUq0d7j
z7n2X}0DnIV@cAJZPpwIg=GX3o#ZxI73OY)%MLKLZJPP-A>xV$9seY+Kex54khB8ed
zkJeXn+B~x89c?S#K3CSZD=*^)lOX2oBfaa2tr4;xK0mx_%i`Ii02g4~2K`zSF!(Of
zj@H>nEHG0`C$crHmzvurYu=21=cMZTUL^a&UZXtqVN}W<Cr^c@EZKSk40B0gR&A~w
zA;Sy5V^m-eHh|sIza8NFL6h>hYn2gaHOgcN0x|w%1g1*g48o^YLNc&0F>N2+i!HF~
zsW;w<S4g!?Ir(o>t(8*i{w2lN0Sda({k?&otZcROe|3bVKB>O%RC(&v9cG{!Riqqc
z=$Hg3O3iAM2s?Q++<18%EEFT*ET9?3D1K9=A>NVy7l^o=OJW}7mwqx(6{4e)wxUbU
zKFJ|c4L4OEvqCXLUy=LfF;P`Q>;J=!?i~K_GCRvT&OrW*_`C$4##FcnPb$aXFiyo7
zW)VxJEvJnw60dLqvrv|UoIBMe7K%b6zB({nUN=+~$9gLizabO9XLpnG#C(C7wQ!#%
zTmh%iE4HL7tl*Y*#sOs`iSv>uyN?y*i$8odt%-_|%T6>ivVEbZl5ny_bHz;eDKf)E
z&<RBu$0ovnV_RJ{DE<T0%R=A~vB*4xT})B`2b3x2^Vm=7-#OXpfsFJ#ub)_tp*V}9
zZ`v}SZpGi&*m^#1tJfa%X`&YtQxSk31dap4Yqz5Bxx!Bk-ecEq&QHQy=PQ$`d@HW0
zNW9nMx;O!b@)GkmDS+~^14v)*4C~lfjr)P1kAk%_w~<h1+rBsaCXgzS3Wv;#90|?<
z*ngb;PLP@%XG3PqlbugujRmM$bq|&(412q=xIf>u@{YGewV#=IcrG#Y5)`Du!{V7w
zmI#FkTG6laE_@%$5>Ze=@>!9@1n~3xJ6Az3c|u)QVX%zoa$V{C_?2|LV#;4mZuTAk
zYZ3MiPW|Hdg6sexuG9|t*qooug9o=;2AS-v3_X{dr_IlMyX1)}F_hpO_1^_VZYSoP
zErV=u$yq`KlJ24_hSh>hb?rDyHLEqb7l8>lUz&+P@c!+7rb5I2Py?yGqOiKl#kD-A
zxjzM%62JM1OOJWo^`ENE|9Dbh-6bl7oHa>g;0KDJ7%o>`+8U%W)W{(!XIksebT@?l
z(nQu_-7L+`mQ19#4`+(}u6{7VP*Tb()O^YDkn&rAP+6S!?A}C!wIr3&yZQH;;m;uk
zVP#`=4Qm~ggFkdz4906SMwFnMq@uC=tE|tS745JeM|mMeem6!$3o=|p3q1|0RcY8u
zlg~SNuS3pox3Z$AIx=c?_&(~2y(arpVO3mN0W%}l_&~K{{fva<#posf+L0}SfXdTg
zM(FlS>5@_3o*^U9LYx{h4tsu}{<AhXY@2}n0ZOTjWtr-HR?AP3yAUbJ4+ZHt6uW{n
zlZy>U-%RfD#UpD;(Wh{4xmKxk=L^^yt+%R?LBHM;Q1i3qh7lHd7{YP`r|ym9SNJy6
z6q85Hxnp;@D^;5{E9O4i<Qje?kaj$CJ&9txNNfrfs}wfpqmSdPz_WM}01N<Y4`|0$
zfnb7z^%QSI3=VGYKqVPxvriEuLI*P#AQmBgDja<dkfm4pn^JJVsW~m#HF~88*W?)5
zKvPIob*R4f7U!w@|H~vKXDkC_h>xd9Y(HT*iJYGARfHY4Z}I(evb8S$yGzJ4eiWW+
zK|$Wc@N)00bs!lZgBO5EH|=$L2DTzyT0dCFR18<X+zrwp@&O|?aA`Y}wO;p}MGgUF
z|2~B|usEG)r7Y#+xKRxG7=QdEsn2OIUX#_nWLC=6vONXA-Sk6UQ;%Gc*TKxW?RsE?
z+rUzd+RSu}FijEV<*>{CSpO)qwA#sXZRz%LOl1C|XWTTvG;^ir^WWAuszpU2U?`jh
zyG)B^jq;YS2~iEOO7aft497d#m9ajwdo;`v5L&a#CngbP6=!f7`wBtOFS^Z#{fAyB
z)pn#vrcp3g_`AX`K<DkC0(&`f(xAC=mxZk*|8C0<s@|Nq2?(CUeK@@xjfomnViurE
z^*rtQ%6>EawTs6UOF~C5S>RR~J4yH}DRj;P&FrpTaEi7VN$2TqPY~)*jk$DZC!pha
z=G?WKl^pg|E>-P<c>50?qL&&GEqv1}hBb6Ic&7r5w~HD6-jrK9`_i8k3$nX+pV&IS
z-0^*eIcfGm3n-<fBfq^vIm@K)DE3oDDlgU`0QJR6zE)*@o$8d13oVEEs8nB;8fhF%
zYOXO^v^8l(W^C3U;w|evH_n^A{E){JyhazRCT7A}!I-QR{|Cbj&mTI#GcbTpFJ8Ys
zB9~dh;fcpae;&P340ic)`<CkE4C2hxKPt~E0a~1_)z|=zbqr;e^ZJZc!RT3~(y-lo
zjUP_ilpG4zvB~h^c)UfKry2r1R$C8?k3N`pFP#cDq<zM8i%V4m#<0wAi%UHED@U^O
znV`2qN?N_iARQDLum;)@${I!oH?M7T_E#4Ac}lX@SE`!BJBNc|1R|e>6D^>y?b!73
z=nN9B4;!(sUq&?Itxpg`BRjPmoSAYW+?P?F6lnYZezvh#amDeK!@NFQGxLjDH=3|w
z@iS@!{MVN>|2g>gb1$af0SEt4v<7+I;Z!<i7-mqn2=NO{d)2BaK|PrSJzlBpUpmH0
z>gJGleiJ$JJ93`Y$&a#z6py#`<#`F|UY$OLH@Cl)qQ>x<`SQ#HQmQhB^kh(O(~1fw
z=w{B3Oh~xb-n_#`@E9r6_p)C@`;19PPkRZSab>(i(%o+~R+T{upr+2B7C!6w?cjrO
zsac%faYtrwK#(5OefaIw=Wa9@vNm`YwqrZC(aj82aaYbqeIlE^z|gGsDm}0@rAb59
zL~SWHIjOWizsP1r&{h_*d`#$>-2RjPR|)a#k*vFG(dSdrw(R8d%R-;8uG!?W@4t(*
zYk@G+&vqHU3tKwYX`GqhEB_MvaeZ{_*u1P_yzKs@)AV?0Pf2LLz`-?o78NEK-1UMk
zNORO#QWB$7?~&el2d<IFHI`_vHr6FCKrprSl+v9f67DXk%<V6-dT=G5JH3>?3USyz
zfTQP+lC9hFD!*OU_=Gq%|J6wr@FAG-MW`lmLD<Nu(+Oo*DCWkp^$?-|Op4O5MtAIY
zjN?Bt*I%X0tG)M#+A=ba$b)HI$_6seF?-cGP->EQs3v6#4-N<D@bm9}_=4P!PSLW>
z{pU@}wf64!;PG*hvWl}fJ>IdFr}ED*!%B(@McsYz+V@tnP-2oipBQ*RCUGmpwp{jm
zQ>B67|AwdXqzR>DWSp4d`#&KgA-+De9?n~nR{%yUo4Ua;73J4HDZLo+GM2I0q5gUE
zs^MEU94@xMp2&m{eV<ibRnb?1NH~)+g{Hf;0mU(%f$KqmfeOeX?rzS;er#E(&+Syc
zeM!w1pswW5+Yb&YPBA7{TrfQY@Qj(z-e+e#S##!GekH@0jln1Gzmg6gZpKF;BNmyw
zK|Vrx1QvNLwId{cDt;y6$??!)ov*}i&EAz%Q$|{t<kFSSy*bVSpsq>fJq;XgsER+^
zWO5Y={7cYcw|X3yuFlUQ4`68=5c1>iX3NsruXdA~cdPWaE{98BB`$fyxyh7YBVB3?
z9cG+@_<40;;<v}GxZ|z$OV-7Mknw=*^yG)r1G>eZdhTLDj4HRwDRCBlA%Z}*+%QEM
zr;5>M{ka0YRB`!scG<*3et^;wNPG}T^X}7#@J3!8`kas|v0Sdrq&-mQoKoa0ZmC5k
zWC|J?zC7sHo7gEhcVTkbYskv-mm{7@dAz@47HdC4!^y%mWv+-Dxm)2U@f^H>a?)Jy
z6$rBX^BH`M=+g0Yu`fPNSJugCasOd+w&a%Z1E<mNM?{;XiZ$^8B^BjP7;45i?Z=C*
zELt?w4f=jPBWaP0==3jpYWD-a>tWRe437@abv%Y7Q|6`^r<X;e<UD4MgbH4LAr{y)
zyamwLt}IwK&E4#D#)Oz!=<2RCQ%lH_yLH{DFL1k6y5K{qk8rPYIIGWo#Q8$3d2+X`
zy9=Fc5~s?H$p+!zPVTxq!4$F1jH#rrX0uJH-Hffk?XTPPDGBwDSf%*DOQmVbocmE1
zA#m8BvSc6)JkWuRr3{}vd9U5pyVrjpU>`Q=ZF5jP#MekUH+%h#Mf|wK-YeI9x$SOL
zL==c!q1T;q^sp8RgWM4iZ=!RPzWK)+r<97qO(=?X4KqsVct%TKvTLqacAc&$tW8Ay
zQ8Yx@P*OwAhnoIz3bX&yUJIez2P^>H2nPx9USogO5>;oZ{c}9j?Ktc>Xf%zOr}v16
zXAOsvIfU&l{>8}0uM|i7#~W$TAwFBUi~2k<@C=^5xvp(tpmE!2#{rw@y!W-WMNZJ&
zdzBB0IyHBOb=frI9U`mverd_>+1JH+zo72fl<U`eEjWEnGGUH>s~Y=c1X_c1P@=yC
z-8CR8CA|4(1U1kG_z9sqc|kHEF@abXg9R6du@+64u=^w_{ZfWV+@vw|9cUy!zs8jB
z@~vcAN_)&MYSE!iXEM~^nE*82>%}c0ik5k~@;N6RO3T3T>)pQ0gc56~U}`h9@y-3Y
z$FKZT1{;e*<{{(W)c5mSUurmkrtYOAq6EA>$giEI>{PKliqcqmcfqM>7iM+r_vQT0
zLX@bA4`V>~Hg1V3ruX&z1GP;_EGD`lZR+iP%sC*CD+4<z*n9~B$<>frUFAyaewSVT
z26_C+ul+8NJ+GDFyQ2B%MH;5dQ50T|T8^5VWkzh7M{^WaF5AVmnbH$)bu%JwZqqLv
zUrMf1SpEYfT<w_e)SO+FMzFeF|B=}FLzrR1SJ$5O_*a_!5^A|0Oy1hYZ~Hm|=>Ns^
zOoM)t9umm|hE|SQ0#Sz0-Q$w=_42%C(PEY|X2?yW+GL!+h={QHSTn__#seCS7iSab
znE7%m@UVXZkW!}JJT6Im80&a6ok;S&v#hgZii=Z;gWqmn-X9kc{k*>IW-bKAeILEy
zVvZ63^&NhFi)3u(b>(5?Mg+n|4Z(hUwk-JcHT3x$9RoxwXt($`FsSoHw4Gxr#AO*f
zJ3GfNP^TR~>|2#;)@CmZX$UC!IH&88??nN}{zbo3U5y)XB<)V29sFTh5BBM4kG{oB
zpE&Jg*q9h7=0SViOIwCCV0d6ctk^@P(vtjTk-#FOtp-@;sdSX5McM{yh)WS*DF=oW
zCp&A%TB978)M`W<w5r!@s6w#6U~MeRCCb~jkdmm!iwFs!vz{|3Hp5DIh4QcmRj1)+
zt+h|rK0`<ry*OEiBqZa|qwXMxvM7dW5x1LsKdg4XKWL8GtH?-ich|oC2-MCw<JJB7
zx#0K5CuRnQkRZYDwBPkA0oB}pJrjc}SO|wac*Gd&>}6Z!Z?Q{a#fpuCvo?c@A6tCU
zhimy`j=itDF=S*JX+HgzHTK;ttIPG%bd>j}u0YF8f80CY7P2iNtI?&|On5lI6Q`Fi
zb#E{);r#H|{#Fq^1>Xg9P7!-`>!F6AqPl6Q*fSyjXKLQfp+Hr#ZrQN<uhloyh4s9Q
zGtByzT=E+vA!`VXfcTMRSn|N?T9$oG`!F_6jo>Vb1htE44BNG@5;KPwO{gXWNsOkf
zIEf2HIsRLOTFEK;fSW@9w<>lvCkv<ub#(3yG$3PwIw+*5Sz9hkKh&BtPCHjplqS50
zf45mQIi)hMZ=&GaUs<X4`G!|?$g09brsgt&+dzUaNHYUWsAJvX@u_<_GP9;cpb9we
z#5?|1;_XG8GTco5x|kUILDPD8OpgECGW&wpz9iI8eJX-!!_Z<{&6%lt$dsG7#wGsV
z-CHu_!F6l@Dyg({w3lWnaA|*qWWcL{)r;MQEc|!Yx0gD+*P23Jj*9|lnZIYt+pJL@
z_Kp2dq34&2@`AbzZzS@R*b|?|?wo*CIl4LF+Or*rbmiDR#t!!x#Cl~yM#1(P-{n{V
zx%9j%T{$X9Uw9I37La@dh@%iWo5*<)bX3$afK;1N)>u4b;B5f=%eUW#BN!k93Yt-y
zJ8QOO7{_Kl%nmOt2-w?@1q3AqD{lZ~9^19`A(+~sg%!dwjXWvjH9l)}Z7NYD3cH54
z%c^gwU-$Rn!1rJiZ^B5Ha|HWX=K)Avz5r*JDs{84JF12j6N}zBD-R)sOIrs!^`!vn
zoQmr?h{}4tRqwgggKr?yLG<pdm!CB$eFk)ey20OR!s8vwBG%RqvAdF@pHHEGW%6YG
zESfKiN=n5)T~F~0@tLXC=z1o-mLw*`7ccs{Srj$reSASb%$w><iNZ2lX$>>a@c&gs
zLdRHM`z4W+J7#t4?c*I`2l+4x|68(HPkXt~TEU!^1bANCw&s4(sA9nFK;>oF6gPnl
zc8`Q6D4%p{uX4#j2KMHR%X=_|hkeTktPW1V@<p4qsGZQNcUB8sTYCR?woa}%D}+Pf
z;|6vq0DrF3#7aU<C?>J#@_O?og=-aS1uh+~!6TMYCPGsw<)&lFtP+$*-ipFX+se{O
zGlvQ3YFkJ3YriZa3r;<WGW_MNduJuj|58~f4f>rNdK-7$hp}SM<)5LTF!ll`&3qbA
z%WT&fO{@QdT}F7Dz19VEP7SLVr}2LnW<?37j>cXFL{?Sk!9UO&3O*jVjy+oWAj^AI
z^Son9>ks+NUij|las4BD*bSO{^jg=Dy<0Amym64GEu7cdj-fy%_*Y>)TAWG`J6+dI
z7^&^Ur>b_6aOmeu7E%(A?cnzuA#6+^l9=uA`CPCtTm0107#Y}q{ldr1|0t$otU}yf
zy++z^7JMmA`gWU-h7L<vw{{cr`6hwT8$tSo_miheQ-3gO0ujnA^?nt{6b(?X_5;dW
zxh-ej-kxk_1Wr(@c+1q-+Pv-)?Hy%aF2lQBRlgpImv!<Iv~SuPCgUCJQz3nmLVEgG
z?#nse5Q=YhaI44BAK>tjfRDfSA&=S#Ac98G!&=oEBQT;eQ_4u?@ok$#I1ZW$d^Gbi
z;)T~mfU8ul7G30XO4=VPBUP;9isJ%?-$(-dkcHLOVG4S_fapleJuF*G(GbsCyETjT
z5_HN#=G%}>hI!a{!Q}C8DLBx1>2+JPK9i2?e1r`S3XM^pWBGXEpm_77Jm)0?GCoB^
zSbqCWaz!=UJ%iQ1oURNX4KWm^H#DgSi8)PU<;xG0un8q@<2mKz(|u)wiA(GGi60cx
zC$&|3=YJvPvb(7t?uYu+FxS|Y-D7OpB(P_7|GTl`JRoc-hVTvMaCagI5hu{$iaDUK
zR(9z%%j6t!(CDCa)TPA<h@t6&SBi<_<J7)@;|#B5%IESv`fL!`dAR)mi=nNQ>g*+c
z=*TKe(=d*M-8V2xcpW{bi#pJv82D}wkNZgE${SE(Ayti_GW{kfd>WJSElTFEXtJ~<
zwsEf{L1rbi%@#vQcARXC&?j=7af?k=vXw8_ihaf9psiMpLaKrfVsmgqelqC;PZj~r
z@S|$7rhc>x$D6Z~{-a3j7wEix-7d=@sVy*NK<+hf$CBI#{Uz$|-}L>cxnx#bak>(E
z-Y@l<neF6y2iB=s>R#yU&FbI81#2=d)1sD<c#f~i%-ThLP=%8aRV3{HtBP<Wj{GwZ
z>PCshas=T7MKrK{^evFJ25#q#ANM!Vx+u67^@a~*nqdmneUF16#Wqzvlar?Sv$NA$
zxtokh`j#H~-9?lqQE%V-lOUBAbNQ~_tKNlpU^80<Y{xdy#I7M|sHL8oXNOVYB&?kb
zU^ZV=oRegO)Zm;Pjbu+9F577H0D~lu5G$CS$s8Lo^j&mvit&`#xU=)!y^*NaWq$*O
z5q$I424W+*3_%1;v;JZXM~svap+=4*s1|8O!KSAXQYX0o+O(xJl;jKY!rB}@Z!83z
zZ3E=}%erQ(Yif3YH$dn#(VI8@lY(RSVpwLK{a80ypH7Cf?;0dqU(`+>SL8$ATzc>W
zYaSQq{9F(2!cCU8`=_rG#^8UVUcpIFW)Bm+KDORY?R8Q6@I2x3+=W+@>}7^0k8`x1
z%sl3cG{30XNod~>wrM?_s}A!x-}$qH9fw<iP{0tIS{#vAkJ&*^lYy2bQDn;usT>)@
z6nt<5fzt5B^Y-%t#!8uP05YTBSM#>e4r3#U@sD~8ujDR)S$?!IOagPyODE(gk9EBa
zPtJ4TD<T=dxQj<E=&tH&7Oskv2DKV4soowpAPg%GG}e*llPc840lAzdM|25@zh1KI
zcS~k_B3u1Ayo}W)UN!o^OQ8m$Kx<aa3x)7L6Q%xCNQ{iZHV;*|FNb6{1iK^2BV~W;
z2Hhjw<0n;X<`qVKH1?ZfDJQw!w3Wp36%p}P9%`3^3G60r&c_g`SIX-eP}BPsFQef5
zd#S2Rh=E0X8wZxzvnhqGI?VY?0uI+bI<nJAR_tMdzmODcaahG+5uAR(Aa0{<zGg1W
zNi9&(aQtv_5i86B)3N``>=Na;x!OSR@)Hr0;%{f0lB>jo$ER9~b0u5B(hDKu8I1!q
zoLe|=Myt+;3~9(<EvX^Wq<(bmP{`_XQh1}hS}#Pvkh!YIO*L`Dm+=pxE-e24)P-ce
zTEpwVHN)5><Wh@SW*w;LFW4b2OD+m=IEpgBCA>aVFg1eHa@@M7<AEm@mu`QL$IASr
z{LE0JRy0X=CQdQivkwO=BH$8x;Yk(TxAVEx17Ael*n8Q+X9vXiRGPTL)}9`DI|QYy
z@NY5o304YozBscdWSN>`AvT&-2b`zvhX1_=Wvk}LheE@Rg7V-WM6#{DTk$+VW;iQz
zGW0Za5*)Py6y&K}fl|zwDlJkmz!ql3f2-VcM3tl7cbMR?$n&w88^5P&HBYtuAC_k{
zE1FQ}P}Snh1I^Xa!s1$wqu>KW&VH)ZykKFI&BA@XwEE<sC;$(8*Spb@Ej5<3{w|#c
z9NA3saz2UWGWAVW!P>sXNWSEyl+Ou~+YSwyF@7{ho=ZtJoAn%Bwcj49gYni=OqBiB
ziX7=2__$ST_(!N#+|DD^FemM!Uw9o<W!xB4i1^CO|0j;1jHr02@=;Ie-MWgU>O>M@
zDr0zz<LZO!f&}h@bGu_DA15pF!;cr4dOqNiI3Hj+br*m{@J*)$&(F$RC9nAD1h~*H
z1ykaINR7wNH=4SDwEFDgTXdS!edu}j)-snnkqUgcavyLwUiu`giTiX;y=nUbYjHoE
zS)RWF8aA10-;&=x_YSCOZrbt+aSYY!2tBqEC;HG0!LRH_lIb%FX;GroV7g7pbld*r
zCDK$xkwnVrb-*;u!2uC(f|GK9Phu(MQ!e4iu-f+@MEI`GJPsCCe~;wnV|0db3u%4N
zg5|BpbDm=+_?v)uUG0Iq-EPMET(>>i^5P<W<Q^2eM&|m|qd#vTTJeVtG)VQv7siE$
z9u{}Rzed#j|M8PeR8m|P$~Kv1=8!aC2N}Q`8)|-FLVNt$b8s)Otl6?}c$#;%o<Z9@
zZ>l$NM6D>6Z@|k$#ISHIeU0*>QsNG}4i(e+&f=L1SmZ&eGoDw!^&+ae?#)YoD(?M*
zmgee#Yx1nqbgnjA-eUojQJb$HI#rer>wtPeYWq2b1JQ<B?u%3(3j@}$VM=by2Z^^I
zeS=@Nu(@mY9(Q(T-79N*iZwd=H}6IdKMZk;C%fmST=js8Usqt#z;z-xLD8Wn!~}Q_
zk{1)(pYK2GT3drR2oJzbnfcktam_0BNEpUr;c&Sw`x;C@A}FkZLB^gPJM#n-Mndy&
zu)k~-f~FxmL7L@BstS!6mkFDea!9^P>K8;AVgP0I33&=p0!ph1{SSd83KZ|)xIIq*
z6WzI;@291|hkQDUa5e84HDEIR;qebR(l@Kp%1LU5&1Cf$?%`CDH7(iSnaDgpGisfr
ztsaU?h>g+9x644Xa70T=OY-1lNy4=ga%4Q?%Oy|B40oy0!#M~(KbETZvtnAaQOWe9
z%)^MF^h~eD0XU*5!-vm$_Od*ie>lT>kCT2Ng2C^X@zsQUW~;{9-iJGF{4z3$5rNC_
z2T0p34YEY)LPX{geHFl6UlD~6Mr_H>>fkPkFps1%y+K}Hynf+2eXO&zwZKL&y>)3H
z?|q7Map;`<0GTd{$2%)7R~vu67zGrQj}gad=^k!qf-g&3lE_H#q)_J_uJhYlrY_&t
zwH;D*s_02*51S%b#A4o>W}?j^a0eezCRu<*dT!<v|7R|^qE|1s39VPWqsOjQ+&SE(
zR?2lMtKM49C(i<E$F?=OM=@vK`Bzni+}YII!Wzk4RW;OK$CIKXr0DCbd|#&hvqq1g
zIXY#ayQO`XdK3(&@w4l2hfw3-Jg>?Vv(<lD*_7XTIRb`+9wE~JLB!6}E7EOP$N0Ef
zVu96q*m6If)mPo12N`z!^0T$vdx6m@BB3{0Z*5W|%m}ZH*lxwJ5QY6L)}@bYHDjO&
zq?8**(<fVL`u%cT-A57x;hu{0y{;y)$aTKBAGJR~nnyvSY?u%rUs=1f$!#VqB{m9G
zE<4fhEMuVFF2C$RGW^IRUm<w?1g$Q*F^t8tAQnuGrh>qOC`|a@thR`kkO50E^}K*I
zwA`mPY!ZQBlt}JI8Cn3*sCwqZPHyO{(eFDlsjA#HBxc(S4K*!42L{4Y!yX*MvHr|#
ze}hIsugrW%YX(-RFTV_dzWfLln|*v2<oU8Y2wmNrz<ckSVr7WrvA_iK>ic(-w_PC{
zFo>3->RW9dxLg+S`vcvQmAxYqdc!V8GS4(Gh0#dn66U0uDM}A^;_O&)@!<2_KFYAL
zuP4`U@FKRf(SV`pM@}u%?$}4#ERGD*&4M<EOL_7^jNce$2;zF~B)YZ_(F6DORyBq@
z4Yt;gkvcBb1U73;J<1-;)l8h{<=6dCZ2ERQL{dre%fu9)E-RG__+l_<3l}+Z%i8tf
zEZ<4;lfP6}j}#Tm1FC@-2S4LtysQDRk+O}*t@sf^y1hO^coxBZQv0k-Wpmg~g7775
zGeBi<`ss!@jpx`Y%QHdS?N#g9oR!$3b<APrv}tP=%`}$mJnx$AZX3d3zG$BdBhf?0
zB@)f}`%rj7WP5sgR;c58BH|!|o*_Z;*Q5QbCl&6o1~Ka<o+iM#4jFi+g(x2_H|1Fs
zea?iz$^5Th{1FC`q7c{&a_GEMF3+JVZ~p$;`!clR2Eb8d<oWLdE96REN_AK)`)}cr
zOJSJ~P46<n0w}p+8^!+HSV4=iY43osY8z${5NNdeL<rH2o8kiwzsb!?`EhA7!~hZb
z_FeOQXU%bT-?b;nXgr1h9x(M{@47<X^1X%3b-Pje4aB&MdSgOM3LA38m3s||HghBT
zKGh%5R`%+!+w&-<rDQVECrg)L`@ItqiM|mIQe!V?9so%k4l^lrq-QrqV+yb`EgXU9
zhd;jJ!+1Ha(2kd3+5xlo@+qQ~MlSx#2vg=4d=(tqgE3q~_yIH2B8k3Mkw&+#KhR#h
zpQY`oK(<%-d4rj6#LKB#Ucc5ql4BX>py`JB%xiOsm8bG(?CAVcQ#=TD8$B70KCM8B
z0XFE2QIb>{%a3Tqk!J*lduEL8v+RRF9Qy@mN{Q%4U!o?OUws7;u_N3UzpEv2IS!~N
z4|eG*3ogdjkK$IM@ks-_<<YW6Z!JujQIs(o;Io+|*pn)@*p`cbECwhy3_4~ge@>;`
zBunc7fkG|?i0;d6a2AGeTQrR*l7k2VpZWFt`!se|WK~6G6%?Gb1Y8iV&)xh_U4eH@
zLq=~2R%qeExP?L`4L>6zWmdx4pFP^k+<h-CZu*;_U&Q&^Z#uTe#S5v3KeF9u_wXLb
zdcv?I)UZ(G%^GJ|Q4q=<M#}?uV~j1s$@K?-1z-0&eJ)+-9Jspj-z<QI{3-{Q%aJju
zfzuoF@rOvUh$E$6bEo)iWz2!3ybUL4`i@^t1QJH+e!#J!nps<|{u68^glH3lUT(Z>
zLexhc1I$8kK)?~%<Ahz^B`f|?G8@U@)xJf7yxjGA<Sa~Da@<>V>c5`n4l@2Ze+bef
z<2gmXbuZ=S=SF+uvlMjR6A;xLXozGN*=&UT@HkB&EQr`ToR@FQPv@6=ImI>I#kK4m
zX47=1nsp~Hc=~?P;XxMK1h{Qq>X!u-6dqR=W6Z}7uIL6PF*lhth1BGUN(#};?&q&8
z33i(^ydOU6I8Ek3FKOI>k^EY_Nm_l&`kmh<y$z93K#EQTD){#Wy-yw>88lkZ?cszA
z+5hnw;I4|W>$#rc9++*BSKo^2@)1EFWp0PISN}IkrGDXddm_pl01<<{g@uL9fRrr6
z!iGVs>gp+l+UQDHFh<IP`ve*L#-l`#vp7N9@vXGe5mii}$fDh(^Z6S72-e=Wtp81`
z`Q43>xztvQiSp-4kd?k@;O&$ReG*dltm2ON++LiN1TFXb4T=e6m>7zk&t?@h);#Gu
z+JPjf1YnA-C#mGe`;edQ1kL?D9oo0Alz`}}7!-jgB*dScc~{vX|J$}i38^<KKP8W-
zrT|f9#g<6$6Bp-yhGEl56-C;!ss?iou%8Y)&PA=R4}0eopFB%_!7_H^^Q*Oe&Qb%F
z-mJ=_@;9gpu%vZSu$zOCJWNqC!_GQcUtfD6FGZ*z{bf~EH>*It4sK#oPEW(ZECI+a
z@Il)AXL8G;;A}EwwXDJtV+%`hitB*0xwyF4Nk#I2VamPV%f=A3NlP*6Nlu#S#@1K*
z=B!aV9UbMrH4Dx(AC70iH*0&JfDear?f)L!i4d_Wg(^INQ@D*O_%$RfDZe7atj$WU
zz6{L_I!CI3Ryz?AqTXf}x{9TIm0s+0-VLrH={YuX5YE?vFpQ6Z4@atKD|m*DeQ{OP
zX*|(>eL1OV`{G_1c1FWi%EqkXE>M(q=Fw^1Q(o5g;}p{cOC*UXqjN_lR?uvd@Nl(2
zPK+=Z-FwpU5bGnH2Dbk62MmgQUD#FZtc2n-IXCEl$dNij4D4q{45r*fz?WYKW6NsF
zPgZO)f#{^2+R}C;f{wd{y<^6?85n?!AT}Kv5d2eC@(yk{ivEMgRo+-acsABB|FRKS
zw8wiT#L*mxL<<}QnekZOYB{|d$(jbyES>%KJ|Fn27Nir&n~(m`a{kdk$C0sRHS&br
z^pRKis$HukR*v^ZS!@vjNNwrzC@c8P9!r~Dp4WpnvcDJa((%+?oz!qymS=nXPuvp0
z1}^^%2LHtx8`Oco>+unfWb{bJAdL$!4jK>ZNX-ws+?#?MS5nW+JLivfY?w(sDExiv
ztg_ed(rDgn1B6voXG)h81!26JGGyL}=UCR#K0kp%;4V_`(7np0JTrYUM_zue(X*f;
zYR>fQ%uEpr{l_qbe5SP1+5HY>Brj@{0k9SoxNrODffPSkaKgd*u-B?HiT4ipQsl<s
z1ks(Wk-lG?_)qW-6igtI#Ygu^NDEZ+mqpF)&1N9xJCI_v)x3@KhLVu2-*Px7BefD$
zENaB58hxoJat7g_4{3zrH%ABDew2<HNQ%rY&>PSUbx%+wk#wQf%WSST;dkJjty+fn
zxp9ovt@PAN{j5LJeG<^Db|aHNtQF?J#59JV|D%ao&%1C(*4~rqgtwX0o{>Gg!fFl*
zMx6!eyZXtT2WisB+KX)|NnEnc1dSJa`}C`oHhicwWLM6qm9ZY$M#;102k~dBbd(JL
zxCUuE_tO#W4jDE~&#s`~pTIN4vF+wGSP9p^yn4OmAkBfOB3l4L`F~cCAXtyO4wVn3
z3{D5z7+Hb{7fWtpcSUwNcBTajO7T0G5dLeDKj!d=8!BDd3;aFgmnpF`$zOC2J|c^;
z3VAsY7ZT)^+x8Zh?i8gtb#`V~ma3w;5x=Yk0w^%SO3^B+arT(GZ^XcF4;m7`i8U4i
z+oTkN#>Mvwft7}qpXlp(=6zGYQS-Wz9!XC)(U}E5$jRDlE%fdgsoB-cJ+rWcSTX}(
z@waDx5vJHsRAuU_K2S;Ks)hp*p>Y&)u1ueD^UxbCI7k5_oc#!8+0Pl0$(Oyi>hw2y
zal7HLe=H=cyHGa&^oY;Z=zLeJe1a_Ih`=Q*EF!PhQ7~UgZkHN1P4~<Xn?sXhV-lRf
zM3ozWOTc^bSND8ckQ6+K<dpVg%PDA9D3e#u>`CD)u!<p;u^z=Asp@-{ldY}%-(_{0
zV!U<y?ea;|>rM6V*@yo-`K))=!hA1}hZfz$(&|wm@j+d%=F1@oJ;mjT+lG1BIv|FO
zJJ_Bn4Cb4`wmle>5nAk}``<N)z%%6Ck=dFkLnFh$i|j6hpb$gh3sLUfQ83y$n)E%j
zrTp6E!5>7cGx2%Iq%qsP;02kr5j`C?9e33<YcUHGK|~bKy<~vNukJ*|7GyG+!RNM-
z|J2_sv~#p;*>8|9&t%MVSGQKz#x3M7bQl90_8n{2+QIWC!W@ux!;IGQ^y#@KG_<px
zq`wO)v2eDGRzQ;FE#{gVJlTDLy*)D$ex(U5F+m<Of%Q(XmRQ<7<q0djQfKGP<nN(j
z`k+jB|B*z*mN?U~W6J_<yWIMRX$BP|4Lj41qa8a7Pc<|lG7#){Ci~ovNv2j-#>vt1
zSenO2%rOqWSS=)aOXB-pQ)S%I9ljR=XV?3@q{<3ek-MR*y7Q6zdGHPhtQx7Jx6LwX
zF8L&FzO7bZTlwG)o306R?c5LK`XK4keWFo7Z_HZS<rdd90C(38j9`#Un-z#8P1(bQ
zJed(wd*S~*wTlZ$x3cr+Q9ZHl^N@WHJ*5314s{jEpcH|+$d8w<|5!D^4n^MQ3%6}r
z0YeMkbv9JEP>_RfHq}+tMs}z$T|U3&XzO3_BVq;eIuta7@1)NH7Z(-4;1~K?!k}qT
zIRc;Dt*SJ1)+kIDet^${s6SQ?l+u@!6|J~e2M)pEQdwTfYBZ{55zvsF>jvdjxAfP@
z`opGqlRwbxi$8{ko#{Rs&mM-3^4$OW0FcN)#h8q5I&0Ib2cC(-(Ra8oo|8=A-3FVY
zpw>|2-h2$_L$k*AYdAoF)POlsdDk@2D^#pxU<VX_MLmJ<NwotBCM6$ia=#cK7wY!o
z5g>`7)k?#<l~A6!&SeU~PRm<X|3wxT7M$G`Q@|-EB7gsDcP1rJBKJIJt#O$hfjW48
zaY$fC!w2r37L^cV-A`UWMQR6hGM@Y^du4^$8o@rF%SuzTuG;ne3HCNhdhy%n(xMs}
z_n0#2g5mRNd0+NAj@^j(F8WOjEF2?sA@_AmXULY$#f4Pc3r_T(9dE{8h`r@vPMEtA
z%72-c=G67I=Jf0+4(vnIc%B?xb3I7il_byeD5`nW>tK*p$igfbB`CoknDM;E*Xz`X
z-M;G}yR2!@1NTrGFlXe($hVwV>$Hb|u919#IJqc5)RiSmn`;T{prMiZfER!2NF5%@
zfkoY5G2|Vs>;4j<ZDG#I$*~<4(rnKZp>#__EZMt$GPQ(*FQhcma7PR2*-(<5Q<dl^
zIhEhC5qYq6*HsUcV6b;<r_(VfuNEZ#qTG}U$J)BXIMne>Ud>_d3)G}qvB?c{od$7J
zrtuM2@GHRKY|Bfj4zkNF{#muLbQk%yY5`Q0oPKd2hE~>v<=LhZQEpKS#atZn*Qz{V
z<iuy(MJ6Dbc@y!oR;3Z;#7Vg5qQ9tE+m|c?BVJOtGjAh=Rz<5?cf+*DhqPZebm-T?
z9nv!X;oOwYT@Wri$PSHrzijo1qxl92H9CqBwPP9zxE{6HMqX)vNf1@^X6zO*#a&$e
z{zMK0f_~C^M|L9etOhQfb@|*`u0-Rj2GX(_!|Nv0TA4x<%|+<t)^TsmX&?1HCnix~
zQvnTsi!S%XE^DB#@rGEcVIE}LLRg!pgdsGeFp$Lhb$|aXNT49k$&Sg!0eeGPsQ=<(
zAZ+z_h`Oq@l;!x6&x&+n!>SNJnBZ{ZV^*BN+{5$d&(|p;eyMco^-yv&whpFTU7q|a
z3HJ;4Yef8;jVEzA6o}1O+}>>JmI*~>@0%jR?IzY~O*(AqygW`2<a`CEqq~K1Ha-~G
zm^k~e=rv;9)qw2r?0&mc$LqrQd`C?xPMqfFYimNmh0TN1w!^0h<`T1xAe5j9U5-;J
z#GZT?4*~MNPQ5{Ew$GkziZ<P@F5uIhAAWCywn;dBUdV?qAg9$TcBUZVTheOGk!1kv
zAOb_zJek0~%>GdBH-%I#%_fL^adAPgs0wSCuk@C<1>&xTT)TR)L9O#FKQ(le7_C14
z&!!si8rya0)Q@U8F27cp9VjE?kMHX4R^Gc%_NqLWo@;XquGj%mgsPB$n~|6?+i!em
z(*zw7?Vc49i43W0o*{(3lo8#p@;ZopASPtd`?v7U^U3TVE7h6mg@hBxL_Kd}WNAR<
zI5_CnSF=youK!S!b+l|#q}ihi{}KvC$0vVt5DsMAX#UM*JMfawPs3s=&ztXwyi|2>
z{uHK-wpQHJUY-J`SS}lFo&CAn_EY7%y+E_&%s3I6I?^dI>i2o?nZCC*G^jkg5t0FA
zsOc`|6b0^2&z6}r+&Aiukh~~X?(0)twHYwL$XH(zuQ&>Am&sUSp9g`Y=EKc=K;w?T
zUuRHz<%>>b;RwEcxj&17+)F*F3}I-K8=Ipj<tTVBK0^>7*2WWWUbI+eGRi)VGO8@w
zIZ1{wJ0`(VK?wQ0_M)SnIt5|n-TmJa0Rd76pvjAwsB~2Nsk{gF+(en?6>F%58sl(w
z<{eews<q?u&CMTbxlya3RwO8){`wI9pxdI~72+_JA%|1f<EWs4f<VBtGkctY=r(3Z
zNu7ba$@`=l{dAGM!e9;W6X;5M%mp$lNb&X;BR=1y0`|yEtg3x_5wUWhQq0_(vUk>i
zX343$1=HJxIUeK2aG|#d70SORWlA>;5Nlfn#XYBUMxFyVL%v?EkW7g@-%<S}<O0M4
zscnw~j9|X4;G?FxY21I({9H6~=UQFsyYdQu)7)N7`>G#sC@5^%bQ+ED$wdiX1y;<b
z3%Vj!d@9O5gWI^*jhnVs?*f_ReK)B|JbO8SH(d9Ba+VdI5b0@u+aAChm*1D4ZUf}V
z+?sGiD-ve)1bwbVc(!1jm)#%AK{`k+P~a|V`3c$S2tt6p<utmKX}V~e=eS#PS!X=|
zC!(}-7dN;A^hEe|vhvdPw4KNp2_`<zK1Et}@5si1(3N?zp6%Oe9iN~(ZCsbAEczkz
z(Tf>GN-vNGGc>&hC}rp2TVGQ&CYG}YgY|a5stpNTFZEuP|2`!0C6)EohZai3Yp^2-
zyzM^8`UOO@sM9BdmG3Y+n~V0`-ryO_xD{Y8^tG3UJ!R|{HD%CeAn_mS2Wds4qE-qU
z&T}io=?%a^pSS}EP9(w0<Jc?Iijjl~Q*O^HD0LzFvQS(uQGc+-uV!^w#c!a@c~g(_
zL~Ql?kf%`Woqt(G#nT{ZWRub@*c%W>0Kd$`A$Nu<_IX!KoXSNFbNzz-%!i{G;(vh_
zWnB3iAN|z*DnZ{CYc*9vgVyMTWP}n+uRVJ%2aam>)k`_L6OLJ?ck}OV9R1KiqEkte
zx~nnG`Djv}r%$Mb??s{kvwFYCY++ONKdwXK|J}ccA^I0ip3sc%=Z}3wV`U<=_|PQE
zL7Bb3gj~1G1Y$;sI{9G7+#+-qtH1-(hN|!Hq)oefDOUapRqVGM+=~{S_SdR<z4&(A
zm}v|wOA`5&DYN?zn1x^-L)kMLQF((L`}&TzsHGmxkkvJw#gH%HUhh7N!K%-$wLzk#
z-A^;h`z+}nX<1`3A|q;Q3(Ja>RsJ8k-aVe__x~R+l};~FLJ>N=IuQ~hXQiW@au{J&
z$=M8ZW|kC{M9KNEB*&Q%+nlzML{7_Llg;@sIp;9LZ2LWXf8L+p_xAnc`%n9)o7;1H
zUXSZ~+z*fY1-W@*=Y&u|^0~i(rz3yi7-boLxANZKEKov9m`8}+)h5e<(&yv$=}oDJ
zdoADBBL}en*Yo&cYpT9yC!6*KH}h5T7C@5#bk5q^8S?{kgG!ET1LxIOY89Uk{jV$q
zAX$YIz+}-{<9Nbz<vL5Ni18PNzuy(gS*;--%_0IOfHCE^g*{JocZO>-0pH(GAc!_d
z*+)0#tMZ4Sn}moTSG1=-JAG0hw*Q?zxOVfw=R4l=|B#h)h%e<I>TGb3=u<q8g<Aaj
z>^U4~I80M7Vkz3RZ8A#h@KplGZ*6HE`?WDHcrx=n-RWw&@z_~gsM$U8mbD#|5a__D
zcg^#`&mmM~jYoKYNWPb#5&+i)S!*SU9@iiGqbeo-!Re;Pe?%CI3TaFc>C!3+06en-
zy+pZVM}aP+_Mgv^A6Q>18$}wtciI6Xr~|?~{Fpv|#-1Gu7Xzl+;7Tv9e>S;28-V#0
z1g`LY_|xLa@MpACeE(pZFaLv0-%67$X!pr(NR!^XZyT30g)ntUS*Fn*4WeOa!d}=8
z$z7M%=~b+T&DX1RbiovqOIQ7eUb~KaX>;$OjrF~qAA+B_n9Zka#?18rV@EbP+ruqD
z`WA#AHW5q0F)}LJx|BZzEI1ckD|ni|6BPc~GcxqkPmJ)$uHP?EPCmuw+bbRA|6<a6
z|8HjVqL61vR+=)v&_e@cpEFG|h8G^q+1)(i!MI6x{BVP2eSPO3Fq}W09~!*VJ;5~e
zrm6wY{vj~+o$-!QJka#g;@%6-lGYtAKpdf@4Jf5Jiex`ck`6d=^yp)&3Y)r+y?-*Y
ziC90M7R_75^W$GBA4AY3VI|0}=NkcL_j}g%Hf(>@+uoJ5Q9M@EdX-<HP8)`h+W?7R
z<07!Xu&qWNMymi4Rx7hC-zm(WnluwjC09CLR;C0UMQ+y|6U)+>kgff_J(jXM(4Cv=
zW>#1ySKm@mv`o@@{UScwdUzWM*#=Coxbh%==BoRz#DmWRJB$AmS-s7dt^3d~^t9|C
zfmI%sP^<k~`d4^=r}#|8-GqHjABAOi?SRzHyJ>H|%zMtW2x%K2?f1k2p%%LEdnu<Z
z#>Z7sFPG}tTQ#rzb+2m1k;kpy#mar?Glt0>mb)es>3DmGcz(J})c+0)o2{^8p%#?k
zacX6GbmM>gcz+Yo<-c0HDmGegbc|N!wd@EKT3jRk9lJwbo<lYbx&L>-uVn}rMf2=0
z$SyaNwEw@;*&xEEin8_XUBVhqYoYf3&#51=84O{ezJISg_1Q7pQSJ}E)zKyHW)b)H
zpWHWnMkq{%DrH!8r>oCU{?R=Z9L_m>4f2g)D0cGbAB%@Cp5@m8f%VsCF20kyX!W?P
z{;NW!P^tTHP`av9K7p7}oNqs%9pBq{y9gT2Xt}%!!j->w{@6j@d!YhR7XtD9WUn2%
z0sDNVFa!5?IqEe0wBm|qaXvs?t&tcRx%}6N+X)MUwr!`c>^*8)A#7NkbF9yKEVHua
zU{i`}Uv{2Q;6%9O2(f3wCqhhMuvhST^WVQK;BMN~zmjpl38O?f1rECX3<DmPoyi<H
z{L@kee|qqx_1v8r<u5=VYy9$_xXpu-e@2ydIJ!mmC>*tozXG}}KB2kS#opGhs6=`C
zsM5e!R}1|YLM18J;w4r6HL{GZre<MtbKjzeht5WvR#(-JhF`s{6YQZI^F{IK--$a3
zs<|L6wM^otXE*<n*}}h(wZHV?jwV+|ip<J^z(UW>y@}dNHL@eyqA+ijk=DP<R{!rq
zBRd>s-~3&+I=Fl%?f-i7Qx4ur&AHtJT&i)MqQP5{3Uu$k_P32-E}`$>NP0$NX5J?M
zxCknV_xD(JH*^X$ke)`|T<^|$q5fpF=2MBQ75KlXX^T1c&8cd<7qHfZpE9h^;h7VF
zhjG#$zmmazZFyYcVyC&Z?*SlY1^u0{uKB<7ZR<wOUM@Cg^W}0bKIex8%$ZRl>WsTv
zhMvJ~FXaIUiM6-;Lx0+Og*Gs9Y!PgF7wi<A1@ac-ZLFHF7nnM!$Ofr){!Qe(68bP=
z_x~Rl&>(((&@90mtg!o_Os2)v-=7fsMYUgEx}^SwfE)RGT(1g8>L!+zb*<Mhfzab_
z3w@=zo?<l~JL$+d&i7aUGp*OWLq|V2oIg0$`R5Bx{x4%<up46L@ptla_DY$3Nrtjc
z_`nY1n2P(kS#0G#v4$?$;KW7QpXk>5sInUqS}7i#GSma<7lki8(e9d_;ToG&kj&3E
zYkX6zEkB)CRd9I6Kk<Dt7LWIAVET6$yA|9F-L0?)xV*zp8#mhqj~dxVo|fP#3m?77
z5}kq!9(-nQ7wi%!>jo*68m{y|FRZiv!4esLq~S&h*9=Cob-=eAnyuf#VrR*B-#_(1
zOvWeU6PA%N@%Z|K;(ky-*i%{>u|lD;)$)j*ZI|%AgD2?&J5C3C$S*lw(*3UW1pz%S
zIFvis3#80?CY431SY3U%Lkhrq#7xEir>?vI@K0-%7tj7J+(*n<Q0bgFsJh&27y-=B
z-<;((4WZ}S+J+SB6W_$MtXI2di&;bL<FlC{p~S-mrB4b1{erKy<5gTh16RPw66uPG
zN0EIGP4UPJ%0I>mW0K8tV`FYv7(bSICll`iAV+I^r(YrS8@E0`owdVF>+NuQT5m7e
z)Zlpu@DU1^OR63|{vkE@hN9_T2Q}(15EMKf>2XaN^=u#T`x~Gh{&b`CiB^qP-`LgV
zk@BYn>##wWv%xROSqA>cu8s8!bX_IMBiW79UCnax2D~2ius^S2U-06sgCxvGqpvF^
z|J>jIHqT8y{8n#V21D9-{zHky`4=T;`;@X_>*0vs-(QJm#c3&CI{_FvuZc4p@UEcj
z(8ht+<O|iVeY7<o*YZVR*g;zyFFnRFOdneKQt-CrDlo&a#v9M?1K{6S`LR5~rrZ8G
zi+zBN<?=l>6(O%k2O}g^$LeZh#cg?KE4Bo9_R=@b`L12T3wh=Sf3sl03qey;&hCIW
zw1ln$HbJd|GBz3@f2FwG#KGL`W4GYmlZ}}q?)tI_(#7@gg|kvHs<UBhwR(rW=s*Ab
zcRG2mVj^Vw?+Edh+Lpi1f8q%{ed(%wl?dDsv7Y(Kn`aGe8lLQ6f9%<Zzl%EFgE`Y&
z-J0km>p}0l{4{>^=HrJNuWTf9tK9eWTE+zI-B<P19tgnQ(aOumTYn8l8j9w&9y(nB
z_-%%aZztpu7lu`ypN!Xy#rM5pmQxRxrp(9hRKC$ME5o1g>J#iU{CC_nyqPPI&pWj6
zr=(>~==U*kvBK81x2I+?;Fu-Z2*GdA)0E|kM==V|J+a4)i|vSt(O>_N9hdcL2*(A^
zOJ<`JC2fKP1CRC3cYD=MIWGt&Kb^c_ec!^Oq4wj;ab^Ax2YEa4_35&rYL$J9``Sd0
zYC2lnxPRl_vlVewLuP<!ull`8xM0;J{YttPr;DT(yf_#>jR<Levgp64wWKDV*`Y~=
zT~zSJ&~jiZvbf|Nj_8~8IyDym#Ak#;koTtJH~~HCS*>`>7vu;plN8zc4AX5FYxm~a
zsOP1WSJzSu8?a#>c{Rx)bv5}RefCr`tiZCRI?ygo3VVgJ_UgNeM(HkfnL@XYg@y1%
z;v$_{F$Wun_N?Rhs2Y4TV+9lv@lfeT3;!;|Rd3&e_R5fmv|_s{{=w)Ok4njKME~`E
z!~WBiH81K(x=ZT|{hmcl=@7Xs`(5K8SJMM9`zSkTyHBS^;rs+UFdwH<SU`J<SGX*)
zb9dVrLtnh^VsePhGfZ;jtPkzp(su8H|F^BCGcT4`p@Qo<yq;<MmbJ<AIj0OZ`5-#-
zK4argi{ACx#X3#5JJ)RS5i|#=;s|LrT&urZ<Zd+t?-1AqkDR#z)B&}!OAj$||Gb<M
z2bRvQY#5u<Xf=QjXN9J1HkJ8>{(6;A4&LH@+asSutY?`b-clodf7lwREb)GZ4rE#-
zfT~KyXxEtwg279fCZLX}Yt!gG45nloyo{HuJKvh;sIpq0O0kGsX`d@?ad)@D{F;?F
z>@hy`(FSRI0?(*#gbU6L)$t<=-D!i@8K|YX_Y>yGsw@N@G5M7PIoY0~yxJEZlbfJ5
z^Nv1E4l4J(mg!BN(Rk2P^Di8Q<Z-9Q&dWJ39(gQivQmj!t(U4eF}hyQXNnMC#ypGm
zToSYjS_>&_54?h>DXY3#0@?MYU3BqZ$Mys7{+*q$@Zsk>8f|QwcQvsH?C=FjC5>sV
zc~tC9rl$FmoXy}Qu!0H79V!i`je1%$z*cPEuhy+qcuV2TD(UG(()v%v*FEf>it=ua
z&p(Mn{d%Lv#NPB=HHuyKyC!0{D1YMK3p>2f6EX|m<5DY+y;>q+3tK2p#<C9ivzm_?
zA~58-pqrRJ`c|D;t!0U@e9L#dz2}bTs(>;4?DS5A*A^tjq1P)_(d6u4!I9nb+^v=;
z=*>U9eGe4NJ&US-$(s(b>cc|g3J?53o;y)XJ#vUvfrSo%`;Oriu)+nEnc#C>oV}u3
zwY{&g(ji?w`TI`0LC^Rk>@SO{d%WAWiOurt7CTuj9Uu6z`NF=k?~l`uJ=wo|uq1UB
z+s>9`-S^yTS}4=ww3TkE)XikNw`=#`=66=T`k^{dhtmn)C~k2od2VlB<!!Bqo%i%&
z7lgUq7AkRD?3@1Ty@*vVnWnY&bTxTfQ3qV-jGEG=dpf+$8hZ=AgI8l9e9hS)_Mls&
zMF;O1Vz}OOwO(mn<c=&<FzN){vuA)P(t>jL=hnS==;b;4<Zg>+FDf9iF+=Tv#>vEo
zz?<9eH2Bgqe$?}u<mVer1HF~E>AH_ec+MUy_6v7W_8m8v9jot`8!`Xh+^%JtPo$Xh
zry)zk#kijDblL))SwrDV;F75klj99BVJp36$rRoMT#E<N1ZCofe1`25w-XBdwUwG;
zDye$6BbPIw_PEkUE0K>ZFKXBi#AGUk6xsD?H8V4x=ta$fp#@t~Q$z9*OIffjLpUgs
z8;_!T71I>(p843JEheQ^RaA#TP+TI^3Apm1JrCSk$@*M~Y}Kx8s*35^5%IS=`f!wV
zk^bU`2`eIkD7%eSfhbcAm~tnGvQ!O$kk6_1>5QK<!Q>SsL3V~(SJ-mp)Rs(SvbHT{
zZ#_>0o=hYyDzQY|IZS9Rl1l5U>L~#`vU~pXfd^q7w^77xD~1$-86<`8gdG~;uV~&B
zxSuRqe<FTb(A25<psv>wV;`6-sRI16%l0a_=1v>>()Qf`+;7bvgqK`rWC&jXeN6jS
z5OuE5!Ex{5T7Naf!JW6xT2F!R-k&ZY4$u`6)!{<+Lzb9%PYYeBL&cNG5@|p3L;y;V
zSUg+@SD&^JdF|!W_A$eu0m%bq9-oGhy*#ek7%}blBfbtE(0{`MJuMr%C-TUZ=qXM%
z@CH&hh0+F)uKIFv*&p=Ieba~Sw{w+C<>AYgzV2z>W0%b;MFo^c#uLY{>zMuu{`EYv
z(m_lj9W;oerp~j@z8Q3O65qwbzZ+W9Tf-~b3mpt_<H+~7081XC^$ar>hQPb;6LXCJ
zuKn%t(cQMr6(;|D*)3E?yVr@OvL%1t_w>o7G8kbqj-PXD-HAUgTG74)X9gx-6Sf6)
z6y@G>h<kitK*Nj(v$6`)d55JNc{f_kMY-lJfD(C*{$ay5Hl0al<N99;y9{N3Nwira
z0StA!{%t|gyKcot<^;nnGGqavXQsrEQdYZf1%G6Py<S%s9Jhb>bW9WbIt&|UYBTD-
zhXL97>y_cN-TTVUxvQShmw1Lb4E^{trZCq)L@>Z8K94?4*&d^M*R|CybVy~LrPM4F
z>8g&a+44WE%u%lcp&vAqb^P-~^AtD<Z=aQFY~WBMXV2@-sM1kXJ>C!VBn&0c=EI!>
z((SX(^t;sIoGb)r2eExOf@CdBQz)_*0o5&RQq8*m5D2@Pn*1m8<j;|~VU?oyv`XB_
zK^x1W$&0czsOqBJ#+>k=49)mKR7yFU;=+^+9ap0!X4eHXf(i+sKF!Z1Vg_S=3BkJO
z!dsYBRAI#C7o02HOwS4bIC*fh5S6C+JCCg+H22WCcKJ01by5Y@iz&_PpI+<iANe;y
zmvwb6vM^rS4%mN#9Ej_eS5NSBPp}hXU6+jY_!Ch6zvd{unw3N>Y;Tr-kN9Mm`0Mo^
zes5sH3BkA9Ix(LN)}!Jquh|1agB~l^fNbA|91>LKtdoi4+xi<hf{Mk}IzLy}TPboi
z*M(!}B`5@eS6slQ**{FBmedDNM?KS}p0@8j4^#uqpS!s0infM}-nk!RH?k|chUn6>
z?34v10wl^CQMV9=u)<zi@;)@F-5k(U3IDd6;&0^4C<J#yY`<QHs!qJ!s*zq{!h8<H
zF}u^{>d@0qhkcyjI_RNihYY=3EU;o3LmdX)E=?KROUb_xPKp_3W_x7pXa~BsG~RYv
zp(1};VBe}jdznLCb~<%?7Se_&`Z*f8u54OhK*+teAbZbD;TxdV2X|gZ#BTBnPi@T?
zAZIv{DhvF@Yuy$>K@LAZE!jwM5S3P-{s^SGiCH^A)+nXN{PAKr<78aNURc?VMp}(r
ze&h{beBakK`I}L8yKVFK*}if<T@Bp4-IX;|l3LQWa#lu{G$vIrxl{c63EzFrVKowA
zY0iPQDd3^L*-V0@^+#*Po<-GbcSTMy81LVLSRy^z%(7qJGRI}r;af`;Z;65Y(;n$d
zSo?N<)DSCnr3S9-VtZ|2f%#~-yq$!6*FX2>tw=i5d!F#trlpv-0W)gic4j`Vfq!&c
zw}L;Ljx%wAsK5u^ax_C4c0U&VwX4Fj^0PB`b5AyfIr3zk+Q09lMH=u;z7Ae(rvT@=
zz|~K8q6xkI^7jHAwlD;bER5JdO8p8-4rH#xmigCr25=0PQk!Mt+O_pnq)^{}Bpem-
zb0Ml}>OmscIu$E5rPl0>?4{{n@G6ljh?Ta~`mY2<4JKh}P+3MU@N;0jdBk?{N*pHA
zb10RxoH-&$sb9>7cMM-53dWXJex5nBE_g*n8tVh)GIe4CG`IjB*!U(ccZNb)Bx)h2
zndM#_<<L*XRbc`;S5}mEdEO=!a>`t1qWEpguON3eJ<m*+vE8BP&dffr>G3N8EFD!`
zd@*!m;;n?pIVR)B`J8_#wOdj-D9OyMtPi(y{GV-e$jT1EEH~EX$`CG6r|`&cC_gAJ
zYx9{~!80a798@2{T!Kr8P{KTXB;NOzIVlEjFKZwayLzlEdrwkgTwx2Ph5ANi>bRtn
z8DK;G_2q;wL3mf1^d=P>{D4!T$`AsU1xf!+SM1-esWhB;sP&DJeVf<WoBaoG1QdeP
zX`YpY6qRExIxSQUkuZ<ZcDk`_1|Fgoo~bXpxFqLWDm3ue$BJB)caf_u7k)JD@~N&x
z$lepsU`FR7jD3EAwty?@U}|U{9X0@a^*~+(B1{WfR80n%2L7BcaPF(9#h(&y9duTB
zs4a28Pe+qvURg+E*@Hkfthe$sOQ;UjIv;B~)HQrjcjo-lVp=L}tpB5I?`j1y=Sr><
zkF4%4G+{Q91e=~A5a?lu*dMpdPYnggn<1Qvkm;Ab$psT6R2`3NC+4%)q}8FRYXDnZ
zajQz9!U|C$grU+v1&k8mB@e`&ePvzj3+yw`F!_=Nf(r+Lvt+#FMu5p~+cUM7|G|6~
zGPC)Y{Rt0ZseH90?pB!*iwO2Pc)UQTn~9%;F(-ZoEzW%5f1G6#RySF{C1-U*>Nudy
z+Lzmr*mD>g7Z|qbIcRQ<#9O(uD?_@k!)Ioc&^!0Jw)ULF=-QD3vd0)+!)uiZf!$xH
zKH1#oRgJydX=O@mVSlJ)#8{uT#U7X=c6N1rR`}-G%Am6}RX*%dvW}}5C>M#c1fEnW
zUm58Je0KKTS?s5Vj8#tdQv~sW&uk%)FLYNgQp*<=`@eGugXjZ&17*16lL9UW#SFUX
z!?Z#N7i=#Uj7-0|7i}6WU_;4*(F=8FNJCuJ^YU)P0d3f=`wkA72h5eAwYuCYJ3aFH
zw81;6`jwk>RqlR>V3STsE6FdMURzyN#3h~A8+*lai+|MZS&ZaP^RL+k2I2=-<}#;#
z=gH+DeAZ*oyxHlMECHu}zO%Rm9!8Uyw36pP4@CFg5=qHfFFoH*S*l^qBw80Oe^GH%
zP`S#CgtUmu|5~0=L4t<`hr=b>Hak04aG6Vq`S(&-b1}R<2d?fZ=^Y}?0(_#BzTe%g
z+_~wBW!0MBz4G^LB<W%ptViqSib{l0PB<N5SqCRAfI}Ip=tum-Zl@?y(G{yx>==V>
zWg2>cQEM7qIjy@oU{)75tgotdYGF?MrcvX-!YP@zmvaYDPvFYGmpQ0_7xm+vI6@A0
zUJZQ~5a)ui++W9Fe=(<%{H<xDr=uljQiOjK7EgRx#Ho#47TNq4zrfI$4`HsKyl(5`
zBmEC4*nxtt{REEHwLAMIVoZV5Oc?fL7Gv!-Mz-}w1Q7A8Eyb1~k^5$*)PfR-E6Qnb
zcv5kPUF!x%G;MS((ru#arYVcJmor){tOSa1_fkwzFMO6wK)&#<Gmq~0u2=`k{PWu%
zp;TBP;R?F*JD-+*xg>I=7=-rnDzQ3cBO)^!3kI$Nz>d~7pVF=IZEU<;xKQ5#6Hik6
z5*VxZv?j;}b39JKNxj15aPegru+E|;&PXIS47L@~JsqFQ(wNSV%goQO(SU23HCpQ3
z7f_7)zofC$Zy_T~A&*e<gV^^$#T1;BTE9Q~o-b%n0>C0=nznH<z!vUaYINz=HD8cq
z`?r(3Bz^0WBP#blC8VEp@5>ne8sXW-kGWS^eA-?nN#PTBeJQbGdGJ7v^c6=sfLfak
z#|-}Q#M5#}4xK7;^JWV$ps`aM7u+L~xV4?oUe<8VO>`xIX2Q#^t7!){ST8b?SFNG7
zA=u3qhFIX9;oef4MHQ*-tF`fg#SfNdLx)k_Q<BDJ=GU8k#4&B9qralA1|4kiw6lf6
zLEmFzb_k8_7jqP$*7o3l<MT?+&h`ZRZ1L86)NL|z>0Qwa8C>o9?UkN>$|b#TT4*%8
z%B@Y5yv);Le%czff^Jl8Q*Rr%%MRm!Uvg!mCC7VcI&cCryk)<+XfskN$A2wFaU`!5
zQyn<X9uu2VNJC}*xLc{wx_B*J?Dy+f?2no0o_k~kmC)h1DK#khMpxaR?JQp83A{Z9
z48!B$$Ql1o{s0xf@WrRsArT(dWi=%qJnS=s9^TkYfS$%h&M5YZB2jYaW2t%a!NAlU
zxif6BhKhO>!K;K;EIK<c3rSz5m0%p|h}uCxd>v}i>WE*?1b<#uIv}z)eE2k~c8WC*
zDQ=PeP6r`d$3)*1ru&ktnjv}{8_x1)Q5yqG9n`i>6g?{^C*?MpZ`WN?NFXfVmzg@(
zYg?RYmG338us+o9JZv2#dNbtshyyjeE`ps2CCbg7|LwK#G~Px0WVO9UnDU7#;Ly2!
zp9I1Wdk)gSR^KEn)INgsmS^_D+N1YDrZQuDVYO^s5h2f$<tJc_=PZJ>4A0vu%xi_#
zJ|P%3=9HaU&50$sH;;KSy{$w8GGkIfmuA*Zctaohc#z8**%>~k^dM&-n3Ig^{nc>9
zzUn#HES^z_of%xybvWC*wrsCg**OSy!sJO>?zh6!ECy}J5$b#E-)5{(-ezt6u{71t
zORz-BN$05Var}M)jTz`y3hH8@`^$Zn_^OE8t%IEN)9IWpI_^QDUez<XU|6TfhF3MJ
zNt)|rjfQVUbo$)gBq!_PKFWzZiWv7e7(gJ9o_<Y^=r?wUh>XUa@bEgK+0_G4X~24m
zA9$9GsNQYcUQETepB)90s<8OpZ42=ZgR<xhG+2Z|L*Vc_B4NtVFT=GeuVqBjjB|Gt
zJTAg|oV|y2f8gG0oF%PY1rk~J9KF0~DmZP2K1g6<+|&GD?avN_C0U90^k#AkJ_;MK
zLur*N91#bsYi&rkf_duClgnj#>lL0fdVZYfYF~of<k2sk^M=zS74G@C%igTbbm)?*
zveow%y0kQ_{S(230P!~35p@K3W~IZIhFAdd>O6IKP?*%bVI+^J3UmS}o+K_@fD43b
zX_Du5Exl85+&ViarmQWv9@-)^>^dZckM|*Bhu1!zZ%?3bD0@UVXXnb^Nl{pibDLo@
zi*<be*iuJwPpyHOjAr(#dd;#qs{GIZ{5L~#lsrn3Pb8ApJN>`yznyNdFDpDXnw}zA
zGe-?>8-LqOpL2spv?0*S6v0INUp5PmX2)VH7u$!gUeP}N7hBxKe5=JDq;eDM=S-J;
zb-wkI6>*!n+Z4_E!La%I(A7!S9Q^&nTYY*hI==a!`-Y>@Zy(bp%rt3%lp}a(#qC+j
z{mYaU*jq1Vrq`Brnwpj+gXNdYohPSlA#Rbw^S&~STx2S8$v?EIZaCt%-@25hQ*g8{
z>-lXr_@V9PgHZP48kU;@VLcpZ-I8NvLq7zf(edXE*he>+3n*gFN~Tv?YLdC`kJ^Oz
zZb@JVU0^>7&<9|n_G9+E%w3!HO4(7#JC(BXg)n<9OT{~kjF{=FagX9mVY2#$i<k6n
zYr*4;uI^&vd<TlXhmB&HHa?#vxu&#p_}TD`cK$FKK`s9$fpHM+e!;BCFW*O6y8ll#
z7O&o)&M_UtxYgRg^g65$VD}eU7FikIZ&{G^4^X2k6xa_`=8~&@vCP%Lp^`m0PP@Xn
zw@k09bF`LRM7+IhU&GEgTNO0C5w=4teM$_~Lw4dG3}*xnn<2_HMg;WGZT|F8a=+M0
zTmGtAtj(W(vuoDO)o}M;&(k;zftd4)<K{`nr8<=XWVZMfyjyIa835LNQ(i5-8uc7c
zP1|q3d+@qPb{sg<!Sa{D@@J3Dh0O2gZ+#}hW7+oXz<3tn_j0IsP?)Rn`uxyi5hqX3
zz3jM{GdvBVLOLV0pV?z>7T^B4CO-!|1O3O-y&?<N6VXf9V;pE=ZwkibhQXvGhiVEH
zr~d?rx1EqNIC&<oh8WlLv!tKxCxb!%nXWGWS%*UvvbB=r>cKv=pPm-U7Wkf0a8{t_
zmM*Pd4xn_u9tK|3TQ%Fmr>Zly-5L`jS12p*`^kOU-T#X|u-vwq<vzEpbEr+G68+Tn
z>@2iZT#gemN50?_vF4GGtg~3#t6gOd-MARqqzH8znkL-m>aaU{J1CF^xV5|3>V*7u
zk%Lq*atl78h~wo>_$8=H91(Sx;ECc+=qUKc@>M5#&e*;L%Xj*OakrE*5dsJr>Bw?s
zt{P*K^;gm+Ch<!lMy%Xo9Pjz(q3?`gf<+L&PNxvX6eiI&E2+q`ZPxb@Mvy#Xy-Sk}
z(O=<<%7;02NNwp}ow;ZZOa*Pk;$=j}JdUZ%nnt&1ZZC7*HtDYZFxNz>Gv=!)SvpRe
zDgCXS$PHxwsjT(q=YJ5%0qN5xi-QWT%}S*|4IkkT9ysqK)jM0%5AnkmUzk#A{e<g|
z)muL{!1NMC4^^TgQyl$@N!nG+s|N-+@8S#;<TtB$+z}3WT{g5!txNec(`fp)SHN<N
zOF`}ZMH#;IzQr0h+b3wZ*mI3iV4xKPOKN<-4|HM^C0Z|@tv$DCw|{*oS<9)qLr1;5
zC|BFz;FSQEIRjEB_H};D7Cp`3k(6{!-{nasaYLFz{#-11WIVqn{w@_>su@+~GKGYG
zYuBwmF(D~UV<yfmwB8$1zf`>Qx<jw=XT_9ihb4y2rM)IM%^VO1KQP_~Gg;Qz)m_JC
zR{Q8xjFKETudQwRLuau@239Ag1F|0>xL}IQ6?V$7Vh>%2;RKSxw{CUFkEg#U9fDnp
zyEt6gs<$?;?xsSmTXR_&(s+n1z>FZYC52aW(uMDX5;KO@HuFX>y{4$hk;gd)tyrO{
zLshe7;7|El2gMu%36DgD_U#6A1<<jU*S}wkdfvRGmee7ZmJXubGnKgG&?`SF3RYpS
z?;>FnEWKr<7uDbvi<LoG31hsaM;2q$0@wweDS@rhhJAlrvJ)&uf9{+>G%V&xrH}NT
zJ7`a`5uTkJft7@_$j3{0H%|RKFZmPl^UJULi%%#vF>goc>Nj*jdYse~TUpX_8pQF-
z0vAHTcgfX*Doc%a#0mo8()$$FHc>w<?HC9ZMQ#FBX~UfY75<dk1V($4kjzdQ-*xCo
zk7|g~qB>Ciw}JA%+T{p*jkCIYhY^k3Nd%PpEU?5LwnBo35(A+%8fK=ZKgOF<(@|&^
zKl6sswYsI@Q}+ASludWNbR&;mn)79+(4?RnccH{EK{Gt^A}*vC(*c{^!Xou&4<~#W
zfpBD2mo~OhX(3dSAlcbWyNi+Fv%P?)yibx_z1qUdA6`b6h2Ma4VO}qumw~dju!>~8
z!n(rjW$W&eZvqY)MI9)M8tT;K4JGB}6cODF7WcORHgw+TUGtDn+uLn(J)*J(UM?L{
zq^+|n6VPgTZV3W<5xVj1>|5T^FGg@h6r(a{K4dl-;0WCG*vH>;^U5b=Mo1>Z8;eA{
z*iX3F;j$r?>8AZ0-yhy5HaX*FaMK3>G5xvjiEA(%3bVhSGK{$D-%e2aGLuyp7rEXe
zC-{{#m9gZwP=i`n-Hy{gDTP{Aqc5_#gRD%Sq(HBx{f&YpbDSyZt#>paolL(1<CF?K
z8n}L$^C(@vJ|j5=LG?1cIe=Q@aun#%Zbc}|mI6H*rcfBE9`ZzgO1)F73@U3z`;iqF
zTb_$UbsW7@ZmT15B_J8Dz&S3MIo>XmCJqWI*r`r2g}0NN2cPN7diVN1jIEif2Pbs&
z6PENJMzXTL$Q4lclXwvjn4iQIY<B9SJgerrvc`6_<M=OF@IQEv%2*TE^m3nMUoSrZ
zySDzjSp&OPoD70>Vy~1tB!h9pN+LuJ!ThyR<-VhrUJt%UTS9Ss+DWpc^#|S|P)f_}
zoC7pzCcz^K)7Re<AzpB)YQ`(vjk?n+;GAYT207~$(0O2bM6{-}hJ<Y#bh(VWmiy|*
z@c~aV^%vuc)!pDo#Mo;4eD6#+`-s(M4JdD=(rS;FkrKwV+TMt+?gnf$T^jS(c0@e{
z&Sl{VyTc?gN9;=%*Z0ST04<L<D6E&){vK6>L#4inA3)vdn@x*%DHEENGHhy+PRmNK
z5IoK2c@$OD3=H-(?S7EW_%@kVlRcup8l6F^eV<e4Rg!!a(}8lzP-;!r$2ITPc4$9w
zWZ0m*#X9MW;9<2LhPJhDd$zu+qzEk4=`B4<moHPx^l|8^pbvU}3)Q=l(2oOl_ipmn
zZJ}o1o^AYNOw4We=6GL8Nr%d)3DgPGpv`t>E`n9T3DD|?uhc<d+&PGY0O;y=E&+rP
z$-(c5pOCeqQkTjhH-ni{wMiC*KcH<b((6&AY`oA_$G<3JuG6jk`HU#)4iFVNbbKsc
z+A$FGu{f%MlW9onzO6UtCpn~3YqfJy1v#OpCGastR{=WT;7VquOJ@ma#<UEL`a`j8
zYaiY)o>RSFbYg=i4>^SkS;b%{6#ot24d5cohB;##>I|+Tw_E!Cx=i18SMo@*Ev3^*
z&$eky+lg3U5a&)a&8~C^AFk|r2ajC70wul)o>M`LXsLvgx7W7NE<W08_?SbWh@w;9
ziZmQ9Yw6JeX~v1a5hv3tdS)}!oGPca{NsFk*O1QYTO9IHoqGt^!%g?*TZ8rcJp<hy
zC0A)_BbptbOE8N={fYw85@m%c15X^`j|tbn+j*hfzFl2c*#R}PD~cUU4)wMoJ%;mV
z%pyPFg^JfVS+<n>`kT24bE&!NM6pn@WGIEd0B_A4;ezKJomT3l+VfK*Xn$KgDWGrQ
zfgV4X14t<Q+_jY6p}P4cko%}<H2f}1C%gkTew!ufcZUjU{b^HcUP$$^F<_^R*sEGD
z@mYoJMR^b<fr@=rmV7kOXSD;{0P9>JtcKOc45;^|d|+vel(S~5z@Aw+#&p$P!{L4y
z3U!AHby1kmNIOu|tWn5pl&_CL*tiz1KHDB1U*GyMoeE@`UMW?nd)&k|lknqNN1G<7
zaaTV)Kw&j7QFac@a@Q#5e3wEkF9Ro|W}||V)kP;Rw<0!u$>ExHFKzk6<&nbR^rij*
zCAEi`Yfd6_%u9n`X#+^`iZh^f*Kc*mM)?9o6El(Z5+mkl`t8b<{qjQgGggX`j0|*J
z7Gd=s9u`dHu~gRPQOmUf6*2pxHx&t%@gsCxj2Y-dnrvc+J|UN^C1Kpx@EQCUgBl~>
znEn$dd~hgZSi=cEvk3AozQ%y)akPStzew~oUjnCRwUKVdY=(DQ;~(OPg1hGa4fT?T
zu3A$}<@3-EEMg|*iQ|Wwi%b3C9d?DK&JqvkHN$KXS3Ni`1`PSysoj6`AZW)NFaBG7
zbeHx+L4%L@QG$T&gAdhLR>c{JP<zA-KUM*Cb8qh6k|@B$A%C8J1@+j|(sd>!Q&Rzf
z+QbUVelk<NeyJKStSq6doCIB(4`SCoA)GFxBKdQGxIbKtgQK(7`m8LI^@hF|6H5(v
zeZ5bnRwTZ7|G0Ae*oj0ellWr<PBD#S*FiJUz_q^n%8D!QmhtH}E8kksvq7)4fIFM`
zI#cbb14iJ#^+e!MjL80*{j4`yyiqq>{*5*IOk@TaqsJXYtmOEwygL5_URI;O<d?qJ
zJ>ML=;o)Vl#Y!$t%!NV2nEyrWi`0d}9RAVGu_=Q)dye)_@7a8y_(y-`gLns3Z5`e8
zSBsg1;VNy_Mf^{^SP$G5msb*OaUk?wDEEtP`&oIs?QVRIMM1nhkJF3`Eq1ptH!!83
zz0S_&?%HcPW@9j2kf1m9`Fv}jt>c_dR;kT1d|NSgMnD-1Y&S6d<D3f%zDqDQGc)FH
znXT3(4L<EMO1Nt2BWN0lt1T1m0~Psrp#>Xf$qMewt%nYqz@kc_<|yvH1Yn2*vq70F
zdz8Xbi+gxwH0_UKn!w6e$krb8)B&o9e6hwxsSlyn^k8$VhnHl($8Y*0{&m@6e@S$^
z&UEH$E&`RXu<m##yYL#zMXA{M-PYCpu)f_yqRwt2D4>uUZAnxrcs%=gip~lflDNmp
ze0;nMP?Md!b})<g9Bv50xMwV-te7EIE$`Aj%+i_o_cJ_JV3tkr)X!4`#P<eOXXfIf
za`#)YH8h_NSU|H&sxtzsaj|BN_9A&W&BmU`nN}dng?^>#dGJi|kb>2XZ<_Fc|IGqu
zea>116~1l`D_cKojo6Yarh)OZB?MA|ryr%*DQigmGj2@a8CxE?zMQ<B2J}xjeZ=jP
zCx8=c?CSY(h26H|6>m(w#u}oFowR2yNCCMuH<4CGRs2tO(HV6dhT=2#M8tz>ZTZRs
zdTySx5x{cQ{TtnLAS+H%+582B<YcHwTvQ|G2YXH(+E2}B%hTZuddWJ$;y3djw|LI!
z6XTomcJ&zioCvz3uz{h0dCwo?Ydg#2xOPC2lNHS&TUlFA&m;2p;Nmg5en?IXI5nLj
z=Myx0E^%RNi`iS(tojg}9OdA!y(etf@nhL1Egk`drRd$*eiiZz<MK^(tVeph=W;3*
zW=C}52d>HzATC1%xi%s=2E$EdtEzr+3Rki4diy`pycWCTeEMrcUQ|NheeUVa<zQTj
zxLoKn9N9dQQM^J#{epYRzG#c`nP3KTf<|)Z!j~xKa_hgG9pkHd=FuqjZLRgO1YbSn
z@M&i=RF*eCmB+4fL8M-Sd{O6qFiJ4^Q*m%I2~FAf>CBW0;|7UHX!NBLR+1c^23_;Q
z46>(nI*0VMy^Su-X^2dF-5I$!$cv{UO`Wy}rIG{RIH~+4nx`Ql<cQ@Sm2kbYi4*D@
zTfK^rmlE`c`GVtwICl^nJG;>LAK71|&SM8xz+YX;YNylb#v>%Xa}Aao^4E3PSgE?r
zt<1^$2_a9q0tduIffv1OcmCGQH2?%j+{H|J&~zQz$s&~tY1IH-h?!HO!<2siOkR*4
zU<NIL<}Q0f_v!`BjGsf;YQrV?_yc({)m6s1R=rxDMdtAHWv08JVQ(E2*HdPEkf~m1
zVL4EPH>Rh^dBr~T%g<#UoA)N1;9m+>_%C5T4OdC#21|4DYD>lOE<PEn?EkUSRR5{5
zqFIv?9WGmPf?*597-K0V_2h7=qk>f?ndi#i)wK$xghe?AK9YsjYQ4C}GzmfZy&FRo
z`W8CrynMRd`s>4Q>46Lf-vN)VNFnA>T}+4U354L~Rp`e74KNY5r47*Pi-_Wi+;eQC
zNi>#eg114~na#PwKfJ)QwU`5miU26;f3CFeq!`f5(jMxG56LvrZm6gvRqk`&XWisZ
zD4>bsjom&l()JH5sy%XW=>3@!qc$<ProrZ#hR_y*{zOg}DleRSK2JQt`WdBvT(_JW
zR&(L`^Op0stZY1CySz1srEoQ38Hah!1Z_XihgDMNX{7UcRm-mqtAWG!RToz@*H`$U
zD(w{yax#9-e%Ozz#a}jJMH_KDR1R}Xo4PMA0rF}^X_$Amn9SjqMZjaeR5lTcz3B^z
zipx;VhYLn^Rx*ebedqRQsJ>u+x(z_qo6$0-S7_gR%|7TXZ50NphhgBPsbEKkek7+2
z=z(&6V@snw=R_UO8*C2aKV5rbV2U{$<ZU+_623%5&R4Ev2sjD`5aF=W7>*>|&Q%uO
z^<dYB$jlgNW`CeP*M!6Fk;+npa^FxIMq7X1QBe25Sl9Y*8qd^rhLQ}}FU;Eo5o^&i
z?G6TW*iqDG9y(L!dIxb))ZZCb)4UDX&tQwc9#eKTVW3;a-6ikudu<ARuy?V-z`hsr
zfbQ&vj=>+f0R{<F^=J+;Uue61Lk@AB|EFa5F6(olZexY^d@Vlq2LM}EA&sDyKgb)P
z={8zF#CgHEC17$)v|_QHxZF@K{5kajhC%PAwGWp;T+-oWzsiwJ0I|T$PDtzmN`Zcp
z;rUfxdaD8tYIpeDWj$c>Sm(00j~=PtsrX9`&@XqER_!_R#WY*tKtX~UCCJR?ZXkx7
zuCKv+fbsKm?<&qH1fq`~eZ@%YR@!8maPrVe5f~V0PmNWptx+B(g&Hi9;Htg3X^(j^
zJ4Y>^g}Z|87DfioYdu^Pb3>u5sKxyXHLO5KcLb(w=4{q4ybUIo^?g67Lun-Kw&_De
zozX)pDi$Px!1olS5@6Gbn-8vPK0SUT1R9N(F2~~m!RHgrEzZLS2yh8U9{R-qt4;53
z&zjcke=Y1pQZHmf+^_$TJ(qRjNhS6jSsyfrwTWeOAwj(*Jzgoqb0x+B>nEZkOngCi
zOt-G@*!lOT$vnU;1@=_zC2y0Wr!nI}oI!YYHaMx9nR**r^MZAt1{vPRDxBy}{1jt*
z{@j8=N2qLN%v%Qs?avjt<(jITg%OWP4`;!Y&C%;$_r`GA8!T|id04zvM&|a&YiCzi
zhV?BHl~L%^*M<jdmi~iFRZU8}>puoobimt4BDl9VjjF7yx=<cv{fYr)X3m{Nh~m)V
za9wl#sZ?&<KYGM&YY+NIb%0Sb27DU$0K%HC?bFd&$Ar&%VSqTHkQzBHL-&AekD0g0
zKwU)f_U8K@<q7YQk|%fAgDT1h$`S{9d@Zsvh0((+Wa1AATS3DXE2X~%k5^6%rc6Or
zVr<D>^>-&mCIQhzIRUxy<83OpS4D7AI_;7zLS|$&C-7|qw|(T2ySoqV$h4+rp-{y=
zZ642W5Dn+W=`N=iI<&05F$E+a%I2;)G7dS{(}!rRU5$#rtv8vw!t_F&T{y@bI&?4q
z?T|*Ot+nR|H7R|Xcx_oXi9x4wB7f`7B?dsk7YAHQ#I$VvzT_N>ikBwv2XH85=*Cv+
zq&ac$MC;47@RkSW2KUM+W42$ysf$_qp!%((C8%P;P{`vha)-#4-ux8Y{}2)CH^Z6q
zMr8X}#p$oA*8H)OdY}U7sOE2^8vK}XgMV4apsaIIj@ROFz?QO6CVPf@<YaZmp3}t&
zNgN-U)`2paXSMNo{OUgM`5^<(#f`*p2M<}sCk-o+o`~l|Sqdi$T5`QUCEI3ZdiG|n
zMACnb%30l|6_=C^-(nUs+-p})UXPg}f7%HBX?+45URXek>z}QPTr`~Svkj|@0ppDe
zlr9ywxLbsFzNTAmTtU8FSVgkf7-S8|fEK34?QU2Fd@BX5Z%8N=i4bC1$#=qNKt+_j
z2-jz5=EN2)^!MBiMHb6Tn-Xr?033X!m&bT}OO7zt!v{1p^v?oFN#efDte2&Y7in!G
z;Ee-qi0x(4`~Z2y1w_>Hdf|la%fy+Qm}QRQc?sGFkzF;A-eLvz>$9sjcMTE<9i@T@
z`4JTu(z-_jz$R6U4vDB0K+RA}2)~3g_64Q1fB$&!=ueAJG2$>Rx$Les!}hP$BomD7
zn@t7|4e&iACV&}u4{zFkdsjl_u2Si;zSkd3O<5{49jF%?BEH%$#HG><=eJoeUIfXu
zh9b`m>S((P8p{#go`^Wgwt*u<cw7T6f-S*~uq1^D?BX#C5v<v);9`xs$T{MNN3t=u
zg+HUpTl}67w6x?p4(%5EqXcxfn#a!{y#UmPVRc$o(D?E5KLD?;x9mcE|Ilc0Ne+AR
z2yDB3#OIwA+Ajmoxh;oqoRwUpXR8ht5i9sb`)wiIRkU4nt(lc}#E`JooCo#8U%%na
z7svk(LUmF9Md#s^ZVs6-85Iff($(})JQg|Igih2X&595pp+wSXvWjs!^U(Gm?%%rF
z%qBp}n1k1o%#fbHmn7hkc(0Jna!~A#rO0is2ZVt1Id=50mWKYh+XjnQXNJ3B3tMYe
zW=UxNXbT-V#rO?=w0f}+_TGyU9#|72`73a#dd}>xT$*Gs7?HF+HxgW<AN)n7q)}jM
z9`>bvREwHgm_xoO5hO70*DDrtr4A3GH`g{2kfWchFYDK-Aa!-GWQDz*AA|`YNnmf9
zAmO5I?-FLqo`@HO_H(Cra1<J5I}Ahf+NLLw@{tsFbw7EY=Ktfif%8zy_mID4!WL~+
zV^LtEL?l*O=2?xNM;>HlB^~*4O%deTe9PfK4olE{!Ok8ZHDw2hZygoxMc(%v@^A{z
zxO-bVWxH>w)h(~Fg%FsvE+KewS+0o)aUdhcFz?8PUdIA3B0w7R7TOdy`w<uSnEB`T
z=Ld1B{d1vy{f0%tMyntan_J?-FZphkPG*NkTY+40V~g40CTC65pbovN9=^SB;9vY?
z1Wp|Lq(s6L00eDV=~*WV1Lb#&$zBuPoh39L*NL6SfATwJ%I%vjQ#vuft~cn>r7bMt
z5gwW&nqESylPv+`)V-K?4UF33YwXN6JnKxI2aQ%dGgva_vr1izZrKY^5-TQ#JEANB
zhFJ;k`)uocb;if$Ckp%iz40(COhJM!t4XXtYtZaKCMEJVHmfEsX|sK|0|QMJEQ%W;
zLy`f#3gzJ@$(;cXUqY}odL|o`dSfV>y6@yu!?VDj#7@#ggBSnDxV-Pl!GHca)Mknz
z-}R}U30@iD)_x`u`|BHtDiX#HU#hJngD;sOPXw=3eA-zLXnO67rxROL!kZK)_x3v`
z&(3YS8Q7B9`R%)AQq9CJ#5Qc**1r)n&v;k6ma4*kR=<5yMX}|waZo3j&npm`Lr=0C
z_?G|$JOe!u{<)BNJB-6_`$`CUQ0a-^v^(Qvi+dO7MgMW!TzAOYx}BG2E%Fn+JYV>^
zt5RgW!_+(#hg?^rBVa9+B2ia?FA~2xtGccQES72C-@Awob}H)EN)Cw^8G9lQzQ;P?
z4NEWwRbJkIlP>(T)>KRhDq%|6Lx|bykU<)8jrg{EA3KF{XpcG~1~QLmD8By5>4InO
z75u=X>nWQVVP3w!X4dC?roAj8pn{^BcC=ncroL@-0mk$Xj<I`X5NM1qbL;JUrw@qV
z>7#CD2#3(FH(?0$KD#saQ$6?Q<fT(d1>-pEjNKY|U0RIIIFwdCnS(s@_SDagNJi(v
ztW;<<gk)7z_v85o+NGCt=kL0gpHM14O5T7B4*x4%#qM1TEFBxaF0^5WpwD^P^|xnS
z-E$W&inDQG+u;@(T0hq~JmL4d*BT&wBv!Od(a=}u{bk_s5;eEoU;kqO2`<F}^BMH^
zmeIq8A8!cly|v}?&=+39$;i-t&{I)x!}gQIZZTkyMF79w>i!CY3qap??QV~#(6U5Y
zdiuL$QK%x4%e73};P+D$srsuAmb1mq;M}ABcD>%Z3*SC80<!Isc9!yt`YGQGh#`jP
z83N*MQT07(uWkIB^GA{a+D|`RD&g>*55OsSL&?p>JZ99hYs+ijohCy9!MmcS*&lJ`
zpl0>ZxP4QAmo0&D=Q^|CnmQ@Io+rG3h|S#z#yXZrJjN@yYx`ny2_CDJZ-y-)ifB)F
z%ck^Ap^BMdrs)N6bVajzA@iFTTAJVI>+m6iId>{N%YLe&rubHdv}b-nfdW8wYwR=;
z+4hhy5jpAgM~xTS_uPh^vb>qGj-e@#cAMazl?jVgX1>j%JwM42?HDR#(jb@`#<N%U
zcuQ*c)2ULUS}lnZP?X_9`@KvJ<S+%<T45j}>Dk;JA)(LS#GLx|D0az~P~rZ^si}W6
z11v%l^9@>+j_A~<uG>Ll9fJO;74~6sv1Ha-U>2@88Z1xiCt!;)!kXC`;L^YUxz`K#
zU@XFkwe0iA5y^KI&bJy#=s;Yf2#!jh3*?fswUl|afn;)QCWYa%9-7Pt7>0a<U1<hF
z`2de;A2#vLF>2KFamxEwK#4yUB5{LTH#Y8+w4|_tR-*-<c7zuy{(aXw4S;vebNBOB
z1wP}tCmeUbKlKN&t=Z)GvXU&5igB3Kg<x26%4VZA<Zg^u<;$do^9HDjh*4*$&oSG-
zC*+k-8y=fJ59FnYfM{x!v-zpgg_AR+W#r@O{oa7LBI*xl85xxcBK!Wm3n)qN!IfX9
zuls_g_xqwaAK8-aVIN~ONzbSKwc{IO8h43*DddbUZB@o%##BWXQtCV`;K5723L&#@
zm+VOuZQBXGupgu~i5u=VyF5AR%sd_Z1>rnUX${8h+cJIK4Dn;IjDIMd+R;=B_4*w$
z)gvkH*a4NW(fQ@`wUgkPDgD@qK9E)WqCSTAB{K#rGm8-w&hG4&E~ANx&}-u%Mi{`y
z6@CEh>Vz2KS6By5cfbaqnwftBJxxHgbNh6cqW&xecsfd#p|h%NQM9L@$T=`m4Ayf)
z9f~+$hsllk8tutD_oTl6dHgCU&_a~Q$6RxT;H>vCb{nu)%QuHFkBQmQ$RO)_|8(wZ
z>t7U&_K~pdMf6Qq@e6a^VOxWaJ~>7&)R8{Jb=VQMRtayGL&2Ymz);U*7y!k{ufHn2
zbN4o|&#~d)3O8Wi{*~`GzVGDd$;+U8N-HDGeQEqArbBdk6E&(AAOt=6bO#_sDgdb4
z!b}?h=;E`_nv{1d+!)Qrq0$`#7ZNNhkt^cVM0A88<3PGruSrJ3x5?)xc-0e6yf}?$
zn96^RA}LiKDNpqE!ow#WS4pGa4S0{t1W>`e?d0Gz<w=)@+{wfnz|-Azq#ei>Z=`7*
z#O*BN5=FZPQX)S#76!6{y6?im=KQh4?q2!T&G-dvCxQpQZ7BTqlW*1!MJhdL&B-ju
znVDJa3r7b`-RuG@oAKz}G1=ya=`j=QX$|FAp~7CrXTQoG*@&#t(~Z-em?Ve2Prkob
zH{F|nmv-YQV}oY#x2Gqnj0=Phf$q!@XO0n<v`6h^``{>mfY-u*DiFR`M_@F)fdMvC
zFe1>)em|S+6W*{@Zo|^DZ-^Kwn?5@~6BJ2CN;CTU%VMC}8O$slDNupJigtEp4Fp48
zRJW<)Rjna<saokRK0{iQ(hQn&9O)K|t+3z)w5){j4ymX=z$qOAmt!g(ag1N+QT5#|
zcHvzEnGd<55p<Fkj)dd|RN*dlC;yh*36x$#8~_1Tj8BLIV^Xw}M`w0LZ5;6C_sjYN
zePp`k)**5)r(K?JVy3tGVZ-d@JKL%TDHYzA`qf=aX2+{kyi;`q8=^CIefPW1MV>Rz
z(^HbK*~nX2rXsJf^~P>a*IOuaxBGbkjTQU8fq}yFPJJ8Y2CSRxGoNh!VbgyTz$P}j
z4ygOgf=6Uk#9R=-wAhlFDa<a#DFQjFqEBfsuK3eza71&A?T}EI^h*d)fzkN;lvQ(O
zzx4rA+t+Jz)9etDhn_#nu=&H*uh+s-K41UHG<iv-r(_!E+E-XH%lC^dY1ll0?X+dq
z5MZYNA8GF$Pxbr%k8?V*qGKf@D=M;AnMcaZC=Rk$#zAC{$Vo{;8f1oKonvH=Y*7hW
z$0m}UPzbH>^*kJU^?CpEyZ!!AJfG(pkA2-AkH>W)C38TbeQ9T=l3yMI7h`tMg|*cb
zeYSQkyi*&mTyvd6FC{rPxOBgPWQB3Kl;zoP0Y6%3e?8^OcFMjJ>h~@1k9$IKlub-d
z@BAVEb~fDar_YD&InR8nj30c`U*NOkbueb3D(~_j_qU(ban<J4uqd7iW72zVjC3c8
z0e!`Ukx4>2Zj#!#W+UMHdSN^^%0+d5#sx{&3YcV>^Q3N2ni|f(>sEw;h$tB13^SWI
z*^c5Ua~i-xl$F0e_IS!yKDu(hx58rUrpJ_1%BFknbiE~=8uiZ)H+~E1_)pLAEqA62
zd2TWb#V{+(kj;%=U*}q0`0z(XA?WS#sVv2fLP|KJccLc8lSy4THy6-L`gir5H$kVE
zjA|Ds)l<(m%DVAr+WY0)T4uMiC~3`^H>3)ko!BvYGl6EAQK`|TDT&$4v{wyjl!Z)F
za)-@bq+$$z84mVpL>NEl>Z^uRxy;<I(F*bVLEfS_ZJZ%Cn^}IPpQ`S*ei?qI@#z@d
zLbL>9(qL9-iO)J4qRyjJp~Tuz(?ewG&YXv@#h<v<gF`rWljDyHFAA)B$3?r|yY|kR
zwZ5M-$om_8v^SNJ6L0?&J`z)GrqWo=57nu9w=WgH%=N?*sF@|ye!yrHXAUyUwqMpU
ztE*}^3^uM~_F6jn_2&qGS$JO0K#v{k2)>^wPXt(s+m+W2!6<y0!_K>v78K}IRaNB{
z4^>=C_mVvl0%hT<Ps(!#Bjw0cv>Zy8FrC<r)Y2;tHo0o#pFXncg<{tKHt%qT-a+1l
zZ;_LKiWinK`MveME;IkdbC0`FH{&-uU6Z@{YULD<wa4>c{?U<&N34&H)#Thu3Tk!C
z>AW(RuLh#vXbH%EnRHP-JqYaAy*iusq%16@A8ytTV0}G=7z@c+KlX&<$}*MOB?XL~
zUvigf?Mq|rJ;IVmPgB3?$lB`Sn6Gu4t|x{?Qm*`+zF3K5o@IsSwcq?vgERAs{mC~U
zvi6xeob|qj-ZExkeX3T;Y`kf(D0xDzuFxRif=E$S7*(eH4;9;bcvNv>sO&+Lc$1T!
z{{AZKiS^k}AG!V<QpHi?=2>I7U&$+o3d#g!VP6k=bW^3WJ~bQHjWK9yuHggMMQ+}F
zXzYR#h_)+_x=oWK;;_D+$^jZuvTja>Ojk~=`d_QE3p6Wrs5c0yo|`Y$er<QvC!tuz
zsTozLh1*<Dl<b^&GVJkAGy3$0(oz1~xYzSjzh9>;CB&3~&R*U;DUb81a<D?m{4xK9
zJcBf?M5)W=#iG7|ZViduJTQt^nwHkqy+7B!DtNq%A-^$@SK#z8YJJL%d-IRAsCn^~
z5{Pd<L2jtUwf&=v^-bJ0vokG`NGn*nP5Rfj@6AqGRQ|+eQnewmk6J=iHXEdCk0(A|
z{nRKkbqd~ktg|NFL}=sHZFhVr_^!v$khI4r0fV<RioauW%`2-eq<<^|pt34h%r#TV
z7H1IcqOVxlRFkdtEu{0+%Sc^4o14j>y`OQdc>fy-Pb@}?hI@XdN=DDBG_BA0;zi|n
zDB<FZ)fGkgmhw-=vWMJB?az0J88ZHZGCk;}J1y*~z*^gT|8CCQ<5K^HI|i%x7g?dJ
zy%vg2&Bio%$-aK0Me6vDvSj6)1^bl5f=k&^*WSQmBt>%Gv(qRnxZu~$JmYBRGfJeD
zu>a1!I!U=E9xD@jjr~4=D}#=D>WQ=KxS&myEM&uf&3#jEs-9$ERg*55B7drfez<wP
zyWgGBY_&3DvVR8uX<xy;)$dP-66SlIYU5s%<;REG1pGL9{ezSTyP;4r$B>8gw<`6m
z1Sr&cRLP0Z0wn1&eWDf>K8`;2<hBx5Fft4l@ZBqsBlb0|*+pC~x)j9<89k%~V2z3m
zJHHj^+Y_*giRXbGq?#41Pg!ZSXCHFgsG@-a_($pY{WsEFu49m<@Q%9KeeNsFiXILX
zthKd2sh?>4IQxa$o#M7IaBh!)3Dvp4#z+pa#E7@WNCm^?@ndt8wmhZZ$}#oY;KynG
zu#Wd4YkkWB92AMo8Q8p(&D(*WbJbsuy>#JZde~m;&4wGadyjcdF#wl19Pnpd$qChO
zr{`xNaJwfQs#{Ltu;&Rz27w7SBTs)M1^>!1f&A}7vei4kLDD&aW6QqXf}~G#;ph2o
z-S-FOVtyuBegRS<50S*=(etRVar7m_SU)aH=8ZSa95MH=Z>4wlRUtbRzBzA#rfl)@
z(L`6pxIBt;rsJ!{(r-Ebd_CU9k1Gh+bOOoNfO|QXuh`FV*E%0Kh*5+3R6Z4nWS<2@
zJoK#P3=?1K1YUkx>WlFiiI<MEp7^huIaJAmKSqu&4R|0`R1S`jrUoj7oDwUy%3=~q
z#e2Q<VSnNMqESEDS&Y<%6{gP6x%?7bRhRfX?4`dSuD7`&++#hdbqxgh6<-OZ%l%J0
zx(J2KvNzn4_BDl`14s$T;fIP-Lit4xCO9H2vwk(AGOuI6jX&4eto`6dmnpBxZ4y`v
zsO>E6P9dFW2YT(>XG)1VL17v=D%m|)Xms@D$~h0&vq6W#8WTi98_8;~4;oIb+?T(6
z^mpeSrZGx;ZV*wb1dsFUguH?#Y`Y}(pqpxTvDRmaU3>JaY#{Hiec5<E(729L)N<Wd
z=k>ZXP0v8kNpz`ZV_~xM?ez!rZ*naYwTgn)VDZxT6%F2bPh6`e<IA#Z`~E=5DYZ7Q
z)cjDnbW6ZZIu`i`yc_e!J`>l{{f5$4N7O(YL&i9o3y_+IPWH<a?h4lLOtwFP=z<s*
z$Zrt{zW4$H(<NkY;w~D~wA>{88Tz413phTdJCnc*B4A^B0~xK%;IY^MpQW$^_b+7f
zRXk6BJCdB=@!i&E?Z7(>`Idu34AL+mJhkK_+|#T??5cN9_#-ES5<AyvQCK1Ko7|zK
zGb}WY1!jZ%_*<pom#KaOZENr(O9o%0!zra5UJ2rjIAP1UrsEZ?nNs}#>?a(w0AvW#
zU-*K<ubDwyQL1~U0~Gn}JW&e=pLw2p>>C0IF(tqjU)-=XEkR@V8~!Rwo1oOI^g8Cn
zTK;VvH*>w(;Av7^(%Uo0kmlRDdfKYaNY1mc5WeR%uWyyQXbI$@n^DFh;4Bw%ZFPvc
z0ab8`?a48)eRbn@`uCuS?=EKUC~;O~Ds;d<zjCbz%2g`7IL)~Gg!2Iyf}t`u=FCYD
z+*W>Rt2zaXPeZZSKf6uSU7MPA%0|8Wd@22xn&JJqdfcz<fw7H%xM(}v!PPYr=#4AD
z#p2(Y6iI)ppn&EWXL93jz{5IE^R9z|ZR&1KXn~*<629Fj>$lqqlP>PG8B*^);e_y<
zN5!#BiVQb#On(?jQdeQ=lX^w2f8rvdwAibR^pqn{S%_Jb%=71+#?Vbx*?cE;I*yBN
ze-gUIx}YG%jgZEiWH27R`gDQSytFh%b4D|LbL=ejc4f1<KX=9a`MWj``9L`4C}7;U
z2@p0eAv2zBxdH;j2%z3lhqE%v0P4l_Fy7(XeR2#6t*t?-nNP*7^lM)d%N?Q48Yi`u
zmaKzjh6LLRcmZOu=l$>y;Mi~W7noZ%Harh0cJXC1!#wCx&&hv!9Dx3|WBcBZUe+^R
ztABHjpJa*A*sSx?@#K36&twbZq9TCKQ>*^(do>_+BxnE=kgZbdCkm@~L4QMX67}u_
zigOph8ebi{HNgn!y_;;ux%!ac{T*LM`-HbHyH4g|@Y5~E2kqU%3^8W%O?<u5@gAqk
zwcc}CDIb7;SvVR!=lG4Lsf3lm68{-%U@TwJtbiFx@GAnBBeW%|stpV2Zy11pZkWlP
zuK|Cy_w?~EfLW8ZH@TvKbqO0VrP^g<eL3(6A8eC!Q-QF<CQgII5(GeiADj^Qz)<}7
z!mV-s_aNQGFCr<=)5N3KJ)-}JDlKN!nrUeB*J#MIj=@N($AjE*Q6b3wz7Qp!0vo*L
z0;prpNULpGILSt6{5qIRLd#phO2TdS3gYkQ*xc*;_$rJQ0`env4MMa9coM`DMFA`s
zS|n<9&r~2RfV8fd$*Mf%1=2u$>kjZ2$4O~&(Qf#@SWgM{g`YCRLS<YCb<AbGgi5D{
z;DW*xx$n(WKP+$JYTt&-0LbOy^&~buFp8*Ih5LcTarBwqO1^C#0Y(KIf+yw~r}K@#
zzs*$c3cF8`Bfx&O1d_4*;R28DoY;Vo!ap7tkrO*98xWeeuiqrAzaM4ty^s!bf~tb7
z&}DMbXy61jbMLTsp&%#t1gVn$=g@Ji>IquS9c<0<xUySmN$qOX?!I-C0OddaJU#pp
zaAL`T?e6ZA=nG(ox2FB!NlXp+a8qx-NaQ8>`Xa|8a28CO(~tj=<!V&SX)k*O5mp2s
zf)eLZ(Z@bvl9JzS3n}wDT=UxlPLVT0S;Etbb@mLVYXU7R>flt9a0_+7krr;Kd~;fi
zXsAhGWKh3KSmYxr@P;u7Yu1hh2a7qT0T}WuwzvpddQpGMAP>R=gGsx_k`mVue_m@%
z&e7HB&0xoV__I@~4S2K6o6E00MR>*G@hD)Fln#~j-g|4;a~8UI1LoesOObD9xqPJ=
z_^G_O456TB0N|2-PEHg$5==L=j$}dk_aI!9=?_ueTVV{em9Kqrh2ne_2?H5dtO<`+
z7~_(e7|fHk1KZl#G+bOtd*k_W#*Q(EpcZep8gTc=LOcE$bgE-rK-{|sLV{*7Q8nUx
zsn&qO2A{jZ^%*yDX^%XVh!03GVNlc2z)g{)M)1m^tFPmCRub(1xH2Im42@oCyc3{V
zi&EXh6&msF-{qb@R7??Ww$*uD+fCBbT_|jqtq4&t0G$aURIdWO(ztk<VMpiafk~4b
znF5OPzq$hHw$+jZ6Amb2T&T&h^$KiGyMv7QfE3ORSxal`MmH)5ZLDA?1O{N)$Y)>+
zp)afd_Z=w5h~lnW2sB>6drmp!bOXNgZ6zo1K`;`a@cAmvN{6*4z$?_{lNWaAqy~D_
z@NQ3@0BbmAD#!{RrWeu{9wuwR8=YbZIY;!R{E$g*77CnY0Pa`j4D;>-L>S~)!UQRr
zPMU&OCcKk~1iTCN_I&wDZ%Wgjh&vCuN6`{}T!+%ZAMahUjwVV4vKd4k0B<`O_z?*7
z@tK>%2P7~$5RS4Il3AU;4G<Q=ktp#UI&pS^RW_NK|L==2=!y0(8!`q=FIUralE%@q
zpG*<N2S`q9FaS>(=YcFY@XGDsYeY+O%owb);vH!1B;2-y8GswU1czwrBhpt(uG-ry
zgO7zsXQ=Lp*f^l-etUHt$U2V(4&2)nk?8AS<hK@+;qhERh%Te~!gn712A|ma#=q`B
zFjPToWY%=1kvz`yuR#sNU0iF@j_oGFe1ZbO4r7%-KKaD*cfNnr-iBW8*B5rd$!hc|
zvhTT3PF+Y&t;x<PYQTya<S(+)+9(mZM!-Twt^hLr|CPsZkXAQl<T$=FFY+uw9$)+`
zkC|ELTSDz^L=E=Th*Q@O5J$kZ{hcHzkezxsQ?<w8i*$#-us@s_Yj{X&k3XsUxa5Y6
zDkr2vf(`aWB9AKpN**-6wSqD<e6qT>Hf4%#3Z>~D8+%%u4B&5228O0L5Pg0I#IKYI
z@Aixy<1t`tK;Xy^aH$3q`=yx&0#t`t{<4akh$u+(lPWb%g9SESo95qH7=n1M%snI<
z*k;Q$e5-^VD9*b%15U%l$lxiQH39d$YN#iT?H2MPEW~8}ZSdxaD*ztTFxyfgG5~P`
z(woAYNgTXj7k|gk7wNLGW+yJ8j>JrefV{UF<h|iS=$uT@k*i;{x+h799U!x52iOeR
zlQCP&Z<iV|Q8DwPlYQlq>NAA`nviHjpA?bB3yX<AsJvT1G%c8L$e^s~kdh!yK#}xA
zhT{vcrjX*d35eodaY3j>AU&K=*3*sWo(YPKDe}uFzSNX?a~mi7yey~od4H-0kttw*
zRFDzNW}7(=x{=U~hPOp`;x}X^8FpUgojg4MJ_(Ex%$l%FM(giy!&59K&*WLKdS`e2
z!N?Urc*uFUf`4nyTw~lbSMFpQ?51WfydRV#9At&1QCv9qE_X9^FGQ3BLF1Ydb?sT;
zZ-Al*Mmkvs@c!jg0Hct(WLT$jtO?l_tPAHOy2hI*@}+!AG(1!_BlHjR?@h%^xjIsl
z{=A2`!uXQ8%=<%e$&Ux${u(s#+l_4W^Xsc+a<GoLkxg+x0*dos$0yp}R#G(JKjrd@
z@6zw#F<nCo-qI12yt*dqW~Ju`Umf+=MmtLDPa~tcD;CI91ZHB4i{%UZsZaXvXF%fN
zLNi7QY=q|Q0|jFErUXOb+qt)tpaYEtR1a~hLjAM9zp<^euhd;V8|^(|6opLfWb?hb
zPEB@GRBQ*2;Vb<+R(m$$7<4tvL&I|S87bK=y~;=S)5OmrV}UT7LL3FSpgOQjv9}~E
zlj%*hz6^<p6M4<q0k|_+?Z3hn@P2wxY)tV|cZ0A5lcAH=)HcSk!_bTLvy}m=Z}0T@
zedf<`bvm`_RY3xC1Y++<sj#~gZn&Y}A;6o%V9X|6?E%S9@|=o<7ra+wc31S7EWre4
ztw_#?5XOky#Ch?R4B0i}K-1KY`y_=w;}$t1CiJ6xE%y3poc5V#pZdpP6t+}t+H3dP
zF4$iE=tO)M1P4GC1-!ppU;_<|kUM$mWt}e}B_`0LcQ>AvVV84=uu7y?q?$5Fv&0G8
zd=6D43jfucINqs@J-Nrg;GqF`Y%6?T1dIPlKI?{0VOAyQ6p=ky{OHHN*)SpEA~A8)
zZMa9+gt9oDn-c&}VFSc%v5MiAYMFC<P-uk(zWDNCTA~mFzwNb#y7X?eSHSz%JINKW
zZJF}hnIF-4In^3_=UF5t73^2$(EP2OD&y8N%SCQSNe&74S)hol{L;)j?_p-C^ik6H
zX33$0z==Y@Uiy8<3j?4$5^DMuQTbkhnltqEexWZsOM}&BEk9H>WN7}`DrpK#-e+mq
zFZ53nxX)2~GQtvWm$h}?j_>ANg!$e+A&h3OQPdf34MbEj^xmP{Tn7(cx+Y1rP=A>C
z7AgE3;Hf1t^%TqsZn$uv6fdRc6$9=e*kyVp*$!DhH5qxe((%^qXGYe8U<jYtD7C}Q
zYzYjuszW1D?Av(~j2IMTGF%@KmL)LrS_;|Zo_2-3B*7bi!_vypKfZsmSDn8IZ63?6
zGIqBXB3f^d+f(9<K;zb2w7UI1YaC3UK)^M2*r?elYPNgMTS24_q2>DSUgVBugsvF+
zv9<LahkJ*vy*8<`;4KwvU<v7C92S>>%Jd<M-EOMCt`{~cJ*GFWNr5ud)NUi&qsLc@
zTPPQ=hN1J_Xaxs~$C{Sj&$3LPOz-+e<RI`ov4NC_NnlL8h{W;vyz()$S==@}T(}C;
zHxsN8HQdz*gd4NN)jW5_;2Mg@MydASyjhkwPOhNN{hwWPBUDOJHP>efanEb>x~?4i
zd=_+e6zl!s7H7z)p{Uu_Q#z(>>_Wuso5LWXa165W^oEkp&(QtjV~xnN%OFJf4a|zn
zFsF+3Yoq&_Jt8Q>tWYL+>U^20Fy;O!YIrO6ww}CmcN8LqLllqog3-9C-kBi^{Y)UM
zt)}0Rb|CF0CM9=7&BAl<2pJq~feD@F&&gj8IP{takz2pbS=utaJ7d{Z^CV4ndlNsT
z`VVnUg0Z+Mb5h735#((OIv~-mkr(9na4#(^1h_Trvv3)yxHvRC>`_)sia7>FUXA>*
z*JuHic@&=PdUJl$)XGw9BUxOKKD^4c`uO8CT`x&SJE6T*Msp$TO2M6%EX&s~o0DSm
zWBXHZ#E|JS9P*3qW<vhD0O@;wO9Sdayo)<Jo&+ez$!E6b+<XsZ;|d-Q`M<y8!3pDK
zn%&V*|47dneKRf1WtP22_5kJuHgDe4Ald!gVZD#66u$Iv$+Ih-Y~;J6sY4RHY4~6q
zz1bg3cS{&3>Gf}~%pPEIcTFzw?HYu0=70|mES`n4j_**`rQ;ST0iHg)tE1<sZ(VjN
zt<6)Hxo>v4YwUu8HLRye%n8UZ5iI1T&~+*OiM!xd`qQbNq7lkD)%tzRSHt6937%xw
zh3vQmk)?PwVV!2${2wg=XA=X=^uT2hUnmy+O(}M_miiUmcpwk^<!0%<=lJWLh_Htw
zD8uv;)(EnlS2TFRD3{)DEj$^=DhfwwLzl4F=GqL}E8+1)!le6lm4jaeY>lb7w=ltB
z+kw#!#U;ubXH=&1mMmQ3+LN1Bf(OfHFb5VW&HVm7u5ooBI#1(H6Ib;STDU_l2Xx!Z
zK5*L@(2I((yEUvRLxz_n7Y-2D9`+d6AD&XS1ANMs)i?D0rF`t2PyTvBt%b)M>jnPD
z?nT4&O=vDXs{JU0#N#UpICrg>G$}T(YVOv{`~NwZ-91bO<^l~a0LIuhCSkcGY4|rn
zH2VUOoS(7(%Uj;0r;shdPG%0Fb#bbSymYDaXmz7GA}GntDN>+~MGtX{AVO1tQ}#Qm
z{|pdP!*q?lJsykWy_rEMULs6~d5l!{h|xC;!5}@!S}%H)R;Hs8WR0KQYkae3*{peX
zoO7tm7?~5ZIu3+wh%1=EoS+BscTXIAP`E3ZwZMAJC+0ps4ovw;;bc{PK+bc_eECfY
zY|P;64I>wpS)}(o#5wRbYu9ZnqcbooLo+-n!o2<ReyQDfoMMCVgsKDTj#?=yg}QlS
zif%iMo2ryDJWmX}G&qqCrSR<Y-s*0pYDn$-8DOJELMA2T@&qT+b(AN4&)J4Ofnwq6
z{cR2c2B~Z)L#D)KbhE-#+-c&HbW4zxXL0%_g8p-}oEI>2R`HNG-XR1hB@E@2tRAQG
zY#J!s#dmLQ<$$AHqiD7oBO@G=a;oOdB6x`5IVpSu4v3N2RC|Kzar!(~24Nogu^2;)
zsYzg6hfWwepiqDWi!=Mv-!a7{g9``Z-;6dK+MQ7ah*IP<bex>762W$Z=>+p!o7WZ2
z2#JYm`<7a#kU&w;_WCH)f;-X3Xio+#vJ#s=e~hvqw5r#1Pk>92XOzL#BG>e?+{qOQ
z(T#x5?>6G+t%Z>el2w`@cTnZj^k%1yo$153fj7AqbWn2pNQf2zpi)%&{b3RkC?;R2
zEG}Jhj62E<f0@BtaB0ZHYj^3iuqmMG2Z7UGK4leQ@GmXBVc+JTV>1Q4oAMu%GMMH)
zj<I_h4`fwbazn-qGoggd-yfv`FvV@}j=W7FQBH517oDN~N#fmQFO(8x0pC~0=I2Bi
z#UOWLIFaaDs<~Te-0kdZ+K+dFn`aWo_HrDbfER=gX^G!Y)1J5wq~&Xc2mUKW*@7D%
z3ltzXb-`D1g}NP1WF#h-Y<?d1yi8$SdyW<pP1ee8j-R8qr19&jWFra=!iqGn2%Cnd
z{8nii*@>?FRC%=%cFQp2P=?|TMNVWOQC`JiL7m)CYfq78Q~gf-?-{6T+5MB&**a;N
z|NS23M(PT?WdIIP`f_l8Dc2_}zaJFQ#xA2TZ&vO~D}oZ^Zg^RXCl`3*)hE|gILBbc
zkHlmv6~{a*S9eIKO9zITENlbeexY`R7=)iR_;)9UkW8S+4@>RF1{7^{oFy`MLdYrU
z!p{1lPEx+$`$X9+K_oAT8-ES^zcaofDQ}9+%jDfiI!xM#yL(xKZ`)5IFOgB?wb);w
z%x|&JJM8EN7#UIwT4DeRzL69jA&O|W8|hgb({H%i^6Kj!su}hkKF93Td<m5u#F;R<
za6Z+R^8$I=aqp+D-ZFSs12e6&1><O{Xuc-yDGAuek3Sm~0A@V!(NvfUOqc$Gib-OB
zBaW$L-~tnIzGW_?1D^cQot8_MZtoOWL^v)w!j004=p*(K-=Hw()WG0ZKSR!TOH+X-
zTJB##726S1u_i0dO%T9MOMeXe1R_<fu>_SMm0N~9b>|N3!cY__po7^XrnwQY9fXHP
zH9Ei%mRrf^yn8VD$d72Q#~NR9k<5R8qGeGtco{1!M7tA_VCbn3#)4c|=c)h{FJs~#
zm5+43i352|gXYL1(#D{UU<eQcy8e)McMqCiQloCu<5aN8U+LY&m9kXIZ&^b28!aTv
zgG0W8J;xCub-_7H5P`49V(E+{*FElZk)1;NN?Phx5lv*>&hhkKGEj^GL6&{ANX|nI
zc#>&#W;#aBYSxDHR%*LC83rUv`PKBL2Xu!=igfn3sXk5&H7b?#DLLmC7qOeN0FWIG
zRy*Rtn}+w354^HnogQ}B7^-+*KX3r^kfKey_4B9S4?VTAh@%E4lBA)elV_KBwmZxl
z08U6V_V{QZ1;Ts{)0{?p52|a)1DDdqhr42)whv#azVYh2-_+@}4t+~Jf3Cib;2nkj
zT|kqT$^nTQc3X<3%vF)j_IE2e_<ISf7v;N5YQd$e4(KW1SQ;;|t;-J(oF%Mxube<5
z0FLo-@>AUQVTjjppr?o1rm0vxf!<@6l?XRPc0OHBUctk8^qqYJ5x`EpI$51id5qOo
zOPZ!6GjYF(BXPwfux3gJCX~xuDmI8cD-|0hJ$fkD>{#A(NGS3=^*>-p2IIDsGHKQ9
z^r3(O{`cXW2VOK(B}eY!V_Y7oTj;Zg9y;ziOj;PLv5N!Nec+uPoL?su1Y-QI-ED`7
zf`a5+0W4#vdv&4nKG1(fV>Tir6$GEgtE03MQ^Ze06?Y)mX~3%ql810rw|WpgEkZ35
znVeH({KN8Ei>>y<%Ut7nJCV>2xqD4SV+nmaAE@VSJ`ImRdj03;ZQ5UiCrK(Kb}Z#F
ztyFB)<#UQqfQgKNpg7-^hjN~<Ty=A^Y2xWI=2$AqzzI||RaHH-Yd57^7DD>sUoxrg
z9^oj?nE;tD>A%x;9vM83qcehs?l_7zvXWNpeghoZMu9FAIvvEhUMbEb#UL5UC<;`r
zp$;<;P4>81YFd0f)<-ZZ*A^HvLYqI4Qfi@K3%0pD#S}{Q`W7+ql<|^W287}d=)5tm
z8qALiDuGD#krNnmTAcob&9Qpp2_2G5;(?@)p_3m+qlGFwBE3%~H3`TVbVu4AmBN9&
zHI6tsV~|UNhv5DA9jjgo){oXoT<SSZ3X!r3Fe1AEF)4ct8N7xd+b&au`2B#fvmWgt
zk22t?Jbi%w5Evi2L3$S`M{+6y0`1>#!L1ucLfQwijpT&AVOkO3b6&-jPrO~Ov^}{D
zFrsE)%<?LD@Bg_)`J&|pO*|=)Q<}l`=%T(ygO4qUr_Vpg!^Ef18iar}nYj(z4z?hL
z<pwpM-cFZeK2afzcF?9caJP>aE&0KZVEH>0g#>ZpbcBKH>{V{#Luh{r!<48I<}}8S
zfA3kTn~XpSpYsKBMRTQ+_6@3oFf$_ZIx!2u#D%mh<&KS4=MJt90k)r`WE>Yq<q(V-
zezozrL3qQ07=(~u9#ZO>mD-kgMj)f=$72J<EcZ?}fRpFWgE9(ri4x-veTQSXL}}p<
z1&~aApYjF8w+$k|t&O&E>ue-&oJ<w7>QBYE`i>O{c@U8qcS?kT;1jw2^T=DkeZ%%<
z&Zf}4BFQh%aGGCx97C0>Z=F{WV-K1OL?rciCm%_68%gti!%iP^Oo-2W_%_E6TpMdf
zN`HY4L&d<EYivc`;Yo+A2X)}sM+b%(xRBA3bno6A+aVCAEyhz9C2V5G{<RqjL5#>K
zUKn2<_$!%plLTd;jGU&Y*q{@MF)F3AT?=U`q&TNzIdse5&TFT3r^~iu)t4Q`Ch+KQ
zmxn*C%CRJ8t1miXQyvb@$Iog7({Tj{`#_Vt&&I9=9VIB<4(@B`??IN?&hfncf_#OG
z|JJzT?=0~$`HCk6MDAg1sT@QkN3l2@$kpGc%*jM;%ql-1Cm}i1seVpLKLRNMX`+YO
zVJ4y`M%$8NbNT$d;!UjKCEU2O_`AJX`l*s@_>kf5gPQ=d?Lu^-u}wCT&r*8wTJ=p`
zq`2^)N`XD``ilf)%o*FDU$*=s2@0{GIuWGt7%pg)^V4Kzaxh%dDkhw(UjP$cTJ(Z$
zTLUb~?AlY>XlZGu7fUiSnty(^G9Q~fO|)|ShQTCGQ~C1ZyU<f3<E)%_OmDelsGoX1
zC<=lM*GIC|U(Y5ctl|^CnqST-D>Fz)Ok{9vB8H5qMF1K!=<^rfZW0lroE7HYzkmN%
z^BPc7F^)Fpr6nF@8*y^vM8W|?m{<2h-!YIU?L_C?nq!963yQQPN@UJ#A~S3`5HvJ2
z&;B}(oP-t9=C7}<W%Q-h)X1M)XpkceMGqC@rcu8u*&g^rI)tl4e82yuJ~r?Q8`&QA
zflzxGyx+j2od7FBE4s;im|e2&9SetW#bjnCUk)x{IrbBo&#SvcABKd(t(i<~*7{8J
zZ0G9HL#{oUT64k>iy*2T1Lj=C{qo@*%>OQ;a~?ND@q*9#Ogx;(Yu!VnFx(ZZnP-F{
znU3i?J4kBbySusZc>LU*>$|v&wE#fKu%W1)2E6kkh<vC}hQ%mf!bFJw=3S6tK>YbU
z%;I<DNmm2Rk<pvsx~+}0R1uMpcZ1+vXf)dP_s>lw&+{C+8@fzp&0vbkSSY9)3qS9M
zZ*5e8K7^rw^30vqB8=NZ&<g?kH9_6BO5_!W1Wu8=KUj@<dmvu~g;+^Kt!ZE&_%21M
zOpdPvIEQl@a@;vA4qYl#(k<6TS!#tbMr4MiAF&4J?N^UTf$yl=Nq-<vP%6ocrDaFH
z+@US`xWu#Uk}aDAgFicU`XE7uN&mnmCnv>ZWaj^zJ819VhT4})IHh8IsZWn$O!ws)
zzj+Xfd`Jd(g}>z|bLDB}iE1NovH~3upoAnG3YRPRBen~QfJZpI#1XUdn~r6ms6dRb
z?bM!=nx+6^e|JCl8rSSLDe_SA?ae;c1?8(}Ra8{uEYh%8jrsZcb4~f?!#_8_fqtQu
zg$Xu7ItZaeTI5D&${5O+fXuy#d)}rTVD836AZ{>_ll=!Ye0G?i8;z8CC9{r<D^1lt
zy;tSL*$rdW$Ez4gcE5WyzAf0NM9!Q!+0@ijYd0`5a;mhnG>0nBya~r@jQ=LFx(%v_
zWs&%B+@GluowtP3)0v{e0lZ4ab5?j~=}3S_Q0mSR{bcx|!`D-(1n@@pGN13;W;IZ`
zT-Y2ID?`DLi}gBLLGa7S+te4p)oqx4<kwG1NJ@ed%uJo`Z>1c<d9}6XtVeRNUz)>h
zAh|g~WqRY+TA!86zzd~S5ZG<=;I^B8!_{px@=>)x8zDC4YyoVrsrEg<PGBj9ik|b0
zvC_SE{T=di_QCW~k!xQ?eF-$XMRh?(C+jS3>uGd<W||&Nik;M=y@SIEk4FprWeTP`
zmd6PyXbVqrcVl#mXrmX6rl)!(R57p59S^pg!s{6cDXA`08t{yAj%e=A9s<nQGP_oN
z!?q*lHCx&HGhsVih8#Q@^>gK%Ia<~sT7!%4Mzm4*655pQ<%NaTx3yj1FTtkNl(mHJ
z&ynURlM)r>;^FbQaok2$sKy28*(E)_M?r50Nngxi3QsSuyFml2gkJuKe9>{^SOXLM
zGXM5D0niQT+efSj-wqQfG&tGaX|Rf0P^kTrqIxxBrnSsv*i`3?^QcVa&!Tr`_pP8E
z>s}>o%-#cnL5=j*(az=N7l2!SUs4<325U`uk&yQLI)0mOe-s;gC<lxE>VEn)A!a^@
ztUp;%W!1F53nV1fnZwKoHTEU*Xm6g11i?ld0_9IYrl1=wvWv<<v{MVOxA?PV=+|a*
z^pTGY$Io%{shiY7ZvxoJ2?Ou`2qIYTGjp2~!fAL<`=G6S9PUwOX69<nwy6uN2<|a^
zO_{H9ed4gWCG0L`K9=Ij!+infopc0#)&n8gw?9LcD4PVn)l($h_`T`gb)I>uv|=(!
z_EVfq)Z70%H5{m@t+jRIx0B#|q`L<OW;ZwD<5^f(S?L2)-fDhh2w&^w*ro$0_}^M6
zDEH3yVe5xQNx&ZpAzqGSg(!qao+}E*bAXjZ%K-!R)<n;47hHz6IK_PW=W^3|SKM@;
zw&E|(&9#CXi{2DJh(?ki*rXp|>FMcW3JPB~tIrBNLrWUwRnM17N=s|Hxa9RWogo}!
zQxCwj!Q5%O6@>?=8+qSxBi@Z;^>S>r5}oFgwoe7fUf@$zT+SZ`S4QrVm*SP#_;jLc
z>?3WNlS>jp)ys|gSNf{S-3k6^_s94}OK0Z`t4&TloQ^$z?3b>ZPhuNSlcXGb6mR?W
z;^$|nsi|=0-=vpcx?Ri;`*`-;ImQQ^O5u!je@N*baHl=yu9|&D&3yZ&wP}Uh!q{!_
zc50aM;;~1rpN~+KINE)Qm-yzFvhT@UTi{a7jGT|%gXt$e^J~Bl#0I=E^GY@q&KH%I
ze$w*#^^(k;<8TTDr^sp8%AEn#U!rB7hsQ^F#OG@3b@v+v`o8?r;zkAoZ=AkN+JJww
z<|zgJ!ifwfAqD@b{yr8k_v`xy;aeNOe=PMd=*V3(%G!Rk^UfJq@-4N=>oFQv6ifW;
zl)3@iOF+OO-ux>H*X4(Y2EsHjI>ZE;7#XP*vcOw8MIJZcy%!&*Pokf{ry)!xq6WK(
z3-Oe0yG@vsFf!&M!gsYxwdcL!pAqkqD|oa;;2LU}RhDvhZ3xb2fftpP@d@pAS2u(D
zdj<yw8Rmkj%FCayMyiCrP7;-rjIkDn_F}mVH!w83pY(Wq{=q48wu_jw1NkjA8(&^7
zU4k1OJjgNL#Ql^3thAn!f+C-`(M*K=FB+(vA0Gx6is>k9+D^DX<5_sQRBQ4N4bH>5
z7A2~lPDd3M7BZ&c@7}#TqD-|=R$ksSG-PZws-#q7u7gLfjpwLB;~pl#7>pX&pjT7}
z_G5}DB1{4LnWxf^3L$L%z(a6}2j?h_2iFb@p!E-saYt-5kaI8!P2S-MQoFDC+t(@?
z_SYgQN*HD(L|A9SJJA`J9DRmt7KaB0)C#8}uHLfu$j603LmN|<Q02E)mr51eOOS<1
zRj`g4q%X{0<N+0xR#F6(*QY}JZ%q~f?fknkprSNBafd^@?)R3{a7L1>k5J%BGqa1+
zXK=dO<reZmeMg5jT7vcb6`#eF_;~e4j~@Bdct6y6_RYyNxSd7xe%yT}==Bh;7gbgM
zpUz!>w*hg&3X?{Y-y-k0rgX@ZeZnU<gAQy~jSOyhXSF3>3KGB_Ztpw3+%Em$dDc^Z
zteZJU(1ul&+r-&_NkBg^Iy!nVuVu;4U6nv_$?~5@UZN?$XEUY^{Ur~nb+Ejuyq4UK
zr}D!e-d4(Bj#3}+a+8$FSDC>#DKC855eH-)Sjmq-a?_OEjgnw4()rFL`&_zp>0XPD
z;;+X?13ni%6Z`SERJuK{9~&DBa*#ag@p^UD6N^VzPJKu9J02e}hohIAlxX>o!AMHD
zF`40&Q4P0mf-6TcX|(w&4w8*HRhpBl>H5_w5UGCABTN^cR4>pIbrI+=8g@`&!*UBK
z<gm~}y!}&kP<ZcPVsrd2O2LgO&l!0I2FkxocTCFSFw>HjmewmCbS{kuFi%NL)MQ{_
z_+I^mpz*VjNSrIP#g1Mc6X|WhS6s|f=)8CD-pTIS{e(de!+}*$s-T|!i`(@tsIUK8
z>%VM~=)Ll>*%NqOD~tS1NP%|f)JcxnNY=h(P+neMTrhUObH3pdXa^weOS+h&-~IWs
zvvv-s4+Iv+3Q~kgF;<DEB4s@^x9dB}4S`kgG>@cH!iTI@cFyZo|GDrG44Od)pz`*-
zGTl9ifLEPxn`pcZOaup$`NR{8AocrlU)BB*3ARIFo%7&2l!+%M3I%wyqrZRE)Nk|8
z4ic<`qgLcrwKXEwAPaOL0f`$&+m1X_N>@sChADGEaQgKZJTE|JMp=2m8eoB?FC0ka
zjCuUYzi1sI;5OYBzdDn0qbzyc<GuWoe2coVvKH;XR!PCe+o}G&`*f{wUZ#IdP;ZX^
z*3g$PSF5}h4Av!i9FCA05Y*oPc;~!HGtW2g&g?>;;%mIHU(AQM#?gN$+qY@TNDV4a
zkL2u;7>JN8M!4>$nEbERo<)uI?|Heo&!?uQ8fD0Kl?ME$LeJ91hNn4JmhbrS9uPcT
z_3K}Frs?c?ubsWPxH#uh&Zk%$58xZ-2O_K`g1nvOV9NC8!Qwj>Uz3n0!HzYrB?>|e
zfNu$MRtzo4j&J=n`hl1Az%nKanO7TCM0^PPAt=AvseIduim0^Et8Sc~jt-Kr6gp$}
zBS&OUHzVb|i=vdwnvlo@I2g9-1meS~qb3m>-Yd<`%|hnwIg|(TfdL#JJ0eb47ah<7
z_OwLDlYh;-dY<z)&!3bVza0Y>`^^Ic1Gna~{xL}P$-phiPgbm~tT2vhOkP90Hco#~
z=Hp$IX^>~2S7ZJji#i8U_P79I0>AMmf8YS@3L}uQNwac0h<me@AZCC6)+~BQq9GE|
z(N}<C4gd8)dul_^&974>B_;a*I0CL6e<Y>iX%yKx|LWDbb<rB3k<n4D@~fk*wVzje
z^|7O42X^EGDGcmOK+d8uv^QO2plID={?x~J)d)Ebhj*kXrYQX0m~0gPwep%{t}R~t
z9|D8BuVVW8`(<y2L8gChHZF+Kr>e~AvZ3NBvq#&jpN#^W@i9$~A^bYR%UR*iyd4w}
zr+RZJEG0`jSq3#AI=j|yp_6j`tNOYh(_f|sWZV`P7fZmG2hl-6ctTRrXE4<vS7+zv
z1MV#w8@>RH(CoU{N0iXjv!Kq5xiz0)^)r|OX@8lJ>=Ba`_L{LG=$F6$@68$N`%#_f
zTZY@Az|M+F7zPFhE7^@*o)6#Pc_Kf*=8rYN4X%Y;Iy^B#F*hAyWRctR|6wZMg}n0a
z)>e&)E^tsXlnLDO{I8*C6?pOTWg=@NMc#ClK~`3lUY@}bjgp$0nqRI3Z_Ji@d-cQH
ziPL$SfSnCDcIXf^^D0nG|093JB*;_`%<L@*Ma2{lmkft|@STkGoNA3Jll1<ZnpZIt
z*MP+b9^wT248i8Lvx|$1JG#4zm7B8fn3!=R5Ei|*_COGRpS=L)6&J?;r3eTL3<!_p
zYL*+RZy!zxT)*tUhBu^MVEk)2y4sixd97R0llLdxU!S;TaImkcu<(KPI~E%o8^^0x
zg(C0YpLvWU#u{vzpc>N1nU<TthGa^LeDCRugumIw^`g2uNyw~9KkOPf+j!3R=KR;<
zJl5kp3*tTrpI&sSguHyRi2|e7!oq^1laqi`e%CcgnF7|G4PdT9!)x~W5qxJoJJ_p_
z<;H(pnHc=pk<On#uTKa+c@i7j4K8gJ@5sKjw;YTZl|*8D35Wq}RxcjNYx($nef?5;
z*T9XohQk?A#b*{!%G>61)d0}0d@P^fSb3R%G|okqJO5>-qXgX+he}twHHDdu-dLN*
zuYP?e%-na9$a6r@)a$V1Py^MP9tY3l$S=i}>E;Dl=+Xp}{HUGvL<0+%pp~(0G1x2s
zAve6E{tA)+9`9PaX=imDiVs(p>i%p|y>qWUpSwq1qzPu@(47Hy)r?Dne+I3colkv_
zPRm_*#e2%m-d^wL=PN|MYF|qAY{1w3`7QfvWAeVEl@(XALg3ah!Q^{{wUhu$=Av#x
zz9U8i5`3WxD=0`xNzqv;)_+Mi(Wm)Ds8pcv{$I4Dr}CulIPer$%wNHFa<Nvq1qE4o
zd3m`RQU1(Br{L$e*;ap-`Y~UHKf);T^<g?=GgDK!Yr4m`cc}{ac{Jmr<X>c^U=wtM
zsM#t|z*h4u%CNxfWvu!2m1bG<6`j9cYZW5eO=Xss;Vnyfz-4!XfHJn{Kbn{H7zx_l
zx~wG2ns}=6TkHtrz(5-4Z8EU=R|s~P7n6~ZK~OtQU^nIfr8G;8^IVdX|5BdEs+?6}
zD$-rrEg&Mn>hmYFiP4vW6s7CSH|%Tv^3Ct92ocbT03wpn=8^Kt{uTicTRrBk0PXNY
z=wCm~4AXyL3FZx6brLv7EwdRA*bxb8`51n6tUCUv?>MHBS5R0uD<&r9A5BrV3<wCQ
zyXSBmm%JS@gB4sVP4>=8-VW1vu2_nK^`550gg7Vgg&$9wW4l7P!9hau=MM#kO%m~*
z+s~r`x$IYJ{;b%4SgI*sJ*#Ol)WYf%u_Dnjd-v(UPxNWGW1&fL3^s81Gx!l_#6`M1
zjcCh|NW^$B<&6#UGhF1W`kd%zls7tGC5@9Rmu7tbQS&2ctz1!)Ibd<{ecQJ-<6<H4
zZ$S_7HQ$Zjx5<4=D9tSHyWZ!M@LOv1Ld!6Kry{PFl{s{A7lW8)Sb1c-E*ohL+ge(0
zjS=YBY)_PaFCi^0`=blWE+L615aJEC9>h%cS6?nl&CEkKY&zED>b3RseSe>|Z7l%q
z*LdK-fmg;|Aa3dz8$0ThaLW7W(W6q}gl~@P8yZ6U2L#k?bweQDn|r~6Ps#wcl70kW
zJdI=tUlFGG`K96V_omh0D|{L{8e1Ea2`70<fc<D89$nroA_9L!W|DoWn56yICjS0h
ze!8}ZMU6imIQetylS=<tcWwQrPqthotXX!3pp{^5cJ_@z)C?>CDsH(z=TYL%?J~AZ
zU9|_+;c^U!6FQvI4XE1&Oy)FB*edKiu>u(jI+03Qv2Dbj9|C2H_}qT~^egt9yEKCy
z1=N`aPT%KWl9*Vc(O85rUgtyK;Gm;tdOO95pTi$MD0<wPl)hO<%Xw6V1T#WW{k2sf
zZ9#*pS(o)FGL<tLAlrR?1__lLa=H$v31Y=H9;#uaK}{3WTm<4=X7B|eReQ3}*qmt|
zv&HqUk?Y^uJAyp-cn46&&s4J`@5aYdeKK^_5ymt(6ae5IpO%)kOp8$k9MN)eavC@P
z4W+}s@*rZAc}fyeW=NfkYmxakan_gcD3nF1q&KS+(-%TkOYJO(QRu_lc8esSxr&6`
zek_(J+NT6cxl7KpC)($mR?-jNA>RXw0kZr9MwJ(J|9(Khi6<34dXW(khexj`oW;q@
z%V*}~yv>pggdoxjl;>_6ls+3ScYWWxRU}5CugvN5znJn6)KVrq=lix>VhDZs6jhQ!
z;83nnVPhp)*88)_OP?k0e|chP>FYZX5f$ZMz?p^uUmeV3@&V}vzO`!Z%a`?(GxA`?
zm;)3QMfQx^ZS^X4Ola<C0Cwr8Us|Hd<0qD8bE*TpOC2pH{2yt1Ru51YtJ*DmfsEne
z)DsIS=`r8*Vh;AdGzrO>2)m|?b8&IG-I_Yss|LPJ@%Zuf`ugCmO2L$E8G+>7k8T|O
z!EdlT*S?g@oyC-iU-ki7u@qcM1<8I6z-TYg1np*^2*XcPjey%Ere_rYY>tp?eCc}9
zA#7Tq>wd6qFDVW_`V{`rwAEb5w4=7#{`J5>96<ZNKCQ^gdVPZP0>s=RAq48w#f93y
zAM3dcFM=qJ@kI}h^Iu712%r_^A?y`ua6YQ$xmV%<$TdR6rWiDmYhE){`5T~61%96k
zUnl*V1^Xb#DB;H-L)Z~xm#bH$K&Ymo=(s}m(btCk!;_OhECONqo%5kIM<T9*EX6Xz
z8y7c}Tt0hiU!F-M_H^eq@v@;x!Hk<1i23tv;Xkx7r*i{cyIxuVt{q((tC<#0*^Ky?
z;3g2jXa{&6kdcs(K$V6EDDRTv>}f+wH@D7+`}f}m*1PL$^S?~4(F~&S7TJmDxZf^s
zz;PFuAA%cV`?0<#K2&)NocpcBMhI&_Kwsy=Cb;z<@{Yk3ehj`(cw+8<(!KPFpov{a
z(iw(-wIBd?P1xjvgjT1xnIphEBm)jhnx}*BOzrvb!PWEWyDTqnZ`M&l{X-wz+;1wT
z6Lsn0xv6*HF9;pZ?+vJH=WiPhR=x^2+eIjxs^9*CshT}fga6e}G~H<jC)Xr|tj`yT
z`wCmx|58O3hF#CWrd%`D(YX&ozI)=7fjsb!SNHwo5%B}Hua{0DVg!1qE;5S7B*rL7
z2Lq9tiyY^lx!_w$`ZVVN<Q~+ZrlQBLNJ1F}Cz07GhK;v6LDsdu*9v53{tP)4#Jdca
zo%zS16mf}&idun`r*&S05UN14uje7tVHOtAs?8FRSM2HUw+CmGz^WdoD8a!2_$}JQ
zqm4sE5eWkY&1)QX`OEyW2^%^>nFL!G2W}*gv1xGq4;hd-^^wwJ4nb=;i<mLVneQ<I
zh6xPEwc9FFWdG4gfP&rb#4hp9XLRE6S7c;liYU8DoFpYAY+G7ds#Ttamt(hezxx!Z
zgKRgsUzi28p}jS*zN2@up@1;!UC2>AeiZ*7N2LN^^&4r4Jd*6>@geYgyy{WESA+Ly
z|6XNu5ctO2oU;xn#Xu8#`>d`=19{Tqh54l=>DuAjE|+Rt8j`?8OItA8H(1v;dZ;DW
zm-aL8li6F?yo+9-TOyD!ngU1#1U{bK>lK5{2*bw8{Tt4;E0M0J4S)F5{Yc*I%~F{9
ztom0SAz);Aa7WewTH1uWcPW>cxH#vuP}fvlo?tMfOPiiPK8fq=-b=qdA@{(lRL^8=
zR^sqru*%Dc=Rk}oXEYkvgV=U^>H>P>QsgyeNaKT{_H<W%ng6Ip6#Qz%#QtKRrLi}X
z=EZiAXWT!j*>W6(MkTTW<4kd)L<VF6YQ&P+*)xlA?_Mgh3xJ$6yCg{Jjfu}MEQkvV
z3Xc7ngGw2C^^nc9F-NGKZW%P$R&Zc8!2Sj88j=xdC~A5i0uNq+4o22{_d5PV?R^-Z
zF~8T&W7UI|ncqL$sPo&HxRd;kv6?${n3YuwoV&&Zx<uKH7r9I37h`Ny$qbn+*Bn8l
zoe6I7%n~5Dt19XWY#z27OK4ZhHU%;fW+hs!;UEbQdr5G9)=++^`TTBkBedZ+nBd0j
zgL2Ek9$J5v?<mIUT>r@MuhU+odPR8_E$FrBXBPU@fP*yo`z5atz@Y+CgxI?EGf<}_
z5r#DK1+@Sn&YYnSSO6dB62VtcT>46flp~~J#z9*pJ~2G%Kig-(EDo0^8d?NOy1Voj
zSh&(2l{@^eg&KwN@bIWee*m$)0Y#paq~xad**boRIU*wC^7g3Ls9-`x`*S7E!{!;w
zR;*>LHW$D>-1rg~(H26@ShNOMPR@w)0YXZd$YboW<@I6L#Dmwz_jOd_xEBuI*ig1t
zl-ac%V4+AEvX7w#UW0xp$XRI5P}w{80`skccMmjibuH+UdJb{c5pg2akTNgR%1N|E
z0@Auk1DiI&HgiD7S3;FmOYq-;M`}3irT3y30Ay1=C=2R-S8WcwR+#=*3sR6Ho#~BO
zC>qJg;0+W=oS+k^z`D%!FdE~fo*U=iKLi+_N(Zkn_Th0RYl(((@|Q=8atShzR0eEz
z$!>43BuX<R*Qp(_;W8KTy3KZ1Zq-7^9=_rme}2DFklQQ80h^g)JbdJcxU#bHScqZg
zMZ64Up8q3!$s~vg;^X3$jqOxb@6655f1TGnzN0B`pf35(S55i|#oMVEkoc17Y_UA?
zH=lJ4G14Ed_gtS<=5UXiF!`_r?wvdsH2&|NpVV(`RIsqIMMydbiE`Y-O(!2eeq8Iu
zjk@pdOr|?rhS;+S8qN|vxV%pwR0Q{eZWc66;pM&NO`wkwCH2Y&<!x)f*DRfRz0q>S
zH7?JjT;?Cc-_4VXO~Q7tWX*Md1u@VyzBE^M_(y{--U!n>k*~P7ndSi9!a!3ZdYFn3
z?s$W806U-IBD=r$htRQn7b`doTBO30W`8XKH3s1)&yQu!zd{a*=bA{=875==8HNvi
zqoXdM*(dO2PeI4Fbf-Y)5k`%xX!O@PZ4M%7q0aUQ7hMBFIb5nJm|AMu+e-iMsdY^-
zioaLxPxEkWhIyoY*zE9W`(F1a@c#%h9OQAS(onxvT}-vd46%h<G{D5JtXwNlI{7%)
zO^jFp`xUw&p>_D@$L4z~<=`G7eLwX!LZw{l18DZIeOAu@nOy)w&T+l-^HAx#%F|?~
zia#d~{(D?wwLs3OG1?^o={f35@F=kgq_-da`0=AgV4*0lr#zBHbel}-P}|d4QR|~1
zz6lVn(D0Rnh2H@JjEMkcwe1`G?biO5=6X#_03=O=v&P-eFR#2i^es#A*U6%T2mfQ|
z{ox<=$9s+GY%jboqdAhppO1d|qwML^qdk3n)5FO@J6nl{E}24&gpt#-iB!c%-8Q6r
z5gWcN3sw~k1(=%y9l5-JbMh8-^-9Z;>2!`?4!(D8$bB7M3hI{w5ca=DvxS*xxc4p2
z&WeEY8sIGkDu^8K?X}(7+PdK3QLN*$1<CaTSe01WSL0TDLF1AWMZ#b!$X`%x*4wc|
z#)3lO%jk<YQ^1muLEw+m_9n%df3pJIcC}t!=MuEh#4*His`5KXdr3g4e$6ivhPzG;
zm;tr)dQft}!p^>S6r8pQ=Zr5puUnYI^jyjVt3IN?dv15t>fS|)6qJI{Tf^=(xZ_Rt
zJVc{<nlEsdd%Dk3Z0oc_q0~9X85q3wY40m}|KW{=<z!2wN4_>=l0Psx)2039)MM=*
z{$6gh80IuysuW#yp<0Mp=Ur@lZ|~zd5M{{dO!vsh%0@!bH<B|SS=fpVij|rwF1tEv
z?9W^WI$1-2nB+BvE>q?oV%A*4KZ7d*Ma4KnGP1sYW%2KIa2k&TR9c$j&&KO?SuMpX
zr+%UI*6r#eqN7(U0EQL~&YWB&*muo6MaM-H6t3#~;mc3f=W>ceYO&1ZHdXS*Zd0TC
zAZ7^cHt$)v(`zGB3E4M0Q-6j?@TKfZ``=U73oh61I~WJDt^<QBi{&4rmTvs{@vmo(
zJSie0gAToOr-r<LWW*WpBQmJFNC0uXEtkZ@!h+-d-Omc_M&fXK1`1pe8nhASW4E9p
z6jmtQk14<H>WgaPtT&#DZ1@b(Kn7YJkHWp(x-^JERn)mA<sEDa*H62%fn%(69f*bh
zHBA!vfCyMvI8|O*Nr}W44bh@k@X*lEHgG2E|EYfs6=Mh$h9l!h{BlKDzNm7_gXqSo
zByW9j*#7bAchIJ=6Y4$J1na6QV@}`gc!E~&2_E$4$A?6nps$ZQSg_m+APc$lkLh=i
zBPF9}x)1@p8!*I?ApF-mmFjUNBqYQRpg2x~yAqMA`QLK&g<-_yWl-254ZoP@+-
zqAcvudjAWG7kzG%FHQi-No@s7#2sjZ=t5*QGS!NVQ6=!x1J$I-;kp}jgC&lS{yB)G
z7Q#X412yK=>GVsIS}6SUDNSS=9*R9<zI^#21u_}i@!lX)7=uv^EFSk+f!V0|Gqi-2
zvfe0tykTIX_j7b}N^MUUq52IB2+U^Rx~0V5!mlff!Q%`QCtu%J6<Q8Ga#f@boYJ}f
z@fQ+LgKvgmpXGextc?_TR-iBSBQh!~0n~9W#Q<P@FZLXy4?AL%(TXlBQ*?Ud0<_d?
zs8-)1k3sGp#D#h277Fd<Q-r%|iKLk4UmpJOyYKo|Pl|Wc1jvL+f`ggoKhT6k)HYlt
zBPls0pPipC)YH{9F`5!J$f)avA~hg*EFiIgRo%cni5){ozrdohTG63TNpdxWz^?nQ
ziNB^PKxcopU8ra<f=cRjF~FZuEyodC{|NeWNx%&pMObcMGFu#P2(kOMwU&QXZtrd*
zU>0e(Q(w$?c1B-pM(qGsT&dseu)PaEeqJ27oMsP7-EA#Wlj`|V2E~7>!NtQT!InwO
zoJL3%fP@~g>?Ir!k(|(N8>fv||0A2Z6c9WEU>X^Bud7vaeBS_)e|~*J>2Hhaz=o+v
zQ;tmPL{B=`sj%EVi`%zv-&j+cae*`wJDpkv@(c!*cY=&Wud<Rw0!9WnK(l&ones(Z
zlS?X1i!P)B&}{=YmR-BOK9Ep~aV^i|3RqKwEdf?A{CS{|hhd>j<FD{Dnw%8X%ErO*
z-5iCz;;%QAKRG*_&2seUy7|)Bm^mmBnFrheKI$kbnc?@v;Td^LY_7jv7ab-P#79HH
ziG2L^^WUs)?8~QDhF~dosPpzabOFbnO1w#~??{$yx4ADrZMwvx8Wkt$)OY%yC~00e
zH9D;^v^KI6Tc98GquEdUWXVuZj}3q?zEZa&@I+f-49)$TE4|?c$>%(goB+o+JmRZI
zwl7!T#AQ6PnShzx0f#Vh#KFB5E?`ck;js`Xku1wxX%51}Vn0wH@_#H-C^9KHO=Sd%
z{aK`1W?9bjfNwE45C<JSxadO(M~@svis|PXhBxccIs5B)qG=!o)UucA8T9C2^Q1Of
ztbHNl1>Iso!FKdN09_m9&-Z_R-rwxM@yl?=e{rz*^+@3N(SP0e7F7fR96S;u8kjMA
z9P{?AIzUI3BD=uZoY67^T)kNa2f1tqAZ*f385Fr4AIA^E#h{DEcoX$x?H41qyK3ej
zh_GX^CHp@nNe&aRRMY<%NWhtuy9~$M0P_8>mstBRSVge`l?VgGl<UKn+cR;nZr~~3
z#0G=wd?Fs_U(hn(HyM6Xs+0;rR5>czLH)GmOs4l_eHLf8mw|__O);~W{*Q`9@}|B|
z2H82rGubAtHF&unpNk&^`tEj$K>{-`u<NV3Kz4<K5x5Fp9c5K`IPBWlZYq`UYilg>
zGXNKgW+%Op&>J3~`8k)x33S{+*XJlbVEdWZiM`rjaNq@c=KT#4CHCKtm*R&m{EX+&
z`;T1s!_EEYc)tz459&KJemv!R_lQ@&+5ce*#jCvFoQv3Qew4^UaZOQCZ$pEUI5@7C
z$^a{!`SRs3PB<Av5G)w$7bS7B{06F{03{HkwiE&@JOY+fIoK;MV0;QE?{WWEIY3wD
zme$8c2**VP#5#>Tum92$B&Q|}LU2I=RfR_kz|m}g=>B_V%dQE&8A63<afA+Sd3k~z
z$5zi<M(qYR<$HmRntA=9OEe~}Kw_GXehdP}rXG~R<69pt%31)7E!^;h(Sy<rJ@I2B
z#-ak^z<wNnqMPNGEBL?HWEoozzL$aOIE(!#%f=))%SykO`*vXmJ14$~Q9;DT#fbom
zRT%mV`ve=LuFOe^sc3LK+oPT>e!rT6u_?QGP4KtbPnPPsjq-&o{`^?GFw<XtP^&Ev
z*y5RB4KL<*UWQKi|3}zYfJL>1?FvT}2U|i=!a$TpK#&#%MLLE~5$P_8p%jZ0rCVy4
zp&O)8kw##K4(Sx6o4fW5oP+-NzxO=Pna5F>J$vo7zV&_Y`+o1@G3(N`L+4Eie^vM8
ze!IuZ-8|$z9Gu~9wV7Ct;>1#_nQvW>K}YE4YkjzkMzN~o)^WY<4E`1tlD#>b2_Uqx
z7|YkEsdKb<uisLM%~syreq@q{anmvu>@HL;$)Avk9o<Fsw0K^xjR@HZE>Knf7LmLI
zkNBoO*BKn6KdX@xXeMdn4xgJ43DTEt*nO<Q&!R8gzRM`BpT0WtxFwrwP9uO;*g|Nn
zxW%~Zy>vX>Tct)Fe3w3*B;z#WZk;Ko_aWKI#_qw%*~(k?NfW9OtLes+Ok2u=xj~i^
z2yF8EY|H3wA&KG~%V-XaCHM{Sdn;Xq4t927rkQ0}!00p%RGxE>7IeX`#~gnf*5q;~
z$-q5{AjKffxJQSqw&eNmCkc_Vkx@}x4+CiOWAt;SV>|Z#xm?(cm2TMk2Ygg>$l@MT
zUG@$6QC5@Do?R+7e0~Z1`<a5@yYX4IrAM%&?)ln@sL%bgllV=Yq!Wy6ig8-ct}~4i
zdMfT#>Wc|3zx<x#iOvZr8s}M9^jE-r{S)K9nc{Afvpv7Jn+X#8=ytZ$o!}PL31)$D
zY6(AX=`A$Z!7IxaQ(08|Z7kPZW*gTZuX(eX;0p?=N=>T<B4*4wxezz99Ot!j4O?Qm
znRGX1fMWhV16_Mw#p8C>?!smP$`6~{SNA`<*2|d6G-6f7m<kN%YPxf|axT5SZ#3@l
zfrkjb3z>R<sgrG5L&i*lX$ig4fFEL}QJa3gHXS&d`MS>YUNeAA1n(_|R(u>F+vMNE
z%0;}Rc{II561xMZ|3}&e_t0DhBN9#Ndqa)SiQqEO_T2RImr{k|n9JzzjJP-6Ono6B
z^eDQ_Ac*h#NYk#bY0z<*%Yn^BH&%|R+or8n*(yMzbxt$d$$xz}<lwu32?nMc9J`uc
zzV#u??Q-F(Iwc3;+VtR!?&R?zOtQiTLV}va<ht>Od*wt?zJl6ndN8afMYf?FPG(_I
zJVwqbAYi8R-o4MImfA54=nNTiWF!2E+PSb`K$k}!H9&*qc8g(UPb6Z%5IjpTRq*pM
z+cLcw%-+2-iMTllX66_bx>?_>C$FwCR@i-&<i>F32L@SklqO0tC{`!SGWwqE^pX#F
za*u0!1_msI7Cg^f+*vkekcnci^{2LV7%Rd^C@H^A6soYA%dDr;ta~8w3wp{X^BN!Q
zSh_X0f#(S&FlvhU={NJ)gm0l;I(^x3aO%Yl7%(P5x>KyzQY$`y=Qtn&eNDdalI^N!
zgh)ikC8M(D_S?#_JHSJ7-R0NesRQmYr@+#$!Z2J=Orh3GXzxs;w#{}$(Ee;Vm=oA=
z1o-E!{af$RfxD!+gF3ab=8Ukw(&(v;x#Ec!PMyuRP*Iwlt$zHE&1x9NIDi-Cpl!bq
z>~(I#aj_%1->#+(1_`7#m)k!>g8|8Yw8*oXE@9H#=!2N?75mKtxH|V`bD&7N{m}oi
zQzn>5Yd6pDcq7mpB;?HO^Dcv1rCKWkDk>XqOlCC_?CRZp5vCgsdWv_Z%k$UwyjSH-
zzE;#=Uu;2JH2x^RwK57_%-gH^!?LsyiKiENCAc;CQ(u&t#3r^Op}~^bPBcz)4dh$u
zL5)QsywIG#$}5r%9w-PkAecBAblME^<#sH(jTGez@N_DH2?hT8z06{b#A-TchQwSZ
zS8d+5aA5LUH+~&qXl5Yp&TXSXr@6FM)a|qDMo#WKMcfKARbN#B!&32_*CKlEeTUBF
z!W;B=Icfb5kJQ(4`)^n42D=Jxq;9M^VN3=~Ec*Fuo47llXI6%D8aBq?fBkGl)+P;v
zrq&zync4fT#00~b>%1~e8TMunfJKdaJA->-+NZ9k?j1+%2x*|}%DJEDhi=FPZJ`BR
zZ_u%E&job6bEnuHg5at+La?Qh4UJhVP+v!pxrgj(m$Ie)!_Z4$toQT8ZViF4R~UWn
z<LSGB$uCN|{DOJ5IAyWw<=qTLd?UZME?KS`N`l}!_x_8Hgd2Mmc)C6v`$HxP!qEt}
zdlw8++cH=~(9!}ShBK1|ypT)mhJXkQCJfv*4FKfhwy|4L0H=J@C*|00AL_JN$8c?H
zvI;k2p<j{}#Q)N_a&C#HaHoG`RDHSqcrkc67__^bY|syyW`1sF*2#V{e!A9jlX;fS
zeWM{t+jW5N_4W7sAXc*1KdB3%=X89q?J(6w4}qzzG_xA_jTxOi5T;_T*th6n%TveX
zeB3GAO+=C^G>(6dh7wUAp;ck3)Nh+6A+5>6s4E2R)!oL1r+@rtnlH`$<QrdZf6(?R
zmCw%rF0|tr<g&sdry*Idw3M-G>XY45pgXokKc+r6m&t9A7HnzRd)X>KRmnj|A(=`n
zUq{0?KgXQ<j=e$#W?+{}SpQV-yWsu+Qv<hx)DO2YrRbfWCus#Ns=J826`ehUU!_Yj
z6DMQbcb%5J*<7o-Gkbb<{&_Tgw^G&6QbyCz<@#?G@UfElv6*1IXAyFwktkMn*)j#r
ztiM(zhiNoF$VCYTBua62np6~AoS8Kb?a;yh1Oj~*3z)NnNK3`Ry1Kg7Uzp3LlcEi-
z9@!x$C^*y<lGPt{nM!&;*#&@=nD3MED=Q>38a~<0zKJ=5i@eyZIi2v)+0+j<(!Hu5
z)aSb+wxLF|j}S5`z>|zm;ORm<1}^Fp+kCy-1acr>*-FgaYkxrZM+mt|*Xvcvhtm>K
z7kr&{I@;S6Yu;x=*Z{~o@h@2?@QHn7v)1zJs?F&d3ST$)xmLIk-~vl0fF>LQY0I|S
z@x7P?M@^uw;DBYuwSCdmg6C*k`djT^7ZLEew^`#pyxKgktx6v`Jk8X%nH#&4w$1<n
zR0r1-iIe%40iHtTp;}SpzT)@e1_-TVD-Z~Tfa6Tr57mA9U~;gg$Vq?g-!bH5C*gDZ
zz@h{9kw&DRKtw#?`rAjx?(_sj#k%*#_Jr`?=n68X63?!`%Rl0+tf8TyFMZ$eDC$<+
zP(ERrkaUZd;A?zsKup)F3RQ2WF6>m$7<u|a(AMNDgZx9ICQ=FI<Kw9*G4DRMCQ)W;
zmze;D^6J*_KhSO^SzTAxKEUIBQy1AMb-7PPpF?_kWbATqaQw`_Sw=DU2a$mE0~J~i
zZ!RhB%280pyK%t-b4XY~mp~ZGrgMjcg4Hggzu$4te08>a<S!%%>F+`42HX5<3?84j
zj%dP_);ENJPED?;7<4g$Wh@#zwq)Js0_E(%h{7435#XVji}$U94G(vW6F-$7f;OhY
zeuqd~jP~=NM79kqg@2dFK@@V8vhna}^n&@zZP%np6<N>hYz|H?u2I34hs$&TWB>#N
zI-~%TYtW3pWGR?XD}pe$KlBSHPxM*WQjY_b{#(s!aN`o^6_l~D@!Q$j7x-VoBLsn^
zps-K^pk-`%dTws}r1*WhQ~SVja;ph6;(t&HNXS!(arpMWGa=Mf>2rSj556;vI7--k
zfLW`gqnK~4&o;nm`*-c%rDz?{?tB5-9f%8x;Q)daM!q|N9x)T3!BhL1iKQjarWgGI
zl`suimzVD{<5~vk7@*aX6R#$HXaU+>Us!IJjpUy%Z7=@DR=)nJcw;>Be_ry-i6!GY
zYQVvw(M;X<*m;hc(1F%U<71m!O@jiVVj{g4-dW&>MhP;CBeM?Y#-sHRWG!~W?GHvk
z`KU$3j>FPyZi{$EGYB1xfQA1XdArWW4w5?YhY!mPrHmlX@)RTcojcC}B3k;e6CfWw
zJw2uWMTH=UjY?zKZ?eZ1a{FSj{RbAP;Mtxc8%f5b%=@rHzxH&l%bLaC1dR<O#F=aV
zS@vt{EbS@JJQ93pQU|-h6hQl=rKN@Xrw-`!6JT*jU;NmO=k|3$5pAOQQ|Qpho_&P=
zPyO?H4~SADFIkrU_?zqZ6^R;(2|>R502a&3wV<DdtfxS~7q1b(K+D8|!>#u7T^IZ0
z0~3ntP^-4Q%rkt8n}-(Y_wV<1IUL*Qq6rHJoY5N_E$%dT*TsCu!@*j8@E4r+NQTbB
z2uMxx&-N&eNl+20oePVIxV^KpBR(<is*Yob4y-luA*@2fG6eTN5OQC?+rN-@=MWb|
zNy_WCU8Gj#oNwFot87hssY^fLZ+!>jf26&FYCez`fl3aCT(n({dxu7qPWLXW%dO}g
zIA(OnfJro$rgk2>jEFy=y~dx9<W3)2d{3o@0NIqf(bHKzu8A&lS&L|K9q0TTp{PF!
z#2SqNw_KCLDShB@&7>=Va8F*cH!Bg7;F&7XHc#hzuHeGE5p>X+U(vqf2Y|)^%V_Z-
zNA%EDN0o=5?Zjy+DfDWmdv}fjXd&VJ8>L~Sc%z}FAUPYI!P@=UzOMdv`28A^o2}`(
zg|doY;c#t$RzY#dL&O|HXupLg;iAbXq!eh5J(BjHZ#^g#&hfggXQ>rhMBAD>{OU8N
zK`hJvJ!>}zL0ix>U0pit$)fAd%&dGVnj#Yun_F8=fX?ZRusaYB;bI>GihVrKPT=q9
zBJN0xLmML<38C;toor)g#jgDXs&uu-^cmoe{vOrEqd=lY0^+Uvf;pJA$z^5zh5S2b
zzrPgeLwzZgxt-mub^^D7kV0%?mH3l4xXVpJKERNM>JYx_;laVvZ}(wijLn@=BHL!{
zvF-4ew}12DV<brDM8@<@<@X&yK)@^Y@ZrM^5`)J_6`0v?-+p4ZWGvkt?Yy-qB`N8%
z&*DL&3z>s8ywtyqUy{S%tN0~|{pa)nk^!R!o-dA{i2xKU?`wzuMT>J5P^XuU9Y5am
z<;%;pFPgi3AQVv^h(WYXyRg`2&d$!IcnK>slJyXr7IR4v|B%l@Yz%lNe}HTMz_!<G
zh3^cmf8&X|wgs3=L!p&a*}s>}Fv-n4lw|DI9Z__-!g50ipoe%eqtk@1sp8TPPiGK-
z($~m!H*kYn3;{(xO^uHaMcP1P&r23XRkQt{d2FaV)713+FW>!Jf*B_O7Q?mtm;U~z
z+kw~rKy?_*^CS$Z@EfQN)*|fx5c@z0h&z}-yUNS>T`SHEyfbL$xN;~O5OaA{?(S?g
zZ4ImmO+5NlvFEn5Q1d?+>ERP6&zy<;@k4(8Eop(`q(6u*xkSr+Z8LR+pb0e`2=WGh
zE#t(c;F_}FDlu|)__uNA!Mor|4wl2$?9dR=>o`vHyz;Iu#D9-ph+TjA7p+vOqx<yf
zm&x&7uycUU_y9}C%`1WYp1k)K0IuEM+Z)M$O&M=|<Y@wpYytZcKJC#3e(;R4|2F$W
zS>&VKN&p)+p)<>=ieWRInLNkO(D=^Q{E-|0X`Y1<{0hIfa%4orFw2_(;!!DGUENA4
zDXHh__Wwh|u>hvc^u&XG`6wggw0@5E!XMLynrOgn%Y4c6jBDjxFH5(j$nl55oA3X=
zO<B5M^i7eGktD%aRz84X{jr~V3706=CBQNmD-XPcJ)eT`b7SPYCO)rx1E6uLx<Bus
zwemli%*+2xCSygi4~09{x-ZLl!?l`AflG=D72nlBN6(^6&a!Vxn6QK0Bp4dnzQDWq
z5HJL;Ieq=pAEI$CWF_d^Z-nme`ww#f#LNy>2>+!i@QB@4sVvWI2WTIieq#ND(sK=J
zU-z{Tl8(m!bwNVhzlWgw32+YqWEtc0Rt6sd@!z9W7i#ZF-e`R-G<q3RSiZut^n!M~
z@~^G>EQ_3s5&T|BK|#SJ<<d<;;+L?SH#0h8WKBWR1>&HP*1yTYIS_lUSv|*FhI%GK
z15ID&dN_fP3n4rsxE#1KuvR{yISLX3J;1I{|CLA+QvlrfrV`Mr5Dg|DiT1JsG{a3D
zT^pM=z`tA^?9~2aryc`i%QEPH3!e=v0F-H3TI}KBjKqk}lSQK-4CDt)HV-0sEbqAQ
zF2(*$_dFoE$(w=-P*ha>K`luG>Vw-L@1tK^0Cr~|nGSL=hLpB!h<U^99eBGOE1aRk
z5yCo9uSjD*6z}hH_^ob*XcvUMhyd5oYt2N63I0Kj!M)wJzw=B70&h537}z8S#lJq(
zxwUy^h;2W@H#Idu61z!;gUogq+^nDFH&Xm#`~rEONBW-lV}zTbhTFLAeA7@{Qdkir
z%J^IP-ALBD@sGE1ZEfv@&_$aw@tCt0e~Hr(5Wt025rUuvJQ5JjM?>nF@gMs=7Ub{S
z=C)W|n20+Kp7D%F^S(q0HxMFmS3N<;L?qA?GT6{)6qs?i1A6!G)b=IGN$J<4-=4fw
z=I7&+0&NKEC!LN09_G9p(dh23TY{~NkRM%fz<Eeb2!c%*$l>iXPORalY9Msl$QOz5
zKSHjO{18yJveWKNK8%)J|K(U=O5;3v<*!7cQqvO<*PNhET=NWcAx?i)X~jc$f&@8?
zV$9t9pMo5ApcM>G*{{X8p-zK;o|1dwp633`+Y_!^y@Pk4fE&H!ved-WbX<7--rrX>
z1H>)ddzjQe0g!a&`)f2EsQbY&4&meD&tiWq@0VVlP<1VE3V+u~h^MBa%OyTMe;-Lf
znwIfO&wt)8fxINrX)eF>@6l}pvVb@39YB)_<h#|@V8tM#D?tWGdFj%UI^9njwi|r-
znYj=HuCR7<9d9M<ISu4`=`k#}e+W085^1~d*e?OeY~S5>t<MgW@Mj0v8*UIhDj?AY
zBkwBcU90;M8x{lf@o`HoAd!A%Vp4A!6CE8b&U28|7J)Rj#BUNmh9Y0V^kKU3^w{Az
zBzMgd+QbBaM@Dl}+0JV3I3#5IE5Z-WAAlE;_sNvW)Xj~Jf5*J?2b5Y`B}h^zFJ4@T
zF?Mt;G`6%{`z5=-{uiOTAyXq}1$TQ$s9_+&CYSy2;37qI0X;Xq@U!N<ZC5$sGi1&|
z{g)6_S6n3YQl~-f2p0~+7?BbM2^G={41yDo%6Kj@njL?J>qZG=0nf6#CnoI_F4F~+
zoTho}shX_A3lwl?K#=3I1k~X+SVV!a()$(QQ&A}R1utLTADFXeFVfQT02PX-OTyml
z)D#C0r~HV14)hBqH{wj{U|E}7M9pLZDF;b4v_7mZ(ctG49dt;~Tlw4gPKEuuMScQW
zThMU+#`eV4+B{F>9dnyMWfx8qZ(PEyovc%TmkOJz?unDO77G!zu0*UF<163>ywVq}
z&F_$Vu%?BBGEUVRhXv2nl%;v`@Lk4T{#R!r<6Lu!CroE&TIKJO!8aTbR)8NApCERP
z^s<1J{s3_9@1w)VemDv84BUD805=$Zz#K2%x`5~!?&iK{foq?%)KoqQiQuZ9zQo%A
z(BqEXT~3KMU7Ab?h=}HQ{8Mx3DF9g$kpX9*son!kkCCP)$i)DSGAjuD5B}3NK!wUE
zbkc=(0oM%f!OB6WY}t<){yaQyhpzm;^&=t{M0PTC&GcW1#EiHLWhs;eya}OHWEyCV
z=D;I8Tv>})fZcNZnPToI+!a<pil8ow2*H^V;p?U&ghGT&Dj8gWVt6;}+%C-%4z*YO
znIZ%_65!%`86}8!zO1)o?jP}7CO%Lt5G+xx;RMs5OlXEKXZ9i&@4CMN9b-uA81k<*
zJrs4_2s6u8BR1Uk=J)RM?+Zn0{!9)=;dC<e;*{r%8fG}XS7bf|*-j#m(yeKq@@`*o
z-k+R-FFhFDdv|Fgcr0VU>XdzQ4jy~F3WK_kdjvl<eXkVN=l%y%f<IBI=}t69k7w7?
z*q;9V{r$CPO%dFGmSc1Q2kk?WZzg`cvlj<79Dw1U85w<dfdg$2=;cB?x`SlwWhKx%
zMYpumONMl;6g!PA8gOz6TrMv0A!n(VTGyy0QOVHE&X~_JXn^F9E7|G;l&hsbgrr(1
zRN6O<1z$8dZVuUP3#tsQ{~oc`?&T}c{Ophp5UvRRd;bi8GsOsaU^tD-+3!$boi$g)
z9yq2$6O;MG<o(~a6U|~7Z9o-i1~roYS>}mo6XEi=a_K6+n3$N3qa?1KK5oRL(sa$H
zv7Ly47;3-la=_`@@9yQ9U{EE9_fG)02{d&@a>R^}&46af{#2*9AImR&z?O1{rqq;F
zVcXiCWB~7zp?>=f{#mDlBfF5YL%%I_5PpuU%QfYUOzj}3I+9Khsk|@;rU2sLy!bZa
zjAR2z4jJfycq)M;LwaRgf8o$%f2s~?g~owm%qn9fM$n}ZfS_}K=532N&N39;xCB>F
zv`RR~h#E83$Swz6YfyL5P1lKbyNz+s4H=uUd@t?^L3DzU)sP1#X$fc>%mt<x??P3Y
zPl9fKgR(xSsZ!ESWh-u`xh}h~=Us~i6myp{%2s<yGM{xUiDQ)EJ9kiE<&ecV76=Ko
z_a={&cM}%qX79So=VQ3I!I3LH>b^L&6J0)tONyVTF8*r-4JLIsMG@%CYWmgxIeNxv
z_{)jRcd%y4!(E=9Cr=<F!sZl;^w3DjLg3tmGJ#YsuRKK6!T#24rE6`@j~9ueSmO2)
zls4Kh<1Mk48O7sNDurKYJNIHCMzonn63&+(8V`HP*rhg4zEUcmg(WKw=*bXj?{wL@
zgxJ{3c`1}~ssI3UVddrJL;a_Ac&ae31_Vyxe4gl-z*o=Bp;tR|XsgO$h&%I@4Jc)b
zpFmKT6L59-D~WZw04eB8luV<N7yKA&K{Tb)AVd|R*xy^u;J1+S{;Ag@YJ_0Ua~L*9
zS<CbSA(3*X_S|f!-Ej@fqu$#&N=clIq$M_E_0^#oX2<eN=j+EB#v8kHv0@g$S67Wg
zJC-ws-!Wr$D*b}ZgbN`oVa7?R2Sl4jfXu5nt1!AT6h*vi`a*}xk=sB|7WbS+;O|2f
zU7)llus-SD?ycB~v>l59whgwOT8@9h0G_49UrwdgdB>@1$55vkf;E!Nwv!$ytGHqS
z|7L1ou?i{G>(Ar5LRA#W79d+f49kyNh!K#96`JF2VTMon!Y*X$RFq#S?>oO*`n!yD
zCsi>821mZQ)QMlx*W#uJ7Ecwx(aL20oG;dRHU|O!fFR+(p_!gi06A&;^6V-7p<V5J
zRHZ*Pf8$7i@Gng^gl?Hx_w7IPzQE(2Kpw`)&VJSuZm*_AbO#b8nG?XZ;931CslzD3
zIj*B9dR=tm#R6uii6&jFy?E*V>(i7w?$hnADA&!#lyjRey+z@ET2&ZvBfXYLr={_5
zU?RZ(8fk9YduCH+UQ@)MA1wba<gmLjTIK6#8^^~j{wj>kSQy^u`u{5U13AMP-xcW{
zqyw%wHOA=%iX`Arr4o1vNXzO#>s9R5)*T|4-3b+(vJq<9T@dPZr2T<w+PxB(=Mm!r
zr0NSXa}nI8CaapIRzJOduyiTC<z4ToQx9&=k~0F$DQd+w27!s=?hSii-d@0t0Y8um
zxm!KJ0`*sibz9Yo<LO$<N$W%;<f^nIGKC_l!NXiC*KZU}5Byr*FDIT5P!DZrzPiWY
zSA6}^*S^L-_6C8YAc~4D6}KRoyO*X?V(;keE{6VDQi))RNC_2^pq7J|ZGaegE#h!g
z$yhEJNM!LkX3y(HK>FO2tzVm#n@98jE}=MqLiZ~fz~R?k?1iF+k<F=0>#9At#UNGs
zwC;Sa(T`7UaM`i>o;7bG9aBnw8G7w6aVtHoGdEQ0l*x9;G^I^}7ao?Swg@-z6(AuO
zJkqD?FfK*n>GG?%7I@Xv7H3Sf#Pax1u>Dn<sgbu%Y{T@|wXv$?FO_q*eRccKz9GkV
z1af&3gA;geT8z99qqXz|W(eV6Uul}ky!sgS_81#aMr&gA2aH9EZ0sG>WlA&WQ(YOb
zk4cQt@_Jx+o0$7UDA=^QHkmoP@?v|l^j`dsRd@Al2xW@|Dx2nT_BlOp+^FrHTaNqX
zRw>xaMy0`t-G{b-k8E)t=1{8fXBrcFs2%(CVw|T_k*op-7zg-C5!R!m>Zg>8->Lt`
z18Za$Z=hwP8zBT;J+{@JdgwF=^?p2ek0a#33*bK8El<T18MPO2n+o35FREHznpmeg
zdlv`L2=W<{X{f8iVij+hT{1I1Gaj5Fs~V<?0DGJBwbyw(aE*L;6n06bH;7zEMC}7u
zMok-wN-WyBzaL(*1SeYlE}g`uPaxm{O!SHV)kDGbEHbE)gsoI}7f22I@2*Y6xHP*?
zN$UKS604ER6&c#ub-0j$W+X`8Dn;@oy+bN^TuPYQq}&Ep(p_#9U!Ux3ar)%RMk+<n
z)Sw0$tkSlEc1OCh^=%1r)n74|p?XXf_IlFbQzuC-6v`g&?99*z<#N;-Ujt@t%_me%
z=t#y}cp5T_lUen_dFM5REg&35|KKo;xKxGVvK0J=lS>9tfdn+QTj}H>1+%9nF(eut
zHx%9qx7D(zL~XRwGPfU&S7=b8Fv2e^ZA$5toy#Jbe8*7b5mz=bI6ns@<*>7DXORye
zSmm<7^Hx3|K$=hrx&h-CwEz|V>!{AEx(^J7EQ;>H2q6;Ej02Hwqmxv;fcH{P+o$R;
zOv-7Gc1%p%Q-)CKEIQ?-a`4X8i)%OoP%>~X54T1SsYpw;?W-Y^Ddn;K^Py0XB>Zt!
z;~$dnCnS?!K35|PP?wT8KhI=*Zu}rCq=sv___yp1WFpW4PSAs(RY|?5qp(^SY{}rP
z={Uxqs)ig2+T0x_x?3cnCkxXrtzkf|X3|ODYc5S7D#!r;%F(4{oljL|9L*#QIE9s5
z<X0aGikNwjEuA`@vao^Src7<4B)g$qVwb8`Wc4#@MYfk(@8{F>hvcXiSbZ1ZWmq+-
z++!DYtHq>LSu#}7XYfP@Ry5oIw@^m4L6Pt)mhcFE+29iOR(8UQ^{;G=?%TEQytPZ)
zOD&OXu0KisN?&~l$6hMKZ^;LbfGxs9M2=2o<(c;oaMyT|J7jsZln7Gwg1~7xR{?Tg
z(ZJ2VVq04ppgJ&s$GGT)@~McpKvio;s-n1FudbpI_gf}{Da|tN7wWIdzYE^gqO^Nb
z;$@KiF6rA3K7?sxhC?495103x+J62<vS%|kJJ{PdsU!TP@3jtx!JCw3;;mClK7T{*
zJP7(J#-iBJnx1#-X6jB5dg^Y<gm%_cmk~I3vg&igrpD=>kRE@KXnV(QY6VLeD0YRk
z>jwuEB&D_W<OwPzsmv(%EJu8Q90!h^m<svtvB$mmJTyjb<^yT~8d{TX-J*SiUi^wY
zf8jtcapoh~!qwM3c(RE&4_B`WSI-vmee#bb^MAxQ8g!oZ6{yN+2>DcyM<PU3grq|s
zojKO+nw)Tk@Vs0;TyW3~dicp%Mp-OsIbWDTOVe{lG56Qr^IYu)4IyN#wC)Q-Rd@9y
z1htKWWr!}b>6B}#4(hJUE(Mrux@*xmv)uSmUHt{-Z4ya}&To(;kVCLioDA&w7H?h8
z@z!Jf_egD1Yin!NS0kN7t8_G+57Dvh1NVaZ$~50CP0!A9p{AKq^0+n5s<wQ{Zx4R|
zp=-cz=$=*nxdK9c+!ps8im#29Pm~YooIRC@kqR%$*(WxKG=5@ZcV-P!RT+*QGPw{5
zB18=skeI(@xlcgoeZ`gWy>}C&7o(#Eb`sNwVoOC;=G4}x`P);Wr#u}85uH>)%3acA
zGI03z<c|bfW#w2(uuff@cY^z@fqX&qIT!C4KQRIUZzI_l0ZLF%%%=7+Mx!cI-{n|q
zTiPC52;c`zVlWH~Q#vxkKF{xArZtfrhBOCb@RLm2uicLM(}GD7#+Zz*fW-ya+C7_U
zOKQGC&1<DAV=pH?%3o$qz;{D&lBYR4++3(9HbXW0DtE2v=H4(kwd)vakX1D+E-T%9
zChXf5s6DLF9JoWwJUaj$CEb5Rzw*$=^HgDIV<MJEXM30;dS=x}XS>=J0Jwj7jHsQL
zYo$*U)#`F)%!>#{sp!po-vP;2lt|yZ<`Pogs`b(BC3Xg)0aDF;ZoydP3{5p+2FApT
zW+<6ru)>D=4ffL6UO<TzUzzAjn0L%w+i%We3WJQXRpCtQsc{K2lD$<^pLQ)QE!m2u
z42xNqrP8ueMN@G5?G1GabmEf?e@{C#XALF`re6K8TdoE6*_rdQ-T@$EAMNe$mJR-`
zlCEyBEMU3(jKq~k_V~w6nd2?F%kG3A({sOZ`+v_mAC*;VIrbYs+wJ$2*4GOqmnq>|
zSHll!<mvPYt(mTvtbG3bS(^Szi0`=^aHQnWt+<9zCJ1bhQxMT6BQqvmCq|-D(!ElX
zG4$>Biu?<m70s#RNYtk><-076TnjCr2_Q{}_*VLDD)LF@l*fju#CO=!a&|v9O=Hjv
zo2AT*Ql%gb@_IinRK@)q-UuJ-E0T`yhBj{o#bE8uP`hQdPt}D5<D7^oyLx3K<^ouL
z(oX$`)>a!NV!nB?A1Qt12~qirpQeH;q%zG4AYn>MuPedDPA=#q-&g%yC;vT&2^6Az
z#FIAqo2`SGU*%gCAW@-F;h{M!%Hbp|Va}*NSLGqn0kb(Vf0LR9kY%ABt9N0!8(iMo
zRCk|_<(^(njjr5Snjj&2XfCOg4+pt8zs=|yZV?3VgS-S!PRmR6D)vGbBp*S>v<EA1
zFgI)Lxih8BpdvEpiWs9%!^v))()w~nc2A!svLiZXa>~-1(u#laC7d;lA}70{9C-Wr
zcKp_INhhy;`yy9)wK?B9O{uHvlxoLX$rMM4S8`JO<XYBrvNP-C-Jd1}u=t2?j+?{V
z_EO0cepqf4SwPKbVq{1HD)Xy3C7CnEAyoc+%My|!WGjrtBYh5a#45qRxX&IO(3)|%
z9iOqEh0c>c$y{<Mwe%2yAB}POb=S7nyzuVCPBjTzn1)61*FV9Ur}zFd;o+vfIu%w9
z3dAFxHbkV&?`+i;o;*VLjd5tX9rXuNb|5%OV=8sq*<54g%y<`4Frmw#WD<SPm;a2c
zimy^2dlzXG+(Vfql`$HYE>1*7#;cWMH{}xFKNR-PeMVIz{$8YHw(Qip&swpYxcA!^
z?bG>gKm+<x*-oWZdFB#4K0k_shTowPNoALnT2jjRv83lm!ozeuMYykazDcm@V)aN5
zn~9KmZC3K*HPGM8q*QihCSfa|)!F|w(R)NElL;l}xl|@)nS)n)p1RFKHrJlC70!(U
zS7;`RgAp>hL-x<1hAX;ULdQPq*G@p)bhT5Kwr4u=9=5!Uwz%z36MCQq0m313+DtG0
z*d?j#&G0!6oYT)R@y$3=a`wEYhk9IaSmKql^j1Ta1o~UIU&ZjlGRQSl!xZ8r;PmN<
zQz&6nC8ZhadWpka&l<{ex@~duGGo_r@kiNUS!s%bv|#~|!o%*h^1>A|HH#H4x@Vm?
zv5v8>DFa#hus~#rIcbJgmhQdZ8LhEYp|0G`S;^B;<!}{lVL?l?nHgKBP2|+bQP!I3
z4)urT!cCGw&NLfbWv7=flaO%N_WKJpq~!%PiDVu(Z{cnE`M6ddJq2==#}Q-rTt!{v
zxT*Ycf3YY~QyMIKBow**slwVMo_zYHZR$*g)*P5i98kjv`clB*%KZdD7ZXs<L@Gh8
zCUP$;fE$N`=kQnsVmzTWNc4GmJWH%o8-oU+9)>DEq>3?04<kdtsyVqrsSp-b?FAYz
zZlhu-&8p5OZg%g|uBN|AMJ1qGjY%|3x~)Y&RAp-ezpKe5E)5?=F{Sp`-ftx*(ou;K
zmQm!&V@gZJ>JOV#{DHJO+d<x5Q_%5~ddG74Op<;MurX1kNI=A(%28D2edH^yzMrW_
zSotmX*dHR2(VYh5Ad6<UfMapW$+({Y_Po<~Lr>(;_A>f-2r451dzE4vtpjRHTR`gk
z*-H*YQONrEx%1!jW-tITR@S|0=7zJsAtf4qIcXnm=Dle|+;z0N8ae&>X<d+LST=98
zXgf^km`0LbIVjV@LAgd`s8LiRYm9jW=XYQ0cbr&mrxuErBs$N%o3+;f=T^q(H<<HP
zWa^r$!X4oLn3*3KkYs-~ZaCF7ttyVuG?%VrfeM4U_`7SVM>>I)db}@_Un!{*KDAMA
z=iSd40{a}H9c-(m;?Pzg;JR*wTv;4z@Pl~-_kO~%$r$w5gwFH#gOq+k>2+|~w=fJF
zGdPqF;n0fD#5`eOWRyK>6Aujxom_ThXvMa{QtaMF?E9r3$18<Y-o1%Bfp2sl6%}D1
zw+~X{iT)1frte?=Oryxn9v#&oQ7|mKlks7Q&l5+vPqRRZHYH4b;W^T!;7`CL{o}Q`
zk(Axt-B#55Dkp`VyEm%`#R#;7b{Fm5v|^RAbGVk%CZZWVk43VwWyWdVmBuKNiR8gW
z;BS=l+Mf8px;K?Jd{J*uD@sW%k89kVwWizV3JT1+bE*wy%mac4DDq>bRgC3S;g8AO
z3iE-=<+;`zJRaU_=;eF{)GBDWsWVGq8?5qcHu_WATvukBoSF4*@a{>Hpe>;mMlH9p
zWQHPjHm4B0e+LsNyNY}I(wGlb!l&r1HkXZapL~T)ggMN1={d{~96+I-uCSXQQ5OpN
zZlNke=bq*T_*UzbbR@FcO1{B7^c4aLNuEelgN<o7Y~kh+MdNk)sTEz|1ps&>qTT9h
z!vb!2m-H3`6=4#ge5ijRyj<z4qK4QHaIQzl%3e(Rlf-X^=v_*32PJovVA(Q?A6+YB
z#k!_3<!ReJQ$y*Zp%Pr+h`|}ouH_hU0u2=(*o7HMw<Nfc)>4ij4OzyiSHb4(Gv!%w
zDf4`<q%+rCGg_{%3@n056&pXbE;$qUfZu($RKDwO*Rq(Kx5`Yv(p?pulPu;vwdfqn
zkbrw9GD0k@_wBag9)p@1eYC+0&xPZGo61`YUoOaoWdfg}W;fvUn^O$T3J#!|KsEwI
zM$!e>lD-twZTfCILXF^1C2n5`KIjmIba|>Qd<~wS>P5LHA@{2{xdCl%67lTtl9VfS
z1k{CSFO=Ic4OKF@hN?{a^!X+0il^jYUJ%_pBYRx5mf2G-mN6E^h!#PnvuKxgO@=6u
zpp8(isnwMkV3(G8l7_m98bYQMq5FC^9|&58FsnTwXHkC|Ia{_>&A5ho(XzZ*U50Aw
ziI{WJpP8_YWvpjprZ(Grl2jePVg^f_&cA5pr*P^HZ^re#8;9)H=pKk1cP&`ltopSn
ze#Vmh1>^P~j7>0cpF^+tIFR!CM0pFnEC&wY2VOtlV?AW(P`CZkVTwUio9>So%ul?c
zPpvNnaLLU$-PfYr<<hYjblb()?yYxFLwC?wIS*qqvqn>8*frE5XvIJAfaqckqs}Y%
zKk#5F=?f{|L|o=@{*_%(GDY(ytZ)}w8Vn_xiPDW2-FnA<&CeJdK~ojqw8_s%isC@!
zq!DHX=OKqC+ma-ks=Z0B8Pf7tU5-+tZ#SKFrs*oD>&`GqXz#t9N=|-y<rEzQ_vv0&
zCF?uSeS3&K)qys?9GuPC_Nj5dit_<2wj?mT*U)|?EP^3gHs1lT0e`6NeA!w=Esaa#
zK{~Q=u9bqyWFzTVbXfa|#iHQo#auB}MZl;&5V?{yG^Ua;p2Ggti!=C@#HWxdeGrg5
zq(ulaKr6gyU;|bscqUcb@<ZJqLM0g;7;_?3l!{#UBwCZI@I117A-O)hDtS*9UIwq-
zOp<Q-4Z4^@237{<GZ>=*mnsgIGiUi#WWGc^K=CZm4OK*CpLUk)MvSn#+t29>Rb#<R
zYXF{X8XX;tl2{?S=OoUpr8WX8Z!9Y~gvQFvGbL!MCWePfs>>G3Cl|n9Q{Cq556&z3
zp??}2bh+xv${?T}eNNdi1FVdhhCcktxCwCNv9|{l9xl4BobAdr3;>hDCCX>uvt#B)
zqoL4&nB3Eq_(8O*@A*~<jegRi*0+j?8{{deCS3q;y(+u=Eu0nsee4NeS)Es^@gBUO
z*AQ+FBnC$aSI)lqJUIR9SImWzX|+Xa&k#g*l*?I69@COd!2QGa*hOXU+i9XRQIt}H
z@%no;ug_>?w#Avm!sw1gW=vZFQ}m&J?+UHZ*DBu?=2gth=a%UQUtCessNe;FCkgkN
z&c$k0*?CU$D31C;<y5CCFQR8a2l_sj&wd&*&xmcWEgUwaZ=WGqD_|o}?I}b3xS_V9
zJukht391Y=+5VpwTJvSXDx<*;eoIM`H9EMwF}2c>hN=o9U}k{DwK>H70wHCl96I;=
zzfGu^v<N7(o80%-+#hCq7OKS7o!S=`oPUFIR%A@P5RN*Zm}UH%Tp$~{F#Y}eqn}R`
zW!8ISl0%vmE0~^V1JdjP+dQS_F?V3#;dWF>OA_8c%%$a^vBeF2ken<5_5G>wcI5fF
zgpWHy1xGZk)8X<8Egy7A(4v$Kyc7;e#}M)6{mV%MFXqp2y~?WmL}TksT!ZCo4$Hqh
zNDfX8+7zSaeChpmCFUVPf1)})naUYzKBe^_Su1AX62l2F)-wZw6Z1AHXIy?66ZC|@
z`uQS9e1ej65|p&BrRA7)&D0cc!}xEqrwv(VP3>g)KU``B+^il`E)X|>2Wt=Xqv~tY
zm47zRd!Se*|FKi)Ew)W@0*3Nh{m*d+)Y2U%M1>??2q<WfB3IGzglpL-Fx(!w6TJ*K
zNc#En=XZ%3MouxAFOXzUL`1}sc+PQoqtr6NBtDaL2Ow(Xgs2CTOJ8aI#C{f+9*s89
zi!Csi<lP0z6Rh56!srN@_Ru@t(qwe@+&elh&o_5!K923FBjov*U5zx7L&i{xscW}j
z#yvg2!^h7;q7ccpT1*(AcSQppk8z2)9^r3W&G@z?<iZ$b{?5CRjHjFX05rKFyf7A~
zsso&^?bXWD6*3sFp+#-9!Q?14GsfcFM&mM|$x+`@eQ3Y=o>U2Vyr#0Xff>y;;Huta
z)?3hY5M;V3TIqReP_0IDS`0!6Z&GczK{Ap(9PRvmK4%gbzHX4p1&YRFbk8z8zJHIv
z+XV;1B@j=lN^ITs{s)0qgNFzcAUJ?Of<Bh46Mi1z_-6D=mH?W9oh~m?asl2glXlKS
z%Tw*%Om~j*ixJ6@eN)zL!D_;V;9@(Ybsq{ONL0*`;?MbK1%sFtE&`bGvxE7SL{qKz
zVUEB6l%m|#C{l_{F`?WFX;q3E?CAl^JZkI0T&zqKuU=$dQ8GCA_$S7>5IJGOT}w{>
zMwwn4@t%>*@BgDr7*!Zbj<mR4u|39itrGzd-FRB|hce&sLe20CtrIG!0xELfM<uXn
z(1YO18cm4}($?;>DWV0=mki+87O#tXTb#XA7glpptw6@c<>j$z0Grvk!}xIPu>o2~
zwMfA<708UxdMwPY)38?HU`i^QS+F6lH7ziW@Icp3Kn1soRThgPoRjQ^bcr_+vsSQK
zP4yR)|E#U|^}!Wl4gchTp3}~nIyXNWXK{0LlQI69HdJa4J!emHCw7YLIea01Af1Lx
zW@SL*r@6PkWaR3gbN^WCInAba>@zLgB$&Pdz+{VM=Ks#^JmRSdn+!57(F{iedKxkQ
z{vnOE{fIRLGJ0MnegJRyQ6~^BVjErL+hAu_QqsP#e8N(reM|yACLs*9A$eqa2>GZO
zabG<8CL*TQ<l||;k%?R*1|F$Y-tDd$IyyRVLf7(!6rDLDh^q!-^K_E(UnMhFncltj
zrqH^g0H5yIE3QgLrNE?KaU-0hf5J6v0q!5E9IUr85KlD+qzvMjRl2t6hN@v*aQK~~
z%bkOI4L|HM%rmF+3v^5U{qk5ep)ut|grQBtC4@6}#@>-J1;v<;ZYvopdrs=w3huqw
z$z1?sF|(N%7UxbJ_Y?BR+P?9`<G-*;{Pgh<WUc~BD(SIw-_lrO+goHia5oA3#}j!W
zCgTHkY;p2vmW=8v?r4#Yw-2CjIK&ip#E<pfY_AfF^iNmlZ(1jTW~Havw!oU{OJ{Gd
zsmq(K+l+Bc3|-}UKNU9=s>FyczA*psN$eSDNUZuy;{F;jCEcK?st~Gk##GN!EH?WU
z5epj5tqAX18MD$*B-4QBo-)<b8@}0@<s{ZmOHPNSI0D-H&vK_afvPB-Y??wUvp46B
zJyY{CWXfV=le0eIB22-os=G{c8&wA{uflRuN6e*FWvl&`42N}NZQN7)-poB_$e^=p
zy~X5yL9?ko<f$Nz1)%~OW|RAtG{^7;&$xXBG&uZgz_`*@xSmig`u@Ta9kk_uf2wBn
zOeITyHWrE;yMa*PvAyI+CVIqE4fsrGMaacdX$9f^{=`HGY9JqwpXVFbp42~JAUaM)
zm&fgWM1`NxaGHd+#LOwn8-5JqWQmA*y7lP|Q`SYYqZnJ|_)a9K7dT8;^oY&?3Z9bN
zSS`St$c{TVNisCTn}p(3GY_+rYm;4^?XF!G=i3{y<}T(RbZv>Q<g>|JVXz@=Iu?05
z3F`Fi4+YO?X2|P5uF==ixo8ism98lX<`nlrk0Cj5%CjSckYn4oqY03c*uS~QN0x<V
z{`oK<)#Oj9*xTJ|0!`4f`x*|Acf5p8|LCy<=?p1T+x7JLxNsSfUUfm%UZYFL*T6a$
zA@P-(mlS6X{e9|^lZHm5eB28tcTbcMA^4irP}PgQ55GxvEYU!Nj!`pJH_6LGUV0)M
zxBX9jVsq4Vnaj8RRbeys?yl{4W7HNP_8NQgP5s<n<s<doRfrUu6bUpmbg_m#SsY+m
zD09Qx)4<6j$dc@IG4HozS<<L#!;S)#d`-kT_B3yJ58OTWtU<@JGtC2d|0xnl({9ug
z^j!GY<jM@frYgpKC$~XKD{h|_yZ=Ys|5SNjJzwlrv9~kdB)qpId{FiSOkEzFDElEN
zc=|zf$4Y7mspAHp8nOX7{WKMI^j0AH!%WH4?e`^#&#rO%DTWeZRqYp5Zs;+5zhn$r
z=z<F7KF!60{}aILd3zh7jN>~a2OXaU;i6~^Y;?>21!Mvza+h$k0vu5H-9>?DH0Sy3
z(5b)|{s1*$FX@hu9g~taM4v|KUm`jy8QJXA%W9h;RKiutm?55@W%4278$;Gb2jeZ1
zqkDFxDfSq?<B{kfbEP;t3<~}h;dEnqnhdRyc?XvHI)7=RB@(dB%}%QGukV<3u}|y{
zQ3p%0^=6r5g1^2~Vvy}!rmS^ukXfCy^X<^S*&BGce|5Ft=ThT&NGIt8&TTO4r`Wzv
zkeJo*ooH*32e*WTjw*3WU_O|!)O|n~Z0vysmvDPW4k;9!aZ>1Z$Ak^)SfagRE4ym{
zGptw2Uh8c#qjrfkq=|ghl%_kAt_^VBzuTX8nI$*RxREb4^FkfW?pP#BXDWH<an{s>
zT+x3dc)Srcgy*O#m=e!kmQ66Di00~)SkwKGIk$*(W{nnhZ1$CQIT~4wMx9QYqGCBh
zec3c**Z-0_ra=CUkNL+WLxLGEk=>)ivs=V7hI<><KmwEymzchBY}jn6buYN;h`#EA
z(iIi>lpW&Mb(B}CY;X(UJxTqiUd*Wbv6XszpUgMw9Ggu@UO6#&tg~gcaG>+1s;Nsw
zT>at<Ha%B*bpWBKqp8#dk5^GaKXopn$bxTRZrd}bSK4FMyH@L`H#aSWy`a{X{k{%D
z0%})p#DWf=hENAHW@w)%#gn*im=>@amf=9W&dabh&QoFRwwyqFpp>B#CWJ}!5W1e1
z3seN>({e`}u_+5;TCNis@Oh$JM(k{~etsze$n{0V&`zl*0(zK0FFisvWTw|Ad1;1(
zn$4TKfnUNTLv@V5$MI&0_p<7R@}5#YsrX3sr-jzQ9n`I~cs62sN@ss{?EzZFi~af1
zkNxrxr0ND+A5oA&VIo|l_M~1dVU@iCQckBn&OlK_N2&mESF-j+)sS&mW$_f-_+-)D
zuEzmP_Lo!Q63x}hb?ivcVblCr$XcTOBl+c&`Q@sq>RoK{PF8(R#5a2}n8w+nBIdFR
z)tsjizgu$L#l7{ls?=GQq5QLT29&8JRhpfZjL|}~PBWLH?EPc|O!)zfoVE}Je^arX
zoMp?h<^xCvzB^j{S{T*&xy2rkNZU8$4&Wv(H`LOnXhD8huwX$1kXi#8*M)l%n?N!*
zGp<j&6?ULJUc45!@Iof*RX$K@UDWd8JSEN0Z-2E@8FBO1y8U^1hGC|%liL8dp3tlp
zc<!ZjPs95fBEl;eR)ovr#sTlVvQ#Du@8@y@nC2Daxk8`0qdC~z4!N1k&Q~mn=eXXE
zoQn#n7&-B!OsQbJc`RpyvK?4iQ)!6ov7I`(EPFh6`&%k(s)}*mO|cFAp6C;6afaLg
za5S9Z-p(44^PYZJTcvkTVsPw%ABHFG;;I3A`Y13RjO_|ltQN?-47OhH+uUUXic@89
zdKSh9vrA%()DNj4itA|X8X{OGljt?P1zx07HFP~<!2RY&bJHp|RQKj}``DPR*Klf{
ztQsr@J=!|oH}RX6&j!$md*5!r0X^T#09n%~OmqbI4*wE&<3Een(EPtFUIS$b;AAj#
zU($uRlBfFDUaPE7M#(&zd0-nPP0$Wf&=9Tn4@VTluI@0KCoz;I$e==G5(eQc3JkXJ
z?0WL#4hIE~+o{QnVg;xW8~Lz%4510?2^JK7-41UR1v}wdQo{KIu=LGWaR^rHO9o%{
z-3WVRZ<*1iq}tfUpw+%+e_{jk^&y?bn^=UNb3yw2qZ$-oB6))a?Hd#H%XJkO;8h*S
zxJ3WsK0mQT%SrAJ{V;{~h8^&$c1|wTIx0QOC2gSv)&6_S<sv$-PMFFQXh|nLj^%rn
zmMB){7$)pqUOXOQdesn|!UDGi$e?Mg{S5YQKsaNxHVJl-n^t3q@`ZUx+t#v>#Jr_>
z?+=DP4Zh6B?uA4dktu_wY0(7^WuYj$Za*PGKm`tp`r=R(x(kGxR@jMuY!Pv3XIu}O
z<nepCh~|H$wlb^fmWT%6wkd42FXsl~?URfLIrs8LFsop<QD_hLgoGBKoskiex1%+d
zPd@d+H@>Qj3lSxKMKbIUxe?D&7^8$3#$GI)K&z??+;az#(AMeHDyOM=NGf5W=h?=4
zg{XI1a^44aaq@hMy0Vh#=-emkURG<AiCqu2$Kv+sWBxVR&cYtmuI0XYhPck@A>i3d
z{ZBxQa&K}}r^T|S6Qo)(I!UnOo)jtD{@a((G0JE8$K!{wS<}C%%9wQ3N?!5ZP!4X@
zWpca1$jnZa^5kiUDgxzdVkRFf^nsVWJsT~GR`*ZeP?GfHb7O7J%`0*LEi@RrNf_|W
zXp1mXyVq2(T=f}=g2{$+KuUdnhVs;MgnI{>a8S{^drIsD>q3qBF%kk9b4k+$RcoaA
zm+zmSkxzF5Q#yos2~QHmJpj4liDQ2r697L7b(AcX%_Caw&Vxe?YRvjeFb5Up#)a0m
z>RLG*Y11b14;Z+}VwAXPy+vmFNuMghrHJHeB4macpQdKLVyR5NQ1Q>s&UoL(5*8&8
zky)L=S9jSly2dM&?_MS>Q19m>_~4Hbs>p)3Li!y!aC3O?5a_SPvNf1elPMwdjGdf?
zx@7uHHTiDQ82p&*rDtA`JMt=K5O%ann<R%#`B#U)a*4dph102ay`%P<)iX-*7?G9X
zn`hwK?WUnnw0o*1Lcrd;r&eH(wGJe7%QGYHLe)}qO4a&Wqwe;wT4u5_-qJNhFK3RJ
z!oPK7znAr)GL3>o@`;m>m}aWy*CTVRidh(EkpOa63N=;|Ddf#)V`3wnU)o63zf$Iy
zMICGEjHr_9ZNOBYG+?-|g0^#R(y6sAn1EY%2W!^R%_4%v)8|swIPzf&z2DBS<tuX4
z4a)-8=sr{$uEkrV=EP*B&pY&~LbZ!$52dW(=eu$Ye4M~hSXVotgK5WG+;?sNMNkVp
zWW1&yJmv7ENQ(bZ$j5<-(@B@vCaO(n>E{|if(DgqQ`a+QuIG-Yx7JQ6rZieT8q0Z-
z-#*0qY4<cgLB`oM)R$xEvU<hBHji|yB7y1(rUdCt^n^QF=9_X)^?2q+3F=9b-shKE
z!%Csb@T9b%q)Gd$IxTCuT`BH-3u#UpQKOl5k)uw|b06}wTvw&V7~m}!Kiq(8iEN4Q
zxF_zpBdE3>(k9t0XTt+JzuWhLGy9^Rp~ow9H+@W~+xJ2lT`A1Uuhb3O>FHx!U;x7Y
zx-l8`*<8R`v$hH*AdV<T@x~6dWTA4ty77s3P^@V-k+))=du7UY{<gEa8=<X(CHY+a
zaz1pHi`Lv{=y{$%>>6LNj82Jmft=y*-!_bsCT7m_NjrL~Xs*7?cXWDpoGsJY2#=*B
zqRf{Xh7mwyTm)Cc`DuH;y3krh3^@2+=97mN?2W|Rpbv<PcH{fQsF|hcdDmK3V5xc_
zz7Q!Va%HttV@zyCf!W?Map5#ebV1u7IElto6XivDl4_H=-C<a}ed<dIqv+QY)6;E%
zRj5Z10ixHEem;se>Ks!=yl~(%PQNfxm3(0YIC7mFpq{ZL(mhSh_q6P2s;oDX%PcfY
zGHSXl5%!5ZvS0=1^nHJ&U>=IZX3pfFKk4+)@0FY~zECG8S{{pR8-aE5O_NZ5g$-wv
z3k-x2@|Aa3C#MH1dJd9b?O1xyl0KAewq>`nGjkcUCRt0ytqdd{UpK_4LGRyqioOZ8
z<rWvUp;5nNz@At8*AwzRge81#SPp|JQ?6!?<ZZ5R07V;Wg}Iw*sbp#k&iGhj{o5T;
z>gna{hNeRC&5u*qv@);_<g?7H?>`fk3-v0D@Hzg{M7|$ao2i^konm`%?0%klXwf`_
z4~^Qk1SnB7g6;8b_`HB=I#np~*ZhCJP<6a1L+f+YOrpokYvFCZe+9>JA5bXega-M|
zJ483^gER@02N#m&OU-vQ8Tb$~r9I>5Eu|_rgS<J5jQy=>)y_IomG(L_KOPx6<tsv3
z+U?k3O$*E&L<hZ$R_L5mjl&PV*IL7Q9ry2<nNzTG>!1|22J?j%%Z?U^r_3dFl0w}!
z-y=P|G)gwOs0&jW5mEYQVmI1S901!p!tDjRE5d+&@GDg#C}m+)6>V?Lf<;$~$}cC6
zxDArS>GPx5<NZ%5A-K|RT}CdTMAPJ@Ux6y;jX-m&wYUFqM0s4wh^|JM>U_X5{mtGj
zlKxCKiEeElXSVp?Q;&)3FLgx}y#F?_Wl)AhGa?t$nXao(EmzrR3C=&>`mWV`+iYjK
zTv~i{(Lm`#?zkeFeAO){s`FX;H_d=C5aVC-HQ*Yzzehu9i@D8y!!x)efD1*ypd%1U
zmzw$CH}rvEv(X;AOZspB*G)1xIjPW`PKiPwb>WDP^RpG@|8=_>^~pp?BI;}&Ji4tk
z-vVVc+O9+<G2&|yF$l6V4J^I1Iazcbb9AXgH1f=)4}{sM0u%nb8TFuv-$Y3gjCF~(
z*46wX3qFaAIVtXvPmd68)7+$nv=5B(g?is60rTw<V&v7&)wV*?d$qwXr9+(Vn@TEl
zY0jk~DE)@4IGrw}re5o?T}0+MZHhOwiYd()O`$mA2a5L&B3!2S*w;vZ0{b-d2uXS-
zI^y#{!_8SEl3?;s`AtrsT0+Ic-p%-U>IG}ruMqhu3a?OMe+RUfs*U*A8hB)J7`ex>
zRTQfywfBzGuI$El>GZ}G3FcE9Bt)8CGTBsrt(-4a7I6BNF(8`0!7jD$0)>CDAt63y
zbDwRk`cN)0Zo+4@xi{OdWk#)m*!?{gy58@vv-oU6@OP>mqbCabk1>AwJyLFC28nw|
znDp`LyR)BI%&l*l-x8gCa}{}{iikqf%2Qok-t(PJ(U6yqw%m_*F<<;Y@Xk97uhaWe
zyKGg&BD(JK=XN%xb-O%k>2;J4Dlp6x%*7g-)5?~{Zurf-wd^X#qv8kp@%k$ZHMF~}
z+ih$+3X@MK#>X2$hI9YGbk<XxU`I>R5_TNEVLUs(qi$J>WjgtF<CvCQQf$#cn39zW
zfsAFl065q#dcf)=nlAC3I7)X~p{kDmG-6(bo9i)Lb>3}fz!y8nvLbFON0wZgCfUj&
zGeeVpRA{<o%vOL<{yzF>*08l98(@4b38FtwVLMPAlWn9&XC5TEhGw@iM0gB3#jOr2
z+--N^s<73utjL<)8ra>`4i?{GePC>mwxW-mMiC+<xOOgyPjtvf=!6xy@f`JLCTsIm
zkQkU>-{g5qm@UsnswAeWL8n}$KF5}}k)AZOWWE(z+t#MQ%sQ}BnBzZyc(5}tKS+g2
z;};U5v3K<TC2N)6+R!kHt2%S80_i#vQxz}12E}FfH)Fst?khTx6?<D1XQI0T+?KB`
zfqL|A-ocqpStll&r2D<(@4Zou@Cq+Eg%nMiJEpo)Sm5nVlnXkTxk$a4T7cbd@7JFy
ztU7msr+=492lHxKh`9mBeUV&;n)hxPv?gPM^F-qO&cIWQz8>6cDUbCYfkqR&5Q}j&
zo;op^k37?vyjP1f(fz#VZY@Xy2n*0)MKY^=U-#0vYFAWTs*j%$;1-=ibyn8PO~x8I
zPX}|F=ay*-u3^e|)R`v2VDhGE1<8Yhe2$hWg3lM?R_8y)SwHNqXr?D+@6b%R0|F2Q
z;#QP~rS(fL`)q&4^pb6tL^n;uX?2oNlEEH?+lXqZ&di`gi3e*2T~42U${S>r_I#20
zhV~Urc!h<TdM>A7vsFgV8-<;SA=L4gmUyz_5l~9hD}e(BLJ)^FTaf;IXzQ4W)<jaM
z_U*x)Uyd__i<J1N6hcI*i;1j(Wfd%rXANYvM}C?s_543<eF->}>-&Euijh*0qM}ZV
zMrpH@b*NNIQN}JwQW#6N>_%x3>2#v(Tf{rYKK8v$vW2l`DLYAGtPTJBouTFX`(M{N
zu4~FU^S;k>KlgJlpZoJk&=((Se3%uFm2!zan%t+YQBDsELz;)QHBPSpB~Bs_EhUEB
z@mecK%6vRu?d1m{inE?TF_Qk{f|oKOjT5ipPJi8`XnvhQa$v~WN@q+rddWj!Z=NIO
zXR)R<Wox3A{wf5C@cj2m6@Hlf_yvV}ai(tcllD8?#3E~<09?ZGX1F$v2se84+P-ut
zZ9XTN*=}AxY_t$mds0l1dp7&ueP@%nEdW0@|0z||nebUfzqh_$Mz84Ov^|L+)-SJQ
z@%g6lrP}efLXi{&+7a*a*-f>@M;$J84#t;&(pwu}3~}eGk@oW+ivWU=$!`jH2}pQ?
zQTF2ZrpD^5@)NV3*>edJo@vrdpwUcVtuv^`L>@pY7bzY@#Mug4klGjGjgE!<#O^fu
zwV1L<%AMu>dW2JTjhb(ERr?xyyt|or>II@SK0cmh+?YkZ8A=$f*8KNW_9?nlVM~Wj
z%lo;Uk-4a@L`;^kv5BJC7O^wKF=Ny1+X(@=NtD@-PuA8F@9_KD5NAE_UkatLpEU?j
zLitHVQZQKc+!fuc6K*=t7hYz%amwi#N;-|UXROW&x7*aduVhqC-|4(MVKzZ+;hN5+
zOIZqPY-igm<R8UPb<;zP^!3SArS$Exj5Z~c>r>Ud9>!O42Vb>GDEJeU)QY*=hiX2~
zJW>t-w)}DHEyWKz?887pzV?7+eoacv?ynj1ls!TW{lk^<Mf*9N>DFfpRUAGV>Qy;z
zi)uW(ur)>!2K$Io#@sA#orZD=gg@Q#r%mDsU7#(IFw?VJag+HNS`qCt^PDvM?IROV
ztg+gO!Uu!1@mCldVR)D78>@l)EV?Q$HT5!O5^4K{)SV9-0WK73uJhF3O)=+U^~6b2
zazT&$-49cTv<ce!7j0;gl`o5pkg}kCpT2wvdFjBF_a?ExKEG89L(7u9tS`Y<IA4%W
z;Ay+9OxBneUYDiFgnjz%i0T}b5!T?Wj2rxPR#<}lhj^6T#llI4<RqZcKGyGoU5jgO
zo<2G<gWH?*&`F}>C2c%fm2RfpFD)2b{l)<}I&n$y@+n6irP#g7^KaBpk<o6_Yizox
zqC4&Rtn35U(=`;+ilx<spbeGK)Ws3`X0()ku445cokx5WF6y$6kxty|iLC6xDnR=G
zJju{kU}5DRKQEb`b=lXGDE-wSwBxZnbja<#?@h>idWN9hWJ{Zy;m{@oo~9*vw^mg6
ze!NE+bd1KPy!~i@=7K&=|5=-RV?ePUrPZP4rTMcnrp<DchaEq&+KVo35Fgf)?zSty
zV7G~0UKclLCR*jIr}0)5<@ON){7~Uf-1XMCFP1$oyNOOmz@7I5Wn9fXFvo(-M!_t6
z;IqG2=3ejn4wLqsFypYzJ{u{Y74RGrh-NJ6)!_{=*cG_cL6>~%XTA~iv=*yE9nZ7;
zPGvaLp;3E{Ru5`S5^k$=DAISQ9Y^o03T+gLc)Q7rPy@^`Li#$>&?Tkn`?|dQ#<&!%
zZO9p0q1h3y|HNF;c;ETqn6|Xp_GGPXLwhwXu;b#b-5SRTA&R9)Od<C98Vu)-JyGU9
z$^E8+_i)RH+<aICJAl8lYya0^x~S#x6IjM^pho@2Ep;EI!#VFhbTK-g0XLQ6_+j|x
z_xpUpU{jGRiDm1IiNI1Y@K3^^wIz`HtsbgNduN~=4X%Lbqhz=n;Cfp!Ks36co$8XH
z9EP=X3AH-u0)YA2F4d046WODh4wtPj_MWSH)~L(I5l`ScpqgNi{b6Kubo49!DB3c6
zYzMUXhSl#S)CjMIH*I=9<F|>)ZUtj$z^&!(vk_XVQ2E~mh`S9}HU+b@jw8$0ty4d7
zfFR9n4o$nZD)hQt>G1g=>m}Fm*LJ?K7n%(;KT@Zao9SWWvxDHH8OaE-+L>GtrF;Ed
zfUtC)TCNed;4mP$&1u^i5ke06MjRUc=et*#BldeP>R+#oLy{)9NHj&6>>kr;&Kr2n
z&CRVcJ}E`0rG?!HU$0Iz^3kHVP!qR{6KoBsXrG)@ZhzE5f2+qzh0bC6s6EL`oG*%n
zLw@`e!s!=RTcEgx`eYEp))qQ2y^eW-E&gcTFbzyEW*&?tPkDPqbUeQba+uGxOS+sQ
zH`v-M=0V_)Wc(l%7msx1WoAB|P!FFJc0A)un9wvmZ#@i5ETH?Y64`AI^gexHXKMMw
zWG!C#^%s;HQuN4301DN=5e8QsVM=qSf&N2TbxYY5Z5_O|ot5-f2Ojmo;5(2Tb&J6&
zM)9*Twq_ExOtlH{Co`@#Ge@g<K_P&4gs){K>pix?dmQt+^+#8kjeR>8Ft`XG#Kzr~
z<T$KZi1Id}JNVcO*)lY$4W#Qz?X4br_jV<yhhU;TfU2QN^m?#Qyncn)r@^LgoyFE$
zq3Sx3iV@j;KEkrKqxx=?@5}uK-@UD;HI2W(dC^}ZfB0~>+rut6?MCI&5AbRHLH;%D
znHyY2@}zJJxvES_56%ssFn&;Gw;d5=$xvPxD$tKH<1-tS_2%pn>x~{DMq2Z>)cnP<
zc#X~Hv?bw_pleb0meB(XvndO$IS*2pK223TDyqy}@@%d?B`Xeh56O$GnQbGywEFLx
z_UDUdV!uau2YC=pP2UW>YMUs4R+6i9_C(=iZ(Z4JdyefZOCnKn1h=OjupCW|A6@YT
zwUOcBajRr^w58oufvRWFHJXB6I*bWftRr2~E<Q9_U-NcyGHbkniy{L<bzmzt>uTSK
z&Dz|+QdX~7Gk1xzJAKV8t8d9-7&I1Q?ae{-%G&g_{g2UA^(&-Nw|?0^qP44jLWx*P
z!4-w+(lvLNYN5{T-nfW!YHFL@ceHyWZbQx3s9Ays5a%U3PYh_(^U@TPyUgpW^*`D4
zR`AEFW_1KLj0}M0^EDpKEa4oTEQgFmfRd`H=s@d_OmS)Jj->X84%zG%m^U5W-wP8t
z@?v3(t3`*j2R-;+_yUXu&S-f1M#E-hR)0t29HjNO=IM(JS8j0TXG>C9QQqPq+0N|-
zBt24*00UEwe7WpQ?MTouC;UqE(38rzMEAybuE~-DX&|66yW%R^NSu`oMsCkaGQJ6J
z+?cA6WZn&$ENTI!`*H+(<YZ+n@<0~8ulCyt#ZUlwg@SN*eEWWJaX~^CJqx9Mi#-|O
zBE8aM)ah#y<>9V_ii$>LiLc?cFw?|!(nVw4w1TRS;+6=UC)Zv~K59T7xTuObAt9kg
z-w~-D;gK`pu`RP1Eba}`0eClK<weO9{3<v&CitrYOmDFGLw&t^!T`hqBtaAoIs-Yw
zrshR4+=|^GU~jQu!-k~w+9!_rOv!wdSmFPs(c6lc(&@QISRqrsY6m|jb?e@%u}B$$
zP0UX8O+<osecUQ{>vGVuXQ7Tn?j3Xf=Si(F7&5C>Kx~~kFWqBm2)kvT3}fKoD(Z1Y
z!|R(j>WV<boAU18fB!x1-SO|rn)T?qdSeH+Zy@wI5oL@tcUm&{ZW+cFCCfYZuRF`~
zc+otF{r<f_ul<tKU7%i*<qQNsTU)14%4cUNh6%SW3R(89<3t=0{Sur+>w|b-vfx7s
zsu2z3p&uq6k8ztJb`5Q9`fI+|`(tScCK!=#RMeDjur}y$Zztc?(k6c<SX;z}BsvLu
zbXpW-TeX|JGz*;y$}bDe>Pj_oXp9eck%AZ0q-fKO3)R>*b2#33&y|23YitY}XPd}~
zuSGn*p(rMli|Tl8s@Fs86GQGv)WtnjgW7hBR@e+P)O&%x7{BA{Kgd4tpV<{AqSpk2
zn#xZ5OJ~lU*+LExkl851T#2iy_~;Xah)n8{SCLr^i%^VZQ?g-(!Y6GW-Uu#E-ed|T
z7&LrzB4rOBzQ~=YE9{q}@vb(lKy91WCLf<c3B{`Vwntm#&G{~=#Ux&7{qp5XeR3h;
z5<@v2YmLkKDp*aFQ@_;sCgspq(3lC1h_DJ<XY@{#ml_gzW%v~hUaEujQsHZxKYf~z
zSDbi+7m(%Q;c=E8muGneR3A=dSN9^j<8knQg6)20tX*7em}H>LB%}MD3>Tt0bs;Hk
zy<&9h89$~QFR{aT(D1Yy1%im&1s?5PEdVMr)6&+a+*9`fNEagnC)ELdZq|lOQ!bR{
zmbt4e2*mf_6?$_==}sj;$)Y1xv1`++N!euOEEwxf@lU&u*nm*Jjf}`kUvsZN_g%Vt
zuh?+R(IKh{d3ICNMu%0c;~4CFu~qzWwn9UqELos0Yio~s<Nh0VD~sa+k~4RvbPe=O
zP`NEx7dZizuQ&+@?$Ht@;9^z7h-B?Ptlzf)Ay5C@Ed~i4Htjn<-*bNGS2o$t{?lqt
z%DFtoFi;@);co2wsOd8?OCK(ZzHjpGQ817OcODzIwuA^s<ulg$BDJx8pVlhkr)Ne~
zO}Z_Y(~x6+NNl!)wza#$Tp6gTrFo>l7`N3Rald8&Srz&4;R8^J6jtqgJnVk1d&*fy
zz+anmrOo1GigTH?znEZ66U?QlEEGSeo6tKuw4kW*Rtb$+qx>)$`=z>+ZyzdBeSR2r
zk~anJ;al=8i@sh9-c@UZ)L+>NJ86x__uG9yMrt{5*xuEo-FJ~<4-mqo@;-|6DV%=&
zzHa`Wi*eOQLJ>FQOWZ!4#BR}~czxPEDu`f*0F{bv{ucS0uQzWN&Q|D4KbRnxWRY``
zc9kk@Ewp*F1YFP)R*&d&pjXy}#5p_RwA&rsjg3nMKl#P3vutcS5q-nwNue641M)7t
z)TX(Oo!R11kxo8ZjCn<qwhRvy0EH3Pq%j?2)G<unvXjE%YQ@KZyVF8IA$Q^>M7OA6
zUV@jqw6=&9nFIBjH<>Fc{R}J4V_xa1JEA-<Zcgeb(#`(HZ9eKTm0ty;7`;(T^Y&gJ
zPpk&`VbMD5W3}_=o5~&)g>RROs(1)DlmvFotmKySpYNqkPLG*nWM*C+iMQ!%$uRrp
z9xvThtMrWGdXB?<-|Q3F2hC(be%SuZ?2a~ODv}+3#I_9Xb6w&3nG>4@3a+{v@;NpN
zx`ui`(bLy+!(iWuWtx+%hMoAVj*jep<%sU$IA%8dn^W|^P7--tr&(%kaH=xF$58nt
zBUrS-c$8vxZRx;Y!ap@!ZsVby5+|^)_?EZ;is|~r^iNW4(x@Oqr7+{8aLd*!i{?<n
z&bPy`z=fvi1{4k^K=c(1)V<v_Y&_N~t4`BFBRgK3{{q9kGUWu%8sug|-(?GIG46ii
zSiXe+nLyRsRyUFvd%6beHV6n%jMp?>PX2K4=j;GRpz2NABTcc7xLSmM-SW_dTIuAW
zJl#tI#lETCGzWR*xY@VQPUssA_usIytDowx&$3e{OYvu+@ds3-7J6k~+7vD$Ed;#G
z*4m6->gD-h!v!fK-OQaW_wkzlx8I37<1H7EMIK$yC>(Qk`)fep&4%fcl?s<p<rtrH
zH=UhxHypx_oMPSmb==d0{)w`LCyjt=ri29Hpr5ZpcRJvsO3zNE-CMK#RhmrDr00*G
z_orxv{D%r1hJ&0EYKpW?8-jy_OR$N8FELbXqs#K}8b?ira;YJQqG1STD@u3dNWg2_
zsih~zj8H9_LRLqsW@bgD;7X8nmInLC!!a}O-)N0Z0qRx7^S`(^|3uXe0f%(BlaxB;
zmaIBs0n0RQV3v`w=FCfYC)*kw9bGamZtb~f&UlCeoVT#tZ!K!tTkw6ne*^`5nt1DZ
zaz&`sm{3E<c*NB6{T^cvl?-pOCO=7Lm|54rvPf)5t`uS5Ysy_^S48O)VX)zzchamO
zVIh@c2V*h?AE!*Fu*)!T*Bb-k(r}LxaF?;4hI9mDt=!4WV!f%*P8;X9v?u0Kzd_ye
zqSMiE=+fVC{Unqb4=JBxE73^uxa(|XaIHvseYK#BsjXp83_eZ4wJjJSc~@sna>RVn
z(>r-F&Xi$U$2^bed!okUQj3pCJTf4Rb|YUpa*T?Yq;jID2<?~TeTSLxUio9Mc~R9j
zv{m~!kNrWdE^-os(%x2%{;VFo^JtoE#6V_VDgJ!*D-ntkk1Ez3Z2X~tGp9wieKX@Y
zeLn2S$D7yHX=;QM7mXWsgoq0s6&%~}1L;79`a7gxqzcMx-`c~<ryf3hNVTzQt|t7e
z6=>gWrEBmEeAsi8o>h(Txewe_{D|d!@u<uHQDP{a5qul8928iwY8KS}77Y6xPlxGW
z)xZCd8B=GXTx(n8BbdWaUS6><*l|)c?~icX3;$oqTqm&G0?~HSjeMuuR!&Kec^2cr
z1kBWEr}V7+74oS~4o2b(!uyHZ=wnn|f;fXQ3$(sn6z>PNl7z>!=3TpXZ6CeBZ%N$N
z1&Z&n0p}!&4@zv+Cn@>d{m)!iU!X8+v^~E`qW#5|kkvZ1JhL+oe;iK0en@Ys5oB3k
z8%9Q2(_uapN2lwmtL2NAnlYWH0GOM&>LRsblp1^@Vt&~F=~r=4L%XoCcM1Qwf+mZ_
z{7mFR?hDnkOa*z7)uiz7EwRhUWn8DJFm7VkQ@%E~##WNit`>d#S^gHEEg30-39?f1
z?LVf`xV3aOL7zaQos%HA5qg`V9A_s6TZyf=XEWz?f`IlWT=p7~NV%a38UWPCH|v*M
z+HANls7H`g@X;cSEE0>afr(0@K;N{#hmFmFvGG;KCK)W!dLuYQ<J3!jOr{Kxm+;9h
z&t?_#F<JLM=_v=QEg#xBSJ=tD<xNx3q~!P<6bydXJDz)aU$+R@8cg@+ffBqxqx{6!
zH*><9X!GlK_V$^RKs2;LHYp_~^xhg_738Om;!_+R_c}o}m7+z`OgL6b&_}1i1_uYz
z<oV{LjwWC!Mnb~EDL(fYTLWBOTft52g|vbrqmX#*+FgA?SB>p%#f61L`+oy1F6t22
zzMW(2&3Ob=W~d|hjL}$#R6KO3&e4?dUE||&G@20^MPISV+YdnJ@JRrD#k8}l{-__2
zD!B?q-AB18FA!cY<h}#)M8EGbt3Qh04ql=WR4gq@C46-Gb!@oOanp&2?<*SmZ>{o6
zYp!HlWER2Q=4fxsN=ZqPl48vJbvq>>v2BRU(A321*T=V8Ty0D2+pOuX1w1R>w{K7$
z`e|utS!(Xu$31-cW|oH1WyV4&b#Q?jdoXUS)o#l_tYq7p!#>U1BQig;HTN=oGnvNi
zZSY7*7&S4{Pe@Oz76cD5S(5>A4xdW5A3Xkt`5oF7RpO5;9_(DNr1rTH&<x|h9iI+6
zpReXE>V-tPx!Onk=hQ{iA~Wo{Z5XR*&-rn*=aN~oI$X7HemuE;V|UV-GnT>5Pdp-|
zq^1AyzgOY<Z_WT3%wE+J`C1nBmNYdr6<S(a`c`f6wt*0rT|2V7ONjL-Pk`<(#81ri
zkMZcJa*WYjYg480&r;z#=f<F@pEuLq$!P!Op_o<|wS|qNlwZ%cPV?h5fbujVP$Eot
zaX;(;CZ0}r=>NDU2U#Y@atDhtMr}<0$$MWHBH7BQuPl}-W;jb)$5{X>*^(%+!*VmE
zZS!!}>w>j><;?LEW@x?)L&S<E0k~kkaikSy(*3HLa<I!VZ`Puv5D;B+jNm0?hbIo8
zO5#sZ`uxG5FfP^*_%=v$cpM)6$)MrE0dYNWnjarv?*Jm+&>Ht|cE1h`^BeJGOrUDq
z20fZtlS-hxHjwdx`Od7r^`qy($9rdnM@A%(qIMdsw=SI3oY;v{R>!=#hA{1X5M{5Z
ziTLNwq3M$(bRM$LaMVS6ptg9--}-sy{7C2Ok(10@p1BZg?0RcqU^S5L=;Rb0sc_)H
z<q0L`bt0Nv($^R7JUfwC&rWdHC*&;Rz)-DsVnf%Wq{cdUh7jJp`G0O_6lT=9#<dcS
z8B1CQ)gq}>$@=>G_00h*|Hx;rpTK)IX<esDK7V1tt4BN$(vKciz%}{sKutlVSj<4M
zSlHm{02;+TMJe5L8$(-IIV2GINbbC~nsraGR&F&1q~%qgU)?))avo*tcALzI<oQ3Z
zdELRx?A=Tv$`uR5fVqk+GUXrpqPT@LooQ4a;74D+a&?a5OIDGz6mq)_ZlvI?%<_s9
zluxdiY}v@cilUio?#w$~_pIpZ{B*#=5&MMBpMBC*ANCh-UdqW?fyZ(F=GN9jZEbDU
z=ewn9t2OP>(gt?t_n!CbW7j-u1QtBd+)#t4@(fE4o0AXKB`6hmKFGZLuA-C+QjH`H
zR#XFv1XbRZB&XuJ_C7JA8PzWJcObX`r4`KIO1c!z<6PTrEFcjtaW2fFJn1G@E?LX4
zJyFZZ;l|Hu8;uw=Ay8ip7gev0*)^uEK2C>-;;Dewt3R!1JqdE`=irTNKSBm1ERj<1
zL-o2MD?w*H6z>TrbWpRivp47w_~ltw{80{Epl^$gk#r!#eYY1}X|Zcqe~}Bz8sy3d
zW@ga%d$6pIoFT9Nd^@|vL~>!`{4ujJCdRPOdj8tq-`R!ZmCQu+<pccuY(AK2UuK>b
zjt#f;C^>n$l!BqwyZ7!^l8O|XzD<ZdC;@j}1r(6mGiY;kid6XM#Kc7A>_l_KOFJqm
zoXHr(Y;O;La2MYJkJCqdvyoX?#*4$F_T6mRh|2gf7ao3W5xCWq-(gw=+QlojIst=K
zQc@E8-(nvzoTBV$RBG=}K8_vf>%Q1*m0(%gI{y1N+3t7*z);W4v12h}Pm05h3SDTT
z?BP_9nm8JZ8^4jQpKTTF@9!UP3?f1yfL4|wnk~oZqB;(A{wr?G$M8X^q3@esUHAK;
zICtPuGc$W8PWG*FA2`-`ICAD}jEQmo?_cO;IxWOzL)@Os5T9iypB}7d=Jg`ZYz&2u
zqx{btfmQ-#qpb^6*vZ@6)^->&^5D?KY9~H}DrJ2gom8zC;h?Aq7j|_S@22ILe_^3i
zzQmx(Gb{=PoDZ?e-|UZQO??*$6=*yJEj-T+GQDV1p-<YQTUvPu^T6`M2S^Foj*att
zhb}bVXO*_SwDF@4tgNi`UO99W&3atE95rd|>PPHdS38WB;DbXm#Ty~ZIPGqL=JpUP
zghoUp6Aom_zm;N7-wVFs1Nl`m)A3``i1NUh_s3b+0JB_u>TFl<Gb1S&Nm^K!vw({K
zLTbL^@BK4i=kroOb=<SqkqG2*@hK@aOVw^w(WuV-S#7~{8sGEZoR2qX)7H}RQ%G+_
zF=L?6aZxzPBi^b#&veT>AW1l)m{E~>a2T$?jG{$kZ4@tj;!g8Bi&=EO=neLo9Wuiz
zNRp3DEqq?%*^CNQ|BsLMX1AB^s4`y`vu<0a3`o^LrhnV<13I4!?x2Akh|{Z}6qoT9
z%2;qtZ9&@p3s*ubBA)PGPuBL!9gQ5Bk*tCOOQ>JgN~~gh0?DJI8?r*Y<+tIu%O$Nd
zVPTY*(CYo$)-xB1^+QC1DRb;La7-90{}!B%A*vPa^EZ352i#k4<UD>h&q!6buF1YR
zS$`E!`Y_WL3HrR))Vxd}IF8j%udfh0pr~kVZ|qM23l9cu?Y3hNtYv{3ZSdQ-b3cz5
zuhh}gL&A%l=k{olZT9hy<lw5Q>P8mnnLdGyRkc4kc=?Z*Mh5r&kyF7dl+aVZ>!8`S
zYktW2#qt&N`L7f3o@6b_!|iWdsB85cm>dvLDv!lCbRI>9C_^2YKe*)FXB!OQ7|Ph<
ze2c1qeUv};VL$;9<))LdFV7DiU0d!0%Ve;3{cYAV{gr1gF4Ivq#^)IyflHk7B_|br
ztQ}80?~eP0P+|Vg_w^`cC~uR>{c?gYD>Rj2GZalrOEY#Y&r>TUFup|xp1JJq-u|h`
zy-j8inB(n!PTLNfn6~6(WSF4EgL<0JH%+muy3~U!!Hn!uPpx7OFN-X|r}5&ue{xlV
z0)hf#@Vt=Eg;%XpMN{(Q7R8em#*34>i`6?a{;9r{#mYNc6hBMmo81>pg(!MLww$`>
z4$RvPw}yLg@aA|f6gf|Sk9ODv`UEP%rdCk;>4OAA%Nx3tW8+r>jZL<qPSZGWBa^Zb
z{|$AT9$dl9n|bla1Fizbh_!SlXx}ZL@*HZ|V>i-DEm8P`{|1Z&-%vY5TE5Z`7lx7p
z!2!8{Or&CT8*~L_6F>y((Xotx&77a094h@O$((GexI5QrG(y+Vkf?W>ktCX<dJGT{
zun>7S{a7iLHo8bugH?Yp{*fMW{RDi$L6F_LGB7p|I@q6nb}P=C{Lj_G&x*M${yETt
zJE6!7Get4bh`8qD)HJw9li_#;clISzU!SYST?wy&fm5i11<=#dErGTuk8W^|_5e(=
zqO3%YTNFHy*TagZ%oj=r;WJ5Bi?aKF_@i>~lHH0kr^i1Acu3fbc0y!Wl`=n+veZOc
zTt9ylzlCbMZR2#0XE|Bkm%tkyp=)I1)X@vtWEx(9T9#-InURxoJ^Tf(BoYLBXLWR?
zaAr}LQ=qy4>X(&Jh;};M`43A8S{Jv1S%!aX1`&YsrA4ww)-{K}iLrKVYpZlB8V@g7
zJ`iLCw*l#IY3!5|=%bAioeJIQg;wvAYRy~7AuX28Odrl0;HB(~M#vq(9{Us59iil4
z7Okd{>(Qe}A%lZAP`gfe_*m1H)`$)qLx61wrAwfdghT%3(7{v8MK3^;nmOztR4aPX
zXxYCAOamy`vST7%+UMIeI$K%=)eOZuf4d|HQbMVSe1MI*VL%PjOP<CaPh63V?ZWOK
z`hwLv$gxyt{}1&)AncZ^5cJF+kw_X(4<F(<(MGE|AE`j`Nh7Ff3BP*viWK<G^q+t9
zL&L*)+>%F*W)W-NCfLqT91}RSM<V$kGHYvO6giT(rG1yI`*lBhisUkXg0Nt$cfp-@
z*}T2PEq-0*`fhTIoi}M%ZmV+>EPX@fTScA4L{7inUHML7GOc#c0>Fz76#xA2zj5R#
zymgPYm6b}F`gP?}_Qk$YIB)If9!Am48}tJqXN+ch&f{sv`LAVBA#!L`{x9oYdXZY-
zC|pvNZ{MnPsq<GW0Q78=uyA(7!$d&}Qs<&?L@yWtisg=~e~X^YL6c7TT|zjH7dbej
zyj#ECKv>?TVd8PwJ8WcjD<4Ah;O_z>bZAxc^z^LKOuo|*UVdTtxQ(Qw%W7snLwy&#
zo2eeL?~neDS7^zZ{e@TO#}yY2r;ek%r<Y(J^Y62dH^f^H+~e3W<USn9f4p3opE7%E
zn)QElBf%MKY-;lFIOcEz<?9#Dyux*z0TfnO+_#9@B>2WSb8pRCp;aiB=#0)|?di$Q
z$<ZMn7#c}AFaSZGQ%3z1Xg^ZbM<4_YpOtp3tNC16dG;cq9uVIfN1EDzvzf@Z!@pIN
zKrp6JA&mVpy}&hkP}7+X^`mRRdNRk`X@(AHsBG{yX5P1a`tT{O>Di(X9rMKS61q@n
zpqbprx!l^944M%ma3;TaF8}Ww7SEr^r{}=KcKU3#2XW_FuSHF_5$tga?>UF>j&Cxi
z+z3B4-w^ccXC5dAIGaO%gNltG@zYiM03^w+;(Xt=Qkxnz-`iigQZ}jHmE{U;1;QEA
zhLYXRTQx-{fG55t{Fr%|ptXsGq+8MuW%fQf@xs@C|2g@kb<5lXR435y`By9}_E3bq
z@;GG4>H{$CP{at6QZ$Rq%uf|t_x1I)3Qhw?wd$SX{8+8~&+qpXC5opX7H|A3yXoDa
zu8s#q#LFV5e1;s9WLT8EwOni*0t~D5qw+<{HprnweR93;wkY3_sc-EW=Tx$t6<sD0
z=xKYc3iNsI3<XWvN&t*BOY=lST-?rKabSeh&0qF@Hp(=%daZS55fKUv`vO!t8w?rF
za?V4V`wEbu1Z34PQKm_bFw))nH1TmaOuY?X44d0CovfPXOzs+%D-CnpkrPtyW75n#
z{WEBqnnJ&l$%>em+c?c7Y6&bodJH?UZH>}}gKB;7rnW>yj|JzkHv&})^P>y1@|9?#
zVafHFV`k?vlsO^ntloY{YccZ|d7SE1=8P@M&4k=>BS-D^H@rD^{g13qX`ou{86Eap
z<M9dNB3N^PYM`NHf?guhV{L8Sq|g=-t3HruPSqW`NH8eeXTI}d_&*&5&KZtpM~eiD
zN6GVUbb?s>Q2$vI%>=mtvy0;z2MFB_dM^4;RbR?<Q1r7aA?9<Eu5nN4a`B|+Am!vV
z<oyL<Sz3UqgZ$4BTmy1p-#%Hm1T!)=_<`IFbWBR%6L&$**~Kae`bU}=|5Do92Pe7G
z<^jp}Y{tiE+UM;{{o?u1;u)dwY|pvu#&^wViG#Ul5Ih;eez#k-PzU|zOG}j?y;?*Y
zXpj;JuX3lif9xF?s1^WfQik`xFUh59;TczR_biXXCzLgLsP!9Q&*E%GD3gi!L?kmg
zDM>=!u;yYjZNvS*hi(QTk8D9zpoBXNbP3E&GQ)+<9|_*Zb>j?%h`{?w#g!uw!$jb?
zKkOoxbi)tXJ3OUVJI+5XZ$F^kH4i{VJBXg99wT|kOkFx!f)N@n5oK;47NFwPF7C>S
z-<zrWPnUoJ=mB!4d3-eyK8!kG!N@BNJ+`Jupd8Cqc&qZq&hLmqG?4?nt(=rR79Iv4
z^&d3Y{;AkkdGGFBbDEg!QI$vhDPEWlXpiHYCPC87%#0FXdZU{$H&q2-2+FYwryKzK
zb@tpjJz?ul2^H~3>yXQ~C%BKucFLKHA`Sa>#LRro7<z|cp8+nNXw(|eSl?D1cC>rK
zPEbPSC~}j$*J1NB5W>>pP6eo)c{;ENJGAh)%ZR|6Eid29Oei1{%n}QZsaD->XRM};
zrM4NI+uJ6;qUMh?9+iX<hfzNv{rmJc0!9+3_Ml+Cq&p*Cy72waDbEF`dPk|noksUu
zT>$FFy^|FVM_CBNs~Y&v^6ohjJ}naw3AhV&KlVf|dw~I9a784P{v~k0M$|{~9ddFr
zJYql6Dp`C_t)U_U*??d(vyk|X+fa!AZm#3{y^Ev^_*2J=;!1C26#eReA?1KXQtsUV
zg6$++%#H0g_DQG^bRV@!sQA+w<6pk4g2ZNITb6?kc(8k=M>nI^h*#j?GjQOFh?kcQ
zzr4;s&6WSiZy`rKjI6HE7TU*mMIIP8ojd0`nsQoZ>7PD@X?QMPolJw4B8h(9DsSW|
zo7EoEm}SlEu0eez$g9jxDVy7Rvw*-=3G<%O;V5-ey^N1@U$J3%AjHE!I)+C*k#&Mp
z4xb}JQw}hA8H<}$QZvbi_)qdDS$z<i-C;<yOTcHrR05#~hyrg#&VQP!FcM9&Ap0SY
zMpm4a^wi&YNlB+FGN=f$i-{($wajJj!Q*$U*=ic9xgav{&3k=gU%Y!W|3}?S)E5tw
z`=TopXFmp1hC<0n^nCOp3JzV9)9f*KwV;5@`-(n^>@>a_!hFk3eCj@+=cU%~ty~}-
zQhLIEa~-&kLsRo}tf=tnz$!qAT}RPkBhsMx3Q7al+$&8@)J3#vMgc1+uPAHbje9lJ
ze`;=wn<S==T)siB+Id;*r1J`DR1-+@KK*!7R;|Aho6_0}(Qsn3<?X@mQqX-{(Qm_i
zfEj)rL&K_{UHZ8<#m4{pn=Ry2)cR5y=*hfyo67I3s!iI2{q1YC*fr%La{S<Y<dbSk
zurG_1Xw%yJdg`ax3P8NV&o9C_2fKIg-XklY8cwxXDL%vZL&MO5pv=FTjw);c;X`m1
z=3k}koTf2UQxZrB3-5V+n~O5fs#u?}-7;S-@B+g-tu-6hw4!~F<5KqJCmLu?k-gqL
zAi%y_$mo^$^dTj<ExEp=Gs~W&D_jX*kooARw72{|x`vzHqDtMYL!-Wfq;2F*E1*-X
z)$CPKbXb*k(T~960j1TyH}S{rC>t-U=*@A1{tF!)9lv)lk^6X|x(RehD5;l+){D0+
zn~2DVQALXknrgf;|Io8%&-}fkvm60EX7{~IsqI*Gn>TXDd^f0(q9RhHxp8iecWaX<
z!qbqSsch3PhN@C-iJdw@88{qAfc(D?3g=n(wp)*rhlajvoVhHw4XyW;UzKB#xg=pU
zQoapm!gic{Xeal}{gDn~?YHOXIThX-i*f#--*H9UAV<CPHLL4|{ub#8HX-ksRruyO
zD51WajQ4!nUB^O=kdClx8pC|pv-pP+-iU18*V_t!^eh$Sz-BaPQnhK2odQprfAxm~
zHKj8g;%!7IBp86cxsx<hj8&9~#qr~BKs8TKSgVUbsyd>lPS9q^;c|wW><<RvvRXr`
zjUdaga!rUMdMKG}s(2EFc0}zNM`f4}qMAM3z=2@O_-lgsaT0#_Z8AMrGzSUD&CQ+N
zwFsR?!?>rXq5@;EpQLh+@8^w2V^}^NkqXxgC>T@Q5(J*d9=JHpy}ogGGst!>q?<(Y
zUzKzGs?#;b7hh!CeV2MZEV_1P#u*x3X7cBBBrl-tHQD!?#uo^N{;?cB0sPw|gM-K9
z&(_Y0p>EJ%1m^eqz}>0kKa>?|vtK541S%X3iz-RWFe%)}XWnV-u1d&iJxzS{hlyPy
zNq}l@#~mFZ$!Vqv78;+37I`Ui&*o3e&linfUAc0lf0^te6dRE0owuQ;UR~ei6m^(@
zY<U(GR0+W_#pJ$h&UN`y4~3xLiGq$oBepn+Y63}UU_%?9j68JUoW?Uo30zwI#zf$p
zHg`Q&D@8a~<Tw&S{jiu#(hm|1baW2n9r)1p1<`BEF)GGpR%nOGI3Q_aMla!NlH{;o
z&8jRLk+hO6M_*ey#3VkMTYNOuZG1{gWTeZy`zvRfl==5X5o@@4<k;GATG0e|M<U-*
zo2AOlC3e29aqgq7eI;}8Qh}C4ZbTHhe9eHM)E!0@-+rO1PK!(OTU+%Uhb%z@l>jNK
z$0An|Y{G2IeX_jskJkpp9_@Lu{u(A!Y7|064-PQ>WWA&o5Xpj%i}ZOmy9$*OQclTq
zt~XG77aq%OIP~a<JS1p?WTD;OirU|&n72Ft9|Rj={`W?d7kibhMR-lgD!tOO%D*D)
z@_aAln*cM#O~$r)y|m4Del`|Z2*Vh)J8)KSdq=c$FU~1Cetiy_c@Kxx`+z>R(R>cM
zf|$p9>`Qnu^7U&H)W{}X&3i^F&VI^s07~qr?_=%xPE}C&PpTR2QDG=5)7)<iLd8t2
zDKeH>zVA^Nu^?#Am|R_LbbQrs*r!M~Mwcg9${S<{-iwwmX_JBpm8ZayV;ys{P)WqL
ze-_moL=pVcPJefI_ac7bheQ88bEZJw79dLc_k^5!FAOW`eVXnnT^{QjpM`px=5LRX
zhtGiMoSKRx!k8*GLUBlL3|Pvt46_PGph43Ih)lJbHQd5R`HoeVAmb^YQZK|Oq1E;L
z@3VUjZI>NBd=sHuyS8T|=aPT*!gH~wZ#6(&QE+IeSgGoP6H9(7DhHFdCEe=b*FT~(
zks3_iiF`y3*W6zxI^P}BFr$E##Z6qdfI7BRo}t@@w!)#2KH?@epBFV@N7uJKzKyH9
z%W;)~qvFon^pyYG{5E0B48=re`j&@B$AH<<kqugfQX^x5z0;uTkzQBH<cAZ{Vq?UL
zR_qJ8B7f^uwLSSE;63l|bNi$Dw+wR{d-Z4zaD*aRe=T?kDB-@qX}Y_wMEHB}j>{UW
zuy9Ivb~eN2Xl^-!P^*>6*vFY)nRTxLw|9-_BIJTwus=|&6*4<awAKDLK|Vz`fI_Q>
zT8j^iybZqsoS7uZ<7O%}4!uP)s+ue6(?=3QEXm#1>CQ^smJX3}`}4q04qTICcEgvE
z^iZm|Od)M-d?98tvnS4~OITubS10FbZQj!sa*)|=MUx1T{TN8m4$j&Tv0qm4@St_v
zrk6`pzMsHpxwo{p8;W6G)MQR@Ok|UxPByJo1-guqx`txK`k&qz=GLb?N%YmNs;rzA
zk0~p`a<sJq2H0Qu696>M5>7QvW|v2OPxI~vcuAx21fj+vA5nZ6E|U@-65>mHEwe}J
zE|@vb&LtIFN47S~vaj<0wIS*Ae>s+cFuc}nGAce}XJ;3FyX(~AB@M1V4SSsH^FRsU
z&1=oIUTsPHl6shBM{*d%Em0rImuRmrEIxc=kQ;1Nhyzbl8@BJO+|+g~xVg{i;T+mG
zIMSI>jF$V9<53kQpR0@zqc|<PB8=Q<C?x?8OKV83UH`fIZ+tR@>E``zi1~Y@!Q8?&
z;G^TJEYtH4$WAuiS<9^D^&H3ZYZGoNQdFq4%$}p-zm2_x<LCTzNDz1QpMU=Jbkrp-
z$!clFum{$5y8Tdg$IG#dG6V^s!KIlK%mUW)iu&W@E*!)Twcr$5d2bof;_GIJAZ&BU
zX|#j7^%m4MHUkOztWK*CT_)dcCf#8p{KwZoZ)R4f!QaJDOvJ*~F!G4)_5)rc0=sA%
z%V3@(3~<4RvhwREp~DYB*4#Jo>kNK9ty{rb;t(A5>RDf7wq$u@y_CsW>(e)`S(_s^
zPvS5COW}COuE%j*xM<qzpx`aPnv6AE4Pr4!U7{6DP`e(8``jz2g9e(>1b-&Y7lgIJ
z9GbR-KyAZN56`U$9go6-BH%l)`&;!s1)d?kyY3KrlMSXx8egLIDpXMheF?yEO8_P)
zTR|=G>}}kLSauXXkpedN+HqcxFFEkG+)q7qn?PT(hxwb1b2ilG;SXP#_tClyr!t1j
z!?HJ@dj6pO*CWD(BuYwR*WPcCb6MOlPg7KX7YkqrQNmS?68+aA$=}TzO8hN3+pmuC
zmpy0xuj<w%80mbu>Bf*h8F=t^nWy+%^!Z^7K$s6B64n;FtHp6i&d_gYOGR7PfDO1q
zPfHL&g~aSV28hUU#P@}g8f^}E(Tqo8RI`xlLMQcgbq~&_Qd4<Ty!*fhWXjWC>*hAP
zER(u+0W50QGan_EMV%0#bm3@P<3F&*VZW{Z1YfzT4b8DFb-T;q-AjH`gvh2Zs`8n@
z2+yKbyzDrT^kFj>B~SF@O7yTtSz-`_WNe?f8oxGu?rEblDeC*n`NnwP7~PrBP_=%T
zInN+U0nDfms%4GuVk}o-9dP!@_Z#Z<H6>rZ#84l4Q?boiZT9ndIy_BUlT(y@8TZ*t
zpl!`oi1)|t6DzQ^IP}zXvs#KIVQOUXo0L4w&M`ctNpWIfS=q3y=(~(Hpr&*rT>yPr
zh%+;PynAyb!Cnl}S`ZO@H?}l5!+b^44drFRANPZL4HT~`3RYDz;Y_F}8+cwaG=z+%
z>CNbmK+#-7<Bq7ncEE9OBDBS@s_9-O048<MD=M<$)3Uq4$9Yr3xA?sJ33bW?T=KPC
zkWU+tjJGR=wqw>kP$qDQeHdqnGAh39wMz0Z*~|j(W{$|zN%<&&4PJGBbY@zozXYo0
zjs3!4j|o>SHluTieX!4shA7l^pdciO2aZjP&Po-gKJ8-@k_3{R7xujG`P1k>%nl^w
zGjEgcXdPz!xXenXz!VR#fdJJgU+f)i{#&)3Pl=@~M?Ho+#VmO>3z3e+iZ|y|f{1zA
zHgV3upJFGJlsT|OwNZDmu;AW!)o5hn5D_Qk08Qu7zEhnmTdtqP(s7@J8iRs@{BXRk
zq4Pn`Fm;xNHQ^wfp^X{5O7r;Knp5@xkt0*n4MpP3$v2}+QFypxqxZk8v{h4NNbyc<
z_%3a>EV1(OKcb}T=S8Z}13%gL$n4i^X>fQW6sd0?dPlQdmK$c1Xq`_DLqB*JPO-Wz
zZ0x>!Qw=FvxxE+D>ZC@2_8y#*2^!|lGLqLYzQs#&Lz66DYg6{jS`#!`ef##U<r>p#
zZH4C4kAz6`SnM$zUyG_MfLC-43^G^jqbf4C+;nuznmlT`05#P<pjvLU8qt)XZG^+M
z_SR|?i@aJ`!BXC_`z;D~pi-%C)oO|!#R?7qWuZlXTa9DucPNY5)}=#FSyI-b^c3@e
z-`v|Z`|iV$_*2wBrns2KNa23LZ%_ytb-5rjIlR0-`1dLNm)!t;`2%~eBDF}zv=h;I
z&aQpU;y9J)LoY-P`4V$RR-N+ns6k<s>t>2ab<|KO^7@>`h8!0<GU{9l&E>Pe2s-}X
zq0AG;XMDto6q<U1xcLPU%@pC{cw`QgVJ2Otb4Of8#Mp<MG9wcRKMj@1G96G4*VrhR
zH0Y-D`GS6ZZVK`ts}*g8{JbgT;(lZP2E#C$c9fst%&z^gsEoz19rX_;k9zSbxkrBs
z-$L^Z!lVAh1B0f#ypec4&#uh&FSsJzv|kQo8Cwco{?3>7trLYt%@V4QRpzu4@Yx1S
zGR|K4_=cfAkK*k1fa~Vbuikb=dy`$xKbyRZ_OpT`BRx%yz0!s@1JyT%C-l%vT>3K9
zwWkeQ`(RI~aCHt*U4|R?bq+<*m!IHyvx2ahHhh7gX810*u+We@IIl;<fLv|fakIgq
ztnu2lYuoP?Q_uVOHZ?U7^OK0O&OdhaHx|hZ%EKngyFOyI7)02@llByZ*gxzRK7Tsk
zU&b#hg@a~~=30vp#EF-ttiCO5B|e`0Cr-+Tr*6*a6NR!bR(jqrw2U3l0?D9qi7pMq
z7(5t_&TQJKL6eBlD`WE${(L(0yR$Ieiz}RWP!CiyOo&xC-WuW^?-A?;rQ?Ra&+GJ(
zHF4CaxXvQMeXOw+2V$O%`HdUzv-96N0T*zIof<*c5Uv2^&~TlLi%TUGTMY9WXZP;k
z9|{ql&YW0z(pavRcw<c`<Oa)^m!M%TBsq=UX$K9#*$mFw*)ts}hAVUSWThy3cXzi&
z9t#PwRODXAJ78}USZj`XST4SFj7hvCE!1Sww_ftk6ZY8(0)|3PZ<-cOnpXoa;5SgV
zwkcjeOw6sn)w?VWyCU!IH-ms@Qyy5Qp;wJP{PanB2P5IjHCeUKz0k?1H3X$ehpjK8
zZq#y|axp|?63U|e)jX{;tBwU4#LkMA&%g-p+jePpN=YijYD5bjM@L6<0lh)9lW^gi
z+-QA&Uix|w(lgYWIcm|AOnWpqwV6YW{|Mb;c9Z5bVSJU~aC5WHKF;B6;jEXS<}PXI
z`G^@=tBbH1uI(+15w9MkE!1x6S7;IV6>Y(`9T&JYtlw#V$(>FcIB)rR(;Y2+eD|KE
zqYGnZwtP6?0;uTpqZvih&KZgFFBiyX^#?@kVE!&**eTVbxuG|P&v&i-!cERRcgDDU
z{fxNkiE2ohR(3qObhvgV?9zF<dV(^7y$d9dmlQkVQ^{rV9q~i4Fl*XT72TN+cI5PB
zFlt$X5r>wK2T*$VIIDcmzL{g&t#WxlQ}G$L8Miz7dvY~-m`&g3{%s6dMkbopC0Sk;
z3$^}KtRJhI!;6v8xVfjlbLc8pau)90IMZRVe%#lNx>!o%77zy#M)5bYw<cN08|IP5
zb*($a)qeW*YV0o2uBe)&fcpMP5!KJzIJ)_saGNL3)sNcye7l~)U0G8TT3A?Ec{5DT
z`H=m{@a+^$+%;R<gLQ9C)B9T$&ck@fB{8h6OX#HlL47euP~zg^N|1Q*IT{B6>iA@z
z<Agnp=s69$-RWPW{idO}xA(1Dnmffj9m`&yz7KY;ZTQsy%h&GenhgllihmR6Oi38q
zycE8G-F^`m(6o_EGROZsY!a}vS<5i%z>o=~WgG@EpJJW|F7{hVHf%mS9op=g;-jKQ
zvc76?Z#<FMH6)W&F!^75S($SDy%Z!~Lwsv%2k=mCC+AXI?d3R>9ac|&|9s4DVV)6h
zsCM@3M#60(b&&1}ekgY66-9#JN0`2-C;;89!yZmMjsWS>2c;3n!f2CQnmUzwafdmy
zZ?vEgE{5clJIv=hy6zM%N0mz3T*$c*_sanBpE+dK8W7@W+%#YE(!xX7Q_VeHxF@pV
zR6<42)4g*nsAWk5?%Yt;m*lEB*IXL6o~Y_XUXJ&xZ0k<P-qBl%9D&fj-ZGQJY+`FW
z3<KqZlDd!9n$1VlT@g1+HVc9Y2&?<&&Bf1S?;+`l7Bqby#ofDi`+H~Pm8g!ud=~X#
zeu1p^Dg9EKV~BSNwz(oRJpQbY0e?<hFA7LhXndf-Dvlf%8KOBR*Z-Jb{+{l<*b8F$
z64Erslhw(nv`%GJ)f?al{M|+3#nqZ0*=heyVGFpDNS_UEdB5gTTlwz)m@`z8V|Zv?
zP6>}WQBXWL8?)y?qJEhfm1+m0*<7?wTeTE%w3JsN-UwDgjJLHJ9lGQpf;6;L*7$4H
zxC`9xh9oH>+1X`@mqxJ-kNo{<NQsnI6wMCW#&t(}%#6fz$X>*JwRbxD`iHSCxN^Zb
zhz4oiS+i$9JcG>GjUo`sT;_5TUUtE2EOe`O&&>POU-2Y!Pj+lF*qPZnL+`o2WO9Hj
z+D)bmRXO04C5OfrD_QTkEKw{QDeE8H<%G*dvf19+%d|ez(xnMI94HgPcLN*sENJKI
ze?DDXdr!HJK7(6@FvtiQ6OBFI)(Q<iqTRkz=I$bQ{RK@Jbjr-s#KiPBf>INj*mol~
z2q<k`P2eS8lFg^#lFmChMRE}N6KFahHP&A@`}p9#NE8y2Yvso*6pFmU*lHWnPCrv%
z%{4AQ_+uW@3%KQg`S+Q)Va3}Wn|@(j)s;!2wC2{{k3wHPKKnRMRV_t!QMyrE#V52v
zEWd5)+~B+ZjahKE{2+Y;--@bwH*cg5m1!R7N_prb2h1lMpKEP~%jb>mnQPvti+Q|_
zbR?ysUsz(3p3Yt7pD<hKAS5P|*k!)E^N8`brHhA+J%r=S&wQ)#j?irN%&3+-`&f?*
zEDhL4$kvub7<C=d8voj$b96O`#-o`P0BzOQ3|F&(#`KNW>J{t;07qJC+ASk-V)A(K
zg_$0AUP?OjZdj+b!}3>m7b+VLq#fR5Boq1T^x3n^=n|>6ckgKbs<)DQIAmsIBd1*c
zGdln1GPGf}D1x92Vyo@!4k2eQ1Zjb~969LFw7Z`_XAWRm99U>uc+s^Se0qdi)b_W+
z``Y+>W|nLR7UuPSUMCwm=oehGvJ#&srJwxm;><|r?&=iW{xVwfdvZ^g1Rb4N{G~de
z<gY9H3cY(!DnEQbIXPMH7J;o1g66|VkIsBe(<;(oC5_O9dLA9Ut?iiQv69nXUC8?N
z;fvRSIPW`RoPFTB-)&(y!Rb4B&Coy~t1;*!tGVHYcjovq?P?|Ka!0%EV|Om=*^jSJ
z0H+U~ldq$rCta^_7oJp6@xvrZfNabnj<nHm4M3}*<g71j*OCyq2Gn!gZ)6o0cZR`u
zyQ%bqQi(P^&VHUXtgoq!@WLgxp8H}jRUwQs1PNu-XckSxjN=P7`4R}D8h~hO#_j$;
z>{tzRLrb5yd6nmSt6%W+C+llnbMgxFls!*Ndlc{9S2+)Yo0dGrQ*=7S(AAl%faraB
z1|TEd=O-rYDKTWalGOGt0BzCM`dTf%9)GRkExt=c>R7;Yt=?NqF!<sFy~n!!>=u?r
zp0-*IA14GjzWbf{kPdOaFeFkxJ}>5${#Dc-<IbGhYSpkdu@ym*>v&J8b^#6fHCNZR
zJXgXAf<r@s8vldQPq`*MuZJYvC%@{}(`ft-*%K$bj>7S&vHiZtuRey&yy)QI<|fxs
znkxO<MgT8&LgY~wf}<c`K%-~rFGLJUNt*gZO_8p;gwn;3?e*@*jic@ykkN<V#jnFa
zNk|e(L+Ri0UcP)+Sy}lU`ufA&9sbaaNvJ~<ezt;Gb!Bt&^Uhb6Cre<K0y)gj0yOj9
z7q2z92_z52>W_nR(yyZ=v$NL9hCtH;nll+mgGav#B_g~ckF~sZUOq*=$C+}MYwQSX
zW4~dLbfj};HcSO%8SlC{KgwkR9^H2*RU|<8dhOP&X3=|Hl&5*nT7ecg+P$cP`kKZq
zT1w({BfwjJZoMY^Kak{)?0SVX_Jvyy`p#Pa`DlA;&!JYmTie&<S0?irLnf0yhhO+w
z+Ua}ob$=~$=Y4pu(;2NtcGqz1K}i%sOTuNH%%d;1nRF0QBwnBnzdG$5v|F+t(&yk<
z0a$Y^zKcvfEVR}J0NO)d$C)(?Hul!F*W-qeWX+{Y1Jii$QXG0bONP8B^uH^bzf7Eq
zBVCV3%jdhJUAWyXfce{Aq4*$=rt$fdwvdlxNj463>y83la#(BYR_{njfCEDSWln19
zijed50&pt9Nz8>cx?KAN-$0($j4%SiqTjp2TON-mmlB$WI9kFaV}Ie$e0M*lo0I*&
z{A|zBxV>0J<P^9bm!m#?Nq@A|N0ibwc2=5=F{1IA27E91@}<BtuKnz&{lH_u&)E#9
z39!dN1Ixef#NvAEt-JqYrFwFf#e?U&e=RkrIvgZv{a-I@$$2#q6Z(*|lpwHkiGSm4
zLyU6xA$0Hsn*zs04<9`e7|5SdSlHee4S>N)D5juDH2t~H?>VR8tLgt4GjYctL4eJ<
z^zogd&Xwb4+Di)yE4gC_uVjwP*q0NBrKO+MUT@y_+p&mYl07qsrk%D5_e#veLcVe{
zt6u{c-Qoj27?l&A9M>#7fCPp*L`F)61g{WIIY0>&Rp&4jxDKR25U8FuoMg?{mYnA>
zNcq|w@VMaWpNn3Ee~Q*YzNYN{hl#d@AmRttRr!V({?FELdR+|<nV@?_nq>cBqv4B7
zUbn*1I^5aO0>xH;{rdGegxRh4ikj|S3h);O`=e~}GTT<`4Z+HW+FOeqa|&lta`IgT
zfAUx52a8NfEMptOB>xKc;}kBfU^!Ft@4gq{gKm@AwIYqgidZ<Fk`p3pq6t;U*pz%0
z2cF)7iWFhd|K4LSn=gGWyhApVck_y0K4uw7iUV>c!gynLk)-{8P$Q0Z|KkB_o!Opk
zUmm_S(0lK!P@2MGV+k*khY#9+_C^?wkDnm3lUV`ieQG7Sh9zGmgF{I=_%6{c*tM7V
zau%N=i{0S=V?kV3_cbVAmefyKqr&t!kF7~bjEL+T;0^_l=Bp?))pR|KPGs?$6)}w>
z5z9_6>>bL}e0KNtA4z}LUfvB$9VWXD;YC-6Iyaf!j|0tNwPdsVHnT(>-JnB~I<y)8
znSi27)E&W5n|g8_@MLb~BkVNep9kjTEru&r|IV<y@cI~~Qi3v>`0>ZprDG|g!B$*c
zv&%)jrkX3s1wYNgER*iA+e@Eid~538D+xFNJ)XA^F5N(Td>124m{0ul9Dd=z1scJ+
zJBasJXuu4=Me;Eozc$^}smt$|x~*s~KBSa@A@B4YJLt}Q&<6IppNvuI8y!NE%p>#^
z!UOYQt<YSi8@Z~CFC~lyx<j!bc%#tmUtS)yRvWhBt|90bPX9N^tYR`Z=y3>?Tg~4E
zs9mOZ_iSF&nI_|dFiD^M>+_BS*qrnPj_bY_@56@7@1Ni(fJWuL)3X+3oPQjd``a&b
zCnI$T4lc`I-<rOsb}$u7qFENL-pG%hUwkfyjJrbDOUgLxCbP(73Y0{8eKfOgtX<}k
zxYTl<N^1xrE&pSeYoB;YFZqI|x}rv_&UH&%0Jqlt_6uh0f(yGsd)9I#?MnPm#EMHH
z7v^Tu;?Q>Jz@ulT0@%%{Nn$kxYp)->Y?kf6dt4I)<+uifk0Awm3;*oe3qCIbFT9X!
zz2-5q1j>d9TUgokUHt|Cm>ARV_BZw|1Z5i>z@o3&<-k^5<-C&_?_AZ0TL1a!Y^MuX
z)YUQm5>`)v_xgr`*E34v8lBC`Hgq2DA`pqW2_~_xKku*wJBDN8?L_rA4@%8sy>wn<
zc43-N3Ty4kgYZVyO&M%-;aiL|#O|tbv%PNUmdUM8Sb1T%e<o~BG4?Yzb2~P&5B2xa
z$A8R<A5}~_^PSl`2D}>p;Hk=()0_V*F<*y#Wwt&cH|2W4f0=glP8l;{1#}rSM)Q7D
z3b6%vb!1-ZZ1vorLzk<}W;x-WOPB4x)76K|ON2f*emd{Vg}&xmj-h^ri=KR{psj#C
z3#lfufsI3l-+X7eAop%r<}5oWZ*6!ApMhG;pA02<kxtAFAG9++&hu^n_J)KG>1C1L
zU0hq9k7uY^bfi|#sj|@Hqy)?zomk(G(B1rjQ%^xEPMA9zD!oNL_S2JIb`w96BoCu0
zpUl3;$9a89%wKB%+s(SPYB!N~R10~lBm?nC0keBsfuj2T$kkzI_NR_rE!HxmPVg>c
zMX2ihwL(3b#=UXyVkg#jZKuXiM90xLsMv|WPc;~>LPaY{FVN<;i7Y#b)-2kxmSt?g
z{OVLk4juZ@L15EaTunc8HFJh4b2Bk6<1VI!7g}cyGbN?i*uB{~Q&$Xr--zMtIe`~Q
zBq~bY&ByhazS+2&c_yAO>mOXAN8;VVt4))@kd-P}=v*)SL5?pn0i5*!1Ya{;){UN_
zZIC5xxTzb=hpFLKCk{HVS-cHIPI*bcy={*YB&6d?4EfXZ4*4;!Mqs+EuJ3+wRgrlD
z*;^@D2<|$Ta+ACBW}(&d#f#M+b9$u?!8Xv&U&R(E3rOjZ3GMr!dbs8SHgmnsh?J{j
zMntmV#RWZ~JhdOa-_PXgoMq;zQACpOAY~->ic7?Zg>`Y0gvY{HwtM^IRr1w3hx6^x
zP=iVTF%mW^{Ya~SPG(fwLT<{F;aa_5ao{JjaV7G^t1~y(v2JK4H-h{fX)P}qj<o3f
zE{qyD8@n5OD_1bD4qeG~ae!?n|MmWY?S5zbx1ga0Y*9MupxS&7ch+$ZsC^BjtG<{S
zQX5)s*hcN=Rrf!Bl8JsI`Eh>@@u*k5ABddWWTbQV9{vG`-qFq!JKAkzw$j<t(1$gA
z5YAUSliOO)Xi_{WFV#P&@n!&x>z-bW3iRS4(QX!LJzp#qBx5LHMmb+y-P}IK3Av-s
zp^QF9!_7mR*e?m(zZqKVq7x{c<V<H;+tU*wL!mtddoBfOuNXfLqAVKKQ<7rg<K)5Z
zlGSq-e2Xh_41-i7xFmz?LD46SMbZ6IVh8&RH&eb$Tf)?FKD{LJ;5&HQA-6l|RrTuz
z2vRPgt65^makq{hIL-79%iwGpipj0L#N*Yo4ehOYAxX*BBcb8#?k`PlR*$|u&g=w`
z{J4%EJ>OJ2=aOI9a9#WDwNe}A(${UU;d#odqvjg71lOG5w~_C(368El&3B3AztO?w
zc-pmO9|0X*C)f4*fk7@+j-Tb9i?EK0I40TJZ~Sh~!(FgMB74}HxEt)<Fyzw|468Uc
z0DR@nF79UyEVZ6>F*n$Yy$qqO)9H0sDmU12iWUG{nf}~$Gf(!#WcIN(+}_THN8kE;
zoh;dzsd|}q`|YCRlHklKI;bGoYDgJs_<p<yjo;Ss-M?TOSYqzYU7F0i7A~x}kw4$G
zj4LHR>+EKf!ms=(UY&jzLk`x%tze}<cw=_&YQ_IY+FM6O74`k2bO|zmfTY9FB@L1e
zI&?@Qsf0*NiiE;|=#T=^EhQlxl7fJWNVkL_DUF~YQg<J~=Xu|I?^^e+_4`MMiF5YZ
z`x~Ecn{pO}7D*Ytg2c-`P!4Y#A7_&uOaren{;_b+?Nm}SU2^f(P3<gVGKF0XMt%k^
z12d!2YuvxQWJ?T;i{;Q~XaXsZZ`v~~=Gj_={}@}4ADj+6umu!)=njLsQeZ9rtHR(1
z;q_9U_Hk9#+VN2OUU@9E3{+UNvm*2muMp?zThav$M{}Oj8xz%D&{Hq{`t1sdAI^hk
zgxgzS%iG~Ipm#*v@Nr4^<;ae!r>6+(cpjh@5Es_HT^=6}^-TbchS3!GhN}@R_GW=+
zR1ef1H`<`6bfr<@93Ig?@W{w+(MTCx*2nX}lGg1jkT?)U0$lkG#@RUjDtJbaC{_!;
zCey6xmg!)keen0K-)XZGWTq&N#nOr=rl8+>@RJ$MD&y(<sw{n%FVS7TEco}lH6++n
zJ0j8agj(i|!lDvr))5*3iJev+;paLePn(juQ^s=rj0EjYi8&D;+;=HrEAjnTCLE$`
zQ`+*h`OALI6Kja`Ew;mN?HOJbOsyPcKdnfKy?NKuvzo?$z05fBw@v)nrdgZ8?H|R>
z*pC>-{sdi(Q-Ro?8?wGb<e>~-t9hkoyxw=i<?`wMbch@`$x}j?f2Q$1czQ6f1y~Jr
ziAcJ4bfXr@kKma)r6dx5E$#K6N3U8WcYi-jD(EjctCraSzAN7*u_tEJAJ3$Z4ffPu
zqvGSbIzp4vLkYb)Lw|R8ljIDzBk6!LjJJqOvic5D|HX&J)XqKXXY&=%qWFQWMU52c
zi=8fxc%iIF+v;l$pVd#VA|(LxcvsRNe(_;aG<IuI+8w&c#QSI;F8v2(MZ?X#JE@l;
zBP)s;J2+;AW#nUNrLf$`Q|uQN9^mi@@=GLPml;CDXa)8`qy|n(h!zCrZSOy7<xEHa
ztOHUwXU|<Uj~X7vWCE>^=0H!7^J+}cOK90u|Hu5ar5O`DT3mkOzk_>y>c*qtglB{R
zSPcag_=q$ei;13ICynaz<;(d@Z;tESl@^uH-l8G8P*yl=e}wZ~^F_p|8czd_oKMpz
zK@3O!f$fgXL(-PD^CH|UAg6&x-|%tY7>EaI;#knWc1_=GS3Z?u*m&x<AH`khc@z!r
z<I9ZVu^6_Yt$~(rM>14YMro<xPJIok;sIHuecrWC$hpoCLMT*k@PoJOkc1uf>zVii
z8(RB<B+^q#SHuteM)W#RSCKZtf+floo$2mJmbP;kE&y*kHNZMjTXv7j3KE&8T`A0e
z=YB_165}<gm?H>I6H@1IWHOr<`}cgvq+^3F7f=~+=lAf>pRP-f`=Dabjv`<YHkL5X
zUCl*mRS&-}sn$t8BXtPcz<w$I`GxX&{k-ibIG#^9(hVQqyfO5<kF-7A+Ea{8bcsmn
z{*p5>+C%2H3pP#>{++vdzylXdtMw=j%i()M5;2$&pn~6sZJ=+ezi?*uSOdORFgIH?
z;6i7rsyDte%g?nDK0OLL+WbWG%BJhqOzirG#e7hm=@oR`@5hyu4G$j2y8H27U^pdt
z(1sJ-cJv}qsg%$_0chi7aG@$u9qNLdPXfEUa1SDwOS+jtjUZ%x4vsnib%iz7cNJ^l
z=$V|UNI<{n)C+j}F0&)ql6Op>y#R70@T&SCtTy|`bDF@jCIgoY;Czjp-o6$I=^<i7
zu-i^8GircZGXrq&ZeOU)SBDI{e3BvDH^AO`1RXUH&9$eZS%HGcM>j=PUBT$y;u*zr
zqBAAld*jO7;{AM^LRks^<ItRSmhpO;=lA^6$NxZeM!?OUmU?E@6=mf}2t|XU_0t*z
zWH~-jDUI*rBp`ZX4S@}*Z#GN_dG5Fh!6{~y@a^!#223+dOxg7Q@^YfFFHt`;xzUY8
ze}Lgiw$=CsK8J$KqB9$~Va6H{%&rNal9&+0+}S~9HrAO%iB$Iua;ftT@AL3uQ9<Zh
zl?NG6opWJ&v1*mJ?uYx4!+OQfRdMq7gJ<W!^%N<KGCz5vvV0gek`9)!d-zBkhlyg#
z*D6J#TDrAY{!IRtLAG;R`i~m9=MfMcPAk~Od~X#szjFHAL~N{O)z=prta_#%+dYCm
z$I&zD{+=ZSnY(aBAXJ1bX&xE=)+)UEu)yDJW?5Ja5{^KpQs+N6T+N`8y^ZY!QnH}J
z*-*ehA9wGL8kci?aXh<qM-teS8QtuuycZ2`=N-l9uHvLoY&CFcC~a=~n39#cNssot
z!BaZ58@OH~`xNf$neh+uzN&TC|M7H7#dS0x2~xe<_(Wxj)Vxnl{?-NBsNSyrv)WC1
zx(5RkT4Dx|VV0hIoV6>?3b*idD7G$?=tOYGEzD$|J)R6_S<`h#p1h?xr@winZ@;KV
zxP9s8xGWCWa>H(R_bqpk2##sKmUz~Bc^2o%(uS0vz9H4p5*9HDS6Sg%Ck!l{2plM=
z(0Sk~TLu=;Sc+|P8l;Yj#9Fd+-oP`QO8pUxw8wcuo%F~`x|;oa%lX}@hzcj$Q>J?p
z{{Rv8ga>xXbitXV@l1TfKsxo0$+W_v&*PPQ^LRwX9QVJZgXe;@U?Nv5PmLU550&xT
zx$}gScJ`M2+huI;hwoltR)FiH(^kxG7>@9c2yK0=i3^5~7I2=29{fl5W<mdk{lakM
z#pgjl$34RjyisHt8~;7n>dXfp3>uKuckcVXim$))k|kUx^qx%&_%(6@=PCO*N7vNF
zYf2ses`o+n9T!cTJJx|k4{2)<QN)0Y-V&GCScY6aZ%F-dv-?4z_|I9eY(?yz_5TK5
zJODq-tgfyL>t>rRlZIy_VA=slRg_>oWZARR{s6v0(4d&zkn8xDmzP&W4+V&@fd_z|
z;wu%ralDZO&oD(}ED&jfcld2G520%lk3pY4BmC||jb`uq>1nq24AW3tD6<Nj+i#rj
zlkchoE^wS33@|E!@6-1H8LFB+TL!=q%-Hj7)~U(W!T=6)x{Pbqkfg}j(eaY2eb=dr
z2!ik~n!AT?l%|it9B+UM0rgHc)}<BPvlKjC7&{0J8*kHM4Jx(Bw`?|=-&)WlxftMa
zO22?z(3yor5V4m6L#&(^&k_JddJ(P$NLi?IAhog*FZAro3ysDZotmqcOpwD{p3Vll
ziZ0b_rC5s@cIV=DS`-Xv{ZG6LE{5GK@vfjYc|6ADE}k%_%YnrQDUP1iGZ783sVjDK
zVNq%ur)DqqI1C;;K)`(KG$i_nqlMo-L;KR~g&uN}f1NBcb8u1<=x(}H=LkH>OCtwP
zAxPT~nl%Xt{fk5l&;lm1x1O{YJ^F2dN0h@~rYq}o$LKAgVL?su?uv^aBm&SCBrc;*
zD@y#HENO7DH#>alfGC%b1QydVTZp<c`0?YjuTu+0vp?Mar7o`##U3?+`s#<~Vc~da
z4(#Smb#TJ@V-VQ_>azz*LN|M<g=qf9-MP>2jHd11g#{AaauK6d>wuqfI|&!e<KlI(
zai_nvx+d6$vdy}PDlkjOY99J|Jbov0Ovm<kZFs~E?tdK9QRHahj07+b`jbPfcD!DT
zKy4?(B>Q7|L8sGa=pu1ke_`}V@q<33-MHccrp+#0^l(ZsuQcPiz;V{L2pNx8v-e!%
z!!J=XF!Yp)m_dgIR7h!f<1sP=`H#%Z$2sk@oxuBWyXM_fgPj`7@biiq7j#8BxHp-<
zQy(sR2td3%#a{I3lfW=+prmm@V^cZYLopK!TU+`Csy*u_)lUn4K_5Wi4}ACSs)*Ql
zTy~P+5aI$%oqKyl7z!c5AA@Fa)G?V0z!eg7_=cMG^r(^WP^3}s7trX%JFbrweUW5s
zjlQzNyqq~Y^uO&<qmqG=82TY8h?7J!_Nd~)$lKjwtNGM#ovr5ulu{f3&F&nrtp2QZ
z4+J8Gi3XlHVBvBR3hTw{Wp=&I>z;_&+}KD4O+gyTQhuI=E<gi7Bwbq(o*~m6Mvt4B
zgWw#c`Fj9t0b~!eH3R<1)rT@vXvBp-_=XML>C2nreA`1w=M6jSU^6muv|sc(<tf#<
z7b-*`tPdAMSA0tr7u%vCZ>+B$pB3@`R|hz+km*QE4UY2*?@QPC|JBHA{&s*wqkH2c
zQYJJWzVr2}Y5DKS(Hi?k_D9wa|25ORiZgN0mS^dcTz`(%LDNHIrY=rlUf$Mu91g8X
z6kA?z$Z0w!Ll8H1Y8sr%9BY$I_0v1=Iz;!!LB)+Bv>64bPRe;`9UJlC*sK88owJh@
z5yHco;@WvJ1U3$}nQF!Lp`oBt0+QlF3g!llF`gdwOcL^Ip|5PpBh7c2<Mx^~p%!Pm
z3JXFeUFAX4(zjiBW(JRX3XYCV@9U}j0<D{YnWXVCt_cz41$lLW&i(fK<DWCq;)1?<
zgU{+ahrD2}i(2PXh*>9zVhidGooRBVw65BJ9<&!S0Q(HiXO@ENi#Hu;sB12;hL8T=
zGc1(V!E;$wtzAY>lDNoaOypY4oC!fnARa>R`eZerDAmPyaqx62Dk#ID`UI}m$fQEw
zg?qt3pmzi7*8JI*YiEl>!a2|tsel<Gmhs!1VHlGDiTXL3d;X^vBw~ZQZAhBzh9k}K
z4||r*h@@+^>axU{J_x4Tl1>1_UTSlDK0M8@Ne;Vb83pnDEBsEKDPDoF4h4R1Bkqr9
zWgN&uoO{;<SZnD|R-eftU|~RpPmN2yrHKemOgmE_u#|x5l&Ld8UDH;^3b1%|%g2|G
zE8kU5i(39q(W{T$v!J`MGy|p<=+d80Er6&~Z%>u%S}R&o0u!JB*-v06Nw~D0?Fa`J
z;ro3T&b5Th*pE`eXHHr-qAeRQ$&n-@1WW-)AfHT!iC@X<Tn*5`(bE;NakbR>1=g-f
z#b6B^u)6l2x^dz1Xkl=lD1jO?D$|IF7^X8HXOsy#>r|qxtGz_iLfqAFn7DtYP*egW
z8p5iQyYSJEfVBBI*I|Cfgv!Quef`Ju)Nc)1)cW24B8>79JTV4-wc*rU$M9)ATQQH;
z)_H_OTb&cobDq-Ck%;VvB#O-%{wEh$K5#=6pF5bb&})!W;+S6O2C!6s`7}7ocsh*~
z3q68&82As*R;O+A;UP$1>LEmmUeG3?+wnuqr+8gk#K~I}`2X8-lY~uBPR=~@tITz3
z5IpzYV!}y+S`Q}W-i4p-&(nWJB)L?#jix1}8xAyf<oc?efUD`hHPA>YAb18{m+~JF
z!PLFm0?(Z3r%Aw5)ia0ie|d#KRp5pCnJc=8sg;U;3`9bWl?X^r9YsL&%z=xDyhD<b
zqc1^^a%A>G<Ly@s3l!tOj+2f!4SCZtQ=1QbFrko=R#pzUt9qks?KBKDb5gm-G-GmU
zbkr)Gzx<Gjf{*Anj2cz;%CgP8%mGHtFoJ2~<q2)N>y1|)#y=*gC?8I;8)}(7MsX?b
zHl^4~Li_wd+VF>?^@axb&3Lbgy51eRhRuzsB<cG$UiUXs>s}I}3kB3th*CLByKL7q
zu#${m*a##Z28)7=7)O62A-dK$Mp0R0^*L5Z(eEPn_(Y=9&pX4w-wVak#+rB)Hv-y+
z-$dQ3M+KaHHlP6B@c3zM?}MkT-f#7h7hDXEgUXa7(vz$=bccl}d;tw8uk5V9o&MO6
zXh?B>KR8a@P4L4`eeMe=ywDfm`X5SJjg_ILfM2(Oi|W%7JBMIVxKO}dhZO=%&Xx(s
z`Jf1XW;uFmxY(*{xNubPi_+=xC2;gPR4&!oj9uq)TkjM9_w9YS)-bU`cy016U&|6y
zODMRH0Ve<SiJ?Ub5=GS-Cl+S1{Lh!?4~76Y7NcZN@4AeQ(!HrCMglDie1=9KkhAu3
z)i=ODwIYW9?xX;%3o&}pi4}($1zwUE@Pwhx9w!dkqD}+;3yOG_tl+nfKOV9CyI3A{
zG2QPrHgb5!pc}_Q<d(p{k1ScV^kY!vTFy>noHbP+gHF!&23npKjj4<LlA##iW!GwZ
zvCeHh0&Ge{Ufno8qO%_lVS&FLv_A78D73&03MmB(sm?dPgBX0|j+6dXD%wC^{T1xr
z`3vK)m54V#R5o>zTkMKHJ6jC0A8bPP4>8mM2KfO7URqLj&Yt}QnG1b1F#M&J0(~27
zBmD(&^YiCLWiEp^#yvWczV{Nj(A^csKiecOT%2amO_r>qD0Y#h1+&)OmMr;?9=I;x
z=&!#Nnzc7FhOfV20*e_b=`^}~{zD<~cYN)(trSHE5m>$mPW)%e^MxzZfj4vsVn2sa
z+!YlQ($ix*J0(Vnd>$2ql5(-p%Ub(j49P!wwSSJ(Kd^=_&t2JaPad31#n7eovmaq2
z?vjQSIpTxw{(;Eu1<}dBZR6qqOQ5MVU%5-I!tI%VFaC6kw8-#4^N{0GdVFqq?&F<|
zlgsMP|JhPNE-et_n2Xll!owgJ!JZ^bws)PA7Y1n$y+I$Vjv@NLAD<p0cqU%+_xM+t
zLyGWA7?Tyx2&ou$`_cDcvJT4FHHbKU!;^6T5laO^>%(VMc&+ish;joj#7}XhmNZdk
z=g9LE{7qe`P7_R&1HI(N{%rk^n5@IW8+5o`^Wak4>@XVU^Zg5i2y=($+2f~+7Tu};
zz8y;jR`$ifsw#mf_A+>>X6h}Pc6JkcNN7|SxzQvN-G(-ggo66tuP)($uU^n5s}`Ak
ze&vbaAMJl1#A2ht2*$n{rO(XZ8<n3DCI3T@ywH(XFWO2_aIruy%LZ(P&mMM&27K4S
z<Tu|n3L=QJv}_**{-f7d5RqyPYcp6Wn-**6SAv1dfMZqRTcFqMIDCbN-4{>Uw42##
z5qY+wsLVIu6pTlbv!_s*PobBss@b2<Xhq8ee7D$XxN-&szXWc1^VN6af7~7niNPEC
zN>1VXyAuz{Fx;2^eR2;8K3N>53@Q3w<jnv*L-9vj0Sd1F5;LHX0HUFb(Bl{`@Cj0s
zA+!u<SGpyp9nHNLsCnhQc|3mfy=U}4{OO(C(kOCcW~Hc9d@xU=GVk4c0)|8|<cQp$
ziSH8Vd|=fhxs=Kmqbb&X^P*%s)R1FXH0d%07Y{_W)i#Arv>`>qC3oT@p^ef~z$;Xa
z<+79o;=bMZmB!iQBJo1eNa_Qtox@UvP;7zX|4qJULVXO{p|!uSJW+6RycJc`^{Ixp
zNm8En%u!)GYtzlmbV8O-Z)b!q$Y+A?mWy*QuGi4}ffhR{xa2Z@g$co};Qzb3U+-s}
zu5{Ggw>w~7g9XPE+A^sjx1XKLv-Uq%p3<BN1*9mBKAS2k;aWx|TghUOv^)DLXM^<<
z;1!NtVRfx0<$obQLJ4i3(K?^#8Fj=$N2O-$Dw;xMjX^Sn6iq+gOS|cD@bl9Z5tO+1
zfOibdOOxJ9tuQ3pASmy9n&#|zSpJDw#Nkc3Vv$w%U-uEC`$?d;YopQE51seH;w3iU
z9XP*n@TQ>PVucQ|e5CV%2vCQmH{(xPSxe$<H<@Do-*yvhf3{OU38F6ma0gk`*6BV%
zG}#LAmqpRDXB6m3SU#)k@4BUQkqPGpC+9>pkte_UmAaE1O1Sl3o2$SsUw_glFKU*;
zSJr}K0}k8fcz@|_fsNafPfT8-x8(M%IqY7?{a8$S;JoqfV52I=N(z;^1)bC%p28fo
z|H;8LuhCVS&@&z>3`0_fP%6CPr!)+^&07`nk8^}z`Ii3SK($u!8_VO-Lwtly$$Uzo
z5XsyIyuj}`+$V^LV!-iaD*-iBlcdZt*Ce{w>4M%64InzgV(nR6zIiXvp$4momA}9R
zmRP`@Pt;#)rge?p@lR9Qot3#I^AqLX$^9DhyFeMQGZJjcz0&t?<F{t*C08R1PG#*%
z_}Thy{U5H6@mgOvod^fCzP+`tgX)Qb@>!~BF)U?ZkCQ$z`*zv?mM3JgzFPkSQDja-
zve~#3X>>o$vqD*FSQPxBS-B8zl9$Xu#fo#T*)=_#0Lg)h{FqbnEDSwcC-48+Is-3B
zS$zzj6il%8Yr!T=1P#>m&X#$&{UrtT=<2lp4XO_{K>hI>A0w^+n9q+_&uyYT3hmw<
z?M~Q)u*WNlX>cgwg+fwXp(Jf(TyfSO%xGX|g?L4e8qGt=9(vmlP+_@&E!7!^z|fX(
ztq;eS0pzkZsR|?#g#${&Ws^bv6NzOI?Ti(^vOvKl@KzK}kG8)Ebd&JDiDLLR5MElp
z!cz%YS7o@skP=Vs&kSzmM|ua$o5z4vG?seO6zc7G(>w-L7RMb*HKf1l4LVG}Yx16p
zkkHY18A5^1f&fszLw@ou5I)^L_X<u`fxcp9C@KUo0;H6}8|v}@;E2madga%_6A6ve
z0C_|P)-{erOb+Prbgf)`kaVlDx4lf!L58lUFf2z&$J-0k%N(p#+QjJ_aMveQ-3n=G
z+WY2kQDzIdsvmZ>KA(#EQM&hH`HIb}vJW&Si7GES?nQgp+ijG!U9=g>*DlEY^b~`n
zgUFw>T2Gci#kANwtpWv!NOU2qmO>VaVij-+VuZvA@lPC)o{OW)PGJTxGy&igr+}w~
z|8(3XNL^hp5fcq3ntz6z!W7-k0x7>=%eM$zvq96dEC;ZePVQgtC4_hc#UhQ5hD)DN
zdxU;c4R5h~oo1sLe%XTmJx7Y8<wnD%T#>l}$%E#jn*F`z6DHn$i?(M;LRKF!B}|fT
zIm;u(DaxazLwOnugC%CtCl<$?IB^gtRW*EIaY5-^*qm-1k_eKlPcMm$wgJgXa$SV;
z-=o-`KT4lQ<i}wMS*@BL@JXLb*8l2$>le_2sK7vdYZh3!8A^rGb4c5!BZ>uK#xqQa
zE`IxMyb(;L8o{~ZyH>vVYw*_F6>4pZqT(81(2z50xXODeZPf42_vedmn~#e16CiYU
z2q6<kVsD5Vne#<%ot?3AAjD=WTOBLL03h6mU;c;txUS>que|_7bo}r$r5+^od5z2Y
zXwH_Z2Pp+!qhh{G6w1(L-TuH-+<x@E%DPbYR5D)pH4K{;n{>q!C|AFeqrHt+ed|td
zr)+9~Xz1HfkVOk$ZCI;V1W=_c8I#}ID|hfl|HbJN1HrYL@4jzZWC4rZDYMap=mHxN
zbrIUnoFMi30s!f*rmIK%ld5s&QkAD#D?V2T;;VucYl}0|$ee}#{z+o<6N4lLL=zWO
z14tpsb?#%x)klC~)WOtZg?hb0LYxQh_Vd2Fw2>(Ur-?fy8@YXESEyIexzR9fn;n7T
z`2M7RrLYK9uLlTnh7(-qo>~Vkc>Wz^n)lgmAt@mhr5vbaFd9>vOkJU#@Na$l6lYR@
z`>k4hW)@hFed%q~(0fAD=mo>(ztjn~d~W#cW$O)_??kR2|H&2$-d{}V<pZ;_A>45c
z=6Z%@3Ezu;%h3%w;*NER^vV=pjUJC&b&(AwnvVdR<vohE!-?|&n0or&X>S_0I~OZ^
z<toklYMe}VMob<U{m$1Cz;mu!pm874Rx-NKG^C@J1UhON{|?P}+3A)@v5J&bw5CT~
z-fTWO2BZZf?-mtc`U>`WG<5aM9vNUF0wo0p<|~^j+k4g`2Nlz95~Dn|f5PnWT!idT
zu&ZflgWah%TuZp~#OTp14^bE-5Sj#sxR`M6_#M~n|7<>~9&hSEge3;k7<WK`MPk~I
z)mT_8tTETFM|!i-1_-$aS|<?X>v%7o<bS-cG0s$V0`@_(=814|H%)q}1X$ik!?BSM
z0tQi@e7-1iimY$VGAIC;3khH~ajK4^llAdvNpie+G<W4h5Y%cwIy?uRmhtx2322+!
zEO}kMVt;D$$<pBypg>bV6YFokHl`-_J=eyBsDk8<e(A2ZbNl(@{VqP97<j-WViWFt
z`14aYXuXnl<*zoze4_IHt;#`7X-Nv%eu=@(PgndMIlx3no32Emy}j?xuOx$lh~zsb
ze@8X%klprN9{BL4VWZxr>Gz1pRK4e*4OO8(Kp!dE*^0sGUblX&PmE6btQK!f8%%KP
z<|QgId$-FR{TjR&;sbit5lpAR8%nAMR3q2nw>JU*)csnQ@4}ZiMA%l!`uvK@5A`?(
zGhFD2>qtDOfKbv-HfR6U<m#`Iqmd$RgT|*RD?A3s+-*ZQ1p%TBHDi`&`$R5ji&ngy
ztv2$My>Gs~cC@vGLXy-@tw+C?2S2@e_jd(tm*WlV%?70k^r*|vn7&=vcrdy52V!Q&
z#-ASv9v0WmhT0`-Emr~b?(v(Z#wF&ygGIz^i!)x;Qo|eAZ5yRT$-h!Dr4B$*pUD|G
zj+jDb=#db>lH-X+YqOA=@?f%Xxe)YGAwfnZOyN^r*RI7~SUY~m-6&>l!<{HdIS1%z
zTfc8{@4H(*v<nRdC;-aR|77!oF3Lt8$>Lhw!T<VE4UkcdQm+(H@COi+54Qx7%h?i;
zUWV(){T|ZoCgx0q4@4CG`aOClh2cSCfB2Q_-_(;uKdW9M>m+O+hT!}fU_XM#aiVxf
zR5@W!Y-1Tc`s5e0!mirqZnxl)C%X5_j?x$JhVqsO0>yW$$RYb!W^dBn26VN#n50=j
ziIylHHZbXC1kk}|)Xa;Tf}&~k@1De@3+NNPbbaH*e=+GkeUzygw$RVNtEFC@aCXhW
zOOKXw6Ow@?GO3ZrJwYZu))HXqK=rHmes^-*${wLh!*(aHlach(c_6KfejkzmqeNu2
zwE5kM%ghN7V%;n@1nIvR55L?wo}Khhzlm;GO7lvWTq|ocPQw+tv<Jg<T|eBqS>!J7
zkF=JZ3Bc{5yPs;Yb(E18AWEt(FGUza^VBpV03NxtC_dqsUH2xw9&lB~xVwO8NKu_3
zHW^@fNb<5nT+hW~8!8o2q=8OK0<sthF+Lag;8Zzu<|${dLeRUvnpBt><MiLNL{DNc
z65`lDDYVhs2xQ>ox*~b?*W^)elq3nlL)nRNS)bDLvw>U`Kaxm(3SoQ+Q*;TD3ETzx
zWX416IKP3(qHiRd@p$*^V#SxMRNT|x6l^NH#i^F<<N63|cgG!=Oa}h;ApK_nAxi+R
z$r)_!8=oImV(SB*uy4LxE>}<kpuvRXl2#sM9R)BtzN~SYNCrrGYP=N36+-eNput=<
zc8Fks$HwGWQ?Dt{a#n*tKN4YXf?Y>9ptq#8@BQQtk&z!#upYh!R?(0M>LeIYwcW;L
zB-ou?EQF=iBgPlM3u~mn3U-t3r<Zet)I0%(;%#tXZ>OI$(23ecow&65`x!Rv^hlF^
z3c8r;IbyU3&>p$e@XFXta@lzl_D6Zt#b-z0<_U4|Z#>Z%CvYi&aXdsC2en_@6wpbK
z(kGZ7&Ix>ozTXCcMA3pya{%b?71i|N1Hjxjd~@zh-@&mUG>Q|Nbie{UP^CEZr$+@&
zGPCSlMq8vXkQGS-0jl^Gi}V}X+Q2&L^@mz<HNI#DyYh~)*eP*RW>o?hg&p<$f(%{{
z8Q%kA5BVjMFGD^GR?_ip;gvbXDOU)Bf6Bb?W#7MA)pw&nNzH9%uBIMRw4ho4XAII5
z;z5?@>?;|MW{IPP<5znu-H5Y9(%m|_XBRpZKKjJ^>}{;0T=6AEO9HHkDN{7e{eCLo
z3UeVo?QTv_L(sBDEp-P&<J~3n3AKX2;m_(&&3>uKu_zfLCxW;WXk8RXYyRlHBao*f
zUtrYkAH(SuU*3`v!l+(|an_NX#juiMMvcDg^j;T;O!VG*PnZHaB@2qZgng&YG5Y+L
z91{=!Wxp_H^+HTy%H!ql3Lq3)S>lYTO)fngvmo3V(!Hfnn56-i;^*jR@t46x?rI_u
z^`47=Eir2t`|Jm<cQM+~XH!+A)oYpm?W85FDPaHu=szNHOL-S;L$d70F7%o99{>Um
z72-jm$|*)^IQTxg;2-zoBhI<!Lwu*OKIFT}E~3CKkGXe{rTcl8FI(Iu>_K{gm5Y3Z
zx>Y)!GAiRQusye*s>JS5V$VAltY3CioX@Qdl)_Uy{-J++mdaC!1&1E&`*5a$8A6L3
z(!rx591$KXL!ViU#;aaQcyC*$B>z2RPcWU0;+P`lTfuuu%U3raWAp1re>rQ|1|U`f
ziksPZj}ytSAND0R;>~^=D$vayT1s#8yv_W$Ux7Bwx2xHGZ_0}SCiar@;BeXJgq%UV
zYYm`=Z#PFCqn>=w`5}&-<TcZRCiwF0wLXD*I{m3p{e=%-TLv^#;OlH<a5eNmE7*bg
zT97WRv_0~m-{aiSEr#D%E-HOz-?WzVQd5{S!>>Z0+}dQ!;(%slAU7;Y&>~Rs?~iP<
zaWCUQqUyKbd>r1)BQs^!s|HEmJ+FX8wQttWU91GC>3+0d!62J!_0X`P@tle&zteEP
z3nZ+NP89hF?JP{3%B($wL$LUn?*oW1g7ZTNuTkK|AaMa#h$9D9T4?Y1^&`a{a<u}k
z16RfctwYt6t^K8pu=p44GyWp+<YYJvUGvVQ!fFH#6a`|MOQa}$l;cHKes~N6X6gSS
z!hB_|zHS1h|5P%Tg;tKl{78(yi}OWWiD@B9Wl(i6{$iFOXxiR?SH-pXP0hIdV)hHU
z&_>7X2ytPs*%@CS?@ck?Fwd!2Vsjx1TO^^J0lk3~zLfaJgja{DsKAGvs)r3`S1EFT
zfAig}USV~LWp~2fr-&Aceqw;rx}GRxh5Fn;;ib@tlRNRCc`D@CPFLZCjv~4`@c0jq
zXATg+G!bZ8EomUlDjA;#f>XT7=XXUx5@<#=!P4FQd&I=RtQZH8;@o_+TlmHK-M)>(
zkd=NQOJ_bWs?K@(-D8ZREcwe?<6fWMh9O|;nBjJ1oDqK&QTxvi4m+9egaDeP{zv(6
z9E)>NblYj?8bt?W0k!dB;YPwQ(wJ?t@zXG+2u~0Wuwn)&RqDf=*j@;xfsw-lt}aj0
z1X^9Ae1Z_ZDo!Ws5BwdrUXmaR!1j3c2=En-%j|Sn!SLg6;8g(@EK~^pi^}|a3by9}
zs2qee^TQ7`5$-*bpBSI~`HnD4p?t>)O7rhCKmMhiV!yKFySrw`?DK=AvIXY?W-wjk
zek8X100)LK<X&&D^rlS8%H&Sj9N3f#rsIrX+O7b65ZUA|(DCR#(Bk6oJE{kd97^i)
zyn)UTso{~@2NQTd@V%XM>sKZ2$?68Uuq_$q?{MEue{p`vjoP`c2#IgD8qPqQi2xk&
zLch0E&~AW@f{uC={o|^U6Lxe2x%8T#zk$Y4GdP-Lp!dyFmmpLF)BoB``ScogE+PvL
z==ZiH%91#ag%ZtK`we|9HC%wl?p0UzL7E$_b7o8PKK=h;OIvSXqm+1p+!M4JmJEz?
zAA&6+?02j2ri9CP9)eNH29GAo`S=l3zCa5|*<k8<C{V69E*VeU6^!pa1VEZoB?frJ
zr~wDn1P1v7Wn>HKabJ;ZKijFgJx9&%8#?x1mT*pe^x4fMkk-@%T?b58Cwuf#xr~f*
zC>(>(vAT`7*AnJ0cbWRT=npAa*DjFHnYzW1EW(`e^rI-6DX;0rH?s?v-8xtZw69iI
z%*UuDgLXU8M>2PxDyPO^lAYz?Gr;YTv@zYs&mmo0)=KhfiJcSnleVS=7;l=WV_;|u
zhB$|!Zxq0JmI09F)i+$WXq^P0j;o%4!VB0xPohio3P78O#bLuc)rA=@t;CB!8C0+A
zQ<pUD8oLjuaPE^!9B%f#3c6Y5e2u~dtHxG2`<P9zt^`#5=7A;^d0-6hMY_vudl1Gb
zrT^Ou`l&1~zs|TQyD5vtG-0^-AIHP%H#>Pt*T&xdT`7_teKnPp4s$Z#0b;FadE#xU
zUemS@TZzHD&<jQ_!hggs5Hm)cIYA&7CPEt_A;>Ds;VOp1nEoH%i2J!iVKE~4gTPgA
z1kXmv2rR{d%D=@TLl1yIyYcyrJ^8!1<yT8w3VzmhP#;L~3BAZq6Ax(!Z{j!m>|N!~
zATPp`<`3$xvsUGMG;VC;{cO7ex>x!G`%rtaTlRUr&cHn**J(8(D)=it;B|1{nYl<2
z1%<sXaj#II{{n|XVN*%@ngrtNINsxD!1|H0)=nu|KYU6|)djpNC4bYAdINxd$5>tj
zaxE*WDKz8fs7K)o)Xh@{5kI7S-_C@Rj8pW!esZ|etw3vLtwBF65OW-v0t42TGd=3~
z5STD4s9aA^CzBk{88jh1>WAY*jT7&0;5q1G5mQZQ_=MMDH<)L{$t4RY$L8(SLx;G8
zU*rf)MCgOQm~GwHnw|qk^Dl3qK9e!ajB&qJHY&*B&W_#U6~jh#0{4o+P~P#c*VmJP
zTg5o}m#Hkbq|fWLhi=MW-37wOzWVKSpAI8?Md3%%n*@4~rRZu(et>V68qWA%7I#dP
z1WerY{N~=z@IQa%UXTrhQ=)VUyy>U!P#W3g#&uyRSV<9Ngr5Ogm>m<?H#Y-A8^|`?
zJ8uC2)fpc}2+nK~EwytV7GfjPi{^^Pd-0}(-Bpa&I_WCK85Bovv!3}B7ak<=$tytN
zsg%%Rlmk1OKShemw@?Qs=ONue)=XB&BjdauIT&PE#aBG*+bE+f7&bq+g*`>K97Vny
zc%?Wh^mhT1#T6oqu}$oi*-`fh46KA}Az~0&w^i>wXL=}jKjU!?mAB9eeH0V9>@TgI
zj|>k`1>Le<z@H@D{<)42@etXAhZZV<^H>4DX_tLb@gm9|)lAf`^@go%Dcx6`EldRk
z_fQQ<0S2!K5Qe$$V|KL>>@x^56;b7=;9S&=QZq=?%U9hw!Q(0IVSOQEc?`xPJR%R?
zz?}e9=+Dw`x#2v$H^V^@MFYTzZ%CmsVUAnW7xuu8`X{Xw^HNcqAnagP#Iy09HS$_(
z;qxVujv5`xx|A8=FML*tFPNSB;<NGa#yQg;Ayn^eNJh1SUSy!IsqZ4uPasOX`U;*|
z1rd-5!&MsE_X&bC$gz5hYsNd_h;ofBQzNSgF-QCAYXD^P7uLB115n|je<SD&WVf99
z%i<ABZprP#rg!h>LDCkoid0X7J0O0MwcOt!1qC0(tB=8K$iW%TXy6F#lHy`hc`h}4
z1F0Io=Wrk&d(}?Q5_Lh1GOpH$A2*Wua|{2P5s2j!M@J{$li1;=1t%3>^v;%_!j=F!
zwCwPE#pR@RC}7ymz*yPqwWTmQ`7D<=fV*cA2r-Om#jqqy3)y~fxYKLGME*BOZs=gM
z`2kyzC>&8(B{0`r^!Q*Gauj+Yx)h^Dn?~<miI!H1pkKJo_{YC)A>LiNI)>};$9?De
z<vfBf$rIK<mw6#f6_;707Qrx#Y(4s(G$3C!_vtn97(w*Ah=0r)fC7;Ovxi9<{3H8-
z@!Dj7O3HG0t)4Uh<JR-AzzhJ{zXbEUso5(_I`BG2bIE*b=VDfP){!ztg6yA}po`0s
z8P85m=0Cqo6JNZ}{QFA#AK#6-PkhxwI@<O<b--HJW;ELaaT|BctVKv*_%vwBQ#M!}
z8Ppj0H>wke>2;K3&2on8N4mvCtH|<#;aM3FA<bWGrH*MIZq+9yJC~9m^v$MvJ2dr+
z9k7egX-WTaapIptz|cG;)>R0_e;tw{_{65279~yW_;pA=Np~0qpQy59HUIcdIq|NM
z%4aND$E#`{Iw-0GV9FN@T7{SlF$5E}Lt*Y~`9J9qT226cN0i(l!zNYp2<k{g!R}F0
zC;^!4t1S$?pT+WcY7;us$L$;St5<^-df9PqAmWK%#L$V@+-6N8Fl+w)jDenSI#M4?
zbQ{R4WG1gkZ4cs(w;1*DTs7Kgx!4U5IpGv8UdKWCRY&VY3&a~IkYrUJgE>C2g((15
zj5QwrT{SoYk-=}N56A5cny!)Dre~&FavT8OA(6*_JyMcaWDrEz?;HcUN^1?Pwt>V-
zN%Q*l)raoy575WsQuP9ZbM5;~xtxJ&2SX9($!kjuif$1@HaQT)OqvE$m0o>zuIg9J
zBI?Gd9{~j!;)Hs(<sE>!?lAJE@6go}XboB=zX<hw98TcdN3zG45dlj67hTR=gyfrc
zI}f{SHKzJT${AAy5M9DW^Xz^CAuz>>ENWCHHo%1paFqqDtSd*r6<?jFfRjR<Wy}-s
zBOq7TNoR2vH;@yPPRV_tj=__IrJxI_j=az`Srs!KPD#Km9G{}NK{x?&B6~zI130r7
zDZPO)_`A>7VR?H)E+p0KoA=^um;eoX`D`d}^6QKzQoAb`Qk-g%ycgmO-*~g&@WsD*
z5d&QRiC~PDVu5Jt&10ZcQjA>Q<1_Spy$G*hjVDj&0P2D#^73*XAx>8DRry^L@Z)YU
zaC_<tea#jB!*Wj}uT2G$2Tj#C=YKO-uD5B9IlNT6T8A=Isu6W%&S?VxMomv6b^9wN
zLBU^e2IU2G8kbBSSYmX1K@8WI9DgI5AMR6t677wHyuwg~Z8&lR0F@x3265~H>B9BK
zKeJ&r!0BJXK9}kb0#{x2t0lYxzj?4tOxW(KqwplnsiME8D8=o9lhARBf6WI@;&q8F
z_nA%s0fEO$-FC#l@FBdvc;lZ#H~bu-)0rTgO7OvM=H2Orzfp}}NA+CbD+_q9v)LU3
z9<LwL%EGths2<igpP;R!du4i%lpRrjEF`r_E51KJF(TT2%l{SgzPRjA-Vf!ib=A+h
z0raLC3xr=*ilTX<JbH9Qd%(Y2@BK$;K=E^Eg_>$Wxc&9AD`PWDBO*0rRM&?DYT)$q
zLID_C>y{CYGA9s=D=R4I$?nF!kW%Z(ltVl8kiw3xcEb8qFpY5Ye)j|Vp{#8OtzAZ}
z$PL+u$774m<u5#@s;26dj^>VAepaDEc{kF^{44|z64mx^`R^q!E!~fCxIX@5%$=op
z`;r(F2s9dtRD}`ELx~psW2FF<Wf4U`dK=L4{E4-x{ImxMc?szRcAUoxXKn6lg4nQo
zx7g_I(#^rwFR+EgR0+tL9iNe3Va^>`VI*>fkA7Hw;J?3+p!rKrrMUpa>@_cS7$jXd
z`2}1Z%d3`l4-ezbee9N&j+N3T=Fx=Akc07sMz`dP<0)vq)A-v50t3$}|H^#fs|?R4
z=QjIjp1R)~suRODMDbIf%5KQ!0!O7MF!TRvU_9<}W<9sRx7oB8$;R2Rybi3DMNqcq
zcB1Iqe>@F5%*srA^D3Na^OHpz{-0^)y`pBEDnQ39$$m`RuZzIm5b^o-qioRq1!rBa
zVg&uYNV&g1>g<BoyKGrX#0U2%Y?Quz0<QlCf|aD^syjNjJO;SM`~?5hJ)v;?>Hb(~
zgXUeLpue(Id`?DamE+dv(D1F7aw}3V-G%=30#FATJ!j$4qCXr7C836>1G|3_QxM`|
zI+Ml8X1*4kC^!Yg#eo7_mQf|hyDy32hlZ{eajT3L;S#cDAuYA^gs-hNjZA&Qk|VHW
z4{F#DtKny?jalH5-@eI4SBf<UGU75uwr8YF1*oIQ0;rV(jIqT#czb4=t_zSZs;$_6
z52kfi2*ArLI{~g=DhiQk0md&a+++<$3q%LxZdtLDWDNrwm$9#e+$6vyk^kbXI^leK
zzb%rm`nRANqms0Ok<0aV3exz1+HhZnb$Ed?@o3AXF(3SUNTZxRW=Exi(aGs=hn<Z8
zK_of6sG&kTf_SGGqhaHw^usl-722;vcfZ#ix)D&Au&c$)g;E>be$OJw;Y~R0F{rT!
zOrN6<0a3D1c98cos`5J1w}%r>ANo0dIt8$QXz*C3OtKkM;qE6J4N@k$VPWoeo={;L
zdjxV+tY9I!tPdK0K1&SWKR(z@nLgU^N}gA!$5{IS(H82lS+~R-q}*Wlnd+8|1<(+j
z4sJgV(0?!;X~yygCjcK5Cz$yx=Pm}|f^Hmk>Ab+}`NkVi@bJ?=N5)yjf%y(pQH7--
z0)Q0z!{+ir^&K@bknp{Dq;iHYG-EZ*Sh>@a7KAmw;cRnX4=GxnyVy+QhuN~2d48fJ
zKTZCa`*1s1o%tSbC+-#Dnk^0cF9iNCOloW>jM$3|UUijmI$Za=R3ig&4g(m`RiAL@
zB}dg>wh#LZOQ`*eI3a_eEE<4ljj=pKkbr_*#U7UlMd9PbqqbUlLj{RGAv)4xa=)<G
z+#u{xy7p%PUe-#?<C<>eGGO-P(o=cVLNw{S_jDobi%!v`ruRiw)aSy<+DOL&i0DTp
zi&zwVCdk)r={&=?@VYP}-q_k%EP1uqH-}h<oha0fgus>EiD><*tqWt%0SHj=XuM3V
zYIKt2aV3q+EMcEt%=egd&v&0m9r7ku573B(3p~Ix`!Sbf*Kn0jgY+5JTeh5xvZ^qj
z)b`=55z=)8&OW50uI=8sepL1K$-#OXwaopClJhY4_xQArB7b<vo8s+jAXpW{1u;a)
zC}7~y4ZeMF$AQvmq9!8zVn~QHlavR{zwKXec*L*m5>gM(qMyTQyh;c}HEnpNnQIzb
zdw`QHa`7`~2C1~{-Zi3J5KYjX@B!H^n2r(*jr6_F*t-4Px*+kVHEhvUpDW?`LBLxM
zCZ90y`Ib_{4CGDYI=}=74ba)@O=0p<ClpJFlw7>*ko+WAY~*$u<P|+`BRhc%IuVzd
zmS=O<w)$?8C&}(jifpBxz&nQkmN>EK_pb^O8#Ns)gyK(wAc$6EK1>aK7CvOOm41}d
zCPMrI>H1q{Emv57a;v;~{sQkEr+Vk_TU&9a8S#;;48i1dN3B(OayqdBWY^siHMSyH
zumVu6hkh{*1vi18&;8WTS4Y(8#_Fp7jH>z{v>2i|gBHbBYBot~P*`)>kczPtzNms1
zRPIU~sl6OjMxw-{9A$(N7q*TfD<gj@mJ;AcqC?+_<Cu#l;V(Ln={FM<OlCLtRO*8;
z20m<uzwj~!A&>R+CY|*+QRQ%>C{$4Ai`|e6RDjj^MQ4<6TvTiuVpnydB*)J@EmJw?
z+m7vP_>^jfz&8i>gBHn+?X)to+VKtcNh<h5B>A2>eY=l@h6-I#=FM4qYWwJWaGYhx
zfVh^9L4?@GP}VIbJ9J$+-XaXK&+h^88mn{=8138HAXYcU{mQ$XLxIwsa&B0kw7&Tk
zegjqPA?UfHHwcFD_N_K?_DT33{T?+@IND2pyWX25^63rmhahy?qm`Js5n|)p;l9jA
zA2j(X5bWBGFqR$Q71X^Stejx$EB@6ojK9mwYwDh^ZiW(_ym9=m?gSHO$sORo$lt-#
z-)#xNUVKk@C0xg~=lAMpZ#bjmK;e?%WiUDLtM6vh(Q}65>?<-3BYgdPDT{TKoSj_n
zywTMt;Bo8M8pszl7R0Q>>poIP1+n+C41EA-`iewKrzuFIxK~)AhtJ|F=I#0ZIZK-I
z6$yzy#^1j<ethaSs`v}Hk5IWyVlI!aDtMYeu7<CpE^#uVK3X|3<CYu0C**p%3W0r5
zT6rU9wvtYltn-8g7+MM>a6&mbo{pdS+_@ond}QC6Sr*Y4Y%2e;z2!mj0I5=;gFtE|
zyzT@0H`Ofj`hL3a%E8%Ysy*$VaC{|6U-@KQY$0CxZ}1;>X%#v;Y~#HTo>XdG*x$^^
z+U4NqbX1(O;f|^I+VKkcvT>4QQpFDAW2aPP3%<!1`BU_R)2fBt?6(ov+qQvnCZ+i)
z1(OYj;+b!;sM;1JDbau}?!bYO<rhR4-z4R$c?rtlfmIMw`O9OCjX|yePXYZ!?vAH1
z3pLTL&<sceQ`Zk$?R@w9Bz}yQXWIsT1}3`W@!`^S6P>Dz_?Yd!JA@XZd^h$1LbXRy
z#&u9AF<SJ<9XN*AXZGZ4XLt20U156E<1e^=Z~16>;usim6M109h`8924B~ZQ?Hg*C
z4yQ)4b<<iq)h*H2scxbAw~7RT^-%fEXEo&N1hDJ6K|EDpAdZKna|w(?DqaCGnOBm)
zrYrV&f?uUi{OVD0^@#8bnQhF;cFW1Y5=rMX<violI68>)J2sI{JHjWPX>7lwTrQ@|
z%?ZHNVNy-JKty+gAD*%OvNoC2OI`5!6|QdO91EIPr37yG42s;ncY;qSa`Z#UCw$Ff
z9(z@1aQPRDKUNovp?r|?eP?L=)?;9Y2SQ>1QJb^R3>+wT4wKH4Yd~80xdTPP*|n;8
z1Z-)t^Y6BheK5NXLm8n4yP#&Own3_<<jxp5R4c$gW9|O8e!1;)Nr*5VwdAFXU-_~P
ze177pU}^RX#snCSPW1*}TFwKFmuxSz+QcIw9+4a(k(#<?sSGRA94=YUqchl@M&sX|
z$PlFW8wBQj-P;8L<rTgK8f&#NAyP`^tZ0k7OnYwQxUBgCRVLj{GzRfmS2+LWg6}|D
zjd2HZakiJZL}c{b6{d+_&=kfT1CL&^+~dDv6>dGCo$(MUy{K{yLoOS8>MYYfu+V}z
zJlD!UC8s#obN_1GYllFjfw3L?Cd;rKVg_NEtFfh-A!PN8%DXEsWq2QqO-gCIDBYDT
z^S8H5pFy4$l?ZvmswTI9Ibv5c>84i1Z;TIf22mlG{(Hc)Q?d_ID!2yXxL9<Sc#7U2
zv^|w`;R*Kmcv>)dC$~O%!X%LK(UG^9njmL58`JoljKO9ryzDbrG_z4nZi2b7`h599
z+{gVFa(|T{zsQMx&_4hY!ED8J$bEs?e5d!3A#QWk<ICDK-Ggp!<tGQtT^&VRAM#|A
zt`*80yKnu@+DyxtUe};{nV(CQUGAoDyzk>QBL~cxWmcG17x!be!ZgJHNW_K0KOi*+
z%4HQ(37e@#!EXZdT!YrMdm9y#yOukG9(%U1;Dpk$^P!hTX`w{1B9ybu0|Q8&XIU?+
zO8Ea^RlTppc6$c*xx0w#z}4n-eC~k{iuD@Oodpti?h3GbIh5}#Qq{buVY9nsfzly0
zK=D^I#Fwr=y7ZNPPn<w4nSG}Q_Ken$^4SiDDQ-$V-#*B-tK7g_youKt1QgMG&tRf#
zvw9C=xn=44&m1X<2OAB&UV3|8txt&wD7e`Jxxz6Y6ZMc)(!e!Z{2AWKlEw6l7}4?$
z82J{jmzdw?iWmx665`3DbgET)(`Cs7yLC0MeaF*&+7Bt(yPqEx+jjI|j!7yM#@!}e
zKP5pfmDn}l&-p-M%T650Akni1>;waS6YKsmyshr91-hL5^M$|xmkdJZ!R%st*WTgg
zv_t7h6OQlp7u`$aHr7D8A3=YtQ^m>g0Yj8&5Z;rJ+<0T2A9`0m2?}krkzem(-^{wF
z3X%}*bC`F5;3`d*UqoNeOUlt7)%hbXzo9O@&BH+%RF$lhG+AL0<|R!a|1w5dOs?KW
zeP}N}`T#i8*lt3RQ)`U1yBP4v%yjCVB_V-?OYC!9e&dTZ9Zv|P%MBdNzfip=E)G#%
z;TKDNim}DJf5-F&r@1Np{X)?dcIEPch4e|`U<x~Jxvth1x{5Qngs;P*#mTtkbZ(TI
zjAZhsHkS=o)AkUqSM0h(KIfODi+#PAShW$&k!4`VYWUSL`WvssI?<jHO^}?0wx-yl
zS8KLKwY25<-V9D8>(tA4@9+$WujaiDartgOH`QuTWp=ow9@uUBmOiCzr7PtYHDr9>
z;IAM>!OZ~ik$v0&DMI2PYfouQWx5~aUwupk4y<?C_01p~r&MyQ1y_MKm)hF}_!~rC
z$nGYJ-QvS1kGUI_`J(ULV_)r@LQ$6$5Gnw^xch<XcAlisvJ~G%ZecHPfjp*~WSB$+
zN7f`_yjTMkr+<U5CYQ>CSvycZvzquFzYXZ)+c&MM1~L>F-9g~W_+_O64VfBNB083z
zVp(|C|7i7&0-oWo4|9s7ikFO0+111dTJp<+a4jd0PYGtj;!?eEg}o$#(8py%gH1|G
z!y?1i_qeoa<idqxr9&cA{4grpzs)a9D<|`Q@dL5BMG$rTZ4<pJcX-``mt2LcjqO2H
z7`qN_Ml{}q6&P9=ewy#;3dG+3w=c*8Nku1AybzK@!PbP2t3vt|nJ}}M?jDllVq@PC
zdAVbVPvFWYn^DCHaXw?N)Jm=dy&1To-Xti0C}Y9FlKVknL1_}A%=(;zMWOZk1>f@D
z7uMR5!LfLW_!dLeD!Syx+c_ypL%Sevfc85KXl-3aJo3_+L^cG^hIG|yxO}^Q>Ry;A
zj=(rCi1sqheIwY_LDc4v!PjfGZ7n1^Hxvzb<F72w%I(ap5C7bl^EUXPS@kx2jPpNL
zF0=M73`jPe<$-A^+=Kl}I0Q;LSp*ukiUUpb9gf98{cBZ<I9tWC?pIlUvOv?Xm`B8a
z39tC|f$TKt=w*;V|7?FIi2RLR<_0WHOhCSw@u~Lb`Ig%C`+b@6iy&w2EsZM(TL{DJ
z^7wyPy$X+c!iT_P)p1EaO<f70;xv949?D1W`4h+nE8x1A=b~O>{M!dl%DQ7uwd|e?
zl@t`bPOo4ebvcGIDvC<#?c084;=%)-FKZ?Ve{d{&PavPL;6{qK3_N4=F<$+`z>9Y-
zyoX2K<DaNSi0Sxe@porM8<_cuz2n@Y-=vYdiWeRAKk%6xj_1}-@hih08C6V=h^ZR)
za;@%1aM}3c&2c1NR$;-pcLVFO=<*+L^946=O7DeUzsj3f?@T|}3Qq(yT|5=#!{(bq
zaGW|QkJYCv$QoaVu|~X~Qnqa%?54+4T|o@nVlS?M=e3iZD~`!rX)eiX1n492x)byj
zqJXhkLWU_#7nl$%sC<C#PX}(KMHERO=4lDpn0;q|-o0f{6CYQmIZCC{yke}I*E}kt
zs)Po|FkI>IKvlMIEG7^Bc%zpdfz|y?NM=IUL5|DTO0gu97sR7yOYLyS5581WpmeJ$
z^AB+L#Ix#D({Cyh?imdSx1ZP1{eo~@c#<eRcS$-Z>X^M(Ezr1i1G4q-80I9$>)h`L
z{fJaisO*w)lm<`=w=y>7pics;PQWon{q8I_VS=ffigq(G$^_=T69eXNrf5h^>BSy_
z#6*pThwG?%b9PkghiY-j)i;%00N>jI;GQ9B7Xtx#)ad$oqyV<88W#_6e7`DzcC<qF
z_Bcqa>ISJumvU!QCqTYy*U{eegW;f75V&)O!sA8GrWNbJtJw|Eg_FjW=^c2>bF#bk
z>Et6_I$C26rA=M>hGua$R2OaqwhwQQTF|LsUB^<0#5yG3Vp0JO#|s}Zw=Ll|<L!d}
zi3Cr$_6Vm{81LkNoL(89n^JwO_RXR3z&T0l>fUoJ=en}sTQn2baQqGW*!)zCw~|zF
z1>iG*?GHFUCrAOc0J5S%uJYIHyk2y>{#@f`?p(dk)0cOm4X|?N;|1{%a3%OMNyK*Q
ztb_eW<lIs#?+z0AHzI0;?Y&Ir*c+Lm)0!5e;^+HNVjEit4|bT=CnaVnE6RS#vDSg1
zhsRZwU&Nk@YE<2{8&dPH`wqufp<+@kXz3>%C{%N-HhaCC-@+Xx6?LtWeN2rw>YFgU
zlZW6cdtiPdrOBXuhP=3n6Vfb5COJ<z?e}HVfSX93fn8Ez(XzPE31=tZr@q?Ytt!+v
zN$863nqejY?GOwG4sdWe*-Glgy7>W!@q~(=X2#7ef~irD-C^9XHBx9&F|$8FGWY$f
z@BUb>QbTn!w)@^DH*Q;+(+BT>q+mhb;wqiHG4QHyAQ=L^)JQmpNhJDY0Y*YJeSWra
z9jKE!#qdTDR_Fo+I#=v7e6yf95Qr4GoP@qjEE{=sldyk2RTMErK=%;%43l4KN^$?t
zYbytSpRP3!dL#QZ$NUGR*g?iWDuH!?7xB&>@6Rk9JjwJSl*S5Dl67Mbp)h(fk%VPC
z(O|Q`KgdGO1!FCfLHfKm@M4#O^w;Q|Nux@eBmig$%~xe>e|}_O7;+lH8Hlq9j(@ZM
zS>!QDr$#lu^L|-dSmYb=0{0#7pM@MM-<kU#?5~Zf;^$~aNzY+yC>yRnp1<IqUFG;_
zY4(WscXRzdTAhB6>6KBg^4yZU(_B1oF&>_V%CC#IxpTM<U)$tgu64c^^EFjvJF@E|
zB2N`>jp(k7$OcKo?$F?1U*u?Bf{1P>J@&Fh;Ili?)!hmj&8JzaVdLYrhU*XvZ{o-_
zO6Q8W7(KFoc@IB4zbIzmgFF(~u1gVx`&F0z_kf8s{G(;dm-u&k^lJ`TiL*ChJ$E&j
z2a=>I-Co6FEyrt{yw=I8Y&RGs=r*{y(PLS|KtL#nWkE$o%n*G|>j7m5!xZ)vpN>xl
zJIptwvFvma153}IHS)2?*YDb`8u*Zpeu!?v6gjKSf~Ny{^^}HYY)`%-glz%f^OuB`
zzg@4H2#t4mq1-AdW<LaKKvOl4E{Px|THc?vWM-<Nlcxyt_lFvPbu5*(IA1B0+S3Sd
zCWIe9#jNVY%uR;*NyF``oF+!RME`68F|ise^vCg!wke_I4NzQUskC`x1xgR-&HzF3
zt?(yuQ1WvKar?LSvMyhc1Jv{!XRrU$O>2!`y@T;Uk_=4(g3Yqd@Y`0Y9JenD@nBcQ
zxbU#F2J-CyyR(2bCxTgaoDpQ(QR;R<DRea;z*|)E%#lHX=0&IN|Hal@#znn#{ln6r
zba#i6BHi63ARrBrLplN?T`HXtQi3ob-6aBoG)fIf3|&%!bjN>>Uf2CxFP@htKj-Y(
zzrEJ_)&hhgKhSI=VTF$Y9{?Zt(f90^v3<Io{O}hJVIZnKO#6D(ef`~)1nD8cVHAk|
zX9!_ExWi7Q5mB&5r*8Ch-{Jmoee)#55aUH<2mwx@tcy^nHy?H>G(R`A{jO!PD{;dl
zJ8p#2We>HUBJn}xr1mZ_M~z4#W&Doxz6V*VW<qh67=PB7qwHe}BTmK&K@NCeojt~Q
z%VTxoV;R28^h!FEK@rrMV7lSI#8v&IgiwSmFLJD;|E-70@*+mV>d=JC3${$nqx&P1
zfHn)xR>R8Y1L;z!#Dl7pZsZ0(xerbKwiM%wk}k`VbYRs^<#i|2`n@Ag>vPtyzEYx1
z?tH<BpK>qNs$Nu%CB2y2&TD}CVd7sDH6Q#!3770+5th5;l=sAf&^h*fhrh&#c^<SR
zJ(kc}fF=&z#W8Iq+XrmuKex{T(#ENL)f+=)gNaW&^@@414=igPg!a-=JXiMKK-%-Z
z>@;L<<Tb&BMfSlXGi!DJD$?rn5zxD0mE;kGts&R~)&QzA=>q8CkWEK?=7A#H$Bwg2
zP^6Y`jCF_bx!>{D8lj-<W7%m#3m-cUgbUb!k>!dsED`MyjUE6bqUKk;ujoM^3xEjT
za8<VGk*<-P$N=rc&3FCtuS4S7?*S{<n?c@YL)by`?lqhk@_HFL#Yh7AUx~~9b=1YX
zWIP-l(1>ui9>FIhVZ&tp8iS5Z!x|i^pQ%=)6*E)(P0aw>g%n|X@!`!fXVmd5yMW60
z15`+~%Jq)FC_If>x|1My{gqc%q@ukeJYT#ZUZDDLzNf2}|IW!@(9LI0y1Et1%-m(^
zQ%H`k2IFzz(yk3$@F4AoAF4(Btl0CJFnsdtJXePaxFUj(7p9Nlr}8~;VTNq)#iWz!
zCLIYyJ*7uHAwU-_rC5E_C&@$A2uVMxp!)RVyWy`=1=+*cV1B=b5J&&N1xcuR$R`yz
zmyolJ9AB(`WSW&8YUaxxy{z<e3tO1oJ5jv?UB0=irIxN}e(iNRbxuVKX!d)?tY>?4
zXz$KK-mfose<!a0Idzx2j@48&y5PHjDt4c)9gYMC8{_f?w~OpKo3@AOmRx9Zgdnve
zEk_G$P<dP(K1`cvFc;sYyS0oCy@QcPTG)m7l)j<BwC)gizRHyy35fa_kSy%>9ozAT
zHHDTmwsin^I3p;%MWRKRFtx~8AdImGAaZh%@J2A<<QH#uT~Z%2T=^Yp=d#fRe0<59
zvlV-wOUIX7mx^fPI577dRcZ~l*#WrumNvTXOt+D_SIRW#AY7cvhgiO`GrKC|Tx`-w
zyc7gm2?%0uqHgp)rACx*tWT{1oY8Zuvv6G|-Z4Ky-09u@<?0<o(IGYb5q1R<oOtqL
z%L81`Mk;_l9yfyyW&sz-Q%lwjn!tbSV6I#kQUxW{H8`dtGnZ?QV09xMLwX;|fPTAS
zHT$r#<seGoMXcVuOYI=;kxQs*4P<tv!T;6G|G0hDikz>?)dI>haDJQQB-tB0%niFC
zx)OqD>y4g?S%(Stg}o&WIi+P^ehg5^`vgc7l9ULPwOEpDGx0>&v{zApi13W`FBSAq
z!V&cIyUlG>y<0WDHUd@LCiHN3^ad2;K?9^2ucU0ZSP4A?Y2MtFtzg1%%8r#ISMPt(
zB&=3vAmR>D(Xa7*Be+$N>75iWP(0ViRoppUFS2W>un|iVOUkgo$f$vIf5eTM<du$&
zjt3wFvIW;B>o6V^>%DMytcuCMhbybsz8IkeL)RbtUEeg!tSFI4sIv8lP;R-T{P;kU
zsE7f4AHoyo|Am@+NZME!ZQH=WKP21wC;5U88<kN}JvDV_zV%Bjt*9z0b%#hVpb)J-
z1YST!?IIGQREw=q<&k35PN4m0gR65<DMo53$WC?F910`lyh=oBbDpvn3dvgi!6eKp
z7GMzCEx<Ef<T4hgKNj)$r5V=mX99M`{QRN95CC9ExCWmP7VYz307LG9f$4qrON5%|
z^v7^|ry-eJe<0k$0h48`Yv{=XwvWu^)3pwn0G_lYttY*BWe9K&x~cjBq~<Rw&=1(4
z(wP+AJ{>#cngt!xFECJ@Fu0w?;{?8Pn_m50J1qQH(K6V@_9y6|pF_KDi_FMuG}0wz
zqdmffc0I6)+L#Fgc;B9+vvJ;yEIk-VO5zy}*Q8FqW2km*yW!Dp#6fhX1LJaFlF|fA
z<5a((rgV|V-kK2Oc4U5H&nxR0ULOoYVjQdC$Y%EZBh?3iwj6$51EbNHZDE@Hx(n*T
zhRky!l)<~PJ|7KU?;~0UEROvP7O<hcrKNE>U;Y0YFSaV}fc+2ysXOuHlvkKn&sSje
za>?_Ah_1upl>4JCsE>&oI3jZ+;<X9qtLoK=QYq7j8JEhGvzI#!Sm12SLPO8BZnOg!
zmx~wkxb4N&^0gel^SKTWG8>>e5bE<k4&e!WF1y6R6x95ag^f=m2TxT*o78-Y+q{qu
zr+<#eo2mh52|lJevLF$6ApGp1`6J1#67T(0E7da4=MZ=tX2!eLv2ZD^2t)Ll8Dp6<
zV9LCJAM)7!ydK3Tr>K!|_DzxcxF+cK#=a|p$hyBM&Jw&2%*3`p*_Yki@tP;o>IFG=
z1Tiz~MLOeB-frhAXfg?j2;{~=Pq6+i2}erWVTd+-k)mW#j32tJIF_$MFr4W5QqB>*
zT9+AkWXh51X||GQbp4M`R9%2sr_l0iV4mlwgChD8P=o5j2ns+SGl+Em8wMN|@0-c3
zVrGK<2?I>;XO6Dcb;Q<4KegPf+}sMwH<uEGHnG+SL>!T@Yd$7PmA#{)=uo*xQxAG+
z{6sIH3xGD5x_vG<yx#g*dMFJ@hKlQ}0qx}yTEF5y*bmgN*>yiVvsY_yymE%48<VwB
zpM9$##EUef*^m?OH{M?Vj*4ZPvEg8Kkh%T+5XcrzxdQLs+rqszzN*SgoRFclyXPO(
zH_Tqe!fk0rfGXOfUiIh7WI#mcyHM41Jww}B86w+R#-+XS<2Fq<x!r5L3OdT~?SaX;
zxJ|t3vlo%@B{9IRv#M_pI>rg_CW@072_;Ts>a%=Z%?seWdBJuXAsdLjnEilm`1`Q>
zN||_=^qm4<Y}Kzsu+lg~0w(jwzhk$-BxaEoddA;ECCh^+6*rqiJhgcL+)VY3=JtxR
zx^`G6_ZHh*0&B>)j%ejFq2L^Kin3a;w95pq<?gR{6NW(Gq2Zs(OXObK*|hdk6lFP;
ze?S;=F2rgtD#`Enm>ELYH|PJH;d7kPRB+BVZiATKoM2wV^QmtZk$_;&5NthH|6?N>
zF&6Q1dGJfoB`8z%_Kp-peFUIPncB$M4UpD?)P_1~%7bBYAA!}HkxrmqOz42`5_i15
zx51K8tSGyPR;|UEv^F5eeTk&H)j}UiJYSS8{h+u6LKB2$TpP0$e@6ZieYLl!YVIE%
zk|hFx!&IeCSAki`nfL3}i&OW-mq^vy=|WJ@qSzm~@#DRv&em|nOHhQWrfuS-%9=OQ
zhBAb{FJ|((jwY0a>>wRG890=b<}au1ls4)9&#fB>BtH1YPvk95*xyEUF@_>+x5kSL
zfsz<-FjoMkT}lv98lYz*l(h8SWE)OgoLh;L7@FF>XBHWF1Y{kY7dLG{{4)qNBa~Uz
z?Ye~1au@YD*vm*g=f=Sgq<KKj(=Ic3BUHRyO7|roR(=aT)xK0SOPS2{gp25zxm0%(
z%cL!Gg?+s%jW<IOwmlL_eD+pw)G%|2Amw7^G4BJarwUPh1H)7X1aOa{pd-8ep*R*t
z0!Iq$D=QXDb$Hr@!AKW08O2U6ofUP4Uk*=tu@0lbiW{v>KQcE61-J8JHt7yC^!fww
z<yHxaP|p)1&6@inyYG;<Z>8CIks-yN+{RY-e4my`6%9ozp;GW5I#c<vCA*tRONA)5
zV;j*FrtPueU(T+k`4c&jqd0hH3ei3b9*MrtP`4WMysG=o{pKT6cDXytfD<zXYh*(d
zSP*?YiHYwJshUr&3XjT1!wN|rp_%08h1PVO)FEORu(akJ_{VV0)M-;Q4m7X?7h|;K
zOVFvvw2iJ7?<lWJXpAO!7t~HJi<`h;J~Oo(8Z8+>DqT9LoOMnV^4GMuE#3^03vg4n
zQu~l|IZ`=;RHp{u5q3XhQe&oce2b@>Xfzrwu?c&Jn@W^+_aa(H>i7w(7~yLJLL;_N
z#~3NUljI^3uRWeHf3^Ti+&f@U>c?E|&W+Fnv`CQ{(zFO%3pRrkcQ;mmqnFDbV6}1M
zmj9`Sq{U(H(ky(7#el1?43KT(ViBRj#?IySKaeU~{b(=x9a4?f8FYMgZVhlSQ}F!{
zDnT#P?NW(|Xb4+Lx>Pi8a7hxRkiy>Hp@-R3EB9%b2d7s-c@$8gg}&ArWYpUOqBXmp
zhg^%(D32;vFOLDVD1sC(%0vPxudkUgE;yzc^i^1eD^mAkGh&3%P(@XbtV1s^L81l@
zQem*GrkGG33i!)6Cft@(zz{Z>-m@<5{{8jkLcONq-L3pS4^1Qet*=TI)C)SqT&>bN
zEi@xv(d^|+Y2RUA+3a;|D6Xu(gQdO2pFd^PP`gS_x(epH+PLpboOl+Om^RrP8Ayl7
zPOjQ&B)E}0I)r)s`8t2e(DW@n0_O(G`osGHj__#N<pb@{1HNDp7zpFICmFt_X?ESb
zW`3aXT|$X@uNJmnmb8jN*TNM&-kX5XYV~CauKwP%l17Q8WU0u!A!9`=R$=vm``<fw
zbv?bslxXqq9TaLk=}3-{EkTZY_*w4<d7)9T{YT?JP&J)<B9hUaJm9JhZuy2u2wrFd
zQw}rXJPciRiYCpL3tGbz;3;1dA<gBgP{jn9W5KIj3{z2O98I<qXCxG9M*H1!jSqL9
zjhEuXhX>%AbuPJ*NFKt79Kfcf!xUvtEp^Y+U&cqEr;N5xsEfxIME2*VHgOvPPfJXh
zBm6&u8A|m@w>U`INEOQaB*RbmMR@*|O)b)D0MkB7NAB^X_urEXKYJ6HtjwyB5>F>F
zfuwULY)8L_^FU4r<PhjS`kX~9gvUS&wuHOKlD7twq;4O8l@CH3N3S~2;J*&CaGE_g
znbk#jKZ-a;9_Qi`h;J~WC0QX*zi~#C5^n+_98j~yC>j*h0+DMJ&WEZcWU9^%@MouB
z4e;Cc5r&V)2G$x9;vE6Tg4`VQ;0VB&wm;{9jQj`KRg0Vskp>DM%(Hl`>m2C-Uo>(#
zUs22hWv~@gNfEjcrWgbo08C{WG&#!CieycmNVgUsu#U)MW4ZfCwaI`G&=QZM*SOF?
zcP2h|CYHeIAH`Th8uB#Mn~9x5V?J_Er}K1z8x{XKhH{?>UZVC3WeX_U9hmhe8N6{k
z>_$da2PWaK{!c!@PgX8QKN5Vs@1LsHttFr)PW{#6iF7-mqDf=9Z{(!zq*_3+E@aQl
z`7df<{_WXSsRXn>eWkg(2nr%zqN0QCQH`^E(4tLkx@$E75UIRS`>J5LC+{y{Fj!dr
z(11As8S+G;ut7MmNSUl^hMFnj`oI_;Uyi#v`K@ZdjkUl#a~hZ~-;!twufcBN&Vo9N
z9QnsEF1Dkd9Zj`tm-ffa+-VH%GeMBKPjb5_Goi+}@N{4Bvh|Nb^CWVI7CpNgrbCPL
z9i4>}hb$DtjY%q&o+ytui(`Wx<!{K=1`<UPvY>ITOGK$2Wq)rTZ#Oj-7-Y3auJ}b%
zm%>$8V<_yEu*=lL(k-O-%-2})x+_?U`F<Y3EH}y~*(gIkv-dahg!I!X8-h|}HSAVK
zP4$aH7L_=`>x<)BM4kcC_=6ns6w^Ygd@eRWMSBXVJAOh6^t#i6J!_`zGt-g!w;vy*
zW?F!&cSwp{q?zK;{C_0|HP-L6grNs@4|0Hm^e<UbER^*X=wS!>duhj>&jwi)7o<J{
z4v%AoxT~N!ugPK;`I%ireW?N|Rxt#aLoscqLANLHh~ZB^@IS(lsTql<G?)eAo*RrN
z^yfg$B8Y~GyJxS903ViysaJt;7RXXKR_phhCtV79vw$T%Dyg)RAGz{rpw{K4r6ADB
z?9=|?`JvjO41)Z(HrzXLs+KV#jpv%ZTs5HAaec2KUnZw;_(h@;x!dRP-|sfA*H9}U
z??U#ou@~<9kHg8jmbIr&)533q<d7t%rMgj;)NHR;Y*Umh6C66%wDO|67-Aw1GW&v)
zJtLAxA<y*o6U*b@z};Un@5vA7as4x1r%tFyI3tCs{iS9rl$tAc_u0h0^@oNO3Mx{U
z3k>Yzs3Zw)*-?u!nItJjjdY|CGp;N%d({-kQR06y(?2y9MS<x?)vu+^Qy_#f!-){+
z&%Z0cSoI%7O1ot{F=q#F%$KP$`HV-3fSjOK$LB~_A0S+|_;&6D&=Y=S4J$I{m6CEr
z2-a>EW=5r6-*jKB`XRN>C@A<{0-3*C4u`bI^)f9Cb!EUZ&A;xc=^C9iN#^NL)(7BS
zWai3KN7w@CtRS-HX_YTs0iw%l;;BvS+Z8!1q$POlv&VX_eq@}Q+V?)iTJF}KqI<ke
z?PegKEkmQLd4nX60YWk^l(&aKU${hy6eAp841>~xZfcrwbErb+l?+S`rdL3P<PMnB
zU!c4>i@He!Us5&*DJ+J|ewlvpork41Q_`pAFe~QC#rZ0L26hr4Y|ToOpjp}wdZKj+
z47ER<XZvDb-E_F8oxtuFAH&z;<m%oKbjRL*p!HSNS1%}QVmQr!N-pkO!2NS&wa&Mq
z@4ghY+4zG_UJW6wQK#Zcy2uUn>J^0zqZRWB#a@(aP$#)JHd`gyiEV3|*?IPIo05;Q
zqxzyhB*M6%h#ZGVJ`Tn53X})51>vVkGozS)oJB=>`Wmk!Xn)u%^X!LFlU~j*s-jx+
z7B8-l0S>MP1ZuoirW{dhO;+~DtyL2+CD!H_O*<qOy^y}0S%`U^SHvdUY?mZH4R;c7
zYuhzkL9bHU@fsU<DOl@W4CT3-mRb3$ZA8&qcBcFKtt)XzCk4Lml`O52FXJ9UQQ_5a
z#`9~y>x=3-xC(!wGDoBu5e)&)=WCN(JjGmOG~tCtK=4L*K{Fe(agRxo_WL-&&}UP}
zh?VQhQ;`Vu`<s(_x1VQUd=~>_^tmnBG08coLLEbo{s_|~W%WMVWGr94lxIc)kUl`W
zQdR=R0X69#6<)rXuOpt%2Dc-JC4mmQTN8L?ozO^SzbPO6s9OUf6@K7W`1tCvd`3{C
z+Z-<TETG6DkCXOSdNVCreT|RVfrzOJ)~bjkN1k$pBN<Hlf#e4h+=SQUy3gxF1BD`B
zNsi-)y4H(5ti@@p<u)zCos-uj+EvA3tX06tW@w*89a%cT`AHrV{EwEP8LWK8Ri9?7
z`qrD;?I(F(r?+vchWh<$&G&B>c=`&<;vno|4r}Y<sajhyV}&$@GJJjg0|ryDwy`S7
zF;RM<ibWj;SGpVhep|NNdiX7+K)YxR4?!%SL59e2j3b;0svaks9a)+IHBZV)Y7{Dz
zMR&ngHPS7gd6kPN^5GT-2{}g&9~dft(UQvv_*fDMk@W+0>c!u-7*06#jr-lNv{V*7
z>T==}<wRNFJo%EkCi@kSYhrfg`4;LY)*<uQcVe;P>CXN!*&v(GLVvMOL0Z@td{@~a
za+x1aS_<*(mH@*O%~z(aoUEoF2w_FtQF%hE!oN$Fpg+ezTi7?rrKb|}>vQ7qZy|`{
zBrr#RH5}3e&je2<64*dSV+KL6kl6~zUKUAFcz2T-y$51u4tbXIVt^@U0+L}SQaxF+
zevcF%z;|KyGvGG@eO{nUynGe<LBLq)T9JH1X9uZT1*)Ng)%Wwfd0X>Ax7W|$oG*Ix
zj*`^;9G$@|6^?jXr(@>)E>;-PS3OtwNve{Gr`I^u!e$u!V@^n+!ysE?v&8SJu&^DF
z_Vg=(BR_f6@`I3b>V3}n|I*+^t63gM)Dhs4CBTate0hh++!cmxCSw1Ca_o~1LlAM^
z?Zy`%glI<=59WY!JrEo;h*U-z8rzYL7DT+1@I7)Y-31zZhn`p(ho4;0s33T)xY%i0
zZMmdPx*)KwD0wL@BpyTNYdrf_v*@}YNzaOQRJ@H5`J^g`7>j#s4&Ob~#6tT5;SC#9
z@hh{byg4go@e6EK6@h-bupg=_oN6<YE?(D3XY3(^MO?9i)H$$mhYcQ?i=ea5Bv<@_
z!IqRuG|j|8&FqAslk~ePf6c$1k%wZY4$CEivV=~BAjDa+6gK=s@?F6VQ_%OZ)fJ0q
zZy+OFfKKK44^`UT_NE4aVXk91KxTRF?d>3W3!hc~Eta2oOSRX+n<@b}I`kC0b9GiX
z^ITf%KML+`ZpN*>@F|rW#tL=VG|9W*dl!f^v7Op(L+@yh_O9-3*H4aE(Cu$;LtquN
zejN9C>g<k2M+*1wWvQ&V0^5amS0zMR-}<4uHm+H`bbWF8tR4Fj5_v>};)P+MnsCST
z=(FzR{odQhlRRhbFBj4L%(JS>!$4SBPeiGg<7aLg;9&t0(Rv|2@&wP+hMsAXH=)T#
z6vs6x7kcva;zw$huc<#-0VpXyD(7760Sa+8qd%iFMz%Jto;oW8Hd7^e;E9@>|KNIY
zH2F5uy$#w&Zf*B6-dQ?tgsA75ootq?X_$?nL+{&{WYHJ`YMf#;yU6XSMCt9>wJ)%y
z6!UlxYdXoe!vTb6$g23BIf;$gM12*=Cmux%y{~8dw$vVihR3W~$iq004gCN3=lbtX
zfQxxYQKH`bo!z*Oi2KnDD1DAZA%m^THA<^<L@dgpB-^YPBXY0D!2b29@fBiUBD^Q^
zwCL;(AAAb?$YYb<*3o(!`xZ+*Pj#>9XSWA{0bB$1xQbhV*_$53gT)CTW8j1<zux%f
zR`?N~N`F8h7F$hFpp`GwqDXXcZ(734H0cDNYY-CW7RKwn##+1&zNu4^0ItsSK%_nl
zOnHMj{&}}e?y~Yf{Y@)ths5*NnIq02#91U{f^VYL%(PGx**}8RGXo*pAz3zm`n_T{
zGRd!UE}fU0r6}6P@pl_o@yHWM<6)D|*wH2j_Ifj+6=@egbwxJ(I^!u>9i#6{T=fx;
zo(%}L*#ym3(YVsc{Px4xd?tD4Iv`TD7rpLAf9j26MH9g_D$P=(GQ)!kN9OLH!Th*M
zHadn97JKM`nFG+!^?I$0$DdLU))K68qEo@|eu&%<SvEE2%-H7>(TbT4v3+|Q#?E)@
zyBc|FmH`tHas5O7YOyt%VQ&(9Uh35!t1I5(>{lvkmxmhM)ry^$PoFg&1t!EXs2?0{
zIrbb01<<<FX9P6vt~BVbz6q4sVvq@9P_v1)G<r0Be}igK`j2Y>{myIJ*-mT=ww*sd
z-_ayS!@H!iNm({U<R1r-G_ahJJWRrNQIdGQW03Z@-7ohowL4cw#?|(hXdhM+enMlg
z%}%}(HO&cU;}1LN;MWSDnn+I+--2&=s_!%;x^_N?R?GDY6ptC3<UnT##A6xnsI%^>
z#PaO$nb;3lzlCXyOo!n?qUv}Ub+pde7_e0J$37J3>V}Xo+vbMx5c%6Kb&{B7s;U)2
zepu8_GskY2oH#NG(_XEsnH{ryy9F;bvU1Zr1qLR%XOny?p{I+2UGOor?B0%I5&Adp
zXf*u8xXF7H*L8@(@}Kh365ShB8NZvS!W;$DlI3gxshuuP#aUlL|MvsjDZUTS$x<QV
z_;f#j;);<O^<qp`P$MD674-@kL{zU&hW}V`LQ!Ub{l8v!Ev*0xbra=p(6oX{N(^T9
zh)70vCya#`5x(~%kV2RB7qgZTR}c^3KR|tm%*>&%i`?j9yh5Ps#$(}8+v+=u5`+rn
zbs^A4gOOTgeUfYy)@2}OF;b+BRj=|`9~$y-1RdcMsc2b3V-SI+xWEAhf!d5L20M@W
zb&yi~*UIFX`{l#N>ok+CQ*51&`?wdbdn5&OSSd+(%NOJ{8c7R8o2(8`i}nxgbeSPE
zp*aN7{%T*^uU%MZbGe0OS{qxa7phOi&)DRw<Z`$*Wwk>I$iSIjAL-#HF!ZP_ip10q
z`Re6xdtT?^yk7j8dfWL|o!nA)o(+xEJU33z8OngpF(&Ct8)l}G@z`}dv9iqKC(*h?
zy&B@cy=&0Y%Nn}>V2~BpG~?A|hYZW$Lh1)U`W-Yy$(CL=8>d|_Ytw`oLJa8&)dk%R
zl`bZ3=iTrk1EZBxf=M;C@DZiVcX6@umMlf?XU}zSliH$LU614z!+S(z^+E!28qrH?
zVvjB^Loy6>*}QNi7K0R;g>N%qKNgJ_)7dufg%@yKEAPckJL8nzv{>`~)*c|)|6~fg
z{WpNX$dyeag0Vocm$K@bN)gXZs5`ZzWGVferYiAV&tZ7>HQGzTxZI+2!;LQ0{J_G|
zO+^(PZT?8dyl+jLA6KH{6|tqGMjpsvVaRw}B6JhMfWqs}wv+JfM3g~@m)+Xbb9YHL
zO_f|bm|J?Q#%UNHSARmE2t;S81zpy~?^t(pBYx2<*AZr-nZR!b@_=)~*eU8IaR@Rx
za7*WDz7EE-G)3RzExVq020mRa11yqMq(D9s83=-m@8ZM~oiC<wsR~i(Lo!4PX+lYq
zEnsBG0N`4Gi7!YWdM_{}+F6p8ih3~x0EyPmU^*QHbQG&Lc>pDMPTNA@rPx`nC5_5|
zJb!Mjp2*x5#v2I6s5i7+u~0Mp8PeSsS)#52E_xm#k2_r6V#s8qkzU9tnd*^k1j+tD
zDnr`>As+ehT&v%y;g;j1<AN{>NMAC@bi_^taS}qv%rBn)w}*@xVS=vj=3dSWB1MD3
zLi;}cpTMwdJ|u+<_u0?I-E9OY$~aTmv*=rsbdVY;_u3?r(N(cDuJ#~;XQu@;>=_gX
z$3tmdKhKWAlfO`ZcH0)4Biok(A$}?Z>%70<8d2;)@JZ;EjELMY{)bceX{2Y8hhd<0
z{PcwR+4<svyd{UapbaLx8aq}-drRUZRZf9CiTER{4HY9Lqf{iL)LC<Zw8Efhgvf0R
z4&1`Dq|Q<a8Rm&Kd_P8HLQ8O%cu+vxnRcI7Ihb+A596idLKu9XzA=XK79DDN5z|dc
zc5p}Sk(Qj;7;78^nvja|a``iR_xH?-qiggRtPw3Hi6=ZGM(^SnoLm!9i8k$p=p)uq
zw`5ACD?J}+k-mfn${<h>Xo>?5LMm)y=!J9nQZckGzF5aA!xpe#S>$FFIoDmol9UNQ
z!-Q>p0{%M4?5Cf-7ba3g#+Tu=JAZz1_-!(2@EiAG5__lT?24NB^Ne^A&j$YYq`z#F
ziPx>XsfXwXarq&y)hP5`*hX#m{Y5M_);YEcDwt$@vRiq)@Gl&!e7<MeT8_olJV#ai
zUU^>hE|B()$e@%cpsKjWO~TQLla-HC{F9q7)o~`F+fOdCI%}~gC)I!pO5e4%Oi>oe
zt~|<$Dii|7nM0&E8_8vY_`)uK5J5OZzCiJ+@uLoID18G+|9c+s%<E}rUpYs@&ksOr
z6K)l)_IM*G|29PK)lnrsb}JD6P;!gJMZEXgCTJ2hfZXFa1Zpjt`M^t8WHzLjslNu&
zYOf6fjP&LJmyZ{*4#o5<d2N8O>u7zmJ_?$2XJi_p!!pyZnE!$|@R@r4o*F&3Mh2T`
z*NxY?-ch>%aw6vx?gL+d?3mJVT{3|5a*MFFx}2_`w#S$`>{pz|xI^D4-b8L$-#m$2
z)2l&&!_SIZe4PFL=C@&&dO4r$|K2i4dW-MgZQk{(pm`f$g=vc&@2%MPP!IUzmR>hi
zNcBW^`JMO9cwDz5A}v#eR;JvKr*RZpF}7IIvcHxZnUp<fV`ik!r`t?DQ$S(}8-`5s
zw$$$Jregl-kHX!mR}s+dXdU{}EkXT9A?DhS4ccD{@4J9soTTX>3Ts$5z+>s?VXW!$
za~>@ax8N4~XYu-N1EC6RrLc)1A>7kts=j-|`<pk`t^<zGyq5l#SOtrpM@!FhatA-1
zyHbeky(iC<Jo+c+h)?a3j0{E&K^TlmMXD^U%#niF>8dJQxuI^eY}k9>dKOcTx?TMq
zXh;M=#Qa7e@(vbopBk^O;Cv%Nd}~uI4gECeO#JvqhuWXfA@-Igr>Z0Z*|N&2`Y;AB
zfb7ZO|8hOYHa1f&>1xF^b<KlHvhcv7g&99nz=rR^-VmroI{pDYP_cjliQG4>FTYLy
z{vvfb*f3;h{ie+T=|3@jt`GK)EU__U;3FOtKDA&UE}eMY(yMd=0NejUa8>Rg(FTb#
z!^KZ`LIhkp?g;zqL9eYd9MhqO+44RGuiuJJSuF=;rbe0&A5@GpU`YrDwu!!6_lh0o
zD^FMDJ*Lb5!59;a%T&xqkzeQUPpua^5mZwD^Jjc!yq{F#5;6vW$O3USG@b&WgpD|;
zv$?=L3)8vU0#`-rtDCSoPPTbSq=%a{!j)K$Z5J)Ua4Zg!<_Ttbb_SysuQC7qg(4fh
z4`H5H4>>DyJu)8gPCW{2ar`d&!X&g>`$+#egP_L9X}m^V>a0$aN(aYC%wYcShKBUD
z(_jWa9wVT^Ssdnyy=|xU;$%Dgl;}_k|CiHhUr!Ir8Og|5AN|Lt50l)C52y%!^=y_o
zNzd-d_rwIabSjE_m`d14aLdr9rOJ`m5!db{RJ=yNe||q%JPq{h1-7b-WS_DZ#WPj6
zQ8v3`uL$iG4A;`c&4gSvw)}sJD;6}MDs0C5C}SS--PWZZ{i&RBT4<aCz{gU(cidP+
zsz^F>tTXAszo0VNLn2_d<@%Apq(J>BaI5%}CIC99<I>K-k7-xYdVs+HipxfazDUr)
z_>evC6A!fi4qVO_H>o%FapnFF1Uh;qDJ0DcAvG#*_1V_oPayUdYST}a8bbGiTvpGa
zQKKqnkxe|7<_Xc*(ojN>{vS{L(j3IU#%>oHlxD13k9(+-JjH6TL4Q@9>X=A*niNqN
z&#b1AXX6)-UVwu8Fp!7p5U*K!h=1^Xs^C_uhGC3N{88XY5>7#b<9sXiZ`N~-%lk=n
zg5n#ud6m@NrP%5^kKFE}a<V^!d`0QpqBzCGt~J(NyvNBBxAcY0DaG>E3w~35+bnpi
zaXAn9H62s;FOQyzC)|fHgcAHZ)M#}%e2K(^xgXe>NH!tjR~xX!ZswgkYHEd5Xw2yy
zJZy-<^JkO(EoxbA?~mW4J3QY|W8DfHX|;&*nmrkdiKlMlwl;;#aX@p!*Rl=H3m614
zeBX&j3E>Cqa0@)}G0v!X-9q=o`;2fvJkR-Yo1GYN?)-lZ#{Xs$^P&QucKYVe(lmjm
z8(N=15S0CLSLD1x3ef)76aReLEboZLqhZuei;LNh@@{mDy{d=FOqH1rg*jHHpP)E-
zWbv!^fu(?)>7%Fdl0v#>Y{KM9DkMbO%iGGI1z~KlIb+f3<03AH1sdBj{aczD`}E1W
zTN=m99RXBGQom1q-mF}l*huJ9tmg^8+fQ6MX~r5g^c9YXR355QT$+3oe9AxLgu<@F
zkjfo+uGFqjJ9PlrX?RVCvL<y>GRY<*UcwyAiyRA0gkkZnDZg7x&bacaZ*jIBZ!nJu
z`vD&D;5DJQp6cVac^hiDbq2{hL0Z(x)?I1D9R%%`r3b_3N$1OJI8^^AOz;%%H;$k7
zV%Cu<TC+t*K!jgcH@2%53$;HipsT9xjnCA7vjDDi17{T~TC2#ePzM9bt3`gqG1FK6
zjmKwh5Crk$CV-U?3KU34YD`c-)CLP?tF6YT@k(><E#r~EBJm>%4;eRcSGw`BQWW8y
zCyo#0vF^gAtL#2Mo;;IHcqu*lS<cvn**xk2??)rVe(HFBIk(*UsI>|eTT)jsWon=y
zgBRRaA$*oRcFOt7c%rl4hurME-@vldaX?fx%?>9>Y4R$G+~BOAHY|LU4Sq(=dL`3H
zSq~&vA|@(80c?gq<fTf1qG*Wpx()*3e<EQI1U+fq-dxkfrClRG&i@4OzdXjg#fYGS
zC^Nzn<R3rUJg9&M2vRRt(83DVQt&4_-<DlvK?gpyVy=1OJOus(29dyw4v)<eL%jw5
z0itm3q=}~BLOOM|FLGY_5Qn{w-}uz}F_Ae6HFBKBC9fK+Xg_M_Mea^%n$`V*;PH>k
zv_&|Su&WY0uZmUksfKGtwR_!{aKUBHa_VgsT;+!_4DitOOj|oV?lP|9n$>`N*OTfL
z$7a0vvescZ;2}HL6+8Q9kk8T5MA<BJ;#F=#EVFydDgV-45}y(B7MtQ%smp$gUs6-3
zZm{e^7JVOtQ1y3L8(Y22C!S!4f5-7qzFpw<I>ry}6nmE}a?y8jrCV%6Tx(%4Na~=y
zH9{P?Zn~d}K1_(P$1qg$RT?e+`=jU8@gn5V{lRy=g{HVKQfVw(5t%WR<%eg{b~qSr
z?0hIj$JO#`4nJk0KWYfIFMT6d2?wqOLdF=S@cM^S>4!8}Y?>iFQwJe}mfs&yFn;i@
zMp355xmWy03vJUuYa=Dql4P#k6mzDn2Zu3o*7^HzkcCO$j>_D^uOCD~{)_oEn_n0n
z6?uEYM(3|j<HjwL1&R&{!qFb~_Oc(0M*Qm3SD#G@^uOFm7B>%OkT%<52Wh$GJ;oNy
zRw@7rkx&MH6fjSN;D4q)5Y?H1%sSJ|6fW<mLOM7{4X@GY@S@lxfnf!Qs~nZRb5gdS
z9OcYrF}j05I)^pyI9@$K5E>8!ZbjA$jW9|_cClU_XWGjZGc*~2Ku3{Xf<Vbh2TBgD
zKSI<&>Ejf|YGcmP_GXMx=og@qPj_#tez(1h*sM3Ewr=`?4srL1ZvNYQSNGHwxpf%~
zHn|CGYf4DJy}`V=lLTetL&3eEH0`-m0ceT9)SHd)q@&Sw6e7V0!C#GFaaUrDfJSew
znZ#q6b`;@ooGPVhHZNwpK-K_`H$()TE?)5(f5OXDeH{5HIns`D3f_OVyEo&s)vtxN
z(n9%1QHDi*PxB`__Smc`LU_B8WEkZrF@z<Muu&#z<))$Br-zXT7Ws0cFxEycFI|vr
z$pi>JT26AcSOS7Rw~9M*y&6(SthX>C8XzmJEyS1qX3faLe)%Uvpf0XVmareaGN}!2
znaEQJA;9gwH|A$<atV*Csv}8yQ_C^rk_$Ui&CZ7eIbuxn#4bK4|DG$E7uT^FGE}EH
za*mTxeE+ksCP!(!_=5`TmrJi6hnt3_WeSV`JX<_-kIrZ6AHkMpXVneeZ$YUbjwFdh
z*;Hp~{`N7X!BhmWLT*As2gE4I{9FWo9_GIg9S~e3vD?)7S9g4{+8=^x&FJ`hsv7C0
z4q5*mn1I9yt;BY~8{z}{;Ybau6hh%|++(=UGy*J5<YSyO!TZ1E+^`2xN+fHAKrpv!
z4?KK#Mt|p<w-dxLU{12VCfB+MG}juJE{@mV`g1Y^-h(@#&+f=%vL2H;U46*79Jd!4
z76ChF@)T_z9Lnec2Ypts>|jx`=!(sT$D$MuAR^_SbiB#3l6gg;rgUkRB7K_pRff21
zkbUz@yD;w?Y3iQS{U2%ARi=&~7gV2Qd#A7_kPxGF2s_oV@9IoFAOclCkuwaQctE>+
z!V-3HL_e0y?`GMR$#7D?Qibpzt$@K^Xjwi*++43I(Qni)h6fZowxNuiJYP_%cW`fm
zzvSq!0R0vsxb0CJ1?wwSC>EvxZrzi=%AVcqb{?Ypl;B8vN(p006x6Y!Z6belvT9#g
zPdbVh!_#My@KxVS>Gl?6M->Ue)&&`$aDt|$*B1W%A3eAen;3)|>V&j|>-y)6Q!NpN
z`Fl7Q_hTglxH%a%#UK)62^}jF4-n<H!5nUiMi1DPeuBW{A|Zt@NWmMBZ!nzvNdK4K
z=80Vf+N{Kd;?B2t0w6f;EAJ>V1dv>L10@N?AfQh_eQ)|1qrvjRo@s=f<ykCik`UBj
zW#-+~_RmqpKS@ACZ~?zxVPRS`)q92lDx>^_twH6rUQl|EH+A@9j7*sH6B?W+2>f?R
zsY35r2fv#-%(^Qg`QIMBUqLYNkxHf&jM8PAOUSJ#3DZ2LCv0a8z&ql3h{>9czW9qP
zQgvhNS!twpQM&EYFD5oI#C#as`|d%kfEy3pLQSh_f$krnYh?-z7a>Wk%<_3pp-bwx
zu+$A&+wj8J<qOdr(n+;#{AS@iAx}ojI>o~4YBtm&<q_e8w$$-5DlE)%5}zsNa^IcQ
zWfrQ&34fM$OxJAn$RT3WR?1|%e}0(n@C!$W9b{RyNO8uthl)2)m)7ywX(8mA5knux
zLo!loRSx&bpIB`2<3Y$E>U7><h^bo%*Derj4k5i~q+@bw{6le|<_aEH5*-#qV_-4J
zEgaM=cdPrg3Co2U7^)m9)y58I-VmsW#<MbC=e~m(u+xFr<%wxs3br5;XUYr{@BpHF
z<U4DNjSN*i`aLc1kO-F-pXyN;F0JUpJ%0myup}rYgWE_9;Cqd24;cw$lDb4z>Yr>K
zCM2;eUr-e2cD6KV<VPX;qUHq))_%Z;H|u*F2wvd%pG*mx!d$Ud*&x?F*;%~Dcr!g1
zu;Uy-(J=cT91x2^HwwG&mEZ?so{$5pIrNroYPUI^TKepxJ!yZW#@$Nxc<)Jf_!)4*
zt)v*otdnpWOcE2c^CKV`>;AO3kLhRLOFdMY-p9i=1p|a(Q9AbOphlPy?X!B3%Blbw
z!})Fa`}eG_`F#|pYzO1BXcm5Ku4ETUvep?;{YlKJc<%?`-*-Tf;5M?A*Koy3^5%Jb
z`%B62JVk_xBDE^XwTM=>`i$ea2gkroUQX%1qS`2qFhZ`_iZwdcJ0RDaB$lct@7RyT
z=azn4L+by5yLswaA{`{?CTS?#Pb+nZekw$pS=`$=BDL-=4NQZ7n%3KTEis8}C2;)p
z+BW?p5Ns~41GoF&LB95(9EGjr6D;ym0dWMR&cOfaN<PZwG&<c&H9-Oh`U>ct()%eU
zA#R;{8vt(R@x>dJW*+ee|1JNs{O$-Fxj!i3J;*Hkl7WooMJ7^TC~CaKh%99*t%`cD
zvFvn1hQmN`m6R0WSW(~LXkGEavv{y6kXnRc&`|s_AKk_T?gWx<O=ghRwaR7Vaz2QF
zr(Ar8wXHM}!QiwM3B*VWhz29}I7{##b3EQ@FyZdUzmuoQ6s^v9Y!hc|Z>Blhy=T)~
zsnD#ZJSI1_gXjIvUQIw0ox<&xqhx|`BDpz>qK@Xm{R^&1zsA0&3~j)?3NG-D4tP)j
zm;UhjY@?Crwm=dq8D-_vIHE3wk(wQ^{dHhE`|^v~Y9ESEg1tpT?_v{V5KqlsG!-t;
zc~yQEeeF8eufHp`{8fi_RWG)@ie*TO=ei=&kKyf-e)7t{ikCd0BoPse90db{v2WGI
zd)@RPKTuzcMIl0)qT(Kt1A@Ouwq1!skp(^-2=Nqmefbd$%|S}KXDnHi!5AXG`)z=E
zN3*+HhFj+kG?qkmE9SJ&eI_kc#?3)bKw#Ltw7dloPZ)G@7Vk%%{oM1U03R*V##Fs2
zPGc%<Ib${KK6d3JI`CNj|2MvG+mZGmAbrj5_<~%Y0rsK&q<!9wV&91;qM7<UvVt92
zub5)Mq_1Y?TBdoXy~NSguz$Lc>LEjig+u&R5FKpr9MZUM&<n~IWY#k~u+FN{P<sn!
z#LQ3|(wkjQ)_8%3AlssvVMVnR!#vnmm}8P6)O5+)Pg4u{1m#bOyVvebC6rEoii=3r
za@m}!==Irrea%b=V_SPrtNmB-7Z0`-0h#Gw8Q;vS#KBa-o_Dj7d)!K|6<UG>^L&gn
zSi-Q@_^4zu8Vhiv8zCf~pG9*C2Xe@a1x6k&$ZdWhNb6==SrXs8CM1i%+Uz3Jq8i)i
zbwW5&AM??%q#ez%?#!DKKzkh$-;TR&u(O>q$Fk-Xk2UQ)y)Y*^mDbd|u{SgQTi*s9
z#eRfgcOe(BQRdd0F|&mVg(YnApk(DTRxaCRzs>b{8_(V{vZ9(H5VgGe=PM?iwddZ*
z{<lD4ITbPdbP6Bvkg6ec=CdC_=Fs9<8A_U@RWo!0Hy48!q}6<gev(l-MNT*hFs^(n
z{v9>G8HMjS9*mo{3P@R2UTaGy=UKL0)&>gmaF91ONw~v;ItcpJpTBH|X#asgvhnSJ
zF<JL7_1uKBHN?y1I9FGI8RzM-E`>ArSj!*}tod9Q!USu`xKou?Q<CtL&M0Y!aAi<s
z$Rjd^M-y;`!j63is5Q1bqY1V!1MN?-P|^1Gqe#)TGE*+JSCWWfx;rkck0E!karQf-
zAtP<1@0vmgLl0J~t&pNQY+gv4%C@puin6z2`B_e<@dW9-`710|BCY9f2OXE#rxvuP
zuwnnfOPM}xoMPUx;e2B?{s-xzeJ=<3W6R%P5q)Y^_rW)|{>Vh<bRl9bs&T2;B<;4)
zo7q^0&vyFSo}2oVuP1jUN|0{~?}f;2V~e8xCumPuLBL}mxn$zwD_j2c?`MLVqE)h>
zQUNZvgx(6zhYNxw=RT)nv}kwt1#95cB(^xsbIK*GZ%#?t;p0TK-oF|O%`D8vnZyO#
zRTQi+$lKAgS4A1zEAZg)qM0j0TEkyc#3P~Rv+>kHA8u|l2<+5gIzbn@x0%L)KkU2P
z(WK>J%siC<oKk$!9uVDt)BE70m3gOSCaVIT{>3^DrBciK(pbe4?|Y*r$lT-6cO5lk
z9-&1(pZG&R-u&xWB4qWzpU{e8tc*uSiNqGEVcD)+tWkShZAN(Bp+V>^myEB639^wC
ze@s(keN7A_U?7hWCq~L0O?>dFoiQ7&xeyfoKc)~@f8fGgY$lHW|GurMt3>!E=FLb^
zUwONvI_#V=7U221YefT}|L!^y@nWucR)(?a8M!J{!Bx$psiJ_2tHIJ=t99|C_mV-e
zuPKzDGo}&&0~uv_oEcUUaQ>FJntI}UNYVklp*l@~v)Lv2LB=Ih=}o@9d|F))iGe+Y
z1_Q5lkXYmCrM<4tQdXfQ(YQtHrbe$8R4eHMzGs;+xV^W$w5#!zXjys0wdZ}4X=<L^
zKW$V|dF;!d$nBP;3+Q{Gx)EnNY<MoNCmAn|?B6Wj*O2eyX31#BWbkUo$@W?d<Dq?f
zhQeSKYCJQA0P*f!!NMFW?XC*D0dIK_iKjQ;q{aIv{YS9j@|Q<9BlwBr@UC9zU2}CQ
z<mgX-{6miz1rIc<P9u5$7tDNxY>H%lZ)bs}g|YQ~u~Ags3AOyaIdQi9lx0+;IxHpz
zPp4;B^z<TP%Qgzb%RQ^;rE6Hbl-xf+PYPI{ogK;ICtVyYTB2i4Ar#dgrBq<1qU%GB
z^k{U|$9moo#==&y#^nq{7+sD{KOG`nWz{zi=NXw$$VXq6Yh^g75n&r64&*G=f80}-
z=!Y-Al2KFZkn{Nz!2NrUZAXVRq=|c{)QKI{2RcER{jSBd)#u_==#M$%wkIe2a$!@W
zo^WzUsyK(8ykH+cDT&_Nh7?M+(isuQl?WSMFCZDQy7w^Y#Ez|@cQkQ+44ShEXS7v%
zW#84I^FoXIG?X>RehVy()2vIUAbN}p0!QU8`ER`L-*kVEiaYi?=y#Ffx)^1o8UNip
z$A|>T(PWoC{s20TdZK5WjI0%!9#s|s!R5xO2I_?9*2J&BaC59_7+EFZzjVgj=705J
zeX%6@AuG?9nHL4C#N%9uQbibOHC|IDERB$}K4S@SLdcpui|(0!D4z@~8&70OSa0QS
zthven7uG3H0)c(3RPM8R`OW>S{iDcRldH*u(69=f%cq1sItmrB8ZR_zX&E_}uN_FV
zf<`k_J!`ZGQ|CRCertR$+FW=&o$oW;+dZDs2n62SMyeb%Ot-A)o@P0dBE$z1QH4Q8
zJAPjpRE;F>e-r4e7u#|D%P$qqslTTuQbjHV)<;e1Cq(&&8#$ta8zhWkYcGecj^umT
zN*`wYC)}_eY1Bm+22@~xfsrT>&xftN!};k)D%^<#dqJYos=I`#ri1c=FhUyR(Rv+)
z6D{=?=wZy4Y_PE47%qxV2pJc`gBqznjEjbt*y7zOiF`uq{lI!qiZtzqvn%Zr$2UmN
zS^3?k2{On-+4b0zC}I35I*Hp7E{ECWq0b3Xw29YvpMog*dCyl{By6>?UO>}wEN37i
zA<f{c?xEY{k^8rYKkG)3Ilx1A%d8=4@f!Ud4P^9!3j}I8=5T3;teY}Yk>U@(Xqa{t
z6*pI92fZ`v{FO%k(~|xV&ht9xzo9;)NDcHoGcmzf>{aASFENy1m;e5?``~&Q;86b5
zM>^e<DTNX{T*CTei?JBwJ`~+cAacozjp1a&X+CF<?O82cnaeY)LJQj#9<{o-o%SPW
z5-S1zG8l>88H_MeT{bE>6mAiavV2buLn(tXukC)seeAoaL@9+47>aUoma?QlaJh^K
zY*k$+bo6_0q6fvdtT0I&or7U-uVv{k0v@~Rt`7DUhv$;Nchd#dXV=ARzmWVw_|=$|
z4Rg7lE!Vp=-la6gU^?c)>3=c%v{uSXAp+v9Y*Z?mpaSbl>euX*m#};Jz1rZXupKFz
zyxDh7AT0bHXWW)AZ#u^PqT-qR<W6~QVBE_L(^+p<awvc0>O_T)7mMNcsT0Q#RriBv
zPe-Y*YAZQwl&+H(rnO!d^WhUQH*JCNGsT%Qn|d3qJpMyzliS#Y_1VY#c8PO`_E*Ca
zr*6AOJ%{{VKi%l%VlYB*(Fu(N+VdWugAWi}Hn$i2p<l}#uulCB4r2vo)BV@z;7{K{
zC5&JS1{nLBk~k7svse{L=U<wW?mtuuUG$ru^L-T58GWN;j@@7{`#ochGkTV?yVAur
z<DHuhLVa|K*zkBV^4ys3!WqBZKHcd}*fDt>^pO^#$q?m9z|-1Td!oj}NA>oe_3F8X
ziOlz~>Ia#zid)tBFgAmf9>?CM>Lz1D*GiZxwk{#RqW%PE^k2}qY}V4a*7#d0?%Q5}
z)U2~yS;<qnH+OY@!%!i(J6Svlo&Hw7ocE_;Cp+qM+rmq`t+GG0H=mEQlrHPIE*-DW
zeBHA15e+Pv1;;8DzB-_as#FhjK&e8vdmB$kyk{p*ZG7Cwt|Zt5O`pXeo`M5Bo|V}8
zs+vQk`y=}m_sTitvJ*!f>BVbV8f?aj1{7v<<Ov1eL2p*P1FhG{rNTtTU=D6F$?ax-
z^7rtH1W~|NNWP$9_V_01`1y<i4ut8nuczEoinMa2ydU4*+;i6Z#AahZ?oQ9Iz4Ejs
zTiIqqmtvg_e=F22m6^yWz2=Am=aF;uK-AWxZ*|)w)j^rwlhiUD!+z#v_Y{q?>tA+=
z$e0S_`O2g?*3b73pPG#Bmzply`?#0LII|0@*(TBZD?w9r@9quGG}5t4%kNBEkU@o_
zVf3L1DPCTOS!jwjbu1pwxK>o4b%*@B;j|N!wf;Jd0>3WW%F;a!)h7(ecalZ7*FUWr
zZa#KByopf0RPN>+_$753*%L`$+t&ff5i`D^0?Pi=S&k^a%~9X^IsA0d2bj*SLK98H
zXx}L(7|?JTq+7<<p>~oC3TE{!XpU$h^n|izJ1CxSU*GwA{Z?6nn=(jfzsTiwforJI
z(xi#^_gK}Hz_C90Zv4KVv7(31AoX6yvD8LrgQCFo=4almZJmS6)$R?QYmJ!iCI=Q*
z<7Wde9ux~YCvI@)DjY`A8&C|Y#b?Cdu$F9jadrDzOMRz?;F0=?M6u?Gh8Ry@)!no$
zlX!O<<rSijad&e*QJ<*8PHDrnQmeM>-*Ac*i}oyRN~ZBSii-IL)oYk%Ng^6|m`GA`
zthUc~4Hr!HqE~XXRMury+`Y&eyvPqHTwjXr=PWN~*p9#BZ}Zamix8KUp5(>NxNF66
zYfj@+n-PLwR@0Zwj=UL00o6Bm<k!8$bvEs)9a_iZ;|&LCON63*IE<eTr`M$dGY`+i
za4`46A%x$!K;<~`B;Dq^Ix+6lP@sG3O8-$&!G?s%t^KA!|A9MtKpVuomVEmXMwjkZ
z+cPnE^7ou~ei3y&CG3;E0~JE!&XE6iO?@@NdG_9G-y_6MxU=jO94)VkyuDyu7$s^%
zDgWc5Em3e^ZM%$Xq}Wd3Z9L5zWzmy9ycL{xOGV*r5r@aNDP#)SI!UiG*Ip$(F1|N+
zoR{!geb6{5R4KUpQ;yQ_s=NHs9Swn37wZ$6ZpLeb&a=nW8&Yih%6heD>YjZp-YNkm
zwKH~!G6(jk(a$)yZK#wY2`5W9mrITh#lAa0u(#6<wsfMz{*>3{-;_a*^!93^qJ4tu
zJ_4ED*NrdbH(#Wl*#<n3NfPH_+w^C3wd^kXqptxuZc?RY(ZKbY%!j&^-YK~*TQ82a
zQLOaB&lMWauRN3XC_{CbXJ`}Z5ec|B>M5C;gw(kH#=or?kIxibZ@Ha_ylA+g>F5>N
zs@$(`c+16VaeKGfq~WK9dP{6|<E0nXa4(_JOhEDo13Civp=&X2V*b6Kj3XG}+{}Z2
z5E9;}1Sc2DL%H<#sAcWIBWn0^(@z`<&hsh>Et!nJl=c0rjkD=NROoTONiAgJ&)DEP
zF}7Frj9wYVHcvo(tya>A)!;8fhUhMJ^Cy-K@~qWnw3Q2uH=k3S$v-}dC(M6e)|+d9
z8v6@E_ALJ-`&C_=O08}7U?xr($>F`?;YU%#O#89VildsG26v};)p(a@`c(pkHfV>L
zd(W32yTSLxYKcqSw;e1dh65~TjT=nADjeJmK3)h&eE;c>J&v#Mc+OTpHz!JI4(u?o
zj=v_$)N3o841D*8j%mNM-Z)!45LkATni!uy{jl-!<fWZiy?^1Vn2HN&>h=P|=%r%3
zxX20FHZ<$>+T~hPKWhNn#mD{f7wOi?qYv>+6>oj(h>X^d$8tk>=ig^f8UZe02zm5l
zrV%#eIie0e{LghH2Y+7!cEX$ok*t|kZ|d4NTVI`WSJ(BOZ@~Xx5-oZ;-%QA}&$oNB
z18p^SAEjz^|Fq?qD5ci2vsP`}n(a;wWr-(b*`4@NWQZeZq7g|-EXpc<RPs~_ue6SN
z^dnuP>@HcncATlQZr;0=gA;QMXuWQ#x=qTl$Aj`pZMU(kBf9A!hWRt}=DPEzL8OT%
zbQu#t5)H<7YLOlna&oE9q<TE*VTV%v@7205u1EVt^QXj*JEOQ|jz+!ZBx;PeYPHu1
zQ)@uxjhNbRpQt#DSerzdpFs$pH^%`5fhLj0mnz-9_-QIm6=`4c_m}CtT%t8HaGl6}
z52J=Ba9e%m!=WDdpDSY4Z6ZpU7@%E-5O6*z7J=*pe~U5(3n(&G7%XPko+01}DHsLN
z|5L{C!23CKCz1CNsMg0Uwd$xh9}fN>X<r#uWw&*$hzcqaBB)4+bg3vHAt4|jE!_qi
zq@^3g21KN#k?v;GU=Y$$8)>C$Z=_`te)9&-dC&Lbyw`i3^Unu(;NI(AYtAvpoNJ7d
z#~V4?jvw{rd4hOD69wnSYzL%g@Y;N@BOCM_FpGV&(={c9CQl0+*qiDZ#k5fj^99z}
zJX^Zhn)-se5J8ID7mi#1DhVqXkmK!5%4>}k?ps@1+l=Zpj^RCVc*K|H!l(K}86=9C
z47qdF=^M!@$#TZwJC&Vx;){YcnZK1(76+SkEk6q3icbo#?<T#%6f(Od=S|VD`j}hC
zOFww+HI3#a<pR91%Dk&o+`^}DK0g=poVt%^nB_0(^f9uJa8W!Sv1bT~ooswmW0|1y
zuHOl@Q``{0cHCLBT<?@8g=e_;<%zTLIg7I*i;`^xvMGD3CM`tZTXGLpgR^8vfokux
zo=}3b`}3siAF`Q4a9B@^r^xRm>8IkyA)7lL;xKT7ZRbYbdqLJRi0ga%0;(n`r8Yn}
z$VZ*pd(gl^RV(qGRG=Z1!FP>g!o(~(cf<YHbnsRsh`ZXo>kWRDg&HN}H-m3}Jf%C=
zp_LseoO3%x`GTxp8qIlw9G#WmhuL|31?-Wxc|-HGiv}|3EgA}|B0qT)gg<cK3xg>q
z#xnUTlWIa(bII1Y?A-D&(D)7BEw;uaE<W&=&D+%t%BSMe{<%8MSwsJ{4jaEdtb3(k
zu6&A2tEaIw^17nfv8G_xzNkpmYdST0Ib#Vad2XjQ$*&AFvTEGHE{o{e$c*AF!!h;@
zZB5QK)B-m1?hFHctj&7fmOV;J7{Qq;H460P%Dw42q1>E!J<)REmRj=V6V(_17^0ks
zj#maA?L|U=CrSz%6fBvhNk$~w-o^`k3fqvFDu`V?p$*xAr$TXiu<{TAE#RSnOZg7b
zcOes<?RXjxe1WM<n+bhbc*^Bc`R&sFo=2?yQ;C9R*25eXPkBDx_SSjX%htffC|j&7
zK*!xbQ)s*)@23--3~IlJHHo`|!xXySNoTfQwtUQ^`Aed)T6>C{!k9T>;#MwS%@kX^
zrr_r&0|k%z{(A$C7Dg@F(iUovqwDz6pOu-PJzVr{wpv@>bHt1%7@f^bp;{#CAHG;#
zw&ch)yV7&7@ZE#6r#*So*0kThWp!<jU>0rJsIHq?;>54UQtQ-)6kg2J^jfnp-D%Gn
zZCn;<u^rP>ZgE+&D$I_+7>-I}Rvfa7FVsIGf1a~AIO9pTHr)J(ioIufJUTmGkE&o8
zZ}Xz+cHYBqeJgg+%^zJdGgi$mqOZy>;8kTj!kFPi_otYS?FB#;aX9Wr^>5sMCH@+=
zq|>>p!;<?M{2%#;<qYg#g);L1$4*TGL)OBuIf62t=DCMe%<`)1GtnC=cjVe+s25iJ
zyxOWyXLss5{L;4%QRp-;FwC}bjN#g{c!wFBnmc#zn30832HWX?OXLZnC-XFJcD_XU
zlF2dqt3+yW_%#$an3JDL6b+%{qnGP%{$$SW_Se_O^G?nA?lfV4j8&LI(VJ_o*L`%R
z^(LJ5Dw#mI_zRT`MX$%b2WgnA_>Z@B|6)4&(n&q3=RK1b!?;Rk(L|1&=K=yXuc^oI
znZ{G5+f%g-+KHyFbvtWCSw>0os9XA7!+n5>t@f<K?e9(aYEu;3x~Q4be6BtD$=ZgJ
zVy|gF+_bw@*y&zn)<PX!?@vifYa^<sbSsmCr}d?F=ClKZ(Q}OjyH7G=V^-t3%c3Gu
zlAE%Ga1PtEH;XB43y8)sNWgGATe>#d5l$bVGeu_?y`Q2y>d5s{kQC*%87Z>2u_@oe
z#{Nw8_Q|FHN%i}Pi60=W)e)(RZwjB>esSA3p8X*~ZRNOhk1>jF<!*d18`JxlFV0cg
zKg^Q-jDq8L3ym%P{W+sTrc%U+=_-B><vwh?iOF5!+IbuoER`)?#f+8>T{^qebJU6W
zP(W7z{(F30a?_E4J`Qzr+MH+Bj}$a7G1=VdYgk&<9Wz*^>s`TbWK1z$ld@bJ>ArxW
zE-5u3D!!YFS?hAYGj@VGP8=f2pU8DIdST2we8VMA^UHE1=O(8=Q%1)vPorM%cx}`b
z+uy`Na@mE(7Clwn$>OnDGh1pFkJ+0a=FuNbIqNAl<DR+e&X`mEP(2=xBU2-G@slag
zsTW<#^WwT4H(;V;QBTQw$inMkn%KNPpOa^S*L3gVBiA^TmuukH;+w0_sasriJn1_(
zB^@rl$-o#*(+N=(@}gxw&lPFuh~-RQBfo6h>8i<;IDaeATVVEze1XYk$u7;Myzg1#
zl8wH3>XRb-`L8A^8cQ}q4*Q+X$5i_uVxNWsBA8HclJG7P)F)21uI`tyH<0?FDD-6%
z(U`e=xIFcH$HSV`nd7@R{0PaLh&z*bChky|51x_Ua_jVPcp!-Hj!~z+#ox{v6~g4J
zGTkF8gvGK`7%*bodTbfP$1cc)VQEV$s-+uk9a>X^@=d%fq?NwA-%V71RA4e{F_g!V
z*TQ!9MVS*`q>xDHQiHXx+`Y&bZSVcBd^OYbRfzYb*j=SnGg>uBR`3f?Ty$LvN;7Ud
zm9;1tKrLs}>6}WJQ{R|h6Q3<IztOfe#MpbsQ?E86aow$FyFPDsNU39midK?BOIS6#
z>th2>ieKIq?jgR@d1EbbWZt=Ux9!1>fPST*uPW8&O4_#$+jG}t;*Xn27dYz9lz6?8
zGw*Y+T-Z;BC^7R$qX)3DshnnsF772m4p~^YXa4P>mwrNlKX<s!<X~kPU<HrpyzzVa
zpn68<8kYh!{J6N{<B%UyoSL0Xx$#W4?ZLL(xwV-+VMu|FZRW`}X~O-;T9a$x{h;wM
zbd`CNGgzEvI`rl1k>?bQMO411;4?*U(sUZrZQ_~cFr^vZBiKKMvRQuD{qwcO@|;Bb
zNX=JidvU?iLOs`pGO{P|Lm^d}E)_a;8ja7D+tn2`KUb*56nd=}f9d4NF@MXo7+7`N
z<_eDP`-xhmMZG;rLy4YmmDDE&9^L-gBY}fYLJBEr{g9C4ZH6bXTYRpN{gT)ZqPvQR
zY{Mi!Qp1nCOT=EgbjU}OSoTk7*~e@jJdKcgprlrfb%{6DChUxEkiyz|uFk|72i|Cd
zotx5LhDb75W2-FV5L7J9BQ0n0teN4TXx@%U`D3hxda8-h@Xzn_BV#qwSk6SnaIIKa
zW&tO1t<v&QWkcUE1$EKgEI+kYp-a1S?xsEIs!Gd+dFipc0|u*xJ?>ribT>c0N%?E-
z7wN}p;nYr6=*6K|GTC^GYDCUzl@2o<{!Uq5r|ii`c6pbPj=W^9P1^#wY|Ks6mA#6O
zdrP%t`-D8a)_i%HpZj@40zUXzeTURjhe;3DX^=ATAEXfigw*+VTb=7vU9TVa&F+`t
zaztFZ#ZO+|UojuE+`U|U+Ohdzs-B`LJ0{zp`E9Bmiym(>-@Eu5cXVIXH;889E8Zqb
zy|K_SvDF~>*?RuEzOy}ti4n@P=Ehw;ifxD8aOv&hyTQmc%8+doJ4SRI-*u5`RE}_7
zN|j$*F3VLk`m8eDwVN#>a4mnF$!LmQhfrDmZ_v*yFXqd5Kjo+E*!bdM4qEfSntzxB
zMz!-?sIpze9Prl}JDh9QUh~CHBzMqzo}Mk6m4b?!<CW6MYD~vbPaIp4#o4=i7$xh;
z1aISQ3UPhzi9+%ld!bxC6hgT)b)1<b!%O(riHrOP+kpTe%7yO_)!8WPdQWiktGyKW
zC1Pudkk0Q6Ei&Ql7R4yMb+w7ie*66Is9&qy&b2NK*je(L5~;UpaO`EhT3-JwZ1`WH
z0x#SCh!x`_ZNZnW%VRWl#Kq&aT>Tq@A7iYSxI0X}hAvWSRZi;W%!0Uu#i+dPBi;GX
z^BOu5dfX40%T*I&HFVqE{T+?6b$DHzIHOZWY=n-j#t!2WHv-=sjg>KGzl7Qet;&2<
zFdV5>FV%=jDqbAFVKLSEV<od;2XI>RYMz);XJ884Je{`C^uzA&iu#XDOwGt)f1A}D
zvmYe0VdJ+{6t<ou*o2rcW!e~bP<C0vf?-*#8vNko++lJ7cE(SNfnCpR=we~BhEDPi
zk;v)L0{Lf3`sg~5$iA^D{q+i@>de)NtnalRJt5M8=l5F*o@VMbZMqjV9X_Y&qiWyG
z`BYkDRWQ9o#i@mB#cw^&TRmK(O(2U%dsJrJ{u(u@r*)|=Wi-=RHm~7O*;s1Xa&s2N
ze6iD7DQ_w03(aqs=`YAR7MZm15+@F~o18DeluHb4ICXgh&z-G(cZ8PIEw1Fnhc&gv
zk1yIaN58tF46iM``kv)2Fu&ccwd{ez<4-xd@9hc6TLW*hmf^E=dJ`Smj|3->a$ekD
zI-P8W0ul_5kIA`%;NcHHr$_h=R}M=t^`$`xf?y!AY<e`PsS2LRB8!sNZR7YYwXAk;
zioZ#r+3<sm@wMk{a$k|<;8BF-;OeJ!FX3-)Nble|E2kr5+8w1WpY+FkSox70W3jB8
zq^5^;fX&zG@P^>3%#NSQ9pB3Sthr`nf263NV{R=&=k)ki)>UN_WQq2jjegkUe5caC
z@XMSw`sx|ZrfNTCC0s0cH#oPIEP@{M;H?0Kt_OKgb)M^8%BaoOc~);|>t6}wLPX9(
z*HS^>KtjzOop+7+=jpUvt^zL%Tim5qy4<A}!#G0saF6D%Z>V=KfrHcihPwQCZvoQT
zU^)DFM7m#zpMZZ+-n4wSU$Ya!it#1Xr>n3*WYM)uJ>e5fo<BmtABC<XlDi))$SA0u
z_>zem^*z`!Ncu!pM04V`V7gwLsK;3@4to7cep+$`XA5eO=rNx#t{F^ulwg>NVOBA|
zDfr0R=0#7XdHZ|IrXcomT`%ZRQM-Hr8&7@O&7?o-d4DMVcUNyE)mnR`%3Pb>$*g6|
zWuscU$Av%rwq~oaJ$n5Ju~cI^#>ku8K1aIlmRrv?6~1-y_?cT5tCgj$jZx4>2=Qyk
zu(SB=ePpT?ZKk;s0O4{zF<zJ6`^ao0@Ikw{n9ul#55h}FlQ7dB1PCFhT}qN%W<`)<
zo8Vj~B#fWLt?^=F8&<)WU1fsh;uwED-2Ss<Ld?b;l7+wL#M4AWN#g^10UhaFdUnj*
z+4cH`y%;2(AWOIh`gM~pzt`qO=*@dAZN``ODEObS<xbW-eL?DT8lguIsaG7(qYg-Q
zbv&UfCF0OnCN((;@O9$EY)KJ?AEv^T^&-Q0dN`j)mDI_hgH6K@YkCLCT43|$u+0cE
zNd^8O_r$e>5AuaUWiMS`eaD^nR2(TGSeVogDC}oYfm~SVB0ERub_X8IbmsiIJ)pqw
z-WUEli~bF3<mdT)l4+n@z)HARi1y_$epc^Sm3ezE$V`?P9ek+7+reF*ILl3`Nhtx|
zvD1mz(Id7cD{s#q-v3=H>IC~yX|7XtD1{Yv9G=<a*?z8Kgj~g}tB^|I!w;;F)fw3e
zpZzW8@Btp+_2F($E_eWKE_Gnojxt`g84)RUSsHsM!!@f;Jp=wC;jY;=HKGCzGb&QO
ztrKI;Y)Ne7V%;Mc#@zLAv802<cbjE@1>OhVe3-RQ&WnY--lIUD!C&S6@r;~@umV`q
zl9TVx6YM|q_hay6R!?QABOzLv+-W!svEV78q34=L>62ey-bwR=NL*Ag$7X1kI|1Ya
zH{}vRg1TN4mY#!^W%zw%|5H!Syb@1<mwd$F+?RvnR0nT5z~}Z^LJkDSjvYVLz5g&@
z;OpG2_rf?->U!^SvxfMHrx34hY*ZfQB*fHn7Dl79fK(sKDQxDj2F*mJ^IGf=$dC_w
ztlvkKA@}seXU_dNc8G9SGGUJp`Kx0TC&9o5A4P)u_~(O1y9b{rb?m`qLJm3j^T93c
z$@^RJDY6yI9y1f2w=E&`|3(Qr?l56Ex877Zm(CbolPFt0g2&O#iaS{C^{MmsLNu7O
zIl4KRMUapGC28T}nE9Km+X@Fs<tkC=lE*1qzPFG3*%-bf0hgHg?7{c$!{0wvd4uqn
zPaLd1_PpD%SNreW7;<tHF?GP;|M0Cu;h&Z#TVe|f=9D{<#N;w5)aL(w%e=6_dzvWw
zZDQS1;$zDMwtVkjGMqXH;ZOIE+J&D!cVx-P0ROx@a_}8nINwyJId3Qlh7o##yX)<d
z{btwW0N834+dqWqVXJuz{W!U|1Kebg&Aj-SCGc%oRO>75gNM&N!?xEE>J2oXqDS`T
z{fJke4rmWWSitD_Du;cVfr!i5zI5o&evBc4AA827-t<LE9~^^tX_2p<Wl%v-B}!7C
z#8%@C@&2YGJGLLFUfEibA0>=}2j;)@@nA!e{qv7~zYg#7mSo4LgGW+;KYRUGqHQ!1
zz=)ZK_g=GjA5o}k=*)$xQ%5f4nmm<OJ6MJK{TEa6@c6ZE?$hvKW7%he4mt&7T7t*m
zrQd;HA0XvIvcEb+A+S0h=I^bi1AeIa(n<=CD!z&Qaw6L>GA&8{vkwop^$UspP50oU
zp44F<7WgfSvgvzu^I;-FfT(;wQZ8L3T1ATMj_+C~Kbhsj%QDo`DpKSlU`n!%T&4_E
zTStfDUOgbc3EIKK&?u{xpmq2zVGVKxE9fMN>ps**9-XmX_}Mm^hvrJc*c$>MRQ7>e
z{VehZJ2kT}E-~hYKcbC13USwmgB&><V|ZYp%Q)%|8k<DV#rI&r*PG}!1O)$hVF#Zy
z9DYl_yyShdne(tPaUb(qKOtV&TXR~qQD!v*)1Quzwic5Hd}a6z_t7g6(Gkj4(5ji|
z|8f6_+90n$6yO9JF)xo)c0<Qr4IH8^i@R>t#k2u8Io$_46VAbl@-I+A`BT`ISaLRd
zAloK19;w>Nv`B3E>NGB~9K5A-2fMhTK$?>5F|u7>yf|_2y?ppB&kZgRJQweP7ruVV
zlld5;Xfg;_IESlTS9setK(F69EzZq6)${SiV?JO8)kF)^c_a4`+#Tn+t|Q>``@YR!
zA^-b)w`TUVGH_BJjs?H_$kdE=vF%@^)msb2-AXvH4M7(D8ggtN#WqthkD2#thHfIe
zi%ks4bC+^2{Ksb=fA^FJ+_5eLQ748Kedi%t8E0^rG#v?~byNOnVYC$`JpT52m5(LJ
zi{ro?ZUfEv=sBt-ygYtq!IaO;u{}l*H!b$J93(r3c@-T&v)2~UymXF7oR7gZ*>=R~
z2HP=si4U{Y`V-;U4f^rYBkMQGx_9g}{_|sJg!gfDUq<Z0*ETjx<K{!z)rLTNG1yhi
zY37zs_4+`|FgQ7mh>LENca(#VO8;Q4B?+C|%q7;3TY;dX-<+|tmgnsVb}kLgeKo8V
z;#FYpS5fazy%mKaeB%2v)DFo4jY3pbRBy7R^{$P*+)Gq@>&@|>uXh(|Rfp(S8EACz
z^@%uc{Q<+a&jA+&dHZ%3dT0n*BCa@tZOFSKStV)%hoC{Y(d2gKG3gx*lU_CDTfIB0
zX=0AeWf#K0b)>R(d-6)BeD^r~%oMucghp);Y}UUhf;3Z4_?=%6`AED2n$LZlyk7lw
z#RMQUJidxPk|b{HlhpN+X}$b#5H2Bk?S;~FjZ~`Q2?*dgL&0(Iz0XjTkT{tUog%me
zZI6NLt0{EaUoz`@HJcZ`HiS3UOKYpccz%?&5XQO9v6mwE_V4U;$M34QTrfA+|9L0a
z6;YV$D{KKV)+{p?5SP-ka_@c>dZH;0w87Nx`g>b3+80o({<;90+q&s4`PDIV_V6G%
zWOJue?rm-!hW}!*PY;cbE}{p_Igz7ZdZUs4@1I6%u&lSrAa%m=_<;O<7p>j5OCu5>
zUD30=^oy41=`qADPZ*rchv53qhjVROwRnw<%?@u-Tlb-3a#_Jzo+yyBa6pXq^3D&Q
z+^=CY5>?2x<cmKj97UqC^nO&H{m-LvgwuUrI}kZ=Xj$3%LS6H-W;racc!-qNA@EaA
zhT1SFo=(#~0h1v+L?ye_K$T{7ZLR!_(#_916RcvkE#chqu??WBG`>6Sy~|pnINo4|
z?r#8Z_(uV~ig}2nvNMGF8@+0(`j8#!4JsLB-j(T2^j>yC&So#u-q{S3`j1nhQM1o<
zTl6&lsE0kZv;1oI8ASMN7%cu`90dk8-hTq`!3D%Y+lH`_-n$Ae?u=Jq{RV!*mmLr_
zDS>T?=f}!HZl?i`xA_QK^|`b^RXMv_>P-Wt^)N(gEPUrj-#ctQ5GlGbB^+wWZ?aIj
zic<uTKN2nw?qP4c{~UYE3+7w9Bf`L?C~HLcLGGDl%YBC~ULQ!1m>10uBHXts;4<(K
zh|d1B(&{;eD18cVPJ~qdLd>dhAO`#!on`X`_E|ZorKQwxtZ%}-;UQ$i7c8C6R>n3z
zM97h;inF)OVInw>VF>}q>2&+SobkWd?<CtGonGNwvl46F6wEwQUcD4x<AAsunOA}f
zOz!~TR*@1~8pxb8Nr4p*v@w*e5F2M%6h7QH*Q>jOoDW3LVwz+}k{<tlt25AR!b)rO
zCp^2O5xy&8F6&`D2pGM>fg_0T@Ew#bKu9WQtlve!G4mj;z#j;JRS((Eq!j;oCY?Qo
zZg#7P-5wlS=ik8Ecn`LSkHr#--2FqyQ!&GcoW>EFbZh&+-!2Eb44y6bdAEodql~b}
z03^YI<?R}>{NRRL3Eo+m$nqaPe(|T*@8|S&)=7nBNcOLEl74s5w&Yuu%mNY_GvyGF
z`G(WC?7~<k*_r)vk>S*S<v=q2gYg8>4Wur*eH(!^u+12>;oyAcA@Pw&Fooae{;Ed(
z$lqV2-cJzyJZB}a3Vwo!=XGP-#dc<u-3R4g4MCi)!an})P7uE}G(7}|VS&W>ACUw(
z!iWq&PVFu}^|wv=B-LIl9k>&KoS}`@>m5>8&d_(<96z<;tL(vOD@@~u)C?cyHCNNg
zwft+I)gis<1h@UY@AqHq{p-I0=MRI_@FJbpp9hOE?}TwTok8@X5^+F7l;B3zLFLo2
zk<LB4)ZpF`16g<QvkvAbO{eF#{1AP^tm~=Jygz~v5dD^cDvWhWucm#HOkjJla*qq_
z$&$fOqu`^Bn@x*%x^B|?1h}QlTkY{;qZx~~;|=8?8Ccm@ySoO_VXJmnQ_pG=(ar^+
z^fNsgEozOxkPh$NqS6jECBb@H+dA?Qr<!9zIK&~#c|NDK0(mZeXWRETg+S^<z;5E(
zz;^uuxChQBp?+#)>7DaU;vOv9Not<#0FBYUMeo1vYE&9IUtuPC5k%y|@WU1zju+=#
zEV+tIJDlJ`jP)bO1q)i5Xe+eN0zZd8!ta(@Xia>BHLr53JB_S))c%?W|5s}cGI?`|
zg!Q5aSi$G$rfSGN*F0<klAU(c`cHgH7n6_e?CjtS7TqG;$9!3Xqq4KL^bu8c5YAj~
z7Medpj0S^`xRP@B?&y&TFE9`^r9kmTaOReM0ew729K6IQ!7N2o#5wev-(-fs`7q8R
zPHvn%9Eqv*Gn@h=E=leim7`dT@Uk6n9CJeS8@J%#&8I5I$Nk_jdyavW<Lrdw?3Rbq
zAg?ypF0#^^{L!v&-X+X(P@8EM2Qno{a^Y)4gw04`=**1fY&{DE=!G>-^HqRQ27+Tq
zeW_xwk3kgw3k-73r8805+MgSJ6-5(fS%&D2#*|Jd#-Ccjl-BghsavM#d#?53LgKfR
zVNOcdpj5l#9^$*Z(VOShTjl?v4y5M#b3j#X$}<;a+F0ef7=P*tg?%prZ;igOxT_DI
zp(1+tkpql)?5Yhu9{-p4J!v)g<0srB2vI|8HbrAO5V?9J`VX^2TLx#z`}TremwT>f
zh?6czdc{s%(1K{ZSe6I2j<(UqdS-927ew3>h3GM<*Ui}aZNtFeg&^7Gy{Mw@zaKft
z{(a<p!~DA|234?j`FNXuP8!92xq8TF1mUbmobS98{|3=W(lGY-BjKIZ?qPx2O+}l8
z<|i4g*=wlRv`$aJay%=~+%0!7{qIWrUuOUK%m2^<u$*0AuSnSjg;u@FSdZ>QBxfmv
z=s~8M)%E+m+=@94=Wmx@-wb%bj)c^Z7Zo7=s~5G0L2>r+TQLzK8ATuN*tmS98G@zh
zj`Fxz)UUtxoPPV0=Vpu1I(qcUSCU~cA|HorBL1ZZ45+ZV<x>}~PvdtyJHlesb<{|2
z{yb#Vor<N}tT1C$uBUTf_yxf}@rNcjZojsObbBO#(Le-Caf73~P6i~(Ew|w?a&hWp
zyFv=GsD86QW)j1R)S4BH|Gw5NAPlbSC4Wv;@flb0!!!MW<r7cXLcZQKe#}|y+#UGh
zGX`Mf>Ub%6-ykaQEFv89=DI=W(%;5_IOh6OlX!ej+7MWhTub1=y_~>s^~;UpRbHu~
z&Xt4)daWkmwnqQfl+ME8)2OuC3TBqCvg*A*^ZjFq-jMu{5=vC7$V|fXp{%?bbF;Y0
z0L*lDQ9JL7FOBSZtFV5ImgsU&U>R~1ug`LF9f3hu*iu$4H!2IqKd?5Vv)-mYKStu$
zKcK$`?g^z_+x#1ILvpOK6YoTpzm+LkKPTaT0)m-=!<t5}AkmF3j$89w65)a^_aH|`
zBT+&>r}^%6<-IEG(jL<5mH78a?;-J%0%59?VFw&X0uh(Jq`~O2#-m5K^#kf}GZS)1
zJhk7v%VjUa;`-ykYd(}}0L=`f341_x9^EV`bBzW~Be+p0Kg3hHFlI3|Tmx<&<;Uq<
zJ`E~8n?(X|sN(euwlj0NmAJX7wxUs#l#X1E&aEqDKM7c^A?nFpDlYN*_Wlx|uM6bX
zmfl5^XsaotdS0wCjj??d!eGvhl$;?mLZH<ozk)6n1eiMvC|S`{t|u&i5N8K~rX28Z
zYK9()Zp39gAbM_`qYl?*<7Gd@GIubSr2YLjxz@>wCod4TCE?3{Opp0rVmjAh9;e2K
z9}i9-8Kn=Ct>Yh{NWPrYb1Fz+k%D15aXq3ZJfl=^!{#TzBFApgbJ4xJ)Y=F<0%Dki
zP-~W4&FIYRtQtFr=oLxtgqr(WD|ZkGTtQNq!qzek5tn*Uo!}P)@0n0rjBX9odwtf<
zHfDJXX{_-cg(+rwgEQVN94+&3bu&7{$TtNNV4PVzA|5Gcw-$z64zOOV-f;5t^sGs>
z8qT%MLW-8HpU1^!uv!)z=gVWI#}VT%Yq-R#ID8i-v>U}n)JL_iIW1_XDU>`v9->$q
zq<G%&a&Gv8v;G3dfuqVfPre6Lh4!H;`@e^(WbzEN4>$59Je#ppm81vT=P;2&gm~9W
z>$+ZC?vW%3h8qNO)618SaXUO8w)pr`Uc`sYWpry~8a6GR%?-2ud*Hk{1qOA;ZRn98
zFih(GN76=E{s^%zFbl6sGkD*ddjUY-eToK|!5ozL4ul5&1X1kELc2Mt)$qh0AQg9|
z)UuyfekGM33Bbb>O(DYw-lep_6oOcN&qOcR)-VXhT7!1X5{}Vz6C@O!zrH3_wi1S6
zRow>FTT|@#_{3lvBafwe1v}dt7_e=RsapW5=2oVkXK~H(ht5jrJxi&UwYJi{Mad>c
zs%TBQ+)z6TS)q9P>vr#Hs!xbXaZYD$cxk@Lsx~^pxIe#QiEJ?A%im)$Z?cAewXz+Y
zE=G#|N}N1U>S69FA1&%D&MVa1Hc?mpwIsiF`O`~W+(*;<M1;^v=bM=%<}HJugxOjA
zyPGF~1~uk>1Gm`}Uo6v?s#!&wyF+wVKY){po%rSy3Lq{&oV&Lxg0Kr1pZh2^)L(Tf
z71WWE@QvEPJ2>!0=S9_e00T4(d0^h8^}_>f4aOSIm-B0SuQK-*Juur;OXK~D)N{Bj
zqn*qaMj!LGVkgXUj*VxF=Qz#iZ~ju*0ywrM*=0KCEPjH+<qySJp<XMH0k`f-mg9Vc
zOi{T1`Sp63JuT**yMFoS6)6#L=IH6s3=X2^(#|go;2DU6;Kyl{cB`|157iu+%7T=9
zYUt6jWgk+HPe^@&WKvq!i6C5Zh|&d>M*n59pB^<L7COn1kPOU9-kjY_j8glc-v8f&
z`Z@|(3a#UnUIGuld-F`x;S`wn;r$^3gG;c=x%W-Th$!CyBl0UeJMFOi$TqC8%?8w1
zsSO_&q7Z<f=Z-B=8)Uyewa{OrHaLTxZSLvMwfl7Vcp1X?4aQmz@+_&{o<YcS-ZVo%
z1S30%$HrD$jCQ+xU*@HIqkdCfx9B$xQ5*t9j2qd(Ij7+mYZ@=wzZG0Zqy!NXE5j3G
zGXx5;!)*ei`bKBBw%<#hwhh+r2Ht9&&$;2eX)@pWd_^5qWsxPRwCt+q$4Tk(b9P_y
zq{o3hbxCU}^b2xEDYrbpe2K5K#PC^wmA2L<6o8nz@rum4JrjV~!f{=H-rsZ8H@tT}
z7I~1OC6-C+t|0LfQKNQ85>ME@AM?nT_F7rumyy#SV1Mct-<Ua3miVcI-FuaIzt_<E
zC?K6d<#N7pJ*|{!TVQS2uWu472?xaQQ}IKDRNVA5G)GIR_Vb4%<Z)j4;c#ECzgweu
zzRzmf-vLvhdrZNo5*Wlz_LG@;A`sGXBsMP3^CHbElO=|g3<}fp*rI2VA__5D-}p+u
z`@PR&a-D?#$EO{9UoF2Wz8uU=hoKZNv-2JeDXqp@DQ&$4!^=L0$#uXX-LTNLdYeL6
zU)~{(?wpjW%{Ci;lrMb8K9;F3IWapwDq`ZXJmP(3POyB3#>&{t(Bd+?rd@VQ4EV(C
zVV)GToPZadNaP+g<Xr&96Ni+_P*ha9PYaLg7=``OC&1E-{%NSgTC(vYBxs(IYLbjT
z_gpi%0PHiLIf^}I-28t*E53w=QD?5?zB^a^oy3W=RrAC@_UEn3?;V2l4lB|{#C*&)
zJ$(HtA;Wh*Nbv@e27i3OVtm%2a>I3{%R8nFDvEN%&_2{`6_~l=%7wy~DoX^>m4bPU
z`=AcZML<<bo_N2)Tra4ioe|<OZ?+j5!m8|4I%Fr$(&==79QFET20{d?XBGL_`Q`al
z);0is^c5EA)_u?OnB>HrH2QN}_gsk;@D0z@rnKZcuU%^5%a~bThnT*Bl!#hXdZ;1|
z%|R{{6oPzaI*jRgmf#A217nhPKD}~-uFMGyqkcHv!&khPP8t;*9t8L8d(HqWNYee?
zgJk>y=3iGlA!ds0UXd(*(wBWI=n|5eB99=8X};fPIPt$OW-yNnsnd>iUBXe{t%8HL
z=pmnWXm@_Q<uSt`@SruJ{rD#$$ldvb!R_OlhjsJiF-4!4cz1zUTYBdW-W6qt0REs7
zNzD${rV?>38`QMo8jCAU@)mFbr@G<Fku{#QlU7)+W&%7!$mZ%vZkub)?od8ez_$L{
z;{`Af2bt`-9(ZIbVrgh%UB-NsbnHE)&zpfouaMDoXD|S+_`5UucMVMgMvCrWF+cS4
z^O9J2q_A`DAOM(Q0FHB5c@ijT78K5#&kKjCZ+|59Oh=dwj;!o41RaGu%{g7C5b5J7
z-R~YKICTzL&DuZpS1Q0+-CNvX$REiQa&{@9kdOs$jhValiM)t}7ES(%I)vXiM4*F^
znBRE+T9-)cW2wv<4*J2Af%}acf9H!7w)I3@I=0m|nC(B=S(lHem`-Gz<48TZ_rH_P
z2>D32G&a0zlExuz<Aj58@N(9z(%PLiE2!jiYiq?y0<*_rcy+y&L*f;%YBbC;UQmXv
zp<BAdOMPlV{k~`+ctBG}JgnX^D+hhos;|rzGPNzRY!*<N&mSQb$%ly<>l^ALP+#DZ
z=y%dfQ>K<dG@r#URrNTAD?^lg9k8_>;3c~rtGRJV_0zcO4MPFrZ|{4Y<Y<`hvs>h(
zAP$;1+C`VwrL$x8{=;COWJd9E#h4UrG7&4}m?;d=r+TR?;Xfpfm?&h=Xf<I%-vp2x
z1j=`3w5MKG)J$eIyu1FO^}c||;{_HDm}~HZDlX^S?b4fy{`&0ws<(d)SmasJVG-~+
zXj5BVT5V12-K{9#I*2k$7#sqYC_FbW?@EhxfmN8?>a&wPPw2OQ9)DEIs==dM{4EDe
zHLYj6QsfjhF`R>QuvG7T7n@`M?o9Zy#$EOOV7}X<ri}0{0#4U{u0g%x<qUbA6b_p0
zM39V-T&|q-c{fD#Il1k~9Pm{7rBED`rnlf99@G~bxOIppJ)S?0(EmnP!Z%}+t>h7F
znc*_qaV|v*D+dq6uAW<`u&%NLN~K>+<@cHq2Bpe^X1NuqQfVK`GbYgMaqE{|HCuU#
z2ZmA*rMu|Z>0C3pWoY~EqF~qTP=23u|8m3?qd3k}^?9zvS;*vvvld>WCo`+zuXoW<
zY~dqiVx+^${{6*ga;-C;R1W&3PoHukT@8-o{DddO8D<kV?)NR;Ii;)e^gJ2keh^LY
zAPnYtVv!osSU*}=>OuK|oRHzY6vOPrIQn>I@+`w08}BW>QV`g7W6f0vZ2t2hr8Qb0
zkHs3l9tjMAI~;b;HeMSsq(zF<e63r2xF_)OE5UoYxL{xl?_9eTI|!t2HMR##!cIRC
z`}3Jp!7Aj!?3XdXp^A|b%#VP5z{?qw17FsQQTp;MFPS(Y*qK>aPl^O}H>@gJV9=a0
zO{47AO6&DuiQ}}C*ziAWk?ZnC_<LjPkG~4dXOE|XH+l7qTf0kv-VR8Cp=h;6*XjQ9
zo*^LXwIS(`RTgw#khRu6`taLb@o8$!AX`BDR%h9Y8ZMN?Lp<3$u7R(yS@U4KAh4M9
zq8B`)CWeP+Wk8t(t&7{4cUE6_->GD@2@=m5e|nE@pSq#__tXtT*dZM)wWWOWeP-hO
z83O<CzyR8alS2jC=`X}5p^2$!-E>`1n>ul?Ed#LgmZKPoL<8L`(x1sB0}aLNCEix*
zry#^tlp2H|Ypy6qyos*c)vsY&ST2+*t8YNtZrBqttgm6JC=7!1T0>nZZ#6#1_F4Q?
z*vnQeg#W5UIB?%KI`3`UG=;M8WrXe)s96dqP+Tk<KW(2naK+=-NgSuq=3PrM9gZ;R
zH7Gxqam$ley!&ZAS35_XUSG6(Qwgqb)!6kBcN^#3&1v_+UI7)B(MRtDQz6ink32^l
zZ-EtTK>*CZU{5|q247X)q!hNV9z^}}rfpFuAsMyQzrJT!byG2&{1uNr#R%Hl1zz*`
z^BawNfb^<oU+c(yen%_J-&gx67@t(Lfm8>papv}fZ?f7H(hnl9IA{~>jW0EKlK2pi
zAwi`=_vuk4DI{8xvC;Y@`wvFVytwv!`1i=DPOd|1BpIO}GEMZD6Ep0R(=~)7)lwie
zr%ou9YHK+u8<m3}y*Wiro&g4%7GvkP1&}D(u~c^pa6t$A;1u}v+F`GlP<VMtm-6&-
zPlZKhh9xQ(Hd~vsBSPGR5KPZRo41K=^>?sX2l6XK-Dr}tQ{>Q@7)GEkR|`u(8vY-B
zCo@I!L4-;Mcv@2kZNduZi$lQ+2C`<j{I921fUy4^+2PS(VAsUFrcuzb0hL?Y24~6;
zq+#r)gl>6XbzhOBK6dTIRWCXM%^=n3C)nKw>Txb%O(V;aJZr;Bzpg81cZveF>k!_$
zrMlJ72;rn0C}loPQ?KE^zG;VdgLjE9J-6aqDzdqb0NA#o1y7PO^TocWL<h~zj|b&f
zx(to2M1l`gsy2M%PDv#BF2n~pjll<Hoj$KuW4=J7KlE;o{*Yss-Hx^2xJ!5X2use%
zPkNRGFV)u5ikAU}jzHzZmm@ca_UEbi=CHMj2$_41or#yla(3Jy7KBwYn>smyg!anS
zF8NrVifQiV+ZFde6D;C_-T5@LCL>MbY=NpQ&xl6m0jxpS{H|pdR|1u47xmWe*5aad
z&E`~{Z6ZlUSoXwsry;5hsKT<`m+GmLa?jA$uI1PWqSO>Qg}g92rnG66=$f&Xhcu<N
zg#)R+wVk5y1~P@We}7Gi5D7=7bLFV{f16#(Jys+BqECvUg?nL;S(*Q6P{Bh0YwdVL
z8c<8`Hp-I^&qmu8aJ1wU4x@FmgYCL*e*D%Vx1<^mxIo(1gGs28dd%E(vrG6O#(p~(
zxtq8g{DV{aX?9kat~JX(L^uqvD?jHwxz-WGo422fM?f#h>AZ{2t8VW84#DY|`;5Ci
zX`+)gfXtnk;sQMv9x0u_0~fcmct4>TN!WyYz~B18g=N5?&adg*(le}dFE^zl9cJB-
zut6qy4n6aGL1kOe4Pv%3)VY$e`QuTb!Dhu$6U?hj(7F8dX_!mxgY;He2{0piu1IqR
zjkd@wPd(#p6!alWA=PXWnjjnK&fVbaNOU!>Ai-{Lu2`J63wzn7WnHxdK6uWxgMDwY
zM_J!Hcy*L}eunk?ox^MJvzwvn1o<~cAC9aYm^F4+k`Xg5-2NcvGuJ4RWAe+U@x|IW
zdUtns$Y8cnw%K9eZc`yfZu~{?XMT3kxfKM(1_er)Zrs+#av8bp4Wu0=qKrI1T^>>t
z?vq4J2HR9byaF1yC-=YXVT$iZ2;`_s&Yqw~yXP~UBKCO-Ai2_hgzk5u<E0y@DfLtt
zgHxwds-|x(+9G2EgLLgcbS%~Y9*o)w8@g&WP^_NO-PI5M@G<_OCzA5rx@Zj)k5x$w
zc&6YcLX_8?l3LZET_f9S%`s~a)=jD7<6zmgmvYWDZs+~QU)g{kL&5-Cbb6s5S{HFR
zECsXFs0u`|AE6VX2iBpFb)&un3bV>eTm@%IUPFNMsAs7=)P1Ac!*I8z5y0sp)2K=_
zT=Kmbzp`bQ=bmT!x@=(n?EUR*!os01UZCk1>7^dbM`ht&-H|;#e1=uY0qR|}({PXz
zUbPJ_;_1!l*?-s9Ww)PdwZ*I6<7B3EEe{jS|3961hF9Xc7!AH@Mwe4JG7o}+6;uA>
z%^!6mEP?abqwnfI{Q!8p`U1|2a{h6#$Cy*e!yn!khU`L8vYJ<+cp$dfq%0(Vrv>j5
z7V8LvTy9?Tw!VFV$+s$4j3H=fqFW!`z~uv6szgq9LB;GEls~xL-Hlp-UYWBL&Pcg4
zgPI$Md5<tRnjcUN_03Y{)hzF2y{YT*OMENVTHum%1|5o2b=7b@l&su-`WzQR39p4A
zlPyYPPr{e07d<;-9lGR34EP5gUrw{E2wjGe5bnPhUf-15Pv2cc$ZgV49Rp9c@iebP
zUGt2@J$9l(#xEBHKT7u((b`+dq^j+x+?|ebl^1^a{l`b+{I(XKoiPM$y@@xou^`uS
zZ;9{Rn^`<WaOq$k@0-lU0ttp!pR)WTDmVSZ8!c_E^XH8&<?*~3zVlCVC5L=QPqdla
zeu>)fTSLzUz4ce(=i&5++iK`VcOzZ7w86sH+R$SbOl#G~vNd~^0}6|(e}%sm#=MI3
zG(0t?rgd&2(2LvDMT4J1?gQ0fIUP~&^`dy@_SwI?i+_g-8tJ0TZVluk<u8y|H{JSI
z*(4;tJd^Gz`}yqTkfA%aw?_tZBCCosXc7?dlVFZ6zvRvcBQL=mIjiVojixLezX2oY
zo{bnFeEdz~@_$*umW?}aY|p4U61VDJ@>$Qj+4wum$#{D;;6eWg44jxi&NrL8^Y)zT
z8E(Y@;UAAbKRc@Aof9q>!ZL|tln);$mbm@xel!*R;PU_BxTA=xZm@28lU>TwT+hEh
zwtwCw;Jg=sP%8RD&`-cxZva=podHUp$(9HRfrIV0mcLz=AV9qLhQjr%`|T_PZ>@iD
zN66Kwj`;Y>JozitJy>uDEZ?YIX%`-bZp(v#zgN6B{Shm^46A!d2>uE;;5T#k+&OO=
z^GkHeSGh-v#KjACr(oNt7E{#Sn~EG2-#07zs@s`zcY!+2^=**z)R_aORC)vEf`-lX
zjrsxo4!@)}{4k&ZLqi(!L2T7<`1PW4EsL61qRW7eelR(o%!(K*2}469m|x9^5r8Xx
z`(}=m|HYr`Fs-XkdHXI?0{vHQn+IYZf1Xf(sqcXSj7ry)DdzSJudfhbW38=5=N~qi
zb6)$gG0wE}v}xn=$FlOd<2n!ld<SnND0$A03dlhi5JckZ8KPg+v10hK1z%)zgz?@U
zczP;cy3bve49bv?OC*pGb`|DkZasL8A5!V-dlfWuF#CDPC;4PQ`FWnlGJE$k=3via
zx_@pWz-ptv!;4>=44G5x&gs`<?-2W2H3(j3L&%KLT>%`DnM2-wn0{D!43Up-rNDt@
z!#o<SM8e0yjNQQtBpUAmBMZX_ng3%Qs!<tk8ncJby=`uSd)qM5vK?rRDp>V5+D_c+
zil_-4h_Fc-3z{%v4?mSri|@^gDU8K~)kO9flC8=<O1{QN<qnB@;vGuCjXT>Tc6|c!
znKObpbkCr}UWj*XicW7b>--c?^C`P9^My>4%LgX7Su?us!Hmk}YTx`a#HEUtC#j>p
ze6KemF0JMXe(rg1j)SxCE019Tof)$YT1_6^i;R_cWrwolzJdf6K>mN)(QwN%?|*K2
zI{1orNiRHh;W61?)eEqy{1h2D3xlhp5B<3nN^dQmO}YH;=9gHo9xZ>}XQl1jkD^A>
z%@i)l3rQKHSeX7?gOEVM3D%V)YVJnI)QwmvRFQE;qoRRz=yE5U3~AiShb0&0bJw`>
zzOLQ5dfuS3<%djt${&yV;KO`5q{Ho+{hB$YV;YzT1+ttlTotti+c*}JjK<dP&esmv
zc&*UbRN{{z?nQ&Z#?HemjC|R9N>0J&_q<@&ZpX|=cw^lKA-o!PnJ(<-D`ffsPlt6>
zol-%Om4sHEzsv2ZH>h1Wa9StG%CXLm9{1<P5b+t7vP+V$v|s0z6q)FSg=UXm%6Y+f
zC9VD&+5;&CCN6jOSCeT8w?vE_L|f^DNqR>5pgKcWhy`CSUo|!iko`@x4^+P?G0YM;
z^>qLK_<RT|g2V_BWVHAk)WQ0mbqO!6^H)Zd+{I0+*lzgPc#PBF^hWWT-|gQ|xB&G(
z?WaoJF814pw9KqKb#g$=It@TTBbcUnM)I0rHddwtYWv$hTuVaOrq9ReEh(7BoiOz~
zNYvSZ$((nCL+Y&8w4Xh>SAGy#f{I;H)l7t_(zW6C^)vB*UR1)Qr6w+7)fjXt9e{CF
z?lQ62L0ZB*FsWoC%%^f^1X}v7gX_o)QYFN&D(q=+P-|V}&Z0#AGwR{*V{*@LlgSD#
z0-IX5e3oCfuJ;R%0rQbk<FU7&Cfe4|V@GpkVo#=`js`SzmWN4o7*fk?>Jfi#zOi^l
zrZJE{ep5vEyyIC(-OeA)E_s${GimB>NhBm+{^tgs-WU`4_%D|yZV(93)8BG)==`$Y
z;9oW;Ep>$G1;CVNE|h%B=2FjO_5;b&Sn;m<c|09UAdUXt;AtdSAA{#qmeHqunz4EX
z998QFtmdh?bthuy_oka>mAwZBdE}oX^$>ejdR{irHaIx#>wFdiJgzH1Z0A?5Vf3QW
zCAtsFQ#`uPHScmP^=dJBi~jy}1P7p?I?t?oy<1sq*mEU%)G{+L3vv2&U+t7pvx&~y
z1V@@C+e*^(!N*AfLr4?tu%qpjn)Q;rNQ~hYV#MT(AZC4m3`fXxT8iir*-LY>{i<Qi
zy;?UKAsO~VjRua9I2gHJg&Hj%W>-JF>l3+WxpPzG3YAZ?y*JR>Igel*LzaEOPea%c
z>IP{xN@Df?6Q&(;R=PKQKOp`|C0OIjO$jv$na##RkH0hI-ORM_;L;h-sR~teUK*=6
z{LJ^_6gpNvi(@08Y@oV#TI8d9_W6Thd=*NdwWW2~$6kmdd}C0y8D<-mQAD?ZAATb-
zTWTYReHw5;terT(6|<%4(N|6KX+(=}t9;-9Rwokhnu&4B&@U(l_)K}Lck%PX;Jq`f
zd78p>6ptx&+qzgahE775YZ^hj<Wj31@xrkOuW3!16V79kxWXwY_`>sKS$4+h|H8~w
zkr=)+aA>KKevu{-?fH)>oeZlU*)LNg?u%A6I}6B^CLj<REZx?hf<VvK*>k_o`bJUk
zdrC*%&uQ#NhLxfB9q+paiCDcQ!CXhazM_qPunfxcc4{X@ULANH2yX<q*&e2kB9UM2
zsV5Z<N2&vv2I#aF36Fsf)kJ;s`|PD;!iuZ3r?P5mM|<2cdR45Bnf83cUL*IIB<DP?
z=Ca{*icIRQ%rn*Qs5Avs^WZywKqaI20MY&J7R=A+z8J6?nQz<_+;gj5(_$`K5A!xH
z+%hXDbRpzJl2gW+2ak~3%T6}4Ohxh>X$aY{-^6_L)XO2Qw(u-(Zn%|nq%t$H_JoGd
zrAjqsQc{+E67CK`%aBT`!zNK)@!cur%PLV431cvy!s&G=`$J7~3$4?S&kp`wNSBAJ
z%;Xa1gI@tQ9!Uc3A$SBV#}wA+wg57lsrkFJs243v{2YnAl}KABNQTaAKv_o;p&p_J
zFap8)AG2edi7ePFdUpUdnn8*a>BU5lbIvK8&vW4V!?O$pTLUis@3v{N-q<*l)w8FC
zW)kYKYcwM(aT{ewyK7Cuw<GL<x{h&3au}XAO*tOtH0tTRQFjJ#Pnu{gP$fe!jutj>
zhX#7;h6s=1Hkjd4IGGD%bSm0>6`F!k(ptV%$i!&5%>}Axcsm7sdFh>(bEzCBmm6>G
ziMNr-6`8as_<alhe0@MmXC}m2FymD8%2b<wRH|qu>00kRV?noF<B|G)o{^k(SGXuJ
z;w_-?;p#^xuX#OE;@sdj-1Sjb8aifSznV6VB&hKI(4A6>ULf@No7yyT*_{by6crgI
zZynU$6|mM>mFuk+30^Y%o*SFA-c6hw(SA)br}uGk)pfA*;7zJ9LjuX7InR*8Pw|Tn
z;Xt9S?5p57ms6S*!Ipk1&c?MxPl&)22Ay(-Q%CwXp~!fI@S^yrUi9DJuf-f#W1c+A
z$hk1<^sz#58%S$|mJ2KIoU6Vf#O272qwOvPG$l&*E}=g&GGcQ~^13aoVw-ZTs{FHB
z^UeG$s#<nwS7<bMKKxz$yCb$yvr(N_lR3M2P>p^~#h3X3Niu9zF`H@|9W_^I9M{_p
z<L8yJ@16@({UTBHls=0fpdq-4;L7USt1G$^*|9fpl{z)%2(9Mm0S^D1!hYQrXxn3p
z+iMuFNd{*XcBp1bFwBk;#B6Cj+HvQThqN8EI9wK<9qy+zDk(R888ef^n~3i&Pj4>|
zuGuIg%GbH>sXHA~5<78MKJ~U|x3a!%T-1$??C~ipn<n$DbB;=TJQG(+7+2$aChevs
zGv?+*^Cn{&zp5C1dh{gRxQmK6z}zC&DxygG$2;1Fchpkb&`L(|lJ$ODRi-avK9yH_
z<o-phV&I^p=gM+f-=1H1MH(=8n-<=zj|s%XHib;}6{LwAb9Ut)+_KOsnZ&pkw~Pew
zGfBe{wc99YCBblJg|g?I+Q?fKRhi}rW}o8Sa2zr;z6DnaX!+zkLqD)dT(c;L6f+Fn
zq!2R!)Q=&U3m$?|iuJI5)3Bo&{g1EIZrg3ZOTVn<-TV-bbowhhpf^3?aPf~HuPOU0
zz<`@k7&PZfcHxX}(N}X;gSS)y*S?SbSsEYqzfv=U+`33}R9pYSB^{i@i#-jO=ZXh`
z9XD`>YcC%LIM5+VLQP0V$Qqf{43bRrGrro?86aI)l5AlVwBQN-Fnm-&wG?6St|AN+
zCQ6@v0#YZ3dG5ZJ)Xl%|(+z4JD6usxjaA<gYUg9X72#=MSX*@#m^IgR33_RdhgSF8
z3zblxK2yyD?3GYNmunQJcVqJ!7z@LQsO(}f*OzP|Uwn~lF4VYdN^!^b?;VF*uzK?R
zNnX~cEjpM8K1A@6If34HcJwNW^SS2s<@Wf*0?Q&3Q8G3`U|%O}yYJi&NZNZzaG@yn
z6YnIwQB9^<)YsRi?J6Dz6q|pMzDy+ka}+quCYe*ZGsi0XeyTqtXnwZZ?p)K2^qxm_
z?n=e*Tj`p=lDA=vI|jXD0fpsc>m4uP^wQQ-E#tSarSUq3-~Y;P)nD=Y<ph?Ahj-=}
zH<6}ecg~dKM|~Zw71^W6?Hr47(sNbvSNQvl&p5YmmwvGB&a_M(-E4QR3POf4N<^zk
z<}c_2-Kun6*<E#2OpSRb7nz9s<qf^KGK3zVTDK)(o;M$AD1=~F0R}sz2wR~lLp!M?
zvQ(Gq#_>Ph9FH-bZv|)cL<y*Vsoa|1R^c@pdD!&r{2Fc3`_B0?82|+(Mr;%_T`BUh
z#(MHWLmBpMh7p@9)556hikv~;EhFRk<};+Fayq_c(M!*Yh~~Ut0QlR8#z0+*Zn)Ai
z(tIH&JBxB3W5L-VBWIg02R+E*FCw=Sj0p`5s)pK(j5oTN^E0!*yWG9=Z1x~c?MjOm
z&UH;*9^w_Kdn?s7_u|?R3+B|@S7c8=-GyVssj7}^f`D_&xyz61eYhQTzM=+o@%|R}
zV3pm&o7`ZPm8XX8M4TvU%s<&TB?aqoM}A49tsi?tzooru_bF)&jUAYMbNSs>(_h*2
zQjvH5!i|eYrf;C^HMfFrHwG~BVco{pcf+v+#ziWT;jBT;Nb6dlZQKU=_;0R$m$W$l
zh-O}RQ`hdL)C}Zy(eA6HqJQp(%*13oKN~<QG{fKw9pKYH6sf(^6e7pMZWniVc&%UG
z0LIAs({2@;08AFx<=LbIJx=0?5~A)aM70b75mtRfsuZ=s|JE!)gs)i?7jm*Bi#KWR
zwZw%h86Y;ZqvL0-m!a3QQ8BaK!QswsSU-#u(KPkuIw7h_cLaA*&RU>*WuKK4lS&&Z
zK_^Q0vWlioA|FTWV6^?q_JS1CgUY#+Xl9iA(l+@04MB+_5hi+xjL0W@*_?768g8#n
zxmiiGq<a-gNUI=<1`xfzkiSpQ4A#&LU}?^gxJ-c*Ca&<7r#@<Kdxi#?!%**&=BNqI
zihxw>+L60=xJS<o<X+=iPOujH3zOg1*ZEhK#deAZQ4t2Mr3Sra$iR0rG-=}+sC>^>
z)NdK>E=T;pu7%;_?V=iiAyzfAa@&Q(&|ke#y_hq6XQWutKOhvlg0Pp({3!M@hR)vL
z^9w+QWTC1`R`o{j6fU`stk7*hceGc_d7=Crw&hCg5WA!$hOuAjOWs6W)ntr)yDc(E
zeQY6jT)Z(l1sPAFZF^?v>%%_`7r6%vM&7PpA^67DD?-6_o>Q8|26NYQTF=|qIEW_f
zXpfy?)`z6Qrg_&Z{>=W5DdX#g4M)w@rk_znt$ol;)aE8I3ytN=5t9$sYH9;|Gh42`
z0#*JaH4Kt{DpZ6AM`C^?_&0Nw+5t%kh-{3b5t*)jOyGJH(;z2rtP#|6_n>q1;&y`f
zW-XyceF$^3`MvGtLJl*>Ki(CJ=68`S<Rb+K!T0gqYKhXDeL3yilkmwMk#VmSGkGfq
zRozGyZs}6h(fiLyj@^hA^{g0#!Ng&h_7;XoyLuR~nL)-7idjmmkSTICJ$c`jM6-Tn
zE2NPxh@$P)7t%pGea<jCVO%kpoqWHkJv{MkS@YZIw8uNAVWSHG`z%r!y%8zmYR5fj
zIc{r=yD$Bf)N@7>2h>$lVaroAM8?2D=<px!VfWAEy|~ppZ@3|}fy@yA|IUo)@f9BB
z{^kJJrVCZ9PTS*#%2VmPrGg)Z|6;zuA)KlFR6V}AF!LG{OX^vW$;IZ;=gz!VspioX
z)V41Lh4m2oLSvPjz~12UKGye{q_)enoNIPPliEbmhPVkgjcOa1SEM_P_sBPSkFz#@
zdu+eP-Xo1RMc%&68WxQ@M@n#uk-=31wVSwVgj;75d9`<45UApqLto50BAy;%P~m`e
zPSI8BHr|EaPzBN%bFk1vg?a#YJA{~)d6o{yQj8*~2Rj9mcy@3Vs<GLrLKY1?Z>0>K
zt1&8e(YG+#5Qh7v7BrBtb7YRra~LD_W{(MmVZUW`fJK6WCdEq|=nR#$are$rWx_SG
zV&R4Sue^D)8d?S#XYP6)X1l%!7Np~66}s@9FFW=a0GN_6XHPO4ItOgJ)A5T>o^Ca3
z)r_$yMp5?F>8G{UH@}OLxe<PUX?vwZxL(aj^zUYeFzsj!$mj+KviHKxSlyhp(<n5I
ziDgSUkLR061z4YqXBNt$%o26%wEy$_*9eaJi*DhLoOf&)<6xEYi?!1~9v<=iAQYHS
z3EBx(?gm^sR`ZWaT02>D=PnxQ;JW=Vc3)l)b9Q8KHQuKCCB%IU{Zb~O^^25Cu>p34
z8b;*9{&`K;nRteW9RIfi#SIt140NWB`VbOen`@%J-|9W6RlbmmYjY0;lV2q~AptE>
zvX&kU1H@w+XIREae5-qlv)c5v0H%0^hY#%M&7XrNd+^p6b**-mexb1(_sS$xDcAB<
zo3r+Y@?bA2Ehm(013}~nYoC`<K7dTm@|P%@J3y<r66*2la1=*IK#8GUGH*j1-0Cey
zDPBXSZL1}bel-qI@*2A6#`gk-pcN=`@^5UQgN)q<%+ksg`TOezG5fdSkaXW|WmZI4
zZ@077CxB)2Ld@#bJReE#xF^`s<hA^N^Axe|^{FeIEdza~6~$7Iuv(t8R3Q|PJnI={
z?|9DK&P=X1jNrPcY2et)z_Z&PEzsd!)6JHM_ZkX8H()HY);zd$4Cjl!tmALq-)=_~
z0WJ<E$1&&XdWpX;7F*k2NN7dHKW$%J)51I})5V0L49R|zz5g^&+EdP)7v$6X+^=o#
z=Tz<y5M?nNXr~_a5r^P@tdPv$gk&jSAGVDfH69?~6f8k={kHCU+h9YKmEA!BErCUU
ztjO60jBZ6|2h%HdNRG54juFNdt8pL6vAKG!5|(-xX7MI0qAEOLv;_wxyd#hl<y&yC
z166^t>G{ahYy)>;l_CX^VT%g5$1XMyI&X{IUD+7*u5}(oruC44s}U!i3y3vbgZO;*
z+hUz&cpX^EEqF7UEjMCNMizQ<=ci-rm9QUHQAhppFjs$h7$)rhUwdEv2<09%9+w*G
zmVGNi)+~ugq$WkkmVGB7dzMI~4AO$KWT(`%kKN3WEfp%I6k{7AMJ2T2UX|YS%tr3p
z`~Cg_x1XlR^PJDw&-t9^bI!xnRI0Hxc>s3r`n;zr8b9k5mfpGQ39KsX4Lz@D8{5dI
zSK9gvvLFWIzocbuSC`qwif=4f@O*qTqxbfcw28+V$-OS)1nsJT@fi8NRc<(Qt1(hp
z!{)prm8HWl$TFMnV4Gxlf#BW(Z>-GfOa=e3j<Xfe+PTa1tAWg{^^xwus<M9AFf`mg
zlVtI*elUC{j#}_TT|^H&y#oh5)CMmwBd+KoxFS)pULiS#d*rDC=rq)U>XH~Ji5!Yj
zTnB+d7rar5U9f~bnz17wzqA65_+%rmj)#$o#JA)J#XqI%7A}!qOdf}0yGY{|_F-nI
zL&4418%f1KLGR15Z(B8f|NIE=_{FQ4{XBG=)<^{VR^C}{zhA+tx73D*h_p8UfG(5L
zvgEPk2aW9lUUhv<GeN%aeK!2Thd4+oefyk`=Kk7eT{YK+{eXwpqdn_uToi~`)JsiF
z|5}y7b0GCh3Q{FPC&`Fg+jPJXs3GXdku^~7ZO<eI57qe_I=h>}f#t*BZdiY<|KtxI
z2mhtNJrt4{ZT11thTdcDKAY0|#zl;SJw$s_#<E3vQbgpbIm{cDs~V&dlxTVIqN+0!
zit7?utSTuUZ~RERlB~`NX!OmJj`YMRHgitC!%*8e5d*vXV|CAEs5|Xp5DLlQ>Y^-D
zg0bw?j)8Vj%gLWErM`dPh%-OH^{|wGyIgJM6$^KmQ)5`|QxSV6L`<Uj=H}b_c8P~^
zeQlXUi@m}ogrTCpCo*uoy>YmBlM2NTTYGUFuyur*qz!Bx2i5NF)<_6a-k>~34eM8<
z(A-aM!}ig?RB<ipM0QJ3-=cDBQs0A)LI3`Blv8}SPzRDqf+ey%<)f$I1THQS@ZNaj
zIX4yWD8O4Cl~&FP1s;i;(m!GvKRazoH|)qyeO!4-S2Mr0!-1Ct%K-zQrMDEjjsz2`
zT=3==Ru}VT+iF$(`NL9%%};+#w}4k&FQGVsPcbO9KC;oZFGcWUo*7e#uwit)Q^#pp
zObXJOi&PuXK`1j3Qi%npKVI$r4kc=gTq-HaBW{PoJ%&ml4jG-L6)|-!7SNXW&hPg?
z&LUJVCan=?mw^1#aQgbJ%8a#GSKib$UH_9M%@q|-rL)TN;{=pD-c|IuzPJ>^TX8|X
z?5#7tI-@rYKH^=->g`{RHBa|_e9dc@!~Ta(wofm-$$>uNLH_bohlll^Hx9sv9Wtu7
zP-f#pYyI(d_vLD6M{wx1uT_Xwt3*XpxXh*iC-;=mH+4xYR;_J>4SMJIu~q8b*mLW-
z<TmZ(6tg1l^x4|XD+F;38<#fskx~<HoMXf0lz3x)eK{@Oh?F3FUt8KP^H1?Y8ub!F
zefN>(MM?i%#XBzLb!3)QotVl`snf^tyj1qRjq~rfuwyh&l+?5rsV<MHS8Qdb@Ya1V
zro_dTdsi!QZu8!+RJTAb)RF(rjm-P`^hd-y@+=<o5x}3vtyqs+YRt1ZRq2b1>|JNO
zf=>5bq|+KUW(T*KZVu0|eHBc2aOv5ZQwvw-eBS)^!j!{T&K36Ph5^U6#hN=^PWBED
zOv!6pfHy_i*P<O*jyEg%4yhKdtDkM#nL4;2_I_b8#K9XJO_TlJ>gAJw>UDGV-q=I$
z!|rN6%9xj>L>4-VK<XTi9*a@N;V^-Y9;&>+oXt4q$-r9{FY-Qht{xw5!>@LtsN09M
zF;+ROVD3>COE-rjS6cP0$=<I`@<?Z?^DCK4=G*7%Vcc)KE+KU`V~2-{&!yg1TFCr@
zcITG@ml}uo)GJ6vxq6IR-`?R1@575l^&f|6m`H777!KO^Q>avLS;rJD3L+}<RseQh
z<u}}fsS0xl5VgH~|H&>erU@p?q+wZpg^e|C+NPEh`qLj|1|7$|go;l<5O_iA@cQ0v
z`}~{pWY65<;+aBOLaL&3D@yWNbzfT&QRU(Xm><$OmZ?}i$!CRge|c%DanT#=pJAUe
z>_0a(;9%w-P<B#MfGY{Cg6~mGqd>bF8?`Svmy_uPG;f<1!#O(-d<NA&(bN_k7cza%
zQb7qtbpWm)9JwudQJVnwK(x#=`Cjj=_yK)!cRewj3r}a*w>e}2bX@tggPyKk(k?lz
zfmlc&%nx;623KHUkmUX5>Gj*1I`&ruuDh6A#BzkD$=Rk3sz^6fXjQHkkMfyh8t7Mn
zHGK9D1RPvok9r+IKfw;JSj)p4d%n)*+R^k3x(}dv3d$%<)Lp6yhk(L{uBy7V1@Tys
zc!eB2F*6HOM~}ym9uINFd&D`nl1f_JO7p=3=$7EFHo`&u53)Y8qQ`nh;5h0~<&k?g
z(=@_xE_j16uZQ(A@2n$n{ZPH?(o6D@Eqj2E5C2q;@Zg@!!6%TXZn#PFK$^KF&r8xp
z$_W9lE4NXYw!}@eFcJsWana6-Fd)-1{0?tr<EYkU<{41Za=mL7+>JB2F4z-F3ZCtg
zYAlF<R@W)2rTq=3XxMX5UFgl@j901h_MVfTvqa0M;$Jh>cB)jn;SD(SpciKJYnp|a
z{Gr{mf=500P2~c7er(U=*+A+5`%o?o>Y0z+QzK1NNUp4inTXsklO;T@#FFyeU#O#;
z=xoJYMqDeOjT-e2xD>$L*8h11M1&G{vx`~Q)z-*~+jxGZ0_}bG;}qQ&E-B8&399$@
z$@(`0Z3@aIJ=-9(TeYgf*W0T3^eMTpGNEuS-e~a?bBKj)^(tw7-d^qZQnRA8;OH@U
z9~9r9($rgZ^Jqbp)%c+C>+$x#PYv^fCgi*v)T?-aE$ce!NVS^}EN1pLL{^xgv#2V@
zNV!O<e<IjRAv1uI<fOXE62Ux2CMQfkU#$V(Qprs#l(}R5`rgZX=liM)^{null%O#(
zAW6_RQTN#6^p~KzHU&@0SACxswpM&b*g8w_a)1J$%^}zG@iH7Hpt_rDrA_Sz1#Ir4
z;ACKdZg(9r3SaK!`?pUP?4G?5L8f_-ixy*SUAK+K&K$7F=Eq5zfQ$9Z<6Vg;t)ldi
ziSiU1GT{tR#NDwLYkh8b?IICn<<cV}Q=MUGl}J1RhAbhXJ7AsSp>({;ZNTg&GBcn)
zCA=cmywWVY?6XIoot(AL7LQ%NkEsV9+I%|9(%Sd`@XE$<=&dH<_y&3%0Nv^FfteRy
zugx|cCuvChpbnc8PPnq_`Q+I;k@Cg!%ui`9Z7Cf1AR&(@?gTY3zePShae0ed1m#l{
zTP^V31J#3aGvVE-cJ2?$cX{_K>;%v5c(RyOgGz*U{$OYW_VheE-0#jV`<H6_mCYZ-
zY(WvK2QQWJ-A_SA!JV8Lsxz2Sa~(Gic5n@jmw`tA0FI1qJt=<gZf6(UFmRHDv}2N?
z`yHm4%onI_xVW^4CtvpeeNs2<Sjz34t;FwB{hU-8Q2hdkgAJKswbYV2iiF}?u@n>v
zi5gQmd0OkQI!QewS`Lc1>Lr-3Ha(OmCSy&2EGyn3a-x-cz$^Jcr*G#yNE_ia*~QvF
z@h<OYJ0%TvKM^&rO?uhKyM=TQN(urmGF!Ex8wC!YQ={vtjs@|`?F5T8<;-J~XrV^x
zye+zoL4JjN<HI%j1T`&qi;QoCCb9%%h~1y)tqUgBN+}vOMA1{m8P>LP$PqQ@%~B4k
zfe1Qp$7tVt`j+XO$svz}+BT0=n^k&C2_B-=y*gegwSS8_cxm_H_`bBapE-ie_6Z9Y
z_-ntDkJw!=Dt5<F!lea)2ki{r+_U(XYNC;M1{sM}NT&=i5=IEZ%!<gS&rzbt7a@um
ztYENh7<eGt$d?V{4fsIaT%}`APK18twhu|c^}kQj8ud;aB28w4MvABEtux#Td$vr|
zf`LX?WRC7x-8O-vD1Ptc33T`|kVbHfS7Dfz)AWub3)J(At(<79_&3k3V(SKVqWfq*
zi_SO<?UNJK;|=!6q%HBTbxKgynq0LhCH&cC+vdVylRazuWfk*$j~Dxg*;ik<Jw4V#
zMk(Cc@9f#zS;}4(<;G%dhUp4-bVCfcCOHS~&ZAY$=748Dd%Jz-F0>3948~D%CUc40
zFaPM+lqs%xKg4cXmgl}^Ny%u59k?6i$ea9BzEMBa#4RY~kH5KgL}3~^xnG^FVwUBI
zyw$)T60^m*Cz=)*97_DE>hgf?P<JXxN7X>U3rbRkwfI`D*+dC1n}teTB3~v>0_58~
zRatfc+uY3k3f{&xn$FI?nvPg~PAuVsH*bI<_j()W`bDv76Po?HZ@`2eHh(G|4AKm?
zz|nfwmjY5ca6ePw8H!>vU4d|)hGV4OYRLT_x?ah_DIU{1@YqI7=kn&gdk#-N9vp#0
zBQiOC$9<yZEk_sERjVY=>mJx==BVMn_0)iPaDU979*R}USmYxM*{xl9&o6x}^~UOo
zR<_r;F(BccW6PvEa{OJ%E^NR{tV;VzQ{1^K+8Gs5wui;_8@0YR>U=uSB{Sx!gWV^)
zQuM~GfMULtwgdy2_1w^PZ-asNJ21io-tSz|>_}3^?P(<!r14lQ-wh+>Ri!`jhA%gB
zpXydSb1m58y>q9hI+AqWlH~TX=xP5EblCo`hs`NaW@K<(cV-VkH*<oqiP!WU%$Q2`
z)#a2FOEeb`)%Sj|nrb=BsGjTdy?ZNKdKwh9$o9&%(twJP0kvDpR01hOz(kRwl%FTL
zcLqaGbh&-QmNYRbYlTCH+x0I-b?6LUPO^;lzTfW=URpm{;`{aOvnqqqjD1H>&Nz*G
zV#_9Ax5Ta<sf;bFe!S2dyzup1)zLijh3YcTkzIikbueV8AjmXUPL9)e@`<-B5=1n&
zZN5Vtp$X+$Vep)*Z^<%I^Zq5Du7yn7pbc?iqoN$F8mMLW=P|iZL0usR)6eO?x+CRD
zk}<*YIlV@M({IUH2Cq$qs{hT6yF>iEtsp)oC5fjmbbvl)M<4Y{)R!q%DJ!}SZM&i0
zh*jrX(zUA_Nmlcp%jJ}!=ux@}F<6<;an#<gC7kk+Pb&=OyE>BvZ>$K?7Psw+)L-L|
z7hX#|r%?0a^NWCn`O+hA9xh}C#qFN%R*at15PPYTCwjzu%+s#Q4R7yy&PlCzOM1y!
zmIAflQZ4?_@LFZ_0&`cp*%X|9U32&Vd5h8Ju=gg_+kjsYK{BzWfsRyb2E16IXByx2
z=-@{RLLz_=x6M>U!6jr0H4|G$sdbGVIFp?m!+RVQkC|v29bd!p=fsno_X`UP9E7<7
zn?QpG!Eg)znvFF&k32n7G!I@8nih*$xHOx7cyI5z;$B%o$56>Flahn5PN>(DII1<k
z-nS407o4f^gDy&{x1n{#WIzumAj*Xt#^1+VK6(UB4xDBnZE7~(B&g&T2M1GJvJRe<
zk7XK|yThrbpDZW-&(?`9z04DyopAWkIB-4%Hn<Ia4q=^rrG#)OiTL(c9(h3kj65>@
znxeXLyTI$OZ92_F`Hl_3fJm4-EbzLTjf>*nmK+HjI8Ulm^ESS|aq@15o0-cK@~|8D
zyL$?H<nv+QjE&EGI-wvk^wxZ}GSQR)6AU|GpEYftzaB{x2+BG+JkvC+Rhwlw_q?kE
zX_;RfyHtHoZ|={sJl#TzU8i6VSrAu`#J`TQNf{0cs4^l7Hw10crdeA_70!8P$hb@8
zz8q^hw=jkv(`hmLg@2{CdK@7^p8|HCJ^V#$FMRP$XuZAw*#R<wK?r;tyQ;dQmB_J8
z-W1VSs7!(iB9%$HuMb744Cg=cQy!xETHsEHuCT71Ao-lp+KycwZq!Glgvp(a+8Rr}
zdtHiPrm5`D8OVG*fgCqV!zgW{bF~Qh<_)W?qUlPPjhW%F`kWb9GqKG}fNS}1)@ul{
z(u*DIVK5u*(<H1&wU<6$9?|KgF;q*UBS%&AVNf<WcXDAPnG+@2KuOMSUq7O;!iYQq
zTGTs+oW5WPh~U<0t1T;W6d`X^)<hMqbk?gt%Fr)QoQHny!R<`pwD{d6N^6Vp-gW^C
zjb7eM(~1GF75ijF2*^et#oAMXl`aG-+gFT)eP9Hs-d^=NZ|Z1R3N`g`760uqKefpW
z7;!ZRI6h#R{tqqvr5QZh2-UdbnDta0b;?8)X=&n17?VTbmLYgKoVj|_o)ZahV$9f7
zgPYBr7i1Njm`9#d$@Z29{^y(Mwuv4Rj0FLCqP3UXzmT^VQ}9|0sC|teH`pS&G%|Ma
z=iCgmr`Y}ZM`coh*i_8=9EaJTKkJ&DQ+M4EH;&rixl{dwza}HWTlb2aqBLPkc<7#|
z*;yxpP;sJ_+v-C7_pE)NGCC<`Q0#K}4pC3QCyNQiCZ&V+!{@pUvNABj|Af&_qKuJP
zPLF6s<UbLss8@4kG2wTJr$SJV25PHSympdr72b~_&6yq}Mq+bh<>#b?>jt+J6eEub
zUyK;_<Zz3nK`7y1vnwkZRyjn6hx{mJn#p1-SGkh&DCg;7->G3O3If9MEk~`Q8|JP&
zX=^@n?WDuWM6@HI6t0_j9>K<h1yx><L|9KlOo-tQF*MYtkc<%xeuC9##qEYD?4yBs
zg$+gzEutuN@M-0;Jo@;TeY4d!@9k?H<=wWGH=uKk0Ky*SPA%kNX(lF1Qz={O{ldm+
zK#2Vhf-MC#DtH|!KfK4i@a|?Se<7i}0dv!BLA(@hVRkT{oWA~Y`{|IX{<eQ)OD!X@
z+nns)ngfe14U^e{p=d@}jp;!ujkjhJ!gV&*_k7YQ7*a1kXBqM)Ro>#ZGm!KZC$H_7
z-Qx4D_{*JbykGnXZyU!&F)sksu)lV&Ba9FO1{*N>@Ke!5YXQT!l}Q#XGzpNUQq~gA
zd6zg*75Hp?DlGkc;hJ@n`-O|qoT)DlHcZ)lc@M*4f_PcJN`o*93vQ7gI|n>qb@ifw
znnZ+&9SQzbm=~EB7aG*-)HZB5vg=!Foxmf6SfJ@!B$oG0O{GKUDt10Qv|o^)^I8ND
z`YB+j5tVtFMz%1jJd}mPM5<&XS|S)Nvs8w5`n+L%Q}Z(j6oGOxpSF{uyK=ciom$*2
zYe!a8dGikcbI6|x<b><grWcE7KokA~%rD!UD$yX4pLf~fHxliKf43)S_SKZU>|J}6
zu)|X1J094N8vD%x3uZ{BXC(l^j2(Izh+ciHh!~x`&9%6Xre9sj0NE&^KxD~6$iy;b
z*Vh}h2a(yDU^r^*PV~UOTX4!}W3p^wMj$0*!GpenrrW3}IW534-5(NJf0a}qLt(kw
z3-mZA!YX#g^O0CXTe+KU1Kyf`%2^iDR}n%M+1c!7x6-77`U=Dk))xKqD-Y4<BTOyT
zjqOCqh_W#Il8kb&yL|A;ZEXz9OqOd}m6Z`p)`<e=P*`0W7UpYF<rc$dvLu(&hcRO`
zv^Nm<5hRoM(WJ!#yUoCk-w33-J4^;awS@#aIWjR}NjJuCu*f{AZa<B26nLTBswXBV
z1Liay@9%yeDzSxf^=|jidii@-f(LY8;)sSkylZ&a>;(Dxzaqf88h~#f@+8El2$^jI
zv-u&j>Q}fXESuDVg2*;0XD;1Kkq!|xM7TaT19JW6MVK!epB~^VW&MQ%!PgkLzyDz-
z&G?K#&Yn$8wSg47paSRHH`-N<-F)oi5%wAFqK+goak=^og=MJ&eM2Y3>oUXE5RD>M
zVHSY;_wR2BBCJ3p6oU|8)Bl~$4f2oCjFuawmamQ?zUl13US$=E#4z(Ln^?=*Gja$E
zdmL|{0eUA%)8CU2IPD;5!TZA{R5+L<VCtcn@+PW@Q7*TLG5ZpH`iBTP_|ALxOhaaE
z-)Qhs<cWF3B=m}ZVtRAf=4RFF=Vm<#^UWKXVz>aRN#79ixI#26$5t{yV{Z>Alg-JW
z)7QurL(?&Bj=DkI%jS3ME6!vOx7Bs(q*$ktZ+N}UuWylG=-&A!@u;%k>bi7ew4bsF
zAs?YEmlqtK1D}B=O;jKC(SEc1F=r70EP)5*nm0gMX5DXk#8NSn?@#f-o4DNXDt>oQ
z3%mZ$!l~x@Ya5wNP~iTJ39AvUUGAmGpl(Ktmdq~$irf?@=2zo$Z-VfxhiH}baZ)F~
zN*1~7BJ<J4efCk??rgd0;cIu-0*mGH5(!}8m`fl=8BanP4M7fwI1-VBb;x5hR-oWZ
zBV=Z<J4{#m$CK&E7DYggo#yGq4oI7ZrnU%!c12ZYlC5<$!fm#`9-0jGK!!3tjXpG8
zAwzCC!L+#W?UU1XLkEoquO!F|qAJc=JmsnRIIihV#47#?%=GxWj~fBw*9b!UWO0oq
zG&WU3;H;{o(Jy+j3Uh}NXYXR87_!n4OfT`U*~r1?uzU^u@DB)sT$D?8a7pDLm3w?z
zU?p6^u{0h~2*->tM_Znq|Hw<mOjUcd{D;!+m<?+-{|MN=;aF_cl{#JFVlW{S-&k_2
z+W-vE5YCLGiFtG<pg*Geo$f~|8qm&JH$XTNND`8DqQuitC13KwnCHww_e4Sdn%MlE
z^<6($%6SH@NZ`xRcK|Z;&c0rnK(>I4E;Ajs{zXK>UE+TFA<Bz0ucl_Cs{{L#&v}vA
zpX-j1kUbk?;Yi9$ws7POI4cWiRlP1FN3`SIY<A(;>=8N>r#RW{h9zIAk!hyuET1kq
zBuFge5rSt+9`j`lS7l#K_n_xxrOm2$h?9;Ct6-@IAQ0t-RB1BT0ab-lu+YO=9Sl_q
zC?JjhqQvD-MP=&Yvr-Zp$h>Q3ynn4al#qTd_KUTutxKbIJ}=_)PRIHr06W`&UY<Ua
zjTFBQS}qR`JajGBa+3n+^~}y8L4l;0Zw1q5MhA#|4)I6X&xG%77{5-&K-d;zYG@sQ
zgSd^i#(TcxV<_Ul-r;kAs9Y{U)kMu>GZj_LJ1{)MLf)+_LS7EzPSV`52>h3cv+}H!
zi)&iRkQ4G-q%p+0J0TsDq2jnq*BTkwg^3A?9i820Z@7?c2%`^cDS2E~q=g)QpvbL9
zHvbomLpL!NMq8fL+ul0K)SDA?91-t>eUv0l$li0et8xq&$HAYiQB2yrU|>zmtcZj#
zoM2r>OkY%KGHbztzEp6WTHzb?4~~{G^g>qqWz?nO-3b$MgxE?>)!7ro;Sbr>^~oP|
zmd9&IQP$8Dj%fj$`?PJ(X)1rHD>*q~Y5`&KHdCutY%aqW|CT_|>0#Vnw7|C~`utqq
zeDQmA*IBdePmK(~!aM~JZ$O^h#9<}NbEL^(b7-r^k_t;g6uzcEv1Y{*0*oJ6DrbT#
z*H+IgUdHsQW<ROt{A7TTcAWjf%bwv2B1F{}0%pUVoVRnT7wqoc4&?6ltra;#$@UVW
zT0HTrpN=l`WTudw8W{xAHJ&0McBTbX<z-`nI9Wn1hZzm6G%h{d&(E^MfOD)EOZLDZ
z4AAiN^2OBDOgP~>nEx3K)9p0QQ%wIY7n{?xi$D1;MQ%2$PMm+o8OVxf%|$mLtF=Uf
zHc0lY%co(*3Q4A1Q3in?H7JUGGh!8%;@|^#0LrZ}&%G9-P*3SUs6p{u+T2zZeMhRS
z;%uVYXqv^;0TwJ*Q5bySSMi@=9oi`Z>1ExwPwzLbB_o_((js3f@LoMRHr+F;hlu2l
zSJDd*Bg5=tmfyB*P0q+`x-^0y_3Rxu*?@?cPA-O(c}%y|-`n?WxTTKMBjjcUb_}0c
z{Hw9k5=Cl>*QB<TwRCnGxMvpr?07(NC!9PNB+J@4E&p5+eK?4IPR?`B(iH?!!o?Q(
z2Lg}c3#(_ecjpr+Pk-R<KWF-C_oFMf-AML<C6i%6KlYr&@Y%$_G^YeneQPJY&AGp~
z(^dC(x#B*?`Spx4FdiAWj(N$<WO9BdL6aXW$Mx$od3f5m9{BN2kg%7ERZ9r`?bU#7
z#uE8-K9GMDnF(L36ZoT)qAS4M@$qr9L#CAQ0obD_06@l0<A3NpUGW2b25$IgR=*9d
z7wI}xSw+u=+IOc;r_fduz5ys{dLQ~#cb8*v6TRC<Iflwx1uYEGlY8twg>%SaD>EOO
z0xmJDQPeLy{6`0;FF90W{Fy)x?pycMvM~lmbMTB7&)l-;ad-(jMKcN{*o^GrB`XBT
z)H&%f8rtTV?ChcGwiIH2kDCX%m!rM3KH%v8i#T<`ap(;jQ#2MlwLW-i#c!TVN%u-7
zu7<q5Ggns+5JbB&rlqB&O!o)Vt-}OVt$?Ri=y$85M>oT6B$OM$=-;?o0`5aE2I0$4
zD^{gSC;<Z-5GD5{4p`6lVnnxvj0et#=Hs=I1o;+2>Mz@j<&Y+M{3bnzf7FHnbbT$@
zaG1V}R->_I91u?(Ija6!zDvl1<TO69rjUI@{#sQZ{MYrQ&C~^))Ihho-<{K=!COfH
zMvs|5^0}~?VnuNxqd4OBo-$pku@@nfzj#5~wH)8&pcF(fSy@?KJ36DcnvjbtJ)!`?
zM$Ly3d%?s!kdXS<hLV-~LWi=I_reVb+REe$Xg%0*6!Z{yXbYktrJNP|x5Cn{NQjR1
z5HIe~<Ojlv4xrufN!lbzP6>i^2I4urE(FlmTJZx@&kQ5M-mk7iSkI;-QRz@|&$&v6
zaP8dEjRzR+n15iPp+hrCx-)drWHjiG4*6U{N%vy7{01iz>L=*#QdLa2E>!3KvVgZj
z0xc*;(zHtJ73%YBY&L?L#BBOa_rd=P$&By%jpl)}YhpqsJ$Hvw9cB1hI|qk3jr?U>
z<V~>83Eh#hhHeZ?#8J8Uj>*}b?moH-TSA-G$F|*kDorUDk#QLn0|QL1+pSNheB}=v
zN#VxKCxd!$d(pm?&NvQgEoueL_}}ADf%2{;vF)XJ(U2<<U6Wy7zf*QzfaNdsD>`$Q
z|KLMIuDZ(16iMqu8Ez0SW%^*Lf5)st(lCm7E)QeNgnAeIg8aXbSXkJ$=X(rI&`vr)
zw@6SYIrUh+9$lZ`9!7`Y59*tOcg|&mg;_JbW9bV+il*e9ne;odF`=;6ct72g18#Se
z3m!Jb?WUKU5=<cN$S2_cB`!J|8Yoo7T!cF-C<m9UFwVv=(1)^112+@_F@wPX$NW3R
z$=!n~@X%aW*?yd2`cq83?}H#gYuFpUv|UTjhTYd|o14PFgA&p5iP6we<3&d@ASGoj
z9AkdeovMilmI^_@z2cKP;dGQ&{=ir=MO!*D1Y`lj&#f)Bz|vFz;V)(r2rlq#lECly
z$G~_Hg{l<7yk<vOAjW279giXY?L%`8kVnH7PdUx7IGHBTm0Bz87aj3&l3hm#Qhqc8
zqoK82?nMGkNs7$C{XK6dsVvi!UkETJM6B`}_<>hvWSZo@P>3z>dmqX$l}%erI1I?2
zvUUICmxpN3$rS!zWGwyWGlZ;e$hf^y04Nxt*Z}#@*`PpyGuH<H4+gLT16anl0|WH+
z(N00me;%fljU!qb;PDXycgEj}550$Rd&}UC&ZkCu%(2KGK8R)NZi#=Np;Z}no?iVd
zf&>^JBTw4$J3gRu_qRxw3QEa?5jcrq?9oAZ8y4*4o<GQ2M>0F|p!i_$%A5PQsK5r(
z`GWH0;rYB+^G&c2E4yE{r${`Go-ksPK^u(5J}dkli_?fsf1heU`}2kUJlSOLvrHM9
z#*aMx89r2@L9Tw2Ws!^QhN~AmC^i0nDFvc?VvJ9t%5-^fC|FLBv!B^aNyhfpk|0+j
zTe0l^-;zVqfnQ)BM*9)NmdpRQq|hEqH~<RFQls^IC$NMP{T?X9{$Az&w<UFfv&jm!
za6b3{pB^AZ{XbIZVc`G$<3FkVr(pk!vC^$}`H%n1{yz`)pEF*{<Nh!2ns8wBX9&BM
VSDAWz?JD@Et7UkgT+=D?e*giA%v=Bf

literal 0
HcmV?d00001

diff --git a/docs/static/e2e_flow_part3.png b/docs/static/e2e_flow_part3.png
new file mode 100644
index 0000000000000000000000000000000000000000..fa899a9229ea39b33e0ac25b30264f174c1f16c4
GIT binary patch
literal 279562
zcmeFZc|4T;+deK);!d<s_NZhhTgDn8gtBi#CB#@_#=eD$2$hgs)@+09V=F@TEi)Ng
z_Ob8#_I+R7pZoKCzTfBd{O-Abe?PrmA~V-qbDh_D9_Mi!=Q+K)r=fhBl7W(hgygi!
zo!eR@B$OBu5^@%b6W}*I=aJkbB!8$`D=6GkQBYvJ=j32%ZEHb7a_3c~{z;PvWyV_9
z$MO_3LC;<nM6<DTJbO)}_mlCKj{I4+*B8(E2QzZ%71+~$z2D8P;HWDXOjTl&eti+n
z^yzwuL5T4VKUr6g!+uTc(&FLH2=d4?ak|=-iDaF>MkhAJhV%_*b9BRry`pQJnFV*G
zpHX~T4m_?_Bga2^TRHH!!OOkcXdI3tWnMt?ddZ>0p;<`Oy({!2&u%Nk^S`HBWjmxL
zsnTVOoIEb~UVhk1uSVw;?p7{G0JXeH>bDr~!R&7{++L1d*JProRyat$&wADHo+AmB
z`Cddx7IQC<I+a}G>_-FALe_6G?(V|RX$1U#p1^+*ol*66+0}=|`1amq?VeZ@RxaR<
z`YKON)0$qfFL7iAJ9KSs)%_#?;prTYDBdf2mxS8}QsXZ@RL!McF;?+-eEu7rB)Qz+
z=9BzyZM=$i{99N`XunqoT0J|pa>d=A$ss8G!s_ulHnHb772Yvkl6kEC{xY=|{>%Qy
z3u9iUQr|pia6uD(jtXK;7Q&ALan(_m$DLkoXL|J~pHV&N42~xYQ)TV#IJ@$4U8t!p
zcl%0E7R|}?LFYIwW1rpBN<2p|_Bg`mLqjN2>07Qxk%b0wyysN>4|I18++Xruclln!
zuPMVM=^~}p7Q$2)y;?M;pi@!Da%wx^u->3R=I!$c!Ca1an$)aeiq|PAbQ;1U6yH6+
zc_DmGW$nOR7wITzZNL6TdQqU|wBD*EO;an?*vo0UiTd`eo+h=lo$eKG*_9SspC`pF
ztX`}XCrxNb4CIa>U>}Zs_A5^<%c4Kj4kbG#^TzKk8!5Fy+w$wQue7IZ$K@_>Gqcma
z32$3tWxC);`rVhIfm>pQBGZOhuCeQb*42|zFK?cC?q{-XCiLmbr4=?>DgW2otSl=J
zFMPS^^iVhK$kXS;LETffb28tqztn%+9mw~}?;FV@3ZbAUA&kFd%IR6Cjb#lI9K{xe
zn40K4>&)djM~{tie++qw#FXC=YiXtEBHsvjxf*fk?DLf8(@gN*`0zbu?(w^WBsYKY
zKV_y~q|$eJ!Rz|n!9vd<wfKnctG@n|?_p!NZ*iGl_c<TeEi5`OVxp|`zTyxj%Wc-H
zyxPuu=~A`KR?a-tLsl{T**!YRpoFg)52g$Ba!(Z$m>URV!<g@ny=C5d^0eu6KAj{%
zllsS{YO5L(LyK#Z8XFqY8mzkJJ1PA;Epcxp6=2HOI@(&S9Dgw?d>d0C3mZ4+(C9#u
zTpy9mZW_q>@O6u_&i1H|Z|5}0lKJuD$7Q`o<-?B^j4;cbrS=`Q{khzia^g#WJ?V>F
zxrWh}mn2C{D7USd<K_>jZ68Q=d^zoQOqPa1{?_@Rlg$qp)@7&`k(WM@Px&<@lfC!T
zeIWgb%=oLzz2lqDjwhcg_CNQ_>M4r}nf_P1a!<@xWY<a4fHM^SZ)h0m<ko4=eLGvI
z98W7Y7C^>6dWZMj>$J-;L1g#Y*4|vbbLsPmtlOoROTPO|2s)8U1ftl*-|pQxv&y;3
z(s0jN=cK57Uf0TX#>wP|Po!WM+HYH>ym%snA<dJ^=^lE*;Xx`LZmL+>HT^{PgrMl_
zS22&MFEWllx^F-k<=0$5Zos7%rfYuMfU2q^x{yDY-ZSu=<B5(s=3ms*U(Y=~CUeg0
znLrcI3PTmG><hETrE%|VE7H&hcM3S&&bmEsetx%(SN_z;_=1S1K~EWm)rOwqZnM8t
zDZYlO_Y{ixpdPPgqA_@PP)$l>{))_%&4@c!yx&PT$DLOki&#~;niiTilxCi$mS*2$
z{F$Nu`TSjK_RKd|C)k}ND#E<pd%fC!zVDZ!QkdqZm2zFag{eigg<6$rk~BST)h}DI
zB*Q~{Jgfgl!w*WE;~OFy)Ekkpv9U3+fkv-m4eZ_;y}-+q6xnR`4QC;82C|TS+I<&h
zd49NNvFg`m9R@3<8g}nL;VSmRQyTFtTv=dQ$UC7>e?K7e@(+Vg_tU#SIjW44C&-tj
zAql;N7wb;Dw|2=r@~<iOsz&5A<4lqb)7=f$FqXA+3J8C__j-v~r#x65(nzyJ1+Rzq
z!^<x`T3EnymayIsd?^voN+TF0=pv{gjByTvVPR4Uwh1>9q+!f3Zwwy8k9mbDa?U}8
z6I_IZGA=|kwOODavpg_0uVFP8c`2+UV%h)UrBHNZRX1bKbS7sHPv1a}tL{>@jGF8{
zS!Lf6pNK>F@xd=0Y>f}1zS0Hso~Sl=ZuAJf@S2a=^T9ly!jG;FLF`lXs7t*|y$^?Z
z>I06fZl%-+rRv7J=Cb3q<IauBp`LdyUX!`@D8l(#)7`{Elp&KIe~!O%aG#aU6NX3G
zf<u=0hr3_f@VsAhzuV^b!;#q%15))~3GQ+3NiSY0K5vi;@dz=FI<Ho05jA<DRXEBa
zH#hHHZj_Ozp>zqhXv&b@2xmM}__2Q*-&UMeTJcD&*kWMnr+sPllR$h0-lAW(A6}rm
zFf`w=8Mh$WMBC{8I^uN>i|f#>A;0l^zwRwP9eF!*anWGn=fw7-s)p_ND>+R`myY_I
z`?zq{fxQc-@aN<?&#OO)S<Wm<DEd;-veR-K|1J3y6{nb{*UY0OcBlR^r~1fIhEdFq
zlJ<>=xXQS;ysvppLv_;a-VuAwrPPwK)$!igfM26ag<YwA;|ZB@RyEVdI%TVvs+_83
zs}eOnCtisyHt$hz5O%295?kVDjna(m+>(LUWYl<#*o>U?nevgZP4LmYSsHKKVc$XJ
z%jp|)boof!M03$=afO7J?Pjt_GRHkh!OI0VmQCLn-m|>teb1}_u{`)|{POcR1#kK;
z<J^^`j^#(;=x14Avg<k@JPb?>EPe(&t$b?erbfm<%TOpbrjcfmcI7h{<?WRetkO_u
zX;|W=1MNSAuE8?6ryS>>|8y_38oTJ&J3c#R+O*e{|GGBeK}7PMCu(V&8P~AaYE&ri
z7)AULb>E-ZiRk2Hyb=--r+tU(6_=#;ZYG(Ap=`QjpJ>UI4ZO}=R#9eRoTVV2EB@`w
z`po{!$zBR;6>Dc})}8zNHa@;E0dH-Oq-Q)o+1&Wo&!Nw42308{ZfoAC62?B3YG3a#
ziR+J;jMGi*<CzNPX%Hw<_*`aL+x)7fKT`Nj-1|!L@c8H`SA!J3=C|>&52egEUu$Gl
z7vIK<_9CZtW4u2L_G?J6CviJ;;QUy37bqDU#Dn+9Wyp2O9jvZ)z-}5NN*}xIF;z;m
zPDye7!M*>GUq)ZB%r0@Js$p%hbGmJ$l*I5&O|sp`ow~6XLm~e3eY_d`9ftdex7yvY
zDYa2o_^i3axJ`BTm*ajp%&Li~KE8^J_TU@Z<vYyV9tg8I7j0*<S)pUFs}`ee=-%Hn
z=|5TPB|cgiymUhEaW27NrqrpGdyKm|8<FF!kIU^g(k`DG#Rrvy&Kb<9;tooDc6X7J
z{FBDw_r$M@p>&_?i#QbjEVmhNYRPTM(LL1l6u)F|R65gcIXb0gyk9C}D~dNN-8k49
zTXL|a8payf>B4Ig%BvsjjWfTJ?AZTu_|YZvYscq=Bo`GI=e}>)_-yC=ygcDtW5aMP
z&#b3Q=3-4b=L1b-fI@v~bz8N?-WQpM8mqnDO*2Uvm*fSuy$AK-QL^^1Z#Q-DK_VU2
z^N1FkSsM-eMJXna^1Oze$u7+>*##R>yF6Hm=i|xyv)yB<$D1g_H&~-tmZaahk3Ae%
zFCF0IOsaC?p3-TWDd@HGrQY3{xYQA2ZdKh`nz$zAx=p_+pguj+AzoTp%DUUPfm2|%
zXAY$w6c906FaOyik+nv+I-<tOf70Y|hjOW9C+DrcWd2o?N=NAp58Ua|&`fcpLrs<L
z)4BQuMOO+})g_x@zFI4{{9W;ZkxiEhXXXmlr?m&S1_K7pke^ACeJ8v76TbgpvwZ(m
za|AxKL(|yP--BN!ZZ&tWVtprY_}xf}&&Yb+R71G$_Cfcsct!qR`uyaVq*k+;TKq<I
ztC`(F_raFwboJqK#(Li2K&<P$tJN@PweRXfta49Nux4qJkxZa>jqn?BLAJ@(?SLfG
zi}zUUZjfvv=}C$olU!ULypxauW2L6M?VQ1U`<Lv)zDrI8<;S{6YG=$nMse-VB%2E)
zUnpmLwT}g59HUt}*7fR~^6avq{qkTI?`=1+ZJAAN4^!B-xT5p5gO;Uk>3i9jXWa+2
zBrUW4I~DPpKxdEyTNtQVs;iR#i9td^LUxRSgdF^I41CEPWBm8eO2@8~9RK}$QWBCt
zYZ9`5Jx2q4hyJ_)U(hjsen0;1CCN$fue0FGEt&MMXH#O5kN@>EISY7<<d(LAiVFCy
zZSG`YVUK*`fI2TZbsGHQ)YChLND>mdtI*dm6|F1F;Pro6>lmO6)bGN~9qjlYK6ZFy
z!S81G6nY&JDK{AS(ar+(kj>4`)*cCSlV<<@3>f$s`n3Q%+wZ5K5Yp@h>i5_b9GooJ
z#P|jI1=(dN+1S{moE}@kv~DZ?>u~TdY4#^5)Ki#%fUB!3zpF66gOinjkc5PUfZz>*
z8#nmCGx(71_Na$$eD+9=KVRgp*ST$hG<ULoin4aFXM<k%;UfoUlr%d#bfSO%`SX2R
zxLN<#ne37Ox-4*k0?;D@Li~aP|9)+7s1)>D*gb1E3tPk6)^;Ff;2bhS!a{;lzYq9t
z5B=9E|Km`D|2p)BxQN()9{L{-{lACmA}yR09PGeJQ8NE^!~S*fe?IuH1EmC@YyXc}
z{2A!qzXg$&p_CH%_g#~rJkv&Y0B$6c^=(ZZ@ExQX^oKMY{B`}$@8D-r2CDQ{Rc{g!
zITDrIw{+Z&%@3W7H?gRYT^1*QqaiP#b^O+yd%?%#>5qSe$3l^2PkAm|t>VD02;)|t
zVNSbqp5l2&PaF*e^K%-C%g<12TQQ#EmHi1ZNK02s;i5fn*`#V=WCwB>*|8Nb-5e^L
zI3v1K%W;W}f`(1*8ObqHqJEgYn;e~tNPyD@DiD1PIKe#{8k94~KRFS_kMw8B2)HTT
zNyUG1A~wP-%Rjgr3Yt%9$8O;;RlL-}#D)Nhmt0q$H1R=$0uW8=k9Kx9WI9h|pnu<$
zXURF9|K#fBlKIKW;B%{=Z(b+vcK$vK$+27dTmR(hpUJ@~DKOYc3&(pzCC$Ii0wS>Z
zPp+QC4|ARdmDk!jmi*T%5Oq2-_|S2pp7__RI&-lRjH06(Zqfde)S<v&PX6@@M4fI{
zORlSgUmzra{hy=`D4a9@TR8t)IRB)e|F>{JLH=*y{BOtk|J!kTs?XTeJwGKX`}Oc(
zPv3$ytmH+ZQHGFt9-JA`>YOuGX;XpS-EESP#M+qdL{*fR8tBZyOYV-l*&I|(8ss?l
zWhQ1Cp-XBG9e;#5&m#2mG);1@_TSJfxoh5NbYw4qjhfSIckOe^+t>(4y5#m%t@0rq
z?Fv6(D{W#LSAOiewifEmWot@nmY5*C55_++&;7umjgrds)IM7zf~UMLIUI7z<-_I0
zE@e*|&CRh+&l}{pPa02+;UC@4bM3nkI-a$$6lI==)lKq9{PWG;m&9h}!%Jiw^P(QN
zN`a?bLO^fU7;OyBYGkp{>H#1|M-B8Sqjyuyd|f|&==9cp`NsNP;pHFA-cpm4j57wx
zVN8aLI<RW{FVBu~`D6<*Od5;};2qEWaQaql6k2;*tfw%HSyHS)ldoxcv_9vCHwQC<
zLpq;f#(;6s{erkxD$`&8oN@2F(}cg%nWF^5D!H4wmuei~xO^QF@To>g`_<qr@U3l&
z`_YBi)T}v>_WiJpX)P*gNQqsNGS11`sYSY%>Wzq4uG{8?=2#)@Or(u-mS+2nyn8=%
z7nO*i6Z1+OH*E82z+)Tg=1QGdd^vWYNYuyIC>)zK?mgF;H&?|e_e@S7&={9=mw-hc
zd6vF?g`BsC%G*jXJwLxFvjUp~i^{j88lkA%(DP4i(#-ABrgb@(bF9E?4(69I_3Z|}
zR`M_v?I{%NS<8MK)>l+AnKibQ$4A%aHQjHd-X2wvy&?NW^xqGfZrFkwJSEwQwXrE}
zo9zF6qgIxFI@ao$yOow+_b3HPw3c9n5EV6^T7{mAg`TUTAsuct_k*QxccR~juQ_Xa
z#TLYfAqm9c<4+&zPVDBjJ_9X2oDEZm1O*MDACN5Ry<K|gJ&Lx5AR77CQ^|;uL%)Kz
zhk+^J%8r(e%HdQ;nMS_dHfhUGpu0mJ58a*Lw_~<{wx3}O!58T3mKTZ!f7Rqbe_6K?
zmi`PV6zmN+2(|-*utzDj5nMDB>^@g0*x+gXMvVGUusy)t0gvrw2&MjccM#*y-2soy
z#x=f9%-dKnic1ydIYuh20@95WzHoNhi1#PHv^W-eU(d8boCWn-;d257zr)FTGCQmP
zMzk-}liw9`7z3i`q$_1?%$vQ_QB)Ee3)CtUy*UuQk}H{sO-0T&;Wpl@ws}z#Ki1qz
zH5TrNYJ#_U&sH|j3gH=H!@FXe_wv!6gp~0>9LnXD6~c-<#9^u5XfVA<P1;zJ$H2?8
z6FbJAU^v^4zf|2b;87Y?I@89`iR~an4r7Z-iq(~IZlx|d=zW*Oyh(2urqrkt8@4#&
z0@}_KIvSK+6ya8WUO-;^(pr2??U$+h*}08o4|vvEj28q7+|#*pa<FC(7_-!De&2vK
zP*~(}<HU1`|Cv3Y2pUq1mVVcQcIS9MtVFp)2Bf{3)2zFcapvZyMoy3(*GrS?i%P0h
zM5EkF^%M#Zm=g0A)M1t1ib{(78_Kq9`4)Tn(-ZR&F7Vb=TOk~yJ9sy27hapr*hw3!
z4WKMT!KJUOI?VMO;WJVZQpS?p`aU4*R%Mvs#(7q9^RkCqTjd%j0BeV_vk~yLB`1ci
z$>*&EDqS7LVl(mAkHT+>9%)^F-RE>tXHMXSka;Ru)0pekML(l3n}grQq2*TmHmu}r
zqCQket5vJE3A-u_e_o949P15m6VXAnWxrFuwoFgE$b!EU`@8CG^D?H6Iwt==i~3(V
zxC`Z=c<3c*<KKA(<=|{3l!JdF1b`f4#7b50UiQvmc4&d&DH=i;D3hU;>{3`}$4g^l
z^~mgvlXi0w)c_NS&_T%va=cgzVoxG0L*hNYpM$55BHjIP3fHmNv`I#RG6RCr-pwwq
zKF`sn;gDvQz}3XcefVJJQ{n<qa$#M{PiiFXQcN15gGm+&JszM`=>_Yq&UQcSwg6k~
zi0h`#*qN}Y2RX90VL8^GL@`5YO*YN0l9FIcuRKwJeQac8@XBUyno(><Mh10~I`WNf
zK}r2{u`9$yAW}|bAtWj64?kSkr~a36TR^8RDB(o?(UB-*UttL&+$&R_s8Dv0#VVlN
z^O+^2{(7mizh6pNQy(|=6oEX6vq$Y}yddJPJR|XgT?i^bOvG_pPvCZS$V`n9Zkowf
zrvStk%}F~=e0Q-r{}GFoU7+M8Qs&9gpSn#bNrjt|n^qFo`%nA9z?;iU4Y?nxU~OX)
zyJ{v)7&bb6A4!}%yGP|WMV-%ls#@unsL~pOFRU}3jN(Tia5=n90<)PFk%%RV3I?K-
zBtRK5zo`Pm8e-U-MaIi*Sj(A=LgW*8sQ}ZPf$GFW9)xT0S{D<_&WF#{r@LKO8RsOA
zr6sUHg)t6;Q4y6?Aln)JK!;gF6rSsCFZmE`L54{J?_#Smqa%o@dv=U;NIqGDfZxY^
zX<;hF)ZDIi9RLd>b44^!@S(hojg2Z`A1ViXTS<+|=37Jt=aZ%%MP+078-%whtFmIU
z9=N8GckMzBYXRb_91{!=^#h1}Z)B=ew~@Eh$<_7@6p|}JCTRrlFr2|tR5T*yMr%c$
z<c&%bZ)kM&f(xtMrVe_F(AL&&u2$05KPtJU!oouoD*VndKb9*1g<sH1V#*seD`+p{
zC@P6f7%1ia68XX5<gRik$IxepD$CGg$4{hf3lV>Q(6Hg4VK=(UCGw*kDY~0QNzp4d
z#HIhgfF<n;!Kl8H&EdN)J&wVYO#2*hwU`_vH&OX$`@|yqO*-078~|b&;I9F6i9D=(
z-qs)Z$EB1IM8-Q(BC}RUGuioE{Wjg=cSqoV{>TI=dm62l_$DXN{PZt%6(Z~B4?pZ>
z+*HqZq@oqhO%zy(0^n_Nn}!p9F`W6DtASpT`>}`#Ud|xW?vbPR`|hI1QLj}mj*5O)
z82_dC96+0Q-q_=UE*u+XS8aQV40Q5wQumrXV~%?2FZkzjr$N@`Jc|>bV6gTjI`1<Q
zo)yd$7nNC&GSdP)4l>HIYYbzK8_OIF(m>0jC!gnX5Y;H2$>B~-G<(m?<DGH!i4^a_
z74c<86n50}AOCJc<jwk#^=w~1!SrIFVsa?BQH*b@SfwXcRkMhF2i}z5{raYz9d*cz
zs6Zpdep>bh^%o1^r8}=UkH6*7Wg=^MR#on237S7J;BuD+r~+mc3##B3@E0aL!aBr4
zt~D3iJdAH+Ax_R6<jSf{1-6vBlColoUHdkXNryQb<ggXSYfvHd`1_k5wZ2DASFyBg
z_bi~)^J_fLFOOz<q)RG#n#gOy7=UXE`MMA$M-5(q>5eL~V32G@K~cH+dTySVQ5gio
z5go~KmAI53@#ClYPFdL~?tA9ajWnvTZ~XtztML;fHE#-2U(vRqsEh)IBIgXH_?)#E
zkqJdZxJFus9-5Gcg}#KyI-zy?*C}FaD~i<cA?~um%QV6w0KR*SAZqyX*hpd<3g(qu
zR>9n}W5>1jF9PI&^2nvs@*1&`vu6jg{Qb4N9|R|DQBDc+qo@61AuIkpZi2|($kqiX
zW1nZ>kVgY*3FiR)K(u3%D6aNbg5LWGs_?~w7Ggv8`#6k}T-U}?d=mhX6MtOn5}o~L
z=X?Vk`dzaW(0DapQ&dt`(OutXCH8KE2J=Pa0%7GA4uWf*%ky~NQKIh`C<nm>G7qn=
zlB_H)^$&s{hb|CCYJEQzA*%jK=LMk_=t>PhHvo=fMhb_=U9CDxT;uy4y^K(~aB55#
zlf>t=UEr&zp^N;9O*p8YlQ&7F#R%DPhy@3J&wp@Q3Y1c^@(FnB3zOs8;<%1Mtx{r3
z96}!*W$0kYG17AQZ5RFV5AGO=pEXa{xIcOlQ$bmwF%Z{1{7=#?kK9A2%NZDWS>Vsc
zj^>8X_VTE<_og4wQPWXiixt^i8mV2@4&7<Hm7Gbj{wX=f9xXjt>XJxgseL-*_oVA$
ze~DXY^4y!t3bW&1n8^K3&=T(7!oB5CrmN;Xe&UZiE9OKZ51?;06vfo#rHKOmXj+JG
zeCO;k{~aNZrxTTiI>ZjI<Vxk9o5aP&2Gh;X8oh6jC%sDUakooX9QSVP*##mm4Ky4-
z3XIaPlAm4ig%Irzrdkh5MpW3N>jTdS@SAfH*?xdymHZ5iW`16D381<(JCvkxIg1>`
z9{$5bP9GP0Zs67#8p7r+oYRoW$v-Z>8EYaw$@}QK`bzLAQ**CKhh(7BYgXkY2orh!
zSp{(V-E!)%6i0H5GZe$dY9VF`B9F!dfJ+}5<%R`Xb9LnfpfMF1t;Vf2#3ni$8Oqt2
zm4;9*S9TgRJB43~tBV4+?}?7z8QFco>J6;%%tF}+e^nTxIDh+%R$lAHifIjGyQu!C
zbGIVB`oZo7;)gbB@Ne(9+;K|6EdCjN`(<3HTp2ayr4yOyK-g$~U>SU3P2{}W){twj
zgU?!=wHw)vi}a&!LB)ekt&==@eS)O<HM=&j#qx0{=B2F6#8}HXyHb;q4I@;K3TL{I
zdE<mkmAY8}6+6sKM#Ws^=j9NAnmghnUP#RTYHM#%r;IU0+2P*EQHRv?;cCy!3;HHP
zd1b>M);|j#S`)fHT7$z{2Q`lUeYBH>NhdLwmSSfmZ0Qg@dEf-x*sL5o1phNvKC$}E
z<=4vCRZK>0Amy%xT_JtjeX56GN=k3)_Hehq(<jPZtDAPcdTY2fH)q;knZ^A|Ue#)g
z_3A`(#TjHEv&$WNGcU)*T_gI&!V%x2gPC_~{3`lp-p;W%9Uo=7N_0xCr3FyKt}oQ=
zEm}8TvYKD_x<*8Po<DaT*XR8G&E+iLqr(QVqStca^aR>lxTzc_KmE%%%g|l-&}aRx
zI1>$IPwGtE8RO|}3THKY9I6<~zuanec;jI7jPG};(9`0Bf<qp2c`?o#CI!2*IrQ==
zkxb?&8SnLOWuE@DYb7IIYwECt;@+NqtE2>Wlxc|2(f(Sd0=2}Ih0+0g>)n~m{09EE
zzt=?TPyMvu@PEl`KhSZw3HZZxzO0je&N#SuD1&G=3w8R0kZr-&6EhCJd&bQhdLn2!
zG6`1S{gt+JH&?%N^wKIby*1R&C&!r})$!mx^T<>gTE<*ej}_tCnC;6Mv&$*@Dtolk
zS=_53nNGMfaKRj;0T)cYQ*x;aUMRWu_fhqDBUgcjFly=6S&c|JAHd%B^|%piG-e9J
z`DV2sCairAHfPn{w?_jrQ^R1{9_M1S_{n5INJIu~i_$?tbFaCv6PWy_m6*)DRuqjq
zX3~2R`PJBu_2CP2hL7J;+YQ8ori9Ejb0(QkTx^m+O&UD;_@XCNeE0)9g&h%CpMCWn
zKY@W6o?4W1>)Dqdz`M})-2Tx(YTo#oi)<O=R(4@&G0NCph0(6~e#1b2at%3)2jOG!
zY<A8R?EA`iQ)b0fERVij^@Rktu~#$60o1e04~JX^?6Pu>LOz0&{@B&9F&fCaxa{ca
zQh&)RUI^~or)wRdE;ci-Q%ZyZdYASIaAj!S>?GO$v{L-CAj4*JIV*&mzhdHD@pzb|
z%Ze$_$WXcCc#qUtoA%Dj(oYCK;f|Xe3ne(yn5OdWv5?GYGarc}Gz-<R=Tdd?#5=VN
zm56K3+shgflkbZ=W%f{Rd#d7Ivssxvctn1}HH~<KnGD_hB=@P9-heYQA5NTMG1;h4
zzw;L-{U7=B`dvRKIJ^>b$*{AEv;)%(Y){68VCSN7W}!#7VQX!|bGx~8rf#F_yL0)t
z4Ix;0*s1w~dg_@THG%d)H-J|v`X-KwmT+mhc~HJH;lBIknbdYTxU2eff~#rf)c4Aj
zpM~bVvpM;R>?WoH9R3~QQmaAvCq6|}joth^EhQ&Tb5X+Sad%Nr7`nT^4-hp)pa&Z2
zDy>06GP0Vnnsu7D@|E4inR?nuv!<BOC4c$icf1$C<cEq42v9dc^x7~UJZ@7lRz0h&
z0!cMHQ*j#1_^yu%y$4$(BUuuww)>j{4)pTq{OV1k#MKm00Q+ho{Fo<3kKZcxl+_+A
ztnW-GWfE-m>Zk<L04ARwy4G0-dWXR8oN-+mc5mq;B5PYHMMOo@3G;ZD+uud&AZ@`1
zGMA5TSpB%)bds-(_eP&SGk)z9XZ#y908f(vQ?HeVnaYs^do;dO5!os28tZ$wGr+%D
z@s%99+uQkO*EAF3-LHY}VrFDl(syHSHjk|?rfkH=GxH43A?e1~ldLF@M5lA#_7Ug`
z%iU?&BSUm90b^*DAZk~8usK6tyRFzivZin9eiaVRK9d%q!M#i0kP=a5<kqLFpAK3H
zrtho+5#5&gT+kcDb9l&UI6NfF02=|)-E+0iVHp|zYxMXTsW<L)-n;86v^Mb;QHD1V
z7uK2lBp1s$PBV(}u07w|T!@p|C8Ub<-W9gMVzs}5)5eMoyNzcv_W;z2n2K|#$!^Da
zq!4a0)^>u%{dBG&W+^ktXBRc-*pxoxI#Qi7vgF3X<n;aW%pkI}eNcJM|5m_>bnp}y
z1d1DvmWa88v%eE<feaq<+2CgYbOp-|4inl(Anki?i`t`P_U4P)dV`)CdA+E-m0Ti+
zA`2@p#|CM9(UjSFtY-+%3m*yp8gMcb0LbOF^4}HH$msAG3vit~uc!kS<IK!;bNsb%
zkE!Q^Zg&QhVVJ2{M2{*@o=&$*UI-}Z`8pqtCvmQ~m4D`y;<+6vV1F+M<W&3!1cn5-
zarpMs5HKsx*JPD%I4zx8e++;-(QAWodyvDe9I%CHSU`g7ums#~^hJfug$*XZcJUFZ
zA-D0+7|#8*q$8<=8BO1o+?-5*@K$*iDy9=-0*k+pQl%j~BslF#`z>Qigr@U-Hgei9
zs#J~PtVvNuHd*qx$*KWrRv9U{&(36)S*?$|IG3R-sI&}P4yE@dBfzUWku;DP(E0Za
z%A4YMRn+BeI7%}q9zcqHsl@TI1sS{Bc8J-2%3a0Q>}`+LZ5w2O9Kw&B-bC<V&g{sh
z`V(PqtwT~^0W*hI#PyBWy*kH9cbJoSMrNCBZJEDv{&R6710szu8!HN7G0rBO;%pKq
zql!%U!xtBN0Aq=>jJ3`f9C&;|DG&>~lvs{!%P!8$S30`?{pqU9|08PtXTc}egF<G`
zC>kw3|LF?T79lk}12C~dHR`Qafm+_@%ZG<swV8$HO&MFmo&t(ZEp7=S)>^UVVG@)_
z<c;yjju<+lCm)Le^T;g08u2Jbe+OJn|KOtR&P2pI=tGtrl7NAv&t$}*;X^t3HL>i3
zo%LSL%;`i=G|eBO&j@GLc;AZQpQP65mp4tTDjP^Ge>pxAsc*`)Uj=Ub3*65UK)>z_
z2HPiu@Rb@cz)(*hxS*762rKOIRz4VTsD&?g7A<INN=JgWS>clINDYAq2C$o+wNBZj
z#!yE6?N@bv$4_P~c}+{cNMb!)4zvcmYoRp1&)<8qpYs4*VQ0J#XkHqwL(clKQtnQ%
zP$RNR^44>SbH*BSLhQy?J)LLV6*(EHuK_5Euah0a)(l6u)Vn?WWbAsa;!@3?y%DNg
zk!s5{(T>0Tmw$09f8_+1E^%wLa-5)KB~LwBv*w`r+C^bz8S3CYXZ+%sbqVRahRrRI
z?P-M9?nBPFbO0*C-hi|<w6yStkj!^TF2!#G6#4P?*ORQ~Ex=DvtIeFzM$#5LdrP%R
z>|O&>!|u}wsQJPsI(f92_lEA;m`i^5DUrHt0BY7{=%4-+#f|z6W}vcW#=~X#^|YM&
zNvU|>Z2mM4m**S-WFzM>Jn@3~u$wvFYpq>aje}$tuqbtBAKDHn0DM%(aQU@|Fl3l%
zwMROIWfCAIFOrc{Clam)J>3ARB%%dg^r6OKq-F*%rn?{}whtWwPM*;KfMMG&t^8eN
zF~la6;-^y3&c{HO7SYK+gxlUMf>vDI!ksgbonQQ<Y{-RYaLK)N0C1e%$!N30OdTT4
z&je^{c_q2M(v;0V4ag18;Ahs@Ap5uO0VqS{1!LcX4P2(e8EKK~<vOYcJ^d<M5LQh9
z?dGu2=jXJn>f;O72zUvPb;9SSLWt5(B#VVZ$ZuEJKv&`aDKpW-1`pUxoH*YOLxO^)
z<U%nDbn}VDVMCkG<(t#-NDaJw<$`MDWBzc2%l=A}6*jN1kzpp$bCK(ZG@vFk;<Y>K
zK;*>TDC5x+T&h}wVD-8kAkg65SQtKc<@gpSnld-Xl^K5{ofo|YQT<6|miW1Ackgst
zmoac)M$teoRb;{drJ+1FKFFwJunlfodZeBa7f#QSFO@3y*55KH2n*yEK>8sZY|rS@
zm4igqBBNP*Exk1;oZ#4a$z7Ev`&HLCx^fYGd@z<9&+o7T(FznO7nfO{rSZ969Orkz
zy?sBl0NB$w3KR&P&Dch!?1A+zpe(KS=XmzEmXb_CxJ6odi{9rli`$#vZF2G;{4)NW
zk;=nP!(?`ubx4JWx&Gy8HCjSDL-#{*SYc!5TV<A*elAf&O*u=a^p=Tk<)+w@FeU*F
zK)#(-t)@fvXy3Z+gOD{AkOD2_FTax+BL|DF+A`4|$fJWTdQ3r-ky-O<c_)9(_LxcB
z?db8FQ-lKJ9NJm|+A#>l(D1wQHw%~dB6AFA|6XN6kz}TOvYm|Z(sf<CDEL5b%{YI^
zfDIF*L?YA~#5P1NIsYb8#I@b7Y$%GIX?LZGb$U31<Hd^Zg70o`5+$>#<Y#X(?vtk(
z-d8}yV6wbl&wBW~(9WB2C0Q}~Y>&=-N)6*S-2HY=GfiE5NTeFjy{iaV<rt^zj>=`;
z{z})SLG6Ye#XI8u!G;{LIVE~Lg_|D2wrZtu1~3gY7WKlNJ?+xaoq8#RiA%r50%kN3
z^otolp4_n+GgWIHJY-eERKk=H9XJoazjjCscWS<By|+--`JrSjCv{-)`&$mA`gz|?
z-okHZL8~Rsbn0^SdwB+<q};v@TflOV=F>h7VNKmTWm~yWsttQ%nJ@$aag?dYOz!8w
zxlW1ccoASDtOHb=7|sxW@ta-chEk_RhCv0e@VS*gCT<9DMlSz%bLdL@#Wm36Vkn19
zrehK4lr=K|(l4GZ)*c-!rOf42EI&I=eH~@eE;$YH<`dLRA9AEfiyvw)&?X=`c;R_(
zw~PQc#?OERwkaFvPF2n{h!))hVi?uJmH9Z*0v)~<J~A#f4vYvN4<HM*^G&N)-@9f{
z;c5?^VIWS(_LVM$GwGluN$BUX|2?UJJV+RS*YYi#*3cIFe0Dve$>Fuf@D0rMn$;Gb
zn81r>=Z-*Q)Z=5@8W=egWA<A98nc(@a?2~hgX|#6#Hl$rBWy7j^hf)CJN7$_UpxEs
z&7`XVPq083=L3o;-3wG*w@3H;EoD}36buM!r0dIs&ks+Ie3Q8S%lpLzz3-w5D3OKW
z#pFrqYn!Za)f^!i(2a|KXsKD4*4B9MWpE~W-QWZCV!>q(sE5oKbVi?sR!gZ~o?$hm
zFfD_d&P)T}CasH0ywfGx)WbTsqZ%%hqP8N`#1w(h?~WA5tPyFB|ImZn7-)Q(im+Qs
zu)eVeb)_i)fhK#0U(fiwSp+$0Qevnm)Cv3m+~{H=ExXABKXS^CJ%9^YE}(~Y%ab_f
zjhch<Kl_3n)?)v;?M7=FkTkXInG|;$ais#Ezq2n))%^0Og01&$(yAT~Z`DN8nLPcv
z4kTVW;Tz+zjw%iqLMgCa${geY_obfpBJV+8L|%!Wk$uG^rOQLwk4?UZYf0{60zbZ0
z$gF%jS25RmfyL$L!x@03eEM1j`e??viROr2-lDd5pJB_5qP_t8ZfxnI*?a=WT}J__
z;nvqPpufE23s~KZ@yM>8rJX3H2IvRHfHO_U&W?o$Xh_Z%D4>lL|CUSscCb+<$sYsI
z0OzlxoOoS!yWP78KBV1WT?0;weRqCzk{NXmYEe#oQ9QxPLy#_nRJN1F0@e-)MC%dn
zEp@2H7PX5Fyx(xB*|EgzEmrm(?kz!NNZi658>b4p<FnF04<Tp!ALlg0hfp!1cHumA
z-n6R-$vQ6oB3AG9`vbaHWtH8wCn7X80#2Nc&0e!-@-?X>q%bb6y{6chnwiBwrUZ3E
z>G0BB;dY(!#FI=<<u0Gcd%&NIospP$Q&&-JYC3xWb#$47_1^PCPb7uMOc`!IeXu)U
z)Y+nO?%@<9NEcsey?}7Lw^vgZZsYvW9TZ?s6RU5$Wup7kXXi=1LqP6TYquK&S|aZn
z>Z6g%?^C#IBxXOQQVs>J-E{}bGZRuAnpq4)7U$)zu3I=l+C^DA<)gy`ZPXVLOwt!X
zY7)Y3js=-;x<EXOuk<IozFk%d0R<=!A_D|4Uq_{KvO8}LuvY<FoV`U3Ijh(5ExdWS
zv=-Ua>TAfplm>*zU6pFcOyAHV(xjvzI3-}J(`T~?qQ~^GJSD4kg265*;q(ohnJgbL
zQx?Sbl8$zg<gI#Lc!GI90HsR_*9DAcfE{5>r^q?<u>NIwIklnrw;)>bEhlH%JE2`G
zKyI6&bB8bubjG|xj!n$g;6^%>q20eiSuBDgbPXoBngL1kc}=v_c+nYPyJj@p#jxUC
z9p+O%AS5l=1A?-w>WXB9=orgu&%#vm%mf!z-<?)7Cp#9n!}wNKP9xOqQ+ON`SGH=8
zs=Fp7H1mj!Eq@nZ0Q%3t2TIltvVVu1TKOt8crkGP;x73L8?_6NZsUR#O)+=xIIk1B
zEhMc<6L|dNX;a#S0mJA4r#xuufrOl*c$=y+YJR_2)8}0nU|z+5s7((8RUjZ>8*LRp
z(f#uNu;4DF>rfpM(~mWn6VxFd``I~M_Ry{2ay!LF7?7{HY83F9=rA==(m_YYmzbZX
z_Sz^n)t`}#Pm#3Kqj1YB!E&Q$I`EyqaWEky$LZ1!d8Ot!C@Z55ybpJ#g~gMAitL4O
z%TT}FpCIT3B03$r3h1gTPkxotKP+n6-8itBP+3HevQzG{qiX|veg?9hrIILUl-?8+
zaroOhCQV*a<1M_6IXc|aW-`CZfjN7IMe3%0bT>sZ3-AeIdY8(_!yp^FITryJ1f`V;
z-pJ>a2M)HfKKtA22}@p_ih+13jxZkB+bL#RgN}2Uh2BifT~NtdWY%h-vWF|-*1&iX
zD8US^QgjXj1GnOM761WlJgQfHpuN}S7FlpDi1Uv!hmq18Ctp*bxO#vUa<5coDjfX@
zpaHirJ&!=ua-BT=NNyd)Hx^*>8d@mgz_%vrFo~%<-3Ma7X-S17nN@qF>j41cgvQsG
zB66hU`y742X#77V=>Nn~LH7VK$e|p@o6SKmdY?W@Uvs!SXAPzs?anOSJEHP|375JX
zkf2=KMHR^?lYp3`J~={t^Vc(I0%5U;NN~n-q3GMWU;nb!bM3_<Z{LJ`Kut#5f?IP9
z6~mBNfgIEpT}i-4P=NkVXWPNg<D}8PSweuTo`<1_L0f_fOh8wU!bvGvxRWqc=^BjA
z;>j!4N?et1H#=O7hU{t!EMTaE6{G{{*C15v5gV}8w%K?;3HXC1Z1TN!h8O?V6hLWp
z$jpLDkz!RTb3E*I<x-7ggLJ&r#A)a07#@dq0Hp7Kdo`=u-r@H)AnY{E`JdwRf5*_T
z;}ohDkkhLk0MsNo&F3)Z$~W<dUOi*G$hmTGQ$DQ6jqG28K#jsXic-65$P(a!3cbnG
zTLTRhvLjFHPg?_t{XIAQ!4O2Q&R=fR8cz+EQ3aM_>%Qt9c0gGURexICw)*<k-UU5_
zk6of7hycRHJzx~+46cYxNdp<u13)|hYQJ@z@>F~xlis|*W9|R!VrEbarbg*jiSF0*
z7eM=u=>Tq$NlCk+GLz$N7=X<<*(fi#=Ryfp!Xq`h_l7H=#nZzGHQ)j)vb8=^*`YYW
z%`|MqispNP%tbn*;Wk<6POj2+iIqDWKeRQ~0YW>hHGR&f73pLQ=99eN5$P^@vIzw#
z&dWa&kv0~@<s3>r`Qe|fcPDZc8YGatQlHahbHMf9Jf!%9u07mkmWiZ@Xw=X31&t>L
zdE2##;(XNHl~_>~TUN8UM5`)LwblTRcnytIIPo7I0}iYP;cxR!OP<?IdbAc9>)LB(
z*Fho0re15&l;c(=y`V*3Tccr@+S_02oTh#yrdi%^8JAvrxRDRZ9GBuEySv+eQN^p%
z_NKHr5wzV^4*9}S9s6$whclT;85I2bu+4v||7rX@Agd~nU4q8joLBth4v0^SXdf8&
z#PNf&HYo`vs{CjO@pAPi;LuLTSmpv)4D0UhgLnuz5}<a4#yl|U2|D^Cf0?1Unz5W&
z0SqC<q$E8UDpV2R7iPG%GXR{Bhq`|A=c-%ZKRf{3TT=*lLhbraHBLNX(wjf!%le!|
z+vixo%&K@Sm`BWaeia7@jd&hty%n3D&@}O2b3j1fZZ1WU9xhT1UOSKef;Uh$)0s&J
z^Hz$uNaLIKgXO>H3;_GfO$?0y!RrCO2)s1oXA5u*WTXKDZqQRN;l+$mGl)FNws4pE
zCINK|ch%l+ug+0zS)s?c&!1+7iAZn%3aGFQ9w`KXCrCWw=j>YW|Euu{_#N#}%f9F`
z)+=kiId?V6Ams@K=Iq;gYDr$jAmPsKCfUQclIM+WYMLWBGl2oXuV2;;@>c-R7@PDA
zRbXRTV8BJHp&hEnfEK*l%~h6azWnQJMNQoSq*I!y+n9%3(+3iqTDU6ea~x_9T#Nu~
z=Ef_cV)${^WgCyx)z!J~ax;VEGll_Yp~aq#Ss#KsYV!NQGMGcPi{joV$m*Gb*$|fv
z53{@EaHE9R&SZ3!e!gksVv53sL)D5>@EfOnmZ?j<u;PU2i$qKbLOE%6BBqk2Qo}oM
zIJPsGdS-)7BF*a6(=Nl1eqa1$Dq5rG6)K9oLwmiQLAX;28N661+$N}?XWhTiUHut&
zuoj3|eW)LCVFscYMh-X2dW{{bbs;2mY@;Q#F?Pg%9zCjd2X)k=rN-Ci;@I8!7aa~p
z&t<=WT3as=ObHd01e@LM@o+0_3Ewt|St1ZO!!C}ModBS`V}bZ@*lL5YYV0TbI^2F9
zwBQ+lB7p8Y4S~)c8zy_W{cbK!pUHjV?Mx6y*ptH#d!kEAeSo|rKxBJx&81Wjwmo&)
zO8|I%GeFADf2Ogw>TCy}5ct1g`M((pa^n=+QEU8qK{J2-UjU62dSS%~at1Ll7o_FL
z8+N&qUv^=JB?(HROvv}fHQ)X&Q0J3y39uqWORu!cc&NArG)cE|(fzpz(z|2mRrw&U
zu@)qeHK>YCXQ}SD!Z4%@YJb7OR}C5^qT5qlAo-wcoRiW(Zzfd@C}~V@lYUQ=ey=_Z
z>JBI%ey!|Ffu)}g&A^M$c3%q~*7pFY>ULStN%GuUOh`d4fMJ4I-)a>r<k6v;uSP$P
za$O&Og@nY}jp=ZE3~k+F_S>!UF*g?=Lr`EP!KLqG|C#?5g#UL@rz-$V?mW91T(U2K
zHEg|a>25}+z)P}J)LV4FaxUr9n_K<}DVE>z3ca8yd$1092qq<y!QdQ;#aJUmBu~s|
z{<>Tsl$YLj=8X&jDr4QNE^b%-X<`rXqZ^9Ry<uU$?REf!F>zZny_qzsOHa0MAWuqA
zLPG&y{U<U-ayg5<uWY^+mj<fvDw4H!e^Q_qI2I9xI1JlV=+2zQAApM~2KK8elcm;+
zBW~jcwx#ETX^*<UweaM}d+G!BZjA1zuHe-9`{^akwyfWi{fmY#OH;uT0Axzr(eK?&
zZla*TY<^H1`pFqvHvVX&#=93N{r8a7Po1<3O_fqoA1BfdnWW|*teU`vzz1p=A-T=k
zV`Db52He*3qur0j!H`p}iN({lP*<BTgl!a}uPI17Wo0k#gZs+Nkrg|TY=mfA8^(z4
z_Dx67*xLpbt>i1#+QrQnfJHYY!w<0hPi`Yh?*+_K>#pQmkl)rGlCgsz`<goLn6+2%
z<Cu~ljI_tS5rAkfkadZf#r2{QoSGUrXp9Zyry$!4zq5y=5o%0k+^1tr{@!To8i&SL
z`+OwH&*jRfFiK9+XXll+XtzOgq%vz@Io6q52vG@OzjEi~&hG-3UJQ&Sq&P_9X(#6A
zzYm-i!Muy2(uP{~4C~Rh^3-VVzx<z;Tps-b;3#EK@s}r?s5~431A`bec<^@&*u?!S
z3{z9LIvE|R-m;U$SV?USBCTUAqMEghK1l$-Hm67Q<`y-Q4!DUS)*$uU3=e88-18N5
zn!KfKe-;E!<rjlT1T<v9Gz#h9@>kn(t(O0LT`G5#G~FL91bwQKCq|Xe&;Dvx!N1nX
zX#CNNh72ALQN|_~k-AO^3eN@BTwe2vjuN_4waIR+y>=b(7H<b>;jXHNz5PslYJ0i<
zj2c!X|L3C+z8-+3xc$PRIcQQdcBU%V5$r%@5)Sb(g<nrFrfJm%=1m_=3i!qV#uASW
z!R&jZhM?6V;VnjH<s;CjECGH7u`K}-3Bb0pv-_4fEOK*ksB#GNh-xemazW7uBilVA
z{>qg`#@>uLd!ugtF<0T&Yp)4Uz3NVJPH-*UYlqZ4<jkc6AQOc^Br`z|;%NtV5^=+4
zZm`9h_o3~C^ldOc4>Tbt$+WA&jFj#OIlMu?Z~k;YwFeB)jBPe_S~<2$ffJ-rlG}3z
z42CW6U}k`{qx0*g2%}>JJH_oo57&SVqNxx_%_pY5Xwlug35?jbT-mW84ku^r_V`cd
z$h%Lu?r*Qe2%7+IU=5Z4I&u-lPrn>HnMT-*5#?S;s|21-CSd%02)y-Y8Tn7NN_mfU
z&a#_5dUdtugOIsal8iTZzv3buVh_O8sBMKG<(M6CL+rI;?g9~8p)mG)*(>p3Xy)!>
zbysLRpI`qoV^R|kz#pLf3lpnt$R1wuUh;&*bT#m~th3UixJx{;CtZi#t#*N}CfN5`
zRW=upi5b6>EZ<8EEAm5X0kP@<;fR*#gha(P_1O0rU<%!acOnM{mPhaxTWnDBYCf>A
zazDGwL5mpcps!@4N1MVF#oNQez>WeR@I)R}i1`A*?SUpcIi=3su({j_s1;yCf@`4V
zC}bedxC~@HYoqq_nhF8qNdvZQd5Xdw5MJ8P!`4s&VXp)L2_3w=tV(@labUYTbdRU=
z0}u&X`-{${p2$S+tiK;zdXxfY(OGlYQ3JN)s4%K%`r5A0DiQy%?tURe8;}++NUQ*E
z7OA$P!D>&Zc3Y&?`?-QxtGz%LkL!6rp#j#H62c#A3N{DcmAF^>HXg2?K&UOw*Yb=Z
z<{ZFK#_8${=imM+5H&aEjOcH(-KcAHtf}_cP^A*6db-=;TBE)Fip^$i4}5~WY&e&&
z2bA44J5W1{xDwNwbGbzsz`@J_!_YF*_?<(r)}$E=^l2}!Uf&rqHm#<z9$YWtrvy5&
zXdO7sqWTNP*Nv>xBYVJ1QELUwa|+!gy$tw^D>q?qlVl0-lj6~rj8hoX_5r1790eES
z-|`F+KO?I5lo;wuH?B-JxBS@MZqs~V1UicbmGfR3AI;Z#H#yBjDG6lUM}@$tS;1I|
zZeOYt<TxNV(T4b#eBp471X?;TAc}>z&XIE_ptSISXR2bS778$6c$cQFA(1{I<*q*u
z9Nd{s-$SIOI~n8AYIN;mYzcokAtj^-46u7V?ssoFCX8KdAs^&Ob_1hH`k|VQI<O`r
z2~;~gkABjF75)GkiR6f3TKR#O8&i_16sii@{+2_<yg?6^!A;PiVApqI5+8i3fCrG~
z<gnVCbSQ%Jj<TvFU?AAZ1av?|)BU3*0Oh;TU@=pYZF>0Q-@|UQGWf*ECZTm{LXAS?
z@xM2U30#p>RTqZ7)M4n#0b%Gp<GWpN(o_ygARQ`veLKDT!(D_n;m&xlS@Z(9T2vP5
z{q_gYxGD@b`^lv>gfFOI2`n8ZT7vfRC`TJ57n-ks1iE7|VD!sinMlLfu0(fEk=ety
zO{ggicu`Ww0bM=AtC04Hac(DHabAUlD}$tq?OMva{O(CH%mL^t>sJx%UtnM&2~pGA
zY+^81J=p3?r)fZ3M1cNjn@Lre59UFCNc385Zo`+eLWlgw)J$r_SCP|lkAR5x0@fH&
zp)wfJZCCbgWy$wQ5-0(aip9Pu_i&)ZP=t?xKz?;0o(GEeKaM!R*D0A2w>)xmxFrHQ
zTvgmBB0iLZQe|^;d>f9CM4{|>#*muO2R>EwE01+<JU^##Cy>eM4w|DDpjNM@&uRqZ
z{aeL5Dh2<tO)La{bs7)4oLzI~eJp_qQb3tt_rdBmTdB#Xb+8YmI<hyswR$%as@n6%
zx;w%=7b`e{eP<NYd)r_cGUQeQ?XW>_CLx@I){t_0>UJq&76FO5ir~nVXktQ6?8fdw
zg$h}q+!Fd(7d+<+m0_UKtK}trmV&(+2D<e30P!n1{dxb4bZnWa&o^4-G>W_Wo_|~v
zWUB_QSWNFQIDtjwOjIlzW}~qr=kfk7u2uu`Otb;$@bvRS+a0P9dQjphp6lNLgTaEj
z(n#CXsQ;Jt{`U=yu1jF`rGwC4S_!sDTyQ)C>K!~aV^TG<Qk`yq|7v@+yNNbJY>v+0
zf#2Y*AAn|YL#R{Xa`5H&nKWp#YYUgDERG}C<H5$`yR{_H6s(~kdPR+U!(Z}cDm=mC
z0B{w`%RQa4M^ebdK0RYTAeX&koIy;j0IC<=m`iy8WEQ_yx>tpL2BhDBY`%xy0SiDS
z#emUG0IRGR5(|K3=5C~<EEUzY6m|o6(<%=H)PE=iS!{X}NKd-O5G}ZmF-~vSCpA<|
z)pu`T<c7E;uxxsPj!H1Zl|BIN*80~MzZp;lww2lQ(?6%6T`rU*pYircB;>Kfz)*&2
zOFL1c$!<D?AHAYWQti2AU)f?s1g~lbx&onu7&`%d66jY5?i{uE#}{;}kYt|9Qlb#?
zx9gTJHcEZ>#%^91<_Q%Jw8P8mLD3Cgcdgxne>^@7Rv8V8Gk(?qUMK|ZG6NgIkPiB6
zre!FF;4pBv4J|5gP5NJ_69h2niNKYx1{Q~d_z^Vpga(cB1qDMbXQ@_E4?@u&yQM`C
z06C<r2g@A|!Nf-SyDQjFYP}HD(R;8CEd)UO)cA$WpZ;KDq4H_x1!G*l1+A$x*x<d9
z*$*lhIpo@Kt%b3Jztj$OC5*bF`@S1ce4362V_UNR?d`H)dFTNod_(LKD|n~EYekd<
z2mgL?mI4L+cWnAL1Ny0;MToUT&iXZ7I)<abOkL{sUV&(IV$Yyxce^8`A>phqx*eT>
zP|)PbEs!??vj(aGXftsJNUyulz|aGz1)f-e8uS6U)V9GX&yhV-4`9OIm|I0%Xpc|R
z{R;Y79M%NcuBX;g8%i<?rjSW`CXNl~6Knt}nOO%6_D@ecKl027C?pZ#pG>3UVD?$I
zf9t^2PWkwkGt%q#jDUL~JRR;&I4cFVEuwP0fh?xn(o6(Fsklj+0K^}>c?VWB2Jl;9
z7b3Y5io+V!4cDLzA0vPv+Nhi8%-^dWm5Uf2K452WpbWzP{=?{m%V1?ndO}{ZJs4yc
z&zRO=Bq=oe>jew&QHW>=;ubYNR9xGyO@Y+=0azD8KaR-mQ*smae-HT`{SxDd{?r@-
zSk;1;^6O2_aK}oh#QFdJ#6^x0*<<BUhRB+|p(V>jC$P++3Xs{r5)Lk!R-Of{wNCBR
zCPH3KD;8`TxXb{+zi!-Hbwg8pU<w~rrPQ@{Qg-{+R0i!}D2an|6UeoQF$Ue9(el*2
zmLfP=(D-l*V?n2ICJ_@Ipi00;{-0zma6uP5sVe@<9a=`70qNE0Jn?%c2&imipPtq_
zFd^yu-5{&)YMe7hjMNoc!h)7iZ%jjT45|bnVX7nJH+{MyolJI!lp-6{)II<pJUV-K
znxbMD%(1jFlTib=P)eaB%V4`+7oA(M2<?$K40)Q@GrRo!*p(%YI0^YXRB(h^pJK8*
zv>c9!w+sblX9dl(j_kR%T~!R%Zx00QJS{9QrVOmm8QZ=ET=&PQM0VjQ(2MUNSttTH
zp}skcn9udYpbunU7Grcq0$8^9@nhUs#{x%6{-<!K#BD(bKXSV7+D4A;kdwr2@?n~1
zk|(k1`w6f)=fwave`A5)9h_@dO8^~64G=5Wy$g0x6Eoa+%ZNc%Xsf+=z`k-4y>#bc
zt<M4FWgKwT!AIDjEz#iRM~OmUm?Hvq<tMokvMnKi1inqYjbY)L%y=hNJkY(tdEC4q
zZ{~mxYvANPcOg|dT%%jD3~LUiy6Q<@t146WDaU6ah7P8tY_LlE^3j(wU_TX1t0SBt
zB72g>?E!4+gSi&yT8PhQB8U(ttDq}QMQY(9AiJig&psI$+7Z=VjU4;-Dn_{)XfLc3
z8$JAXs;3nyKX=jqa$&(Diw@y-tgEbh?W)gT8`s0uJm@{&qot#C5W4EIg;iTY(4EiA
zqe1_F1PxXIrHN5`eetbfEs(M4(3USSq;3tyIfhTo)Omn*lqQNbNL@JpqVq4I7lKAq
zKK;uW8)y*SVZuUlz^OqHDHmu=dt>f1C3`N*LmWkvYv1-}S#1J8DEW1;gj0~?Vl7Jq
zq5cfYz`{Lu{v%Wl>vgz2Yvt%RLR5^EEx_=ZmyGt`weeZ8gxv~2-XQ-dU3=~Pz)g%5
zG_`xtkqec6;k$RO(2|FU%luD>#l-_$tbo;u;an#+a*H~+=f?qWT>L(zSOz{CVbKHh
zS8PhJ-Bt4@X4kvXCQd3-*Ps&6ey+~LOzXoUW@|8I3GL57^Ll7$aiC8r`WGbHAd`Fn
zTLPz9lLEcgy5Az&?*Fj&=HXDc?f>|lD54Tsva2jvL$WVvQT97o!dMbw?2LU$St?19
zeJ!DqLG~Gp2+5jl?6PFv8Dsam-Wd1ud_MQ@e)=89?~m{CJ)Zv@W9C}U>s(*wd7T&f
zBWKdmk@vp145QSd*>?JHPF0@G7cfvx(;kf+VFFoB3rXOAYBFsUmf<qP5ZeC%$b_63
zlpYAlGpc5?P7wq6Qje!o3|w2jVek6<3=x#{==Rx|5&5|7iUabkL;7@-2dVI<bG9^e
z83gz+0~1{y_*od~3N!G+EP>2sx|NYpbG{>;`E`a+7ryw~<>TlqdQQOkc1TvrTzxbs
z!fpZOGl_3Cr-AO#SpfIqm_^K0MqPmG;n)pa7?G)NS|$K&O@OK$8+1|M*sn-^B&CK;
z;Sh#gO?=S57jNtT2|{h}wYJ^A+dHhtjJPw}E4TXPWDC&NF?V%tU2!h&0}jG&C{_z<
zhoOLP5N`v5Fywo<<LK98{|Vv+l+l7(iBP?>L`BG7Jpx0w)7T4NCjr^4EN9?eoQ7dt
z2Epa6{$EBi+W@Ujh3*SVhV+9CU66DdWrl<k$}o1{4_9pg(2Lgic#LaL0RjSKT0kH@
z06{U{8!P<IGzp+Isyj2I>JgMm82|1*^pq<N7|gu4FbJpIz2XC1VS>sZulHQ0Q;!!H
z!p#lHRXN-bA=N^Hdc<8PgliDWHqAs9!sc_6w)hf&6JtY{?l4@PI$pg23fT(vu`XYp
zi!?^Rty=(jy*3xE23aGADw+!@lz9lS{DM$@(p@u}tWdZsAX6G?sS$7!FDUdepMh%s
zp~}%+cfSJhVnFUUx)f++0SUu-m@#4VKoMs`<oZe<Kk*QJ!VV-fmO=cK23eQyO{)vT
znvmv9(1SvtiYe&!#0^H9*JqhJHE$40LT2<vC<`q6sanwj^_6PUl<Fp6a}onjFvn_x
zYcY9Wsg##bGmOP({sbCZ1uBL20150?YIW&Xpja(c!CuM-4<RLINu?p}<TEhjDu7zM
z5$#n)qoV@Vz&Dn1|3*Zl;t7n0rSEa3D_a2E?idhtxb~lw%^qale3%3@X3$@bvjdme
zG#+qc58sLx_B%g5`8!w4{*vGScEJTX^#69j{lBUUE~HnvRH9!(@^RW3<W8<f>HkK`
z<*!(%S(oTIqqB{b6%UV$*XsP+I{x45j<sKo@qiCVbv4TH#cxFQ2XTJ0DdafSr@FlT
zT@9eoM6{qf25JExxIWqMm1I}gOGG4d1z27#1GBN;-ZMfFv_Zy4eLJLf7}7@%ZKM8v
z4f8u)XzD+1HKEit)zw*BTV-0EjBatpFrEEE^R>N*MPB|D>06@2;NZL0T}x>YcWFe&
z&vJ9WeG>dWn+N$b>H0!sC7a>3YavJ9labY`gw@tB*DtH6547&!KfK|Rk!gqFv`g*U
zJ-rOao$>lj8%#+?2%Iy%F!68N=wxflHzP8iG?Dp(zTbuiMEs9`fG+OidJoS=D+~f^
zlj~4X|IOHcJBXho@NYYECOdkS0Cgi?_WZ`(t34vhpM(zfq4kp%pyDHu_c>L5uWAQ)
z3c$i;-qXtbpbv!@Brx^g{UNb1=z-ht$Dec&P$MCOTl~M<l8g8|H=s}T#~7!6U}oLP
zr;`3NF11gtJa!Nd9SP&iho*$p@<;#fFP}kEe*GA&i2>QY4cMXK-)sy8+9H6gPkZ0P
z@(8e2omlbTyHEoy%LD3$<>Yuc60~#AC%!Ix{XfG+d%JmG2Cxtu+&W+athF_+`1hM}
z+y_&}N_;rM3o)SISv{gXEB?2<_HX}sZ3Nc1DVq0a8cdlh*8bZa5-4x-gDGR{NkjoN
zWL|m2|LV6-1X2f^3^68iP`=g9_S)}~hs{3VVe%Bsc{NH>(0`Zs@0G~kY&rQ4aDpV<
zk1m{s+Tz%A2(ka}jPFyxfiP#-He?bjF*=um+W1)H3`pKudi3A=-7(lSpi6~kb!vLo
zIW)c}!!g;<m492(7J)b4psbBC11KWD6RtktcZtjcI`HVl+}67p2=;#F-sJDULg36}
z52D;lrOP0vY6a~R0Uhwwh|J$UU=XEfD1bdv(KfvPZ9N7y_TPyhmi{m4c18IAaAxqk
z4V*wOu1ZjR+xmLr|Eo#>JM?oTdwqG_1Kju*jVJ@*a%`e&*zXEA1Op@+0KxwCF{<k~
zz_SC`zzWg|akurk|IG&c6|Vi|qwcHG(|6g*TGmEJMrbrk0Gv^QgrSk*bHsj<0IctL
z^S$G@eZT-ZpuoJIs$`!8%l4KRJO8^Ypw#7M8wZ71W5f!e@xI{yTH*ie;z@wo;+H?A
z^2Q#_7{L3K?DwveflG<Zz%EVcBH*?hz>X_@oB4f1a}-P^BY*kY1n|j}b%d#ZyZ;&w
zaR0P(K6bQa0)tcd2>BcRGWIuq2AqWX!}r18q4G84JKEpu_jicM47h*%rtS3-c0g5^
z1mJ$({p$vlwK;q%yc+@)kR!Ce?Qvd*ro5+B|6u^oX$$#q;kT`WJm?ZVX)FIz39OY@
zHU2*rY7kgn2JqdCMDZbI$T50!Hs<W_^4%TCF<KWbs8|MTooF!ly$h|71Pg;H8{+Q-
z(Li=n{uKXzXbv_*%BM0gpeACow`9M|B!M+23%hQM5X}Jk7L2{qDh1p$rDd1#k4@5&
z?-9W(GlIuv?LOJ#)&kVyGdf%NgLXB_X(eN~sX^tXyNnN+m2CArXK$ObQtATcMjfjR
zB9;Z7^(69d+@^nVQv9gMJ`w9$yy!batgC!STyt+FPvt2ptIIQfW}quQ0FkC@#f>b$
z`AF&vbpPYQatFv$6jmF<rTz68DYp0gY997%DzA{>uFpFiN}p=aqJWz})7aGB4#g<u
zu*`pSU;L=ZzZy>s6>nVi6719)Qizq@J>;7gz>qW^s$@EEMjs(*c+yhua{`z3OzH~)
zbNszvHy4+GM`k|COkhOqY2-V%jHjukN{*FkfB2Y*Jv-jreKUA{S9?Q_Qf3E#VQ<TF
zN%-H7Mj$Nr+lLR~r!wxT?S3s;mq=)tXI}49?1(5M5Wo94eRIg9)KS>Z{_{9bh=`E0
zNB6!XuXhMtl19U8<OzCyw%0#jf;exWlk}fQC_2yf)8lCcVT>RmqAcc$h@Zm1VLM%W
z+H*g6`A4&&p?K&JR#Lk!cK4j+%ZP;LQ5^10cNBkuD;Ach=r~){hY5EsvNi}SIH6T=
z;~$;nbxyXQ-C`bxcOx^uZc@^cj<hyfrQ}G!RQY`9>;D+BHIw^&2rcE{i$`PVuAbS4
zc;6S7&v#UY^udB^PGSuz7Re~z#{$LL&SNF>kF;5avCR%iBIfkhWls`jo#Zlh#jdya
zJ|nvW^(daCDJY91QdXvmGti|lv9w%!wxV3?eso{0BtIj1d^IY|%HBTN;hv_WkNx~&
zkJk-g?dymIq*uBYha%(@MQuy78`o+Ca0ex+<sL+F0^42%j!Wff5usuDg@X2^EL3d}
zG3jYV<I&E9L9fM8g5g`%l>eEZv|i0A&j!6P#wUu?a`U6Nf<>cOYqSq_R7BMg?+KqD
z5$V^9(@KB1xH%o-ynl?CbXk#&tibSC-m&bJ^dmP2%H+~1diwQiY}%{&PhV&fub-oI
zbqHa{1~}pI7DNYM`gDrY1$KBylZaRedeZ9q=NM-+kx(b<vu1`d9BtK2Fs&VQx@2YD
zIE44PLdy644~^j*-yfXX=hZD@0TLq}qHNr`?0ZDsG}*y$qqXB|drHQd?P3Yez7q)l
zMQI<m$J(|4H<5P$W;j@%QDjO(z9|2ycobn0NlN-IY0By4?nCj)q^JKh=IFJm={T!h
z6HgH94<!DEn&HLZ84e;%R?lFV0h-ELXzzdkw>)LEqjQ-d$ph`FzZu9ki#pwAUQuQ{
zVn8<<`8Yv;L+jA+KI<cBb-O0C#`7ETL~y}OAib8#7DM~&<L3hA=!s}~A@AWAFtJhD
zR%&<4_sv1aZEq@iWfzwaG+Gj@NrMxdldx8uLEJIE`hbf`#0Ja<Ojt#kT?ZGMG^QoK
ze45g>?`2I0VS<mxNK3TyKX<eX`o);K1}@dc5z-eLmk*g>KWo){kpTmPVCDYzrOB%j
z6C1*BKd9r20!uEQG%FyC7!Us8^r+n?li1$?u4Nm%#{m(iDP1z}-{pTMZwBbitKU5-
zpi-WX%Fh?xliB20pdZ>lWoSic7&}PtaoL^tOO|<wLdvJo{3tJH#xErP;pYMd?)kGN
zaL<k9ehkT=$xvWV-9;^@^YY1~K%7M}hhJN+DJ!${)$<3XRtYzB8yuJlZLmI_^Ch79
zq+e0+l-D9FL8yTEAcz_Kuy4-KPXfm`_2Emn^4a72<}!@zYxY#+R$<`aLM2CB@dOo{
z1{Y+6w9sGS2{M8|^@bK>_Ur+h{Le7ZeVXGKE9EyMaNxrykaW{Sv2q2c2#nKCN$Hk(
zgE{l8+#z=CrZsNgv02tBZ$xh4#K16_fJXX^mOm7sB~ItbeP78T4kUPaBWKy>W63kr
z$fP-65*skGV`~~$|ANNk^+9uB8zIX(SHa*6w0&WFy0d}U9|qU9uj9}V2Fnhk`J~ng
zizYYmQTvv!CR(Vye+Y))x44gm?JH`=?)?JD($>pV1dW4&&L=Z7B9)HPQPpnr*#0l#
ziA*=_j_ZesK~#Lk36O`Wk&*jFpujO!4=N)A&F${8K)X<&vWMyMHN`i)CWIf!B7R@q
zPzH*f^#Agu5$Q^Eh$w?tz&{vWWH|5tMT<xF0IeQZ08O6BrK7ZOBu}$rL5We6l~9S9
z-SBYxm_Xn7;r*4E`c-vNM<HR+5<U~)KY|H-UyfEFIk>|vP`!s*{vHoD9O0;Wxl2yk
z;v1ttUGDDf+tu<}r2G5HTy3J@I=ZXKe7(G?1FN(QO-=W`n)`EkEqac7aakZvpCY^Z
zBHT-`-s4P&`tFg+4-nt$L~zVYI!&JQj#KRR<FYN0p$KJF^NfM6%Y0J>;xDGhoKB+)
zC@u@0tv+z_G}M8Nd35xB6rrSagrLp?iDf)y%|Lqi++oJc4(I%Mj-B=v!$w@3icAnA
zFVJ2%@jw;&qQ+gnu2xo?PnqLibWE_@eI&yf31U(%Gu`dec}~Puz~Ryh7N+xkrGTu;
zdUb}dCl7YE>27i}(>qG?-|}z&%A?;GH2EJSM{ZmWc)2-nCHVx=_2b3e`S~aCvT*1a
z{3OXv%PgZdp1QVuU<$Z91(NDCu>mkU&~uV)S}$5S=4L41SWgPuB3=@IgRDyq`@+el
zVF5M>d1{(uq{V4NEeCii8zcCKH52Z(H9@gmXghCO-rkrQ!1J_rH|X$FA)&QU_g~e{
zgBb=DvYen6>rI@{Lv%nX`TSS3I0&LOY9P<Q$BtEqsJu^*t^i;}_*E{byh|pkTdHF>
zxY^HiKvm*(Hn91l&R19N{2b|XU3M-BIYMpUceBQ3_bWgNIYeR4k{AZSJbmS;oo7mm
zPX+J6h*~az3djil%m9LU5C+pU`2WeJbvip7PLpA^dm<3206>n00P^0n^7<U9%C(V9
z(wc(D>SRLWK&$NX+$5JqUiQ@2kisCKOmMu{lC=58ySdydX`!7p|N1aH;%|_lug^<J
zz1|01*JD%D%6Qn>M)aNv>k$)Vl8PwqNJaTKd5*|?r--$QpHVr640g~vA_&3iGb*?I
z47lA~@FQd??y{Z)aPaH?Ojl~S{qF}q3#7i7nlYJ=NC9c~;k7$~Qzp-W!%fn|-cRM4
zD@&Q<?fbkmdJ#3e;GGmi(56*X+zLMt);pOd%8R4lKrAEbYkKarI@pJoC@=1LRHQ<5
zf}sG8K_&4(>hVM=!-q}mv+=_WujEaDE+^MKMtu-z>4G^?N4}<;(TwA5kq&fNddHAC
zf+6!WC%R6GR_k^1q-T-qwf1N<1E_l}dm55w4~C31WpC94?fu`szDwA{Gp>uWgB(J^
zIy54aPs;-+Bgevb{-v?u={v^8+-vUqWfG*X?<5bf>!6DwmtUB6@3F&4qOB9?6LvC8
zoVG=!Cwa55FG1EGsK){>5V0qQYo8&7EUg^Zc<iB6&;@?)c=J!wGaWN=u4h$)-`$KA
z^l+D5lbC#zlxpQ8mhDB5wZXq+?Ku%dUAtCV#~H>_zddbjxy$*vCw-IcmI^cA+sluT
zYmAI<ynt!@m2vli1>Xqd99<&tfj!Z=xT6*GqZO)k{-h&Z*+oo|;kycXZ%ux}q!iDU
zP?2xcM%{|#<y@WmT;?yBJaBIMMZI{2Fovohy-Ua&tRbrlqQS`E-_Egb?;KZxx>{%&
z{Ru};LPO8YO8WRQNkY8ksc*OCzlkcVdK09BbXmc;Ri2)HL5Zm}`SJ}HqOI-*t#6`e
zhRLV9jL>%1cx73!vi?Kpa=bBteLy3AQC6MONPWOQy*S>gX^SR7V7+gvw4WzTO02|o
zQT%kpc(h!6Wb&P~&eZb7=>P#w`@eb?`}LDkP;kg)Rf!$-qas~~i-BgdRJ{@^d$98B
zo5@B}1P(Gd`(aT<t2tjfU%0g&1i>qfsK|5t(1}`zVfAPS-V$b&IQHC{g|srxiAf$y
zyv}bdhV{`YUp>$&FhE}GW9(~~$3Ta!=fq{ag#VbM8CBdB_U{*(L$jv{E()3U{9SSs
zZHasumJZnAvTUqH^TY*q@ZL|45@EK|eZrP9w>}{DILkKDO>O>|Akw5G+}W0F6wf=`
zMHNk87HrL-eFlZoB@)kP-Mo(EVoCOo^QV%ZCcbp(d$>eW*Vb1lN0v8<edMT)+*$3?
z9FW|ombINxD7Qtzeir{_j#JBjYLKRwZrgWLDLrl><7+bH?u%DF(AW>lK^TZa(k!_D
zAoeKT-Q?_{(Y>(xBUiS#=h?3bFi-dAGZ<0pTm4L30BSOy`cP;EfFtdc7XkVKFX4kq
z_Z0T2=BIS5vpqk|EEE5BdQ@+2U7zq0O|lY^3nKHjC~sk;;oPX?B@~yn)avW+5_*(-
zThoyC^YMqxOvY|)0e11!l!@F+E%A*U1G&(<wBdwY=pD6kBr<~6a)$1{7`A(W<PQP~
zc{q%9uu2iRw}U5ewn(WgU&GW*K7uz{P(D2o8W^L=I?;80-;B?8xgqFp?gp6Ec|Za!
ztMcqFfKv&(x$k-arB6XJJqanIbzZ<6+v|)62^2O@Ks0l^k2OdVKs3mJ2mN3Uo%86I
zBt%;8PKj^KA64k>%crZ^XA@7MJ2ut8x~YEPzXWno@MC<cJ;2)8G~MFeS0I1*Srda9
zLsAUa1)&+S<rD<{L;RU8I|IIw<}s~iJZWl2Mm{z>hYY`*MeArott7Jddp0LOpjS<>
zhRi_Pwe^}s_0>zYt^%=RK=9S`{JTnSQv!6%=W!LKgNtFUI@&)TOr(&Vk>Ppe3$a?i
zw_=ld-qQLQ&YJHqK?QVx14d-tbeE-b=2y?G&vON&E6qh#-2~A#ckXq9f<DFtPNO2?
ztN-m|oeiQK(W3`ql}ZKn@!`AHL~SDzS|nb*-@~D^0dmInDW^vkkD5!!jJ@x;u}?RV
z31u#J@UAf(Wzp^Ayert++FD+n@c3eI1s&ktpT&q;HS0>xeB(Ztg1CbeEb{mh^}2I_
zii>UERR}^zEJ+P!x3EQiH%QjG0y&)~JzvuA%la}C7T$8KK5_d&v;^)|UKFCuXQ;ZT
za(;F21rqV&7uac(=jwC$)7)mwS`*JMfU)m&RDB{44si+$4da1*K^#MAXTOg;z*4id
z0jc5Fz4}l3g}V;?2sfD-{TJD{ITr7|df3Ea<yu^(l%2T_wsEGz@WLKw4c?4CDttOS
z4jvedA_%}i>XhV^Zepp%%a~~BHMYG)_-z7TU@5oV$&-k@6(97$bD+g=SU`WKWZNCK
z^3!quYw|8cLL&^7NO#sp$SyK+l)1%+^hwgrANi8`(^E>3yT*NXiiu)Byaobh?Cixx
zal(;J<Ln`HapZg5G^Kqno2@ybJk9UoMd4;GIswk+kbU2Xf3DK@Uo!OL*OGP6s9B#O
z<^+`{Q8+Ot7Z*0Zcy$8g1E9o(JTnAQYW!mP<X|G;zb0`7%c8+}ki9lO3`EWL;c%M5
zF}@})IYm(GcZWUL^!CAN$B+Z93F7cH%INh@{fdg>4NZd|cQw()E~BG7`+{NQXE-w{
z=`cKF;<jmD7W_l%5K%q^4w`l48Z9rsma8|<`lxt7MK$7Tu4&4)r*ZK0bJ^0KZ{!X$
z{`EA6yc`hG?vn^p9|g$S9I-VK!}dNszK_&7v)fOWxw<$YJfmLht4y%aZ@>i<h5uk!
zDa<=vF`WmZ7G=9y!kH-?d;S6nmK4+)-jNyz{4X;PAT1Ptw65!q?>V0Tlejm2PFJ#$
zI#^((LkBa1D!(2t9Fy<|{rca306IpMJn7eGx>1Gbq@|iJK2_Yov-JR{{5I-$v7~ru
z3U({m0`Rs>%H@4!48bSFM{bDGSO}ZnX7n>8hRuxX#i7Fkc7?>R<=EGka0;~U2Wb{U
zFMv_+X>hvkC*SxI5nDku6P0f*O7CC6e!7m^vzLHB0e9?LqQia8gL*_V5cf8RJ5c=f
z%1iQ1qQmEIHEVU`-{kmEWdP})*{Rdc4GEop?9od82vI2z?0uP}FwcPAgOdiZ?0R%S
zsO0JB#Lsc?AZG!BgH8GEma&&YvnZEdpE<|N`vy^CB(U6}wu5W^@=u8`ANTh=C6^oV
z{$5116?nm-=Y%W=Mab+2|ETNxcBP$W{CYFN6$UCw9>NvxT6JV+rKVDvr<1_ox*p1e
z82+^0o}|!vJmb`H^{e`o9bW?8KPA|Nw%vzyIOgz==+fp+YU0Z{@Rrj+Hj6_|{vgO^
zAyIHHmjVTP)SY6_LzQV_Usip%`(PGacbPA$<RV?gX1rXZx#dT}1CE^~xpDcV|6oHO
zKIJG;F>rcDZ)BJr{C9|);<+u)_W6cvVIq;5S&FgnLg`R`DZ3LXQY=Yhl<S1$-#^<N
zoD7d2pXKU*RqKTSC*wy0+!-3OIVtEm+>?gC8o^1BQ=AC6C^?#X(aF5Sn-0WewbVxh
z-CB(4`~?W$ASHKBdHGE$=LiJ914*4I0=$ILUT3|hiv2c8)cWv^y+=>&ov#(}z4g#x
z7U-W{OLZoeLOrrLLL?7BoBbN2q(aCqED36s`%B|h0EdLO;8H}qE;v5O>T}HS?c@FL
z)5^Po<S2(4k?t(iV*M;2GqNukF+egJjwRw8)6=KrU*~_=J~*S#r|6TiQ{b1wJZgdA
z6g{csO)w0kudg2j70dDj8{A~`Zr_NEbYNZ(%*<W#T?rX=2M6&X!;T0C=^BeZ5&isR
zxcO_z16BS_7tCR*(Pzf>(s~pnZKsHxmd72~4Gl>@)x##n*P8R45xf)rBrs(?@z(vb
zas-Y;Lx^?_G4LEguyoG09c`$0%*3Vp1yU<37e}zx-+3-d%2FOVS|{nbgv=`+a@1A(
z*SOgVWJmRSTJWZW?nhw+e^V~fT!p}mih$XfbBdq*;U^2-IW7LfjK#1yzrJ0>mGBK5
zKnOC7hFg#t&G~t$A`S;k_Z%p7kw<N+QoDgrf;n^HDd(B!#(;fMX5Br114Y&zUwCKO
zu9Uot0LP*oCOWOyoF90-@IGORr(h)IJD*Uhz^S*TDKtEof|KZQN?dF_;+gykSZ7z<
z<bII}HwFx}27f?8Jo#_XRmUXgp#k^kul=9pO28uSg<8|=t<-+?(8^QV4ghv}cd*Ag
zee~xBgXVl|8WE$t1tilE0jljo82!Pi^pF4Wi-mOcyJmMjC&-c&|B^;^aQ(%rNH7kX
zv+ar@Sgm{QWYj_Md<}fS!K3{&9d*&$HyVZKFGd;zzr-J~R`H8BP6R@95LvKp%j?F=
zyh0R4ty4RfUK<3ysxVaLL;CqeAD9}{021=4+@XL7?p9ibF#=6o>hvW)Z#_n2pm7K6
zYyeU<9>qaTi{P?;LycC}{<*AyH3q{fSFOexUck^UqEa(VetOWZ-qx@2-QJDl4u-f7
z;&aGZ{S0M}`tOA9TeL$&zW{gg8#R0vAKpWs^%H9vr;?&9@CT{}pq=Bf<Z$x@sBO-h
zyPY^t1VL7Tj1ii8e;*<SukNcf-f_KmR?*}H`hh^@3O4_&tl%@Su|IiCSPrJ!0^&83
z?&Doe>zt{cnYkbP+yp8mwlM>nNdoiaw=EF{n}~d)M3Rt_48KBds(0|~<DkUa)&DJ|
zNAiV7|1ywJg2d1Y>&kZpyWY{i|FD=}2%wMH$^<@hF9#jGS0MQMz8YBch1Zq@+F0=b
z$!e{LGVTJOLtrJr28=+pc2YTqsGwO1k%l~UPis`*x&+wrYo%z#SAYY9?}UUkTyM_5
zPa*;%Fu?A$Q0;jtex2t0YgNKp2a?bWe&CeSzQ6;<(V{=VSU&;QfCc<nev$-6u6tT@
z5)CLfpsWE!#gT<B<^%`t{bTSs^GAb5(POB{TwC*lcLQHS1qB6(9&jkF*IRXWe?IVG
z&fMWg$SP!L7Y=%7Pi{7X9tbCuSsp22sr&hW7D1Kf{AG?jf_(!q6(n8qZPy|4MqXps
zH;$q-fMZ++NdWJ$=1xJZ>)XpK^fCEgazKCheTV8C3i48oqLbkh$`1}593i2M0kX~f
zPcQA$diM;bD?nh5mNmz+g88<Kbne}`f>nC`<19hrM}Ubltu2)?7q4JjqMC^apC6Q|
z@`D4{r?TAl@7nHw?REx$;K#+g9w`Ur+j7YI`X1aj<W3>D48%N;TJ36y^f7saOci`X
za^L{m2XzFohu#Y4fsGWLZ`pUEcOA7Ha=~%E>Gf!sFQCuHu;J4`NnpHx-Uue}%^grw
zoc}qMf2#s0Ln8%p!snFVK%J=Q;cGDH%8AXbcl!?yX=sA&-lGG`x)Uda-UhtCQd3Hm
z0wR;Q&uIxj_4`kN&SuK`>j7k_$TEN0{XJ5$z4QbBIPwJb0Oafb3W$@_z;>$yO2Fw)
znYwI2O+G?BId0H6XI?wQPw>|@?t+QGM;0uTQ#<o}lkpP*1$j28e4Bz2@#8kw2*;}<
zdxs~lx~p&8z+$mA)9XN?bhF}>p7V_V8zKtbV2j|lnV{nw*ITF3Bk0YCz##<niENW^
zp=-c@Wp$v(2Wips|7FnsGU)&B464z+n+ns+*{@Q_{hzk43n*78qP7N%or`N@B$zLG
z3GhMP-NMfedjIA{=l~Wj4V$%Q0u2;;4YX{aLXHer*y1O(T?i9o&39GOeq9;P@zdSr
zd?tjj@`3L60^=^>+BdF4SA~cPU;hV-Qu>Hr(1=u7Ie11?t;fnZ*`X?R=dvt4=|W$5
zdD_U#5Wgk59Rl_fNDYeY*$s+bE-nbT$1^Z6&E7B4gH;x2|0?LD0F#P*ZPS8OLX2bD
zq_w-d1m6g5>F&oE=MM3;3xX8KkLP<Y-22=?UK`uW6vwb53-^6~$r}!;m;KI?^6?4y
zJBL1Jr?BmQU2>e(WPMaV`8FivJQgN&plfPpOEmo+;hLeMAX&QPDj?4M4|@$Dv!NF$
z6L*~)R5!W#nDfL-I(;gwmdMj1E3sAbIm7D9?z^z1u~_rt)kWzN35t_8v`-qoz@msJ
zx$Rxn??g*_o^5Y2y|nZ3uvjW8?L|lz<TJ%Xa2)Nk^>4dAfBVY1w4A3bllStQ6$ZNO
z_R&`jgWZRNx)bjjzzv*YO|6~z3`*xdUW$4EZRR#v@6yjwcG(5?h8)kD*=+bdi&*76
z4*6u@S70x{yfgu&f8Ywt`$m9f*U*`O>d!bedn^(LGO4#fV(t+V@!nAle%jgQWWm4{
ztak46E1mo)!?isH7g6pdT26)3-?WT<d^o$b%p|N?&eS2862{K4J&y^6Pe<7J6nG$^
z)<XGH`lIb+sFf^_N65?>5-8XFr?g+u)v@|s>uCA`?ULG<KM8kBJ_5iP9uhoInM#gY
zq3qGv=dusL`Y3A&gmcKV0sW2;8wU|ez6|Q^QJ7BF+1W*ucMppnww+sc_G$U;#juYS
zVF~gU=1qaj)EgD6ohymY;V-R8{DpFH27Qb@?F_P<&CsQU4Q;&@$b1#{XDCuT!!mzt
znnLbQBdsRe>~{$X(KBkQ2`BUmt&bmFnHC(q*6>jS&?A5+s1`h=*qlG=`jCa+s5xJ;
zIdDIpqyz<vsIZuee%&A{>DU%%mH@MOx|kh9AwNBEUefI>-jeUkv$X&98c*za>WS}b
z>8O(4t*(h$WkE)6;CCX_C26YbLu3Atauj~KV@-k7>1u&hBTvH@IxiQfHs{l)UfARV
zh_umJ>QApA3O?(rNj-*IIW^F{Pr)}pGRR>p;pgO&pMoz?pHA=I1$jR_zk)6L{N>A=
zY|k1k6E`;}PxAI>@=AU&T~4(E$eOFY4G0|jI7%<YfR)^IR7bF2t!uKl8xW!$X&0lz
zHQtSxBtsPxfDX(y@2>ljjE;^~ENIqL*7r`EQJ-=yeO}4M2&_B+$~cK+K)wHrkeg}{
zwR5KBpl8u^YAX5Q$jF5K=GPDQXWfHY?fRvuI5`UfXBKQW3aU4r+6>no5sC8<7rD9{
zIPN>S4!nnmsvu9^P*q9f+!gGKl2%7D+yH0^kUbwZrtg#P@4uISwmGo8V#q*T1R-7D
z&~(X$f4uv3>S?Y3p(S4G9#95hU<2g93R_s80Wz;fIN(h60MWhN@>Y&WnJ%)Tww0?g
z#z|8Z%Dug=s^tV5R@I0<+YFUq$bP|E>t4ae(n#0*5)cpwz^qPTKvxVdR#IPYY+s1+
z)B<(5$zoeus?MjL2dk@Mg^XDkPOtUwBud$og_R3~wMi~cPY&rG_4|A*UQ(ugRqv+A
z&T9VrEiuEmQ7RiUfDZxJiA%SSitS|_I4aw`_Bq|={8EM}iE#!U@r&6Prn?Xb`ZFvx
zc3<>P=_>wISX8Y2;KWtAye2Z0SLCMGjJTSpFu?sh#>l;M)FNZd3UH$~y3EWlAsN2&
z5gb`J@V`J#yOc)vL|tu$UpyIClS&{toxmrlqU0&mC0mdd9f#7Q#Ool8=vLfhIL<$=
zmvV0`yG`*$0;%t2B8CF9Q^QI+=RRP>5$6_P=lq&}btCjvCyudfc5M(|wisMdkg1Rr
zLo~(b>X+m-6IY4f`8IVsL_}Kpw7I$uce^M9HQP(bot8y<0GXBpRNb`Z9moaZ!Xe<<
zEQ)k&P5YAVihpzQl6Y_b+x)ZHH;mUeCvJR0q{t~D4bG0E&i+}3uZUi2fBsLx@<YmR
zRn&8{?de6##Q{f+UC-W20o;Is`2i>q1T&h!JWT+|_}<=NXM>lU*H}%Q^Hp6<7}#hn
zaDg}6;~X~Cuh8*cvl)yl+pep$@L5m4|07kFln^bEj(~V7mN%;r92%$!6g}F8a=tL$
zZJ3%t=^Vn_C;geDs|y#qLYqnBr%qbmkffeC=q1g^SFoKjax6A^>e;omen_Z9{!ys5
ziO7S=Lmo~o*E{z-2C}BAwGjxi8W{3FxL*Pa`aSz|@B=vDq9O@C8y6RWuRr_Mx9j67
z>+20poXf-h3f^9Fs%+XEQLbEhnmGeYrty;nuD}XefA)Teep?Kb(WwB9X3^Hp2r^Hl
zvDzGf(a=sC+ZPMW-j)WywLJaEflO3}`tapHPKH~3t}p;P-sr+Va@QKU*XH2S?(QlC
zPK6kz17CGJ2TnP}x%WnLA&{n09CGRbFfW;2>j=ygevU$LEh*~+-h1=GdazT`P;3T1
z$Y^~{szM}bp-W;JsZ7)b)QI`;dpe>m2=t38aUi1{hoT-$2`mXv0<*+g$56K2m*`jK
zB$zJSbhq^n<$ufv^x66@2-e!r^-q$p1|($E&S2~m0Q?QS;et?I<qw|Q4Qqg|xyZX&
zlc{pc-Se^7t)x%rhIg2`%}BbyB%gM?Sxb}}>3!(VSpNHM(&as4as#MX=#KjAad;1)
zmS^hRrE!#{u_pbQGcebezuc6E<>=&e4GmAw4G8$tUo6S?GU<b(i%mAZ_Gcrk6~$mh
z1(3QCy|Dbz?3gLC;@j%gf-{dNk(a@T`4<oqwBW5!Oc;W}nVFuRRR6Nw#K2cMp~d-T
z`_4kRUC)yE`uJ6Lq(lSzc<c@3o)W<2OJVJHAPPgsv1u@Ybq%$>{VsCKInxo5d$$K}
zv;!aX^!=Isd4ez9&~R}^@K}~lm9pa`tdLj|_>eQbjS<AppgMDZp6J7eh%CW)tq&|c
z0aQ6<#x&*AV%dzi?{;ar&-+22kA5HJ)huOYaub(rujm+wxRQ|p>kQ>?l(*Z1^V2;}
zFnt@*kA={YOk$#?NBIOA(+yVTfxeDhj9nMC(8t8;J3yQ45})LN2so|UGn3PrJk|VD
zqiB1wa^{3)v`g-iQ*Bd#@`q6o@uCaQZRg+B-AS-iNxllceqzv|BT|0T@a1MVU%Qa7
zG}BP{aZrqNA4I*end$wp;EXT3I;^}cw=3B?SrJ^eaFmg;_H^HfqR~p`;L)8LF<S3f
zAd6t6Sejl(UdWgihv`xJeTUR%+1E9G042)w_>jP`jRJv&>gvoVbDdh@c1m0B6hEuk
zkdMo6fVDGD6oo)>AgFs9hw7f30ie|VRPQpjjUQlAv4*6}hJa`Bqc=dI6G+*BnEH(&
zMu-G9rL*LsvpI|3(sG;C@$%Hw)wRZll@)ppH*MRyEzC5{ZAhy;EC&$N)H8oP@pq_T
zwGkB~>L&>n*HOF<L&Ct~%HIM(GxuESy&o;<>iDbmMZdarA9I0CU;B@Ifsc^7^|rD}
z1r7l>)JytLUQ<JW6QEB5ZP3*JjkpB}SlW*k=mPdH$Q!hq`F_a>D)P*5bxM#%aQ3dU
zCNifrx?m(!=FFMHFbyF=p<b)56<-c}dPscAA^im1X%PrvBz+AuZ2oC8VQ`yJ8>%Rm
zl#nR4Iuq($1dp2UGi6xwIS=Yt?0!5#I&`#(SX4}igccM&<jlMw78=wim1X4^tVzrQ
z?7Me;g(Bp<H19zqjQNl>!&6H1fUI(47!mE~{KY_Maas$^_&(x8M+rcEwVFO@FQsH{
z4h;UP)jtzT=hN;~kySQ9V-}B+(9r;2d~`kkogUDE9UpsXm6NH6QYlc?FQF>4_Pjr!
zhQqB(YUZF0t2@#1)MKQ>Xbo4W|Jqv23T;kWdz$Lw!JlP}9r3sees#d362#B%*0c~#
z)fy^Bl1Z1=BSVe8`KV6R1&#;g<Dneh=|920o@jmOj|XeiX|>h4<n6<0u;brTQCln0
z=R#9mQ{aCU%S4JbD3vqt95)t!T{3{Na}{@3batB`KR5X0TusHR>J7z;m=8{{(8884
z8#}8FgG;g-wY*6l>dAJ1`MguaF8ZkerV=q}BRfPS1L2SCF71I-&Nf+ZuOCMV@HGY~
zs!KQbpN-9v%${4nSY-LWmS62u5is+UiMue%7UZM3l03&G0#@@7UQ43eE582>%5obN
z{$z!i2lAa4;CBMf0NCcuvo7Qy!p;ruR=eYcs7W|MLE+z%xK=#4QMR-)pO@}+Lw}1;
zP%vm<tyJ!K*7^sd6TVA>zP3}bAq;)%ZA}z&Tcu()ZC`Dm(v$Js^fRG=5jY6pU?R0_
z#JDyvN<4I;;|vzQ_ZA;S$H@)!D|F;_7mjsbl+JT+=<4^9jGDeCCE|IRPe8ywH8sHA
zWKDsdf$7BK+MZ^O#mExYz7kRE?z{_8Wc=q{x4YIRvh#}QBL(;Z>Bmb}w-tm(jj8@%
zu`a=^E@%KPeLPOFT4D2-V#14$B(MzxCK$gEP_;I)Ej!?baZEBQvuFQm^rC9RS9)kG
zV}bUFK>x|3K@29#Uq-g(=SN3uE?F~t8-u@nhM!ss=&BwbZn?dPU>OL@!mY}(2#sJY
zFZyJj<Or2GXHqx1P`$w;Ig*pc(^)NA-^ej=G%TwrH8pi)L%t-GkHg5jb}MCJi+gQd
zxojoyNccw0gH4}H(MMBdd-g9Yl|cYnK&jAs;Mh&0&wyArXh~!&JgIWD;@+a&=c*Bl
zoa&8{;Z?idH>-BJ)%gA|BNkadvJrJ|i|z|$JBBy6kITu#eKNHzSg?CiRgDn}PvQ#q
zRsVXfu{bAk)yZtr)oXESW;GIwV!Qd>Ei)N@CZofvabXJATVFgf)>TtxJ6s%$se8I(
zt2T?T^_J})s0qvJ<BwB}a~+wcAzBdn)m!fzZFJMeB6~7NXxo~~R}8Tr#IbE49KC5E
zOj{jZ_;$<o<3dsNClgLt0nX5;!L`GKRY_ll=hlZz?`_H$ZFYHbKM%3JHOs1xw6}lT
z3%L9j(&(-^KqVuUaOR2R<iUe!T(VqUW;or+LqUN@D#<aE5`&&)!&4RMy<Vo1Q#t}}
zb4flIH=9FCWxeLF?i4xl;5JtAS?6|EW~*m&J_x!T0tGd)E<3O0vvyp3KeC9~FpxH_
zKWb7%gj9n(7L-f~g=?2q>qyzTOn2vJbXks(wm~Y6)~wOu)g$CgF|EY7hxw$Nxa+pF
zC;8o0t0p8oOpdJpU-wHhoz;?fxx+bUHa%xxhT1c$$lH9yKwL`Z%)REkcA=M>IZoDf
z1(4b2Jd{UIni!Lyw$0{_Tp-754`-FiY_qcm!W6^h4ZMPV^FDn)b=WAqN!p{zafmg=
zR9s}{l+ESi)|-kG^h}_g(XelM#F`J5^alqX@0Mhw^2qrvbLA~=r%O4EJ;Fa$P5;#1
zLM~IY&NZs0d#T(C^V@JSLbqJ+nKPXimkmsnaG8-V8bl4Vwl+4Yaj-w5f2Zy`5W>E}
zf2-Wb+Il0<^j*x{WP$ZkE^MacN6o^NaKBiK59`gd<F#1u0@0K$h;D_iEpf@HB*{?^
z>BpKjAu|FV=syJR>K~3y1CX7&k>r&n$NEBcU1O5$>&ph54y&3s3?t~~yy&)A3g>LU
zbR+y_R~c;MHjJ7vDONIKv&5xfW@?D~3bM-=7dSH(W;}JL#bR3QNMQ?;12Yts_Y|s~
z9}wKY`)AS1O1b(-s)#)@5DDSRNWH6QEhQXJY{<Bicyn9z6>;fDXX$zSC7sw9^~6qw
zq|T_(CkPhXg<Ka3O_pBIY_r0t26zg&tJ*Y0Pj#V9+q;>bA@7~e+U3FEEzcAF4VC9?
zLa7<6%O_qbzIcZ+A6vPfX*!jaf2v&C7rB6w3SSiBK60t1rn>Uly%?SM3ttpjRJ?b(
z%WM>f7tYh%X;~eluATcD#%6`C(WSc4m+RDoYS4MKvydYsi+r~x`4kiPY|D;O*(W{h
zhc}|{sjdChlBTK}+-j$|NSw3)=MEhI#HeziOh_nk)9@S_2I(sOvQ7NU-MLZTMmtp%
z7n^}qyo!#&$Ti4mjJY`Z4g!tHlVkff>3p~FgCC6CJSVkk=29>#%5p4aqr7F@xcmkI
zaZg)GuZ~tj`fc36oSlo4{#gHfH!H=?3}e~b%mRkJc-tI|*l_2W(=2$w>R3Ysvar`t
z8I(J#CDgy$cj4QB3qKQ)`|S#r{=I|@!c0CVA!4TAUF%$Sms-y-7psa(RJ2XHWr`}r
zqv~xPR)<8(!}7e?nr)XE@y;Je8i#%%l_>LV-eDwOHZZX|{GtJcm9|L~hMwpJ`Y?X+
ziH{WL<?Uh5Gjpy#7VEpHZ32qXxEDrrKQ7ia<GLm^O?YB_W6$}>7$AP8U5dKYUEOy{
zJyD77_FX%!$)XK=ujfy{4B3XRk~b}!H^$gV`*>T>y*KuBzz#`U>$giENp6alNvz#E
zH@kuYu}+%$X$enTVU+}_E-T5XJ|Fvm;}NT}j$Lnsx3BGG!*?&*nN7Z!q;(E?(_b`t
zNs;0TtaNTMsiwPld-VhL;BwbW((>s_YcT^S?^YxuJEm4KoOwlGt~ST=Xogy~gUeiJ
z1aVtImSo&ckkB`T)ui*eKjJx`bXb|6yY<AO>4i*4f}wss|N4wjuS?Tm{EBnzk2%!i
z%%lhSxs$!&9)_Ob_CqhuQ^ZuAa^3Qt*G0`+GU1!I;b8;q?|M#&2Hu{NS<Jc9+K+a!
z``p2cNgML^cC`BJFwivQBbPWm&u}&A+^r&^y5Yp5bE-6yA*OTvIa1R~74?>(^hGL5
zy0nL*j)s>z<_=p^vB>&NuBO70<MJ)>1{Bv6dsd?d>dqZ;R!@}e>hvq<aTp%<*hB@(
z1!c*!_#Ce(TbV&E-onE-aPIpV?}fcPt&?7(J0&>S;1p&pNRxVVm3iQl;d)q>x_93V
zI<FC<Ir5~f<*egE%iXmL%jtbo{Yz*}XKgBS4^M-D%6kJKB>SJaH%~J@$L9RFheJr_
zqhV1p`o8!V?UH>*PN*kHL{7gI%SYASVXcX>QAeBJ_mY?tu~6sylD6V{UP<)BI|qs{
zRe;HCMK@Bty0_Qc%i=cvOm~_E`OGLhn*N=X41%xAh8ITqMiUb;HPl$sQ^?_aUj0$!
zT_!UM(`tJ-MR9dDJW`P&r-sd;*IPXJ@r>!SyFIcUOTSpF<mzi+Uz<1%&GK#E#Gvp1
zygH$)?`pKtDG1;*ZgeQ9^2u$}EC4dq<&ic4K)ZZxxyMMMRkz9d4;N!fQo9DTa36<|
z@6Qd&A4S6oTJhbNHCr`ry@U&gvthf-bYw#j&)D<x(5^@WBY!-&nyT{#V0Xp$u`Na9
zHnAFG>qMb_RK7-^MaU>?k}b6rL5kNwajNJlzWDrjEbdh0*P||TP0LSX8%D+Bq#Xv`
zdd<Abwzw+9rYvTPi-vK2eYI-U=i&s>x0-RnFBE*wj_Zvt-Z6Is==TLPPV%)cQ9A~1
z?dn^OAIk!Pnf;LB`>N!gCW`BHzQ{MJ0bKw5FQW~anM<W_8-D&wyNH`N;>hAetl_`#
zGDz+v_BsG^3p<*|28xr&Z<DrizXp2h&G$c%wIJyTP~4+1(<e@g%jahJ@2h64I@W@#
zEj_q5amn!BK7l}Al*GN4c5o^lEBq6w>uQNU;!DP@9>X<J(gUSSlLm&fUZq00(neLu
zaKSlOhr*w=_bpoT1gm1rjw{|MIPZH&x)ay<5=7J0uwa4Np;)76nGWvRehC0?OgZM1
zhF#?C;q@$AUCdmVa<rB0Q<f2%f|oii+@g0VTzGRo3hPFSLUOhDxr3m7(;y)UEZnCc
z(}UL8hT}8?dIM*wh+R8>9)I%$dvQDO3pBbqKlAvtOxxCm8gQi`C{!-YgRalE`nh0!
zDf*pYA^$ka=T{xAb3**HL%3Q4-%#Nk#M$YA`~_b0Cqa)jegGG%HK_!d)}FvBD|g9C
zIOX5;Qh6R4vLGZJ3S@A2*t0{O%^(I&akZxAOG1WAFO4(o$AxWhU3Lij{+P&V=S&5f
zT>VO&vhj@yDW8qL50abDx#ZZr=C?4fCSxy!B(2^RB;DD3)o3{J(+E5YRLSMrGI*)d
za<74l00@i>-*S%}1yDC%@Gab3;OI1wa4&&8$Bb4MQ1ogFqP!XXm@(AFOP4+`P6W<L
z9Y?t=wv04zIvNk)Y6Yi)V*8w{iYJyV7zPV@ZNIHu>wROdPURBvCH*tA7C`kEeZ-=s
ze|jt~UoGCs;cD={5C|Lg&W`H~sH3WWe#oCXT(Lr7^G3&G)0!3UTID*ILbyQBXu$Uh
z7n>$!I@-$G+MtSxd)xTXFXu;4u6WUqxjz%U)Mbn20+EL&;aDTET3CkmkI7G<T*o&b
zWG-w5LYZO1YA+STqAWwzZ+zc)lJ&`<p=|YQgSGF<Gxofcnqg|Q#T~J)dMTgFMhcRr
zx|L*C++)B4BK{Hx<dV*yyLEe}TrB+n?Ftt<)W!2P$GD`ZcR`M_ZQ+#7*!pTTJuBm|
z>HWx>iChZ^`_7$q>?>P2kKRW5!vI)d#?yNo>eX<IgX{dbUhQX>lJ{J`jXHtoor!_l
zupN%3V$qVNoo$tm@RmzHU7=;NC5xh%*P~&|Hap{mzU<OVXOg@poLG1BG=7(W_OQ(J
z7yuCwz!3QMBe6~pi52L?0udSpw^($rYA+sd*jjHy4I~i5Ox-4a0IzTTWP$^>t7yYo
zN|6@rRv^;oVKY?sZLa@}D_!?z!*GSftlPUfunGiEn_myJ2MPo`eoasu7Klk;F(WlS
zar}ipb^43IH73_dgDJYo%8jA$!?HO}W8FPHYw<QtseINtcqWX1x(bV`i?W`sw<I<+
zDClyK%&ks@$GS5WrFe`LC|Kz*02!c=yz#w4ieXTnkU8VY><rU2AU(;+j+J)hH9$|k
z8hm9x<98J%Qwv8VIUHAH4N-qR(T8Ez4rP_=mn_I%SRC$?cCfKYa`zP&N0r&%eT1x0
zPasWiN;LFkm*{mgZraYavDVj-iDDo3nB8=CTm4!I%M_WZ>IsKA;mz{kwoDr%G2yjp
znDiF4l#G=P*Ew?PVd^W*`MlMMhTw9P=4|%~kkRjH5reHF#N>FHBs@M%*i0ozyBVvC
zFWSuk*9+O?3qlEc*|9S_sVP4FtGRMahF%*>QmD%_*H41?o;Legx9_e-`Id@FJ5Jvh
zcbUE>zA|1rGRKr&(UECtGSCk*nM;I);5YCyC)C&5Y62|0zl?EWHhN#Vysyaf-AUT9
zaqE%V=I&j}Ia=Y3XFhI`))+XIg_i7f8_pk0V>}U{uGBAw?<x#r?m=(hElp?*mY(+F
z3U^NTyN(^Ld=>N};Akilxgz5ntL3K5X8E=Zdw<sO2AA}9Am!otP~To$0QE-mz?Smr
zmfU*oe9p#;^G4}h40b2w9HqM+Sc)^DJbcBS$Bl=*d&$;Gj8^Jz`+C!!z`UcTg34k3
z)+AdsBP=b2n4}zh6{T)f%f-X;chXk=2-AjmaLmD?!8X*zs2erFj*URv=m|E#=0s=)
z_!^}q!@tf}ZP`kY6;@{jgD|_Iy)cehn4Gn`*V~5by!5NKRj;N#MX^w^vH~gQ=$UoL
zzHa0)lhKW(A*|V)t4XlBJ^h(}szx<+q)K`wu!@;6dzV@FK%*K^uA<+A7asSR`EoVn
z<<!v7y{V^Wz4w5xRom#>xAO%dwAQumr^qsGso^T~ObuRW=<5zJ513IA#T6_7y~Ef{
zQN9=?W@yFk3<J|KEOSZ0440AERPi`)dBwfQS1Xyf8i7G?jhAx%8GBJuICeBF&88_)
zj*&&;mB6*Oyp-2mM=RvTi}3Q5f(@x=eP^T^7=pWj{Qd=3+3GCaRo`f0Kk}u8#TOrC
zcT#=xWT>*|UHzHiIgXRwiz1bkq45tgysb~Wny|9=P?ha?V%STTIgAEY5SEPFt(acw
z{spNyGR($N*FelhP-t3diBMD1`tu#iM5i82MmzU2NR??gW^kiY&Ud6gLS4VicXDjI
zW*()3S$^h%*+S2eXRX$X1)SWeR74ip%skZ%qAQ&*9+WCu3kYHG!S1X+%~#d)+4ip)
zpzmMj&9d%7#vK{hI4nogALlRL$};D%(G&=<D_#8O!p-$Le{AVs=2U<Gbl{sWU*^SF
zS1}E?-SfQ(zAIvb=$)|)G3(rw>cX9FID_9v{+N!eFB_RX1}Ek#xVdh(?Xx<L=__<Z
zW#U886R7!Aqs`^{kR2S!VD;3=e1s}X$o9J3><P?5fgI_aQkj}5TWO!En;W;+0-X&1
zCN^uU<p#I+g9q6YsdgSqQWcE-%LQqLnXZd67<^i`r;clubCKadqs1;JY|&9lhBD{>
zh~WV+3P7^F^&q%@9sp&D5}wlW$}XW(BTvv&vjd(*Gs>+;V8e}RLZqEDr>>?55ue`Z
z86Q{Fa7tODuw}5C-j2rARoPrJ7c0b7+Id-fb_(U#Ra(-m`M8cwKOLFMDn!RxKgpl0
z&NCXw5KvX{NUyl_x!{uG=D9YlqunPPvzD0;*K(=L<Skn2&jkgE1qG}&WT-3l!X#&f
z`)a?qnC9DB>v+hDM0goV4|L(HB4knS1GRWrpizhZw?>sZuAJ7_<)FFfq_=tQ`=)}g
z%axE}BVXJgvcmDtrEe*U;W|n&mdATiXfupZXvM28($ABp)}61PL{&!>C&kSTG-;y?
z=8mDm3)Mn_O;HR>h@_>9T3?wI1la~M?6lon#H)^_P_%vx*B=H&&0BLT9gL<aOAB~E
zp^L9aDV<eQB5d@pV6A0v9Z;gYSQ*yj)1~99b1pB&WlPL=5jQ9}fS)qC*W=c$++(#<
zurn80;ms<?P+e2#pE+zALJ8j#59F@VZuA~na<g@IKA)@e{=wxh^xGSLtnRSYhWmz=
zn5@fFcE5V*ya&eubTC7n3d{AwtLlYi7dIP%c8X_^rr+jV`&UrPGs768vf&Lw8lOQ`
zJB%~3@8l5X%Fu}dR;6k=2jRW}-=X}Sm6I4oTX8Q{bY-fQ7{W!;0MRN^QLlpXt=vg(
z^18PgjNhING~F734=|O<6=%JZxL5ADG7{8c(DGmdIe-z7o`aY1wj+FZbTBlsI8E7!
zXK)r7*)wG`o`z?(ji^RuS7c>{g_+85ab=Pv)2Rb(t$p6Z*ohstF7=>+bzfh{s`Zvc
zajzMz!3Mj{9LmZ8c<2s}8bj|hLSv`v=~3CliW(~oVYU~u9;sFUoJ#waVoFV+83AJu
zYlF%ls;lN)CV+QFMk_SV@c5|^TgQZ4FVL7AQq%=I%5!;sl`Hr43%i9;qSM_D_LYGS
zN5d4=K^l@{F4+0GO;==z|K@trOTHF^3@Yb_?|JQ8$hf}Oxv{1hJ}a{*&gbW)RMKRg
zu~e&|6F>EY+Qi%}L*iZA_<KUSP&pwou2k{;ZZ}Gcaq^4zUwlz*NHXh-J9FCi^sY0C
z1kUJ;(XU+<43btJoNI-h7*F3tDr^Gg>&X4jab|KZdA&C|xBZquAxl`_km6-4?I%6N
zFs$I!ACHk!O(kN56eo`dRqDX73&z(^pn&g0A^5!DM^WqWx14h(=C%c`bsLT#t!>oF
z_!yKsG?l5H0~ZfJbZ27M`3JV1%~u<3XLcNq%Ui8z+KI15#-UxbU85?TTE{BYH<z>g
zv1QxX+d*gJUW&@lB+ai5^%zmkuKL-X@WfABcc-<6_YuQ}2ULtUGhO|Qu3Dzo_-^KL
z`CIgQD7)dBN;nX7a*JC#GMn~`ku?jvnDxf_kb#xOHrUQ0qall}y30oIIJaptjv2Ex
zOUX*E7GLi&99;Bxg3)l}^Zc(S&(RzAVFQ=N#8?d@yb{XRE&Agpu$H|KCp<ArQx$c-
z^ZH?!Q?e^dAlSfi@H#{OxPUrTjr#8eo-+|S53XPV(rgc)aVp0dFP#ATwr6kNx`cvE
zl`9uJ_Q&~Y)DMTnwjW5tYU%A$4!=0k#W)1>Pr0VYtCxw>QjG;v6~Czb>d=UGHKZ9*
zcBI>)bS^DX$eeXeZ)750aCp;d3KD!@6K)+1kAgo(?^JIXZ<44`*a!;nUvl9KF&gV*
zqV8Gow;7)B{c>mJqIvJ1PELzdAy*%tGr72yV%YnO_eglkRQ+@@l10o^=AN%mG(9|W
z#TcEVD^{?uF?g<K&d%$&jkMB~KI6d2u$OL|-On+npQ*nsdf6Lf9?lg#k`tGm44;Yx
zQQ~fO22|P_n&QIX95R5ZDO}zj81;0WzU3mrJV`%2o^n#OBR=i%SrXW=^6OArkZVES
zV0e?Un)SX&^Ji~`S9D^GTJEPb8z~rk+S=TflS#rQ&k{3}$fRb)IHx0|L7P<a`Q;{>
zeKt%&jMX>Mz`8Jww>yLrZDSZ-vgx+DmiH|PsLJ*a;QG!i1%oSB2!3ugzoaOyZFM~)
zv~pppsApKik(E`|$7gDU+p`(rM0KC_R#~GWRnIv3^|W+BbadnSQ09fQ)|np-jm_z4
zY5~;g>Ml|NBd#ouO{Tb5SckW`WDUP=G;eaT?Bw?I13zIZ4AJYC46kt(Pyso`SfY$0
zs=nKFz9L>V__B|~5!J?{yhhszg8@dk__{~N%&xl0<U3paM=NrZ@ce_Oc-D#9PeZds
znC-eOil*Y34>2KF)n;6f&opkZ#%N0!*6>SIZd+!sxT#E3db`#rY<=#rn4vHC=F|Wt
zBL%~n7rUHU=<U5)Zsb#>m0M>!Ae$q~w1&r@_dVIaI?xMZ)kH}dnz9*=EEN}??aI22
z*k4==b3}F?TcLRrq^^>qAX_!)ZnTv!xaGTDnBekb5yd4pu`p<ZS)Zhw3txbWgS97*
zKn1)>|Eqx4ChPfiGE_BNuk&J9z2+Dv`WU=QZoWE7>4jf5;BO$DC#jCE*fMd)#mF#n
zs>`*^3JbvLm<wLakm?uCTKQuI&<^cftz%98A{L?P+kTf_axSc09ov@a0|C~@iIK&@
z%}o`}npMRo^kpiZU(59}Hgv$-+krx2lF!^Q!7L}`JdA{AoCV*|Vb5G`>IvJ>r$7}*
zLU|*nF*U@d@N}k2D$H*4bD+>LR&UdTMZJH>R55p0fhzEM=o<^h&^HrPg)L)=FdZ(F
z?wknq9-pQHQLXfXu`pC(jAXyZ!{d4en?BjOr|e-_UAL*CUkp4(lcBO^^g)~EZxKo4
zC_~F36(I;a*9lU4jNFP{Kpf4Qv9f6Vd<14HZaelBIZ~^mk39~rPVOCv(KN9_Epff7
zVjB+$y1ZTNP}=Pa>Mt1lGH|v7<6d4}c=~(&!l>;G?yopzDfdsquv4ycoy;!(4_j{?
z)@1+wjoYXQ2nb3m2uO*Fbcu{E$x#EPyWHq7>5vu>kkK`yVZ>Cr9W`mGF<QFE^X9%k
z-|z8zKELN5IXw2qc3tl?UU8n+rIr=2IV!)^J6m-WIXP7^mVN&hZ9tCd>*n+Uqg8hn
z*|)3pyhj*m7mef$2FJa%acXymvFJmz)$KUo$Ju}58(|ln+(Yhow~Z{8M?9J{qgq?r
z4mNK-^5Rr50P5BkjQvsXP1)vUCRfg(*jx?x@o&l_rU?mp@>Psg!@XfimViCaDcL=+
z3Ziye_cdPK+|xs2v$6skt3r>NRZUxQkuX>=yRC6upH83=;PPVZ7!cBYmSH$7nAI>m
zz%NT3{>q$2r=$;IryTV5YMj?m7SR5MAm@GbLePH9l%=%Pen!9z(@mPGv;*?QV&j=L
z6lQzN<HPBuV4veqMe!KWFNl*Yjnckn7zMf)wqN~`MCy=p`p;X*X#>;4sU{!dcF9=s
z){^}C>8x;2-_Z(ZiPX?e+ur2fOV9Dx{v+bv?EuUDgLLBCgxN$eI&%@3e){Eh&>0f1
zGS;ppo9UBtJ|1DQlaPXs;g*(J{O2H^yIUCc@e_^HszdlgmbSJ^>43fxp|!qusM?#i
zbF^h}KjV;#kV~+XG7*Ebk=f*_^Js%cfKI(n$kDB-R~PU(O(Tl~9sJ34Q;#!a&lxAY
zZMw4=R@Xt!j@f5sRCO;7uH)kn&uxY2n7arP%fy*yl~S1aOjwVxu@vx%CX?}e=RH(m
zjP$63)3W-vZz3$}>~BYFn(Rl-kE$A8Eqe+DJWvsLuU_R36q8Osr+`7qnD4Ll_)oN(
zk6<^H)7I|3z%6!_wY|U()^3aE-(WX2I@)7aht)j+xnOQMo{iS6@xIKq_R@EAP&Sd-
zUaz<M$o~kkDVTc6Zh+arC=6le!#mO==wGrj7c9=RuIx_X%=xCV|FngZL}L8+Dq`L^
zcOBq{E?^-2f2ux^IjYv-i378_>K_KI>jFkF72?;_IqFE#R?POk+s8g~9cOynL+KHF
zM$Bv<)(#3?xo3X2Y{GoA+k)*^iqJOQ#dMshpGe}wo6%Gs;Z?C~RL%@zwB#!zQ$61j
zQ8Zw63A;<e)`7$7`cOFCae+-3+<3t3wQbW@SLejUKtZy{Xgpy##*)ZKpqHfv|GT=e
zQJcy}bXu9Fj)K>3AsE+N?VW6_^SVZx&uy_OJ;MyJNlCS?pMQMkS1)DyCvVn+$=7(}
z1r1MqI)z^dIpiL=NFQgDHcBu7qQ4V?JN7dDi~I}qm}qd#yjAUg80$oCx;t+DVZpCs
zA&65#>SXWNE!p}0r-2d}{B9zL#;<jM>wR^OJD9!Gxzoe7zcJ1Mnw*KI?rNMexYH9f
z%k^~cuB}+iEMm_&)O!5TV0vQR+uU606rf}3#u<$7y5(#8h1fe^h%M<y)9%St6ZlA$
z(~p16OVA=ERs72I#MN{RpYJHObnQI5<yG{gXH&*sIn&*q>AusYbwd<q;g!tHlqTuP
zok*9a>1~a>_Ci5-^oc(gh}ABq7byhmL=#{CBX3BbG?`wL-Xq0Oo}pSr!B*M5df}BR
z+z2(bHd&S{4#-+CYWyhZbEtYT{<95XB~s`ITQHFc{Rm3m<7Uz5mB|_`c3&16vs}L~
zH6kf+aM}6B?bgKg(2U_b<BJvwJrS+r4O<1Ry)g`x20li#AR!)3l=@8tnzvQ9KGMHI
zy#~ZCHRFJwuv&}T{nW9GrvB_}$2HD-8S?G!t75{362$0xfwN|c4|^z^DvoxIQ}8iA
zD~ds<Up|6ynv%M5;`R}^4oVh=$aK#~h;}ie*<!(oa5i(9!>exfi_HS%3o)>8aZ;gX
zn7POOSGWq2v0<~+-@P0fmqMa?QW+o5p{;R(9bMm080{hNlZPA{Z$w;|Y-T&?mn&@-
z!1jtgJD_v&hTH#cF1dn*pyAz<8|byMO8yaDXXMU(T!o1Lk|$M}WI5i!C%yIW@8Qzo
zRY4-8@J??^QmPU{&7odk<n5EdnttYm*wRQ2^BhSr1EbN$n|AyJF$QLd1fmD6>+Rke
z2J2)tBKhJZ+hTea+B>{PWn<_FWmlWIwq!rk=Bj`@Vmb6w(6}G|W3*-&!KrYjgjV?L
znu#ah$rYVh&zSMEagsWTMa_zw`CLohQv2=EkHn`8p5>%4d28I)a2JV}Sj<R~{Z+}(
zum*DK?2(uMKJ`;4S5JCt3&Y&FaAX?W6;mP(e<X2YTm8ZMzOzQa65n*e`^A9UU%Hxy
z7q=(Yj|%^Ox$SGe>C;KNTtS#vOg#Nl{UNboI|WVu$nn>XXtiYJ2DkH>=HV{rRKK4%
z^><T+ABy?*?GCy0bk*PXQtJG}34m6b-@Lq`WaZi%Ks~vg->1YB`M+v7cKB8(GrVEB
z&!4S+Wxj+WU~>}VU@vJP<h@&-M&-X(?T=c1xPZqu1$ZCgb}cw@m9c)K+EQ%3z1Dt)
zp7ZwpwySCk{y>Agr;*`w3(lt_iuw$g^#4A~oe2#8R4ITreOES2`i$Ax*kn<n!}-@g
z;|cf2tI?--&|$BT?jGG?=ezDGP7s2B<lJ#l_JNm=+1y~3_GUd{aoJsM6uLoSy(Q~7
zy5m03xB?c}*F7G?=}npa?s@$UuRDIo`D5EXvZmaQQwAO1DDHPdtY*EnmETkE(00Ku
z>E~x7`PjsPao4Y@mV%B0i?gEye5w3RjBPH%7mK>{y_`-<&AS#<LaC`LdzU_l7#~a3
zc=TmddF(m~9qo&_NQ@Xr5X(vjz(H1i0pZEU_n$o|5wQPee+1~o-s<R>=OSTPpuVg{
zYg6FmjjopOCZlYt<YkYa?tW*Z$YJ6*@MwBL)mevHO}&mIcUhUsd}Sv#K`y(IjhQ7+
zv6KL-C)98zbraVGKmfH)k89j8D^IiT1Xy7fe}MtoEN{~UFxqW?gCF>9oC?BITm6AK
z=HCUcz{Ewtbf4KHObXlDeFl%X)on1gq=PzI2AizHgR=IZWe&?D?8zm=TmR=-0FME+
zA3t6+O&0s`J7nO@^Ke<#mKKmW;YuIz#CY`es-rvRlkfaI-tIdoa9P1_mt0S5`!Ivr
zJnQ<L8E8(#xF1-uX|CG1xlS>`{P^?X--dP4QcV1;rS#$9;PiLT)l<JMjSnThKg#vc
zi%Ta*(tk7lhA-5MAXv`YKRJKn$$=vbx(ysH*Mp|hztL60F$$S`$7}pTKi4O=PbT>N
z5c?yhp7z2pIAV4GcY;N1K3roLBv5F5?rmV4#EI{`e22>KFn)2ivqpbQw1gcrM9wkW
z_M(3R%(*Pqw(ixykihcOn^pY^z6KjLTV{F+H@>tc7O4AJl-4Z`j!;LytOvp+rK%)H
z&byf=t6axc{To*HVN~lukGJVP+>P~Bf0k^_&W$f+jy<wkvG;!^bZsE}RQ8xCiTilR
zN#k`KdpO;xeoa8%w1qW3<7ro2kz=m-TXNyFM=leVewAC-#)g$`9nF6qXPEC*t<@-n
zId()YQyUGew^mgZmM?HL4c7JsMDr5RdfT1AtN{;j%eey@z)7L3a7Ma+x7eEA9S^>h
z?XyAF2p8w%<s-16ZDrjWU)hpaB8Ax9?#y+>OqDwN{H`lMfh9z;zbeQl|EV*vhC)}w
zeehyYXTdiRm-d@$drv3Ege+RgE}sRN<fluws<X#wymltouMDk=yPdW`c?|tz8CX2Z
zmTgw5fIGqaGx71~sSXs%mZe<%i#qfB+<xgRZA|vFd*~lOeh6_l`p0@ohek1Ml$OP^
zkuIyZBGfh^{aCd-|CtAO<s$K19`l#3Colwj%Y7Y%NhHRlI6JItAAT82qe|QLN~e^U
z@5dPG(8fk;P}Q$`O)*X$<+5}m>$(p;$JKB^e{C6SO5jVC#Bw_R5-beC{OL-gn<Ro)
ziWk)#N%=pOSX1g#JNeKJ2JF11_og-uyAGGOV@po)EaayP#p}w5gR0`$>2?f8+<}S3
ze)()YX3P*08PT}*(Ui)6{<eR`EG3aJ5s<cmK6Yd>ohl)XA|Cnte0$<^C|K{R4YZ}4
z?@O`(eM)_0DEkYJ<RibPE9V0+(C%131)mT~``}%Lpj}$zAc)1S+@QK>Yrs6Ppb<3C
z(VJ`=C0U13cgNbSlho}TM*b);Z<A&QObLaX3*Fi<C?eUN{I$_54Tb;Cq_!kS<6SZK
zL6VcwGY_M9>KdKYp7+`|<=D4{V7__pW4B*5s=HG?RJl_gn^<GIJZh`>WUZIMV^PiL
zn<HPsu)7n{SLAULk^RkV<TS~yNjlbi({0x0=jbP&<slP?dxTL#<$v}Y{<8|o2v&eA
z{iK0$c2T!S@3G`-DGB&-hLy0Rr<0j4FkUB!)TGkxbB%KgwQ!jNz7CZR)7X_xp!2@3
zfBY*2uUKd9nB2JK0Cu1wzb@nN2M0J(X|3!Mw%ON9Fx=PNIP2JRB|E{qzs%<*D7(h9
z)hBtAi;=a!RidDt9UIM&bX!sUoRs2NccR?H%aWPXtM<`6HVOq#U26Dh&y7-L08hH<
z%r8d(o`-wuDmLyth6|!No)0?WpuG68@A$Zn+;np#_apzwjJ0tUgUw`YD8DST2jeO}
znBV#Ia^L=nOOI{`hJmBC3FEtMKJ9$EX8JSelxPaZN>9@p%Flhu5*hnjEwsE=x8U*Y
z)46MJUtaT`cJUx}zxlL{;u6IV>Zi|K$fjK`oPSq$iCpC>)gKWI!UKb8G{9GRczB}=
z(AH=lJYQK-+FF0E_d-=}I<Wv&w<Mr0^#z4FbSU0*3PEY`)ys5GlgA#`kNM~RQYmQ^
zwhhQ);^OM4m<iw?OSmL@!Fp&VHLuXfQLdaiawOg9bW1K8Ewc7`N)8(Nvu>zQI2&Q5
zk%_>oX1+T%Hf%&DG=labxi!9A#YV(0%wNhp$;mC0Ztlhg;>O?_b~X-lZN@ufQ`VF2
zh3UVlj7~ok@O0&Uy_-m%VrYv{yVyX)vmQc@d&N@kqQ%sndhf`<Bbbdi?E(o)m*fU1
zoiE)*w~mFkx=7rF&A)7WPw0$R6;0*|=s?A;1f#ra+2c}HSF|4TIU)wfa;v@=7#fO|
z?k_<4LzWD+npK7@#jw8JOMlA=^buPRt^PDUZPw&5=+;pZqx^EhYOZ$``&8~~t~<3t
zpdQUFQA4t>kb-Lt#Uc4+LlHSkA09X|MmR~=kO!mWW2UR`p#vA*HLOv;AuLTYK7&_U
zvDjk;)fDXnJ``CAlaWzi`-i&X3a1t07^Af~$Zn8dV!P5gCy3AIF3wu%E@kJ9Xw#{}
z6&X;6L-Msa1lVG8;&cmdZ9q(dQN)`t11f8SaVIm;Xm+`wEQXy?3M7w84sXh+S}N-W
zL~1akIJq-aIb>cVsX1M3s>G1B(L<jt*3U8RzA|g1n4@sAecn&XjRq105<GP15>_|<
z^Xr3qXt6db!6fi|?Rq(|QNCLfPe$DrGV`-_O*`SC_Y@vY*zYkB+GTgY);?!eQ>(na
zDxrnZD=NrD2u;F@gmQP!ndbHS?T$wiJx4Ai3)tJ);IeSSQ^a6@zkaz2t%~eq{Z5~)
z79ZObK4D!xWv5`&$ID*LT@^uLy+_@zoqzcU@x5Sf6NG+IvQBf4a}zaxOTyxx;O~d5
z|3=S!G;Ks0!frJ(2gO$AJxbRvklM+TeeY&pvr**%$2xjQDkqxwk?ibIeCT4WT+g<4
z%1!n7t;JpPctEXM5<==PET#2rqh?4*Wq>o?<?6{=w|RcqPYE=)0!!nJh6nZ}z(@YT
z*}Gio8C;NUw&CO^tU;Kwm01QZ*#BMVYB<#!La2aD$~g#B6z+c;=4HDc^V7~qlYK`H
zcmLi-_x*&#FRF+L)(cTJ*9v0Fp19?Id$xwp)ol=4fcTqm&0Emu>#pX{5@}$WuP18-
zMSU~#QLjQaBbb?LM=73g1mw6rRp->w?&2=JWKp7}+o9B<V<2Uef5ZBUk-bHMLyD1o
zUI}IlJ#$SIe*f<^-Ebdq2?<5S^W<Tro3P@184y|@7}susI3xFPqCpl49_fdn)H{qN
z%364uFPh9q$2VW#4$FIz4-57rqsLwl<u*^&FK!O0D6&e@zx<r&oluhN<>i54|0l9i
z#j1@)jq(hR^Kxuyv|D6<EOm_@%E0;fsi<5d{X%N0F^PIZg(Vi6hWgJh*Sbx~?vQN{
zbfV)61~{3|wNs^IbUWu+X@14$+(XMF=_kx@!ZN#VS4RDF3-3|Al}q=PdA;|!gmLGI
zR;qiHT8fqoMsi0{Y>nWTofrkR-C7|<<t{rD3zef^PF7Utpx1Z12){0R#B-004$E++
z`O`@rZ1ZRxL?rEw`uQ9lH3`#uC^?FAp`A{))Chmyd*mV(RCDPB3T%g#ybsqCr!Hp>
zOA!aV1_#9Hdx$ledzs?SjUo=G`W$Js(-H;wx<;06vk}ADeUkya4yk409+R)78a9Sm
zM^=9LN>5n$9THN5;yd>>;gT<>YT<pw0iTE`-m4K5w&}9H`r-@9Zy<PvQ#g65d;crt
zmi@`eDF3qCd?rYuhmf!iOjlkbWa=J`?ZHHVpF9Z*LTG5Hu=qZ;)61K%Ce01JR4{7t
zOX7=?yXZj0KQxzGuRen_nZM<ey8uepn?=P4H$esI+x$trF+5?f++$FLPD)jSs@G2z
zuglen%FSGnEoFnz-C1F?LV}pv%6nw`FsAL-C!+R8Za-ypb$0)<Vcr8>ctoq0b?XDe
zqk{{cFTX({57(~C^E1<FMp^yD94#&yD8shjhbJXP%gSALV|_pL$7pQ1`8I<cHbeA@
zyY2yFVF4!-$(WKN$Lb49qpk}zGi6Om&vj7!H{&@G?mr^~bLOAxYo4wI62#71e69wU
z_3Q^QGR{ig)Blt_UAdgHB}oPNd^?I;$+CWjmD?;RI5IC8ubNui@Vv9R%8uSXuMX<C
zs1*76LHY5)xBW32PksJ^fo6Ys@4kR)gAfeJMt=0>-ud#}?$D=0{cUje&HQ=o2W*nE
z=+qbT(!r<!?p#gp<ipLJjK_f{Btchf4SF_z87<;w-kEWC#u~lKFD_4|HyWBFTT@h$
zxkiKU=%^@TT3=d3j&kg@yWWIZUK3BJKo)MPYR+1Ko6jlmBW>f7zS-F9cWv93FI|q$
zCr-I${o?TtpilK2e;c{;A@O-SG1JtRuZ_4eD?H#-cl^ATKhfBW0mi{<R&YPkrVjK*
zZLg$JKT%EyuAoy3y%R`k(>GBiyz1sBD*$^vdjda_jKXed9Dl4jYUxwmS_)6+IhvbL
zupNlN2^0(Wzn$l?x80Sm<5F0db1h7B_NRtLi8*MXkN5*_?ltzTI|rH{4GNU>zg0-1
zS^G5KsEucNE)4TQSxT7)-Zu40be}ranSHppn*Tf@VD+HRW><A9ugfalug+7nhbHD}
z*n~S31S-C5W<-m$ckn8#x&nH@olVXQ=YvrpkGeGJ*+8lL=1&8=XiKMKtj`W<y;b{G
zzCD`<jkmb1<&Qehx=xw=RI*u%zRR{Cgk3v9Emg7pg9JZ&NsOnINa$BpL)c!bs?eC%
z_07%);$6OU;+RkrR%G3wsVeVH%kYm3{|z}~=SM$nPM<|>-o8Vf@_>s9X@8dpfpRWX
z7iYdj`wS*l7NGR4S)ID}{BOcen%zAu6d__Jb{&3Zfp0v|We!f0JgOmMvQ6%ifm>dW
zriS3!eO(46!RbwyQ(%XZ8$$POi;7DtLq^5M!t1iCM3cD{bP=qJ?a@h#Nl&xu4GX*y
zTJ-6)m2C6#pJv(xDn|!<rHm%$Rmw(`^O{fOB~yws;=iiK8Kl;B_jG25Qq__`n&9^1
zsC7MF<~<X9L~OsiDP|8~oUBet-Bd-i+e}=UU1xW@&e}T`2s9y>P12ZG+$I5+Sfq#9
z<?7@|nr*Pfiu4P1br$5Ki$eFO7&&86ze%w}9R@E7Ns)#0{By%>=dij_M#y;Y>3NUE
zJnDyE6ZCf0eKLDO=lknU-9pN?=}@M^<C}L=5k$l^x!kzN-}75G(+yCCZgY1R7nfk6
zk<D|5_&Q4~gP&^{e5k-;_dw)zpKga-7*<eH@|km^C%<Fqh`g0r_*mahdjng|W)cQy
zQ30uPZozpa@S0#s_=K*v89Tphz{Y$49S&M3JYtYku~Y};;)kvtj%y&7WscUVB%%(c
zRZ=T@)D^HKEPg2CZK$}T8vpT$Ubb7^s>k()?Ij;&OA!GD6O--X=QDZV(TiOrnB1NK
zuLnDOg(M4CE3aV%AwQ2wKw3*Goc$wBNEHXL4c#R9(C{OHTQ~wl`$5#vm!b=uG*}hH
z>92G}c_^H(yX2;u?OOAaL&G}3E~oe5&ir3}2eTg?`8v279Y|+%)YInI_ZTiyA(sif
zUW@gwm+G$#HEH^gGzb0t^J0on7);e&Rv61=B8NM!@Bd@{g}O*gEG77|&d{wAWMTSm
zw{4wBWI=LS3nuFF45OPEB4jHM_C=%M8tABxgHglbpPHD?!fU#>`1!wRZYV$RqeNLe
zqA<_-CHz2fIXV*mf)a+9Q-Gyeovhz{LdV}z9Am*I@Ep#RSs;K5;Q-lVscjh|P-sc;
z7lM*v1$oHjpq!cWn;w^WcMCXZu<>kpWkp5FR%%H~yp7_ijixPy9(lzM7qLT&2A@hm
ziIU)%8{`C0k`6=0&s_~vU=EOKIGN;3WAL_Bx;NpqwQgH7QH@(;IE6j3Z-RxisKm!b
zN2{9#9Nti))?`Icllt(k<!6!M($&%f_Op~J%XrXbFMPYBj~-NV#d?*zSI=EA^)=#H
z9+hD1Nyr>^gBuN1Oy>A-^LzEp;x`I8Fu|y|&*=TO)~y{=+xi;*(ysdbr7H+l+%d+t
zceQ8-WE>0gd8{0lN9A@s><_zS&-gnYH?DRY<{svn*e?WuvKynU08;1n?`pk=He`Js
zc<KHh6>R)Mel~l3o}SMAy)3T_y_K`FfduZLK@B7i|6(d9YhF%HRtK5-lSGtDJEf{<
zOnz*Bai%8ZrB0ZC(`qhw(7*=NkuFT}g!vZc8RLj9dwinm?b{W@UBfbPrtGEcEp^K@
zPW*g(?8O<Yldqo)NZv^=E%Y{vSxzQitrdr9uI<VWVv+BzQ*N};y-myZN?6d<t`9}|
zn{{EM7>xAt)nR|9+Knk4#}@~2Q))fMf}KMk0OYTLDnsd3BYO^6C_Y}R3rpf=Xa88B
zQfM~0@kYODwD)3gA%opJbG^kH)aQH#EW&E%hAUZeLBHHUeIbKh*v4)$Glj=9Jvb9H
zr6wgbUqQ|ygy$1}TyXc>r|K(LhL8nwR`bD%xx>QQ_t254_in=4^glb!FU)BgXeN!k
z%06j0X{adhuhgRJWh?=;Q!pY2ss_cs(tEbxs|TV`%I9FJN>tlA1u-&Aq(Shs*a@E~
zBc8!^f6m)j1*0NoAeI~;>5||4So?Nq|5XTP{NO4Ku`1b&6>CTUqfMo7Fic>NSPm<p
zC1EQppp{xLnqAxsTMc{7d$sIAUJP-kbt)^f(5=B8f&-9?;(7!3No-G73{MxTU~#0)
znIn==7&CeFXKK64^u#b*@zMHGiL|2h=}1(3*MS^d(u?>5zE!!v71gKzwcK9k856T!
z9Y*}Mw;&&JeXF&A)d@qy2R-#Dp=QHh^Y{iZzn=frlhQ9vfI5*4{DZP!DF4(}M_G8K
z_{CBl3ap@e5yJ2tp+J_*awheSvmDMd{f=}v$eD3oFBn{nR(Rsc!0QJ*JbkYDPa%p>
z5nldzhP2*^n{&j9iXlyBQ|mnYMsL1{MaXdYGP~?ubfkJ=Vy}2Sbwql>8Vez#k(l;}
zN5L7v)>25|KJvNWR9|isj7nWHb#E;sEOAz$&1_{%=q#=0yS^|hdmVoC9Lu^l3F4&n
z#(%{LHeODZ_Q^@Y@m+Ko!9oEq*c;O8X(@+$n;~OplF3Xt`CGcW$};hD5J5~xR?O^c
zEG5k6=;*_KKJn%7;3n6M&&5iTKm+`rtDg(<AC-Jkz8<O@_OWM*v$amkyncflZFQ;N
z)~;pnTM^vd4FVm~eW?S1GL^=$+)dJz)V3B$u+$3)V)mwC@diXMM9_}zE?S<9k6Q?U
zHoG@()od?FHu%ApQ=|F?g(nr%dX|1@XEF4*doJ|c9&lAy&o$nR^kL48y=|PK6In8p
z3~iJ>@Df#?|7kfKvUGT~rH%}1iE=1oL!0ab2@t+qZfh6Hj*Dt(ACaDn(BqaLkaWSA
zV%hdimGX<JH862&ji+4MPwKl*tk<P;bU5Nh_>nweIlNy+)s~&gIQ=m2Y%M{Wd3Ko%
z?W#{sPjxvhOw3vM>ki4$bDd{h9dK;rOgBjYR&cp@%}BtNG{1j;P5B(s{+)U~brUEe
z3RrujeQ1qLm!`}>GlfcQCM84c+?C8E6{tuNclzvavc4C%6eB3f<)6QNq#HWrRXz~J
z#0pKs)-8GkB8NvO2GsrhU{8^ER-rlmLlW7nAkoO#&`aT6;i+qGTi|XVh7_-1dOjY|
z#KkAsyDQtQFFcqc>*0y(0&)4@B?2^&6>~bQU<d?)vF(-HF0?JmSes;CmZ5iR4@IF_
z(=xblLZZl(ZRKUcCy?(s?S5EY{-3tIayYYlwY1kphC&88k<O@Fnj-&HD0F(0)iII}
z{g9gC{Eg6{^Ez6|!G_{ZKk_PDtL*9RTQHX=T44!eH(`8~a(ovdxV#LxmMfrzkv;mB
zulltvH<8(AlimAIM!>JS(?ivRY0CL4?ANohv-^4aCY3P14|Az%+sYWdz+}wd(tya-
zPrnNacxfnEO{3dwQ!NiV4U;RUQNwg(qPr9JoZd6eIJ#ZP<RA@9TU*=a0LM>B8iG|8
z>%Xgjw|MpKuIZZi;^d@%fr&Mz-8w;wzEusErjpw&4arx1P|gCu*=lp!EJFDM(GJUq
zTuJq>KsZp$C#P*O(re&>S@m7i$P8%Qj)W6mv{Fp^1`C}o24+-OnI3q!1CVU%w+2XX
zgtQgSGk64@U2))DwB0M&3=z;M1$#L~lAGRxK!8GXrsv7ZpKQ(1Q)=kA&7^$zamvoF
zUAC`uI32XCOdCzLFZlW1XL0w_TsB6xslv|Gx@kK4Vs+E!mJ|Mb-TaASoS-K3#`PL2
zEZ2v@*S`H39>(5HU|9`|<HNTphvjlBc&)8C(NL<V#2t2~8|l)#j_Y)>nh5@4*)s5e
zuZLL1H%=0aQhmjH5aI~cNZBtdaV^@4F>1LSZ#KemgeBz=5`HS7xD(OEu~y{^AS@N-
z|DW0Wz<w0`gK39Ynb<iw2UfVsi^SQJWEGrZXkZ3kEu)8{l!RCxLvW=dLzFO;>&khL
zN?sOGF&Ig*(zElElq8#Rp~dKaBqSy+<b5qTgF-9a4h7uBIxVk~)7f_2=1k(VsIZ8R
zg6yXfPl~h}JpW3i=7`>@9RBU;_gWGGFD%Ai!VW1ussce}-X*SS^q!EMC$N58lgMi%
z7XaJmmE7DX-JaN6q9_(0$?T7LZkF%ZTEV?&XYj<*RgJw=^#~ufS8(fbPZuSAi>I3Q
zytKF4ma4=fAH2@tu5_RJxZ|M-6h1*rOc}86o3J!2p(fG8J^j^9wh+BkwpV?6z$!NV
z`6L_tx1E~**K}JNXS{G6mw-U3o*xhYKw#%blassXwep3??KxRo5C|n*g*z0N`tz!l
zOd|QxYa86|FOGk4u!EhTX3u8{5f6yl^SCJ<f%k-h@a{^G7%*A>Ar}=DmEXQ{a&oWs
z%sH>#|Gya#8stCUd;O<jL0N2!Irnq5<VIB6g8En~N#*=iFMDO1bvP`iSlxsvSmRU{
zU^QD2n8C#rr;J{do~x%?4KHdf%m`a);r$3%N$rBL?C^{r7~<Kg&@p8W7LG$(_BJ+e
zmQoT5X{k@udk?4Y(as~UX@g?+Q?+va%605e1J`?kU5``(l1DmR)IRhz&aaX+)HKoT
zmb3x3Qd?0Q@jPwQJZAm|7UAH&0|7MyEk-@9vscbtg|z3QnZrlPl$Tz{A|&d+6fqX?
z=HI~#wAR^#p~NW7FR~(+w;#yCi|q??dzph#Lh4DMX+IL^wa2fG-GSgfq#ovx`)<U<
zZ}%6jV@dfjD$WgCk9W3Pr9NF&aIzTD<tR3UX$;_|<T#dVB!H%Nd%|Zddv<rktGtDu
zB2$BS5)Y?QV*N$Y<-@ztaUX`=IaQZVCc+OcByl**kF0;YybTn<2ScSheZm<YCSK19
zx=}}Is{EMUMxDtQIcyXYv1^#wvR_8?P{8&{)g@z44V$NNZM3NGT-GK^)l(<>HL{d@
zWR(FN>>0y@Lj8j~c=;lp@gI&=<8hPz2Sk@3hgI>V52S<)g>)$DBC_zw6WsM@a0Hno
z{gv}Kf87U&nwl{bBwV~W>0LC{;?<yhE?XTFF<J7m=MSaBPzOLaj&<}KxB<Auwdw3F
zrx`9W2?<C~abZip|3zvF(POEQ3vX}G-@=+16zM8~zK}plCm<;J_1({>{1DuR&2e*8
zU9RLEC9mVFMN>3$@gXGSUuu(_9U|DowyYEE-VyB7ZUCOaHs=xqR7Q`Q*M;cK&khjP
zJ$c&3`5`jFACH5i>HVEm<)EdT?L~IMsA=n;wGF<nJ$na75@-Oyke#a{6fnq$Bp~e#
zG`U=Fsd7?*@4fZ<Bf)T*4P>+(B^II22YO*s`l<XoM!%GRARQ`Jbipq-A$|zd+6!6r
z7ofp2#k!Z0u+H+;WAZd^@@7}kRt%mcV3(bYEdOLIZ;T<bs#6nM+|S_5hfLl3;vDbT
zztQzjEWTIzXkY0F;XzP*&FfXR!W9db!;!2v#*mBK2%jDCD^c(26Ln40Y)XK%%4;h*
z^2laNb8Cl38lo}MUD3QsOB~=_g^7!dVyjtA@E{S?xEJPBVB@pyz{|1R=E70^Z2m?=
z)f5M>H@a0yZ5n9-k0yMJ4WCXa#eW!aZQ`ToH&`&ejaQt5-Gs4iZS-pfqfC;?wl80L
z_AC(GPCDgw>V$I;+&6uW)enRMPV{E~O#O|j0VM^0IGO^zGmpQeX`)_g=^Bj642I*y
z3>Q*e`}IW}9SpeU2K;B8+NuUVG}B$R2(>&{{y<VPEG9N4zv^uwm(G!ynl;^F@0#8c
z!9j~&g^FEMw}mnL$(Py^j8Xf~C6%_aXML;<)Yp*9o}vC`V`Dfa;5*Ec+}%*$eS0ya
zpw)5_0LvWOoorhG@tf}KlAZm=Zvz+4$guD=AnuN|X~7YOcO$JJI44T3DtSowj=iCE
z^3K#afCpAk1vuZs2RW=ktZ4TgxTa(5;Z$KM4Xo<}AzAoJPb)15fWL0#uk(>LzQ^he
z>qsUn!mG!P{*IQBWC*74vm_!RLNn<$%mAb8YyFj07eHmvJ{y*|1bWAxdFj`l!CSm;
z+FyW8NN!JJq%v`n#`pcDzMdZM8O=YtRpuwP|HiB0?_?ogxik=D;lDJkjqoX--_Cc2
zZpMVvRZj848k6<gb(E?nUCy7WW?FJ^IVeq%UI80NlDxdUO=`s6S4*D3HAmz9x`XW?
zQgxwx1iU)Z1wDOOzPLq^9<E<9B$Mhs(65zWa$tU@L!P#6IrldP5#9U!3z;Y;d}x^5
zzN7R;vLa21ZQ_f2&~ff~+-D^{xF6Kl-J!bcaVt`540<wsL(KZEw`gH!y3aJ<=+Pg6
zqB1oxax8+1s&5VGlq2~vZO_hKQU%(p;Q99x!{F8%3d}IxgzZ3}v^&aSIqfof?JfTn
zc*dT1cAmmZSVY{XNCJKFR<DRPpJV0V7|wD$yP+pK>4GhtOsU|f1iEqZJ;(zH?s2n!
z%;Pq1wM!wt6`OqP&}K|q?*rM;NH}Vru{U;~QRpdq<p^8zm>$^%El7Ug?EJUL09cJg
zrpZ0EVyewJQ)(chE(a-sXu8A1hZV#Ghc-u1=V#WvUrHIebk0c_q`sGClINY<$igAt
zk~|}>#vm>5xHXMn)VvfG3_5(R6#h(&*V5@px{97}6O$=N^O%er_-1>Nn9>mvtf0^r
z>INF1|M_33ktXKgh0bJdf*fVfRyK4h_b||^O|0eTpUo0e<YrmBjMf@@T}f>5#>xC5
z)ABcYIqt6B<xtd=ACa*qdHPtg!=<TVX|!(fr;776k9PP}_u^2qUpQQ?8jC;b$4&7H
z7PF1NT`rMI=@mKn>k^c;cOV1zTMIF=!I?VpNaiTgl{Bs~qyJC{D|Axrel8*u@FWoD
z54RSxW+|?ZRi&mnWA?7Cep`0!)CG)I9&ZSAOH_tJ)7^6ylEDeuy_0>+8jNzYJ`aIP
zV&gM46K?5tfpg4equcywj)L6R{pe(4Nf!K|y1RuNhy?6eY-suAdeWXGr%S(Hc==nF
z3bILx-zkpoyGBK+S*+#QwAa}+6c?|WS)qe6m6B<VGiT>9r?<ao#74H|Xi#<Wy<c-W
zWkE>5UMOjyPM87S`F8ZDItau9cxyw+cOX!E`SxjY@Eg}$7W9DbQ65B~Ps4uybB?bB
zMoE16p<yIxBrYk9@}7bNIn5j`q@Js@;SHdFx5be58Nql%RwP<18VH&BrInhs+~C66
zX-kexL<^FgnkOMQVNl`0OQ(MEnbHaNb}hF$uZkQUv}^W@yekHMr9ip6_V^|&)jTA*
z8>F<L^?SBb&hMvsC-&Hd=9xt{jrzNK{tRUkAu9Y5A0LV=d<fn--Z=DGJXUcE{oDrR
zIu@UE6YjGgwI&8=fHf?g)va22bWe-vdTf3bD#Xg+8!2cF#Xt92N%wy7SC8<jMnJ-(
z4&GIbP6vN$>vp%Y$QtN$HpxN$^eyMrIs)*l@nrL)q9-9mIiihwpfbS!jlTz$OmBpP
zDUk+ty4(I5zU^DPHSxRsy@#n%5K~2pYa-j&De;(L)M4y>{4%(p|AA^zfimYVJq6b^
zbScOTX!w2L{(2+rD=d&zyWUG{tDjOED-XE4th8$slk5dNZ7zb|Z9xb|Va3+veJTQ%
z=o7Jjza8F&Dw!!^&ZNfP&dj*Dr}O2-IsT=aYV~C?i_hU?4=OLyX_F@wh1(X9IYd0|
zuC^Q@r=YkJz|v!XJ>WjOXgqhPRiLzuxifI@DChH`wO2qAx1ZIJ=j0xsrXYgEs{wLL
zmW1H`h6grJZKy!`Ndq4JG@(^hAuWdDgI~yXlY<D9EoMWDiQ@Q}iU-GYm={Tr%fA`r
zN8b_XLwX61Bh`(0=`ucNQoO!pHl)LWys#jCi$-M7-Px4C*iN6xo9E;@R+m10mJR^E
z$Xhgl_W<v?acgDs(%T_HGWdWa1-7SJTJ_}Q;;0|+Wx3DPJGKPry%~nZWQO&qvr~=|
zv7qq&)7zDe&SgX6@fO-fJw94H;_-{$+4_*VX<oYdX!FSNpfzF_`>U=mhXK%jV7b!n
zejZUzU^R%WNC8@g|K?g|#bWF72$S8nW3p-qMeEdnR5w@|a+%LVLe=`qiNgG0x}oRA
z)rL0m&iSJ2yarXF!y}#)g$}WivhdUo&E?{E(cbQMzaHN_cb*!6akcL+s|C+PfYjP7
z3O-SRuL2|;slJmUm))ZMKKkjr)x?A`fZ7K>YVg(7W!A_CMaeO-+7S3GS7(2IDO2ie
zq;W7R|0XQr4yWU?JRv^*aRk|O;OIV@(tBkz_6-6N)AO-QGjcb42rIWDb2S|<qI=Bp
zxq~wI$gDrS#6uRov$NfTShxpzal=_JmW7k`*^m`ytV1_3BlbV7AB_}t4P>G7)`0sJ
z2zs&QtEd)9PAyp#wn~pm9_VGPE;$`YeRXbRq0^-qoAzvUx;d5*CTKbL5?r1ubMrfZ
zN%UXHGq_*%{fk|wIDKWU1@nv569mH*gJavJS7V|bz+$FtV!tGXgr)a*7s>9JkG1#l
z5BqF%9vfOuHzBk=r$ljRT_*=Rwg1L_<mi6((xzK^zSYKZENfrceM!rS+QI$;_mi7k
z&x@4Xz#$PA-gDYylHv1ibUo$oS|s)Nh*)$jzgULkAzkFnDa;94YX~J5eF+^hOE|#5
z>c0%1E>0#Ka9Dw26dmj_1#ZdO_*ZLCWv4;jk@a2nVFxiD|K@(#Gx$ydVRULrR;_p`
znhCf*kf&-sT^{YJk9S}1?0AfoK#*5VhNalqhn{khTJSpObL8rSa~lfz-5zbM5?bJ>
zH0;Zk#)dB70Qu7lh_*FA-|w{qS;?bHEVp62zlAD`Xf<_wehRX<n);jAKKkj_ta_aU
zajO1@17zF#KtPPHijITGA7WY?=LWZZ7j0%`Zckl_s4@_K*&fY};<VE1d$dwoZ7`;<
z0&B3t$^MTKG#$TF2n==&Zs!NF1Lik|7$R^#GGyrQFow$y%`T}bv(9YsY8jf;J>Qn&
zE6{b)BiD`7ffVQ+evTw8SsV$@7_aF`Bzn03(>CW0XycqT*h;AHLljkdQ~{Tq#BcG}
zoi~)JPDSGrhIl!NyxM9vVY(rri7d#%*SwmsqM&Nw9bE29oF}R`<kv<#d2*o{D`g%n
zg683;nEX9hFf?9PVv?1w-F-^CTTT#jUaQ(Zj;&U7#Ztm>Ns<x7y%FiGB@b@ubn|6L
z^zDBnv-l_}7c!=A>*KDLX<ln&qkvz{?iw^4V9^4LT~Vh_@oGyoz@uX3i5dyH<%r$+
zA4P9`Xw0ep6Q0HAjhkrU1s1<U_Ko%Ue|ty+=phs4Q3;^rZi6Eqnhn$f(F?5|cm{oW
zEz9zz0%gP*CAPAfd!Z?lJ==tf=l2@%Oi1}Oca2cyt__bE_G*i!w_m~}2JOlAj(=h8
z?BddUXwCaooI<Rh6&Xq2k>XqkVImv4P<4+g+En+qJ6wqJwXT}2?V^sJgj(fiTmRGm
zHraR?I9c?gfRA8A<%+^MJ2-7gFbs2+nu6AYzegWfm{dLxH68=9$OF+433QBCScnfq
z0p3H2w9l4BF30Gq*y=w%4A7J3&`s=68qgD{dmh|)5{l%<UBeEAt`GnN82+LI!BK9c
zk|@*<E9qv($E7ZYKg&9Dme^xJ7WS@)YF|MX3NUJ_oEgPzTS{4(@88SnO#M==WOcKH
z!Ptg|1us|I2mHqSA!bAr^qA=BbN+`QeZJREGhXw4y?*nYBN$dtJ@W4TDEtc{Ecx;*
zx2wk71-wtv_Y@JD3h<K-4ryf6lozDHpHpBFvL<133L{J(wes5s?3XTJLD&8|SZR+E
ziS3nGeUSacDhV`Je^AzKdwH$bY88y&^R;uLx@rMv-}5I^iwcFb<=rLJexG^3jSCqT
z0Ftk_756VnP-vCFRj|w48~fMxzE(|wEHr`OY_0`KC;%nO#zvnHE$e-k=Z=BEIAh_O
z`Nkuq@j3VtvyXNxX3?h5Z@f33yH?!{TjgN#;x$~D`13+q@M-Z2W-TS`EoBM|?nD9F
zJ9h}#t+YGs+@KEMYI1I4U9!ou3`YHP$PnCQ<3l^!!U*Gx4oyyf;o2oBO3Qi!wocDH
zqnj|<``xDZ(8=XLC_O;2K}2Ctmu7SGzR07`Y!yw1h@+w^@G<q$%32m0@4a<{LqWuh
zS0NI?TI$=Od2?2>76_xaHSdw!%6y)ad)dY?`-B83FaP0bjj{&)2LktA%6ZV2V?zm@
zm5ax{Zlau*T~qVM#!1vcOA)QvI0f<kHO<rUIb5w?G+kr{b2=+1wiw=(SDT$G5|iVQ
zTsNz?Ju^_<VO5>#?CJS|+j{-xO0JzHuXNcZ+XPfS-U&^3Qk$1&g{Y|v*h+U&WT`*+
zq_ZW4T&^-Y`7r6dD3yPh+CBK|_j4ede7tgHZXN3OVfrxJ`GvRl-QV$zjsD!}wHFbH
zt`g%`OX%^sB{x@9086C!GzoU6t}i{)Kp;oti6530X6ic+8}&QYjz99=bq-L2njRX>
zyXjqK_CLNXHY0*KV-_?9>x@B!rPSJI8i4A|ot5m_55}*+U$Tqr-4BCNK-NM96YLth
zmG2Dp*BOp3<yDtxiv>JjQ}{ivSm#bn8YL@xF)lfo!~a5DLNc+*{%%baqj6b}lj&+4
zjs~{%TIB&}-7oclA7uc5!F%f(iB9**haN<7g%osJYg3gh+p;0{DzuFh-n)^_vk$yq
z$X1qV|Lj(wW6}L0;w1ws<$>-;J_SRRqds@zICF@x?dQznkseLh>aqW(_5D+yM-oqN
z<y@`>?7mp^{~?Nk3L38OYjIvn(6!=uq@j&4A|!joz9nXt7k%Zzd9%_dFZV+@&+Bm_
z^R>TtrNKYc&ShC71NJ*%o70>2u)w}xpa8@@qtHLeFNeeL(%Ml<i{;nXeAz5}jR-~Y
z4UA%y)f{{5rwW|_-C)NX`v;?XOCf4_z%`P~mEzdYD$WZQ)|y=f9$f6~?u7yl((C%(
z3nv=!x%j9=zOUuIkD~CNXQqm+H7whBeGw!2g_}n?u1nP5Yf%LlkZYdQ(p?HhiLZZS
zZ`kf$1<)&X@t3*3LX_k|j8^5T=L*ND-z5M0|1Iar^G$LebqiiT2TmUKo6q%34o5n6
z*@=77#}p@KsDt$~rJbk$c8cDv6>C!$Nm#&^X-~4?1kjalMJ$kmc0C^VRTeaI+B3p?
z?&qu5pb+$o+=&98qydS9N$Z81<;ajaJ(w?|ebhsxqMgsh`#p#Bd_oJ9_LTy7&ypuX
znjZ!=I&E;<+jI-#60TFM9dEv1LIp#x1?VMgQ049-1s7djCV+98G|kwl<=(>3a5_60
zq<t`C4ys#KyowkcC?x*5xc81t1H589wK<y2aMbP{a4tK8IzeRqzsr0?w~gF{@)8Rn
z>I+x5CTGGzRp_sjn3yLr{%W^zrM8XX=L(w)_QuHsU^)Z(vJ(xPn$gb@s<$a&22#Un
z#~!Q-t&BS191M08|Nf3(RP@1LO<in!--snW#RV55-o@8*_7hV~#OelliA!IpGNQ%=
z0VI*9FP#V^&>KyLjM77Jkko@x*Vltx#|6c5=VGQyQ)7%6fpuTk%FT3?61Mm@h?p@x
z?yMpD4pq0rJK#pja>U65T$G%)9&(AwzgI?mqL{kLeVi~rMBtNoaiurKIRGNQ>iSM~
zxYA4iuwh|X`qI?am(B5lENFT|tov^#(s)+Nt>^HFVCz*G11#b{){A{thm($OLO<YF
z(LE1Sor7RenblKAkh8>v;BH=9$2^Dc5E(Oqz%kE)63WzfasAd=^1r`~9r8i)V3S|o
zl8(&DO}@U>#l<6_QTcoH7_FsiB_A2=VlRE+*Jxz(%lFQY1_$}|oVcKn*FDrABRQCU
z2neu=fn&Na#~k4LipDa_+CGzTreh@x8P0bp=UmPtE4(#KXB`v#(pdMgLUz(i6WFVU
zdbs=x4ye;3Re*P9Gxnn$O#`BWtBUr-e`fY|Jp6iWEI1O+*6#LUf%tZE<DB3mNb|t|
za@aw7t{^Obv<`FFEjyGuegDKJ$R7V6P}hM~7hTF%?o{o&ab2&>(lcB_ZzzsKZ~Nsn
zEn(JrrjTxwZ@!ow=VnQfk(}Q}KV@CZOHXX<J_>Yc4h!P6t*Z|&YPwsBPHgd9y8d60
z(M5nf$Gd&eA57QEd06M}ddXtr$WFm+es`6)=EkJx4f1EnRhCN-<j;_2i~X8fmBgFI
zedQDX7UEHNb{o-Kt^1n`Ts^WsKN-;LOX%&N+NxoT@*(xdGun&w<&nb0IC~N}1R5FH
zsi`%gcr4s~C1q81>S2PZXjaXGbURD{+y0)$LHBBYF^q_|OdS~@ENi4=8y}LjT?Nt&
zckEtAD9X4De&{~fKPpvA6(*_Pm3{o_*+DlG7|K4m_X5zF$8g3f88D|n=K0|Ig}Z;Q
zgEK(AjEa)KhwkhF<|%(D3bLB2Hbb$cSF7}NZibM|xTwY1iGTAcSzpYUji{~0E~ouK
z@>9NH_s((Qa-;T|Y~UyFFs4u54foMY{^S<c^I^f!mYp|h&xMWqHj<I&E2PY9GB${O
zO8Ak|59VhWxrg#Hjd^~{M>)cpwCI`XV(jm#qQbX}{;b=E2DduK>;H0Ew#k~FmMJXK
zY6Aj^IS|DE8_xr{B|uLbV9gI}P*o}5?&ZJUX&!BKH6SjN#+^sG-Z-|PouP5(_c}}$
zlk9yo#C*d{)5&V+hJw@RQt+5+h#a0ycc7&Sk>C02%gx=p=+0L`;5(EQ;EwBdxq%7t
z%bjX&_c=MWm1IIbsTZ?6TIid>S6SJuFFndva}<U^1x?iPU~=WY+MuO8xRrEC&7%R^
z$E1tSQ4+Zl1Td*;NZe7;G0`hB*311KRsB1v@o<W29tkwVOmuQ~+N2csO-;w3AcgL-
z4-)}|w{`tfYqi`fkNMXIDPep68D&KaF`Ce(B?dv27~>HZ7Gx)O>(siTSls}T_q_%#
z;aYTs-Jk_tjbMgS!n{mOeP(5AL&<8Ljt4~Hqe?+^yT8Zg`c#Q4gJ3Qgkym?$RK>@!
z+*jYckvcyG+87_-D+QR2ML_NHHyZPW`ygUD?_H~tg}Rvk2$w7OR5YO?mz4nHlX)3R
z#A_WdME%v&$X<j5S8%Zje(WT>mLDQYfJCdQsBuQ37Ta{RPaA5^7wxuOiz=`AW(axG
zb6woR|7W~tj{dmFcE49HgJ0bFxLdlU9ikFp-`+I$ex2h+>X2`eR9f}h-hPt9=y29<
z&FJ{5>vCc3xn#qsp`X~exRS~s5JGqN_}9Bm;e)MOJONj>w-J=mfB#sVc_h^Tw@30X
z^slti8PieVWnaqrXWo-XhkNusYkL*9d>5JE3j-|~Q3KJ8>PD|28lNOS0U;Gey2Q+7
zL-sV&H0#v3G}^Crr8mU++a9K@Tz{A0em05=@dwUV5(NuzP!Eoh=PSVwb@eXuiV8)R
zwu$@0c?*2-`k&UU4a$uZEz^L2zgyMix!S&a8AQL>k#>McqeF-Q9$>A*X@l>gXLw&;
z2x#27C$?qW&|cJb>Mf0)%?ZmSk74U|n=?q={xbpXe?_uNTS~|=Vp2Rk(c%*U(BC9c
z%5S|ic*lG3Ya{`^ZX%AQ4yfy`eDzeY8e73~5_)(<l6B;=dHnu;|0dI(#6uW|;n{Fi
zEf*L+>ucDTN8?+M=DCIDMjZyoY_MabWIij7M6)$)GxjS2%zZN1t;M}Pn-;GC)!?hf
z_e8KffC{7KyDq-uwT1sU5tZ5twg9->ZXpYW+0dISl~p)RjgsRS=2p6e;D5ZZcv~jR
zcZs=9%Xzu?diW1Xx4N=NAMf_@jDab5t(kA$SrB|mtnM>9x{)82_#`F;j(N*ggF9Wf
zG)<FKvgX*q2+YD^t7SCW-aGuGNhBeKo02bv2bdw(<ii=Mo>Zsm+(#}wv5p6u36ZpC
z5=!YUSgkObny-MK>5X&|)<{Skq@#+pMZHL1+y{7JdErwez}KXx-}*;n?YVr$|3Prj
zfwhWXq3C!+O<1ivt%i!+;PcGyG$`GK8bdL|eBEQheOfV5bRG*ezue?Vu}6c+C!=RT
zik+G6fV(nD-HKa7`}n-0bd~$A`@<rToyzL;q<}r)p!><U6+=B^dAhglg%;bpdzvaf
zDldKt7phoFgQ;1=GmyF%j501{Qj#z(*}wNZq1C_*q2-YJ8yGSn5VJjIr2UFMCwST}
zjM{6rt+mnDlCNjdMz|O=eK3^?+|M^vqh_<E*E7HEEK~C%!4iaCA)a5FD1Krykwn?W
z9MH)QpL(yM&@Hg>QeIxHve-XLKc*t(c~?4spd-bd74?w>@9&MT7qKMU_iY9uA25r|
z)NB#J6G1*b)P?DCpb&xijTr{$?tlB!(y<6=18Q$W35Rn7CBI}8Qu&}8AB>&rT_{f6
zQhGR6bOVmgTwkZ7RHVt@AgY_NN^DF0T?p<oo5Fj5EQA2EsJ!+lI!qQGpW+85+G${3
z`Adhb^M;fPvgLhPJ<)fj@`rh!=t5`O%-F&L8M!{Ss7}o7wKs~D<=^0mbm^p2U}I0M
z5|D$mBHx874%x93-lqJ3nAesn*>qC|#NvC!$=e@Nz+$5U%$t&pbW@qjsJ)f@tgrC>
zQ$zUBWp^hB%SO@W%w2%gc|ZSu>90V8|B{)n1~FK*iS1(KxP2Oto)XVP#P{ZOZ--Z6
zr48ojZ{lJa{QP8o#3wEcs{!gSGp$`+pEAF)DYz{DI$Z!!H8Smb1RXA+!fpA@?&ddk
zbhh6zdyNWaO`!)*QetH_A-}Gf%x2=gw-fB;jz8oZ<o}oGf=vi~lLA5x`mj#<c<o#B
zYA&z^8b;m`mY9zqc63O4)*kn{(zTi~*X`lDbV#p-8~m)zuO_bNmh}^gcn@cI*8A6v
z((U@a=O!*6)DBk6I9{Jff70cL^V8^8vNpDI{|!I=pUs&?*O7}r*dv?pJ$jxjRT(3s
zA0Xto-$dbDf|=x{{L8*6YxZOn=-?!)7*a{!DHh9uD8sZfySFOc!(nh~A=K3OQ0R=_
zMpmB(5@tSN$XcFY#j9D;YG+xFc2e4JT~k?uq8-7jib@#XeF<Mo9&LT3Fz*iB^VzwN
zK$2~EL`t{_y3QHS;I8=O!FY!GTs}8~ngheea~2oY#gBeuB<Lv9c0o&~Pn&yqIJFEm
zo^E70ps96hwG>p0QfpjuZ-3;}3euLdKyJp+MVEcTL7-B7`@ZF|A_ew_hJiIQ^mik-
z>8T1xS|VIvA;U$|wIgzIiAE0YA}gT$zA9B6y#`Fa7$tEtKC~Oj3gjT|>A4oBWA=((
z3<F3}88DyqUu!d<k_?B7kdWrrL-szkUZ<Tl{DUFcZ_5w<DEj<sF>n42Tpa%{kao3Y
z!-#5?itoP|NXiy{e#I0W%2q5C#v%>&XWYsGv`&s?`akS_WmJ`Iw=N(dC?(w}U4pcP
zfOJbP8l^+J8$?=ATDn`hQ&74aq@}x&hI23LeZRfO-sAi@KhGFz2)Lg0th?ql>zeZ!
zs?_bADcDp+$SBdMUUo-I+F}46<ACq$P>`sQe3$|y67LL#6qgbAMP<ZqX3KKvyw`EN
zvD7Oa?K*A|PZ=q?yb^;i8@v}^wq`j!GV*@L<XaX<$;FrL_Aj<DRH~fW+LdhpJ20&~
z_(2b6FYEE~kD*bAHAPLgvrEydy;G2HGe?+2^<-zLX}qZ`7bzh)cQXLNhZdyX48Kzy
zi}90>JM$(-9vfR$F=APbAet~(ed{u==s#{s4CIOfP?62~4$qEEzw6&d6}Ueyid-X;
z;nH=Rd)sJhb$M}NIxmbj*i+od3~8ps6M<l{kj|hEjrm6Etv@Js>=(dNQc%D=K!0$T
z@)6kkAnq-+Py%pU2>=hc+UimkW;&w8s3YcdH1!`2?M^;(?|*TwbDPR7{Cb`cDfyhX
zi2gmXUxzv10_L9Rx!6BgOC(c-x+Rtcj{0DDGrfRUxw`DX-kol$v}HzUO-o;PLMv`p
zQjtuNPP4^lub|Eu64Az*Eb+@h{}Vw1@cc_H_}SW@*eh8mS*#Zt>qJIIn!2vA)5VRj
zB_$7r!#?aTl^_mfuhgSAg#Tm}Q~s&?k(9>=0th)1c~b%YhpswKbdiZl+D9N15E@A1
zJQ%j#jbnf6s3fbuEkG7>6q1`!&xX(O%{59Nq%FdL76-7eh9%z%Y)<Och5#atkW3Xj
z$IQ7oz)H#bQCQu7zwWlb$26pmGosrndSma_IW+9LuWc%VVPc?X=&0<N)%5o3KxR&g
zhc=X56F}C$dwo*G(7vPOVh4C}Lsuh@Rp=h{YO1J9Nq=?^S5#VQx^q&#?h5ignBtA0
zVs*bAjrU^EN<XxMe6VaAfL_B0arvlaoaoN2?RE0)RoKV9&F#(XMsyx+-owgL5LXZ*
zoSOp%@6Ne;g^7aNkV6Pl708$G<O%PkO8`<5_V;$TF%a`M0x|DuQAlzdW+}D-$bubE
z)l8vM*0KpQL&RJ;aqv_(aDKd?GnyK#;G^fyXG~y%FE$vdYoxBT6`$rIY*nP#$@cg$
z3>&jYFJ(;c00ngrkQz^%!O*S+VJ}!ON9&4ZHOeqJ9YsEstIHAj!bfmbASV5vd>JRD
z)~i3g004L9k6mcci`mzi(e7wa{q%vNgF233wsAM^!Rscff|%iwv&-I%)^N+Gi-j^~
zuPrjG`X@mr{=HX1mOdB=<_2}O|7Dwt*1MxC9I6!b3+xJL)lYZ?Xx?`Rcblm9*#;J=
zmhjnwa~VKQ5mpa3#1TdV(KqQxw8y-5_+Cy()e&4`?{Z;<h9?j(G)jk~kAz)ybGoBg
zcXp_`(UqgCK+EyeT;bKT(igaQGi9IQ8x7boH;B5Cxr=?I7_Zm4UE{Bqtx8ZgPW+IO
zR_f>3H2bPTFZ$v%1uw<v!L`m+CpF+FHE3Opo_LB9D~xotu5E#YK^aasm!cOS#HO=3
z%BTR2IcXXJ(e`tW%8Qn_j^A8}>UIY3hL7{cg)EY<*AkAW?QTSRRCBd`!$PgEpu7>j
zhAXu6f>`5#yI^<MkQ(iN(ULku!P>55W2P5?%9muxCYNz+;aa-kZ;>(aav&?$`ry&(
z1LMp?9bVN5T1z>eio_h7*M?Lhf$DKoz{zAB8oPH8tE(TUrm>RAgAO8rZIQ#U8%59U
zqlJIsre-?B={qXO%~jx!JvwRHHovhb(oXDQ6&ex9*2r@PBoPSHYg+6(06g_!zGWf@
z7E!;vU;nU<@TG)h6-rzIoj)ri(^3UHR>`ueTslw8j5)qzGkz;iNyNyWCmJ^fC5T-&
ze=3}Vq9wP;SJ<qlUP{F>f=*i`AxTkH7DNRq>V$Tvfj^9ui{%JXk}#CLn&6v@I91D>
z9gR3uqQmBzLE_%%Ie!DF*9oAZ39CZ{n@v69llG~|G!>O|I-su3?e#=VM1+jnPSc&8
zrXFUK9wyE-vO?ak_NHgR2fVlnvD#RY|C}kF;v7DAyDv~Ry@mqFQ_gkU=}K8!goK1>
z-FB4@o9G$Ks|F)j=-T2SB$#FI26DF*BfA|VpK(2au^;t>iHQThud?j9=ZY}ceZF1Y
z6lYBSvl4zx-d5)0x>Hi#L8W_EcN-n9KshL}B8YF9H(uW4thbJgQ9LAai%N=?3?Qvw
zAaQLjs%Tpk$o|y(Zs8TKDP(LEt7q>j?syLAmJ_$U5g<C}myaqSn{1R@NeEK!eyDzn
zi6Cjoow8tp2IxY>+CNK1T{zX@UcXk)W4zOyglt<2XfQ1jMF$nw9O5i164`PzVa`3_
zR(%n8qLAIK=9juGZ&;WkNkgzP9%$PLWz`7H&^I-htC+D06tmZ4*1diR)MzHK;OuOb
z>{sUe9(@vH80PY7$6JjpzP=9#kREdDtKRGR(r7E`vH*uFkP{|AR5MX_{Vp`<RXGs@
z!ne2rmQ<dB{s?kmCiu*zFRi^}CW@@xx&2)HloekvY8UUW`P<*|f0wuTuq_WqDNxs8
z3S>sS30`5Po5OPp5Zg-GuWX)`hYL_-MBA3x22y$55HACcNZD0?N}5C|lvn(t7pqkC
zr)mrDaG#Y$AAE|(!+cYES3^}p#1El1DmF#>`Vp(KxG`5{wbStC6r#<ZDWz=(_WKxY
zyg{cF0eP3&)l<nYDlWeu{CN3kjQoJQwah*Z4KIV%iTNoL;7`e2elA$|i=Ef5mp5GM
z6h6(o+^dnvx_ho|ZwPyVXZK!}uv}$zEv3P4wQqKuKH&#QU)iqPi%f)vV*<K_@SBJR
zEr#)0lzWG?6cmEQrr$OODD}5MB8I&Iy0_Cupsr~8$ak*xR}ITjx(fLG$lakafpms}
z^^(BliK#ik>pMSER-<`^+ieXER~3ckCh?B+#jhIMo*VlH>TMn?E+DuVMkN`N`gIh5
zPZ?S1;#F3RiFxRivmMduS}!K>U*BmIYEjJ^Iu^u@##WKW^8uwjD9}79&>FiBy&Nl@
zI2D}a6C46?Y^~uZzFeW8h-$2+gOr5I`F2gvO`-P-ItFOrP$#i4RPgV*Jy+sc#D}yD
zf9u^Oz%o0!(F{ZE(pLpB4;7Qpf$6z1IS{IU#M)5KRnk$-dafPp9GG2J@rHGTjfU*_
zJlRCVVI{Ddu`MsNN-lXidtpA1ent84a8Jj@Mt%Rtzh}c;2N<#xXiz&YGM%A%e0pB|
zq|ae7?fF_d1x-jaD7cWOM!o@w4j%x88ExuVB53MhVE;1f2FgHA@OZ=mExq`rx^?1C
z!^V`|M$~x#?R%fkr!!^&6zde2+NxYCQL%&Hk@n==cB@D%>JD66BbaHzurGHOSB{~j
zok^$sLU-=?YRHx}T#nHUe2`*?Sa$BEGrWH_Qizs$>v>LMH6_<zaJ_i@OunmYNK**7
zM>FhD&+}-@%2UGblt-Zm6MY4E8EIW5>nI|SdxDS2fI>fnPj!(8<=C5DrU&9VAQ0Av
zB?9pZDoRr~#4K$re?mQ^{j^M1N6tpXlx>vxb5q&!)M!Jnzj$JOT6lsI_OelXYY)Kb
zIK$1Ds=8dp_x)?io|ZvsZw%bobEf>Mx_3bNRnF+BH^HjSC6w0q>H@@}=;AAp8bEM`
z2V}csEf!(#)~Dz)CLS4k$T_~s-K;FWNZ(4VR0tVY^$)cH5!JA-K3t@aKzg^aYY?-e
z1{4+-u6_DNd?&@Qi8r^<XL2}k)N~sE;JY$Nw{nQ?L=fyhOH4|dE%s2v(b37DfA?5U
zr>I^=<e`kLtV5ld{3utM(OWY@Ge63SEj2IuwFdb>*GgH3#fNfhMdmIqjLMSx*KnW-
zZFuO>%n^lHhLgdWm{`~^A3dS?Ah$w=gDoMOz>ZHcq{1<Llqps!3~dKsVNaVY2%>>-
zpWwSMez>I!_PZrwj0O4+wYm)6)DM1fD;~eG{6GbX(N5BE35yjrjw>tB+!2yy6Z=DU
z?L|x2eGhVa%udgq=cG7PZs4n+Y1!Ubt*6^%Fh~N;n1Bg<CUXJT8^7af@#IMJ&hJ`2
zg7GmW;DCM)3e<A|_4RireDVSH2L@B6l?0gEHe6YyL>M3xF%Al6=|KFZ2$O4+r%t2Q
z@9F#}2hTW{nB=l@l-9^1(H0_2TjMA%J5W*;n6)W#jCQkcO<vmCCGC|!RUA?@V}-k>
zF};=dc|MNW>nu?(=rQDqGN_Xp3#+;<MUtLQJTc?k#kS`ZDledrH9j&{WMXKpDDByS
zTlZ%H#-@CC*xqz*ameZbW6a=JD(xYaH7%40Prg0hb;5!2t-Vqqdk3o<`_?DBg(J_6
zKHVh;OK+;ZF_dqF%SNO@2ynZZzF_>|xWYToKut=W-~g}9;SolR_ErK>Zb6Ru;={sI
z)93FJ6gadCw)Z<(#yEnu=-VW^j6!X&C(6<l7oW+>@T5RMlvDBkEeN_eKW=Xv0(s>V
z^q|}#l39|)93>Iw==X=XSN#+W0f%L6Cn|3To{<c3#4n+S5*7cUxFkVo2I|QN%F}ny
zuYJRK&rhZ1Ph4JIeV#F5b3NFYrsdauEa<16GQf9AcyUyS9!KJ6aXaAkL*I2R8mTo{
zEppFB&4Hd&WTNVaTzuWG)`7Nt%9u3;sj;VYle15@a>BfLh?>u`5WwD4(4qvW`eO#n
zu@lfTfO_JiaBa3+-d(ZKXMn90ZT?C9iZD7BhapzjXA(r{2;ElcnV#FLr1>=jJqM~V
zz1JSQ9U0j8fd6tET$DyYipf=`_L}f|0~w_xO`oUOr{aEhZ!eB+_gcJ^JkQBR*8N*K
zdwULZ@g7-eX*_A$)fYx$a;*{>pyFECj+14Q=Iy5HqQn;-Iu5E(R(SLn#n7HK`A;FD
zjjQ8hSWe>Z17BVne(Nn++-`jXR`~()t&X@H{PaE}&F<JM-cq!J(<>{u+afenba;Ud
ze^C+U8v=DU#%Ci+zMp*=g|jG+_6#`>jGI)3&ozCl4ppNEO7nTXzZbTbJyU8fhk<gS
zIRMh1f(-Ua;zO{1V#Ej)nj&#466KCrkgyL?Un3x@MKz?sUM&uf6m%{cBt?1*vw7%b
zMH*M`)_jY5ib?e}uI>`?qRqjA*8$}`CPO)&@`kUguOFvOr|3*`NK0<;yx|QfIL3m;
z?AoNRmIL5iFI<CGAYn1YSD4dLB0{i<Ub<&A{1~ZP2j6JQw~NBoH56aS5Rc)|{Qxl4
zp6v3d>h2H+rm?nXFW2l345qVLjza{k{@NQ?Hs1#(uUgK=X6)<QygF<%JN@2YE9E#V
zcgtYu&3>LcBLeVmGDZd(x1e90DLqcRBz4ya5y~ATt+x~(;Ja8GoX%~88ph^;^@|&?
zIc2&<@;<dqTD6<QgbgC(`M44AD38za=7%vml5(_&L?DI+MK}P}30?F2L0R0Z=h^U}
zoSdVDdZz39b9;vf>dnJ@uwjcG(*1Vu{b}D@7FhQg`E8W(!eDrxQ6YTxUNiCZ8MW6F
zV#Daf)*X}&8)a?M(reJKja+#}A-&XjzAE~H5DOFIoI|@rA5^5h?l9L=FY-!-%)sCY
zEJj=H%kUMe@fpTNKYhpAg~{dBYZcbc!0_%K{9=%xlRR&w13N8hkN^_Y$%~e31!)W{
zoAK)>z|Fk*NOSxEK9RaP{GPh2p`@*|nwEIkXxl`jo}1p{%C?fCV(a|XMys^_5rcTj
zN`UqQem`#39-o#L^3NRpDr(QSKkDY!B+JMTq!K@@5sQ#=h_kIw4`b)0-b4-F;=b{G
zX|IC6E1i$=T77gWw=g5!BF55=7731=T<B%jX4WeK2n7xkGkrz_@#U8nnVi;)d;mee
z*S;(+2m8y@!$xXef1E$Pfxg(Wl~<PjcFt`_2n5xJOTno|9RZOVS$ToWI(>&t)u`A6
zk|<}cDZ$(CH_n*acpirc7L{Ky>u7yf)IchoV+!ipzN!Zn#o_EJ!`p3F%F2qW9*+FD
zkPK0~QIjyz>-{BWz^qzckJW<~#Vh^y%6LM&kw77C32!Td(7>$qwj}Yz1oiJRVNNBr
z+@H*3U*NA^Mm98XSuXfze;g<XPu=hS!d&yV26Pr#41f{0x7-6Y3K#->3V=_QC-VrD
zVaErS@4kNmNPQiAX|d!O(r{P%l((}27tJX($;;OM62tIs&{M)bA$Pav)EF%W;MS7S
zEl%Mg!wZsE!8hqvQl7cw51Xl&8om&L(D^p>L)(7b7ax5P2RsDOjKMytdG=I56wp9P
z92_0o9w3X`YCF%9nSyRB4h>$wvZ)w&_&E!-?HM?zGh|r4TO|LuA-M`X*74h;S4V9j
z>)pQ7fbzRBpW=n(n5fE|qZ~UD!K{NZA>O5`Zb23RtjIy+p=eELkC!1(3MQ@VdEKb>
zHMlky<!GbWNn5D?#%%hfr1ntdt8bdhT2aN5JZ1IJBq-77$~55r44^#40#5BjYn*w9
zIH2g-WaeVP19}YfMGlK>?^qd_Wt9*umQ3229+7UA#TxVxgs{Af_-nKZ)v`G$D833L
zRShYDTB(IJ+PmH`zh5Hc`?JAqm|^|`?3L~)hJot?fBXdp&F!tNqn#5%5y-5%e1mO|
z>gZr8jkbtY<7JRBVoE}!EM5|Cirj7AcfGOZ^+Lyq>1p{jEqnf1&(o!D^mmhfCnK`s
zIXR?FK0qauXyUX*uDf>dzaQzkS2U<+J5)<EOtp3^R`AK}A<!hPi4U}ED*=m$=km+e
z#yBrow7C}R#E;K2i8romIG{64Rn^;~^{KiG{zck8i8<iWj7{5tsPunz2W*~%;=})*
z8YQDoQ8MR2+fIp^6sIiTY%;xPYr(znNYFASFQ;1Al(ek;Fpu17`yNf!7vw1DVo@hp
z#UG;6#Ay5W@P%Y0FL8igT@!I_HGh`*3G#h3R7Fi=-mIX{^NMYiDjH@Q`+K!&;vB0c
z-GC{rl>AnGjLjD_E&5)%w*@e=EhyfpBUo5iv{XHxF!OYk0KC3lxyTxmK*(<WMwOp^
z7f!XJcuxJ0HafpGq;56%HlsT@;$!Lcv4HMK-o2tsbb%YI(P;yl(@`w+ENNyQzcSV&
zmj%jX5L>>@F5-;^{(IEw8wm3GO^DYpJ5uYbIDn<yFCN({+M`yU0q1=LMBBwUDnrw>
zHHtwa1Z~&vbjMyfWH?%e?P@__L1*{V&ce86)o`l#K^by^IL&H+rI7u}kE>LtUmcoG
zYfJzKMoWeQ5f%<)PrwUVIyKJ_=LG#&j!>Yd=;1-M)i5H$B$>{+hhjvz^fM0j;#8rV
zuTl?J)?yUp9DSY#wf2JJDsW_ptsUC9nvmmJ=VP|*mT3XFEb9ySe@>$J{9TZm8qU8M
zi>ymxEJ{)fCc=3+BBp!Z=-kOd+Y_|KK%?Yj#Wlu0POs9%+6fqwQQhR_c2LmkV4dRd
z6M^XSrkPg`794zx1w1=fQ_icA*xh6u*X0Ae^)R>OR8Z8X(#z9-xHhh7N%*e)yvKqw
zM7_S<U+qWZn$PEv^Vq96ptV8+h^Oc5s(1Wa-KY!M+~V~eY()<!>kgge_^uV}Kup3}
ziKj22o{9f<nQ8cZ#|Q|fI13>FNj`RV8Rn+L$FsMC0)cH4K0ZRVXhB+A#axkLPi@I~
z4hQ-3K2^}ZehNC9Xe^;lOKw+)g7s!{S75$B#IYGT<c$vUQYYUtU9x%rkg{T}BmG?&
zG@sRRLh$U^_q`ty6CcG?_GW*%vQ0ATh$bK<NWbtmtPs1(i2#KhZ#-VmMFzS&th+EC
z?-Q9AynBVuK|6YC4H}nxRcLtz*pt6rpC7Cft>;8LFhtj<L`7l0gV9t_6e57V#7rU7
zB=QY6RN;xh>`Vo52IXM#VqfSA-(~Ao@x#&%mGw86fUfZLG+-Mh!`@ck9vJHmX#>Zv
zxbfg2llHUo7PNYb#3zNpj&b#<J7pu|6-z%fUs#55#ayng4C#8AV_q+%SPer1hT!=*
zRsP+WV(0<}=sZ^ov%YVV3cF=cIuh2q*X9PQd3y~izB>v0rXPJFd-nyD8`-|lf9P5E
z@dldsyKT~zVt`DHm>rbcI%vO8D`sR)%Ug8%;FTRRkT|<`9RaeE`aS)(JK<~V>*shH
zt87M{y)rpP7wDn&B|EQxaPsp#O*j7^wAOEY6#VkQWXmLVm$We#-d(t=>~&S(ZoEN=
zuBIEm!>J?fM2m&p^25wduts95OIaDJ=>?_5X+$|`kfkS|Ujs$eBa@c$OKQNstnmK+
z0VW%phOFveSATWb(WgO0LmfVx!f91lS5_3VgpI~+x0E!AZlZb)rh5}-$S^d<{h&$p
zXc!8^OWQA}ANzo`%Ej3Tv&m40?x1*zr=+gOHGgH5!wX{wdg!}%A5~LQVuh*N{D2CP
zZ)-zn+3E8vd$v<{#96VMxRJfmVC#MBVYm_D2Z>oHB-F@FvpEjvu(~>p{aoJL*OeZ}
zmcK!h@JT+wq7K&L2gt?)DyYe2y>juspnxE`!rd90fhGIHHw;n!J*+z*ZmUf1+q;Vi
z6e+1&TnrR?o+pby&A1_>nU(`!#$izB!~H&X7=cfH`ipQk*UiQ)t64t3DPy&(?6G54
z52G)LA08gg`!xB@uu=JPAr?@#uUVBuKpBFKvilJ`_Rd(%{1!NIjn9PF$^J?Oy$|SY
zq{>vr=|#>YI6|Lo*2By=G0HyvLSA=oipP*EUy6Z_cZ4YX$l#J#{+t{L1*ZxSid+E1
zmeN2ZgxTIqm^@hU3gO|Y&ns+<oNAMIk|!&jA;i`UL1}fuqZ@iXH&%y)6p&k*7Y#Np
zk6eI@wsr~?ZDG@Uko&H8vj*Is)<)*@J+EJbfXH!I{rheMQBriMW#J<kIEWBfgt@Tr
z;tPmg#Fr>pc`bk}8k-2}-xINmxxTZN9#f^UgGNb3b?>`<{#iOts&WURhA=-r$>{hH
zZFin1(W3vMZEzc2`;T-II)}-QIH-Uhg5t!byN$RUos-o;U~Om~w7C5v;8<!8)AN3y
zqnV&n{0jR=_1IBP)MdMF60Ive?!jCGEVNVu8;gMDpZo*s2~!nudyXos2yNlwcKsoc
zMuC=8lKrwRbda?Ua_ZL?dv4R&8$g%B2p!i|$1DKBq`>mrEsZq=n)5!@vLrhYDJ+Y2
z5@JxFi}Wg;{?BlHK4L9M+^a;DZXMQG?Fm+Q2+qJVFj`iWQ-!t3R5_~fM{FgN=Wk2`
zb%}H_tVEmxgx~L0Llk%-BO;f$P(<E-XCV7sMI{$ll-BP?W%eRh;JXfJSDEp~<L^>>
zQV$LfN%dJ=Fc|GmJ}omBvV68;v?dlMAJBH943P)VQVQ8B@I0X{df5Lfs!Hq{0>K09
zLI>D7qew?lh<^FQZyd*Fe7K=NGYzE%^MKL;p!d@y7qX{G)5ojifEmqt#%7^GC0kgO
zDoD;0-zS%U`Bv#x@bu<nFY<@@)RWuEJL^?M%<rNQI`~8Yx`X_R3<Ly`eBNjy%R}qp
zQ{XOuo48pnEcs_~V68ArEQ;@S=g1xVQ;kL~D@(~?3Oss*aj(MtPE3}ncBzBj=bvVZ
zJb(94tLuXme&8ziRzw2X82t@2T%fB+og|rs?_ZP77e-uFTeW<qG#_{)v?^MfS-}vw
z24YrSUDObWr^%4z;#M^vm-$*u7T#Mq0eWZ57;h^=F1V<@>8MhpqIiP5jxb1{=;!t~
zqr*E+Ey24U?YwVyh`#kK{6u>$1ZtTXTI5nxMMu;Eaado=IgZz`I?i8h;{^;F-=3!^
za!hDD;9mcTqJZjXH-L_H9Xi>DfkmuQA83Zan#)!YI9WGfXp_7R%KvR!!N6-hWMP>U
z5A9>nHr31-I(%S5!O4-T#Qv}c=*58wacO&w2MY-~X(q+(*OmZV9ejDF;QvAkr%!yl
z1}LHnb7Tt}9Z=9`2<{=tyBEC<q7L~3kH@JpsOtRNG3!)A{EtyUH!p(XUkAtYVab|L
z&X9nvt9WgFo9KB(N73|9W3_g^mZP4}R2_9Z=($KpOdRh_yLkCKZq2DjN_-3zo4L3U
zYkp9C9ES3PiU<4+>QE=~LCThB{{{BXr32@unGJr5m$0oY)*^Z1y}CF?-`Kl%=OEp`
z`nti962u8?dP@Td4PIL<azd##`=oz9M^1Y8KIpi57>~pLNVR(37W7AicDJNs;;54T
z>>3xO>EXM+iR*IWn88#>=!X4EZg~I>IOL|?{|S-a3Gi|}ORRNUO*EBtACgH^vvI7H
zRE_*q&tIgS=V(iv^6e|H7mhOACe4;?%hEG;Ms~lK`PuyShFD}1R%AlL-kMPX`ApG%
zrOV9J6q(ofSBr_9Bd9?zfX(sd&v9!_ZYH$Bs%kQ=RfAL7=~`C%!Tupe2rw`MV`-j8
z083pZIePl3J`>mgqP|?AG|n#|PJk+oaQS!V7kvbQP0dlo>FP@Rvw|gVXX6>Q)EX4D
zv-Rof2=m_lvOBf`X-r+Q6L`bG5?#Q7i`Di((zac(n3_G`(uP2T(?!}hZIHPvP=J;s
zCN@g?a{4!;ta4hk<-diXnyWz!O6Egs2PmfLDfeyi`7@<l417YuR6r1B=Ue3e#_{y2
zUw3ehf|OK#_lFM<D7dGLG&6y|BDD5P>;N)WkHNTdg3|vnv6wMU%*@lr(X5K%6{2({
z+Roc_zC;gt076O1h7<H8FPd{CZE=94b?_u;=m0FU{X0G&W1jRw;7VqvXm!PC#I2ZL
zg6PU5Mv(*r=UZrtj1!N<LB36uz9){keqEX8c6%whC(Zl+TDoW!M89!>xL7a>JslI%
ztiv<UZ4eN??TrU?2nwbq7sB8lW;1)E(3wc2lm5l0;s^Wb+ZrDs5>yBuv>NUEfiMog
z7TFEK6Pb8{E<9mYHp~FhSWg>%9fvbNL0w$|mENgvp8C4Vdg8m8Lk|IiW5mmj``RFq
zEN=Yk^R12)4@q?X3qJlI%hIExpH7=KjEs1gE;p&@=^nFK+(T**2he%C+B!)A&FN1f
z`X~U!Vnb~L73EMggkP`>&JLf{OK0Z~Q#^#A7Ovxj)W~pEK}ZLbGf>sf;eB=l_wX|6
zH%~7JPqZ8**C)XOC@Dwz=Jc<^IFLwfEJ%u<ijR)vbBGtsS0l-2sCie$T9#Nuc=8Q&
z*chX3#>YL4ST`eflyF3CBz*4&{EDBAPoW35Ssp%&=lh#f_f3(Ma#pt7vh=8Ydg;6p
zmiJRrJb9&geuRXYxmlII<Db;^>*KKA^M0^w{0=vLlKN&6SOb8WZ-NSL@(kd{4+84f
zs6cf(Za%U8z3hQ*aE%_?qjTRRzJ3*cLT0XE#sls70D_&p(_z(!Py;}$k+II7HeU=C
zCHmeefHY#9?K^+bP#o^-*RRhVEz-kw`#+*H)6oTi!jL>Q5gS=axgeKIlfihf_2yza
zUEfuP#ySHGCk7o7YyfmopuYa4Mb7-1p{Awgo^$3FdT7`F;^+F$7t5v^PW|?A+nq}f
zq1H1y!8!^cO<{v6D1Q7v2PI8?&wcsVKoe}hP%Afj>v~z&CQk#rMeajoJ4#N*DkEc@
z7p~-Nik!qs<NzCBV|vs<F&H7HUpj)HPH2Y#SY%*D{yl&`&W{EKxCN7*JMMt~r!8qM
zxo9An9DQhaNXJZr{>EHca=I8$89e+;^IJfMHylB?z^@3Zz`9=kR$%h*xL3P`bsJRy
zeDf>wiPjjiwzKESdo(=U(7;cZObHU$h-rXou5O-uv%G;t$;qVlXn&BnSqP5ex$6#=
zg3cw9tEq_z`PtV?dn|$Pz2Tam*Ju>Ar<$cKW{>Hkr_$t49X>`x=#xcHd{dwlvk(>*
zUOeqiv1{X!|0;?a%x(wx;6p9YV&R`JA7`3DfkAog#@WS-{1n8uFy;_<S)2()f{o{9
z_cD=m*+vfbQ+4|v+8~}~6(G;cdvXuG4=NrTukaGQ)3+y9dFjV?8ftc(OZ;=7<WG?8
z9Zm<^HMiw^AmgsM%`pj9GEhn+0-R~`4h4^q9FT{nM8vQFXsE$P%_ZXL9)qMNb2f6)
zKT7n0&v#7RBSaJM2vhu>Xo}{ttL|d+@lVKA@rhB4B0UBuO~E?`rCLT(w)r0x;abZW
z6z!2q)~5spac0F{@ZQD0i=Tl=;3z)@dXga{JN^wZQL?}`d7>Z}f2GKnP^MUP5ZNYc
z?AO3*$d<bKJ{7F1<g9rGKMdEJ&JZDhY#+SEk!((h5l9V-t1aFt&kh=;nhcB1LdEvO
zBzzO7@pYWp;m$8KKO_!3EYrJK-wDX8%kQ=G5DxfLC<d;bgBI5E+I_E226#0al?H9J
z@cZ@Q1=wopQF}MDk~At-;bJUaK*fE8*?{y%dcX!rh(K*wn{j;s5b!NE4#WKgI*C*O
zLmi-0$8e;gG{Auy_|}qM^${x1N;4++!7+jbpCj@9m<zf*$d1N!)cgf2!Dce>wHNxy
zi;b~RJF|NUaJKi#!w&xH9I#xSK(){dBfD&aJDSCkcmI+_XP@RW91i<KtKw8>@bP4q
z*yBvcexz~@L|0<AJcN+8f&XRpo=gf{-kJ=K^d#H+1l)&p?S0C6<p0bYBNhyxeWl{U
z^#x;nc6PR6w**R1rLzY=uKi!L<EO>@=i7UJkLH(}zIwipXRMQju%;tipgPgf&?7Ks
zO;We+bYyz#vD)5X0WytX?ipWkDuE^tc@KuMUK)BC4~B7#t?&KMFc!?gWgh$<Hs4%g
zwA3BJD#VV22>p8%Xu<6B@817b2@J)tFaFPeeU_AZaCSr*1h0Ace~k7VADZutG&jE-
zbp^##GH!dN6iGa{7*o4=0wEf_xs$*8o`$J{<v;#u-p1}zJ*=a?qJx3?*GNpkNcj2r
zkw<Dj%ybv0RTv41*ogvVhW1;T{W`#uv_M{vc@CbC0viqgj=0^gJ3OHpoEs9ob-qD$
zy=;`<*t+$Q*YzronwsLRyo8!tvR)0O76;{IAt|9I^%h=YV=9JICuynG&?pZyx(4nN
z34TxNg?FO_KcnIOUjH*R7`P&+m4V{OPJj1prfS$6;S}c^pLMfLAB#Wu0Zyxr2*~tt
zC>TGhTKZY*1=T1}&Ex?G0)Ee3wV!i1ppK4>NrR3!83Nj%QRYiP9i(ICN;o{SZIyq#
zvJz?uK~6jAAo?T>GPIYzg6MkCtegx>2DH)^35?1C!zf(^0qV^YFCqLRA6`(0zxX^j
zV9q~ej?fY?X#XR=1RdG$7(fy<1`xoj@%O{~P>na2LU9aY*Ds-|izSzZBxuhvl#&lP
ze=rwJf_xQT%|0u$<zsaS;u!LMR8-LW;v+K|wR-IsH~TNU;GgkeNGQX3m|tKytTz!k
zd3_dG3of2OOqkCK|AC&~-C(`iq)<o}{ntJ67Gwt}D-=;>6d8^jLl$~!CAs>yz!I)u
zz5D*pN%S5-h98ckWtv^{mH4oGdUAq!dq%a<S=bKJz(3pU{{=X2!Sn|b-4b%6X_uBW
zAllosS$+^-SbZbAi77B71HC_<!{4tL2?4TU5-!>ZwtEOr1~@bfuu?&=2brY{|Iwf5
z2F%^Fk5KDOCYekG(xlK$M?vBHe7f%K!@A7~;ivyT1I|#^fk62N($E-fHDMRDUj%pp
zz~7<016#$@4yOse?1p?nbI9RfvF#P|KpY#*w&%7zKnuuPT)No5ZV0;u^@+p4lj#r3
z*3BHtN71kXiyYU}82`DaH&E?R8#wMbf1R*SM?b;{of1^;4Y>Fx|Kk)u`&UgKikX8i
z{sHwOEKE()L_=`>NUj@Pj=t=6$gM%oS2CU1U-biU*E$S3AT_ai>SDm}NXRnclG-`^
zHx~YySL+>cU~b|>nZZR{?BB*X0kW>~3CsUQTRmxTj$gZEaDa(j0@#}}{#e2RAbB#c
zqxtVeg3WkPNY;yglXMIkmso(4MFiy<m7xAn6;Pd%3%$m8wGp`OI^`fT{=du;)D;Y{
zyfXh8>v`|<cf-BCnZc5tw6P=bZp5tT6C!ugrGo}HkAhr(A?t5^mHBD04loU=KrA^T
z0KMx!gdHCUl*2neylUr4yPLR=!NI|SULOR>F~K6rwyHasfCME8T#(tn@0bo1X5|vG
ztYPTm6=oPK@4%%Okhs#```7d^n14=>8aP@0MH3(8*1wDJW`gxf3n=@GMhDQ5RU11E
zrHj52onWe(1h=WqL2C?wQl%B%678u7+lQVKw4eR+<<0XyZ+ine`uSVN@YrOGK2`^(
z2sxea-=~Q0=P6QuR|QUyTu*1GwaEWAabTa>s1DLV0o1__(S7Eb2!u?Yv<~f`*&sui
zEnd`5H2@KGS#{|(=pOVRvH%s+pXc^H2z`c_gYxN{rvrmZe-6LTZ^JylPzcma`(Fit
z+nGP=wT)^A8FQ(Z3QYeRyEg@xAkUj8)Y05@bz*D}J}9w(zeOLM{1rU#%NejQfrFJC
znQqRwtV#h^0P4>Cg)N^a0D3yqoNWL(6VDjI!xl==sWxuz*a3m#gXOfXzdJzw0p{m=
zMkE0~nFkO_Kx6zLM6!Ybx{=PUX#rUJ9In84c@*mScVDicg@Dz@pmE=SrN}Pn5k9&5
zXCYuQ0yV+VuGuO9scqfJ^pjQ86cymhJQj-jw~-Wx^z)(+9&iy469omus%=3y<G-8;
z=vp-6gF~Xv*ieHoG!|0+=2<PEKo(51EiC;2PK@*6pu<03DgpEJeqA8$tGn{QZ67Em
zY;^1c#kK-#1g@YW?3ZbW0Ufh`k7gzCs`Fbv2w(!ClYOfmHjEF-S&$j?|EeG;&b$Rn
zEzZ)O`2fV%8N$62-+(e4x`<rh3H&sHp#L@x{9N-NpF|+VU4>$0{}mea!P{Y_`-`C7
zi@6`=Vwn?6)N;W4{WR!Yu+$|y@ej_B!$ReMfHEPdNT*5NEZ{NpNd_-)|MgwuIzO+F
z@yF5@o-pSN9{d`lLyY<B#_)e8xPSmA2uf8}Jpdwtb|MdA0mQZ@xlL1m!cd}z^uHa8
zpXV#^muzlXkBJR&*q4v?03byJ9bB~E(4zmjA6PaF^q+IY75=@2Uq}AmY$5P{TKfGh
z<1cd7T>1Uh^E*(p{#jTU_(h-sfnXRzAb97Jzh(a5b~_0nkyvHC&5Ct*m#s_0Iu<<u
zCZrxwSM9aU8|Jc-&c)qbj6}my?U$tsRUwZbkU5>kE!XFiCmky{<`?Z2Z59>P;;l|-
z?=`yG>Zs%tZ0W9bxhV)@V<3pY{`{dzN1nPx&opx;CkWx{4?d<FN4dLBxJ3}S^aH^@
zbg3({C<HFuo0c3U5c-1!78_&G0Zzs?5lumGf;)+Oqw3FFzpf|*pEfH<RE+b1gR3LF
zOVRbO&wj_j7#y1o@b)g+O(xsWehqHL!CB{)t^%vg|0I<4?!Sk{R{$<cPMWGA`{-R{
zBjCph^Y3>>V2Qwo#}F~If>WWxRenVGdw|d%Sjw=lz`8qt19@Q2Os7%>LBWa1_1z#<
z1pAX#_HOduGynNx{}UJ|=vTGm`4SFlly}4Y`&|r#*DnMGAw(ik^l#|NQ_WulW&T|X
zauk^t2=KtaY`wR>xqBWy*CqzORzIVjMgwPX3~Pke_wO2mTQ--2ae_95p_e|$>x8FD
zw0Hjft{`@a5cseKhC=?`d@yk#s)&Cty3o&s!(vV?s9zIz#Ulb=8ydQsY@#9vk(bH1
z|NNib6oDN8<18@F;oL={22U}RPrLuGy@rkh5q!8(NF?u3E|@rCw8XD{{keM0@G4-k
zPVx=^e}n%22K}c5kv|rin3SL@Gy^A5r6BP2zcGOvrA87eaO_0Gv4Y@qp(+c{{pb5K
z%HY3~a@ojcZSJiTYBy$a{3FbPWZ*rAQ!V8GU5NHS!u7;5=Oi~d&gQa?9GM(0ch%WT
zVjwhp0^*{RJbOl(;9YdU?=}1j+-C9xAy#;yVWFX0Iz}3ZS(G{Nq$5%75Mr1#+j+u@
z&WKhf4E5PvhAE{aBvRjY1vO1%z7?r$VvSX>6@`_CVwfZ~9d;TJ5i#1-?Z^KJN%Aid
zDg2*A1PL3Tcr(MNMF+_Yt*|>Y6C3ohsH{+e$TKi45pg+oP&Q$*yC}ZdTOFW8+}?lo
z<VjG(gABJw)P?y$YXQ{v_lNQ4KYdZVUP|I~5xsrzAmVIQmyn7kYdBL93lDL7*EFNl
zFvC9pPOvNS)1$9fCI<FL2Ruf$4RVWe%gfj!lsC*Qb*>uDbFm22h3+ZMTy*7Z_f###
zk5Iz~cIT?1J2Dlf)#J{iIy+4F)#MyPj~v=S2>+<|W2$s4yh3vi6r)zYh3=ICjG8|(
z9=}}uVWeTHN-pJc{>|koiTCW(-zN=rb9bw>5pss>zc-3pgSfCq=8Qld6Q4-v!1CJK
z`NIVgl1bDn4)*~B_`p3~<l8OCBQJCrS;?%5D0W>k3p@%r`c@n7r4~jMI~2Wq1t(pu
zQ=7q0AyKi>Jrnj_OWiMT+%7`jAI<b8e)LJb_Pw6rI+{n1zydD%^i-vXg;JqhM%fp|
z8w+x~MC!69IzHh;n4W4S0j@|FCI$v?W0)YiTw(Je?kOY$c^gsvEH-9|&8_&xpSx<&
zQmbj156y34&~B2t(!(^gGb&N<^7-CU>Opl)>6lk~#pBd1kvLO=oPTuMTPPf-(c{h@
zf};SjGG%%O)mqP1yP_Mh2gjmE9wpiO!0jZV7QtwjvmVm&7O><#g1IG($Af1wHin&1
zmXnlROL!g^6|*^m%GF%xajnhHJvzWuUO1b(sCfvQF$t;PN2Xyr;|Yf&9OFU|!0nbc
zVy$5zeH0oa=iO-&7KiY15b)Nt!;_oP;3&<p5nOQGWwMD3c_W$<6+Zq5LwqK7DYJ$2
z_TJ!_*(g`vDJ(H~=9HB2q0#GArV_G49qhnt=pk0JFlE4o%BE=H867VltBf>ZOkMg{
zw)`_#ynE<Yup*n=8}H0gV58yg_jGrb!7urbJna=Vmd87JQh^8&D}a5$6#MY|C*->b
z<1FM)@!=m8(mu|yPp(&kU$wEhelY8#Wucp`qI~rARnSs|O<#S@D`bJ=T+bS;4g(d*
zl^T!q(kIO@mfF&d8y_PcVC6+zW|KrJ+-}x3HTm4wd@D_?wjr_kh8TtfGsy4J2v7cO
zxS4omZGVr2;M<dW9W+kFcLZy1hVG=^T<1XKj`;5{%%h#)pl3h+q>a64sld#P;XFzO
z;iOG1P{ft2P={(#T;+VMKPC=PinLIrn5~HT2t@`TibX6+7Po>3_LaIyc|$}f>{X11
zwf^m{?B}(HG31KPsi3XVldZ>E%15?RlLWLiOHpHT07_mMJ4wHAW>NECxKQo(Ao9v!
zpY%M47vSR)WZJ0|s@K(G@ms(r-tj(CwcC2&k0U0NASd0Iel?@09ryB*rc6mu@;mk%
zvnz{<n=ys&LHn*Ez6iDO)>GWnlV(_Rfq;cvRUKA}lE4N$1nRe7)8qn8!+L~JprJtA
ziV^FC*JkEu8vPq^*5!#B{(I~#Ur}c88)EjQU|N}a8B&QIM=BU#tSX(H&K9)YPw#Op
z_-iV@*tT;)tqyaZLf2r*)iy!V(&H0#@r&vS%PS3RucA&_%2uC-L4~c$2fk0jLd|RJ
zEI+FI+{Ofk)5&PLHAS^^qX!Qjcfwc~*05dj<_?=mnX2>>n_pksjxeNdsQO>|KHc!2
zHtvN8S$ZnJrz!Agd+KfXP)#{TS>*T}X_9cTayp~V-ArOFcDe(r_!?`FL&x}W(*;wi
zxqDyivFbl&OL`8FvY`<TjR#=Q+@Pi%DG7}M6Ig>z(^w%Sg_i{Ns_g8{_Z8`RzGaDS
zH@|`%+}<!Zj_s*hx9?8H5p;&ZQc`-P%L<sx2@fGUtekI%rhR4;dwV{uu1t<pH@nWB
zHB}c!0%&~W2(-XQ_Nk$suut05VV`bpmJM*85a&0+lJ#P8a@7a2PWEvT4h@ZoaO?Cv
zqF@TJwF~YGrag+Ejya4-5N0^qSN9%(M^<>54z-&_5)RG?ih<%`gQOi-)HeFTrWd_%
zw8><gfrm9kyvN<coQsUcg;+o{?9Tl*1}|E4+nbx6ul1#humoCB%Z1K|$N{v_aqSb|
zv9)n`lj@36YLinKD!euErc9SXe|Ch0D)kZkD<3{ap)ma}S{AW)DmX#gi5l9R9E(dY
zRH`{qJ#sCI*c`@M9cUA^l<>9Csgxi0!5tMUV#p0xXj^1Y71NV^t3MuPr)OG5GIkLq
z;%dd<)n=|-=LtLFiwMA&s-IF{bL6@|U4s4*k9$I@RR?Oq3Ls&nA%V4js~+<t_^%x*
z$PKl$!_3Ow19WUvgkG5EnOF@rGf_U(ejXE{<jPr7d|R7=`Uw38cvuEgDCRY4)$6*f
z;75$`la)28!3+5Wmd7Vf=j0RCr(Dy;<i#_%7!#jD)z;K)@I=YLGd<{d%gOU+5k%%D
z%Ra)c8VXG_br)wEIHGU{t2!2v=$&e)EX>f+eWIRGb7ZZXw5h3{caK}B7?nY64z(Ih
zI4Lg72piZ^k&dCJ$x_5j(S4BKETRN#{~*q#12!F4?Iq))=NqP|!uGz17}~TaA{yiL
zsRlTf?<xdTe++c>8hNvFCz>nc2}-2!QuEeLk+^)TRsN`H;#66b&-`&Z?{m2+o#}mD
z)ibV)A7*1NHRRRahvi52FF9Da7w*V}qKMpiO=>iW@qr=c0~bmS2?TrTf^94}@RchP
zFJZM~nAZmfqp^3nFb)1mwnB*ZR(g;H6ECr^vz3W!tZ};fBxmoo$+R3oO~zAZJ`p=w
zqmh|)2qS@VRwLO~K4uD3boHo?2C`vT9VMEvZ}Yk$`U)^$Kj=Gr{?S!|aApA8RJI=F
z0jFz02WnUC&D1m*13$<!IMesZi`4q+P*+#|Jq=i6W$!rE^imhhP$r^E#nA&+Z!Oq*
zI9F7T3w*+D1AuWb-ZG1h3)W9v6ybQEg$}N-vxL4wJLnVBC!v;&7x9CkCBQ#6V}Bxn
z!v6+gM(g_~VV}1&v*7B&lb~+tUaRFV8`xnvVz69lHD7petY7#?mZ>ig_YdeBv)#z!
zFx}sxrlwSI)!<|n&JS>{v@8{~<K$!QEGpw?Z~fqD^U9w1lk!qHyFxP^bPiJLd0dL%
zmr!M)(;X{^jZ>53nN8Le)$i>l#{?EpEbH-o&E~n^HQ|zDJ9Tj3ZDr-8(npt-Jxd-3
zeHQ=D^D@d`T<pwh^3-_TQbFh8ijio?$^0iWxfPBB+tpdz7&iHrv)K@l30TaY9<C}*
z4MLuU7u@g(qIV|7dK~iMyf?tpn%vzf^UEmYhzLm1rm}gICSGYd!8Q33<<e{LYM!Sx
zzH*%IrRJVYcYkSr>cBSmt%0@6q<=6rxruah_4DwXh?3N)=+K(0zUD#ift{z5#v%(W
zsSFFFl#Zh(jfZYEFW<AKzMDtAAc*((SA|1Yh{20F$fw<WTB#_WX$X@9_pFkT`-VRF
zYrquV_`#kGHB0rFC$~D9<*fHKm0mH_c1iIK8oUFmP4k7Z2VeA;Uk`jea$>M*sNx*o
z!~xRk<v}l07U-YG9R!clc~Q3)2xqjL>%A87K#ABCqDkkiz#vF%IS6#&@b2z(JF6wk
z{PWP2$yZM;VGq3A%U!-5;&8oz!9!z_;lhQ_?CtH;?_^=`$b99v27hLZT_YLY)iacn
zvv#&1m|?3X)>M!aZ52^4>tL-kgLH?mIY8{BU6`kRX0TyU5n@A(hbLF6JRbI(;{GG9
z>c^$Z(PK>xj!(FGQxT0}WA)s_Ywq#ihIs$!1wiCbl~e3ncaG0?uX)nX1*a}y{Kf-@
z;*Qjh05WG;`GHl#Cy<#aaUzo*GM_b^RYHBF1(eQdGOU)$NdZ-tBq(t4*sSu*iP5K;
zH}t9P-^4Q&qKSXLBG!-XTBr<AeZ;`uv+pMIQnv3t7o4LC0<lavTbZ(YwrLGw^KH+h
zAK8m<v|fAouRdU>s^2zy?-91-!nqr#s49>Qv(D>l-46Q`Dp_N=E|>7WiVxzYUM;R|
zY_nE(JGL<UhTW7L(#Vhz?irq`|J07r+>**jS<cD*<c^mB%m-#uwJ(Bc2X}&Q%A6~Q
zxtfEdof~pBakzJ-@vka)VN~zfq9TgN;6y7>-}xj~nwv}}ca=g~V>Hm+xon4n{<-k1
z5H>8ydiPkIJ_izAr1lL~e|N*Urn0)jN$#S@`CDa8EUdiuu-MVg1WYmaKpNGIOeBFd
zDz5i3te(>kdqjjCSOrM*V#~LM6GU^aQTKNqrb~)slf|=m9jG&nm9UdUDIMS6-g4hF
zo^STh;Mt#kH<eZYVKxEQM*M+w?vG7lSIW9pJzby((k@!fl>pFkt+DEDp)Abr#*Cxo
z7g()+rUof#(8&EU=c~@N#dJP;`tG#}_ju0AH;Rhsx7zI&5{o&MO-rLC{ez8JS+l28
zy~StAx{6vQi^XqsLr~nOXlUGyc-TFSWL)V{oHc>YY2^RR%A?R60`*kd)I*0q0$hj~
z9G20dgLyG{H-eEVe$@`sVZ<8|(Jil0X=f8NnBmjdlke?Ly1F#;YUXSWLvOQ|(r_$U
z)sYzu=UXu{!-*JPiZb4!;XxRD$Ow4q2wlE8ov^xDU%*#vS2nYrs_o86y|e^Yxdxq?
zbe!t$1jgxrltIZ?Q%kvhq7iO+A_CmDgA5d!FfWFpuac5<%B}q^Mn&z7_e<b9#}QYl
z_&E|-*^b;htRUWBZ7dxz=da|9PxIycW$L2W$Yx$0F`DF9K&nJxxfp<nnqX|KcPc9g
z+3WKHws)m{E(Fh8nr=pF7T3r+Lj^MVqJ3GDC-J)mcL^cFLKa_S)>`Fd9MgMLytas|
z2c8Rk_=Kb56XRoYJ6Aa<HO4V)Z`Uhfq8d`$r|wwcyQxSTj?M^7*YoBUmdnySZ8|k;
z5rr`yTTyZ_R6#D(GDe!Pz=jcq4V=P(DTA$DBxbn>Q)T3RPJSndBb1|?e!<{gD(S=s
zclC96T(V@_x#+W862a_lLpJQ4tCRMx1u7F}?yAd1t7lpXUwvqveCC!5B_-ZBM=(|+
z)-+*`_i;gD&qt{tM|v~lWBAE?$!BH99bFc0{IQ}cvWc_Un7v^#WqS@Vd)wC<+BAzn
z>~Zd0lG8!o=(jO_H(!`*&?$$OIo9iQul50tT|2ghRni#ayg19|=r#IhL0!+I423F&
zVaQTxve!7->y3L&;$9bRPRGY~#Uq+~?%mCXK!YMV<;%-UXYEv93QT#dS(r>DRi_h-
zsPf4eO6O1uQpxsN9FKo~mIj_#_HoYTREbRHwZr6AaXk-7&7Pe7f+z2YhPh06T|yKV
zLV9*{TkO1$cV%Vi>^RYgLcmU;Y>Y)LFbNBKs72~1K)e7Nv*XAWQEZj~r#3Vy{5U8d
zCQ%BuKMzihA**fo^5NWT<df}QxbALyBZ6un#MjgJVKmo~Cea3yqSrSpPJPPr%d9Jz
zj)i>3Q`Nmlyvbn)@>5sf9YH{StCD3{!2ydvpP5Oox)6RXg%Z*FevW|!jF$gM0jF(w
z2%T?|Tj5(wmd*KUmXs7lWA4!~7_F(HF#`>p)YpPVHBT*YnJhTmBWLh2TADOG7R2}n
z4NPS#G*#c}^Hv<SeJYNiL21>1T6p|-hMU5{rV!F$ecq6@kZq!BR-u3~i1~^Uo$%$p
zW$UQ`jGS{NueDNTRc$|pqpXySfm-R5V!3q?0$(nQw}H3ASDURn#|RJ^6`0KXIdUr6
zmXbs-_iL&o8+rUUHBvKEC)Zpz>~CQW9vg8%3Nt7Yscnd1-`=~=eHw#{=(T`)nJPD0
z_~uzS`sutBqU+Ax3O{|Fm3RU*F9n_O0ZDci*~@46sUe4S+xUd*{r4JEqjB$#kMF?G
z6j@NjPd8qBj1J~|=5m#gsWm-gW|+V|tFTI)Un30}fMmcp>#E}Oza+K$oavdj>n?Pw
zc+QPf^X#*c&*53~)0eAnE!f3)hb#MAeH^|7RhDHwVv(HdsD&QTbNF`2Q*c20MI7uM
zm4-&uyS*TZn?m5xtveN8aVsV)r-#4;c8SM1dJ#2=MFg(c=kp#<Deg&j3}n|^HqoZn
zd0y?o#a~_}u%Fg)nH(ry@9m_iHf@NRkEp~Z$?@*h80OZ?<sR-e-9EiO@2+1zDsHM?
znNf4=+i?H1_dF-rnHC4vdEkTLa}r`wg4egr<SQ{&Z4(n0TdA7G0x5C=8~Y_<!56!A
zUXMXPg1U;aRid{l0ow+$U_%QxD6^nZV16imCf5emCj*<_Nr{@oQO(DsK4a=h;<)3C
zwbFbm(?ZsWlG3)%m9mH5H02DHici)w>=nYj89_5Mon=iz6;0f*k4-CUU*A6IdpVQ-
zhF-^(MP=GR%jyobO6{axB7N@g#*)6@#~uQ1oo?@JQWII=3i}8(@(S9(GSl@G<*LGQ
zxg`*okQz#8<46Y4HR(%4<4MJTGxq&V3NtEtt|FwJ@?C3YGTpK2U;?MBAj#T_^7?~^
zC~Q5{JA6!)MOqIHid%~6>ypJh=dv}orw}wk<huAylcS8F6}U1H+RV#+|4S098Vo5h
zKJg1&1_nk$nh6<0oe~j7yxO<1=i_iOlf^96A4rTF9oU9CcQ8v>$R&4dP&>4__jpM9
zwr>h-J9`&h+H4P|XuBDXpW2#@gjUtN)#n9Gvjj_oJ@iVd(Lvz0Sk-%1hHzgKuI4^&
z$X4wBSI<rJ*q4`xJp*elOo3k-5VrzI&Ie8Cc<1x`UwK`7*GPX8;+h#i_Try{)a;H|
zj}ko}r6ubNAX``tw$sA7(RY91Mf!e!Etxa;TM%CWNtZsR^|=4nD*AnbcLRFJd(c3J
z)9P>^1?C_JPx(>5Tgnh<0)?H_j$PP0WrXE=Hph_XDpmUk0xcYncfpzd=xOz0k6?B*
zV7Dm|)LhM%5c+BE#I5OU-C_EgPu?kK?b3L`Y&^J{P=uGc+}eG!#~iW_o*I+Q1+u{5
zK6p5*LrGlP%Xb<`Oa<w25E$wAhjMPS)$4DB)GsoeNOPFDG<D;QW6lnYZ_`EwYU7)(
zZy;tmSFkwC^;_R<%9}d$lYx88Z9Z(Q@KO(`xUJUY+dwhqRCAHTu6|Nw80ny|4;69b
z>N4`D%HzieD+G~)^ln)lQ&CqLO)E)Mo;HVA%c>xNXXP=(rF9d=8m&geMXHFz5roga
z<s9xPJbEgZh`~jefJd*b1D*>TEodvpxz*z$Cr0Kwm~>ynoB{!cQ#fDv>rxBi%qPZE
z60XRKdVI?S*uF_R>;N?t3h#hvUP6<nx5n7q12FP58s23J19xxl@b&5=dB1}cCPXXn
zifx#1QBi$Gs>)$8K$FmVj=diYK)}_Ix{(VF*drV{-g&sA`LUiIr&u{N3KR-McP&Md
zYPT)#nhbWCytdF&Q@9;`FjWD^2q%WX2)bui+^1&_?tN0)l;v}Qcws+wrx_t|D+^qy
z{3e60i|*|fEB6|r81<GWZd#MiN#5MoYwXl?&Jsl_M=@Ln+U7><8JZ#g@DchMznmCZ
z)E=Ds*NB~{3#Icg?LXe5TBiHq4sZ!}c#p#Nqa8Nf7r)#1T%LGj!*nC6r5G7`l|lOK
za(flBuH)-sSojWZsofYp)sqIULm9Q6lBneh20Y&=)Qc?fJ~1<QyUMjU8^?uruIZ<&
zmRHxo4~NdGn@z67Qd(&DknBT$L?53)o$IrNa_8+*5WR`3G`DpB@VIudf1TZEP)gMZ
zk^g*ftYTuf{JzvX`J4TvV$*=x_e3e{Ukdl0d4-RwGn`#VG#5EJoF2N*2%SDVb5|Ce
zE0^O9F8aL5sF`?prvvl-p3UQ{l})$FX8kLAY`J$U-X2bR3n$O%=^SrfiO^gyJG6g>
ztDZTBPjVZQt@8oJLW;(-9Z~USeIF5VDk>ZY5xkoGNWCsp<{f&EH>ECi>L=_Sq~A0G
z@G~n;R!jh{GdI+K`ag`lWl)r1-#5H8lA_Y3A|l-_p_BsBOLvD0OE)ZnAgy#tclXjI
zAl<bzNO$-0p4`uM&Ac<u+%wNNXZ!-3=Xo6eU;c+|_GU@YozC|r`r10w(rcR4u@<k3
zLLzQ+T6t~C%+nd$>HrSbhFD6eu)wS$Bl)ek#=ItP=*5t9PEp=)Y7TaK={3^anXc^n
z=8KmZd|YFWUZ89~5&gPB-H#|9F5G`g^n6CG@IhfbHEbKSD`#SuKnhgZGtY-y7Cwwh
zhR-`Nq$i%A<HZ($=8O6VvYW5EsCjlt)MNRok+f5UZyrXs&#{z1MYEE;a3{niWU5J=
zVlt|3Y|PdA_W68t38*%ZST^w8vcn@<zDEDDd;o|kCA~pK@8+ezzmf*zB;qj*3dC#5
zqOGK%bcld{Ba+Sl1!+YCLf%?l#^iET4WNZZ*|8Dn_fAbyUrm7=??CDq^jSbwIv=nj
z&+90QPvm!9xbDZ56ddtV4Ya$r4D?l)s#Met)M<)L;xC5swjxOsQYG<XG`<j$Q=$LS
znadV+<rEi4>DcC(fZ5{XJuNcaZfmHVWvvR(<L<<Ne}uW^jBzK_R=)akr3PzRVSpN`
z5_KFeTY$&y$(nTKn3F7K5Qe(RAxa1G5F$?%(VG~{K!$y6OmH1&jW)sz#cZgdhz+Hm
zX)U+?mBGvg(#zW%?sfmwa1K1!!f8pBJq<v|yyXQ?!XJzrw+_o%%lbmBDGaBF7k#6q
zbiK7lT<jX|Ib9Z-=q>9tN&XIe%8O`-{Maz<=Ps~bT$G<t!CR=e1jJppwq;7q(4zj9
z_GBWgk|{&GI5Ga7S6!xMGREfcMM?t<^EYPbRfTV+g~3%&>2fz^v6R73a*><{{j$$8
zFqbZSYG!6td7Ax_AV7rw_PIjD&Yg6VKRzXCjRG(L%2R+ZNMp15+-ndxQG7zoV6T{z
zh7a=l-K{=?1@<Eft+_Rm5-FMDz7G#OBQt04I9S;J(Qo;;`AVmM)wX_nDaJ+0ur)oq
zAP?vYLX4`j_mwY)g%uRg{F`N=FVK2aE>iUdg<g^mrGa=-ap;0f+ltBeCg$3IR`D%!
z;O5OLp&42_?y7VyaB-i!V<;NoFo;E|o1AhHFWnhN-$QdFxiOY^!LW6ytDQa?U%jFK
zf>KRFqNdXEPqHy7+Cvg$`Vq72=2>>QC;@WY7jGF?tQwbEMy%N6*iM3+3|}#2b#s$U
zqWK?hbGamA_BhbZG0C*;@gUYV<_VC=LBduZXm*M|(OqC|YtyKWoo^YT+Qi1%D|&%5
z5Bj48d!zl=>rlYbennvz*5KK*yXVM=sn+)(NCcBWS+qhU{GiUo(^CE6p_%%iN>x?@
zm=+<RPhDO`sHb{^z#ciF)Fi)uNEa^hH-X$adVaCA%Q3|ixEpv1e*hlOg?F>hBP@d2
z*J34GD5p52EGTnL*9QG(rkGzuArd)zjS!nrbRInKV;a2x2q5NRqxU?pAgpSXW<ch!
ziKbqnp*HC`Xz1#5;cy*irh5p}P-hF~d^`{nK8s~g033_ZxL*B@f-)9!xOD9l#kkk9
z0mt&mh{;girh!L)K7~g1@Z)`b86L!PxqjjKJG1J+DQg8ysW1dUI+o{&s#fQdh2CYV
zg|gR|m$pk@Y$aCNu8X%Z+H*qS#+|V#16SvpTgN)pN%R1=L+>L&q4T{W=OoMLNB2!l
z#XoYtl%yA^_7!+AJsdM<HfJRR4&3d$G}1AdG_TG}^Dx>~oMKX?l^{D2Su3kW&jeOz
z%E_WPPH`<#zZz;^Qfk6L<N0*KahJZq3G&h40kmHZwA!Bg`iz;6hHIorKtto8>cBXe
zI;mkz3Q+d9kF%K17Y6xofHqDji1X7{GBkBc_)t&Z7d7f21Lm`hn(313xI7s<D*W5K
zYPL=O)=6l&@5x^kV%R$r)g&qJaj$hkK0un>i%>DFEy`(%D1D3iv>3lpTpQ9{fe19Q
zQ8WmubcZK)2$C+F8!lt2T2*lKU#}>IoPMtP^SW&W*j17fZKtom$lgf)`!<1SB8+n_
zC~vi+ATCvLB@U0@FqX2!Kw{#FrV#yXOWxe^1oKM`FB)>G*Gm(B>gmgietnEO;03<S
zb3~Yj#e3juv|!_W#;sHuu%KKq(eQ|M!btuG)7QkmgGp_nla*Cwcc^i(JXzu&DPuM<
zGgwdvK^OSgL9RmS;#ZCEFsXrHcCO5Hy+`>sg-NBif@kfzd@CkCWz;31bG^5b^!H^|
zUoU@9D(8w4xk4CJM}P!8O_R^AHVvk;<S4g;_OY-t;m-Q;l@siH3cTrLoP7tvi6@PB
zr*P3jXl6Oy;!kuE)NQuid}|Im<+w3@A%Mv>#uZjcC)?xB^JlY+sk(H*oX`fe*VBqS
zikF3jKY|5!Hld+!$^kCB#U#bL2x;KhvB(8h|K*m}6jf#bE1qvQ)+}P(&4aIe__(<G
zTAd?QTwQ5vxbN!RtVFzT@5{~*$+TCC$@{)T<TB&u8mVUL0s7u+-hnvhgkA{;*}YAN
z8JpXoWxgZXr89S(%D1C@I=0yZRY`CPw0s@Aij169QUf0>J<n*~cO-1-d1+2$8IcKe
zRb-Sp(!gd~I}hUno3k0!vhvf0ih8siEsGNJvu#gB73qfSd+I8_HP%A_1?83aUV3)!
z;)F49a{5KQcVch2x_gc-SBZstxA>5D=$jEl<2jpm+Xg$9wawo>n)MucPKb#G@vmXN
z&V+$6j;^(IMdY;Z+8dFpw_eKTm~VVI4w(@^b{kDaz4?AQEmHE1yrGcK-69+KJ4yF_
zY5)cVI2d@(7lgR&N7w-c!7wU2R9Urco_dnTRk;ysd`vydpY$H`f)hK4elV4wN;C$<
z@-JsH997H-#R)8>ukZvd@)tYW%zSN(ul)Ffn<43^q8(3`vE}zdJjGZTUWz2~1KG6^
z9{SI!6sKz{qsRj&b6sR8(MJ4nKtlBNsW{{W5KHY({Vx;>+9SxTd{AY-OOzMt@5T4A
zwPTRze(Ra>&i!tr+LVMr6@(%`M=U_Q{IeJ%ihIn_sq~LP88kvMA}acqo=J>{q#yKA
zxu%*lO|t|*gbj~cgg#~H4rx_#!_AUU9<1$?v;`)AZeDK1X_lZV#pgMsH%bAjI`}(r
zUVl=q_EOY7;vR(<Z6u86v2?vk=0V9&Tb4-z-fs6v8sSrYVF&DA;6tiP5l1>2{?K6D
znqYU`d6AAan9<C4^piS{8EfFlv;qX3t+RBns&b(_VqhO9eY%x>-gt$Ak|mv<hZmPh
zLZAm)Vy01DX-=KAM!flvP<Rp(wTanKL!c2+ml>dE@}rt248RJ~M$;Dl%J<USP;i$;
zDN~BW-GMRb24GbHN5^!)ZeCzcqIKf2bZv@T$3&6}WEX)v&&b<6Q64_K$pO!@nK#Xr
zIvg1Kh6k4Pz2gbquYNU?@Z1*-)px((Gt-9$gADDOcRx4WC3*hEM)nW)XXJ>ruERUm
z19fQRmmaQ?9p1r2_~%UZ%zmc^gA^a!x{1&JKKI4d-XGWoqhnuP1|1Hzx??>=6qOt`
z()#37u{Zr%yj{kHOu_eqYyVw|Rt=|5KOC<J;NMZYLAQQLTx83!3H(a;6+lTpQjA}e
z1=>w2w+{%H95JZ9|A^+Ay-|HpF6Za#d&`~bdHkhsXL$oBZ_CiWvn28+0s^TI2<V;A
zdU&$5d%k#H<WgL*2;4nW+%NY53yyd`Fc47`8msu^0Fb3L=HucI)Ihm;2?`eXh@9bt
z7x3B1ktW0WFJ*1WSnhet&G5Rm2DBx99##%?-2M>qOuSX9v5|o`I<yc(xrAey^t>1g
zO2L26WWJ;zz}~{dmSF7WMM|tz5gpx3nkdnUCTggfgK>lUlvq5E4_dsO5d6ktcCt2f
z0TTW?p`Rl{N}#@Dbdn`Sz(?)iZvi8@=(HyB-!S)1w@mxr$yTr2GhySv54}^}q2ddF
z{OL;_4(9B_;#~|h>psnLdWqSuab222O?+Hv#O9x0_hHL^Kz$YtlYY@V*q4*}-cjZi
z9jRX9JkmOOhwOw3d+Ru)E~CM7hY70nZFX!&zy)RNgAL@x31?JKPe>|C-b&ZG+|`Z3
zA;I^xR}9=iBol0E`kmSs%HcPme5Cv=D?yWI({VEl;V4IaFF^uvJ{t9dn6*zdNzTz5
zhw$eaW^RGaQ-S_E-NgQ<Q0G}S+Ts$7L==3DxD)@9rZImF)agCBo$FUXO9)3dw#d;4
zN;l0uhi5sc^zT-DD$$;%`iC9!p(^^ln6TkyOKCkvYTt`3G2c-v@I%%tzg7Q#M@8o*
z;PFLFcLuX^GmJ8`2~KVrZc8?nHC@n9JN*;vJN#*Rn9<0d2kiEo4$k#<HtyYT3Mq*t
z$m{L>JfU^TnUhVH>^?JDQN;%Lvu)jE9Nz&(jI9G5wp@S0nXb6QEDc>pcK`0nq+0iW
z=gm=a23jNSZrnsD`J&tIY@kH_MTnr&Vu}ggsYI{a-L}RyT$PRcJ>V(zeCvHXi<_aw
zXeQ;Czyv)~-W-!FYs%W~yxA>PctHLW)N6P%^N6o5Y?yc-g=C<vkabJQ7wMJ5#ceU9
zmMfQe4?JS))?5_;-x+SmQ{Y8}cIB_A;MA#r-_Uc-Yg!%-l7NNbzh?iY7c#vy(vot)
z#V3(&FuC?%F`@m8j>d-K=kW?;##h6pOn^}ehjE32lo()N=tvi;Cs_K1S<n6Qw<7se
zqGtDb#kejx+Xe@VyS8S2)Osw{(%ym1*e+4v&O$O^$ZX2qYrv>A`BtWSVPU+xKV~O2
z>yDr<!DNeKYa;-2<sGht)|3CsA4NLj37119QTt9Tpiq-GZUwxST1Mo)8usRl`)&4#
ztcUu4l}u<lOU;e`UBxH-{4~x~IOu|(6ogeoGFdU+iVCkDt4qg+=Yw8Ci02dkJbgo@
zhULC}PSG{CJ4-&hm!k7^_fwdzQ}nav<d`Wt{<h#v3Yz&OW!}`c$G*QL0pk>JO@SVV
zav8ay#m0~ALsbWrXA-5cqFZBWB-=$qlH0EEuFD7drhsM=P}iM0=N<*_5%(Bp(Z!)T
z*7#dAEY%oxW|sBg8u`i6h&&^LFc5@CwAnbRq$gn1f)4SGo0&?x#&1~YOquwKrF&DK
z2hCgA8<|PyvP(Q@|5>N|@yQj3|C@QVZd_Pdsf`ca-u+tiesDCqNM>L9(s*afZ1$Tv
z*m0=!_W}IU$_xxl0k6ETrn36p3qRZRKEa2y&Q<gk@-0|GZtl>WTVsR+60h#$>_#(s
zQtTQoCknYd_PZJ__j&V@<8XPO6I3#!y3<pN<<pYM$;xK4i>1izmQ-oygL}Z&bdile
zH-PG=%3)v|0=LNR3_g%=dan4}k$B;uoO9r&Y?>w=VEtR6Me+BNe)&vF%@?+6szttS
z7w{~?bfArwr_ehwKm5s-kg|n-H!IGcGF1B~4YhT3<D>@p@scx;x`kC&zSZJQfc%{e
z`0Prp3gTxQSWvbow^=pqK@jGxwjkNk<npYS@B%3v$!(p4KpQ9{s^2HgR)rgro%<`Z
zTHfd<HN!csqR0wse+3Fcj5wf@D+5m$<OLEv=x?w*^0VZ8iGq*UO*vx{f5`#(4ZTMR
zVruqJ)g{h5!r&flVLtvXgu5kqs!K|hk@Hn>lD3<bA;u4D4Fk-eoBR@q<}fxPOc=#W
zXT!D+*tdB21@YNu@q<Gw>BaJ%@mf@5dn@&$!v@kG1ncHy-w4ADXINa4hs>v~fS0=H
z@wlB#41cf(On(oKTeN<&D(ldufYY404uHxMLkUJDapnR=v6Y%!%6IkQSx$!t=go4h
zk28}~g|^ib$@!RU+d<mCKR>c~<7~4VwtlfSlTWw>K7U2W+KJ_296>U*Lme6p69nt2
zj|IvES}~&4zzN2stv)<4Gc&!8Gu9XkP4)gjyKGy411kjC0=nZ1P-)>IvN9NN7nP&>
zbpD$;@0S{(mrA?OtkFAjbF!7C?CTlS-2h_B?49Qb`z2hXQTKNbm||6$b$Gn(XM=AJ
z-irAw`U<Kg=FC?o7WEU(gzoYpCg|@X(dcp2aqpgBYg&desICcKA?QqBPrsxus#*Y`
z41hxHHi7LHU^Gy8f!t@zN5laJ@>u*DmTMT04UBPjd4oKeGuHNuzK;R7cU6~||K=Kw
z_@i^+^=+v6Q}fr${}B9tBh2x3udb)1s;`UbX7W3(T(=+Q+^9X)>*orxXA*738xMWs
z6vQqmIz@*>p&CiIf1Lxb_5W%@?wc)FjL(^zO60_{Q@(oAHdr5SW%BYPf)I$tn3Mh1
z;lr)(43j-M4p^UGU>IkMo2W8_i)*7R&u?v8V<N;hK!AjXc=R$}>@d~@1Ly7O<D+fr
z{tfvct}(1og2y6>5h#O69#X7)K+Fg&D4qzEYzu(lfKdbpex^kG(Y8|PkQ{#zJdbWs
zPyHw(J)2ky_I{485DP8FV<`7(?&E#oO#BaA{#@2WV6wp>t@MCoXa7*`0tjAzbqbr?
z#>SDE$Rz<0W;L{!mZMp-31>ubE+hV?7XjLB3(BWCBEVMX<*#$UX85|1Hui;jq)j(A
zoPY)0kZid;73C?Vc<qJshAHN*Tu7n&lR~hZV<ujTXGR8}+EHn37+^U*e)M7j>fhpF
z9ROnz*KXo~<{l+qyB|5B>AyO%vhet)*wxMFRssu)HKS){$9v^U>a0~XzH0BIwagh(
zG4ZRg*c+tKE?%;62kF;+>z94S`X;IV=f>tgRg{NU8`CT!zDuTCuF^T)wo1}$os3P@
zw=oZ_`z;BZo&k{tkbjkHroX;KM59Td0h_AwAja#pv<>GBWbL^~uco(e-aG|$nzlrg
zGehr+QnZ!DmceboexoCZztdhGN9b~6CRR6Y1YVe+MgEY=*DeL-P~o`Isafg$g&Xka
zk-RoX)-h3vLGGRJs{B-q;iyA{Q0Nrq%Y7^506EVakNk=+4@b;57#jL_jZ7;dk3e-X
zrNLejwLwUj**twa%nE$ATURDDhf?Ytj(?eZjXQa1iLeo?q~<vz+$tB-6$chdDL!n#
zr-KgbzeR`|r`cP%0A?)05t2FD4`TPlF6J^iw|n&>BIidnU+2?(X1Yp|R1RnEXC3`^
z%tf7O{$f7oTqUBa4<iW<K?1<`E%KbO)xj%-Q)21nZmCFg%l#gPUIX<LLXnGSsctvK
zeTAT@Re1bUjQP^GBD*HVTWTSh*}*a~k2pSEU;O`v7xjkh*`BGU5-~Do3G7}W-+8jf
zRHt%Q05`-j3U*=W98f0Nk0Vj6+l!eP)0gY)L~A%eJ@GHH$&ZkeKFG0bv#~8Dd;Ssv
zD=vJu<_?PhMNuZ5izU!kI@*3lAFB6*xLnpME82M)Mjd*;thV}h74j`dO7mot=8}^e
zMgalnSuV-uj!E8`im;O*ZvvJ)+bQ{?WTJPXe>Oier?LB?XbSQ-25h=J7*+yy&G%Wr
zi}^cIb{Jn0(C+06e&NzcV+&ya{Q1ZmoHe=$%^H9_0ClKbqLoHdvN1!v5Tb_{>0GeF
zNxVn;RToBLle`;q#L^P2t`Xn^Au1l!+(>4%CwNI<NQEj+Up*SAC-;L=Fe0-#WECfn
zZ`_Sh%|u)WH_iH%e5aP2g={M>Bxlkl3Cfz|`*UFFZHtM<37JaNerroNu*>tH(@(C+
zqUsd#M0nX6O(8X*N1TJ|Dd)T-XRaFo{I27>7V!ve&vy3bXth~ox!r@^++03qTE{8}
zvIzph0YWMmd3N}*qM70QUi4a9Q!)yL*+S3+P04OoTm;F^p0aRs`zvZfs!wi;kI;%g
z&z9;JaDEQ;MGrSg1KSaTD}PB4B2qudnbaw+D;T{wfNvh3wKtW;c>0_kJ65-Q6fvK^
z{=(yMBH6s;jeK2FH5K+LnPdK;Dby}E`Os~i!?$d~Vzl4UF1W9CZ9&Al8o7bR6i+LI
z6)EUo;IVbkkAF)sOm3cD7roY9b522dAc0F#fN~g!aj0TH8WKdhre(0*SVw$y8tXbX
z$^Sl|(o|a;$9c-TqqU%f%W;%A3VrTTPvm2yF0e%2T?Y^k*Kj&+$oCD$54)GJRf=!|
z|Lbf#P(_yoxV?$Aa>fMIUQQk4XUJl14&3Bo^esTqvYXJwS_E9_u%8;q>997UZl^(|
z@&InjRiUV&WAa(Q?#?b+d2-LwG-4<z2SbV=;I@7J>Q!*a2{T!4^>DDvqyo=)+_;1F
zvI&Y<h$Y>xo+lbgz96Sbp(BOWwd^LIlQpxj4?($8U41@n7{s>u*jbMFFlKQL;m(1a
z$-@aeXm$94K}MGH%(jQk1m+E3UH!{nDl-ca@Yf6K4-YwcX3R|G#lTsN60a)`f0hZ0
zf8^@=t0<RD06%Wa=J1jy%X557Rbr?;y5V{)hd(7Q+3P-6ve(wec`ddsd)y(6IpDaA
zHnY2XTDiEQm-1T%14m?3Ab*S&+)hY^|AX36sQ2`zJ)8pPUOe@(xzk;;oqgH~F^(TT
zibaN>ZhZ-Vk^7~^(i1n~d1(LX)a?Up{6x*hM=!G<Se{Xqa=unmg(=oVYH63RFWoB)
zn%fTL)Ar!MoL2MCSslDF<Rt__O?2q+@$hdpaDfQ^&zZR;8T=Cbmcr8+4AM>E8?r;A
zf0$wR^<5QH1B^nUVp$+684Br$;{0hG`Nu5+kh{E)!ZBIdFD_FULrZL;<5)qHgsZDw
zvL;7*9iERDWV4|2+7Ez}cTpdDe<;*&+EU*qZQHP+o8-9j3z$`(6N>KWdThtK#(<H#
zHCUFn`$)w^($BBs!r4oI=M=wY=Ju!N-6Z$nS3P*~(OA!$yJU#1*5BVl#zieUIa*50
z>zXSzmLyQg##HJMn1hoXk>`D~QBltdE~Z`c%MH5@@A^L4Cta0YistEE+-Fr@Zl;}M
zHEf)4#{vTfjr;s}p37_gSg`leu#9CgE5FLd=gfD@Bp5CWmv1~an}?kiW<5gjw>#@-
zCUfMzaX<b-VWlpUH(jI#?><Zq^3BPMYcxv6d8{e`ALyEG-~6}{z-Mujjz!Nf!PeVk
z+@IKkUl6NZ>xu)%tgLFi(9P{?wFzTfPLTgQ*!wK(9_6Wl@5KA2*_%fOY)f}?6t3Ka
z{5_nm(187I8`{ml=QCok7^&;n-`{jOTZoV^?QC@@1SVn+S2S@pReZ?=H#<g&hf04*
z%2?1XnNFh-CX}sa7KDwL!cpcXDiao3&mumzFAqU)F!M?GSICqxK=Z^s0|`uX@xcC-
zA^xBJJ=BhY-{}Tm(Lja<cWHo?!?_ltX>@i$QcIWMM)n7){-f4YHVnOsPz1!t)W){o
z$&FdLs_wszI~n}WB~L}D<goCTyP>*D65EaBpT2vbwo4bCqsr>`$=PBxXk#AW@{io5
zpnmf-dkOk+C<!t}(L{xU+bi>XiheS8*QS#YR&KZMqCzpYfORfr)1mIYw<!aEX_B}c
z)&dUv2x6dY`{tVp5X19`?br*nb!ijnTY<Q-aW1c(@LDnCz9lWcK;1G$sN-K2z$@zA
zR;!T?N$C-Y0K<fwptxjDp4Qh|-Str*-8*!btN5d~jGi`)g3x<5X$+4HnHSmyiAzfh
z-!Z<+-3$9W<P2^`R2!a>f3eVlESb(}Jqk(c1_j>V0d_#h^Uc?qHRZEwjU{HvV3MzO
zT^BMV@k@94d!3gCO_DZcf_lJ9yDGMHop2$rtY$`BRXZE7=)Lyp5u-5-*M}VVUSV_=
z(lqU|p9N)Ia1Xe?&MNbT6;30<5yBG(d&43=Xw>kfAq5`laiP|SV}1m*-#^w{!15t=
zd$z|`X=C=6TYH*a2Bn>+ycRJ+>b5;Ir$*w5d?!91y_E0LW*vsy6Sg6s+?h`Jicblm
z_uR}hTN!Z7l<+w+?GGw+c<wcn5Y`e*)ly$Kd*7cO111A{IZDgpF^{FCDEjm2?A+fT
zo>=er`TM8iU(*b~r7V?7hE%dax}MVC*jVuJ)tubd9$$)7bVL$;MfPqkjfMJpCbz7u
zZDJwOs9HBD#w{cDYBM?sXQL~t2FmvDybY?ehc?Z_Z(1H!G?uQXM`s5eh2&>v$y+Km
zH`hlRc8fPCZ-KfXahqcG{Uwo1jmZS%R}om%<YZY{P1dF+a=_$pFRe59_Dq8kDuL{m
zVz7yxo%r#^4t1lnswl`~Mp>J(xA*HmRo(P25pHvq1Mq{wckB^xq$U_3UyEbvrb=O@
zQ%+GT&mTEShAFQ(A#EVG606D-s)_+>ZzobEhS!7D-_tSuOfK}!s$Og%z+BaiolV5^
z-ze|TdXAD_o$4no&_E&erVS{+4Z_VE{ley(47+`MIylFP`F0RC7rRcr%3>NM&n{Sh
z(=#=_v_3x2N_|DKl^x<l#}9@F883E(ul)KzdsmDQE4Lj0oAkd1bJETy##%j`;F)iR
zRMMdY!@6<FBf2+X0gs;l#}mXPuethbDKPGA-29PaORtDHP%v{nbv!A6J<O8;>hjI@
z8%gwp7q*q=M5Q*%FC|Rz_pG0|%2mPoZMfJM!q?}5$baIKfI4My<=$`p3$aJr>r%NW
z96{}oeyYdT_>E-!yRYNZpZlwU^exvT7ZN)BDbXmrHk|~Ylyn$s?Nb4-7NeM{g^zr}
zg;dhg`Q$r;v3=#X0Y)(H*ST?Hx0-}hJ5bDuDYY%SusZH+J^%1G)yt8ipNAPJV6k$s
z9ebgHo1X(P!DZJcc8@t({>@29*0YhxdUA3anvD675-ZD3cIZ(*ITD3-#a4m>Qd}|F
z0T>8+Uyuo)J-U$v@brRW{QbEtINIqyI!MkyC=Zd`WLecVQYe4O;PB98CS}oMUG%|R
z&49gWkFNn4Cldqt?bY$M;WRfi#{D=2dxR_REA#qOoD)aOW8a7E8A0fw|M2K@M}w@6
zkI0s8+xjbJrh&`mgOkRR{3e#G=9a|W{m(G^nu_Hh{(O(VLaa*B`&HqF<*4NCwP9oy
zYvG*2moF=h%a=~=vptn4;oK2-AOgGAO{)e#lffVM*6TsW!-jK3ToxjbZhIf9=Z17-
zya+A6ekBKtV^a5MYZ`B7LNdnO?IN*$k+PNMi0OGG6FTtj(DHbmwJ>i3rVB2nk9MuM
zj0+B%(T^6%CmxDwI=ykpC5jBxV#(&T<;*D9_zYp)VGV5WFWnk;#>TtBp*{yK4~%PL
z9kU}oEqbn}olc_$w$oq?vf6_>SEub?Z|?4PUn2}d{jcg6ny&|m@EF99Z3c7&qPe#~
z<Vp3~pO5W-^44wWY5+2SBCzd(uLay>F)<#iS}5GEY8MY$_46h?-Pj|;eO&*51m522
zMA4oKpa4$)${D~FvlkRLa8XjUYuv^ljZ<Ma$D02%|G}Gsm3@UEZ|oBqTj>Z79po-L
z=-1S4?tS<&_>734wzs#)CxGLdsADA#BR3uUo>BV>X?YRAAC8m1DA7!u7aQp;FF_b#
zt}87bfOr=0dd$Cv7HjDM_BGMJyd%5=#ZCVnVYlPsC7e>L;%Ex|gCfz#cDAuLctJU6
zLar69FlAuLE{o`D$Ot2b%fBRw4D@|BZ2_fc0@zaBnUjCN-%kF5AY%nHz1Q63K7iRM
z+Yc)i1hh2IuTLI2N*^&*qow03&C&YfwHawSK}@ryHnj1M$U)V7AhI>hGaJGgC*=iW
z2<H;tMt<8XP+4PHa?;fdK5yo_54m+~lV(d!R;-Zc1R<rR(Y9s;?SsPd5-zyym76R&
z$bz!*x?@y>`19UN-kLCtPZdW;^rhaL)A_Wk5ofv@=U-x{Cg-}+);!`FVg`qRHvMnU
zCT*iOP#&>p+net8r@(Dw8`XjwR;-?N31X(y^j(+)YX9Ho4ODRxwdr(OTff9(3r;<!
zotvHSYq${kC-1R8NT_a$)l#vOOAe2mylfR)G4|M*osR87`Rjez6}kqJGW!tpYzYug
z5LSoJV{6LlZ+LEwi{fM5kAG`&K|HM?s=n;a|DmUK1^;ZsxiBSHWR==U;SKSzc@4*l
z3J6HX>pSyH#45hiKp)+w`l+O){L$BQgAZZp&x@u)=ZQOWlsiXznTp2LCOUzrn{}Y`
zfKmU{umJA2HDMQ(@7x7^Lju>>4eJf3>Tid=kza&>en$82pYJ77m~oFOVer#dU;kXS
zQf>Ruw57=fxx9gEW|7m5WMp=^!7(|$fTM_uCq6ImX?W;++>jt#%c#4-*VDVS%WGSu
z_Esxjb)6QEoz~MdK2%@fbz4+03GIm1?u8X043f>y64T=1K0e&v5ErTp#Mctk*#boa
zQ;AxmfDpMLA~x1I^Qhx}b-I)+0`zKQ3bUs~Oor$WQkoFW#!e9~dXPL%VRnUC#qgk7
ztbvLeWX@p&DvzNw*P~DbQu3G5XOpNc`1PUIU&327T^&OK)5aH!eA9Bp_!2&+UH_`u
zy7kI)dcI*|#Hg;xbOU}YF$d_B3olVLHrE4OJFN`Mdp1vsiejFJ;O0GrDf>FP@Sav=
z>tA3G^&%-(kS8w96ybCENXbCSkdq>~*b`}~H+q2MB{LtmJCtAOB;h<}#wDWqYrd0C
z9E~0B-I48nlKY(17X>E7CO^+hj<2)j(p(e@eU+(_{PHzO71Rh)MSYK7yNW7a#^k~i
z_OFpY1%&cN8mHkSmH=r7{#gI$*k}hV{icyOPMJ^_LGzR|1y)1!gbLqPU7)WpB7F7k
zbziUUd3gqTjE=gRbfVQt8CwQ*v<oGSUEH7uB}fMp_iR)-J)`EA2mZ2)_%9gU!qY2V
z>whhUuX*WX3uT$WS|7$iex3W8&NN0A0xA|cI@5;A_r^Kge6ZP_lb!VY;A-*bV#Om1
zb0x*nxAo~PZ-VU~**JS)XZuNez$}r>250>35QpeG_z&$oQQ!TbaazMKA_-{YL6y{P
z>afz3A18^eSwNe)*`zkVyjcdvvqtyegVi0aK-<!3J$I5+&y7)|iLb+KXlN2K8uc|s
z56k6b@IAOlNq0+J^ro)VrP$rKN;()xn(yjc>Z?2!s`Wp<P4`6m?#oP;BTIJ&jbA0o
znxPDn6MSPdSScR??x&UJEFS*?XXb9bzHWq|iVs(v#}eru*&;bYF`e&%Dc%)y*z(Ps
z7H*?CDSCI+@6=%xzkA`m+FrB`NbFZ*v~K^TmMn5&TWG!7*v<yBrgwLWfYb-Ii&(@m
zj*Uik_M34DR|AD0>L$-mV9~P~Ij7Zajdzy?*Xxkf<RhP;p$v^BHv=uvm_Hi7o5L><
z-cx;g%h2W<OwY1;0<Y6+EXDC$$`a~?7Z<mL8{SgF2kuP{523?iex>k#YG(RPZ*YL>
zfJERHUpS>}4h;u};cjVH#cHPXB8FULOrng(m=lpY^~u3HJ@?f{dA-d<rJ2dZNO8-%
zuJCm)7pHaE;+jGJa_@(g*axM{nM&nAOBrv1)R|fen5<)^KYLbYA)z;!VVxqpTN}k1
z>})wcro!zmm=%>@54D<$?7naa<l0G|h+qZDqa<Ns>V8Qki<**lP+=mjcy5>PXOde$
zJW}H$I1+Y7)i+23aJZFOA?vcwpGRTCYNJOH`Z5xo_aBmBxEwDvngBqP2@`&#B&bhc
zHjg~|tMsGY<TxE=!Y?$7*_iS3-V1CLpo(jnd*m|7B?cZkAjR5RvP?``%oa0nkv}cy
zmlvOWBJEcRdVcSZCfZix%W>t(%Y2?itLY*-kJPm4#5c1}vbKVLYAr;);cIrFFw#dw
ziztNcRC8A0OsA8S(W1Fvp5=Xu%D9c;3jBR7=G#_K*AMbZR`<i=O}#x3X``5|R98o3
zgF`!GfBZ%@@3EJ%$3UAaQhyh$Uv|do?BuFqV^JjPuL_DqV<TiZT1KTYRFbmhLaWZn
zK&b{CRi<ZJLRr=gYpszWpPp9Q!nV$*1-(Ty0pQqQ)mK2f!Xt=t+o=awq`@isJYDHX
z(d&>(KTkVA{yqvq13)o-2gKo~!IKO%k8s|doci|me&5>GOauffnqGvgyDTS*^AEH+
z2``F0jOjRSac(jf$;!*8BMg>Sa&}K+u196(T{g3}qla6;e3u8igk!}Je(*+@<7(uC
zp7^evtyi&$yBo{8&y<ynp!p0@gwLZosyF0|fS+|ldo8a4JDq>Uom9|RwOL*DyE|Hi
zPZoBT?f`qebGU~Zr%vqfGx&g5|Hs4T>!*;~-iC|=*+=0D#dNaUx7EFC^93&dyd!(V
z=VS={epEPe9GIfS*jh`PL(TU+@a`|;rPjvwXWA@!0M081nAoNqoTW|J*qL9$N)h?G
z-VD~3Y6j1(`ja5j!w;mfFG!17P@w{iU*%e4ihae;dxJ`!kT2_L*|$;NwbTIe12(}1
z0tA2P_eBmB>F3&1ty=3mHoV0DFZC5au!$|dYGtFJzb@wcxA6RVbU`-MdgT72a~_^{
z20ljlp0|R!ktQ$7SBP1>GQ0;t4SIL#*#C~PH<@2GFbFF@N6&kF>Tga>i&e`(5V}Bo
z9I+yy77{4!*f|&#J0{R<jA@?~mzm%U%%#K!LExZH{F&aZ-NWpm1CsH#BTKJcz}@xl
zUIFQu1E8}<<8t8pnd$$LzUgS{I`pRIgDX%6s!<C9cNDfI4bXPc)3Mu_sq$YyArf*~
zuVRR26!H%lPA`?=SRD(Kp?=9cP)l(8Uum`y=RxP<bC?1FOFe<iqEZJQ&16Gw<{~}5
z9GTC!!Qsjk%GQplIGuob;mf5qmz7l<evRNQrgFFsXPHtaR{3aXf!Ei-)7jNO*nszC
z_JdY)46A74F*%KOn-y8wwzMA>_VNX_Y=WSOqR|LX*N2f8Y1`1x8W@H*<gw$O-*&*~
zpObDMziDsB)h-&qn>$}@Ti*5ItW)tc7T@cBw5odL#^&AWo@~=)`{vd}RhhbakgtTb
zulF1g)@Z!Gdk_J@K$$iA0M~(eK(Gw8FOkUoJY}D@%bYu<$9<P@tox|^`;AE7T!xL7
z!mlUS47S;57Ym;gNe_b?4?LeWpDtSDc7mGRrdi`hFn3FAwb`^2fyKl^&Bw#;4IAY=
zchr}nUj|wC*G?*{xVDzjTykorQxwK?)j8lZAAx8Uo%i)QA^OZT3*Rgha&u)6d3s+f
zS!LYUq;u#IHB^5jZT4G?Q-n3PcHS5*NgF)mYsT~a!NcR$(&~#p;nY0@`RwMhPV6?6
z*`Qw*cRQ4DV`u(T?02+hz^XMRy#>M9#0hooNIiM6^n1eO=SqmXeISe=lh$+_P&)ET
zCQXLDsTk{%^3(L4QJFnC;h`I`!VUL=-zo~t-e}c7QVmF1iZc$cxo;}+^p!i(k%1t(
zhpWkcHL%q_!ZaE}kn!Mk8R~l(TgF5Rp^~|(d(8nYSr|hQB~+h?=)zViivWt$_{MsX
z8)2%l9r+Pd%f8n7X|2G*Aa5xRT2V=nN0Y0>w_%tGD<ufAk(fknK)lRUTM>Mmdgo)L
z?Zkm{4MiKP-c+1~cGuB^3ZjJkeHm9fN`v|ER)NX5;3+;I%f2C&e+&y9I*3uMdanFn
zcMcr!Xu$c>BF4f<Xz@C2?FCvT-5u79<Bx|hW1!bYG)RHHBeZ!BHaD5&^X-{!Arw3*
z4Kzxm*&>`^rGAEmd<Ko-g8srRx@I*fTjWQMhIn`v&*r1SzoNk}E;zFb6_YU;ruhO3
zz%RuOXTLS!hz_mZ77Vr>|MgUEV}8UYvA}L%0U$W}Ajtc8v25kWRu$2+vqDI&*i6v*
zllC{&Xi~0a$q!I9$*tQevRZO}gXAeNs6LFVs4~*Aj$;`EYS-0EMmPq+O5`ifEc)Sl
zXKjoh_v>rx#3lyTpuc9EPC@RYfkYtE2x;E%y|==}X^mmkPE70+hhGJ|720ukCn9*s
zt;ls-<mbS1we~|3bv)?b3+S{w7HfwTMnV87j-yE-G!U%-JWDy#KC^ZDHuBYW2gge*
z0enhtO!Jd^Ws>fC6ktKiTy6+}L%yBXsd94gv>o(1_w5`XVo>SPH$6^Xi>W&N;Q;?>
zVUG4x%V)i|&+HEhBf$QzqLrsurEbj~`sVDr2nPDGo$nAZE%%kS=(^29obFj8-xXEi
zmX4{53JFQ)jJu{s4B0~B>~4>-kg_sVm3dt3Nx`6JC~pf_f9tSkJddO%Y%1vMGNDLO
z<WF;k6A(;BU|e<)%-b<E9Hp#LW3|^nZ0h>W_wx7H+dfm-AwiNJ*YtTK$30Y^V0vH_
z?9(gNhgE+$@b#z0?IcI5p#m8SGv;ys`izeDtH%Xbs#j$%4SW@u%T)yMAI@*EwrK5q
zUnIOgxc9r=mj`&cPB>2$zCiGX`d3~B_LwF6+re$5Fk8--I>8vBMvrbV%G1mI&dc2M
zDgE%u%CYVEC6e)EJ8yZr``zb{+B45>n_f?>@8$ilm4yoc(A#e2Y~e6-dG3c6U5zFA
zN4CS`Zo9S0{wK19YDc=!QcRO9ocy-E{;I<<l2HBo;i>0Zi3M|iyPiv$NS($;!84Q$
zRO!j?46J<xMG>!XKEZ4VJg}_(xCNcm4g%7|atpovdrb3K&W4ErG(X*aIy8RN&niY2
zo|gclT(DKl2g!6;^1O0*o8<lxXfI=_f`G*}Enc-l%<20Ea_x}+r3U;L8#he%*yMw`
z2Mw^$_!u8@8XD%;PLrmSr>qAu4L!+oTQ%+~qt%}irhH<eA!XnGA}5;FP*pq+0gJYB
zsC2GN7%F|cLpk#B5{q=f*yU~a9fmYOFh3X;xU?}c<s0Yyo@iUGZN|c0Kqy<do${2w
zDk^th76l4*0N4H_<-ExoN7C`=_darR9M=b7px|{2fuIUy2_)5&AY2r(ZlUG4q_k)m
z_t`btuayXP@lt2JdV(bJQs^g^0ak3BQDbBhA{l>^Xz4Sv9Fs_$ZY}u$riKbU+B&N$
zFBH^ho%NC-ZIjy|`73;(v%i@C#9<c!N_d}xx3t@1Kzo6Ic5SE%asNtsM70^@PF1io
zo}1Vn>}O`5(k8+~Whq=v<4&7|dc^{2D#Mw#3;;a1nSmK<S;NIqcg8*-0paXY)TFNC
z0vxJHsI~$DP+bq_>ulB{z8dJ>EL0sGUHDv*x`So!$mQt8Hm6X-dfxs2Zw3+K?x*!S
z<K2h%*!T6-A-vF%E-y?TZ9Th`+Lry)k=Y2LdsjK%djqd4o_49R;28kDZ#NURD5>A?
zoVo^7qr)qoNv+<}`h0Gk+eMcmAQJx*`2DcK`1&g>0D$Z9m1*j)1lEV_e+nE%+gVzO
zzDdmD|8ExnAF#lph`=(ad{;qd+}(oai|_zKK6(A>;+cz3YRk~Uhq*+3z0d5TfDY4Y
z3nfJu%<?+(2~+z%tl9N>D3ivy*WqAhM%vg`6H-ovz1y9$JEY$3#VS*7@MUtnGFYA8
zT*?OQL`quO@ONnxBuzyFs`NfUlDK+Mp>^5}Wh?dan13y<aTr(%m0Ttg86otQJqHtH
z|L6x@Ktsi%@*!zHL3lRs)h<|@+-x#ms>t?T?ON)!!_c{1RbJe#^v7G3@DBKzd=#r&
zxZZ+kYczZB#@=qZ3V&^3YF}QEh-{W*`0ewZt8OE{PQqcb`64$6*fDfCGWmVj_fGif
zXWjoWX&UOs7fXk9ph11?M>Zhzf9pDYt<*L^O>CQ>t<i^_gwtRHWH+d(@(~4o@xJ`1
zLg4j%dH-Z<ZEe1Xt*9=36xEJWA+mo-ZRMs$`tF~evf4(~I8WVD>4T~LcUe*-nqNTG
zsHw*v#9@>s0GM*iUo%n-Ti8md!_m%)_%-^<+Ey>5uHo-6tI1}Gyq<@g4nDg^p{w^t
z+EI<O*#oi_-+$UDs?53;;Rr6&fbc%KM}PHy0$41p0gpzqmF<nV=5O^`s2+~1x53tT
zmRNFdEL=Jz&KVz<^*q3wOlinhM)C6lOt16FmVW=!I3f;AR@qtSr|CBDjB1Mo;&!^D
z7W8r2niraHf`&MxVa-;IH$i`Iux`m=Mbo`My9gpj=4B0$B-89GHc#)rECF3BOnu`9
zb~Vnm%AR!|f}J6&4zh~Q=2G9^2HH20_tj7&dg;a!3vII5)X+XJpqfvN=gBW)Mv-50
zoWb|o?fqU8ibwmq7*)PZU^DC{;uL$0hJ4bX--I^Hu{Xb^%_${0bcX~BC}TUU_IIH3
zZxq2hD$LA=85trkB{~`(FXM%J=kdP)cV^CK3xtw{9-?$&V$<wTh@1c~CL<t@2i&e?
z$fPMQ-5(VhfuVw4``?A}Pw9HwT6?Zz=agI((<+m?zaJ9mzTJ-iA|z-FE|;o()`WtV
z{2n(eHo$18(6o!R*a~x;^cLK$&f4lO8V+`e&qUC?>|0Z)4+{(oWUa$}d00FindyJI
zB!wlYUHazFH+JMcB<bGs)X}MiTy<;BSA=MSk+*ysBh=b5^~)uHfcFD(e!qItb`Imf
z_=<+0BJ%w)zZtR}Yj4$GcSV#^A;q~J-|1Fl=hUj5&`#+*=C~-Ftj14BDW0$VVKt|y
zG=m?o{dokZ$};zb)<}J+ThY|xf?$2C%IAx_yG&ElGTQfe4>jP{D+3^Y!<84W(qUPr
z<-paKT<7f|^mKmByW=qCt#%oMF=BsFIbR>Sc-y$69m>OTfK3=B?(G{$AG(Qj-d2CE
ztu1VMj(?%zGqpz6U9lGn4B-phjQ>lI=4(_8#LTum^iwlS1W`HZ2S=hqp>8D;y3X)X
z99T&(UiI7KFS#-QoLbzo^vB*zAj#@OGHF277}vxBwG#MS<9|RK4j3~(l8<w`#<MV4
z0uYx<{f}t67zdu!K@TRrM-!PC&2f!DnMjQW=Od)zrx5x*rCK+qZ@*I;;m(q)Q}$a4
z^6~)Qy+2;0qzGR$ZZi3j{Vd-(OFX2PJ28f&-xfd!*qrgklaxGG4e+MUYxfOMPkw=c
z(|t0&dHUT3-q7&#FTYI~`1wwJlm%0<qz&GV;PiK1!B%bWUkpMGyPoR|w-#Wd5IhUS
z$-Lfm-rZFR{1-^}Os#8x>0H888l?N~CDc<xxaK&G54z7+;}vp3L2wWSO;p365-t%!
zDY)R5^><{As8PzQgny$&RJHU;<)6!4ALA?of8Syp*g5fgT3hV4WSBts>xnhEfBT_2
zW*gY=G^4?*@I+T7RwJjKo|F*P1}&m1f35(8Zijw|sy)>pB0Nc0z|Z%{ms2h<Xaj_%
z5cgUTl{bx1y#x6D@$#h8)t(6OTI3lqo>SU-2b4A)_^AHi;HFD$N#T!IPum`7)f0PY
z_=|N?fccHSmlS!G%f!4|9bTIR!M;T9C+b)oiquBJ@r9Y-A)8oo*+r|>Vl*2%=6bQ4
zIo0efNIwG66Drjnqe(Xu){j}wk<fH{O(k&9WHm0*3wOaSxnkEr!R4*@&0=(QxAmlY
zk*?Okz-eig@L_VJgYePdf1~{zpRZ{S%6E}VNFKi22U{VV<S$$M8no#F0Y@~MQvT+p
z*^adJ5df7|RB3?tlNHhW<G0TNKI8-rIlCkde2t<XNU`K~YjD#FAspYY9n$9BY8*D0
z$kF+{MN5`#WpgN90!eLHO}1;G@jf|t-f-524qrjtn!*%ye7GHCMwqT&yq%-^_;7td
zsz;;iVc@l6uGgT|ard3Kx;xO5IdtOwf*>|dv(dGnWVzb0G}n{HO(A*Df3y`aZ)rO^
zJ8tSMM6f9U-$++<r{44bjZpJ@B-C=G#;;y8!>d%#2ZNfJ<5IBR6ymUu(+-^+!h=PE
z?c`C>Q~&UTk8orrv;Ua3Y?BFnE!@#DMEu?2X!K)yBCmZ-13~kUyj_tt@FjJ2;b(Rw
z?5a`I@(X>2Vu?1PE@dv%IBmYW5Tis=S_svc#C*Ad>N1K?0&vyy2Zec>X#JGHc&t@Z
z|HT`P8z^b>Jz^v%e!F@J`mHn5>ny**vtCBkBLc$)!-*U;&Q-@G{em-r+vT}g?wVZ+
zzz;5^U|h`L!T&s)&<sI9P_V=WUKXO-#zbE=I=w>?^A-nR5gd4~UxG+b=zz^h6^Ej-
zGo)7sX8$ll)R%LE?E@%b8`cyyF-ylE?OE~b?k)GRTzfHicd!;!+z!hB)hio{?OS6d
zJOJC|!d<iy36xwu->WPj-zmjt{AG)&XYR*r3FdRM*mxQ0lc<LkfO?M^p}ZKB*ETal
z##*eCJuk>B2oTQagvv~~!YMN&2=V57>$*Cn+h9(1Tg^;#WzMjUdDOoChyf9TG=Kk2
zkGgjgcIX{+>``QESoSL(ML2i2sAQTQbC1`{{<U-e*5mc^*1Wi}N1&&pP2C51x%9;L
zrwe)<yD#8t!Isl|xFkJqCHLEZe?7wMG}GQ5Z%R1N5Ob+0dP+g<y-MGwM}Y9P@VMY?
zZp^BL{s@**wNUm9y74QP61xY)kGMe1EbgxVW4AuS?dxOzj|dp!t}pl1)+(<P2}Nms
zSc!i{h%f%nUgl8I;<rb($!Wvd@1Ak2(-y8hop(b;2-$%Y4t|8;m;b@ydQNjPRGzOy
zPQTIQN`8PPfVk+MwEfni*Lhb2zpNFzH8e5HeQQ4$evz?6l7DEBu?1AKWDSeCC27<>
zIn4MA<ZE8-bKl~9Df)+YUGg!fAyv@mp>tzo$-vhj9{e*+VlY%}BnRs)0AvXHmtO@L
za&mA;))VUx(ddtK8?XzfBAtfp5vJpi_xbVQhMckUi)Mb>%>CNMKTf{jw=|YBfNmM%
z{r>!q#P$W{LpFldb{zN<UrzjQCAQeAkCNs5^7q@kxlEuL%j0&UU$i6qd1;DmB#<Jf
zAX8(1WkqU;eW|pMue)VTyy4UsxMiSdCk)I_E`GiJj5%l3EbAQ0E;_?EmT2itpOtI)
z+~@gHv``o$nc_6%75j6WQljkF?<q$EB75S(PgIL*no<fq$UmJiGBSRz<i^GSU}UMR
zD=^7@(28{bsiFK*AFzP|b&Nx|_ds5#WpieLx<;V&hXa?RF0c6A7NMaMvHAz8$(B+1
z-JSi+jSCX9XxJMRIcbV>R{RP6bgVHDKkCuRM?5@yB}nv*U!CF43l+>|wbD8u<lrxK
z!B@kp>S|D@@DVnu+E*B3SUo#-rqI@7u8@d~h$o3t(y-$<h$gs-?ruhP2#R<%#0=Z*
zzm_|n&b6Gix>PR8>O8~&3E<O44fN)rBC99{_Xk_nhV$Pe_uDtYZ~TVE=`1DzTbgM6
z!KWRK{ki{%>h53}uSDV1nLe?5WX<a~r&+UrBMg}c`lG>TB4gGCgkc`V2_2;ClLvL<
z#LJ8oBUI4$2FfIDtK%q-8~#ReKHehV9(7)yo6kYxCDUnTeU+^HVUA@vjRzY39{<%|
zYHQZZuy3+SAsb6nmmydZH##lLOC<|NO_i7JdE=B1Dg338$Z#7rvFIVOT|(rS;nvj|
zOtSk;=EKY+ZIgIkx>wJhKi~Q*ae3nB>*BX&iQ7u_Ps6tVGWcw|_3x6+rPf(rRox0?
z#t6Nz<9kgN@_7qZthFY;_^kJpfc3v&KXV^30r<`b7U7$~K;cG@{B&y_Guq#tcbG!Z
z*3?*czhLUr1$5BD)~yfVbo9PCh^}4~D#AD*8N20Qy7_S-^a(%c;bOstr&*{8>#nr%
z+NfcRy^i^IZ2T;7<t`zdJgxZ(kATG7w!!Y<UK9b43I5=Wetw4^&4(9q+gBz8Be8^W
z<x3fkTa)~Y)5QG%4l-!<4%Z-Yo<8(xhzLvo29zJ)r0U^-%15G`6p9NFW#OS#4i*dm
z*57RURF;_qGL#dKFN88bo$X_bmFV1|bkO9Y=`U>*EKl)@_Dg1-w+zK8{JP!pOCfkq
zMW+LlMT+`(34k%We^gLN0WOuCIV<;G`Egoy&s*VwA{|18HW9p^EFgQZlM}D<0}Pof
z(AUw<&&VlNqx09Qe?|&Zp;TZf43({`%PXawm&_~(e<;rlr6;_baT~BhJ`%HXRof*M
z!0fSfYPAuu^8))turch!+Wm<eI6H?!Qf<}t2R46rTzTlq->rOGY>;yi^J|^LIRh&l
zU{X3wW6ISq>>@b71cTk{a-GkdRBU95Dm}aKtTqzFlfofiCdTu8x5_i&DPyYRvA|L-
zD9cMNa13dzvb1&}Q$JQW>QC_ZMBL&+uW}ylpNLjFeHS)ia}pJ?G(~63P1V<BJ6ymV
zHoQI4n${$g2m7^FrlTwFdE=R1QPZmgf)8~}PRh19doT(+_HfDK%3}YlU+^2&^FkJ)
z64XEoV~=V9MGRQtw!kHXqPL&+g!`%wIaNIA_TL<D2^2l27IFOU=C0^4mbdBl#-GP#
z?n|uuuQwf&E;mBf@!Bl?;p_Da&!pSPZ(KLOkdF2;47kW?WK9vm`UorOj`8b6DM*fR
z1kUn1FLL|Ygl0*Crqg`%KkY(t10O*0z7Jh;M8aGK9+P@!fbgwkjmMzE;%LX);CbT(
zdY^u2rOKS&RQz|RG;n=@ryNJ81)!^|f&HB1wf3C`!?{(856wm`v3ONJwoUEYXYD$X
zWFHI6&mVv!Mp~AQK3nq0KXYXtnzG+NF5PEaOz@`F3OOiGWe(pf=-Ae_Sl8KG)h*n=
zNWIUa?9MSlBiyf<99Sb};C6Oze-<HxeC=^l&+pXLaqWtt&;xz1{+-&fu#kVs3YZZ*
zFbC#HM<#V?ds7pDi&Thnb0JO{cgs37OyzS5kXDOGO4Skv66>Xu<S7Cxe+xoRqR737
zGFqU@v5`_qi5nR1>!SZ3UvC)}W!SZiDi#6~A|NdwqNIRy2}nuD&?C~F!_c83A&rzs
z4hRh0ozl`B14DNV%>V<;ck{l_vyc5_fBT>R)VZ%~UF(c>u5OUX<;1_Y7WC3dh*lZ$
z&njFWq<OhSdOzp#-@%JJEc;A;I}%Y*Z=`ddGe_a!7xpw_2ODsq9j{2(P$I#~@dKv{
zJaI5L{idy1B;Rw~LHsWTOy|J^FG{Z*B>jZ$EwMQ)6A_+L*VjwQwKm)_Wxfr4tiElc
z4X(4Hroh$Xo9x;X0@}56zi-S5hub-CA^9im-VWO()m*;!uC*32-7pn>17!ARXJ`%S
zf=lBrRyQ6c<?4;QY<uUKb;zC-AjBu1@%bP7`&ndbWa<tHWyy~-)LLPPJ2d$6ldl&S
z@$Z1hK+FWVIlA}mgD{VB?#@5xuq8({PrjQxIzk2Xf{!Ts*@)k&=0zZXC~hYXmzs1E
zSKgyo*YzhCC{=VVX=A3kR#Z~@W4$)vVf$v$18-wYH%PO)IwqOFOJ7^}W6~CEVKXvY
zWz-E=s|akwu_%}O&maDt)dC~BTX;7R>060;!e1z0{eWj*rTgFjm#eO+YUr!>EO~3`
z8N$=YQU3ZxVztlf*>v9vTKj7ezPB|%+7>23mMB}Cr7uBgHcdx)Y{5t}+39g0)5eF0
zm>6~XaQ7AasHb<j)b0_&DAL_=z)ojnKKl$;7|$rNQ}<gJNc=#$>y=&o&N|@gg1r>K
zTxD~edz1La{o<sF#kxXy60|PEcKD;NWR%<gs-nD(zS$>fQs4A957*nn-_-Pf6pL$l
z-&(I>elFwaA6!#^7Ycj1=mItr3mf=6K9z28wQzaT3igKqQVg8}ZvwjMGU(9^Ojp99
zmdL$K)6vG};PAiZV5og@nLgk3$?1aYmiE)|brS&V<hF=G3gTIP%nve7*DE43O0dVV
z4(XI*`J2I9MvS!y-W<0LOZcsH{{OYQ0%%y6rc||bqILcXAj4_x+w6EUk+Rd-Py4zG
z7(b<aj4+hHyP1%<$T&!skx^3;aAzVvv(Uq9u071uH0!>OHt5bWd%uAD2@lTKfk<yA
zdCEb!Q#4=w-N(^?V4h#|3(OM3xHt_BM79Z#de;#fYYF9=6CUW_3Ds0obn4jF=$Jv(
zRtpM@d!i1oDInxFfv!v5!<zqpcUJUNJ?NiPzdL`o6=HB_{(eVZsK=KO;hDh7&ep(p
z&*VN#oZlOJIOAE_)#~|<&J~X)Yy{Iu@Gw7t87+wb5m+Z1YEph}wTKL}h&~!Ge{+>O
z@4@`IwzchvHg$6|;(i?Z49z_^mtk)*=Z1H0&`GST-R|bCfer0-0cSfaB}!L#a>0_T
znM!i}Ia@+QcR9K&)HwZ~?Gug-tk&H`jT8~>%qU~M){HX3TCVoM8I-PWFv#?TXgQO%
zwbg}lrl=OP4fG}dkpgY7g(%NO>yxM&iSm|ZV%s^J<0qTVBAj7Vs}IhtEB3|}A@|+|
zkmisc*61u`--{A7&^vAR-h0m_<{QSth4|sbsmz7wFP)K3&=)9tN671>x?JS%D+OdC
zy==Nh<uXKlMgz9jTmW>ISF{D>tBP#c)Ng#<h}-k~e`H4~g{%K$GijoZ*8AMYI9p~v
zCQ%f1#11z8qyxMiV91?~25RxO{fxiLN@o&wkwau4oyRQGTUVY(DFvH1!A5F)D~bUt
z`?va>zwm}GPWYDD^9awZCzF3l*2PTow)ptxlGnKkN8-hfhMP9aFeRe^q&>&%?2}&R
zMDXdP%L2ni<$$<|`LFE8gZ+PtnE$_0!S}o`Nh0~w#`5gfk<5#rn6$1w_0>3dxncZ6
zHHy|^ehp2Y=bW5VuY#NG@4IBSc{nvc;XeTOGuZ5FExZh<V5QL>z;UP<mZugBa$>hO
zwX^$<G)yeD&A)kQ<mW)S;PcMS@+*X$#tak#3}y=H#c-$xh*!B!lFsQ3FtQXx^YESs
zFbrHiI;j8Sgok}$;&VJ-sQm9XdfxlCv7n>PCjU=3N){+9NrcsqW65EwT34&)m+XZx
z3rH)mJ$?b{@Qj0&V|*sd{jAd4(}gLTwEiv%XO(P-yNgYjy$~dEVDVt|VQtNaGFRaQ
zp6;LP`R_e<b0bpvX;=pZ#B~nDd?g2@m|x-^JVRB)Jp2r54anbl=8qH<xKqONa?{ae
zl7C{PHF`de9AlAP@hZ?p`3l-+yNdU`jv&i|_m0R>Lco+-pGud<TPd<Huw0Oq=C?qy
z_f9^X_8p$@GV@vUtp({19D`E1g@r!?fe~y49i9SBjJ2@|E|v=6Y`6Vg!B*((Al{}8
zc08%h4Y7bYr&3hJyEO+5?-MN~Pa0TO9VQVvBGJRguDyExpz3coqAvUKy^ZpucbRci
zv^w9g&`G(^dB9lNwyl9In+JQ9=pVgqOLmXHynV`|VczMSc77ez!hLZ0eQ4=v<X`Q3
zky$0pPAtmF`o_@2__gZk8{EsIWO^M3%!1u*ld#rUcQX+3$v?H_`y|4{$efmIs44zz
z2I6g=ruoB3_IfMv!O1@MO39Ji@TyBf;^iM}re~ikY$8(gnkD^92=2Hbulx_MdAzk5
zE^fy-N3<(u3OldP?;PL}9~X{AW)28|RYl$zRI}+U{Gg&bm6iN&T8`xG=H_lr+nd=p
zeMq<V2d)TuBF*&&idXi3HS{4_zOJ2%&4}3(A)~PpFDH=BrvGDLiFLE7o3(vbaZj~@
zz0y8*#TZ<#^YpehEB#+<v-Dj}cP&9Ja!{~(K}CbBn}DWK%gy>*{ec0_%<vOKOOemg
zd#B3B@d6CM_74xC3?FKJUG)cZV!_WAnH*%}6Z<QRQguP&0}fSUyZQy8pBLYpaeotu
zSchd5#3X{YM)(p_Qe<T=)*~&&n)b$#vpKUAk6D93=8~}=?zG(TA7Bi-J7xC}9D(zK
z^PT#Gl+-0xwp-6e*{vEjZOz4zd<($p#2p3!b@{>Wqs<}ZyRBrv6zCm2<q}tk4`!8S
z?!pax+NHKx;E{Qxq<!l4ewv$bH)3KzZHF7eFfh<-E<bxN!iB(b5@?ZaLEsqjE~Vu~
zpynNHY#b+FVI1u4CGZAZJq&u7SDmL_!}ZjKr-Jflgx%WxaUuaV-X1<~hLMd`oBQ9A
zPf4!tzrg>Z+a~njp(mX!L1gSRH~h4=;=eKX#U-3+zEfEYi*EO>o7Q$LbK9+3J$Yoo
zGN;1rkOeWdm>_5;)03Kbyf#qTE3dc_Ot9+>7fQMLCq8n!PHJ;gbi{yUcw(OE^T<!(
z-*xk8XWBLz)UA`y$u!BGq9&@_Bv5e{dA8x73h~C4#&6u%{}qRdIM#=#h#ObmQj-96
zsA!qyo?4y;1Ukguq&FSk3D57nJb$bpA8<$Eg)2!Zx(gu#ZkUGdg@LE$8%&IL>d!dO
z<}v!E=yErmH!#u{snO9m3t|DWT>W!fdrbl@6(WQEzWYdT)PCdRq(&@e0e?uStDXZH
zv6R9hpzp7Ian#;Dmip7SOY?BC$X$%HX5sn|yG^x`BW_AKUXz6PzPdVzb0w^}!8h2>
zm`wTAF%98{-_?@;t6uWtVtV^tNzB&AFT9pIeY--(+4Wwq@ku^;uy5=;evY5O4ok&Y
z&vAiw3eu*r<CFY7>=pap0?%wszNXT<4GSiDxSRd0j}-GcrM*XlZi=cV+WE^sMenmJ
zBXrsEn4$WifMeavLzk|9!F{#h8in7rqH`(xO?w(bM+Z#-q>ruCAFZUKg&8uS7qhAh
z-Y*@#I#_OKyrHd3g6s0V^~2u8!&4kenzruNeQx9U8jNYi`rO=@mLEQ}eQ1CD@t%~9
zrOs1WLB)==TN1;UVLskDF>Y2V9o4uPg$~IVDIzv8dWgn;c4t)OFC$)Q#HqCHkDIl2
zpT1TDexaN^h;?v(vZFiw=-LuA>D;Wd@d3zUrg2e(2@(<FnQ>31zidz><t^khHhv&A
zVu@=N`aA5?G5P%|Dcg*yO}eEIOCu@ne9-M`#9UKf@f7RpAzr>80^>`%5`9Z;{JE{y
zr;zOQ5;d4Z`?j#s`#U)Q`4>|1@!b7h978DtjdDW4V-ie;I#Sv=Jom^+)F)`bGYseG
zW3vVe?Wz96E(^?l@F!hykra%1C8NCohZj|1cRY?E9q45)29ffeEj*(-on$g741hFx
zy7aqGv%29upw8mMuAkM+nGVTb&hNC~xb9YK#K&TFmT<7o9)x0$Pf84fj<+&&X?Gj!
zg5xSB@$s2)kUAGS@Jc`|p35!IcQ*ZLbo3nmHs!R@tRhd_FH689<rt>uwD^4@(DO2d
zGIOXpL^i`ggj2(y_E^8Oot05VoBf>t1zfY9qZbpWkmN}`&+=t>0>kIlMnF>kss?XJ
z6iYAUbR{&Y0-f3ArY^BZk{6fN*2-VTogImNR8;JTIO<tXztEe-y<qKa$D*DWFPJ$R
zIF4Pf<{G^+XaF&c14BXP$ONku&7tNukLW$qs*)ip5>mx=yIMQduKfAKc0H`K!Oxzh
z`64_nHr8^pd6{)0t4eb|6}MbS)~%%F_Me7LhCl?j_c1+UHJ_e3OJE7NSMwu_tKpYx
z%9Q-?gr)=*ys`K*#!)MF?LCeQP3#5Xp*K12u4xU9{oF@4j;cL<4kx0tC9|NV&#AMZ
zWWHMy3gtt8a}B)xuP<iJb6XsYkqPoEYg2Q~iP&RQv_SUErS_m@s_>^9zaF}u>GU^<
z^u2SGJy-Kl+OBsGB{I4G6Bb=zndvg!e0hmkU1oFG5gx=!L2Q2==RJGYfd!kka}Y-F
z`(Gg!%%_fRhmfyC_DjvDyl3&rq)O`NQL^l`SJyYg_uLbMQFWtkzbp~N^}-EtxZqSU
zeR&@NaKe(7P(Rd3>b)|<l^6+emgdx<Z=hfeqyo$cXG2@Hj1vRr%no??aw>+24B}|(
z82^Bew+Jk^B4r~sJPI!y7n&r0(3M)zb`O;TIWg2F_fZ$9kxL_>Ax_OoEFvO<<ijhx
zzdy|<r-=X9A|8`?lp<oprT@@qe8-qml!)qWIYy1Uso2r*Gfm`9I~{45l~{@uKUYbv
zmi8vSy-QnUw=C}a7ku}L>vMwGnqH~gf!Qt-@Qz4Z=IUMgx*a@`_#GCSDElM=i;mSA
z$jyPt+EDK@GLjMJMfYsMI5RK3y*{7pA-ij%&xq_IG1vW`6@RKY&ZSJEQs~4t46aeD
z>%S^K7sC%`$XT^Oe{KGhp2B=&pBNm@5v@t(q2R2zQ5`%fkfVdI?SC>XPa<WI8{?Dn
z7AYo{!OsY{n}yRE;@2&z(qfRhpf6&`5C;2=+%vMGFS=;vWhP>kxID&*uVjZ{czVU>
z$csjH_t8;ErjfPL@g~LL+!HjfjwM{BczcsdnH_HM`ckhvQ1vbKU&<Lb!*}*e>u*cj
z1QRKMxjaLe4UQs?$;$BokYmq_M%6p80<`V!cS=TAWe2js=7U#tTa&>>srk|B4<bGh
z05?a#OmRn<pLH-l{rbly&rDv3Q|4bL!dXRBgRc~8P(<F4JBu%a2+Ep*-$rh~$t~Tk
zVxo)tG-*I&D5>GSip0LK=UHG4lZnT1r-*s*9)DPEIw}JP5j#}>%4#8oDX5oTqLFHx
z&QV%W(r2$Q$~W^&-q+pLwU>0LkrUf^c=uw@9kXD<cuKN!#wG3{%DOR#&($!o3iVe*
zv-YQ7cQ;t91p?UWpOwdTQPk>w_or1zSwwaVN&BO|2bT2q_e;FHQVrljiNC1Hw)=-#
ztWv7c!Uyj>*G|y^8md7n$1u56$H7E_Z<jYyRhE5kSf)FXH>s+^$2N7x^SRfK4QUe`
z7d4JX2{36!qoG~lo<OeK6L0l@J@Lj!^#P6D`j-u{j4AT(BwF4-jFa=<Fw0q=m^U`$
zr5G$FOjm*xgwliVTjR5Y{<8NBvfbIViro$zD{7ejo<B*eoVCYG?7<l*yzkO4)7E=a
zuVsDSAU6ThK|<}-hsQ!9`+}zVW$bM2@?&z=5v7<nVdZ`S;qUl_xdZCww7ClLJij(L
zTKlgE@3P<Z(Y<5${Yx<J3)fRMZZUqc@5Lx~D?#^hlL{XUao^EiQrgz;1>{3wVNK`a
zO+a`^&&A*|jD|XP%c8ae_r*lh2zjr(UY(fMpCXgJ))1LLMVtlO)l|<}k0$-zCHzj_
z&bLsl3024v+sGNn`xzM-*=p>=C`~pYi}ChC6KcifGwLMw75Yn%EfR7s*E1e_M)H%7
zbG$X_c({YAFKn!LmwkGsPn5&WilaQB%u|vhyxM$-n+00Tmzru-gH@-s!&3YV5-LM(
z`kyfSM6NA7CNm%UCBSQDMCKd8TTZf&!}yz=>!&CFhF$~b&e+i03v~x1xvD8VeIGH^
z1GDI)gv7Ef`QqS$n~Y3Z`iWt-E(N7~oO1ty(|t_$PLMkL@nr^%Cdl<O+0=?bB>Df;
z=DbjPze_Ox^wk|(bi;mmMB~YLOVRA;jK@`;PEQk&xFv0QrTdTmlFJvyatgK^bdEl!
z5k#w{SzM*U%9pv#-43Q}fh-PZEl)5$9fuTs?NKdHE2B6?O8SOa*f^WE3F`ni&$oI_
z_4DNiMh~kV@%sQ#h%Spu8$EH>Zue4Jud{rOgfa{f2t;<VxCb8v8Q<i<<;(nIEg2*$
ziZHyLh>nG59xC%0qOmYk@aZ*aakJ(t@ynlj|9H>6A+>)exjARB%{QVm7JU(IdltwX
z!Y0;wqVOXA1+{tqV}PXC!N3Y`K<k6}pPJUrvxuT+9qU`Ylqw@&b0$ouMT|Dk9c^Ri
zXG2$1nafNd7T4}<&ii}uAm<yP<(UfJ<&kcUmzwI&Fd2Uj{HphU9EelnZaxT8L&1fy
zf8(=g-AQa?NF4dU6FbUQylWuc&M!{eMp=iMJyuJk9GbOZD%2Xu<X~mf=5ZJ9YOxC{
z8gi}SaIk&`rLU5)E^*mHvI)zT)CYN5%%tRy)jxLC1M7+a-~T}vYbI@Oc9nw7&K||o
zJJmgwNh_OTUVmb|o2SU8bQ~rvE`h<OvQOa-hGzFG!*+4>%{BG7Gk2E#(T5&S?&AJQ
zxFa<+ew2+qfBeEVA|3oHs?ZwFhk~E^@Arj|rE@y&RsIt03!&y9y!gG*!yx<NS?AGA
zQd+FAMgAt++n;aVgVYm48|=6<3R_OLCc3Nt@!7MYQurHse>*xGmyuYP)ba#C<;JE<
z;p*#CgG7iz&LY1<qawYa#x8a_y5}RIS8YNp6lBkOhkIdP!E!z&$2u_up<wC2P|HWB
z^v^5K4J3>}kQ{^5CRg?ZBO)15p}k8nKcMGfur<(9GaF3Wbo@Eqasl6L;^?T${D%6v
z=9TuW<n7l4<|3Z%5JS+WJ^r;{UOFjRpDZaq+6?PFBFuzAN1Y0#9JC}l|D%1DtLX5V
z?h*p_Z=Pi|l35Oro8})`mju3`n6B0%mB%pKqtML0F*J2~pdJU?bc_KuwJ_--1`Zzy
zgK<`GTiAw?Mhd-mXyE3KNhmV%PsVH4dSMa9O<ly1uIx2l{l?y&m6*D`_pH41)p?Gf
z@^W;`-YcR7ZxG_>5b<8(nn#a+0rhrgLuDgh<@cDMpJosN9kKJatz&u3)n&_PcP+BI
z{AoVDGK?R~KWglSAY266m2$IVAi0O6rt{wB6GFxHWoMf!px1wWD#*$Y)en9``8rFM
zFt%#)IkSjeOOjnFYMTc@0y4CadrbO&bNnpf&zq~p1qwYPlrRn0$Ud_xnD;}s)SqZx
zi-A~w<YkEH!2y0|<XBlp9#-%}al=tK90`UFuC-V5O#KePI=BFW-M=R~>6FgrdKCrc
z*?ey0s6+w>t|noHGoka7j2mqIUe3{^qWgm?47F5UKOvPaLyIrET(1+_x$k$g(s&X+
zJTWuzVRL);G8$|Fl-~gYch&GvV2iK0*;DSPxN91D$kh!>cddn|Yus+Xmy!0FAF$E&
zK8>7A`$4}n#b&lG05gr~(+DTV;kCY@lDJJ`N{LTMn~ADPax&RDJvCw^1wWZ<ekt$U
zE2(|8^w_yM(ey=LDiUkyF`VPIxini(iHbP5GdP0zH-*6Sn)$`BBP3=s$!HT23YwbH
zHBG9^$Rn&|?X8w6`RO;B>mF!NYES&-JsxmDlo<@`RYHIp^ZmelcM-q}0jv)dN|vYn
zBot0RXpQIMh#J7hR(m-~NCKDB*cr40RW7}Ea4SST(k{d%2g-UvJT`({timOMH=|i^
zqT-txTuu8y#nPN%Fm;TPq~9v_qjn*d?v>>NDd58+I!2K!Jf(B&|2~a2cx#TA?1b04
z!(`?PXgABzY)|M=myp*s&nc(5<L=C+hvH3uO6in09~d^}!J6~tFVT<oq-93p$<}?i
zGgTwBfwiOdG@lbWtHKPS>AEz!6M+W)sKC&#vR2#lBIDveD%k?w@a9rIJ}l30&>AlO
zhBW(-<-AfvxYU)bBx%p%k{vbv^!?^<{pOSA6yX2An);ZvR&ztdps)<ldo-rQHO=pt
zxz~EQ5yIK+fDd)jV(Hcjtmi+YY^-C~d+KxVv$644_LLhKoZ38R85rM*@lT=C@45Wf
zK-8C$T$r49@{<R(oS?1FGT=GEr*XY;+<0;62h?2}o{7A7@y_in^gkh7H#$8Gs7rLG
zOFs!FXs(!=D*3msiOlSNQHg|q!|urxM;je|UzcQ7b?gQHH^*o5=G`1?6PAwnGx40Z
zC2j5Uu(rz)+1C1M=hqV(KzDWdy*c3FS>oS-OGRv`pY}>jJ|)C#9MPcPAhB`6wEDYG
zrOIJv{v5NqRo)fk#=QeHW7~b%n43JmB2*<>+2<3GucM%TXj|!ga_+kdBs~7GL1VAg
znE|_NB6NX;u2GwCdW!S&o?mNNNh1q}&P5iTQ#>W%bC{wUJ~u(!9i|2yIbQL{`gS5#
z9?|=9%<j2WLT7zzRHK;)D~4vgzJyVe0PU2=|D~Oh#aT+I=HmX=*Q`Kn*!4@J0|`|)
zjU;w>c`sbix>?ciqwTguGQRv@cjo-p&ck2gBko!5E`N{^ZTiCN|JSu5+`OU1I&h=B
z`QE@${2}<n5SB&IqNm0?X1HiyWx;LL`g(`Le|C_gC@g$-doDxy9wzFoJJE)sGLlBK
zU_E26%!wdz=e_3s9NkFRleQnft`+is)%nk;wZFK@CTag+4SESnuMuqz{&MI3s2qSL
zE_Hb|>;Q1l)z$aLI~XDd_Uys!emwJ=Jej$P0)f0jzGTE>VWbiMEU(npKRcMc{rh5c
znx@eXhMLXQ$s_5JaqBEQ-TA{$X3Q#Q(7`yWJp%V5#K|i6`4X29ciC0?Slo08?ohgo
zXB(#53HQ3|KIsFtW^5!?%PekUB}fr>uXiS^Dk03YizA7l!ihQGftLyI<iGXu+rzQe
zd%CN=kuH->B3Ez#sTS(CGr5cP3lzgQn{G9}sUb<9P}c^7?A5IdBZ51ZZ0vT}3=Lkh
z*pppEQt|Vwld0L6a=;Bf-|u`<t<3#6pon&OlNESBz#xDK4;$w5%=SKrp;+4_WziK8
z-OX_3IYf<f&e+omDo12Z%_!$6r`yx+b#tXB^6Ai9BNGa{S|UZXU-=$nS2awfH7L8y
z8!PTqYY9wF^7U*}?=tXJo%v7wmtfLNmF>kWxb89>P1HyjbXyl-CO7hJkiY)Ol8Ka5
z9nSNZBb02THc~y~453^9Chc#!fPvMI)eG0pv9n}pE!V5odXA|e9jh?(fcpaW6}2NY
z<MhD5K~Pmibh24l!id_@Gh^b-#6nW2v#Ow%|BOX}^0G^mcFlBqRNe3b5^so0)VX4}
zY<8LqVdp4yN)lmERMcWtmA7&R;cDg(m_Lg4xkhrSLov&-0sz_6EjuSLo^sl1)!9U$
zR4Y^5wDmQkY@EBw;jCNTD4k$?ap+;H|NhtHhe+b#3d`nqLs&+*|25r3qCH`Z;|+EH
zM+tl*{}Z!eZdjL_x5zEi<OGcHXc$oYth8>9WMvn!*T?Ipib<CTyx+Y&YJ=fSH!r^o
z$7?cBKmHDp+cOY;|1lIJh!^(BE=j~cl#hihh_IN(9J$`nCDZkz@~_}egj6ce1UK)z
zTCOVD8-!F~E32BT_hur$7{!UuTP+_w>ks)OvfjaUn>BBzX_W#qy*>?;JpSaThSb0$
z%DFqM26jUV_UiK4c3W@Q<dXBhKV5U%f4^a*F8=P-p&fdqp{1DLP?&(;;2HTDk0KRO
zxqapn9AbGAfE##&qgeBp6ezK8+bZ3O2TwJT;vgWIS68iOc;lm0UqPm0-3hNsnnQ?F
zpViLMQUHc1(wk~2MWtzZJ>N+yq^5R)b2<$4$DY(Dapz*Zp+qTJlQ}h&t=K6;MTF^L
zks0Teth=;ct>FY%0Fk|L>K%2K%~`p`sFxo2YDGne>$^yHq{JL9Eq?f7jQo?kWCaCQ
zVul^8ZWGPpGa&zjAUv^__8*2->)ReF)N4=TW9F<utNA8VTEW8acZTE);8_KDKBN&z
z#}*2<$=An1m7{YVYHGmKOtb&=_AY3=PR#uQ+=U0COO<SEX^+yX+@7nnT8OpEMBv+Q
zXS=MGO@@1;Sz{1-^x1~Q**M%}p)<>?D?|y&B_iF`Z}R!Ck$Ol0XdYU3<qvO3g2=wF
z@TxHp5|T~hwTNP<X)tehz@)u&Y`!kzLw4dfE7fHc5c-TuaK`_LYBn2K0><p(<xmZX
z`hf+H>jBcWMnwRHfR{WkOB{dT@x_wB?nfZp1=Uw;uT>MK7A|{!w}mVPto;ivNmS-H
z?5h_;$U^C~ADI~RryivdY|`t!b3+JC{VQ^R5LQEk@Tc%Rxv{ka=Qb(J98wrLC;ObO
z5gB)DZ_MsX`13DYVu2yU_*s-6BfR9OT%4z6J0Qc&pq<d0hGoAAD>Iy9Up*&3?|prf
zappmFi>)q}au)&!i~ffOb6v#Si;}pmr*S)Zz*c#&(0JS{R=&q?dgUmF1^TFCW{Ypc
z2fz-m;xsnv%U9or`Fsm0{|Vi1`!W46jwtcU#}ZttKU%FzK8e`p;oQ_SOR%Qjrl}?2
z*)l{hOyK7iN+~zt7D3dx%?n8e12r+M`vTL3@~l6m?Y+C7S`#hRkG8MoGIlG;HeA5$
zNi%FzwzUf!3Pyr%mTXl{S2K`(;UN{!e~fx_qt7apWr{~8SqzKILSz!3KU(~KDKrV`
zO3x5(&+p;WQz_UsD~POyNeyXU?~(xBlo!zWDHB=B{zwJ7iRmQs%aB)0=SdVMTj-ye
zPnoJ+=Lgv9JA7Wp81ba2jp@Zw9$N&tuI(<ANVzItbfv-KmQ=FU)PE~W{IY$0i@%MW
z6fkzH!7?kYI+I|R@|C{5g?ZZCpF|n$XFanO+Y4;Xq4uT2Z?ze$;fA2sf-Y9B0*x2V
zCG5X!JDS4UGd0VA36R2H)`Me{#Hcb>gyvz|m~>$8Qf>URMER)u+L{V$R|OHnwcP!d
z>fM~2><M3iHIewLr_afL><sxs-$gQ?R7iB-9)bv{mEoVOdj;=33hlh^&KdjBkOR}U
z8E7X5`oz%npYofQS`s@jzngs9Ld~Iy59<SEZouu>Gqh6X1is<FmAZf0kN(vxU~Tpe
zDior6e??4IJ3zd%@Mu7rR$=zl2;F%gJAF3iPj%kT;x8b==`4@&J@~f>7gv39AC8FU
zW?AA|T*b|sdRGjPE6ph*GXmbYyy;#rk1Zm4*V4lNWOo$p7p6RwNHp*D_Km~A<lWKf
zbF?YfPhe5Sgz)nJlB`q?$b|kbAZS$yh)wmfO%!oxscSrJqrH7S?h#7NZk%uVFI-=s
z_l;uI+2ky>My~~DcR-U!aE|r>9-?x4Gk$f-aZd^ig@B<=&XfB^UVf@x$9E~|UT6_e
zy$B70cI`5?T=DZ+4c+!&A8IA3*`FBL`Pcf~fJ(odEKH@dvCz6luZ8sUiDBAiUABd$
zdK<R`8Da&!uEbr?9Esn7&QEGUkJin||K_Z;dt3Ipsl{hnyQ}~8xkY`2%5{UGcjp!f
zCd49GI#Sdq&F3s41I*Io++x?%DGS~!DpE89GCSiaE7qY^7e>3yef&qGn%J|Jfl$lu
z#d_)%uO8o3C3(NOo#&F{&Vvgc>q{QtQT@Edvl3}z_{tt8)whO%3snzL+S=L_$9LsW
z?VN9a$yb3pgm&cwj*i<Ib!h;Qd~%mEAf(hfW~riQP_FKT6~*TJ5hE7}ul7rGCaN-8
zbo&MuOv$KG-M{G~5#V?J5*jHYJgf6LYeNeHX*x6okMLF3!fQ@;NSmVh4U4mz`m)^>
zRvT<)5&CAv$lYj)!FPvr>n3%0suNWLNoA#O2_z=dv=v$eC7B*Lz<WXj9Hy<M{?}!|
zdqO2rp+sLcEO<FVX(?d<Pc~0#pHn|Ym%ZU_4+#mPB2kZ9W}8hJL*}$K%pC6tkZ!qi
zlQrZ|^B}Aotk3EkgIr9sM%L9<QsBOFc;IEj#0x^QB)3-tiAKQXBCFu%v@tZUM?}@r
z?dT$<A2e^@Jbxl5#%Wm0s-|VxZ^f8GosIPnGkO>&g9Z=zEB&zquls3NUCU~U@l)db
zl^1$h-(;*F&|d=nyeGRO*n71bQk^!bqA?ApP_?9_SeV2GHkena$_)B?qkrft<!#j5
z5R7hEWx`8)-0yv0HyH>#<<pq5!g>euObuz&e>h&6EAG3D`%%C0>M1L(j&Uu=IEVJe
zN3+`>WJYsGY491qb8XgCvd8#I*SxhLqLrlG9vwcdkWdIKFdtsDwyIrDcklaNuwNM&
zrxcR_{USkq>P`!dFUqqoMY(MZQ2Z;CLs{NxCD!T{h0TA{z*2%xvBvds&9&BRx5#tv
zh3V9&xG3@KNkmf`>4M);Wnr1Vt3ZLCh_l*C(#FCIVBIC0FRR9=*`S&lL$OnB#y<~T
z7;{;s)G=rnN9+g@b83HrSQeD3MqQxBa?O!dI#1j^v}VW4G*d<FoqHb#_p}s?%~t>0
z(6%#}{N%1Z0t+P~jVNisbh3jSDZ=DdLJC%PhFY4XtBJ`zKJ3cf7i09F@kni5hcDQs
zLr;}87KY94!`5L#Pr}0gYNYKpb)TuDNo%u&HTI3?Tw2aAyIYl;(Y8h0AN|gkg?9Mu
z2?RF6fGtO_44tHUOs}bL&~ovGbt9i{YS=_2>{GnZNZVjC#Ii4B0*dZs)_I8UNZ+`F
zCv>&w3`PdI^h_o{i0iZ|2;W2qP=5lDeh@3K9Ii*$9Vs2h3ErX#$<5!|a|G*mZlw@Y
zy#%pT&AhyH+h(T+3k<nJaEyg|5LnjK9A;ulrpx(c<xeJK&(ELY#)+_7ZR8b`lRaN#
zI!wwoUnN~=-GAh}^7)oTaSh3r1Pfg)!znfU6m6Zx7kfh`E%i%XFNh~s#;dfDiVeY^
zeDGb(Myh*5Ni6b48&M5GzO<ZEq2&x+BvpdDhugRXCYoYKQZkXw45Q7N(4;35QAJ`Y
zOhu@L64mTy6!8ec?Aw;@Rxng}_|aW~3D7vLUyn`3gidL7Sm2W_<lzn}z#Ou-zuDl|
zgobFDkq=sH&^`ox0TEj$>_tWrrhnE;WFjJC{WfO4o<$ZXqhBsQHu!zpDNiM_Iz;Xd
zcuJQGe@DkPpv;$O_|SyREy%#{Q|Ib$$3G!m6BX{xj_C!Kf0~zP#JdIm<wqmP%kcc|
zegD)CyfQnB(wnYO3wlDc?Z4Aw36-8m_oYq!i<8p&eS%q+)&>MGT0Wbbn=9VOZqMiY
zR#6)7EGKj}r;Ck*8lEoPgI-Jy$yCC83qFe<U@Ea5&?0R~|9ZxhO;O6h@}>I|+05A*
zdg3p@n&vc*h=Ka}h0#nB4;LJ(X$F0(r6XZrS9$aMXe~Hu79axbqwcB1OwC^n3n!X|
zRu<lKwG{=F=c7d?E;ri?Y~npOwhv$-#ZXfN<=we3EVIBB28P|=9MahyKkw+UjUbUP
z$*@N_AzSF;j=7%fd3gYAYjoJ4*rZn>HFZggXJ(4~zk$hdE-|b}U5BU!?S|nASKVR4
zqW)Gb>kAO@#;eH<F%(?!jayutrv{r>aPI`o(d`AP^^NTurng{!*_AKpPZr+@qjZx_
z{w7M!PU_i`UF=&9-LL8%b6S0z7*bC$yPQBh7)u%@He78T$Pca5w%loz51N*UTPYSs
zs9bEFwlbJ{Nm!zA^lVp}!nrjL+$ZMd=rklYG$8}M%_bIbAzK_S3E!~Y>f=cgh`N9o
zRHnLfJbfWLK8V>e{ttzbrz#N26`o;ya-5g08SwyrC*1o0rA@xwQ!v;#LyilsC|d5P
zz(L)rw%2_9(*(rz76fAVEJMBs|H#jRbC@{aRMMvBS9>1kCas<BQg}Q((>XNu%MVh~
zYhl#@k(k2q-`{-2$N%WVC`+cB53$Ux8_tfJthRtWGC4pd+^n4FC6?*r4gviVYh$X2
zzYUsG+hgy(`r%dJSOlg&lu)rR)(|C2(<dV+R{Yn8oIKEJYES%PzNz<5rOqn;C^9OK
zzs^k;!bj2fC>(D`Jg1vOEyngacjaJJV>+INDJIJZO~cewZ2QZSGXz2FclymH`{F8Z
zIsu>qG!y|kz~*Aq`|1{>4RLD9<%`(BldZ;=hOJTXCtc2vW^+o<H68uY*^m%c-asCd
zGsuG<GG7=H8TvrBRNLgcg{P<II{H%d*w-rW0$Gl%`Q!8YZl=VWYccf)Hf6Yp6yqGx
zm#-QMev*FZTsjJq`%^>!>Zg1YiWeHrhKiPNC@KY~egNIE#4ifNd)h8jTXz{XCjRi0
zewx|pq=scj@4+|T^+5vtwYCL+nFYL+SBNR>r1KDO__T|{7v2&H1?c;|g_0I*k!d>U
zov`DQ=z^vA<jYe_&)2ydR+p@2LUn|Z3ak0oK@f(?6j_2#|K|FWsg>~*X5_E{B2Pe)
ziBd{T<=ckyx>j7v8bb9WJ7FSkNONMtZy7fAD?MI8fMAQeoNS;=92=|~M9dt@(Z8r!
zaQzBRrl5KhflyiJf>)_9CoyvD+(A<Lr;CCo=gk};sqGF2PD?`FJ!=%H(|aKYT-aYc
z(v#PH&7+eR?nOE}?TP7iAlWEGX9diEy1UEh)RLxktBcDl7GIS(26va4AXRZ}iCxo*
zhwWs01b#6diRQKYSI`tSi)PM@qm}P}bjphL+z8fj?Z0kt50_<VIaXXG2tfnF012os
zlkL6X&;@zLx!~WkBP-~b2FJP%ge7}K74!*@T@`JSN+DwCk)zmaz%MS@!MX3bs3!y<
z!hkc)yCry@q(8E5ob!}?PO>vNwHoII_bW2abgA2fH2sfI?d4mq++fE@v;-4Y@S1hU
z3G%9iE&d*(5mw}M*LJPCAsu%+%U?z!NdT&$=H2)NmSRdIVwIxQh`}?eVM&KZ%sCHf
zN=l#Xjm^%nALPd+%CzXKsj+a{1GQ|lEr$Po`7Z#8uygulYRYZ?ek~d4PW@GXB@*$p
zjkd~Y;p@7Im7|=pf=uc$xl+aYpSB^%d$Rg9b+EGkkzO{kUxJ|L>;QUViHvZ&0}U$5
zOQv-}D*=i*rRA8=gl6Hz+6GzAm(Zn2`z5Mm1FHU~tjFzp%cOV($+ql_`b}^__hzvv
z(TbD2GYVE=ky&%efx_rz)LM654>TH1EF2F@Z`lq6F+7;r7BxhO9MRv=NMiDpenEZ9
zp9irvKq7I$NRR-TZ{B$y`Svgz=VfkSs3B<A2A?cH@AE(ejIk|g!b>yuy3K(RqCqmV
zcy}HBVMU)(5q@4>RW#uhLYnfpeT^bY-azL2t=zIP+oTS52GPAJbN_D^fGdq6oHVzd
zWY%Pjfyt-Me3sw7fV;1GDoFPX=^xI?BJsz6m+=Gka6~+qbk0Jm^11yy>$;A*KV0o=
zBi<U4n04IHYVd~>Y9Q}d@TAUAS=+Zw|46t&ZGBKM9@GUSH{}{E+`m0E*E+n9zN}zM
z*uVJd`+eI0O>N=l25;w#5d*4)g=!J6kS2hXVE*Ua6uqXZO%{8*K>kMTVKB-X&?>ut
zw*Cj_g+tig>pnA79NI2fW72JUgra9fbrwl`y09U)-=YtMg(Ske(#0&B;hQ_zI@0(9
zS{-L+Z0Hb9$6^=`x7aJK&3$S5mSZ(3#oFL)k=Q+2+Ekv;9sCvwo*2B)5n+Qakw--%
z;*ZiD#0+VLa<P~6l<(f2;N7{^8?`o{vkr>eH(nhdjY-)@P8YZM7bF)9#Dj<kS^kXg
z$&e-MKA6%m^!aJ%bT(42DCK-eR`YLSYQb_(T0)?zLY#lfmeGh8Z!P~S$`t#mX5Oi}
z3Ts7uDvQ$uYb77^_f-rcRM-t#L(gN|beIgVs$#B9yESOSYUQUkgRBQ>XMM?&ra06S
zPYl6-?=k(nBkY8g-#>-u3tRE(m78_$a~s$<!y2*c_cEn)$<RA~U!B`0EPJ<DXvwEj
z$o5I<Eo73CUfvg#0gMm1y-D-`0F2J%DBCA`mn<URV}N{n5YCyQ5~|JATg1I=XaMg~
z?M!iqoMax*u<R&?rBp2^CA+-g&0Nz><xeJ`__&fuwG*vEOvYtxdsw%Kc*_2UHNM%`
z1p95y;!<m4+-YR!#K7({iaDW@gTD^JbwoySn&9XAP`^QQV>wWE6=B>_yu_HAc><s;
zYn$qYtrCCHyu!D|qJ)?_l1SRw7mKn0ct+}0?e<W@3L3WOtnO#kr_^wGQIAZ$e^j3p
zL`twdx>6P@WDgnAO2*@uP#=HQ8Y;j-#$M2nC*J*Z$&jcjT}gyAsE>;z=4>@dQ)+%V
z`<QdjJb{iY%zn$+s94sluK$Yb?Rb(-U@<In5Z4ei{+v@wP{6D;I<A4;ns8gZ&}32V
zn;o=Z9MW!0qTp0Fnz3Xt5tpW-C}JnR{l2hm<%|%s;L=7%v(cs7S<D;J+Q9d{)j%S*
zSBym6I%N!ZhbOtGj#x#l=vYbX1NFX-5GUmJm`D2ZM}!aa2~B)5Z5NZFm9am(-WUq4
z_weFQ^FFj6VeYgq0}?s@v2`83ONB`lRSC?ntnUB5xbQsMuBiEERD*oCT{*sYe9HxZ
zc-M8K@?P(=IX1c0_?Xj(OblrFyAzS+rh35VJO=b&{0;Ts#1B*1Bla-HF|K)k!ytml
zJ@4qElGf_qh==Kdj-RT0JOBN!xL!3^#B-pF#emU5>hoS3q}bVvjVF@^;O5JNAGQAb
zjXTY`YaP7BgxfmQZgYMR&y_%t!r7~cCN=>+w$%p<@4Z%+y!)DJz}pKP#Tx(>-OF-7
zaC&XG79Z5JO25Z=(|UJm!Os8Ua6<wo+1CNKP4!#;>bMKD*4DQxp^9p}U=%v*xqiAe
z&mwiRQ)^n}3%^&9cCT9ZKfbg__P3Frt6Ra+A|e<fwMX0H0RpiJ35&`4Lt-oPbzV|d
zxyJtVWumh-e;AF)@b{sM)<?ZN`;VZx#S;>K7mX*ol(P%pzX`io11`oy^2kbt=+4`(
z;e1G%Dl9ei;jv3&GA=yCVgAZ`GVYWyh%*;eiOW(RW+~*EJD_^3uAUVNo<#(--0A*V
z5*nxIts}2)T%t?3gQ&@Ih=d<ZlHcA1o8s7@R~UN9%LKycpUcy<O$oolY9JfIZWwjT
zIlu{NC*M{bNcsf*W{;~WG$7UP9R(TE&9%@Y(PHua;UHgWy46BKEDG>Nu17`wbq}_o
zm+5+-A2@OU{)=c~;5uk_C!~?yViIn@Epg#Fm+d4M1b+8>F5!IQ5%NzYBzbB!U-j0T
z%j*8|55Q+n8VvQUCDIK{M5TD3^dNO-cuys-aqX2C1$B&@%&tJ=mSKAx_gT*cB<XZ+
zPEEIPk3&&Eq9FTPw*He0GY=g5V#oPO7}W=ftR<<=Bx$zbKhQ0-{POIF@86by#hcZD
z3zF%1wZG$deI(WTJjj@w!{My1A^(>EB}_uZiww;}u|kpDqIf^d3X1u>vaA2>?@ZOd
zD}rPlO<JC8NwRysE8piB0;z4NZL+&W?PBCV0YJoyG-y6t(v0F3(u4Mu2FL-Q+Um|W
zKs0=u)qN1z^f5FW&=aidV6P98I_BFw6X)2c7DPw97PB|#xe|ZL)vtuCa3uuO`!lbW
z>c@7|)yldpm?uYL?mMW(EFI<=l8jc>xR*TD8*iNUB0R@vz|!k6`R#Cu6<GJD1SZwm
zm#gFa^PiPhs4g;|kueXYHdhx*x*=9PF3vDUMJxHG7gLT#Pswb9@S$0tzjn1A05`mv
zah(OZhngQ6&(|xz$-yWdFE1`souZemX#C`gnhHQxO-o+3Jv#JaBfho2KIsgV#5}1v
zPyYV&v90Bb8!a1`xF@8;59)UvWM@nelkjj4b3Db>vt3Y3Gft-%Ae@$eoX5dWT~X|F
zawhGJA5%4?R@{796CG5S{(I-UjHGmMa)t1n0#c_x=W8{2<%7R`3mZDU2lYfS6^DyV
zL$SGOzK}rhiKx%5Z*rqaMHhy|uFuFh#x<d*=dt`dX~4q({+IOjzTvGSZb$J~9Uz4d
z(0I$LNZcjk&i^$+{y;1&JCpq?QGV7r&p}g13EEv5SYMapwdFQjn`bk234hO{{kI^L
zd&0T0wpPofAG`d7%qQq6?-@4^;uG`r@}BUU?g=VxC&dEr{kIuDwW}N5=-@=BW9^uN
zqX@pXA3^rM`M<PeiuW#~G=8ZuK=uj7VV=$b;{piU#dqM@ls2URWq?!;zXcSy;m9#r
z0AV21Sj;m@QSkUKTE1`5Z{8?$3@Zr!&ERA%QS9|*9-jaO>V}bXg<5|Ui%>NAL6UdM
zwwD}z&YjYu!SyGcrrbq}BGcq|ocV^+1vBGlT7%Ok`Sms5KHp_yMPcLQwjb=$r<4jW
z;rH^HazYI!$oNxX-;VR^#s&sF{xZrBWYv~VZ!o3|rZ7eTO9hx^?L-B?PYY_as33}$
z9m#rXDmfFF*Ei(YVH95!m5}5A3_LfzuPNWz-q=CPM9$Y`k)MpkiF~~uEfnUh<bU=D
z{4UzCLWe1TgP<gTQy#KQ2x#cBK^*!`EYEQWOPlW`<_yJjjX90VHHdWP25tr?XIhvB
z(8qd|&8MCO?$&NNPexYHn=mDvbX`x{f3lkMLz{k}Ww3`0<~8irX4`9ioYiv5|0bB+
zm+Alc8oU}FON6dtUSE^(Cq*dNh_kbzs(xHt`Oc<ANnGBk+v_@Bxx6`US8WMS2@Bmn
zoAWi8jkb0iTN?z*x5UM%zndnFvQ-hE?7t#`PcLTe>eSmVnhw*W)^_n72}I_d<@UJT
zuXfr>O_h_y4P;9y45ocuSKd}UyUyJgXAF2GgT+ku>m8fribbJ09y?Mmmg8d?C{k_R
zN%oqtC`{^0;e}SUk&{P`%FoEWx~R6_H(_CxL83KR*R+t1W*1=5DPS?XxEje_=mqFF
z0>pf7W#V}M)$3wNi?`)vlBT4KZ@{&FnlN*Lsf#E~fbGgWS=y|(a*-Me#A``24g0ks
z_5d3k(=5s*4m#^yf@GPst15#Upu2L@y%h<Cm*-H*;1Y?ep${`AW2X)CEGwPyQ}axT
zpU8G!6c!g(SUdtYTb=s1XBvkN^HF`=y>}N^@CU$ov4Gmm>t47*_5R9J;OM>27!%Bc
z*Saehgk4B0HK_XJ<BZd+h>vB-74OH`aysST(F|-xB<!js&e*IhZ$<UqF!jq!>>8rl
zhQ3(h-kR4LfikbTN-6LZ_~0?PWwbbDB*V<O6U<I!Bqdc<HJF4*H2#oFM1@uHMU%vk
zXu+_~0~=O9B^fwxRwx&r7J)!%BM({oFw6Z>sn3Yrd`^<}FXeYfb9JosyOgJ1q^>(Y
z@G^aGYa3RX+`_!MKq?&m88quF!FzP{a=|BYXv*@KH>(yt%^HsW0WOG`=Ii)KcgdRz
z2=b@Xt^@JTFBZ*!_bAnnc7HW!nD0>k6QteOWn`^JPeg-z4cKXHeCsW|PE+T1Wiu@|
zHX5*>A6FP{VdQ;9v7K4BH7(6p?^?`bQ>#>aa9`+idTOQ{a)KF!7CI+5_SW!#Jofh`
z6?<ey7=8oT3Y&g3Vz!%ZYAF4+`5RCWlMc~w%F}+$8#))Eb0^wH-YrPoYUu15urQgR
zCYeB>ZG7mJ7%RX+wV^0ftl;0QniPiUndAuKv5hY7AA)s}*qVjh3mP5(K82;;)CV?R
z?iQ)1y1UOE$EEm8@>M&0fLxx9<$eGMW<_j#@-c|K?EW5|jznFj_)m_wtTD4d9m|`w
zNzP{|=ATvCH<bCu0EDjyTr4dJ2!S$0C7(B*4uAWWcC^1UNJh5a_0-;eFGr=j?-9Mf
zsn~AShC^(sdnx{z^njk@Zc*x~x)xs@z)EB0%<Kb<ATxO`gIj<{trL0H*0<m5C%Z_a
zym^7`d=&LhcBh1L0F{P(1S_yq?CW^3s0aN1Vg`tDRRWmpHYG34{TGYkIAP>diqb1M
zM$4X_V%g;;%xL9r;S6`~;(B}sPH5D#(SR`k5dY2OVa9!qqiLzU^R$7vyi(vTL$o!{
zwoksp<c*rU30VZG8_qVNh)DP}-%yD8sil<h(6o+NS(H56{YGivjc~WwT1^7LL!&T;
z#;3mVWc#J9oT^Hr%GrXY+zx+@Kt5yxk-Tf4+6Bn0=Dn&V1~u6Q>Zum)JUIMNs)%P<
za)hx>UG^*udyQ3q!AKrxUmNCN^C64mljD6?52}t9=>1}`jp(FCQ@WUhI&_r#zl-j^
z?DZJ=!uol^g0Vkmd5T#(Pq$P;ozjC_MJH&XiL^C8X=`Scf(VP^0Bq>9Y(-|D|E1pM
zk|v28Qmi%bYsLF|h5{Qu)O^KInw)_~l+-&#>U-)ASGPVSv&;t~OHOFcF$~_l5jCQf
zZ8?CBD;|TAh`de)^$5DpOVt6JvH(>(JwAcF;kiE2xaH#f%}8_R56=mF^LVIxVkbw@
zBy!5Y5>z)6B0AyAs|EjzwuhkR-O#Z|z^d;c1PA;&s9-2=OjVd2E><cDRsg-DdH!GD
z#@7Morjj%xrUJ*(;CK8pou`N`U@UbJ)1T+<RI5f;(s=U~-o7P(z3!~v0U~EP0guEV
zXfi*Y;0=xE`UUpBy%FRz=4d6+P10d;kR`<}d+xZk;_E;&+UutIaG4goQFg<gEau)k
zKEc-uY?HMRd!><uS2~55zJZ7wOt%wKv5@XJGnNYN%rm(T)c@o)#;r{Q4$D;HTga_p
zLFg=;0H|<@t!?!)<!1j(jJ`D~0yLp}9VC{S_qI^c-LjY~58Mt<i0kWXJ^m1WCBCm8
z!MobOt=C+%jhET>9xB9ei{`2#pc<M+D~e5}8EQcwLg>o7(ccxJ0UPYUX4k&W`Z`@F
zz4cjqTT!nxgc@iJx^w?_rXuCx)(fBxI`_6~&q}WMgB?)B)3dAeMq$0z+y{aJjsB}Y
zbj+@t&zJ{5a|MhGO2PI1bby#H4zppeTipN*T*i{RlHfl#oT3}g>#j0;P&rGN>XJpA
zQ*^9pe&=54rCj4@N|gm;dpE(U%q1<S>T~UE*t4_9+Q<?bHO|=iS|e=(^AB3xQOFDV
zi_I~|fHM%q&<1^r0{_hA3t*!0jpQumlp`LPv0-BUsr|J$)EWCr6x@7+N-T9~VRiAn
zz7YA)8C}*9n22NrJpDJN!MB=Z`OGh<vP!#oM+k$4(ZXxZoWXZeTY5)Fwy~>GZ+Hv4
z>7A!P-SX-BHF?Pe_4Tr$BRjjV#&U)T5qlTiSY~fjv;8dzRx^KEo8qRjn$AJ(SekRI
z_VAcw|K;%*z5^uH{1k$$_x0;d@R&{-dag*&_o=oh5hexUrAl~V81$g7RuyS#5OF}t
zIa&mdJpRxwRBz*Q304>?0hn%{lKQT~@w)Miw*@K{hu=fZy@}?u#{cmfKBFM(Em>%O
zDIHw;lt^mI$r5k&#htq>0JFK>kzf0g1!zs)JhPU%gJaD!JTmfX0zcP1VyeZE%WP?S
z^uc!u;#<3z641T<{>p1O4zzQ!5uvmUi&Qwr<l2g3%dd=@nJs=C|Gj?H@XGyZ;CpwR
z?JHhil&kf=uHRDAtwn}yp#Nth^4O()XK+v@NrzXJyr#M^+QIzd&Kr(5U|56z@t0N?
zpe_oLj!FW5jY*v4KygC+<n%wp54`OB+$KlldY~-$BREm3rW2}@hJrLz+AF#z*BjH>
zbQH&mpYs$+7i6u9l+5pt=5>l380`BnHlRrL*+ot_1kAFH1D5y1&AapDPY+DFDusP=
z?9|4}LJiXWRv+ql4~(ck8Jnrox_mMt^_!yP9Fs@qbLiRq?>oLqv||ev1UP|9YXfVL
zq<WS`pjF@<NMs0j<mwo?UA10&8o3ftae&Q4Nc>I(X0(1jLN(5@eBhuwpfJ@KBX^zt
z*G+FXXEOBIW`91TxI3OLYHxo0)N36(&o4E01Ky84T+ZJ?#VZy!icx~~FlsRyA|*&R
ze{QLDH4=xx8l=b96sP{XFhVd4jD(^E7vsnfj7@c$bEa!R>qTN+6FoaM>)KMvXe2i5
ze-pg>GK?Pp0GTGdp#Q_#TZTo|y>X*34ho_IA|j<j3nD0;I&_1SNTUb{sB}n=B7%f;
zr+}cy&`L9pN+~TNjg)kU^jUkz=Xw9{xz304#mkGmXRSMbcdXb4VS|$tgpC-2Nq+)>
z1kp&vZCzXDDLRAKpfE^%dj|B6JN<fr9n1l|nB1l;wf6>%8*PC_Z_jw-Am^O;$uq%2
zU+6X)3&b$L;ghkG#-e><1`)*~HpXfHe3eY}9VckxZj*T;9zW;V8q%+-6)1madHEMt
z57hnq^xD*<0$-1Gc&9ZpR3g&+^GiXo>ZuabsV1{0P&e9jy+OI70Bo>v2OIyJe`M$o
z$=y#WLF_D5pK_J|{z_+6xQivjBK@^qyD@h{vvE5IIEXNnynSt>uIzp2$DX+63_c%`
z)i#T_N~x^)%ElRnYA>HbI}|dg9v3VOH+j@<#LiguZI7l~2KPDicYjvwyS?l1x9hIx
z#}z~Q;lLhCcI8`k@sH38-ZtvFQ_In|!!vKE`0a(=T!#ud%}4K7d;<M-(>McDhbL>5
zK4X7=#aeo>mCm??>;|Dt$(9@c&fEqHT*vO31s@exx%jz&DPM;|;6X;OV~sJ1hx^Nz
ze5R%K%{O)6NFJGn{-kHw`s%B?wc9(F+jmNS5-RtyxlHr&PHvxY6dw1n{rbB3)Y*?g
zyW4AIEG%Plyx-3yTMSZsbHPVqCV;;QmW!QhBudVF;U{hmDynV*wx>@*N;aNVSi8wT
z0b7d7gd-RgTxc&5!@yHM;7Fza45p<3J=m)Y$ee@`kTes1&;QdDaX0^Qv6NZ1>U%c7
zzH+8y2L4MhS-R$qekQI=)Ab0yHuh7LC=*NiHiiexIYsulB&8kS2XSAdNh`hiB{YbS
z|BwJcyO!$s8D&!7q<BT+i#;PTRI~XGL&nm=daEVb)?W$)kgMY@;*%yGY@p`P(&g;>
zRgj@|*?HQyc%`w%I8Uopgd%rQPW<7k8NSd{m)%9}wB|AQj0(fu9(1C@$xyL$6`JYN
z_O1n0>_SgjvTsohERKHKQEl&N&69XqvU0z8JApaP*<DffRm*7au6u2QO?w)1&1l>v
zfZgvc%t|?9+@_1A*YLwCcV@}EjCMnf5?;KHvn<+B5cun<mo@yYyC~yXuC7hhj7?9U
zvX5YEHRab==fc1N<hsZ=?svD7pSzLGp7I{cX8Te_wp*sdr0Ztd%<dA<qm<w>{Vr+s
zAy0iAk8)$hI1>os->M4m@I*$Z!ROM~O)oRPe2GV*R<;#WI>Nbx@1G#Dly<){{cRK2
zn8ns@l1?wtm!3jEMpQF=dU{Ssy?m=@j!$d=w8$qsVpp2L+TzXy92~f=G<062yIVV2
z_*ov=YSc}mk2Bm%iO}Y5t~6<24)Jhp|JuS;<>1W5BoNJuFWnn!tPA3S13xB$cE}_@
zaDL1RGR(Vo-h~#zUFkaUY*X#)Y+i-;_UcmHe8f26e)GD;?;F;gBzJ<R*yy`wr*+x&
zuY%oEv{I?EAT1!4VFXHkpDI7#4(w=~VaTQ5x@mZ%PuAcb(d;a~S>HcZ0jwLFKX^~+
znC5g)ri{GeNXUO`E0<CdP_fe?y;x6Z336sPMlOFt_K5M$&+1TiDKKJLS_e*0bC}OA
ze4Lm9?Ty0MMD4T-Et}|IaG>e@j~kqi+8j7NM6*_+rqIHAjl!dI9Z!@VtE-HGTl(+o
z>KjBx8pJZ34fvtC>&MgC+RvEx^PEm?k=`c~d#dXkQ=}H;dYg$>-QhM(Cz>3}*D5cW
zd`r@(ESvD?S@|gT4ft-GqeAMI#vSKcROt_`^c}s8RoR^e>jC%O%s8v>WN#CzWRm~<
z0l7Nuso15JzbUKaWcDYk?RTB;G*&JTKv`L^SNO0$&b`~pDC-q3wUJ(~z%!4PHZ~JI
z;^|1QxXFUsDBFV)Bk#O;TGUUO_h+_;lDBlDS66(7{MTjkM(jDQT&bm@i^c1oq(`fD
zE}!1)y7SN0^zDA%!cDSOkDWBfhr3@JwUZlmO}6bdL$hzWKCkTgi;4o<pZW~v&%=nV
z@Nhd%>s4+o%3m9dckJ)#Rx(<I&OY2ybN0f4_ev&ZWl2(!x7VIuntt;<p-NTd9r+2{
zEk$8*pi)nyH-yQ=PTm1BAiPRQOyl56lQ#QR7X}on4zx9oy1pmxIH_?aB!uoyv7i7Y
zQ=M@fQd;^I1n+7~bXq1m>A{ha%wJEQSrIW67CjHr0bxaGHR8uqR2{9Iy#k92!wdKa
zllq&_JF`cZvfYEaKoa9REc{_Mh1G;wIHU3-x2w-b;RiYXH<~Qaw^Vn)X_UJ))u6?t
zc1~yvmibG=@^9&UoYBaT?Hf{ix&WTG73;#48he`69!HKJtSR1(<&HlIw;MB-)^}d*
z);ZqZV)9UkragOBvGtJ?A1{x*pH^T+*~jeVIRg`2jUTR0vnJU}b_6r)?&>^d01bHA
z=vgKm8V1%&XZ_t)w=#v7YR{q?^yYYKm=m9gyRSd_ppX^A$Ys*VbCQFR^YJ*s7JVi}
z&$0W1JWikeozwc`4QVl7vp4<@sIONEyYHsRohCf}Fo{Hyi1L>~hrUsPe~&#Cg<vWt
z9tD4<Jek_=-=!;y?R>W>aOayi!ES{2*_L6>wol&|IU;v$2G&#mv_b_IxmtR-_gR}Z
z2JTL<Lss&gLhOXgxJ!fmh)*)7&BzUk!o@o*Q{<IJI?S8dJ(q()kZBQ|b2KRDGZC#Q
zq$lE`gHA|BpN8jw60wtw#g6qI*vd<$K0yj>g%kx2DW_$*6}yCvWwE0t$K)W-_Vna}
zLV^@cEgiI~YRFW8#3;h;WEZ=Z{@A7Ua&Z`(T)o18xBd_Mrk>CO40et&C#OPcl5(mf
zPc7HM_*vS>YVC~qFdo1flsdqg7}mVy9%!fNEVt8H)HecQ5RW-`iu_8SZV*meThO<;
zPX3;98*0Ej`Q1NY^T)_$qquX^K_z$Qjlr!ePaQu=BANlJZ=CHD>+TVHzKY$j75DQE
zzIi$>>?!jdQ?JU*kENyKwuV5yAItuZG@u%^b}uJebR@!XJUyo%Ui9kXLT`v^{%L!z
z0Ek*9Z5Fcm)0jxN5tnFyNGt!|pqI)xq3lHhmC{HA0{}MKmK@rz(DFeM&KV*U9Liwi
zvYurasmu-OtG0Z8ZajDX;rHLs^fxk{KNYZ<EfjxVooSce2w(l7%Lx@!4{4wfsJZB`
za4FeBDu*khhG6{sWKEo1bU|U^sRp}%_PY__)UU4GYrp58URwNmmQ6Y`vvzA~#-=}7
zx=tf9ff~zr(rh`jyV5?}QNLLFQ=f^yJyig)6&H%DsZ#W5#db>)ONRU+k%2ICW}rUH
zBb`rtfY()u8_yOWzR$`!D`&Gj-lBT<?!`8x6Yx9~(7@vio7ZDL%{-EZ6Bi+@KsBb(
zw03t-lYSl>V=|?n&{T+HfP_#4j!9{flU@6vDmflwjAvSsK%etyfiAJf`2PLmk*Hk~
zh=`4MCs|n8z6AejkYsSgF9NorNlxA*`JUd+UL{wiT?1aRv1%$XKcAmwUcH;`prWgO
z723e_v9LNLYHV?8_g$TH?CiA??$T=0(9594%A!%bGF?W80=uonltebW$*3Ai<Kn2_
z$FJmS#S;%lAo#h9VlZK5T*fnstGTD=m2d4B7O$7s>WWmVGrno&(Rdj8b1u@r-Hfax
zkb>(Z*epo=(~l5<pZ)!oxDZY;&2;tW!XW-ZRV`GiKnGg7Gn&WXAb`c+!LtE>I(S;k
z4b&HnMmqR|afK%9*|@}!k*9VybII#0EZxWD2ltn)DQr0pdL#qZI+nS?WosL5w?s|q
zX{?dtC~(f=4mjsmh+f+v&&=W!b6+2m+|@~-9i)H>%|44O6PoZ#T3?>hVXgGoeI2$k
zMOqMWk^~$|y+sI}#J=?~k^)f1^|g;Q1vs$;MKo9@+NXY=4bYcxJ!^{DySaUZ@gbI<
z{fDwpMNL3FK}QGPAtA{<0Y6Wd^SFx>v^jhiD{p_0c!|!f28YmTUtPAZn9KR{1qSU_
z)Y2Ee>l3lv+53pYKoQ1A19s*wHj8MU<XyT9Lo>}|zH-#wWbX3V+1lK&9ZelRXS1@U
z8Z9i=sottsX6c3Y<w`v@2jvyzG4Gy8ft|PBF{lG#fn0|mn$A6<4!H<8`uRLs^w=|M
za9Kg-SHh8C&|q**4N~|T3J3ds&#L@sX>3fZSl0t*Um&M=W`mxHQ+E>&RX;PJt?osA
z$!7=VJKsM82WN1uQ$1PWGkc_afjiv3LtC-}G;rz~W=IMGyhov|cvAro_P-7+LRNsK
z1d|Wm1D=ddyacsIf(Z6a1bWB-ISvCd)z1gKBPH?e9I=cL3fgI->$;w`_)pD%T|hb5
z)IZWdJ{wk6){ExV|0X>Ma*H6ERsKfjdFHuWY_U)C&{)r<LPh6~)j``#!Ev>Z?<?0f
zw(}YysI)$}6oG?znx=^az!d+-g%e<3@II+d;K;9LQ$)uKsrdNh#(B;|YX-Q+0JiqU
zz<umUf&s-oKEH5bX3RP34zKFS4R*(=_?Vfc8=<Att+%AsdJ3wH-~<o$8W_>?QP4`+
zo>orH$w54#I!kQDiu&BYF2Q<Ay_PlQmAtHVFh@gRpwhF|s@>X`q)*SX*of?J=jI3d
zpXvycGmYf#E5egA$p{0qpsOb$5^;PLt|VK~E%O7IIS?|U9SHDU%#H0DXb)N02>-dG
zXBc@%0q<iP;|T#wcX-$5g(7uyN|(VA#PKDlEe377n9duH=pvw(%<o?d;u@*a>?fSm
zd*-p-5-K{wjl|T!PwwrmT1n%7IFB<Coyfsu+C)lL>irtJGr{Awhm`XgD?uUQj0e=v
zm{!C6-xu8+slEw%udB7h{Q)=xV<5(K1RaPV2sA=*g4yZ7JCr0OLP$gwe5_IDYIel}
zYP#g--M4Rf=+@zPwT+mgc}fK{hK=6zLTlh}lN>0a-ulZ?DtQ+d={A<t>1d9*3UIl^
zPUOnlTTHQz(AnBa0HF?Uwd`C#C??*e%u<rzV=tVX1P91<&>hz91l?h<rdN9i3_#W)
zNFd$wh*n7nKq5WegHxay5Ql^28Ui%g{t--Zu`E>&6n3?o;-#b=lz{o^Xs0=jzPp*`
zFfc<p;`4R&^+eR;ey}GaKl2SZ>$^f*S`V2O#caYQvgAzW@3jnvzUyfUz;)%ZncnT2
zUT8E2E$M-#q4EF*&_~u&hMWYv6X4@R1AawB;skD|FwQ=qoZmQJs+<^M->KhT5+H@o
zAB+JPB^m#n6p{+pR#FNChXBlM##lVwn0q*AL-3H_1P8c?Ch9Ww2Buwawe~Fo)GjJg
zOt^>kFAR(dw9cnCd_kt^Mi6}j=AOv&AO}!{NtE~;rnUG^KA0-aUM5X&&2_W?YroTJ
z?v3dou|4$r_7COjQ#-~3J`-oD1n;0L7teHgB#ukuk_gqmrGe1-*Z;qcN<2@D0_UQ%
zD>i?BPNF!=Cx!uAW_dH>PlARFhNDt3e49u_Z6}ITPf#fGWSTa(NC9$Xft`%)w4@}{
zW(P_-(43)+R$*ELx{}@SpHT<OkJqLkA9>l_jweYcd1yKZyCP_A*?XbSaS%_4?nOgL
ztEn%6bPEg{H$;KmZL{FuV1H#LfMS&I9`W!{_Z2MT<>s#YkfIr)p-Dk2ev&8%1n9^n
z_WTLZTxQ#qNujq3knox5g5=D5S47rUYCMJ^$PTQb9e7m`bfQe{dAL&OzL`R4;{IdL
zDJWRG5$HjSpy;clvY^w5MUNm{@FOl95pP<Ol4=}3y?n?DKC;*^GJ`d`b%hC%BOpOM
z13ts_hEaqu61+3An96rJH4d&L<j{>J#n&yo&`&cjtsjoh4#xi}DOh0*mY{0_Qp%vJ
z<?~c*YZtAZB8$G@t0QBQ2?E2yac!KwLpDXBEeJZ<2Mkz2M*-PcBmC5WzYYxr3m!aS
zVFckX&53lDI@#h2{siU)1a>(Y6EWw-I_-i@sE<fQIe}pVUQyPhz5w&s-7z_H^b9v0
zYQQa@enx-W3*DbVpMT(Ph;@kPL^DnoiSZbPnB`G2z)rbp-I@9m$rdM*xEK!T02SUr
zTlVLEpO*UQnI}CY{)bw^krzOS2@fMUu#6xEFkUE}Q?d`ROmeTpo(IwoyMak4Sftk4
z@jrK@UShDe&^hn=D@Fj)SWQAOHl^NEV;r=&WNZF=Q~_{bTv88q;$t~LNkF3X(w}?-
zl1=Aof3VI48jPA;H4nidxtnPSl4Bwu1T$Z}$}R95L_z5=6vKh&!9bi4N8W@%j9-B*
zhKO+~9{lV96Og{iLo*TZT-%x}N*=%H?zkYxk*^KiG^)PWW2SHmj9O<Z_vSEE;lS#k
zZ8*=^CRmCg*+w##9|!{&Yf&he-La$Li59?VovK>$14itiYKOgbA>c(b&#kA_qfcPy
z3nk8_471TRVw!7huN4lZf#e0I7!#o3SQAH5Qj($sT4o32B7(F5|7t%X`y)voS)xO#
zSxD7hr>rGqF=Xe^r5QB~9BNF47owXfrgvwL#Am=}G%ee1(&vM*Nv6-7J{pr4>ei?{
zfAF~g*ieka$Qk^jXM@m{Cp7mi5WVwiZhs+ZEO#IV1_%yP4HdMQ0X^OkfqFo~nSOqe
z6Kz65lG?G6#)4<7kGY1YXE>Pu+C|EEWRg)d8yC@0)&ji03sMiS=504yU^KTn{Neiq
zc$VU~DZ0?65s+&JhSMz}hUgE<7eS~0_wwb?{8=Cs;nByZ0;}j$zmukXC`ugMNGK`I
zdtS`n7juOvm3#B8yM@gCfp#^)lkwP=2jsn|hmcSnzg<2BATS0RgLKtu7X%nx-FGJs
z<s^(u%3+YUu@$*N@@`NBh^$;w&E$X!Fbpvj>asw{PcG(9M!%?F)=*x+%zy3$Gyxa`
z^Aqy<k}`#Jumo_bxjocau_+a#L$A0}4xkad_6<60@7l}HdKMn>n$3c1m-d)}BZ9KP
z7$z2@T%2>&?@80#R5ZR<H(vV~)c@j>oYt-#C_DFu3Q<f-u}|i1*uL7;hi*2Q$XEz5
z;C%3sw;y^g12qC9#;rec^Rd4G%gP7nivy>YO-jAsh>*VMohm_GVsr5rVGjjRabU;3
z;uSc&6#{Nb1lM6Tf(Ba|+BHV$wD6IG%0MmxWasIcOPr$Z92na0P8~`aP={ay47`J1
zi)Zr1<lUv#3-t<ldTf4O5H>Oi{l<pEfKNb6jr$BC<?stScA2i*SH4TN^hh6_Qkt(E
zp#V;YRE3b^boKNMJlSHkBO&@|GG@}+22vKbYMR<Qp6{!@KyI59n5`rKbAVLdx1zi@
zt#;k6eSKNy*_@rS-@+j^$X-BdbwJ<=S{&3F$X7-G>R+Nv&Lsa(OMUo~=NkSpTW#<b
zY_7qN;@K-q-X~)^`Gyw<h6%wQ^5Xg0i7xSPTZx`XLHq*sN)EpU`tTN)=DQ)9_kzFE
zj#KS}2PiZGkbMQ@Asw0-fmU{BCA}Sh!1RGUhZ$?EZ^7c@>9QJh<3{a{jc#=jcy;54
zQ(bVt4Q0L8#RCHXHa$%nq~`OT$K^x(dh|Q-ad2Z5S?T!$&qiX-0`^Lh<wgJwz#&tW
z@mjkHT!oU9-Qie71J}-aq0L|oHx@|mvF3ej*n)0^IAkC21_bj`vS~1^CpI(H`un#q
z6KtTHpgurEhVzfIb``ZJ-4!3a`A2VbjgmHvzUGu=5*{QP7@&a(=Z!ePxu@S+!fkO6
zMS;X<!R6#^<HCu%kO(N^BI(MGAx-Uhn835K&6r#G_^G}~K`*o*nZ2FHKi7`3!8ip3
zjacW<_gvM7mmxz%J%mVAh|%iSoEkE2?Fvo{1vmU1F%w816w9o7uU=BEhRoaRIX;_3
zRSOUP>9faPNq`o@mlz#J;8f{KVXKlFEDdLqE#wwj4*^-0?hfC~ONNyTB~)JM<gOgR
zqz}}R|J!9fk_Z=sFw@$8)az(gVyly=1U!KdgF%1YS{Up%n3iiGC1O#Jm74z3v4G?B
z2B~zPXio7pg+Kzt?&R2q2bxFd${&uDo)R;Q*;M)d^O}L9*!LPkkhvi?fpaue#4x*6
zgXkR?cJ9#lap32ndK}k@Iz}H>-E6N#g+@=jY<zT#SqjExdTATyJeahUMNry{&wQG)
z!(qNGiEfqQYf9^v&K!Zp5M#6UZfrr@Hs#!J6`IHa3$L(1>MQLP(-1TwpnBgZxvGMe
zfSYef?85nTREO3B){5nlQp5b-nc+1WE<gr+TPP6ps1IJSVmyQ#PGr*9D*~1)8Z>(C
zUExRaQ(}Mw9+s}5D{%L9J=X7n9)lS}6}ja%E%eG11cmbK78Q<M42ii3x3a}HqUB&e
zy6Y8R$QN7Rkkg$$f_cQC4NO49#V2Z)l(-g-+6P*>S70~eYrSI?7&mOf%C=n~GLVvE
zosoW-5wbnRd$=x(T~=0BcwH#7j;KEcS2gIrn-kbMye{CiwdO4ho1i(eam4=CuRd$I
zmA$>LtPK9KXZCQL(<;U90@+2R>4MHBXO4MhTBOS59Q+)mKrHhrHnTC)wT~b=>ar2Y
zWVMi(La|Pc%B@!Ig#FI{B*EY$lu;dN3qhQKlx2}O^k)8cw+0H0MIk}Nha&exn&Xd*
zM9*1lAP_;cu$cypR(|6L-=%BXc}9IG_LFfO)Fpz{9}R^?HXkoUpTe?D2EqDs^N3Z@
zT9zklDmb(>PjURgvB@B@AgOwIL}7IM&4@fPsro_wgQ0-TFdC3XG>U~|A2$$@wsP|6
z{;NUc6M`)1)g>vB(js;Mv2+O9Hpl*$`XPOD7fWk*eU%m!Rri6#0K-sK-V4%dx6jcd
z5febLih`<w$F1rTHcFH7X};26y!O*9PEe(rTqDhOwy5MC_01CpA&;05WmjBmE(l_c
z59c)pKMAC!U^Zx}c0Z|)y7}LhD&-%aObg2UTo;Z6i8&4MtN2j~jJUt(HHdX74vfdB
zL=37N0@%YSq>F7hw^DRe1RJ21(Bvd)-v<y-2~C0{V8<n<`Rbx~0jC@YyiyA;mR7p|
z$vt|JNv5KKBjiQ2YBpX-d>GA-hv3%OWA02mPlt;8a#=s_qOA=r%I>tDwY~js0<rJ=
zue>3VNw3{kXfQS8KwpFP%b<fKpC>1Lx&|jFeK>;-<2`XLE3By4M59<lNJ|&&QPXBR
z@}9gHoTq3lJ$GrP3hPM;GXwSTh~C#5S+p<RG?jncI|JK~=s55a((y-nR~2n<Pxgnk
zc7hrG$U(#QS!*mGK&=%i8X6u#T|F9&b0G)Pz<~h(j?MfdA16Zkt)0ikyx~|jeUSvy
zz~lFNCglCQpY0mK%a;qnGfIzzgH~CjB%0MhQ8O%Ch*nSBxQZVvq`s|J;DipL7{RM&
zTSzeNJc3Hoc!vZcg7|TJbxBQSh#F}<GeO-V%5+SizNBD6YwzVCN*K>=1sTN}TIZS1
zi~Y2pnvZ2+%1MPgd}i-AdDdxOjg#<o5*wa>1PWpt;d3i{{o5xd%-)$6ChJ^>l_GKN
zMM$>tY59*5ib_mWa-&%fjcWcDAP8Le__;ABZNp9L@#TrrAnKVO3k0b#$P!7k;FVt8
zPy>y<l4k!9s@?P%fH9BFWX>F7jMH-*I_%BP_dwXuVajV0#y?6QK#>y#G|A4ce=)Vc
zUzagJjp?2JJIU>ipf44f>GldI5As?NWuWvuE3~?Sho^`Hd;M%lEL0zLHnnsOPfm_6
z1|8LyRwAe`A=GsZ_S@W1IPm8LY-Cy;COhH>UI*b6CJjzpTvA}A72z=4=G$74!J3tS
zS5wp8@yLOYtN>MFPJf7=0Q(C}inu=HLxrn@n{J}s=K0`HjQk|U6+sF|7{l)mSUGnM
ze}W+%2aT4MmV0$flV%J-YQN|MQf^*=577q^XlgcG$hB}?8M=BPj4!0MUbSR=o%1}h
z53lWI&YEDp6?0=6?(B}LAF26YMG1mWAF2r~IT3_~jTO0{10>uB2uyjAi0Tj#ao}<C
zIDFU^=W~LGU)nYD$AR7aQ`dat8bb_01i_i_v@2%4__@Y%WB|BI(S2Ke49W%`s?3Bj
z0Y@mD3{S?GOrHT2%f9eH|BDYah9i9O&X3<?`mq-c4}jm(0)M$SI4+?#3RKv^84tg=
z^JM3I`7<p?aEMCCw{T8Io2mw$mhUfbgVi&qTaO!*fOq8Q&zdFLW96!wq$uQc@(4^X
z(|gvo8{ruXk`NpwE_7ENj^Z=16&w|pAR<w}OMqYGi+rc67p^iVs^j}w|0s|W6QLA*
zb$K*<b%)>ITdo1!j|4Ioll?m%{F@5w7dR)TYn><=4tN3RIH(FMen$7QivL7$fop0!
z4$3%7o|HdE{FsyxL6;99w#XlvdOM1^bVGLjz(0{}a84G8-w3&?&m160E3yvz4C&Ru
zjfSsuOe)TYTJysB=ZE<SJMA6S?|5pFVXwJE6*1$wk%hDlioAC>4jciPo6Kcg33Q#2
zta3DMv+8yQ8}AzhNtH^T)SS7=XvzfZ1L~|uP=OsUTUFOG$8F!i_&VF5Hp;QSho)&S
z6x;lNwYN($JUh@Y0yM!y2yGZD5hqT7j!vA||ERG8>9JXxjnUiTNingTq>uKZTa~MB
z-Z|uS3|q+ZekX389i>oGwDEpuY?3*+8*CnUKPo>r3)Q9Z_O|vNGx8GM5mu;<f6p%k
z^U?i@ADbMfh?9%GBL2{e5b^{g7glRqqq&}BlkE2_xNcpCXH#(C9xSDR;?itZn!?^%
z<0=@&(Hs<RS1hD#AVtr<4^QWmoCdeHa8ewx%L%4~x(<DEU^<;^(*1|iVM5_H&XmE|
z1T~dAcy*ZD_ho(RL8pSI=fb|28)=(cO75tS#7xxA@rcPu2R7MJYH{6y`i4BD0nnPx
zCBs|`8v=xbBD=ElkrwqKqqZP3zEww;^AVim%?;Dw45<orKXeq3gn(DD{T)|WfEu&h
z=37>2hS!7bB*ut+vqnncXJ87`W;^{$i#C`I1kKAvBK_wpM+K^&MCsCvzS0nYkeU$<
zLbCJ@D@xa+2@cUih6%EvR9ORk2G3vZej3I~M{JA0Z5C}LmPL`66u7y2)L>Nf`(GL<
zz`6qKd?gO(lcB*)C(yNjR~2rQRx9kY47H>{yJh4u@Z~<WYfUDvf3@eQ89z827Qqe#
zJ^ZCwR7(aY*W%*Ec$T9o`V=vyt{qnr@iOeN6?IFA?F7Op;N`_lkaI$V^h#rVVVY?^
zwLDyZKtHqI%2eHy)GDjl9^CGBH_xcrKljtm@y9S9?84TOoG0jj5cN_iYPjHn5p|qP
zhyw;7_y{@&*_vqdO<?AGu}<j>S^3cX<hSoZq<gYLIKY(1iZ)DDD`w%l@(DkomNUq~
z!YuHMRL3VNOBg6galfH&{(gWxZh_@?Pymc7qN&Oh23Q9D-Wcn{Igxisks~qfqfOm)
zd`j_GXZ$`;3+<MDIbFvw$+7YAsFUSLJnyH&qvJNy2I9YMIJg4^Y@nXj1+tCTiTzlA
zCfDL_M7->g07XZ>%i@6j1Hj6N5wDK^j_<{Qb=5Ji-ujdHPSN{0;CKwnho6}zpJt<3
zD15Q<MMe-?`Q;S42oM)LqzCVSOzCG+97#NMmTSo(%$~vliUs-0CLLr61P8+hg~M%@
zBo+Z!@bO(sZ%U;N(gpm6{s`?q<QE6dz}$qdyCRB2_z~=NCB6pyc6_GM**W{$a<0GH
z;=mEl(>M1;7nU1~YMS=-lv2{{&{cNgv(O0i|JHIADu?PEW`5`8M;1Z>#I+}(c#-^_
zJ)V9R&3>KQ?0_H~)K!9v+QOVD!gne|5BTsU6b-dvi><9#_=u#=`qLZ$BhdUu5d5`s
zo1@a;y=)E*tsys`9MCbu0PID{iW=masn8{+Ve}@RpmFS==ykbf-x2|Lf6kAa>FO>K
z#>HNV7R9W<tsMWo7E}wR|3Bh&T^_QXIOz>_yd6NtTjunBR)k_8y$TBG5SLUTXx=*L
z8yEuA6O6!b%OJl!Vu+jM4tb|5y-h=d;!n>rCs2=>Jb&@TW;XR6GK18GTUiGXQk^m;
z0fwlh{`lQ~Kekp3mX=a2?_TG_7AK$vx-Gq+qn1haK_c)LP?G@3p^`jH2`)q+tn3}}
z>iP=-1tp*C7!G=3pn8_VA@3|mHbJbBBBv*JC^=6Yi0U~3!se`r7$FFhY>;JY5am@$
zX`jWxp>ULy5LNemj`O_pDk2v=-;b$Q#JKj>*V!7a??|P>P;88zga0n$ke6Wix?eH(
zN#SB(F3Om*I)}f!0^n*klY#==W&na`L-hxjhmH99BC0a)4w^Awl`sRtQ;9>a*>o|=
zw>Z?3q|}^kbEzvn6me)|ph4qBfUr`$L`#Fj$-VaHFzP;K4%+J|%&nRQ-3GwG2oTgn
zHo06_5uUA&X16^66ifh|xTqx8d?d~uNNVrI;{lQLB*?+<zBs7V^B@SS$Jrf}D@aNp
zC`J0m-XO|{hynaiz0vARijQ!z7bB}ZXhxwPGbRn)Jxi?{X**a+Y(<7k?_Bk}U4x7s
zv^)1xOkyEiI69YW7$09k7C>lN(yxQ14cr=H<j7={Y7jo?51#;`?k47erX%s4e=?<d
zLPq6n*ga}I4h;rWucA0>9oPo;LmwRWYzkOY&Jj#Y!ncO*&QwUhu1?YcX|i-ud9j@O
ze0N30X}ZIgFfH)c*J|W~_lmz>aFQ~!hgGTqboQ42-PuziLH1ITF*!U3HimGvcigVM
zeBc7pjE3K`C_#UX!rEdr;Z(h_5%8jhOU@?``huV?1yLMj0Sp-5B@gPudU8PtxQSjZ
zt0bJb;vGI)-+@OCn!()fXDV^>b^cT{wgGPjU{rq=*{#2(__1>V)9sJ~Ny<}=z>a<D
z!p+;&HZJpi{%RHy`g`5MPf&M|7SvcidTL+8^$#QknriImh5TU|AO-<o4}$3zABNz<
z;>QGQS_5~l6y@8lSM@YLeX?5_u6ZPySh#xa<eT1J>WPIvE)rSptk9lEQFw`;!Ajxn
zoeSSK1{R^*5JLcuuq%+A+Rb(RoNFJkas}ft)4g(E&yNeP{|M3iE$VNe-A1(+V%*B>
zD(7XU^WH6Nx84rkL0%3Mu=bYZrhEODk93S!!SzxHf6C1kubC_+O6CQ;Z{;zoz6q`9
z9mkc*uO2gv0&C@2>E%ssw=`{j_IGXzt-0wXX6ilKn6V#Y&3%``RnloE-RZl#uJx04
zS=+1d=1Cab20!jh-rZ};TWSsu(mQs03flv-G{~+HTu?&}7Di1yP>16aBalgb@RJ<n
z4eaQdPvc|qNvW{sXhywzKk1O3IH(7NTWgiO0SgNY^`dBl%3Fd$<xRRwVK5l>m!3Gd
z;6H67QE_qp#l=+~?Y-^oWE11Fv$t}M%9|}{1pD@0!w8(lFHN9NiX=sVL2+TG*PBJG
ztk3A%^k`M~6A}<3?r`IZcD~K>SpejCB6aXnlcs+Cx;LhK>eMMbJ+ANz(4Vn$LF9hI
zY;C!YU7@%uo?TvEUTFC?a{rN4AZ(apTe)6oXNh`lXmp=Mlq+nTT=%jY^SJ=<p7Hss
z8qF)ea*YTr^6!83=FAE%#?DEA2iKD?%6KPnIFBdtH=H$GE|os>?3puc)AKPJe*__R
z!Rv#M@up{;KiTL@@4Y=jCR1AU&eLM8#BZrWf(E>$EtQn^0{!Y7jkYKHq;BS9Ebo&K
z?vwP`-(OAjOtPSjtV)80+Mn)fG-hPvVSPgbPn?FSscEX?&*p=t*Ju&*CFj2<h+<#u
zmIpn%@{XRz1O=JMA1C$HiV7+1^h%tl_@16AEn(NNR)SuWJWp(Qz192@;Xc98-;6Kt
zyKgxuC@4Hs%KH47uQi!ufA+ho$U%F?LJ>c#7{k=S1aVX5cY$IrKI%%ch-n-jf7GBw
zP}1?RMHU(e4;sAr!KKs322Z<?q0Sl{_>uR<4Pre#JuPGOzN+Cdbcp%x3wQY#v8<+D
zB(}P~vREBVFMW|IiuYMTi&1fB_jIEIBrY@Q&Vu}@R$gIY>WMw}kt#qfekGjMl33=k
zB0*}wnV6Z4o<2qYwi6T*GP1JDxgX$npzLsBVkbQU<EA~{vaTZrySt|%O_x{te+%R3
z|EzvPiE_C3Xd=l%E=N;sI-UKk<*XWy>z>dq0KSGkTp~Tjmodqq(9-`UwAXY&u<U%b
zUH`5+kBi1K)qC2(|Ck4Ac~%b0>0A02pW@|;d>Dmm3y!l^_1hR&o>YLCU<Mqyu^ee0
z81yq(xEy0^aC=9#!4->+k9DlJ@mN(5BXU?_EXy(7nasD@<Ngxu(RIfeb>Z=hzN58W
z{MNk<g4n?+SbyJ^{pmzve#N9P(N69kim|-$yjnC^ktAIO?kuTAFnnlgU_yVG8DD2X
zrbS8w49znB;lL2IMG-TLf{qU&HA~AseKDulGgp2tFrQ-9-18scQ_+OXJ3k{}DJdyD
ze?<1wRFIF9Kc)BcOZ(=@fg)?8$G>ut<2yTgfm0)sFko&xeQI&~12YGIOT$ye@Zjm?
zYg<}crXD^ic#E|EtocvpU0o3)ChXfJEWI($v)-rm>F~g0ll0FudcUc-g)dRy+FaNl
z(eNByQHGtO7Gh7I#_0GI;dpy~o7SiM6OE?aS7*{07|VQ&cK1qQ_XoH9^kt3gb(uY@
z;#N*75w~y_<N4NYZ`0YKwi&|*b9^d^qL&Vo5H#lz?bK%7=vGWB5bZ38wK!dBz9(28
zXl7k9BM2vtrXU?2wsv)|_^poRl4l<$k);IcU$bX;EteQ`LSRO_>&m^){=_f5@hA)1
z%>CTIk^IYHbLQ++<?hJZu=MQ>m9H_ARfHU6H!7Cm=e{*R6K`j~LO}c|56RQqJyKKT
z=8HFpr}ygBD|#AW&E${PlcsWwYUpMrO9}`|*vbB1AmIOI&5&am3gDTTnhtMFWxq+>
z-TG5(>C&m^ST);MYTI5p=Qih;xIJxJY;IXR8u6>t(GsmK35g+R1GduNuG?(C(pioF
zn)Xh2lEqNr6Wf~=wf@f`sVI>X+lll^?3?bMq#8AnRNqSo=4p2~@XSmeTHihmxBmV^
zRL#{S9J(2i`1c$0Q0%~#$?Qhu?)KbGPR{d2Mn=W@OM@?ns!tFJ2W8$Rfh7MCje#Hv
zH`S3_nd+7~yjw466rc&NTgvCn$lP^+L`f@fxSoz>gMZY4sz7WTBJ_XrrUt~4uP6t5
z`zj0u`IV9!GO7c8TD^lM?kuMd=hj^Qv7JX{S$5NXYxv3^boRxa5$4;zR8NbNonzK-
z&fvJr6n2_)ut2{=wUcJ71&*0X@H*?3+b@hfAPA!y*S4G*3o}uE?*K(0IQ|7iWOL!8
zYY&9?K@0j@K?w#Nqft;&GEqwT7tmnEQVgH1*qr^_-B}T_>CmZbt0=rVo!`>g8M(=m
zezD(UcY9%!!(+V-U6PpSv9oUdcm8+L_*=ipjv_2Cnb)jFYJ+8JTA4OKsegMWL<mTl
zj4cNr@N9s9CW{3z-W@Y#(sqoT3z~a6>fTtHGHQt7IR@wuL5N69w3pJ)vta3H@fY|a
zl&;h7m&LON+2ikGpT6GST<a_?%kcOSah>p=ZpnBh=od*hU@Li+U%!4024NWGqYBrf
zdNL5_V5c~7AQV|36q(HXY{#ew6E$>o6(0NZhe|0eGxOTXlP4)ViuRort0z<$tkiKX
zkVeR1<oX-F@(D%j`N4mje(3avZ1Sv}Hh4A~eu;v@*JFFiU`6iY%7DvU`NI5HB92L0
zF-XT%#FuDjvIK}lJ7d@cd(@LI00(yfG5hreC%tahuN()SL=57>7uHKBAU*AyhcQW1
zY^+~hU0wae^6ILTAotNDIDT9vX02ka{O`E*?U+s8i9Sa6rPzUQJp((dz1elF!d8Pw
zUE2mA(rg2dv1rqwu~<v@?OtYRY{;D)Y!&Hy3e0{^5;f!FUyw*z#==f_yT%^G{jboT
z#eV0#IvtJH6DzA5ASC90*JVC5VvtXXqf8Usc%POnRD1KtbL?z%Rt7p&Zi2f}o7P?b
zG{##GxUG$rG?my-4bA`ly3p~tf=9EQ4r1t01+qLTvtDOuMkKiqE=OvoSX%r}PtT(8
zf}P^P)*i54eGRf1mAhZ~4@3igcl8D4?_a0-rY62PIY&pwRD;Pq%-nY@esa`>dm=w+
zR#k5}03-Rc_{%%HeCAWn(5u^9_aW#jI5ExPzTh|c{tZ?r-?0HldQh+4B5(Y$5vmog
z_mi??vzpxQ$#Axn8sHTv3Zg1u$qn!0dBP6@kWW>Cv}&wqb7SLedOCBy67De_!Y2vJ
z{to$BkA`cGZBV2-znODiD_sbF<C^N+9rk8-XRVSR@80fm`t8w@U0`BE!P1xOG%|f4
z7mi`RW69UK{Ecfn<@H!VYdpaP@g#Mirxc6sE_<{5@Fi7}KUmVcL6FEShb1T<U<#mB
z>maQ>cTNiAdUvCzpjQtRmccULS-E3RJF@ZpT6SBRex~i(Y@aoN;`Wk)X*Zy@xuMtB
z(6w#@%!#g?x3+#0{XuJDUE&AF9gcC<sZU!Sv%fZAX{Srx1%Y7IVXit`sJ;w^c#Js#
zehE6F?9chb$q;vVQ6RUEN=&rm&zhZ`z4!U4-hV*wj`AS*)PnU=17FRY$L^*xWBSSf
z1USv&MDZO1^?@QTtKUp-Z+7Xv86O|_`TB~e#yC<hB2yoW%xsm&az~CUmoEp}J%ZzJ
zRU+R%N1JJ{?BM<asX}T&sT5W$uMvoGZ7+=*pkg@`gtngH)2Hm6I^L@*E0W5}%9+ZY
ze~)4FJv`LJ#Kf;WV|i+RE5zDQ$LU`rZ-f_RW;aIJdMn&qgcrV%7C(Ikz7$uL?Y@$E
zFW*EF?YtMUT(K^uoRd7fC{U{Q3@%4*rzlkNE?!Sf{+|x>6200&VS@q_01zlneEgD#
z`(zC$ENbroPWwffN~?tE=sN1^!9hbi2Zw#!Kd>u|Dk}DA3Crr-KxIMc?0WjGmG^(E
z`6^V_obx%#R=X`0`qwJ>+&6m$#+=(sZ!JYTEw@P9wzFc3tx?hpKnum^g5(q_Ps{^U
zE1sTOEzh=i5Dfh#%a6Q=0-EH4G{8xIi~9^mvcfMwV?eo-nwU*lxUa;N^PPvH1pm3C
zHW-??_0V-nXW+xLth;|YvUG+g(i744W|Euwt_xL8HA4Nto6&DXR_~=2V|_Kp1_bs(
zVdMS}R6^+9N5a0y1w0_B>$i$Yu;zoh_gC`q#>>Zd^QZ1a1Rb~Ff=tZx^kW4@MPsGP
z>}(EaXJ^i-e-&_p>Zm5SS=)t`Y>(|Ww0EKb2%ihRwoQ^7Mx}HG%n43(pDYIwT&{Zj
z{d#36e$Lf&*7+sGtko*GM4)EUBv5`X&+O;BG`&UwVt!i0_~eg0=lb~ElSWSyw~zjq
zom>saEHB&D*VjL6th+*NavmF__jP6Hi*Z})BNuX<)os<;UDlg()|~G7%+YvzcWXm3
z(`r=VO9{(}^B@LwuhM;+)xQlIx48l~5&z?7u(tEsVgME2Cl2pu(nr92yK!n5vDVwn
z1}a&Tx)P29g8;TOLl@M~NWcBKJtIr6ly_rulPbJu&+_+lgp!0AY)@(q6B_*e^0q>X
znOx6Kg<9AtC&!Yj{MphNh^^$5ioaJZdOkhzOHXi~T(M1rj1lvlAT`GV_&La;2kpSL
zKNXkvjPxBLehF{<uM@{i;A-xHRvL5ur&bUI!aIM57joaYvGG-d<n%MKP5E@*51UGp
zG(wOL-ma;wl~HF6*L|ZTI#4=SA*7jw4G|C>auBYB75v$oTn(gJ%Kyx>91{S%@s6Rh
zv!IEI38w)MH}?e^8k%VP)5oYo<X8?={3@}xc<Qs9FV$VQ0zuq%Ogn2YNHu$%r?QH#
z+!hq1oO{;fV$*qzVIM2Gb$}~$eVN?@S99R49mtkr5da4j2LlOXushnktyKw>mzsO|
z7nV+3m==tqY+meff0;n$<Cc{_i5|DmrL!fHZj!f(|0K9P=tS!kd;cBds}wkQ<rX!$
zu9fIMf`HjkCXj@6er;n-4S5y_pYm$SafX7#4ILbK-@SXsd2MrZ(`cr<@ZTIivP9k9
zS$G2lAE`9ey0Z&yYRXlgp7hvslBdm|xbhdd1p*J~1{9Re{8YXjzn|#>%9FZ4NNKp}
z;DI%_JK{hDCttH4Lr(k=;;4j#!071c`tQlf$ugFV|4Olw5-<iki;*vbrdm>@r^4ep
zDovXbiiQJ)l%_0S21e>Tvq(uv4S@zpvG*qC1ktw_M7N@j%^nTS-ezyPH#>wy=lq`@
zpZy`ee?WlbM)U`jsfh{Sii!#;M)W~}2?W$U27{7DvDy_&k4>GYzMSyeP|8}gvoU4c
zB+zc)*k@lnMRpLOVt{*hpV3&`(>Mi~n*zyx&{=@Qo#ef5*6l@kMVXbAw>!{!rA0rn
zNV%_OxYB9R^!Rp`ua_9qt;LGBcGsI~z*|7l#W(OADwoqZMk$A=2L4v_+l}ARwW(t)
zo+LY<`2Pz5djQi02(Wnc=&GQg;6+ElW96tPMizBl=hHXaCXvV<Am>>h5Hd&5mM_0#
z>3puPaND#w%QFKuSUa>I*iR-SV!T9qF+m=}wI|ns2s(aPE*``CxR=QO#1w$6Z?m)K
z*b)XAk3B1RfvEwO^>_7iWxUIWp3jzVYOZ()JGy0FxGdt#4e53?(x8!N#AUXa*<rRf
z`bf8i#UP1_)M?ws(t$jODyvMQp{Dk4Y;2@<RL5q_`}3e|2(htjGBevmDQ{2ev0CXz
zISvkLm9%K7QE0eD`bvYy0%##_6AD#EtT^%j6<DvdYyMe<ipXA@AJ>m*J3=1WY+uaK
z_X-<t<4~SSQxt|QdyS*LnK1-V*pC9?x8M>b<!kVj)p|j^<IG25%Gdg-4A#GE+9+>)
z$V5ZMNDWp0ymxQ5S=AT4QU}TIEFNX~xdiL+=47Xyp8kk*-LnVrpbOr8YutJIS1!NJ
zh|C!xq8jhBR1s%80`}xV51d>|@VG4_4Re7Wl7SxRwuko9^L;ws!-#HgS-CFw83-3<
z{{92p$_ya-4fcw^L*Dkr#ZH?upKFNR=U?dl>?(U^yR{fuS-+oJg2{4pVY`GlIJ>(-
z8XGkS*D+7`opMsw=*BGY(S{?R-@BvP*Dh(T7hVV_EXjbUW%#s`z$IUM%7n7gu(Yb*
zu_CDwBOwd>aFR?y<!xR>d*RgN13X4>(5u#cv(a6gb0tA`mcjPVPSetvXwX>xldvT8
zwc+7dye;X@(f}Ph8>p%xnr`pvE~iI;x<D>PDnR$@KS3l&99;MZaiqugY*&8GVl%*)
zkf^9f6w){_e1zxWKg3P2Q|G9IfarD3<(f3agoK1V_|H2<(uVzI&o~V+IK#MC?AugA
zVq>qJrQ+r8ubDutudmwx6Zv70U2ei12AZ^WU{|F70|GHHIWa`RG_j18(c4U>qREEJ
zwrm4~WhqhYBSbfhp+rh2Y86W-_ElmeA_0DykT9*N=$DO*{bXCNKUfmj8wUGAFa7-A
z;WzT1pZ58miVF)Hk+pf!n(Di7YvFv6@sEqX4|@s8*~9e9ovVJ#Q=9@^8fJR3mu2uR
zHa|8_yBSGX#Mxp$Tpd80uBU0=-mb^8Ck6>MPl?V)ldZhR#qurGb7DaG{rmSJ2?>{#
z#ZB3ci|h^o3Irg1?axnXR0x|y*5Y(QQbaOCs{GGdpJU<~YW`*?8O!pOi<*r*9dyLF
z@Lq<&21TP5NxlX_qkvDI*GTomv&KLCiW&J(hrY1K-dh&K4bdkiChr)Sn56Qr6$BjW
z2h!BH0u1WJsfW8e+YxT{wY5Q@O!~nO+n3p%G<Wdq>|4QMEdi(bqy@t(F4H$Bx(hR{
zUCU0MqvVzuYmB$xE_<gK`yI3h7#SI>t|lPB#F(?Ne->M1ob12Wb5%cr<fEbT*>Yf3
zi%#&;4dzHg);3yb`d=)_x0&%V1uu^iwZL}g-o2|;RaN(2MFj;Rw6wJD8~yS*{>Ch^
z(_HzQuq+yc5WfXad&Zx*Cr)0fsj)SbmGv!n)FNhMYa8I*1)xPM#}K8$CJJPXEF*-=
z+pGjeSCN;W-;zjr07EO<^_9DPX71v-5R0Dtz<lZSo}OBW5iLBF9}0YrPr1Nkxba!d
z-26jodU{RIJO$Blol0DtU+FY(3DK?mJ484v!mJp>0Cq3j40IG9?6Iu8-qqDrEgsKh
z8rW-HLsPu~rvt1nu;y3~R|kn3{jLh)evHJ(U<!TFAH*+~x7d0?0t5@+_)+fnVxyy3
ze0_aY#&H#)Ume*>E{D}12DhuyqtaNKi<6T<K%k2=5a*ah6Z;sT2HZCl1?|QW92I}x
zE+C`>saYHc+&){E#lpz1YcqWAcg|c00^Jd^Vvyna4--fLg%2qrbT3oNq8E63{L=;D
zy7A*520`>7*X!fC_nU!K;iVvU4k5UVU7>g|@4qaiACJ3EBUJBexR)2a?)&%C<X?FI
zMUXA-cJHV+)zcu2%)1nC>_Cr()1rfI*op5XNUd~D>Z9&+FINXp{pc>VNK=Xzlv;p8
zMzX*_%wDHa0|0W#iIUw&G)Wt-n>hYK79BH9`GMQKO=hwqi^`m9WluKhGQj6f=jM_g
zlNElEOj1FC`r^{kb?La67*-HFBCO%ZkjfLeb-LG~=gA`IC{hyL8UE9hXh}UchOs~w
zSBGNEA2gS{I6fN*mR1n+g&<}~3d6eQ|MKFn$p;D<9>StqEgIWjjoU3kGMP$M_au@7
zTwha&$Bghe$PB3@6&2kBFm(M@L~t-IXdC^P4A;|V_I*mY2xNiZzlUE781B3L7sO9l
z2ZvANWPA$W!&uZFwq>X=C4YlBu%^Yde;a;4N#S(@sAPLrb|`h&)AX7iR+o@0_+u2n
zD)ljGsE{-hsSr`~6Mvf7*AvxOsekFo00q`%zJuPA|EY|~K=;Y_>8TDg-PN1KSM%&9
zR3}=~{BBl(aFA;JBVym0mB{cv7rhOX^_aT@eE%};dA;3%VB^%8XJRc_r}B)(@kN^`
zNno9RU+|tncyjXcjJIzO*v#+2;nV*_hi{1(F9OnsTYnd-Pgpc3p~{w9<!y$1nJMSQ
z4WlvO<{}AA3mz7b*OZNnj{5GTLIW?b8itQ(SGv2kP~m|PL4s&0j7w=J$WTd<QU&O4
z<6=dQRSD`fLD0DNO}^E`Z~`gL5&r@?xjeY3V$|^e;#3@{V%tC8lSE(mpVG+I7pZG#
z2nSv2pH5d`C-8vXGArNSwj1<D@PJ-q7?2NMml!xwi5PUny{K-tL(K{M1E!tiGlg7A
zgyJPDL#cO2@@0r3u&4jL9(@bl#p4#!%LFQ-TL5_tf8A$hV34_c_wKJtyvLCMxkVtn
zSW9mM8Z%TxY}c<hgpPEBrpmAz{uy=%l;nZgY%Tua_~*oyc}*bAwUR}4AQxgEJ`|{1
zy{SXk-)5{EgHVy932X(C@H<3LfC3LU<usP02M|e2MyHNjhm|kV%<Mh5LQyC1?(L5q
zkd%)=pqD<!yq&ceWbyQr^N<?@PbZlXw|azX&(xF$tDj=0{yxzvwn-~^($kS0@e25?
zr!C%>(eR0kdlD_hw(?CzIuIR8MulbEb!gG%46J&5AVc;k!k0Q8v&jh#bme2w{((_e
zR`&n!Cj2tMdPry}{RV}f*|Wtu<}}+sjqiScqc}aznl)VWhVM06Ej<tzkL>owO27~{
zwRoU4xYTr;y!<7rGkVyST<(=KoRt~*)&l=_=0i;-1=_(3EEPA-BU;*he6dh{AOWjn
z49Me02LE|+UpgTw>MF>K{u{X#=;s@S=4A3s8b&$|Ja{g*f%OZ7+vX}yAoC4Q6j)nO
z;ST<lstd}Wx0wrAEMX=L8krpFN|{?g04k!iM&M*8Unye2E*#KMsOmcHf84#TS?_3T
zvx4L)B1K+ap0r%$NISsDcJM&zN!TQZHt^UkTrf;mif5&l^1lIQw?TmdOe-%xe>B#z
z;%2wjAMrmgA>80s@ucQtZlrVz<O9}l-NbHlb>?km>B(y!Cn*o20V#N*80NE=e(me%
z^Pzfj{<nHO^YPr*N69CC<)%FDE~s-tq)5Ms0K3AdYDn){qsR?hRnR4qtivZG*tF>S
zO6<7;nL)xs?1P7!$<Vo<j6O)tT*gHeT?DEybbi5D8Zu&zBaIJX9a096B;J~Xd!QRA
zVbo>I$xcF^iwN@~lTlCz1MQ%kn~x!&JQUF%!mzD1%NG#zf;!DqI4W8E)pwD#UL$H{
z!%;jCp=d#8lh6DrBctTv;^N43eiQF&W_&O}##3B9YL%sGF|rU{@wz*2Jhwp(N*T40
zSRiA=gQSN;b09tf5WN5F->D4yg{#-EhlACpAHnHqX}<ke_rlm7MiLLe^h)f4)8r$;
zH)B0^cWl7*eLy^q5|K>_BBQ@wUEwv)k@UNm=f3Tna_>3d0yTLtN4r5o)298QCIDUu
z0}zG8jV$x7$)ddty|C!(MFz4PHX^Fy$uZ_7Oj1(vEnlW;=H2VEa&md6jf9Rx41E53
zhM@mt0~QD<-Xw{?I+y3VZZqrzn;`>>K8Xe9?Q*=9{g2z`gJ{Jcj@3s?<znM@`*mX0
zu5gCV$pnhPIbH}!qO27i7zuB~Zirzg7dss^P8s5T_Bh9bs;KABVJ-5Z-q%3d6A~Rw
z!S40sUoTjpet&)S11bfilL;b}MOMPvK59Yu3ob${vCq_Xo=B@cdwU*pq7^Ji0V2Uv
zsL2cS$_~cK-zMYE2F~0Cr1S|c`BOnUNz%rXvCF#aelGC158Y(48gHfr`D3<mc57>^
zgynuNy=Nyr;D)y0>bh^fqyeWoQ)NlDK0S`6cI>qV0rHXv3Uun~JaJF>6XiVV;Vqv3
zLKv`@Sbb2##7@hFSlBnhY8>)`B|J@VtH#cH=LxWtyHp~lj>8-3(uJ$6tmn(M!nF&{
zWmQ!}G%of0OJyjSGs`BZiYV5$z$#As$k^C-(8_&UMuci1zr^{_r#?ZXXB-JGH7fpS
zP?^BNO=(8rg#*h)VA?T8_b-mW&;g9wPt|ihg{&WC4y>Y3dtHG4xZ1x(Aw@+|VPRoj
zGa3&bynSe5;vI0G{`edGYKARuC2gj%K2tjCSHjm?<vDUGGji{><4u|xHpKEp0yl0M
zPZFFX5?Kz~%flf#59&iY5L)x6#_E6)(t(sKSP?un_D#k^9V7xB+#9V?^*x^7#xdvE
zjLMk}RJcjdfE@=Zy7uiFP^f7q0F}Eqz%j|)elC`hm~1p${t%eNK=h@Q^LF0z__tR9
zqF%5zqlBn9fB|a8JL>8T&iSl`7M&54Jm&Xa=F<G@IYUxro<3MoBw2B)dQC>cTrFjX
z^ZW_Py)vg<sF6|q<VkmdEV^ju^q%oSzs2YQ4VPF{P+W%?MEc_cD(Fc?`Hp4<me`GF
z$D^64;m-Y!2I)Zsxeo)kVIW_K1T|R7HDM>|a;x8B6YZIiYqYnGbPd1xkZ`(f*rn)0
z4g5Tl2Fmw3pV2D9P|1T8H9I6~o&kSsUV)GTNn${-ZxZ-`6!tOppF3Hwn86Re=(~*9
zuPYu@(R=bh{U!c85~>VJE#Um|3!YdA^gau~_y#W=l&RN2cc4tg6yPzFd<5Ig*NhMt
zLbB{-1hOS-0*h9ql9nq|o!LY5w*1f|)IAWjcp^+*R2-wg6KPLyfsD+z|Kn@)*oVxL
z{VaM<DVTNG?VZ0Vc9U(gK<;G2|Mc2->Ty~RNdN&GNh3pJ^7HcpDn>HOJDzo{zdIat
z6j;^uY!$q<l|{mS3C$3_Oq@7z=;=*XK$^eO8L-vxNU<nZvR|=@9Ixc$zg|`&)#Ygk
z|5wu7NZ!m*0xUuaG!`v{FX>fjXxgUnYZ?LzXw5Z}9>)Esl`jRpzF~f(bP#KSS$`4O
z*;;Cnv>f$gDh-*}*7pKuYdt-o^2xqNm`m=M;Su9shb%sY%<cb#9IFaXCL#0I6tm*(
z)t=FQmpPuZ%<SHHcHtdRz+9RCW%MSztV~$ow->4ZUK;a-VEnmPOm^D3mi<)6S@Q3o
z67#taOd<1;&2z?LXClSCOwH$s5G^hcEls*ys{f*eJ?WajM8k)1b9BjvYyZme;;tvj
zX08o*R4yO{?I#)JBiW(kWfiacvn9thO*HppMzvJPg(q!Sfe8)@;_kX;jWxuUHhSXH
z6LUa7_m9FxBKHd#)ykU~zEjWZ?z{qK`Yjy*;(|c7KQ`|?P)j`?DB02q3b?1wf$R>%
zrmX+OYt%3DOT3Sx>f;1{7NvCRyJRuba)K5F2nI$5P~{yCR-o1wYOVwb3YpYjism*8
z+3y8B!<}PAZ{)kSY<-jppbXC*0vCtyOMoPkHR@`pgr+6my}tHq|0n~AAS!?s1LoF^
z?T&j4v3^o&s>JEjr@x%qcC^sej`?FkA#)tP@V|XTGDLpt6xFq^B7?%Ez{Yrrk%NNW
z#~~Ql+eM=IkoWqAE@(c!Fyps|v~X|KEI76*6pm{OqN4W8B@=tP6^ECkANG_4>Qew2
zm9{@>k3$AVJ1HYWX4yo;yc2z$$Gk1)KVkb@24;EUC%8<Uq`F*aA~h6j>eo~fSy2bY
zfn5Ry#4qFCB5Ns{&Pu|i#l=+77bme5x2Fr9Sk@4wg2X{9YmgeU8z;0vs9vECL)qPh
z5i7`(lTJhSE%x}_znV8UnS&A&InvV7?r(;Ng)tPGx1auRd8voOBfKaBfIC1aDm;8t
z)<$G^Ybjujwz(Jv^1M(`&-FgS0Zs7;P%}_fod;2C_5$L{kNBm=j6MiecpBDLXL=+n
zWertjoOo2|P698siU0=G7{lT0cU%jr;5c2F42WUIFU-u$-tz4?c=j~OuZ-m28+fml
z{{Jxc-SJqq|N9X|G9rl*l@UT2$xMZ^%erkUviIIpB8noEtjw(2o>?t3p~y%m<hIKU
z;rBjodeZZGzOUEs^M}{xN!{0do!5E3$8j9*;|dhPa+RI3>JdovB5}sn04FdMZGnAY
z^{JSi{3>W@_~2Lg@~TFh@Ilts46aghihW#V<s(ZkE)L4WrZJCcxmcx`@R{XH5d(Yh
z`J)hHPLbWmne!iO{;T1=MidkjBxR$)%FnM#O+%CYvg=<}NA8tZJIuQCjioBxmq*hO
zR1#>)bR(8G*X#oupamxn)qi~xoN^)b5Wek(O(7LFkg;n>_sz6}--EIX=&Qt8i2oQH
z!=_3rS7=w9QCvJqfnpqUF^c=yO9?O|yCv>B5kjA!qOHxa;0qrg_Ta&uQ@8JJ{Toys
zgf<mFZnN9v<>t1QIsllR+v_>o441Ess)3Ma1Up#fX2#{D+t5Tc2#>^E+pA0k$2ndy
znG~D#mBFWlKxPOf`)fv1TAu}F*lt*(>#MV%<Z#wu|JINb$l(_jM$K{TSnh<XyL)+Z
zYN~eao<Cm}{$JkF?*N3j0nE0(<}s+$94D@`gPg$#YIDzBh#kx~Z99_mLJx9tzTKdV
z?8S>G@WuJp^UUvwFpPqkrL}dv{JV%MAPTv&UL7z=Zou{!D>a@xVdseYglE36hiE0Q
z(QW-!wiS|>FF(LFXF&BM2Sw1o$}mW%Ypc^f@}QrAZlAkWoI%Js<}TBjzSD6vKWSTO
zeRYa0IdZC&GuoJUQXV>9PJJ9==~sh<BlzW6Zy}SxDWT=D?K`UIY6V#M?vNWi8+AGj
zq{$eHPg@T>v;IF3@jJA&tVfR?wcPzzCC}_kG?zg>`KcrdVD$Yi=9}9WveKY|ArQy*
zKi<$Cpmc-_z0WZ?gHKj9T7<N+wjF!&4HF8!J?=X~bqAK=fvLJ(mh4L|b{uEiUJ4YV
zyWp8+D&7~kx%GgB>^a84v1fH#FM>to0UiC{<q>Fb8g7iJt)xF~oA5SPwDWYF<RXdK
z&w-ovpR7vgDP6}uX1_;(1*+6*gbAZ@<z6e!gA@fpnI~!eNKR`&2eVT_uk;p1!@;SB
z=sk=HNHPb)H#~c30~^>Z+@K3=mA|}?j!q}!<i_#h9)vNAEeU>%4%c5@{Wktgf9X-L
z<+(kI*OQs4<P2d40}7dS>513a69Ka$@O1_=m?b#HB$>U5PFeSw3h$@Z<-P+B4b~`6
zwyG_&SL8=$-ed~}^O|jh-msUJ{l25l^q-4;)i;FpEYXL|p9@ZvrzAZ^;MNxA^?gYe
z(mOqq5OG{Jyt4tA+I{Z^_I09U@ILO>EH4ySyqma7>Jz1duiEXOBPAf><QRx&SFaML
z)@`z|Wdeu_0Hj>EkKv{JRvXN*6i>v;QOtV?+okB>4wtPx0`n9x#UZg{(6ARAH2Lo%
z)xmWFMzG3Ork>vuZOhW)*Q)X?GrdYpOu*#_Dc%4?5T0$-tcs1$Zy9yvUcrNozBh@S
zr~9~}BwZXmNs5&?C<ayxunr=Q<?}}Gm<T9h#mZ4B{|g``Ox%vG@nnF_@8!#L96UV5
z2kkc~iGQE*4)znqjeF_&uiv%XsU$qS7XfVH$`aj>)AwlR8{Ki7?)$v|>l-?Qy^7DE
z)|2!kHBHPEx*(V1sfbncZ01cmy9uNPeb8L>PvCm(?n95`-GPt%l8z{sV|lYtg#P`t
zBrQoNfW?~iuePm}la+lCEeKX%R}TF1d-$7b1vS5xW>cU6udO@{V4Jus)@P~7;O^pK
zDuSGv`UgjidkW3^0<QS1fmkdG)nSnAU)ARAAs~ujO%PVpt`JsyHzr;wy^TN=zCn@d
zho@F%VVQluf`z`Q`)GY9du0$%2j53>7`9k;43o#!@8|14G^Y}dp5cV;|M3iuet%7)
zd=Z2S_bBy~WXP4n#zA{^9XdghpJagI%4p>1PZ}`J*+uc_NyVo@FZ)b{z~)GX&~*Lt
zWpm*4GO#oUVWa6Dh7-<}D*TJNvdJ?bbh*FeXa#8wOSQHcz5^oRg`n-qRQxykNV0d|
zJ~=zPykXz`{Ct+fhhO}Qg?Q%fCus4pzNl0GK%1YSa2`~n(50OqTqBJ4T6k<^ViK&+
z@j4kIramD5Ce(7f0kt?rbv#{AjRyKh%Az}{S4%jD3dcb1DrbakrtDOcAo%!ce?zW5
zsW<vIe(>8J(U<;;Og}ghm}JKKCBFn=hcdYSZYY=+i1a-s1>tZ$*uIluzl(K480-6N
z9U&BhNd9RnOR3_mShQAbzi;!)CF~ngx4FNVx0vQrxtQ0Xtk>4@MBa$D$r-*}4b+Vo
znv~NaZ7HuRn*uIaJc4$Iu2Q`i$J>^H%VexJEs9^Op5qerUSFNm{uWym*)Z1o>4$E|
zzNATW69Xsp5z~EwMT6@R3vC=;g2D!@Y-|kT{Z-3jTy0IB%XH6m6_>|+CN464>gY6G
zuYPZ5XMNAnIeTzY%s_fY*wDlv*1qaJy`!8#tYekEib2xqx?KFV7#;N&eOE`8ID1+M
zL|4Wh&PKc|R$U%To{b1!W|&;ZEFW}uUp61(@a_R%k7gyWB4O9d!T;(XnLh7vL!W~_
zmHqbr{F@FAui@T|mg6hIdecQ_EvHK&n?v=mF*;2O^Kq*0FiK+<PBA+3i?%>04g<hB
zA3Ja&bO$6p1aU4OWKrM`5E35tOks4!f8Ut}r!O!4^Id;@ebo|d>k@MMD~THj;fA4|
zA*XY8eWF*r)Ah6aqjrZnj_REmgS}&1#%uNOs(SK{>6gZh|FZBwM5`}qu6tNVTb<|p
zBl{AyCYFa&cny<Q1N`*7vUg#gN4mMF7&xuXyHRB)^5##t=S?P8$*d4(tzCI0BpRf;
zY;IqL3YZZ-E)5=0=Lr(`JIc@BVc5Ki#*#XmpKmVO#?qmMTw8bgz1ABmzWLL>>TB=V
z%2+G5^G1x0mtO2#oMbqg;*B-MLD3@*va*gtIr2S6;#ZgK2p9W&gv0okv_~VAWTJi5
zw(pl3Wxbr<TbyN|@7Vk;*NBE!l}tg`Ji{mapP)YvuUeb?pbXCK7rV<G(tdm>x9G&a
zFLN+awhxyum^=p0VDIE|Z?kL;anqs`1f+aGqWJEgSmddkQ=u0$S9=tguLytX_(X+C
z=L#L$NM_^Q6EVL=oPS@ZQfKRhD`bQurLwS<g_@lM^Tx<t&6H4Gp~V)DOJ7-{%cY&V
z`zFL0zMqe+XnIbCFSiHbr=`UELOUCEGiREif@$hioE9GS98RvXx90ZP0Y3_IXZ6+N
zbhtj*Jl7|iDerJ$n{ek3cd&Sz84F9WdT7AOqT9h2{@Xuxabj6~AbD23a3$kTCY`?P
zQxKZ1lZvWuvgD^~H<!ht`$NdaKR8{|ldknKQZFZOWBG+kBE>QAL#xXz)BzY}V=FuO
z2H*QWaPcd|im3OwjWF6o47X4)id+OpLfp=|%I8H{(cQkuk&mDTX_zeOx2`y?0tCr0
zNY^>H@3sqdupoIPr{Q3o&0=`}bF8CvQ9;hxW2oeygH~+prECd9zR;-pU}Jwt4{y8k
zbN#(xCkD7IJA+@E`aDaiEY8ePa_9db>owf$m%px~zVr=B7UQYZ#Tfi4{pU-swqP3_
zEV?gqIfr&;(>fING~xG8Q}U$e&HHGr^hUU>+F<v`%()bYqs<75<PKD1V|rSg_5u?(
zj0bKU-N5YiOy`ZQ)VL%UPpmYW8IC`Yg)MO02c0rGyL4PXo9CpJ2<n%(vreowcn~hQ
zyX(NIipZTdfhWbT9CtjYdac}U1a#*|E8XWs4%$F?nbE$qbNXSG$Y@c5kHNeR7O+o7
zZ>-j5dI`@`UFUA&E3e?`)r@NxTz~FOd3to(61MTX*@(E=BAkUfcVAuH&R-}pZ`O}L
z`tDY_&h<HFx%U@#%_p|56K9S7IC`fb6E@Yn`Ur7WP5@)5t3wUNo0?M-?%`cSp3;dH
z3DxT4BN_&W-(^=Fau)mAYaVdb@PN9THMy9(k)U(sK7l21Dy<g6q{%TjI0ia@{k0gK
z?TQo6zQDgpv^fA`>HPLgOiKx0eG;6>whn_=wCrA&hLWp#mY!<lE)|S>rdWxlz_a7V
zC0D_wUG&+XqvIt$;re=9Lv-)<Pr2iZzW8N@3-ym2hpUAmz!&f@Pp(&D<;!E4DF)Tv
z5_=#7oVN6+DVz6s*c8PZ#VQ}UzbrK+r2%9~T<o!qD)p{?G$gXB>EtmwTyN+cM>J2D
zm@^gPmM#V_=8X`nqbBL{UT6S<O07+`*9|+ru4=7SmAu2!@m2^AJeBwbL08HB=qp*K
zy~61^N=peB<A1>eZ&(VF>U@>PKPajsVt{_J@l)8~&8M=CpSQqV5i7*6=uLSGcf+no
z4`R+n<Uv1&d$pZ|2F_>mk%>;*Sr@6QvYb458BkPi8ckJIRaSBF&ocuX9|tic&V3`0
z)RlE8HRl&kxZC^=YjC6^ww};^BOm#K0}i=g)X3IW*SKOg9VXB702GHirQV$5(~wL%
zr`F|E_5NGzj7N>^^p)FV<Iq$BOd<3-Ygxm<_60E?%qsRb+J{1-d6oNvXGG(`$@S`V
z(>R?~8jZ@($}>e|!_%M6h-f1g=Oy&q41EFFC)pBsuO?|t{7O+UXu96W(`ov|Jap8e
zyQ15TvU4DM`9+R82RAo4!_}ztQ->zkb>;+ddo{}6!{2MErg&JT;a-08l&{65NICT$
z<BZtAg>~*_?euhtvI0G9TbvK$HZOAFdl5ap7AZe(Oj&OIj8YYhX_0n{`hgs+g4E>X
zWX(hDJ+nECx#Pl;23~127z0YtL*2$1UUwE|BdU5%4*FSj4KqwGb;f<@tXV2Z+JO<>
z>-8zONloV-y5^Xui?euslOTM=;Jxbx>`E~>t)=(vf?&qJ57Zj~MpBf^3#>5A`9?fT
z&WWfY%gfYD?eWZA*YQ}Gc)+7qUJo?Zxw)DW_ZnY<!{K^KpE3P$YEusmtT0%vai#4q
zErC5Wo~buTu{Q-lD7lC%T2VBEsulGz@_tC}o9N@K6Y=(~LW|r*4Li#VTly&iqN}nA
zxw)5uf`hrAKa7Ylen@4}O-1m#tVRX)B@O~bdq!x8?GB{HI!BubHq$7JwV_HrS7)FD
zV-V5ATisjQUA;PK^S;1D8Q%ipuK-;v6zZ{M3GDcf<3U`jba?ZnEzOPXV~|maZX}2)
zKE~Tya39GD(q0(xv9Duv+3zy(=vv4Rma;gfk6OUb1WFcypZVjXH+NE=GS|-$3xk)=
zjKsRc{lUwrM4_6feW%+>gI@(Y(nsFkn}V=B?kXqL@PD%L<Es=9V%vd}^KNPb{z+9u
zMdkRv`b`|E7_<TJlP*vWZpYDm1WD2`Z2psd0g^<C+^uQKOj@P3Pus3Q_+~qB%JM!?
z4g25F0N91U<vggxEiB(|uf%tiwn#p~^Tc-RUHS(9BWQd5AA+_-_FVUQbI`{tO6}Bq
z?wk!Q9Vg&hG9Zpy_6MXwrx7$;cPRu-TbUn=dldiSW~dIJ1*jEkCBxro6w)i?lbV!n
zd9bBYHFGwMdc>R%6<9fU)BI_E{kmveLCVYmdla-C_e2*_V*+gl5*H<K5`&<h2NcwP
zKMsR@OCMp`o8%a5IKMGOLAkFA!|TkUsFNpFIP<Id?c0a1UrR-Co`g4U{L^1k*+%<f
z6ARGVTbmdeU9`8)H$M2+#xtz0fk_=8EkM6`%Gz`7*AgCVsG|v#bRs#fTY71EZuFWb
z4&=D?DN*|72bGyO+dVaS{Q$PZq~!sAr|BMthA5al{^^!}jH-^%-``(FSNEXvEmBg_
zu!soSe`98he#lBOd}tZAI6adg2zL0)+mE5${Y=RZ=@{QW=D$~-Ad3a8Asj>!2mU<v
z4x}`g?{+Z4-!2^lw6U)ZCb%tY|2iG^z3^sXl(uX47J-pp7j0LOMU>-2*JY%C6BUNe
z9=+ttPRx(w^$kgY&y7IlAfq?hmK1PYzoP3{<Zt!DGYN$7w!|I9-)O03&D{0@IP|g#
z3XXYu&;NDm(@0>_MiS;)Y`Q<+y}MghNvZhm(Z9mN1PutN?}NZY1Nu&@UL3H(cQLgB
z)(<6#G9(9HQJ#4Ss5}QJC!a`9d%7w@r#A^>xJ$`-KsU6-rw-DhJykOdTe18XY0dX7
z2S4yU1eFe>PFvQ)htERK`O-g^{Lcm?AWCHZeYWhH;C90yJ=3EHpGAs>f!-HcU<R$N
zx^mA(3)xt2dGOir;MK>Q+cvh@cla8OG=GT)zRJR;k7;jLlT}s@O?%3}Z_AFnsy_gN
z?)wmQI!ogb_(sd6u^)fYU3VD-<s6GN!tGy@vezRq;QUwzKPfv3xM)LXXd=>K$B6C5
zBYx&P8c?$#rzK(7+>;xCE!77?P(-R|YMOS}{U7VTr?n|hIbPy(X&yS>ARS8q(Jemc
z9VhFxeMLS4as>vbJdnW50Hw!(N7nI|Rp)|T*WvCUu<@P5VAW@&{v0<ro37Mdpfp4?
zRulKBsi|4GxVZiWJl073Ly8};1nKN?y>hjXGi$EEHApdkB(8$jiZ#4@7y0?Q%K<0#
z^?n4AZrOh#X#c&7KDq&y+oDBzwYT>l+7>NU0NKOHNI7rss^McQ8wJU~k%o%jh;%Kv
znY{%V1N<6Q_TfYEHs(kISNT{YHg)*1N!)|+oa#P-7(5vXPvIFMy7somcxn(BD?m9i
zt4Tt)>^RAq^nccV^}pAill?mkl*$9_cke(tB!3XJ$nwBc3A+0lGs1GYaS*cIE!Ts&
zx`w8va8)JYO`R+{Ie}HM_u7QMk!<V%BE$|$o+IA+_)n`D0$*Yeipktc<%<{ZXJuvm
zn+j_r6I-48@E+KUK!%>&D>nsf`ovJc2aBy(QI|+Sr|F&aFpeD&|8UFyACdlb`afbX
z9&T=RASVBfss@pP@<0ysOh?QOmu80FgJ33b;qZQfv|YboMZ#iZxe;;PMg=q*t7@vk
z7KS(x?K(#<vki9LF9CMl4&$fPn+F4bIu5d3($zf<@iwv&tDYIj!pf@kFG_%xrnM<+
zWN2u=*PdpNTZmVh?yIb%T)N}SMWhcCQ-K;Mynp?u8?HTI<LFO*b3^RI9Eoti;qIq4
z_!YN9U!+%wd;9r6aSQ-WfZW2NPPonJ@ZZ`8HQfOi$(d&<^9B`v?LCEf3B9R`StS(b
z1KIr`^ELo7c<(msTDItm-Z0_I@F&i<fi6){1X~z{Pxq3VumxYu<Zf188>jFfGw8U?
z3$-75AA9yUan;599WE>j+N~j&;eh-G#<F~7?^*CyzTgM)Ev-XtLwk~*7Fl+yz=)s8
zUU}eT@L@y>aYVS%_naI5eFfHmyy<WCr>(Cfz<Ge`X)hE)(H{2jq0zr&nNn;CISrpc
z>j<#<$v!)Ph54@4?#5po<5%giC<mEl2mn8RhOezp&kx6WOl^7U6Le6^d8^_Jc8KsQ
zP;<&3`CD*aOT0k4xBf*~SZ*au?EHsJ3$&X!IV|*5LVa#f+v0UeDB4z#S$5}3M+=x;
z6?^MXMkkk}U%9DjM!RVRYRaOPut@yQqB?;@V~>I)w?uKOz_Whu->WpVw3JL}0jG<*
z_m>1<VOK9aX}knWs0TQIB>O?BwNzR%ycz}_OvQRZQ7sR3957P93yQ9z5KhEH3O7DU
zQVKS?%xmcrThBJAY&ICC_6&7-n32f(7cIDl1erwa(L1+_Sjh-3jGVc-Injl~dkGdv
zb{`VcgnIUxz`*|~@X=n*g~yHYIB2%P-}?oksyZ;(@UMG5i3C^hT4>TwnNVsqynVa-
z-+ZltAt-9_8!Q&dT0lHlchKSP4+)|p1E>5z4JHf3#Sqj{d<^bz_>5oNApVokeZ}F9
zdj>CZZSFrr{7LB&Z7HaHC3lnJcKUiOP8CgD{*P5Bf!%%nHYJmFZ`U36xMO8yW%fO0
zY4p?QnF+0F(EtsrsOTrxp9Ll@k-%W1RKHn5M<7PT-g{z0RV3+;uyv{fqFWhR$=xIy
zsuQ_v?IIQqjt0)VlN(=jBk3A4=OV4mhqTbML+j_}#&$&yG01+6vl}EjLX}1cw;iTq
zQ`zC_m{TzmgrJa3H8gyL<Qq6z*`<sg8)*3@B)#BLs0-Qp>6e-biHV7!bD%D!1F>5o
zQ<mz+-rPvN2{VLT8d>+Dkd<k_uYW_Fot+)U^KAq_vZAvx*`GYzB9&+Rf)|6M3$vp8
zBs%nb^TL<Wg*ofI|GIE2A=n#)!BN$AKK#FupGH#4-qOq3g{FHh9|b|jLueyq3MpSe
zKgVX<EZFHvt=VLLuK)RH>XRX$W62q7ewRYI(y-lh_M73=j@$g|(RO<qZ2H%BBlk;8
zJks_=Jzej4F{s#I{cFXkWDrXkr>?a)-Ot3<=n}5)z8a}x{Udv54-f+^-$BfQ6wNT8
z+hSS`+LtC6O27BdOwhkX-3cnN`80w;W49*rglHnrS?P5M>b4PK6dhAGp7aJG1W!$%
zjR%?+n20m$t%o|@xc>g(4YJ+T4`i5f(97T@%o`n5<A#J8Z8*ayNaD`2?<qEp_8yeP
z3HCkRy6jXm|F_I4h}6{H0+GnG-<oT|*icl1P2rItK8|RT0r@7As_^(K<In!U!O%1M
zAUzd3bI+Oix7O+iQdAw`xv_DZe;@kIbef^GDHXxr``_B82V@id)dons4l*qWsed?Q
zU}SYA*Uv~mVId=m`U)s4uW!jFY;c;5^rbdVvtcl-K=Fz9c>V3>86;7ATGLm#WRJUK
z)^*hUMkd?eL<|h!Fp4<dhhgSM*AbXQYV0j@z;}eOcdC}Y9Y7T$sFJ%)>tG^Ro=qvn
z^v}f~A%%stG`wI4J;7pVQ_T;slK*wOX-N)>I9^<s`fTBr3@Rf0M8KaDcH|#E*tM>&
z(xd4HF&REvz$VJluha$v{aQr<Tjsc2?r-&Ht};SMj++5jhCb#R9IbolBpWrwM(N<U
zpK3$3Nvj7cT&KS`mk}WZ%LuK4>-5u(pPf40c+%dD+g#&=w(#NaIR_alXo)VMHW}6=
z;}0rf$PH<vXwROF?bO8s|23H`@H^7s|Mc?S`j(a`sL*mRT$Gaw1J$Vizr>nEyEZox
zb?IR#MR-}-af2$|5SSjI+M{;VS5klotU+XuO8#E-N2573qw}Xl_y{LS`@kMQ{B!l4
zL_u9i?&e>+oAtMR!&3ZzVhVwS9}J7@$b=rUs(97F9)BE#@kWlc{V0r+bRGQ;l6!Qn
zL0cjuLmsmK<hfL(So1#*`xaCUf)$iH8#_EO2zJ`#D=C-%iYzyNr%|k)PN`)^1oc+E
z>@gbG0l%HefXy1y?puV3p>dEMjl?({Khh2A`8I0T(UhnmaM}>CUW1qx0p1M_AXM1=
zd=gl13tKw#&8ugis}HBxZM}N#W#%(y3;^?ZRs86`WlzVTQjH%sZdH_ra+1Aa9%eFx
zKKnx#5*Sv4*mXE{GT9L0<@NRB1T4E+H|FTjw)+3MJiLDguSYws^S`418f`<EJGY0>
zt+_KYShL7H0?ii;o0kG+*1^#V$eY{GF9G+;TN9<pw5q);w_riKP%aMev~T1RDs|ZK
zNsaP@TOYe&_#b^t5cY)h)}GDpJE2aAbp+^Ef$^tc(zG5w8Y*@KT0maRD?Ox{_XAo`
z7U2>Q^<?zuk!l&Fe1G~v5(I&_-eTBT=|uDx+V2SejxG4e-NpP{Z>ICU>BMy-qg(&l
z^?{z>U+j!y>5TVYZg_NUs<(^}jCWA6Dw!}wr0=upR5lbQf0yzn47uYqX&Y*7INyGJ
zaJx;%OOf~m@@fP`7;WSBgTI3=K9F!8yQHFW1hROfN7{w}=5HjbR13)vQI7z6uG-x+
zYzp_mqKg4vq^R?r@LBU51x?Bizkb(2@-nb$`ctm@t;6*i`8Oa4KXVvKEMjOC-i&q|
z4?v1#Q>nZG7?{%5B0Bna52MSKfRRH2LrCUrU3i(W)0o=EjV}}3-c5f5N~Tj|H6Rth
z<Bt#^lU&gZ0SaydK5)Wk6gCSH22@h)aHRNaAaV~WF5m~!`7Htl6nXdV-M<^snn^+s
z&_$TUxz#?p(wcC#R@R~R9yLU)%QUSms{p?6prORJlh&2<8g96!0e=R2|3B`0KiO|x
zpXYx`B7Aj-VHlO2QtZ3$kMGdN9k^U!_X?&iCDn+XC%O*9IHo-k+77~IQ*~t3+*AcR
zlT@s)t$<c@=9QwEQcxr)m*sEnAgAaQU81;yRf-c|#;f%PP_xD;>g0&mu5Ye3<{ue^
zCO<zv>&cUCe}faf$4<Zu*JBs~{m}{(+j5|Wx1jYSh%e8m{Vp(hskzVLu6SmF^Ospq
zVLECmx(+9_d;kH&POHWz`-R}a2~U*{-l$cR9)>i9nkyO`pBs!0;OAxkQOkt*(@?2M
zEM;tzp)qW5gh^VeMtt;l?*pz&89IaO-BHjFH9}`dPnFhEfP6a=;)3dl=N20Pf}bcD
z<VcG-g5ZAXoJLwof2mH_N7A+Ul4#&Gx?3S*$Nigy1lk}Nq?lo!2p|o5YI7fsTxp~K
zi;WP0|2Kx5CjjqklREst9*lPyf@ry}9(nwxu;uk(U+@A9+;h|j;8(u`H`;X_+obcI
zC$&MbZhb#n?JyN1fma`~{ORL9g&?7jhx)n^qu#v=@;N#1Upu4aP2d3~Qb+V%3-)?I
z--p2qjm%V~h5Whm<gRBqAwic~V8X1YzMw_IqB{kK_Jgpe#|*4XzwB^>)3=)GcJOHp
zECztn?1sFGm#UzEB^-;@KAV`SY7*j&FJew>Lx#Vg%oMu?^JK>UQBhs{&+Yb!hz(8r
z)`bWjS^!#>vpj!LmOa)832>OHo)aP|D@=9wJ-Z21b41-CkGCkoadIV0FX1}eKoa`$
zl%U6gCB1;@rLIS&R+jx$m07xFe3rB9F}626p~JayEvE3t*I?dAI8hqvN1p%o0w8u=
zf|T_T2=l`URT*3_#ck%~#iIw9u(*}G<(!iM#Sp%96zqa|nVs#bdmc;XN*O8cUxyjj
zWI$sc2=05;21x(+p;kc@HvE2~!65IE$Ol_$r~yZ$*J@Jdcf7m&;vyuj4*~M)TdL_?
zbxDlThlp;4CditTkW#^qPSNEsXil%{4uEXy0YJTIjOMa3&{xMG>qMdCq9$VqOuPM5
z*@*V3woD9fn|w3Ise5yHCo-UNs(jq2BSSsXPKkshN=jq{#<nk_9Q^Fk9|3j}yryRy
zS=+d<rAKh5Y>Z3Y1iSk`QJlF+hHD%^rg$~AP&~;&Jxh0KdT1B5UaXkM93Et<$%CjS
z;yi}iI^|-=n`_c?sI6M-CFqs+0(f`5l&W~^5{SS%Oe2wM;9gyJPNowpCOrAjpbQL4
z`#qx4%)9Cjb#YrMZ#ki5t`zIw4#4{)CBrc*KrqlRfrFPi8jYeiG4ZXUb9zBccM-C?
zaRHjbzI#ykJ>NT0f-hmAm>hlX@^g+(QJcEx?d1<(?j6EJrb*F9-+RNHo0Js~X14nI
zGO_z-gK7ok^hdsH)u6a_7y?dt)=ZM72d2HP+JuAB&LvuiHM3pAXJXsCP^^SJ<`mgL
znl{R}Od>~G(#n`e>HuX&0ivCGqIgR~KEU7yzBfva{$&?;-LZOLx+mComdG(e<3q>(
z@s7+9+3%u&qsIzea-Z1m7bot~2#CIAcmK5zVHrT$E;OAM-5%%ql@xgdTn^{0oC_NQ
zbnZ>9I~awDvp~y9(bEigWFt(%(>dy>YxKd$3=#nOo{xhZIRpLO&h`}yn)Qg}HJCEs
zPF>kKaq-O+0==RlsGb9uJf?A+Inb@oNZfrA58Jm{jgJbS_1F<nmE4_}v!yyIz3`i%
z+!+Hw(S?gplOlTCmLz$Oqyi}WxLZ%)v;6}}vVLQQyL%<cLB<>*3E9IK<f}5*-peak
zyr(AiGbM%M>=Jk_dL?~x0TtwhgLbzrTN>X4MueA~LE!#$)ylhk4!x%;D;jA^j7^&C
zM7QK5);>>rn+#p1y(TuERWJk#w)?ai3?oZn3Q9O3(nUckJi@F%^90Nl@_gMn-xAF^
zjez;4$r9l7p3bJdrFoX0%RAC|^bbK-$;;nx8lR>Qf*3wCDK+@rme>mq4{T)u*D9&8
z0Fjj^{yn-Og#?OVQ{Xb$WBm3c0K}u6Iq@jnFc0YZ*;KD;0O5ZRQ+E*5mkQAW4Q1O?
zM@~W+@x6_g=ZQDRHKZQ~6Do}cS7^nKf!_t$X$>IXa2)}SQ6H2<xta5FemSRori}2+
z%6y%pU6j!i0L185E&BF#w<OZKa%zZQR<9N=8!$0~*T>mwQ`PI<Q2+R}TB&K1ZIY#-
zzBMqjro{u!4!+B-&mbfny8hrKzSKLd1i`sZk)CnOoE%78=WcFaZGDxo$-@4Po=NtS
zd4h)slz)hlbIo$6p9S#&j8H-$@{SJd;O-%VjoR&P@}4`N?=7<14!{n)u*(%qn%}hC
zBP%Z-4sb=h6?n=8BIRis4+AA&102y6W9xAbv8EYZl`!j^BM~qOL-B}Tl5kS;qT*R{
z-6Z|eC?;*I4P3tvoAp&JeW@Fsu2}l^#2(_n!<?^GPm%S8SSGX2>U^h!2ON`ndEUw)
zRXSx#z)jM+jW(P?LI5i6IH@XqVN2Mxy(bAX>M;JS6N164x2hl5IyG9VCCU4w7s|}Q
zFj9dl(li+O<$wf%UWyaIcrx2_0C)khzFXL%y9hzp?$=#l(gYkG;gNZ-LyDZMxTH|e
zVsh|ffK>TSmG0io@*^o&g;4`E>jS*;Y)&N5To~)>)dgR7c8y!|65b#wPl2$hbTCpm
zex6JMMS0~|iB{gWk&%&Lec>SLG9;h9iM@Sby5SYzpKH2TC^ya^C$zN|DWqn<YgYWW
zw%pfMU=oV!=ll{>wG;y;DSuCZzOF=+#E44e16>u@4GW2^(vmB_kZQFDK)e+O3HG?7
zWEpok;RMX^Vz9TLlc*_4(p+#VGF-O@A=n-L$`L4_X1m+LXiTfpy+}FsGbIv;0op*}
zdS(n3AQBB?L(rwMtrzNZJ<n5)OGGz|`#Cr7=hMdfXu79J9*Gs#6+=9-M)>qPda7}=
zQy?N+$oZD%=ZkgJ1p|VmwUueF#LwS7Zc1U|IY!_`)MyujKM-(jryYJ{3iuNH1kGtE
z4{KPz-k3~h^27y^ZT)TU@m82*MMfqk&w>M;5oq@}5Gl`HIJs7gfme~`r{ZQ)U-hEI
z)XOF$_7%QtwO;T{2nJg_8iIp@2*b1w2$(XX@^1Ur$t+VK=Kv;WO_0?ic7)J21Jh(n
zmhwtU3t5EGk&)k2r`vZzfTk!npG36`v`y)%0mC1rku{k2&o4XUMZ6Hf>IPla_ObNb
zeWj2rhG3?Bjue6QV0%#CZ4y7J%4CCfaS6S#82+|Hpn>Vw^FfOJ|JcR6CTW>+;2rVL
zPO#0aVRY&JQf8Sy`V(;tXwVlwDn&Iy2vuGfG?jywC4ghXJ0BqQ|Ae1`_mZ?@M7yCe
zK*sqFBT8B@lG*YtIhmy`;;3Mm0K+hRvk0*3J)AI#BrRk4Fe9<M%lVz~NIjIq2QE#w
z2VH8Yi{7>ZVOPXSGhk&E3XTRqon3$0Er~9BBCE6|&Zz?=;C|2qCG%IUA0?ipY+1ZI
z#aW)}x_#_zf;?#vXYs|u>vBlEc@pR6D7O^OizJWMyuvmdNT&R*ByUMoKS}Q*)I&Lb
z3Ugrj3Y5N}UO>ZBjIRM*wT=BvZORN{H->HQu>HJD_3T*<*h4cTp>+957^^%=EqnD?
z-&cDA=VcE??+OO9`~#xQ&|Us_B;_wBfQ1}-mJ~v*NB+5bZmdIoACE51V6wgrD(IQJ
z{F);ppp996!;ltrso|{%mQv!U<U6rhg*3{%#+97)Gqs^i(+;|da_itMb{Hvol)c0x
zP=q##IJt4t6~3c88<y`0>Rpffi#s8al9xQA+e#~vB?m6T$R_A--1l{gFB`3?y`S0A
zxWPInj1)%nuTHt7KBt1_n}@pfRwdF1$sDbkY2-47yrX;N&BfpZL&9)&<w!sVxw_cg
z2JZ=pl^8a3W@2(8f%Dq=IfpOeX;>vxEbM?FmKECc>z}ghqOv7fJ@Ww?U*F}6T%dOr
z%dCah8T2_+F!}ttTp^^$(B5G)pL*x!^13qSio~}^*N%uQbp5n#s6#jg;O#3D>%bm2
zW~gTx!F|jC{T76c%$Oc!gv5;)e!Q^*B!m*dlWtHks$9Cn9R2B1l__D>p${2Q@u@&i
z-A9#bux%NFh192X%Ox1%ABw=}|6oxZcNhugt@{3U6u?OFJFlY!R#*Dh^`lQ&jXjpv
zlkQBH4o`AIz;%&ln|ig=yp7Oa80<aKbQjMWGJiv0dl|>m^IP^*smAZ}r!GDs;!S{g
zq}&$Qo7YJ-(8l2b?(-j#!=d?HnvGw##CI(NJOryc6#xOo5pjn<pahmlK=}R*NogW%
z<$|{IjpX$z(7xoOx;eQCtYMaH7FamI!$&NkijNj~GMVN-J=9tK_KA>kxyv-qg+p#e
zt&15DXvBq~L0EO+_pSg}Efhk;?+iwpnrXME13!&MdW9Ez9TZ*24$yHfY0_AA$W+^6
zr7H!l%z^jzEKBiitGVg}^A&tx)ft+np4G9Ci7l5ybI-oHuymS$=FI!LukTXi@md;=
zTFsQM-dzat4|vv`j<i?3ycUq`q0IG@#B{~1(fefC#LOwtY~1=Am^S(8sFPDO56Glz
zn48zB*Q491^#&cU(!)z=0s65-!op9p=cl*Er(n?Guq~&WK}V>gxu1O_y5ko=fOsFT
z{_zqR2LDp0;WFn`z*c5XO@cT$7%qSkDDWLE8lRn;?mwd&Zh4;hSq&7!?Bz2lKEhD&
ziD%yY28JXsmhnr-BTR`2e209O8`b8<JCzRshUv?;_OtFxBMeC%NAe-)cZn=p>g&I=
z_-Yu@UeX(e_GtPc@_A19e34V&i#p8>Iv(9)AP~D_)ak3K$FaCH5>NTe2JHEN!Q9$n
zyM@XWP$<$EhkMC5+Q(DRrzJ)KpksMX{2ES?5H4@JbdUmY3nfX<rCnYvKLU@2kVLm;
z861ihcDTM|JGg=>e3O1d($ZS^zTZLM_JgG%&hfqMg9#0*Ja7oEWOwUc&(K{KJ?kS>
zngS(y<m2lx_+>iDYPfu5a|)<dt$!3IKk#K9{>ST3U;VFd*U8@-CVfz6nNzgiI=X31
z?Fw{yGA!jDaxLDQ6R*`@9${bsg39oTFI)a+FmkG$tOS!?*t~;`B#xCeCH>x9Ps5hL
z*Hc6b;Ll$$k!}C>WF3*F9!LZdNxPjRLM4{#3yzGVmN{Ct+%X+BAnpqj^mBX@(T|?B
ztX~Yqz7#QTd>E*)S}0O$mKOU>>oCSgqY#Swk3THJ%tH@}8^J6%tyNz^JXTi(#^iSu
z{eY!zf*i`=XrL!u1hSj6C2m|!5p6);e_m-FNejsY_*243gHoXSTzCXmH1mP1RrmR^
zhOv%J>G+X6{T;jaGnaq0TS}bnG^Z}nm#yLUm%^016&S=b4uKqi%v>`U!EIePEN!bi
zD}D&BIzLlQ^ANlj>(8FOsvwCmw)&W*B~>}YHY!y}11mP*?g#hW2&&t=2Z1<;jHZGq
zNoF=Yl92hR4>Ut(&)3~Mzz$Y9i<Tco9<E0{onKA3h@l~OPgu`s=e+^g;z{NqFzt<i
zCDw6#qo&x{F{HcB2dcuBl(E(E^Wq<kdcZdC4)*P#dx@u_T|MBz$@Kn$2ACbv>ebd&
zfs^Xh0<*C1c6>f$mV&MS1TEr4mv9IN{tDMuL9ry38GPGf4*J3<>(AxH<V%2?OJitG
zaf4xrJp}zAZ-R!YFsNI!?o@*^-C4*=#{+rW2*6ih*3zNzNmGuu{$v-^N(C6+Bi3a+
zXF}xyKtS#1hkVRimggY5;j)V?%rN4HF`EW{_^pWeeJgu=`y2Y!LJ$40ja~4Gm!6~}
zgy`k2LXcRXymG4c`48YJAAlQ+8`BI8Obo$WBOZbXg!o=thpv-4hTA08Dbf>gb^^OI
zzrNqZHAY2nM-MQVznO&!PF>*6N@h+~80dmnaZisd@!j#x)4}WpxX7xtxFRB2Ept6y
zplyND=jY9XKEHm%(eep4sM(<N4_4g$ecyfK%fFfdvS4IvOl(Ppc{&B7H(ssxq4EJ@
z|3`N!MoR<%1r@XJ!hvWpn9Im@?**A!6R_8`_Y-uzM*u8og0i0O^40XIoI7t|uX6W4
z99i3Q;oxCZ8nCeLv^<Wn11PF#b+O+7`_0D%4vgs%7>*E*oma=1ze2<JsJD4~PHaB<
zS%w5epyH9#y0($o{`EB%&@Z?Q!D&GBRDu<*V!A8uC@!P+tjn{na$X_J?3UvWN;J3O
zestbcruV&ifYYvAJGcSaq!6Yu9UBjB{|^~xU@B^$URLdy5--N$9>l~<c-5nk{ogg@
zS8YiQ#|M^9<ojPc7$f480VUSU4O*whU;yqUYGPu-mv-gXU`41C?HRr1&>OxHk|3EK
zhQv<6kjj-7XZw;g&I;I*@U(bu5$1PKZZYH@zOhSBuLyLUGoe1ejvDgnS$*{A-2`#>
zP$ki#a^n}g(_?peb9Fw%s4JNDcA^f5p-2~lkhitxOy0kM7HG%@y-2A~fY8I|Nq1gG
zmomtbMtM&3hp^e2hYg|-Q{6DD8P4cb5&eul!!!{G-3*<%L+i3UPni@x)mdTm-BK#R
zVuoOTjTX5@w+^W(I)9|KPz+)#L+YovTkkIYFp06d&Hi)&tdvP;zoz$BxD}ZAcVEhx
zR;Z(0V7}b-6Ovv%0vp=a&kqM<UuSXgJ<o<XT}*FMu@R>aL&u_^us!ylg$3PC2Vr@+
zw4I%u=JrY>-Q-M_TUPhC4vxRh^~Ij}2($I~NzcA0$42ds6EIWBRm7V<!Yg03@>vq)
z?^@(PW;3}=MZ%iEr8yQ93aWKd5(IM_0mvILK3zV}1M1b8FLiyQWc!ZahpNbfNduRL
zb@ztBVd9BQ%pQ<ehf?Hx#ajW6832=c5z@ZFugseg6i&x&Y|%8&(||+NdZX=yzb0*b
zX!M>IK6`cy#{<P2t>Q&N?q&aIct?&uIg;z+=**TEr)|nkL@vk=9)d<E!D{TKwt?pl
zf0K@$1Oo4f^298j`jlzL<tQ}1;1%~U^aF3__{yCZ6}4ci2F%Verb9DTRcty{o^Gv^
zB0kZ$^x3P+#9pgDt>7LAeWp|EsS?ZXBgg}`)v80C{_Ox%;xjDkGBXFU*tJhyy3~4;
z`%=U=Ht=pJ=L98>Y$z!<JBUQEpcJ~}J#Zg-;v(<Xts<hlBMGwf<<YVFJs%5qGm5AI
zw0h`+?N@Xb<ozycxT9P@UFNuSvhLuuZXSZEy{#S0;8Zu4aC6aMcoufRL-bk`W)0pe
zXW%jTx_^Kgs-0HN$w_HFF_U_H>~$YvYwICY4STu%OdB<SQqDI+Os7jF@IvLllhbyI
zrsr&=ku#xGbuV=mNDp;UP_$H)jICmKdA;WXk)p)H4vVW}FefARNszk-8zRoj%ZuXy
zH?1fXBtL&MSc3Af0W7KM*3Db4>CtP%i+*W@u8a#phkomQG(!q<YDPz$CAoWKPGHfx
zS2-~kD{{b$bkXy!QBn8BP@M;^u>lV6gfBQ+H$_27R}XFqjhM1;5_hoJ$L2fm04S9_
zgcHtjp_Dm)G>HEvR#4@tN}hQQSX8xfI6XamZRQcpQ!*Q9DHpLLEk|F!{ct<KDbYdp
zRv5X%OTVg}h6`7wtNS+tidq8frNfwmb2drPzs!K}{U>I2KS5{>C^n|bbUjW`=-sRE
z{Q6CFy5cCX0p60P#^LJ%hiw36Aec12u>cYCo0hN|ycA%v#Qwc3JMn8X|Aw(q03c`Q
z*3tQFJq5)9EBMetU`bZNuv>v6;xA~Ib}_6$b_`J9<f%SiI&{rOSDMD&z-wN;47~3u
zn}7Zin|;ea4EEjM)5+!~F}dnFhSC^<j~%|RX!VFo!EgQSd4${M$-Qd<{Q&>F)8~<)
z!A`4dKfb<6%v{$f#06D7)!;xdmvprh6<G>Q@Ddo*h=5D{FeDR~$(KZsOJDMbOKfCI
z1k!aX3UA*E(xnpZT7NR6{i}aNw*A84ah~l-%MH1uBr({ih;fY}tG+nOXHG?ImA^{*
z9N)ws-zykG^R$LSA<=|2zTlk*nG`%SFiP4%aqt*2#I-vE?xs{TD&@8Js8C|RMb*lZ
ziacMSyE-TJQzH~q#tx)5{o02PGsiWR2P~`9qJFttC8Gpqv1}N1?hGopqhuFrrDtYQ
z^Tl#}j1IdR%oZD|oZ5bC62!F20d9w$WE}zYOAQTCwyrwGl%F#P(N^nZY6M6S=_((3
z<|gJGg<_4$GF(}&)XqEs>zt9<G`?a_%TZn((ov0zqOA0JvSc&slQo;zfL$BDMWgin
zSLKMo^!iVz8TKg3%=1Rq|7sTM|B2ZtHuWJ*xjuR5@cG+BiZK+XEDHYK^r{%S4qD&U
zrcL^MF$X(SXH&J5iU>4<y4W*5Rmi=RVBR_%P!?|f=F@nT<*FR8_m83}M79h@`(_f&
zHS6lpzsLZ8jdEwFZCnR7u>U|$@Rp0~cr`~Ii+WuUzG?&x7k*F*2lbb`_41XY=(s#H
zC#bZXL4J6inu^TG$1yo21uw+|^ex>t&ICMwY$`rMdpuM=js=sbRz^ZJ&RH@4QRnQ=
z=N6qjK=ol;POb9wKm|CWnnoH{u5B*uJv}=93o*rM;$F53-7pf~R|R=8pycz0sYl|g
z(5C*jYVi>9g{~QOiAATPjx+Galf+E_<tP}R3Bt}~Tq{U2{hEVa9yM@e{RT(rW3|Y@
z57-5V?4^Gug-U3Hgh>_Bky4F!DlG)Q!b12ira!rIDvm_yIcv3A4Rfu7`F1^mHme#P
z`W^3zRKL&&?HIWk_vvK>9s?{JqHgotwVvqJUuYK2joD3q^6D+n{C-}iietejI%iLT
zA;%!S#gaG9K{>t&>aO8TJ*Rjn3`SAtCJg?A&Vv>e?8a<3<R6VEO5w*8%`qOHNW`)E
z{cDtEin?pPU;V}W`y~GBZ@+sESdHLdObEARE84}XIw?kBg%B5gKfrl|^vk;oO>ex(
zH*R{#_UTcv^g+0QAuCmbupG@0Xo;p|7YfXyCa0)c)zyHVmhRs<!;4sl7KxR&)!JzO
z2-G+P^U-t98iF4@grS&=XmEKdu^|YfYv&J7i%>UL;&IlIWnd0(>khx4q76l^Cd<ZW
z*704GV&Qz~2XzsrqIZVKP$+RVTcJDeT0jg~%b$JHs;&(gh2HT=iAq0z`-mbKG?$Eh
zSJo56&`3c9qSvHxqGS}=OO<*jWtlk1HU&1{3^;M`B>!RHf7<l^l@vC03;QA;;laE7
zLrm*G1ALq!BtCMb2!JQgz@xnU9!tr(jNBVAL-G3CrHy5E1?A<u-1jY0Nib%iElKn6
zh8`c*^UU0gDL6_GXO@O;gm<xpu4|h^)h6u%j_PSp*||v!bacEyO#sY`InrV>je=+D
zK1v->Tr&eH!;<+FqRTGRwl*b?55HFoYB0aUHc3UpL|A@x3`$)(#}msH+U1UBHN{{{
zT@Sv+gkzX2%{^_qUM*|6g31Z%a8Uv)JzySYpmkbmUk9bUJ$OSewYxECW*^BQjfiGh
zfl9{RMfjI0#%>j03(Lx@m!HvU%~uLkHcBt4n^U?Btxw~e6_0e#nyv<8AFaSkROAKB
zD*2>yzV00p7x$Xvcf_^kHUo(`9!INwlX!GI!I1RP@HKeLiXZ~nw5!Ixdnpc}s7rZf
zp*o3cCqQSsI66)MTGd)~GYS}oA>Wes(9N$yl|OM>%KsDMp>U1G!%gr9JWSp{uXK%I
zmVUZcDkoZ0ygNR);nZq|Ho3by4(-9;o7|2IS&}Z_E>UlLod~Z<_{}$#UX;X$wX46$
z$iVG%bJuDDBi(`wiUvEVFQo~QW8mD>=TEM$VbXDdrR<b>dp#N*gpx*-XpT%K`h@AS
zbQ08JO+yXglcxo&PU{+i^cY+p`xBBL!AKi8DIYWZv}xQyFb@@4AkGGHxvo3})BX4L
zg)d^7+LPbR7{f$PB5C%EAQ+H?k@^TQeP-*zUai}ezDC{;VG8MmP)(wEe|OX~2A-u-
zplkDOzr0MCl+jN2`U%g8(3xNO40ziJ;T+D>C?GoLzHDLN%~1ynP>=Qn1o*JAu{8p{
z#<m>IspbX-#>p0)>({202COpr>O#-d%1hO%aFTK)OGWQtxXW?=SfiSnz<$2SbGJ>Y
z9?L=^xOMJkt7M`;;Eo`b>yQ1{-4>=jrq+8afi#NuXsKL`@i;R+U!LQ!pbb{}3m!~U
z^l__MEBBg3c!gXBDGo&-uVM0A#ZiFv>5vj8(q6J)>bLL!-$oTMFuqW7@n$pQcBA{d
z2=(~u{f7kbHPKgjU&+p&<@#^8xDor^J(AGWF-mQu&#D|JmS`Zc3D;lpgOXM@&U2<A
z@Z_$&$C%4+At|R3NWtUi-%Rc-g?DQWqvrOdKiQ`zU8pPw<30ht-)0DjSh?Vk-Wy1v
zU;>GqnK{?>$5oUeY=WUEM6z<v#k6a+drdzTXCpq+)gC%1>ShKrUf6w4K`!5<&uvX_
z$jG>zHabF;KP&o1!MykzczGG)^U;hwkiwkXE&MV2+5jxm#XAR90do-K&bDB?ehAv=
z3vCA$dV_Z4BNid#I(bIBS5kyvm2R2+48Z88Lz22pKWE*DonH@uVv<OR#%H{@{X-_2
zEKNN7c)=c8jRPZld!`pY*+hXd__l^t=)6NC@E@)_x<#CKt3Hi?V7^aJwQVsc+D#}s
zxc0tUhMFu?#rKEsoJ|CyaODk~a0RwlAreQ$5we;u_?*p`w#^Uwc(&Z(<DcV0l3e2J
z-JQ^s?9a9QH2o8`$(MyB{Ky;gwOysg*Ye}Dy`O%<>WOlwXFPm(?D9DtNL6)FH_;R@
zdUu0HmgeDTw}uwF6!24v0$}CN^^Z@{+2o*Y_3aRyDm|KbMc_oSY&aVjv*4dY4<Xp1
zJe2TS{>iYARq!qh4qziKM)ynRnOMHm8bGT#;5D<3F}lT;-B}&pb8c6885F?&($1rZ
z))Q!LkqedSUx8|&ZQf?V>pt59qTwO18p#uq1<YJJs;Go+^=>0quqohW!_Wp7O*6E`
zFp37GyFvvr4DhAE0y<R5Mh#)Lr?MT%Bt8yY^=hHX{u<e)zE0T|A@Y*8xp)OiPtkJI
z)DB4MB4d-Zum#h9L5aFxZq|_zf%A|rnE?z$t3_PzUZXzp5#|!jtJS>4^`OuqA(JCB
zFC@oG*x}o5muG5bA7~X3$iCkLtVn8)=Y)hjPPif2sbKp+7<o-?gOOI|R>1`<DgPF`
zNaiFm+|D=P=rt$StP4}1TrSov-j4VNx&9}i`^{TBvZEs_cgIy;w-^J89Zc?`lIC>g
zX7eEYXg+?Tfz_pV7Sc;piORs6mUHZZL&BSN+-ce8Nk5-;?`g0#t?ZwgLlv@$ItW(}
zksLU-&)rsUS^H+vvB#<dFju1?ISTiFa2vz66{s9fkKLq=ZkPeUmE2mpS}-Z~qnq)=
z_Td4+*%9z^51Yt20Dy8BnCc6U&Cha@dlxaOin<%`={PVd@a)6hfoCs@mnB$xhT)S6
zZ=6yb9OIO;);d>It@Aw(oAC6pS<+>tnA3+z{aO|j-i)6v-*w^XIe&%cjc}|v;bmcu
z^0+nArw`1#KWc;s#D>W7^oEQB!uH9gwcT?(<(zj!lAYRoGKZU@TzYrAzakf^2aNNB
zyU0loF+#m-3-3>y#IN+-<B|y$GF9a<TiuuPI1;)^=C-@!gbCT`=YMlM+=gU$M$~?L
zj>^=lDvJ-h7cWbvdv~X6Jq^>DbI6DEEeo+{7(C+mDUt{Zp9tCPYo?GwYM8L22~7lG
zlk`b@;p6n$vX3hK|5fKSCP-EH#|T#zr%Upem&o16`YNCArsren7<of*Raw%8<@s==
z&Rv=h>idBJv$6cp$f=%zZ-q@^!}brqB;$2#5703Es6<Xw6lFi$sP&>Kb&(ul-?RfJ
z{TE860aPD!eNhFhLx=!8+|tKGC4FjiX8RUdwwGF#R$h3&t<6@5<TmW|2p)lFLJY=$
zgnb-iNX-*S%FsVrf=u`Ev(nA(uP%Wu>Ymk$M%!*{;92C$0Oh`^$5<^$;yj0I3t2A2
ze&2;v%3dnXPM!f~sSyySXzhS|&+SMZ?>(2Vy|oczZa|Eo|H5fcu_ea5j`F>Z6>*y}
z>XNl!esFy%VIzAd2wg<4LQ0gs7#+kj`^;cQCQ~8i^yN8umlEp9!7@g0N2jWHC0t(D
z1PQM(oaicLCH|Vnk$MZ_+Zf?$ernXnKNi7WRTnyaYi)D#JSnB>N~!mQd&qb*1Bm7#
zz?7vlE|ll;`bQlb;T}N}6&nUSE?9zs8%B!V>Vn(ebNku@Tl2oyN@p-vUrTEKdKsGZ
zSzLuSTDKsW!R5PFy3n$jvx>)$#)sqkJhP_DyjSNjE4B@NYXBe*!R(*F)H=WmvS2TH
z&q`a^ux8unr;?l`ad;!fN6yP%@;k<qkdN)jVC#1=!r7~z`I^V7phBjLHE@qY<8){M
zLLm0`^)FByXZ?bRFB_r*uMz~aG`Fzww^e5oEUx?PuwBD1=jajG#O1jTm(Z5pgc$g;
zeR;OKd>=U5GTTX+RVh)paPZc~;?tiqggzT<aAS-vjlt*vXm_5)W_s(V4tlRGjntlW
z5?0mQr5>e-A0+T5b{ri70<kesI{4Sr5hKYtMd=GfR2SL(kYZ+zjk($wkV=&@d*kZQ
zqfrDzQ!r!ySlA);hXTA&nir$z6p^RM1%qnG!2Qmy(1Tk%hoEcu&<p*s_H>$s>F-FN
z1>9=E^mVIokDKGz=kK~wBN%cm8kIcSr0E)<57b?hmwg3QAvZK4w!5EpUlR<@(y?nI
z8jmRYXeCy%Y<u>derFXzMgh+kxn1=w+TyO3_ax)z8|w4xOshV}bkjBS5|N_uOL?;F
zlj|fPA9IdA$mMz;VznN$*n4{weofB*Ql5Bp=MWVx`VP;jv<=usl#mEa8Hx<qw(MA=
z9R$sdE_1lcEvi6(+o;`)6r;Sj6CX$((UQ<feu>cHC}U4C*gqbX0JD;O6eqzZnTsna
z?*Ve%tzo9(X{~G36LFb3j>fmr?})&kGN%#&_IIW2ZHzY>3Cr46VcM5GG*UVzd&UpM
zIqi>F1ze_jKi+Ho5=VxPvuSR8B^<o-U~y%cQ(TOwHV}c?7LM8>>p<g7M}f7Rb2qK4
zVV31WLHzMVU^hdN31VJOpJWL*GF<SI<Dxitni+(Ddn=#z>I-m90!2U3apzOC-Ws&8
zO1%^kIIw!A)jim&G-}gaZqZ2S4jpn6yk~#~nlNm@F^#N86TM|0+OX^WrYBM{!tk|*
zrmNST9ml~~|L!62p36+ymlGrj;8ig`rV;Z$AxYA$g5g<k5_jPd?MVdO<7PRtgS_>1
zGSoPhAg_iW%m>OQaUFY1mKbW2u@`t2bQ_@=+S$=395(cJo7?+me9f2h0YgJR>;Cig
z(Sn&nfQeW#F>C~y&>HByIU)1##o3x)k0f=`)r(e(`hd@Q-bB5T`<y?O0Aqp-R!gpr
zp>Xktx-|tWsQN8{$s1>(A5EaaFQ>v+RRdb=l#36J)Y5eLp4ID-&_&vs6i{l1@K`^-
zuukULr}p$5aW^#P*O+n+Tm&Zi_|oi%P#;bsU4>Pv#5(rc+twiSjtu&!$DMDJXGdBn
zCmAB@z=I;r^rMPun~%X4KJMqlOcvYHcZA6#Ju`vqCS~JVLYH&5pxnLIpHAPjzqtn>
z>@eh8SzBy4403_P(XyRtY+#v$Wag0WR)EvhI}_f%yGU7LDS5o=N1tJ1P3GC>(O#H>
zUX`$2u%Fv+a&N5KdnqWd1+IK!-m;yUsi<0y)1Z=~us(t-3P-t#PtulxO@=YNbVX*j
z-Y(sOvneudZ{>yhJqzq`pgOKc%$=1QQUE^1yXS)8`pH7hiEGX0giPKYY@4t{QX*!3
zA}F?x0-rxGuGg%Y?HBOyF86m>!=_l5J~OcfFpCMq_EKR@?;FL5xgC6w24=$d5ha>8
zUTQZu1R%P7yT!K;5dAdiFEQR*&-@8aWYRa)6{Yc7!E}y1rS0~DCpz_EXzC~pyHX)0
z%~hvA6gN)n(N^;s^v~rx+);Y-)g^y>Pll8(P!!m?(e8q@@hbxSSRFRi=0=NM-V}^)
zxoL72mLPZ}Llyq?bGR5nHiv<^xTr$c+d6^)F!bgV`mvH7KjEbiDsxMFw4rk2<TrV@
zJNxU8bs`eS;q;B3Q&NNk)|&!%aLYKkp8}`tMAykSCVVA9TH+YnxmJkRy&4_&0~Caz
zy8dH9yD_bkR#W>iG>)22^|%&n_%eq<@^MO#^|_MGjwK+mpf>f+tBR2TDQDJh&1hoz
zP!~`Tv3N|FPP>k^bHICw3W^HHfrDg)wqT#$SP`gO+a%P=L+O+|rSk-CM(~tnc3#K{
z@P5EF)%448=eq$K9AJJ@^4rGOUCJLqXX(#hx;qV&FZ7pdxa(Udbpbp$403{C9sYTG
z$pOTpd9N<hw+umc4};>G;nO*;d8gDW847M-s2_l0i=(h{xk5HduOG&g!`wfAr_sz7
zO2IXAr1D*PNn{4y6nbL(_s!W<Jj|e}N3ROdk4>}^ucKy_3%s6NM3<vb_T@$>yd=uV
z*rYi0am*xCj(4sH3PwN+(FCthG&Ij26CiO0`CW+fYQ=Zp;S#yd`g0*<4JxPCZNrdv
zBjLqw0iVz4p6Xg#U3o4M&$u(VVAqH04iKMdz4(M+x0qPP9)&2$&O*Cyn*v6bJy2_t
z?)=N0{(caeR^{_1VRFB?nk!;Z<@r=y4393?4-rDbb7;PiY|w6A+u44M;jLNqk0W40
zxl5wsu5s#axd(60S3mlA5*Qi_<9(o4A!U@WHp)^-3BvKkm&f4X1)m3cViN1(J!kG9
zo47fLm#v8gO5-Qb2Vd`aFX;!^<%{L8(}ju!7ohHHYP^;5qI@B-yHqCRpjnR6j|Iqy
z$$+4LJiXvh3ZiweWjk~Sw?EHbPr$bn#K9rs=*<X?P$W*DW^eXPF&MKb=JROF!objD
zZlqZU?@tc1qY3Lufa?#h7&7D{pYXQfTX@{5Vi)L5^<aqMo5gaput9;u481Qewsb-b
zl!fCAPuOz&G8l5l)D^Db#^qM;auhy_)azUT1Tg42K~Xi9@-v3%x$(u0VkGM2RC|^{
zsn;afse7$r509YreMG_!!M*dplP(xCFV-!&y32I;LdPQOa`ed*V`MY|^1<Niq(yYi
z3>i6?SHzj+pK;IpelRdktIy5PKs!BwOQrXiuT(CzpBa*ETl8F5q%Chjud)F}7Db7N
zZt*C2oV%Vt;ORmXF=2K*xs~%!0GvsN8!ygp#y~lUfrVk;PH%~UM%D!6`}n+StS}8*
zLZDv)4Eb-T-cEnh=|w+)HQ_MJvO_3oO=r6q87-%gF{XWYa2pAA`|hXFv~t^J;H}h)
zfg@Q46K4R~1N)`WXGU%vdC2gyPRwz%qt#eckV<;Rn*6vw0|dM{j#l->HeTf<#<z)&
zYmol#QJA+|6`D#>OAkwGR@-CI`NpcD18jQl>^Qu$3F@ybRy9nvHf<K)+Pla6Y4e`J
z*Y6kpkW|wqjDB%^PQ)$GwDvl=eFrl=lB`fo69Qin@g|sVMTDF%-Sgxdt299Wl-Jf)
zZ0df^Psi=(9KENaFI|vjUaal`bqD0Fl8kw$m>px2;7Z%qysNNdBpHKd!?ND~T=0&T
zRtrrLiu30}D%<0lxixLlBhOYYWSTOkzH<WJG~{rHDu0+hIH!da8%o3Yl5YPQvxIUE
z8gpBN>grd-AIzCOq3h8Lc;7|r<&6_8qWj#!b$<<P;#CqP{fwq_>e@S-z>Yn1^}EIn
z^D}<MA&lg-?hdhi57W-RK(tj@JQ&N!-(wKm?UAAs!Lc1%<<e^CSh*+o>OSVyj)`;l
zH(YEZOy`7JA!CMb>!bzAFXaJvq3lOKdwu3*;v1Mq@|=^V_(7X`O+toaUlxW7y&q>b
z#TA2%H;<Bbb#f=Kx1vF>j6317an+8c+dGnEL~bv1P85RgglvAMmsaZ?8g}jO*ty_q
zIf(=n)>_GPrx%Xr=@0r_bV_Q(R&xxhu=w%kx#|hrcY{H=kPnoCx=;&5v~}%mztWGK
zX!*cu*hBDBI&*?wr+4I4ibLA#Odpsr%@X)GN%GzJe~i6(Jk;&`HeR+wN=dSnN?L@n
zm3=BAOUk~JWvp34c9T{~Qjt;FNf_C;3~lzY@3IxLrm_<~=QX45zQ5;ry?)<+?$;;X
zANS1reO>2r9LIT_<pBR#ua<T+Z2Yy86qte2c^q;u_T*Jt9d*qn?G0!c+Rn9gY~rHv
z;9HY3PBpHK>2F|v{Sc6Cucya5*Pxa%4mv9~^Bu$k<DHczKY*_e?hCU#3Yv;+$7dpW
z3I-`B>++oX`wF9Dii&CXP6WbIt_Tohb5_n9!W{PHiQ;IJnDP6d)o?0s<h{zN?)14B
z5Zn7C$a#<9D01{%e=;~9BW54*r08U4$5cVz;R09&q&NdL%hPmDR&HwAqoA$<+qKJf
z;lSRu6~Arl+&!$!^t7Fm^#PYexTU2r>-(!Bmf;toe1ib>Sfd%3CD(4vif}z=UB15j
z_j-zNG}gF~!+L`s?<LT!-}jFDfjGL%uq32$phhD}xf;R^_Sx$`o)b{fH3-SvmrA*m
zw8n&FFA8NZA7GoxqVY?bL9`%rd3NgZ>XZz)`-S(Ojht&0x(qS+yv1?b@aI&V_*Fps
zuIR)Dj@3>9#(@H;Q@=o0kEFWh01n&N3mJBlZD~+B-GuFVj%~FzDLs+>=iCAuOa&2+
z6()Qi*xzWS>z&}*bmbDWUarkUcjNu+%D<VwiKh4A<QY>`5slE!o=a3(8xhjamIuv2
z=u<f%zERV10jbi^MgYQ*TY2VNFt8Fh*?aX-!gO<zN)iYi+wBjKBvaYVAwQU{jzl|=
z>y);NN+>BKp~YqInRWjT_~ZR6aZkL1!uwuY9>vqn0>^hkOhIb_h+u=$LmaAhN4@u;
zC8uKg?)WL~oVUeKK*m_Jdtj`+Uu&;mU=HxeFQ#wz`Oc^zEX&qrVl`Ix)+N8PxRckS
zf{8J+-KGmItL|JrO$`FDGT9o<uTH9Mzha-?3Flca&A8LE)y$0PO?!H-?IqOSfD%d7
z^(D}!wUQ0yAA=93TEFLGrq3l~fbe!P9E>!?!>3r3?oKbU=wU_gTUQMJ*Sf-^N}#8?
zt|Z;>Ho6iH(G>ewb3~f__wmP=7hRWB2ketx%i+v|MQ}oe3BE&*w|Rm!9{geOeZ9;z
zN1Tv&15JdW9Lu8XoGQ<~si^YogcmEc*CpYnPgL9Gso5{x|FS89Hm`!wcg)sdTYbk`
z2^ej+`{NumDpsjZGgaeLY*WhFmMSbppCPyZ?t|xzkD0Qq9@EK8>pl58B-MQ@=)Q-e
zz&b#xdulbP2bZM&=$RB}Dq2PNN@UsT)abXb3yJ3+X;=$~pl<R*VBlKs!c0Ki{1KBk
zi&4Ok@Y7*QJL3;B(=T5wT>~6r#_uUcT<gmzNM`vJyI})+Rw>{V#0T4}4m)t2jfqBt
zoY)1PM_CiQmrZz*4mwjWMU^XWB~;Q|TFgny^DK6{2gr0_B9=sue&p*ZM{Yn$U6X;H
zfG=U+gAvy)FlL#cj&ixb!gfT1H%q;6lj8~$TcV#F&v#Ru6lDJzdk&YrdVZPD`fO!m
zma5#_h0E3KC!7899ecg`oT;B%>;WX>-qn|?T`?g9ob_=^tANYhMgL~}c%Oh}%x&!L
z#*)YDMb$bFgGr<+Hj0Zm$SAgg$9`JJcg)xt)1MUI7=rN_b0_8O40Z*vvszGY$>$6v
zdN!q>#|3J4!E&Vut)C+#e!vZ~vW1=q8h8IFa0Yp^FmxE3eFqQY_w{PkL<$Mv1{9kn
zr5-+B@8*X(6(VWdlCbVeE$}2IyQ$wE*5NzwJQ^$3EDQ4Cc8wP}p@$ihdGKuACsXwK
z#Y%LQ?_tf`+_uszO5SSTqJp1N{`y77e6@J=7d386=-4JI@$^Y+2xECqBs%)`G3)Ux
zb7|}~&KG++Wsj(z*wfTLp7{xfV{5P4V-Wz@v+xq>Q_)6y;z|n=O5ah$0WGNrTWcrm
z#{o8o1ap^_ag~%#w&PYQ+v*J>Gq-(eWc@Vzi<{ncr(Z9-!Ha-3FE7}Dnck6(GwW>R
zLlbwr%vX;<4RS$aI)A$(VR<b9plZhwzEm{w1pOG_d1L1<FqD_m$3|0dU^Rn1Tud`N
z)n>i{Sc|uAVnG;8CMuFe<;{EVpX@t~i}u`6uqsRcsa&wb*z<YbtLwHg2-_qFZDoxV
zi_sMh9|(h?HY2{7;mxb=zJ3B3{AZu)yllL77lw%?_4yBuDj!_-_6PE{qU981?~IP`
z%S$!}k0D}72v6FnR>8k^^d<wV^1UM;7ETCTT@yOA?usMH7}g~ATxi4Xe+OP!;KDzW
z7AdydyRNz&q!CpKKT>No&~rj@7amhS!A|;?3%AtyY_gpp&*F@#*^+wYr!!wU=|@lH
zSX6E`ouQ|B`~t0kG_C|sk(f-EGg30JlC9#0Xp6m>ehcpvT=b=S8|<;tt#JpLRlWFL
zYfVHo*2w`7qa5xR^fg`oW&9;nv3*(eeg^6Awv4>AQRETL<lPNUpFiBS2K4x=4dbyn
zUo0$3v7XK8Gi$1}y9C2ABI)g{TIZkl!@FOJD*u@iI<dpIFWO%YBrvHW?B@^<Z?4M2
z%sYx7Y?}RT;cC+Gq4S8y^T0sjJUvYv`)_f&>r4B^i(xXD%R&ZdA#19QL80D$CS!KY
z{`U;|{J0M>AD-~soz@S_M?+?svT7m(e9oEP=1W1Vnca=J4NVU$AHfBhRGxxQ?b+&8
z`XYbt1T5OIex;lFZMWjrWI1pKoOS;ud0_x6_T`kni4?b-zqG>2?H3&Yzga%J{i5MY
zL9fR--OS*`(IT-c-L3Abq-5C6FnvzgGI)7Bm?znOx>7=6Q$0rNQIpvBOx(J$lmR1+
zi3+^Rj3$Xa|1hsnN<80h;(mcl>4kN={(||wnHOK>$H+Z$7=a2W^g9vi+W0PKC~uTn
zh<-l&_VL(#YPCqe3o`J6A7S_;YjDqu?@HKzWZ6^f`@!rJwc*&APx)7(ZEoq6Ddfb1
zsr|zF;)zrE&9(q!-krk<jaUJo2*tpY55>;gV2D!?chG>_m`cT>2ABvgeS2>1_gct9
zQu)cz;i~bZ60I~HHCfQ%9QV2R;l2CjV?_usa(#9i`_miTKv*Wk47<Qc4Gnv%q<=Zx
z%`iIg3DbBT&FT}krFXT0&XKl%bqvXWK9mGvueQ|@{O@4{I*xsR3=3H5enPii^n->&
z+`*=FtGIZv*7(HIW)?nPTc%IHEUaF%swT%N<n-7lyZiNyrHtBN_EU2>3R-3#`G7C(
ztRVC>11=$X5Dhpz2D_nqgfoLFqvJ}rK$QviLc`xkeL|d{Kf1hjUZiZC>+C(EfBV9=
zxGs&k(qO``M(D>H2^E#&nf&tUdRgx}36;Nq=iznM49k+qb%huXVC`_@s}Gfua-?w%
z!i^re=8)p$H-!M4@-j=?OIt#nJp?e|E@RTWw9z-BE3cy;eglzOz-F3dA12nkc`yR5
z0`rjYkQ99*vFJ47?c_z~D$MDUXX_W&<v^_G{HBN<-+wigbp2oH02T?&`If~^pWjcq
z!8|5CN>)UKxzJE;d}>W)`m`APezWhvVVf2QF}#en$dhD+&Avs`c(uc?KUoE5&q2{3
zlVI_*UgS0J%jp(Ino;)3CWkX|7WQ-*N+PhfGeJ%G+~_r&m8D-pQ|k$4UK=h$HLBV>
zc#rex_ij(bKVqWU$=PsXwtFYP&SV|T*040(-!yih5$%G>WALlLEsKV6Tdd>BUZ6_W
z8%aBMFaN$=Sc!{vtheFQQ~t&9=0^o5p~DBd!|gGhAm19@E##b&n{XjU7Z+W<pTjgK
zu2^O-@_%U3>y}^+^WvKoi}st`uMqqUtamSWy3F}3m8)T`1&NF19Yte>PmXF!&OncI
zi<`d_Bq(wmmE+xc6H!ppwl5N6p<QUV_I`WfOu!~bS*e7Tk*bI9PZ8?X`-5n&JD>Gr
zT)757Fu`IKivG(BZ55BdImrbQ3@(=eH;aF+r>pI}qN>>+jb!PQyCqF{Voz1qY?=3x
z_gMjg;e@Q>?Jev(rp{W8{-_$|xHiAO|4zvsSDwZwT%0T>S^1ASArH%Dn+SfA>{NL7
zo<CjyYy_H!GrLH;PE!n6$}<D8_@+7nPRMHYTX^R*)T$BXk=Z-+nvJPU&m3x3oWS|_
zC0FXf_@hfzIoq9P(5PBO_t!wiI6t7`rRXWgt`;O^du|_TD<@&}8op}|h+u{eQfG44
zIkA;jr8LA&Hd6VMXFK%vn+TRn3O7ya%p-zEF*&nQ_J^x6RW05i^WJQMA;P26(}{?m
zHDnua!3+RK@(_c$IemaOLN7l%VW|&?OwllOERB<40D~>K>)@NTMM^Y2YYxEB&m+L6
zNvD?322_#XoKn9tHFCU`y;fhQ9YjsV;4Rl&+lp4u{Y#AJozZ>NxUl8nF5|Y-y4&e>
zMcu}Ls<^Uh1nZy>O0oIVF+OlJ%MC37b-Qy(t+8kCL8sEW2vCn4aws!PATTt7ZfyYj
zc^YO}fecq0db?>aC|Z+w+c)i{apYqmg{O6?&E;8}Rr^fH=nahIy^dKJv-ZQ^TtNKn
z*5RcRDBN`_41ExaR)spDOb>^WslD{OBLD%FT=vnn*=6JhT`jLsQ%Iq=jQbp;UrfBd
zqu7D;4zbn~ZHmuZ`7?rLJ$D_`3mbCAMUM`_S-jA`Lgb~kif00KM$^X;Epl&Wj(W4s
zqFr_W$b)eqe6bq|9HZmfRQjjn1J>`l{C?-5s_kf5WZnlKo_iN~OAP$P%rvMkxJxWz
z_~P#@c=nu*eAbclRZXGHXsczRF!U)Yrn7*qHfO1yIdh%W=v7&14G3x9(R~^Ze+9e`
zGt(>83n;T^SSe4fjJt?6o{~VZ`4K2KBs|(Uv9q=F&b8$gweFiOxg&rMZg&ZN%fKYw
zxM90-azwa4Rq-zeo}ldM%{FF4I)|il&ZX1m8&PEjH=Jp?xy%KG8MiZ|W+%H^MD!Xv
zFjtk`aPVGgAkuPGwv{1O!*=6(+3+1z-}xcOFqGUQo`ZGYr8bQ=yu+{32;rDpDqjSb
zpD`^gHy3KgYRGM4wEUUtxZ7>wQTQ@UkW|BVW`%|>Cl`RD7g#xzII6brpZw$;gl1@`
z!w9RhB1DjT=)El@Jm10ugmnRx{FEBUowSWbCP`;*GW>*zP>JHDUO-l3&rn<1x4yi*
zDxQ~;NI;rj*nXNcHt`;6X$>@LRGAC>;@I+@_NFKX(9`I?pr`cGi9x`>js@25Bfm^a
zt5wBIh5uOo*oEZ3%<(KdB8qXc(we-W7WNN{rZpl<6ThWYeb4;@p!0vodOVH&G<B{0
zxniI2HT+G@oWaT7l9T649fulXOu^!2P--IFA~1|$RaISNlkMxwQk&#<L&u_zCR3e`
zU@(L5-b<OR95-U$K86`n;rx|Utp+&q62;zDChn8p%YwmjrG_E2$ql3$@nw)E=Epxw
zT`LyE@6!^wS^NZ)Ayp9OrrTBhIOuHxS3y%du%ZNYOEhxS5v@Ie`jM(hDxjf=$h(rr
zPE}iAc=8~+>tlkknI%7mYY$aE*y~xRAQI%*_onO8w00aW0bkTAigoUX-F_ulEYp0}
zZ&}~P*K-`bxjUKw&Ny6*$GF}j3b9LGeF?*G4K?lfPcCN`YM)CL*kIy`FG6!|oD=9I
zZbd+Ruaf)y>ycj4X#z*<*dZUg&lmDHafqg!Otx)w;2j3-M0?)x(wG^y1f#;$IY}F5
zXZXDZEzt+ulkVB<WSVV1M!*+IX51qR8s|Ichrb^eYguRowTP-l!?|l4sf^#RG*a9&
zFs~5Ha5Q}j<&RK-pjK-m4wOg1W7OjpxtI<&W4PB-@e$TVAT!XoWqWvG@vL>CLXLbX
z$Ud6kb}4zPP0E2CLx<2YDGDE{Y~KG^w$VWw32nBB04;C7SyeG8<4jrO)!NR)TK(~&
z#KbLoWj{SFnge?KF)%v{(z$}1uTH<2kB_?I?$zk5@9<@;c=TtIqke!`34v};*yjGV
zV@f4cAW1|%SAKghMlKq|wy)7Lio0z2@6Dr3NAVeL>P=-{_$eb18I8|p&7ekU7yg#q
z1(@8sr_cLaJ50VtWN5C~nq^=YgbZ?D`W3wHK_lW&#F07`gP6rQeU$I@r6+yOm{D<T
znrY^YL%spfEQMa%T`=$k{(v@{LA}BrIfpG!q7D};NhjEyuxX67?Cng+oSB;=rh<~}
z5TWBpr`)H!Uyz55E4O}|o-?#Kid5ggDMSvX^TmHjdx(u}TX+V*>Vl+YYfsxH>ZmCz
z=na~a)i?pt+XIBL_l73QW^{}ldQTj$LjH$=)pA@WR`dJO<s{a(945*XCP;pNtZ6;s
ze9+zr2@w9FfC=QX;IdT=Ry8<xl<jl!hD)TdVpzxssX;aIZ1KFORD{3FtJ+t$`SC?Z
zJ_)CD#9oB**ZJ(Vd;!3gW^3JinuNY0$BoRbC96=$7t`_BZ@8{2&U-RVuS78TBEd+4
z-?@WE*!%-M(gv!kwI<;Lu@_qc-OChWCOC!+vdk6AN*d7|d6g&?hgQ<buZu^L&7|d4
znhyEVRD`e}0MVJMbRn^iVV7~TaiqQa1(4Q7A)2``jgALawe@!HBA{922sFf$r7~(H
z7UT~gFiVfdPmJ7w6_E9&M@P-NUn#81jjKEY5(jB0$92S;9{YNXfSe-D9E}jf-Ok-(
zZ<gM7E$QU;H5kGRoo|GJ(8QB=WA<94&gf6^)0Zdpb?3ZooJWE0k#P$5EUCVr8wQH-
zm{B{8ro$kMj8u&h{#a8540PEthepn_ePEib;@n8h>`?@=f$5@T^`H<G6Nuf_x8=VZ
zTn1@xRicUFagTcm94d$Q1-gGKp$%Xb#s%MgwlZyW6KOe4WE}~yVH{;*gB-qNl}f64
z_$1{0V+f*S6f7)X$h~^L7GSWu{wExSK-m@nwMBQDW^RV*n+Y~xci5XnA88cEM@2)E
zX+5a{bW4-afTn?{p~L3LV-c`WAOh0BlH?6KI-6Z5jW4vAh)z7h+A!#T9xFzDR{PKS
z<d8*twLJ(}su{|+emxs4x6xR#1j@%X$xYs4uV^`j#v=~aFJP{sF;3x^for5RkUWCp
zQ*#IV_{1J#;<M}EWNg!zMBLS}p&6iGLpcuV)XX_idW|53ImNy9%;q-VuNcIv0487w
zWZ_R}5Nbfa;;?EHMj!~sy0zA2E_+Lh5Ly#Y?85JxgQuOZQ{A{A>-|27NY@(uJb34k
z{irKKd((??$4li_08$o80%c%mN*K1&5g5UQ7Yt4i=}Pa9QXC&Kt)K+BFL{LeAFG)_
z3}yh5sX0S4{l}(l0U}>+5600^h&d&{jjPvna^!3;zVv_lwZJAUO;GHW>Cp0#`AO}#
z6`(CJ9HKVN22Va$;<s1r{2tf!Saim^Fup7LYL}X3lTc3Ybu+cq-tk#C#nQN8z*9p7
zLHHRCBT7w|oL=pg@y^ZDN-I^%k+OwB3xH1h9$QMiAl&P5jrTr-Ptp}JzSL~OV|4Cv
zL04i$nOA|uCDhn_NW&B+Rj7SU3~1TwJ-Sbm#eF>+r$RQits%XoB;rLm_}*T8>zEli
zq+@bvMQ8BXrkSI~lLpEWCNmr{>qdK%R2)j3V9wEmQISgm{8vZk9Mh}Wqa1}xAb(^p
zc@9w1i>{}$ZpF?Y`v?K{0Jwh!Ow4f#>ahgb+%u6IOtLM{gD9gAgQG%*71h8eB?w5c
zYQNITx_)zN<-*hBr@Qm7*h3*XabE;af<3>+q4`jwS1<nf!aX-13^^Hjitdr|?o@x<
zZ33>eHp!QjyBScoS)-Gj>9o3wwB`*h`pVP=IRtxaG9tsH?E+T6VTGa+keVWS?1w0Q
z-x`F><lkaul!c8^7oo;fz1AdQMWO4+Pe(%^5jgR3CI^9q{d~x|%ATv6QpDWRG6RW1
zGmMPevtP*c6PvLGH0GU0%Ry;0OFD1X`dTVUBO!)I!&uo3ki$^+MW#LOlcO4ODy8;~
zF{O*f{)N^JFXC%$yYCTib!J=L%lnX4DsWY*kDvnA*b-z}aVcgp?PjJjrttL~V1ENV
ziz~khK8v$3b$U-`Rer*gCvusO)1%;pN-=hWXWGSE7GYy<f`?}441Fu*oel_KV$%w?
z%TQkTonm<VmkwEh72khqt<pfOsT7EX^lo!WxGI4n;@x~4#hV@1y0dZ1eWVv+{a{xU
z!XfPeZY;xa`5r@sCZ#vLh}u6DcoN)mW0&G;(>pRv`{x?LD<}Ffl+>MsjpZDjY#G9q
zRm{kej{E)Cud6QxYoJaN1U@|K#|S%j0Vod!Jqo%ZoQ&Q8UnujYnS3@<V_KB=5!*wr
z-6wSTA5B1k`FSN4Db|3utMm+zB;U$kG35{u$VdfT<)!_|RnZchP>9RT6vJ9vD>Ja`
zVp{C$qY>NSq{{@_{4=Pv0W88rZImK4=8xj%1c66S<6QT{PAo2m*}e4gMu5v}=k)%_
z_VNQ@U0*zVg?XGW=%HPw@;ZtySb@}}8CHoZmaG}~!9d+m&6C=uh)=;#1SkU`$yH*1
z@jGk;=bnpWEuLLLBgh6;GDI+38V1qN_b1f?F9@|Do)kcPdA|7OeTGgv0%9>|&&v>E
zIq06!0}l986Ry(X{jR|<MpMj|1L*5V$zx0(Xs2p?^z`_(j-Ea|fAy3adapP=B;jo*
z(9e*Y<Eou-(y_s{b?5(yW?@(=m=_hnn&hZsBDv~8$yAEJLOB%S^fm)Y*d?IRFNQDM
zIN9(Fg79KoGMz5eZbPbJl(1DWBDoz&wg#E(hANK_4|><Z;8+dPp-&;%2D*%wV!|0n
zxAZ|_RmlvPB?~D&8cY=wqjhdDdPGTi5=3FTp)jUY7`{6Q%&qG_q@4q$-W|IQ*}ZqC
zehbB>?EvMd9z3>%-~2Lr#=?7&12p%PQ0f~qmZ!%rUk8ViKAj0->d9PWt6fShupZvR
z;ee;o)V`+t@dkPl&$eEn{E2cSm{ZH&25nNHrg`_|&v|!`qX^6&ZML~p53pTL{c|Y=
zk+g9ql5^_Gi|dNFXXE=F+2!ZT@x$<g1cKW&m^vMT1sg88aFvab?Q)xSb@<1oJqFt|
zJf7PZW<ejv2gRc8Xk12R@ldf~=^j#i=H^)^qKTqUlRc0)kv(Y{SC|ao0;_XfF~~eE
z;IATW%;vW?>N|z@@`Z!>eRo>dg@ZU`ik{2m0kS?z__nE{oVO6PD;yI@{Kg6WK_*KX
zKtl>Sm28JEmg@#cQtbSg1>nFZ9IRef9LVzkMNOl3l{}oae)(Z;AA)5J*hU|A*n0&^
zsDja-RqJL<*Qq#KM<X7pP;Y?ErCnwnS}UcX5@@Q+a8#gnf>{MS2geS=b5O@NH6^dQ
zm+2kBbDs=Y`{fEWZsp^vQS&g*C^4>S-~xVRwV><ZdcU3r2VQmrvTBxMuY);pDMBkk
z{XQN2JPf1<KqnWx;PY^&G?#cfu^%@JOn4DI$~d~C6CyzNG)`=00%kh=7E%tN&LdC`
z2d=00u#yX!1_h1+__xphV8cjz7SYYMUPk@i%sg77`9F5s#2<`}`WCuZ?wf=W(RWEc
zNP8VVprM7%UMlrs+!<$)YA4d`Q{Yp|>z<kw7f@L*yW-Gfc2Tnl(+Rw5G(Hhf6WF7C
zOwkaS7%NzW61qJ5%Gs?xLLeHgjnNh+!0@vM(pQ|aG9EXM^xY<42T8;WM0=Vxd2@x3
z#)Lg4^%VUIgRd0{dT)hjAug*cx;O`F+ijlsT!quIaH_Ujg%ZJtDm`FkIe?B_>+uv*
z$*nCWXu-|DW)V83<bC!|-|jOM5R4}SBw=d&wxN^(NX#9$3j20TlkGG9yzrfyZ307x
zmGru<;H7%>wCG^yd9wN(Gsy_DN=+~?#XhrvF38V%PIxQx>0t#nV_pPNxNKwEA)rfm
zmNf-kT_g<Rf9%YMja2;iUS*xQ&wmK~Kw<RXol83>(H~Ik&}ADfoA2kL@8UiSLyQ(b
z$I~+TQe!CBR`&dJN1I*Uz($o|TgmM=JOPNaX-3{-Nfj-P7+a>N$%!ulu_1u{mQ7Qm
zO#?_O1oUO$wBIN~zIm9Vkco66h$)Gl&0AhC;~)Nc`Ka~TRl`LM?E`%0Xm|wT%;Ntb
z4;UVOD%kuu`{c?&khX@0g@vVCyk<cM3RA(l2&qZl>DKWlz${mRy35io*zURih2($~
z)vju>FJllIc&+Q7Rak(An`~n1V2BQ}dz*Gez7qfM<q4svlTI(50Zn~Z4#jiJh8MjZ
z7xCPlke5P<$XDUVmrAMegi9yD(gzetK3r$VvOj=_qN8~!wpGBmI2SzY4rB=~n!%P4
z*xl4IkUZTF@FKSU*^z}lpUf|BfJHb6LRc3tIF&(zNYxMZPkkDN-$Y;?dKGn>V&sv^
zk1Wf`oPN-#eF7RLhvD@Bm}jA6eWknbSdKJVAY}l=k?<oB8H5Kr|Hob_$O6v6M~)vp
zpHhAfE(tG)Q0DFODG&0suz?*`MH4AaValhvb!VO=$!2_4*sG0C@t0aNRHMb!pz)Kn
z$f5H_V{DzfY?Jn!eZXpvZ3!^-<f|DWjYK7zM_+z`MC$-DFG(O%d8)5ML#tnQf~wUB
zVq>TbY=bxq2%J*7C!=zkSp&S9KC!A(E*stl!FfUcXvp5eg$`d`?_bLO{H0QUIbfSf
z07?=U8bD6PI^+$0Da(DgDN87huplQmSaDF<!Q<U>2YY?ptUjz8)q(lPzfdee&7fvz
z3p~S0!8RyqL;jfaK>5a|1-8Lp>{}_&LB9KwFIX50tvI#AA(4~Kn6%oU6uO5h&I$`a
zzA*r8n!)@8a9~QH<GMe^QQid=qlF>w6I9;=5Z+a&0<vpM$dE{73$v~1oEJnHOG<6Z
zQ|VqLpKEd`_4+yV5EQ1o>_ni`kpoqlBkUU1fI7Mh3h{8+;uB!1Z435B34Q7c(nf4D
z4*>X5fPtH_Q%TVD=+Ancze@}>OdfPrgbf!D!EXPM5nDI;wZ|U=cP4S@-Ge8)^J+V)
zz@6s_9He?()Aa-rW&{c35&xfM8i^Pvk#`Pc@&Eg5K*@C64MM&;lkrwbsGxH8a+80#
za7sB0f)2qk5P#tdMI%|N5Ac$Ok23#B$4`eLwRzB3&{g`uJ4ysN=dD_$6VvC`gCsFC
zXfZh_x5@qD0Zy^t<Wirk`}kuUaUD{(-BCMFpp2vNJ0^&WpBWJ<%Tf@uZI<sbAW+Jn
zIk>KU>32r$8+#ocpQes&-oMbAgV@tSlOzq8Uf>T(PIzmLo>6H&QcDvfmO-@{(oy$y
ztc9dNUepG*Fg|^Wti>hR_O>l0<UEMWWowMS|HkC&je0vM^x~t;*1d8PBT%7nuy%b>
z;0>hY+_F{e-$G+RWdI5V*I$b+4MdI)akc#G`%aE;w(<B5<AL|E8^l<R-}%Fs7^u-U
zYPw}lh^E;9LK%X4D*2MG!yjh;U*KXPus#8_lKpF3myH<z71v;Y{|+!^@Pg_yq@?5J
zrL(fjqX#SuZH9q1%y2m~G5bU9WUpl%pWSq1_!OF-fTYQN_7_N)HF9k(6#)j9Vb;^Q
zmE&3oNT*P;vvL3Mz+$!7CTtF7-NsI3LRF;42TYx7?xlymIOyc>Vlm>hNhSA@HE~l&
z3+2JgvW!A_mIi|}B42Eb%qWwFch2^8JmUYq^4_Svkx8|AVHaE}*R~MCdd=}}vrT&|
zh`n3#?g{<?*!61Bz;#BW75V1Zek&emQW6bQ5K2f0cD>k=cFdIcsb+^Qnl?Uxq{<nS
zNy#1sl1$5O7!vdb93?|_QJTcHW&0y2bIIiX1fV4nOlbIXYrKC!(M7IV=bF+R%Xcze
z%wl6|gt-^>`#63yiwo(cf~fMLC(GX$xxXUe?K53K;N^pak2J9~1_W^oy{a`^5y0D`
zPR_rig=~Dt!%B-HU(=Qz|6pujTgbxt7t=Tkcc=BDl`19TN<*Ta+YrxANm7)by<>PL
z?bTe^O7J^m9HAHFvR;$iV1X9&HV`u)!j<^kE#TDmra9A8&I`ywg&Y&UlwY7069zX;
z{;;3$FA~lg`OUTIypD?r87ih(C1>xor4$!wriiwXOb8|?@_YE(Fp<g~!`{6$Aa+lL
zTkl9ZKQ1PcfxVa)iEOQadcbCej^_*RbCA4+tpTXL0QS!aRsRrW=>ZL3A`B*+AAgjy
zeWF7_WECpYb{9K?%&5R4P215rMr4Kp6Q*bTsmI;ifT~;<qF{L3X=i``gi*3Z;^je@
zsE$B3-tLD!j*@Rolm=?Qy}Bf9(Zj&ag1AzwG;>4czcLLXZRj4Eqky9?NN;A+`@zCH
zB*DBMY~BR+C)q+PvJVL4Z~$HJV7=#x<IdzH00W{8Q*1&oC~VMaW}pCZ<6eeC0>_*2
zf;S*D05JM&$2Yv!9LxngtQ9P&%X_ePrA;;Y?5!=^nX26Riys%$1uq}L`;`J>QL$x`
zT&2K#nE$Qw9x;%%FF=zt&}k|%W9OVx`UZaY&sI(KuCzy`+-V&O>PjL7$ZgTZkz?m7
zfR2*msdtPpPIY!@u6(B430X#O;S{fP@?0ht?1>M{fj}S1?{S>*%LTMm2_UsU#qI_w
ze{^IL<o8kzOFSAKe0-W6oX5%G7CkgozF3^dGI75VtX>ZTdD!iVGwXwecd77~wIid^
zhuAUkX3sOI=QW@f<)?m$-6#O4HY!tU7L(p)EGKMyg70lnN2M0Dac7hxj*X@Ggv&w*
z$`dZ&OWo4dSR@O=7L7bR?FmI{kAS6N5GLN<Yx({bQ@p+b6jbclw`bx6d(&{7kks77
zIqXF5B?)#p3fav;|K6FFK=k|kVRO^uH~(M2API2no?tEH8soM2Q9SBq9J7t%#uXvE
zSX|TN$Bf8n43*D5vB+x*4*yt*9GbA(NYku?agrZ}p~cJ~yZPTxBq_rjp5I&wxrqB;
zJt*GTt}Gaune?jQ=-e@7#@Z0nOzscB`d;*SHWZaQ^DViu4?(!xz~CwXxOeu}RVY7d
zAUxXAb}X}FL|*vxitdoS0K(Svq;Iedki&p`K1;Bt2c(pWdr7xSK+>z|XQ%a8z)%Nl
zz7I9Tu^rRnfl;aNlWexP_1*{~(=4>3GE}o^paVdD72b}{6ZEVR7+AP81U&9sMiW2^
zUJ&j6oB+%+Ju>x#HAw>#1D>B;ZiB1Thrg+M04P#jIpx{)MxX|2nse-r|J5~C$x{{Q
z{)F;Vrr{K{Y4N9}*F)3(?TwQ$_zabxR#kSP1MIcxrmKeT(1q0k*qH=|@BSVxQwi*r
z?y0ko35w?L=AIS_XW}|_@#^_GrQd`;(3lDXl~cJ7=1GNM0jXPS%DJ08TxT96>07&>
z|J-^s%fooKC<FI&UL)Zg(-KI6C)*qp4>!V|U_@<Am%?%yesCzo9;E6wCu79TFoRm$
z_Paogx-16Wr)ng1Na6RR9Q5xyp+I|dXML7a-W1}-XtePDe`=Db)8*4XcW>OFxlSwm
zp5?k5>VGsYnSsw4!t1<X3`%3_Fq#8ny=Vx@_9gdOC%UmuML8jyCj~!RM1b7Sz`GRY
zTB|wIV3Z{r^j(!ie6MQGvm^zy8jbbkghx6IbyP!Bn+P*mjxg7}SEb`GDO|5YEh;vE
z5BJ^3G=QcW{kC1qFc6D6VR0@v=#$^xu=R3u7t$hpy4s>ftYim-7rE;HLAH1X_yDtu
z-ZDoiCKBTV`-M_whHEP|^i!{K@8<aD&R=6`JeY)VR*5MPysEg4)QxpLSbsLxHiJ_r
z+fU%j^w`-JCcD10_2wA=KGz2Og3zdB({RlJQuw%6;BWV*BG#e6t{Gijdl&&qCVl-Y
z@L&#l&nUUppt&C4<%upGV3Vl=gJL09nh4Ki{fgm!HoNOFNjGhHoO^W4&v;fEQ5k3&
z=*#1NaF=e{QuugivrUC8Q|N-BVBr82Opg}9eQ2K+B+q#>-`S1>F;+E9%#Hhq1H=$z
z1eD32Y_VbEBPg%<SjQ<ZUC9b6QBC%z6w?68&#GdnfT?9A-5JsT`L!X&4tLh1GMQ|m
z2R;FiN;Tk3lI@(+AqLk_6@vp#!=pA%A<>*M(46rhM;HL(wBbb$7n$Zt`a-dVSTNMU
zJu#jGq_HAStdjsMWnJMGsyvr;mlt`SoQRC+8JP1QJUpbn2L<p_$+rC8i(j@OSZrdE
zW7GhYHXZY=c1oEO@f`t>|KejBZtY?!)VT*d?G2ro&XmA4&Iwpk)6lmcyjt_F8zn@M
zx)$D&1zkMMtT?pG;ate>LHl$70c!!x)%U81+(l{JK0yv}e-yWed;oA-a1+E>UD*FU
z4_l57Eco5Pz5trolTLdem;9*A&tq~TkUHNL+8Bvz-(%+za2XKgo`Az%$1+lQnqzA?
z($jD;pd&1Se6P!}>zEC#_zTZIFWZRAV%X#6Hv5etcNg!jeu}I!(<kd5PA)?&Wq5k{
z;pACz7m4fK(b#YpEd*VHEaR(|4rY$+Bt@cR%lh^(Bm$t@`D*=rUfEb?dhu&*q<S_y
z;O>^ozJJpge78H)IB0pGnpKpxex-88K5V_Lq<n3Fq>nY=X(hsifue@}F}A!Vjcn+z
zc+Sy^)&_v8X$ZO;A{Mf-Q1E|k9vA9m5-McZ?-YXjcT#0b{Tnwf{w>!<9wgOyy?B&F
z{r9giMhpn@)kxD3kbrg1(@PIvXC1h44gASU=B8#phpG`B+s}e{X2drAz0l0)RULlo
zMERD@=szy{*T9F2N?LB%ST?;6?HWc&bRa~6_U{wH>9L}wxE1a#ayRk`MidAXHcQ{s
zVH_F~|Kj#*fUYB|oyg}4ZY;IXTO>hUPh4Jq__$bj_@_5hcE0e0-J<d@ORSF+ib1B%
zOx6`~l$Sz*h<J9<BJTr`a{PE^09*hs{I3_Qqht*w<sTSV8nhDtsfl6q^TWcoKaJy`
zulpgU9I1`K#qhh>58wz*VY%6Onh@m-Gt(nl^YOq*%A>VC422Abx!d8tUl(xAz;f`p
z83xYhas#hQ#IbO>fVJ0tHYkp-e^Q<zs%3mGG)38vX#3CF?9wHTC{w`hPAc&EdxX{;
z!200RriZ#gK8V&nWD>7Z3@tD~?G1aaf0h5&+~g_N?<;HjVB5Cq*Lv<0>+0P9&?9r>
z0hp_Q0_K*>FR(Cv1iRl&e)PsrLi!JZ*nk7GPB;7G+0DR#exN{VmHcsqi{R-;!CLPz
zGQ^Ph0K)kz2<L|YLR5=6@2d6ZTcPiFXY=2)|1}(9O!dP9x2@$QDabYXLj!zm@j!+T
zDq8$>FZA^LAhFH-`3&r5V_`r~*sOem=^;13r)!|4MUD-#Z7~-pg|;D_y*j^D2_N#&
zxw-=m=JNrGV}B3&1}c}sv7jWG<RE~|TLD7rUIOF4_&KjiEHbTv+qK-Mn=?atA!CTr
zj?Z2SEn~@rgDYJPVZ!(MMc}f07v{uxD6d{P9UcVxe6y=L`J-f^8upke_sFevB?<f#
zGf5B0#bE0m=~0O|Na580N&kPo{#^`j)Y8>YD0cV32ACs&CGp;l6GC4AL$?D78Hc*<
zGoL^JT$W7xBi;FP`h+vlyIAOU8zFy$F?9MQKfC?Av-7jk0GvEmG-%KMwfd1F0HuR}
zb1L~gEV7~@2_)Ha@<i>l6)b|*0IH*Zg{<ttK>j&qRCrPJeL+9k6kG(z9oTM|@@;SI
zV3qQiJpLlXzkd%Q5$gkXf5=Rj$#YTE))2@{)ZK<!z>)$LgM5dvmnl@ZYi#g-`Z9TD
z$c@k)6$oNqerBH_cS-BFq1k8vLZvHcL0(sqV9p&hQF4DK(ka*Fj=UM*kIgU~+g~y|
zaf#_%s!>t)A0#y_i&j*{9@tCY=R?5a3INXc5ZaLCarKnCea^5Zum;5R9Bzlw-WH&F
zxZ;L1$lAgHI#o)eRa0o81hD5cpN-*MT`Rj@x0f7>1rdK<TU(L%-`!zW(!_z_u@<-&
znFmp@@TbV_>-?l5*}-7_tNfz3(J2Lu@8TF9#5G3nQKAY-)RgO?g%qj6U`uGa8^6&5
zKzHEzj(lO9>?<_{f`5nGA#YeSQUziv3v(06NDxG|oPb)oxC$-&`rkfDt-o*HV&wn%
z=C5r&X7WZ4ty63hIKT2t!fgn)J)hU8q@!G)qvX{}8`_c69GepI$cBkw^f@gUp<0(m
z#uILbQuVbUazuZdX->}uInT*@3&>&H`*SV1?kIy=A0FfG5+2n}<j3fS&}<2Ui1j~8
z9*i;#8u$kcdyAAjC>P};@2*3c<nR!tvC;T5;>?MT`3!sPDH5UR0lqTIn{cN01qyS!
z)#`}Ty`bZoI?`a#@Uu>&;lrn*Z5*OX-~k@>Z3Yhxi#ClJsSbT_^kD_;6}$MYxI)yD
z6NL6YqMSrsbQ0%kPOPUi@<D4pHvnZ53cC$K!^%owMn!Hu^9ldu&<#|BG{oO)KB=(V
z9LNR{qXOP52hN3rf#K!;^W5u0&`)V#`LQ5W4`N~x<8To9(18ThTcZ1Al{6I^hlR@J
z<EPC+rbOxZ@~Kuy9GEv$BT3$FGDPaL;Mf%X<p{l{D11VZZq{L6@@M;e1|Do-p{nY?
z6Y^JCPWk^T%v3diO6&=sWGOw;693uEVtz5gZn9p3J`cE&MD=qb>1f^8-wG8696%LB
z3cu6Hj51!O!<vL|1M<yE8i)3<K;^&p%UzI9`h^4YX<_)fnZHq_XbKwTdw1KOh%%PZ
z^>*KD7cwqxH6e*pv7?W-#f4pBGdV0@L$qZdVfV~GWF5~H+CT5z=i+MiAz+g(uQZa`
zko9DC3J0^mx(L3ZWw|-Q*4>VJEa_{`HmnaQFaP__Qy!B~(aKfXwMB~tV)r0e;qD~S
zs8st>!35$X5c2L;e`C`W{}ap|ID3Ruk}5cM9=?bH%Z`ClR-{=;P>3nYu+m%7plAC|
zdx(qjY%ic^TVkpD&(b`cD9b6o<y<c5YmGD4088Al`e*(Q1^X}~95Qo&3*<Wu!%7co
z(I%ijl@v2QE2`awKsU85gJI<w5LG{+ZM-#g)}n%?v4d}!<D(YT#)rTfR#eOiUknuM
zc^FKwm+ptxSPhkjl|#ag|5fCa|L?vJlcIG2UjOz#BmGkvv{@eYXQ|bC3t(GV3+f_A
z`1O>4RYqk|5%Lfqu;nR1&|E!6YgC~Kswl&N=EDjooC+2%NWy4lz9PR)1N_3BkSTUZ
zN(nTT5-_-QAFM23WE#v~R#+`5emX9Qj4?71=c7z4Q4~3NdM??kN*C4^Ogk;CNO)}!
zl(OY-yHCzxlz$X%mY!?XM54L^tfC)Gl%#_yO7ihKE2d0a>@jr|+=my$RH5ZXE7Vv@
z2P4BJXkbuB5QvuJFD9W-69V|JBugMi3+g+4(Vnc*okAu?@P4*|!jRr_H+t!HNkj6K
zmwp~z`n6(%I@a~z4L`-@{`b-Y|F4(MoQi?r5-Sif5IxgiE7Kb=`p|f7cKT1++^|sy
zhXj+b*yT;J{uF|}VRB^=rqvdAH8xa0B_ed2>g4t48nDq3UbPPg%bp8FFooLGfT~TH
zV{~iP#9_`MAU?t9d_9=~<RL)IbU&^3qvgMeNCXFhj=O8uSV`vLV9Ar|NKr#limWhs
zGZ^S>2G@ID_d#($z>a{$OC*?(^BSF`5GTxc^ajAl4LXfiRWOq6J0%4Im!^YLN7xMq
z;3-DJ+u>Bt28tHK*Deb~Y-($OP;pHQU@zP$>6tUg{s3j95acg&t|<H&*&r2T1Uxl|
zZsfh{|EbczXMBdPjL}EhSWri<G5Oy@@NPNTehduBri~fE8GyFP1ei$TLL8YN-$3<{
z9+^A<IX>kRxea#PIF?L_!|2fN04jjA9&Xy}+j!~+NGxh0Xy3mQmGl$r&9bRJsC_K~
z1Fk03Upr}pU!j6+uEy1be8^6Kl*nGybPpe8MJ(lL7Sn^%yz<)Wf@y=rSEyWOZ&S`3
z`ELVFae(G)f)rr5pv1B^g2dpOVNzQBr}hYhRzj3|7zJ<pj(dW|O6>$=ehBY#P_6zr
z)CgRa7qm0?Spv|uV&I)m=6_TfhPN-D)4m3mv3(i_4QfDeZEe-ip}Gu9KQ{XWm2|&+
zSc)oF5M=N}Ya3d6<nt7ylj;X@Ylp!PG20(N8SCm8xiat$e79T#J{D-IdHVxS68EfI
zE1bG&P#f%*lv~Y^<G6h(QEB@`3ZOkY15R1yALG4jDwGxB9<*$aIZN?UF+sOtI`3=U
zKL^a21;yFX2fEeKCo>Va`d3#(etmjW5V{`2aIbvgI(v6nex;E@2H=JmKpUep>+~R|
zIonFb3k)@WT}@KwVu0hMAZnkQigtCQ!b?-LuHy>m!obCSdI`j_lQ~K7*_(kF;$Lj@
zH^)!u<n(nTX%<?sK0kgZU+j)AT)k|ww^aOQqMz!$MIP5*GPM|I(wL9`DhWO*K6%JV
zT~x%$^&TC=16aX+HR(DkqB)X50NM=0a$|s6@bdC5cHh2`g@TlW2^;n%IhwzPYL7I)
z_O#_6sVWaUvM~vVu{EK|7trZ2MYrvntQY<7a9c{^fMM5yq2+^!kN5lL1naovyG;GI
zsgm2;jWk9yq6ZS_PJs%bKS{B99BhttUU-c}B|dTZSXvIZNr75MEz@u|c^c7wun6|c
zxHLFVMSs|!dw=_PLs1@0(?>vkAFCF`pNFyYZnR+45^Ak^JJTKrd12t%SpzrJcW&F1
z7U0<k`030^)`9W7S@)Nv>4pUt;DTFb&VT9yeV)xZQ!xqGp*z+Anwv=U8Mrqb$JFnt
z!@K`7Q+&dnoU~7&TD@L~r{!PL0)VGa?Qnr7B<u)AMSllX$mif1429gJEBe+~+LLB)
zz5?#d=2l;o(+Ad9r`hrzhk;}861h8_VC&oqL2ejQq=l&&bnWrDN6D^8Sp&1jSL}kj
ziV@X`?okwX+Y}A(?B-Mbkp0u{`FmVL`@R6U<Ss$xw=mex2BH&&Rq3Cw!Zc4f@z%uG
zHXSgt<Y#m^9;p2_Qpi+R!gtX*+;~nzjY$WIp~Ag0?}Gu4KCUo%X1=?ll@Mj47_$3v
zoxJ_Hy744bs2oxq*Q3ba$Z|ir4SxrB$caKYHxO&q7W0@cW)DTVY@@^2;%a8HLN+#}
z#Ivv>8t|6E(iYj>k}ewtVZ<X4zAaNUoX{1=3&!dj%uPRx(ExO<DXATa&QhfOK4UPE
z2>~F63=#1I@t+1)m@U^S)}vy9vp`8iK<<#YnnflMu1H{oEcq%<pw**j{3VN|mCCOI
z1E*S0L7Ur!7Jfs<pFm0*bQ!?g@;PEkd}9%UGK}o+Um(jh{0M<Q5wr!>^;#3+g!YaM
zL*0>v7$N+Tr#s|O{%*)KPbLRRb|qBFT|FVeO6glrT2vKa=7{Ck;=!~QN^?#`c=Yzb
zU@%>wUF^TxDsj$K#gjRLZV-H%oqNM`=b*hbs1ZAVaJ?>048p)g9tQFAy!#NE=@w-<
zcF=-8*RD+&Stop{MoKIOZ&C4zi^J${#JtD5oHA;{OaZN>D){F68UB?u&`TkyQUy5G
zT!lik{ps6DLL9f)*>SiE2zQEWBRuegjnPnL=Tuys+G%qb6e+B)LAP<f3#dJGC13&5
z&@wv~;Lh~)5`gU^P#QUrOLxM)kr0#Z)Guq>`tl)ANBbQXfd5y9A?!pDpSuE3V&Lbl
zO+D8Q)AhhFe{lbehLd16#kj}zjtra{i)sAv1LS+8iiB!>g;me~1NAY<%=AoGnPdjd
zUfX~7w25BLLXR&^w<+sa$XBtgQ~wo0?7A2^A0+8U^8gFyWno8U`_BxbXY6`TOg;P^
z+F0l(wB-X<jucD(0;?SqU_%&@=tPGn$rjI%Yg4nsZamt=okJ@%>WtXTE5lTs3_Q}=
zYQT<DMe!z(YZ^oSYAF*lb@GFKemjhK80afaS(rlljmKsC*FYNz@<F@TX@*T3exfcE
zj7BF%5vHIIA`DozRL$U@=h?VHm#L5&ip$b!26H0NiCiFY26fk2(E17>6sz=zO9?PA
z!VaCsZJXk6LRLGNB|G~T?s`UDF~_wD9nmy<c#pmK)CVWfBb>Z`oSXaz>-NDT94V}S
zc97DT!t=pYusJirBb+gFwnL9lc3$Mxe2W7C-}dC+gdH77$NdI`6^^7(?<qOhYmMrC
z@+D17DF-w<Bk**Y+f(r?c-HSD1#+w47b+6I3tEI(pQ}DFS@_^dmT0>i+XSLEVO&Sn
z&t3{9*mO47LqTjzEfOS!7!j1%(8_}A+U-tEqoPZQ*MfoA$iz(BFHnmhjCBc`0yPo<
zfBsE%MQF+oA&!vk#R)vIUq<J0*+_J0`VOUNyWTJ`2*Mtkl_1%y1y%Bd&oDn}$1i9Y
zY5-~AwlD!vnGWVkx?BMlOG6?nC}Eo!8*C{^oGLPwJ;KTJdI1`zuM)S27gcPVuCA^V
zW8~<?ti-*s?DVU*37dk9gUa$ua*DchL}^ww1x(z|;25P~juhauTn!_V1NCSvdUO#!
z9$^>Bvjog%sXzt1gVa8rGTQtN8E(TO=XdI!%O7F`>BQ{<6H;xkmze5BX}xaEKk)DY
zjmbekT;py#`~8~hFs+5no%X*%)GNs=g<#6gwYR@7wo3^%liJte?WU!Gv9JXhW@&ep
z%+=A0V@(OS6HNGFf#?3(LO3oJ9-2ws_H-TK=>NX;S>lBt(}k&?uk1r<xO~U2@lob;
zUh(X<2LvQ5H|@DrUf2Vghatc>#quw)8=|1rK4&IQe)%r@V{rt3D(#k)tD+Ypz$k~v
zz(odn$dD}00Y-U_Q4YJfw}j=>1%mb?+PO|P&gr@V>tcEIe1s!05P7T+9-_V+D)lW4
zEeHZ#neX)3^=#j4fC(B+R*m{R@p|3#Y8e?-K*x7t*_$sSm@c_K`ecKfvNyF4++Itd
z8Y_r+8Pl9mMFSv3d0>(&4e8{M>ZI?^kEZ)<7dQ&%k$V-g9~at2lTGyzIIsiY7`L6N
zj!9Saju)VIgT+-qa9NQqgQlv&A7)tdMeW<`I!ClqPZxnGDUa&&l%E)82{5Ew-5l;9
z^h^d6E-RCtNtO`6q)k=h_-^Z($iY;Bx<$%8L6;@UnCBpl@UYWXTsNXISU!aK=dUm$
z+mUJ}&o`}Kq}_~$Nwg5w8LfUhgN7C0DK#r#sQbV{SqQqspYFdPMBc?_Bz}m2;pP}A
zPe)ZXU(}ia$=o0TjykHaY|wEs<!v{>tit(T+An1Nx*1~Ic(e=RyF#{s&E}v^a9i|b
zX3+=-*(-8)>E_>H_5B!{XQ}RAIw8Pdpv^z8d&TbP=ZN0sN8$-kMsb#)<$JSYPRcdl
zuDB1S%L5|LkS8tS5<|oG_VJbmqAd#296WCH<aiTuWWeLlrDM-C`ur3q6g2r@Y{0d$
zDBZ*8>ewljPE=O?eF$$DQ7J;+86$fi1<%t2)}vbAOSe%7er6?g954&=cC9Z5eHi>B
zT^3|`xLf2gPUT%thT^$ur%!_pg%288h8{l<N$BiCwr7&d@H><c+uqb)EdaYOp1^*s
zl5hSXF!QFnZeQ*gBkLDp0X*xaa}V}hahNeo-B<*`jtE^dU1cK=mdVnc-)*GsA;k6F
z(MXZm<iVt*W?Qtrf;058Xn8(Zy@q-pHAiOgoyB|V=*SpdD2-@B8rI`}+Zpi=y;9*i
zitL#DR|hsHeze;Lqm(;I^_YL23y&5i(zX5AWq%bkb3EkTqIPnr_ohGP`Fyy6Nj&KR
z{F%;CT>=-2oAr)9DiD;W7=g)IA9u^^+jQDs532iShl*`-GlV!!Yw>lL!z_~1FrYt)
zP*M|m!LrlE3;HIb9`)yv2P2JK?}B1zZ>TIsU<tq^FD-?yfY}mSVHRpZ!#}$SNaQw0
zNq=4FGGHE%U$NBWHrQWQB}JNy+o)W)X*e<f8vkJINYaOV=n1p@{GM`?5%(>Oi67az
zk4X3dKO0~9_nbppu*jlRyFj}Pwge@&41??X)5plo0)@kvrh;OIh2+S39`W&saM0I{
zs^Hw1pTk6+>p0lFx|8&-$g+Be?Aaedtkix;Y4Ef*SwC5oouAWQb?wXYA1{DYFTfs5
z?{p$SSZ-Ha%2k;fRc&`^7+d9oXeSi@zkoVNLZ7?oBzM^#$67GTrwj8OYyJq@)M1ba
zCW3uoMK7qI`8et(b)d-MMH6FLOUMTU9t~$txMtV7V!@&VxlrWVws6g9eLy0>EO(iw
zust18?6b`uTy=CaOKLxd;K%;!ba<E_QQ5MOa?sGzmDmmZQ}pr7Y({8oyKpgw(O?1E
z8iP_JxEWI#Y)sweXQy1w0Bn2!Eda<Y^0F$P6{CONEFY^LBa8Mle91xxDRfuvxn8tk
z$+@eDor16@70PLl<vnNTQu{db?PHL0GfusjtW*fz`4Cuq&V>%MZlL+udvZ0LT!m?a
z#~CzW40j8s{DkDoxIrX^f^5ub@PQ%M7`8BjiLw|*huTWb3RWnzm-%QKx{f1B6_`3Y
zPkIAmQ45&I^vjg}`3P#sn0V_z4rQNJd330at4BDj)p?Wek<kG359R`@vF)QA!3vG`
zFX`4{NvM!RguX+zGdxW|`=9)>0lz}#?SB|fI1}3C_UxW3ZxW)inq|d%K!C^d9+@O;
zYUNQQjkDiVFf~P+$wN~Q^70}QAPH<mL-U8Uj9fml{sc-$(nCP+bu2)<m6!IWcNV*+
z*<iciSZqq$5pWXPZSY5mE_~j+3C52fLmSq7st(FRqny(5`-TUVABRD`*PG=8)mKJ(
zVKT;A5xo96>g>E_Vg5#8_BWfd10ys+Jsr2ZC|iLGG2Q{GQx%WEz&+x#^ZRwao(z-W
z4l{gc_My6Nl5p)ZJHsF3?9OQ%czS(gaBYjF1(TTs$bYqeRAD^KGgM$x{pj`{@2Umq
zKh~(zYgbhbH!@v4ru8zcu=hg_)D<sjL(a|A&5FE*dYfG&!%n;t2K(iwoV~e7L^~lg
zt?mm8XwhW5bCiZym3EMEg7!PwxCt(ILUR0XSy&|OXcrE(suIivf#te#ChOM8DR1eP
zr!>WM3KlCT|Go8G^dHQ1I$-(Op{+wt|0~lsQ2h{MR>2YC@HC~j?7shngYN`vG$!Oj
z*g-P>{zD0GneeCYQL4^zv>2p(=p{qmgP17Qc~zdx8!fl*l;4Qs+;`{jUYgT9u|}9e
zs_W_Ftb+{utElmZdsqc|jvBFAK2l&3Jp7X093yX}C%@~`jZMsj;WAOYk1T~}NIhBM
zFTNSnrxM1y*S>o3^=fMSjX&#8t=3X6buV_HLaQl@U;rzlI1iSmKZOltEg`Tu%g#sK
zF0&l4d+WZR5e19iv_$-fke!JW*(QrQF{^cG`%wWq8r_wEP079;AN60VyBWi@a*Ikr
z{oH)7r)j@iC8UTbnC0M5d+|hTX>Fm*Np|t=wq+fdjPVtLFx~HdD8@G%+1UGa<hc!k
zlZM_(K>YI+OVe*uG{(K8YqXSt{VdH-kIROKikIUl4e~m|zf9%jBR9}tA^YR4`c139
z`P7BxYJKVeS|EP8cT_!Kxn(3^?Q1}Kf%RERSrN?V+<1CZ6s(S}eboharf(4Hm7Z^v
zFwgJ_R!)sTu{_^922HagaiMg2iBRhuhb76uIF4`h518C&$NJ0}j}<zDq7Mu63B=6h
zrU(9(TV)r``rQp)Zpga+;r=l9^tIctx>u2dtzdQ)>EvYRQq{%UvLL2Kqh;1=wWYLn
zwLn~t_(gXe_^oJpZaUZEI^lwm17&7Cuq^P~wHlSn;vH{7Xr?F?HL4+AUdQwW5kArD
z-b@IST@R_4F4~=I7wJFbKZ7lOBle~%_^A<x^^m!b7B;h-&w<Vz4{jEQdB5ZD2?`?^
zur1%ARThVK(fTgcn$GveVW(tZ%-gTSs`NWc%;Jru{@<(p$yf&%UOZQc)ld-WCN7bj
z<}(D3UF_-acS1D-sOr0ByI}`Io9{5csjUI1ite{qMH;tjeY~W|ZRJ=r9FaWScb!SR
zvm91IH>`-~R5tj}=ZpZEQSb13vhzY<Y}#`c!}aN`qm3;s7FTgn6Y&oYsr@`am;G(q
z%D>3bG?mxZ;-70g(~8@s{^Dx!w4x#r*s5#+MJ|^cOW!=p>`NqiD8KNc4Gv8dj2-w4
z2OtJdz4cUVqo1JR7qnSC8byx+L+IDV0Xj&TE>36jAE4fQTyCja9glZ`T})9xY!Gd|
zKGA}hQCPCf{uunOB2+(cuw|~U!3#YReI>uEdwL?q$c-d6lKAMtE7R7WGoU1``~{oD
z9A13|+v@Mn$Fw<bk#u^rF4Zs!mi=-~XcRlx4+ncjMmCo$RgLAL@+vAMIjGS}nAz}A
z&N|ARwlqI~nv`#QtnTw&^D_INpI_v{K}XkvHZrs`A>FC{-f1ap-R_Bw*ZU~{jsn{$
zATaM^?emT>tgQ}i3pfr_(^;euhez3gYXouVj{5bzq@<)sP-VJGRkuJsci7`M+r+nz
z`vIGg^XZnKg^br7y(Ndj&em=7{~lCs$GS)7PG=@B_u>m6LAz`c?)x61^MSxg-SZ=|
z?AJ$dxXJfd6Ls>cHB|NVEEpRd{cb!hplY`Yy;B`DucdZgb*URpcRbs=g+$hy9DY#_
zavTvSQMPQ6y;K~Oi;Obi#S^$UbjC%S3Fe#j_pbANxaQ5H<|}MviwYC|w)r`racFbM
zuI6jcyu5ysYxX;LUcP<v*4p?Ax^3<L*6l)Hyu_&h+%7~CwCVbS9!IGeP)))uet(8m
z3fh~w<YY9VGy<nw9(`YrUiS`zQzbv<7(8Pjgx|l{;h#D44!UUXsf9Upf7q}a4dVHB
zA-l09@awY?eRRd5DMd}d<V`2o>leFdPpz2#`pkxfi!x)3II(C?;>>g6gr1)9#_NPO
zZXa*7u!JY<HAY?i!L+gR=4rmyl7g0-nqO1>$#;<OwP=4jw;1|u@^ZSE`PPjRra;2Q
zjT7=6WXua@RZ=TPb6+DsP3IDH2HRmu^rZ8-V-vxh%#=iWok1E1v~##}NGtkt1F*{d
z%@6-b!_vU}8rv5~PL|oq&SyPXYF~Z$!1n`E+M+OC=sK*NP*%pYWs9g7>^N~ep~&s7
z)$;Qc<Lt>wsG3%=%xIA)9Jv)59nPJyZH!3EFLI?jx4fg6a0-TANw5O<OLF8CEDAh#
zc_bDM0OKF2%XWFrnf_kx=uRgP`Stbm;W0en_LihPhFna$h=j`tsj=-zvVXoN1hz?<
zpF6J(`{8<@X8oNtYJ3&=?gW&wq99(1Tx!eoZ?ki^H{I*;Hel+UyE>S98!{Gs19`Z+
zir2a!%N)(@iEsF>w){`9M)N{XPkXJ$JQah)_@~NDUKx>B{j#40eE=mU!7%Cg%1_vt
zHh~*7?q|Dk?9Jz3{yKK+XHB^Zii)?R;HYn2$?bsUNbi5Gl>PQ;vCkV&lv{py>6F;r
zcy>dvk}FP5PMYo<rZ=O4Y6^&R0&cLebBVClJMFK_n7Kl*ylh2FU##OXIz~1?#&A&S
z*N<~}?2kTYn)*K$)3wtN9UOi2fEo%duJ`}pPGQ;QP@CPZyZ%J0(;Xm?5!k!#Y_|&0
zQzQo%1gX+n_bK$s;j}=<Gg;45-9guIZtozmO~>%blLHH@%^@-B(m!rENr{O==Qn2@
zIrk2DB-&f5La-caCaS?Vd6>^GzY{`O1yVeyx!W$G$ddcU|1I@4X|s7y;VdiI$Jpn0
zK#KC1TF8)Ynyf;)S0`46B05s%E4EQ-kLB4hV&-bSC(&Z<i`?3KPj1FEeoSLtv4wgA
z`O|4IR~;R#Nmo0vg-`pR>fh{0SY#~!$uj+|yQ3+g8iIfT!?m2EcHM;66A(D;MBcOu
z75EVz#Q62E^jVj9U6G>N@Fz81+>V30*^LslPN~dn<5|)|*>AtJD_w{6aZm!|A;UHR
zDO8;L8Ro#B!osE9G9y`sZ@l8HUs+j+#(Tn%#)A<^tZmW6byzSf^&QK{{RLP#H=8HO
zzrG7jj$gqgW?kGToqO1PzgojSbLg%|4BMb=cHD{GdK9ITy0X=tvLyl<pCDPwt?2i=
z6Byl(*^cPl>^a$G`DmZ1lmAS#8U#f9Ck`<WA^wF7bdjyGF%q=P%gZ6}2vdUiyz_@B
zvqOL4fK3@@&vnA5U+rry)(_UJnTy67{frzgqT@fz<pH+#z-*}tG;Y^&`tp-kZdXB;
zBaxCNW2>ls|N1ItFM>m$n@;a3$nteC@M4)Kz<Kb{cTl0?Vf6HU!8>D*u8*)jGvK>%
zWaLd)i+9{VfJJq`bjJ7TlD;_tCI}V$&pf(q<95C}d)k~fn6nnHy(4^|eo;Y>wKdpm
zD~gOtrzcPiuuI5<3x632rn?}h_?c!#nTZ{6*f9+BfiN<CbJ8wb{3uihbHo!Rp*NRU
zct-JMC*l;yUk>z1<~q7q$D@m<&(8cu7cvM8EGSNSc-#rIm&)s6TTgyk#^p}p9p_jg
zU#H1>=&*HMd4H<ABa%3KFoALY4?y{yjXs*GWt#O*P5MhG>)1gYpjDrI;hoKAtjhhK
zkt4x4!BmN$5M%$3P|v4O@TR9q;7`n=8qMHa_CR*6pa|?D#SW<K@g9vcU>0`{3drb$
zaC^UAh4UV^W_6|ix1)HELr#Tud%wN74*Md>E=}3tT`rzoS7H;bIcF`<%2@xEo_=w7
zS|(q+r6yko=>wnEVqef{&N%aHrXjk%zCPLgSXBy~3*S)23`$;njVZDIKb*aHJk@{y
zKh6o6WfK*e5>mFJLm|q_9>++XtV6OgbBu=FKvskzTO4GkrE+AiW0f+FL|H}Z_jsLi
z>bgF^-}m$V<M+>X-FW9Up0CHaKkkp^^EulWzm-3gVk#-F(U27{8D3H^BK}hB<bEmx
zi_Su$96(w89AS4b76t$<N2lI*ef4yA{IM>@(2mM)P5eP$y)tDHuM}=pv7IJezxQSd
zpKv?AW^>i9lYN%;#a>hF`}?@Bklkrr#OJP<R|a@*S<09XdR;vTNwfxJ6L(Pm=L-*7
zYEm7>N|6QHvfzISV+E}j-m9*r4|=}dL4?eHaP<zgpes^>1&#^@=};g&iBwlYcK|YR
zpU^m)%`dUN7McqpNAm#y2fsxEP$SdcS3jW)e`(|^$b~FYuZg)>cL{nd6j>YB6AxYe
z`EIi5_iPjL`SJiQd8x?AQCOs`0n}W52hpwMrJ9+ODoro|Eq!Ag^8amD+S}WE0U~wt
zrW;d#Ljl-w$2!n9Y1On|R_5yAQK}3>U5OCUTmHG-F_rnV?P42HLEN<*2WjGGpV7>+
zKi!@;wekRj!-~k1ed42Aq$^YGtee(|`P(ej85IUx3X5GToY#Dop;|}|3LhHA3Wg<(
zm1M<Z0>KTWzyirvPm5WrB?f-hjcrIT5TLr?aJ<@@)A-sN-}_^WXNX3!c?wAo8TFEl
z^7|eRMA(>)NmUP@i&G)zw-!9d+Ku}3V@^o5Nc5knfbw^j@wR4_M%Y;BnbTByHflGR
zSS3fz)08J>-GiWJxeC`I*skczW_<kLq0pf^QI?FDr!!IkZUg_2#;LQ-Y{fM_+jxCB
z(q6WehG6plyftt9SRM5@c;XZ-1B%HDcFv_DE}Y()9a9t^-2~C$b!qQkCEtS7)y)}g
z56m(EMc@kSZ|dFEM`TBO8lXsO_-gtuBxhR%VqO779kqR>{spc-uKr%kB$7r~svh~M
zv)z@Vzy>5H%hGdscN`+8RF9wu;RmFiQuegYB@T}(;hk;ILA~@gPNOo9L%M1*D|`!U
z#+%;2^0}fa^6I`cw{sx(6Aj+26Oc1;-vat2_Aa~8C`06Dt9BbQnxpP9lzKlM2G14L
zUm??k;O(OdmF$QfWHqBy{Lc=^&$Yb1`$+1{#((65`6SzUF7M9`=%t!6TF?ogtrD%R
ztz9G`{JbPD!#DLO*}TaGldMs$E<i3m_!ompNMt3<{#n2J=Y8$!n$lW)@E6BEQlPMe
zOnyS)&RI6~{(xBd_sA)vAu)*m%W>}5USuaoowNrVU-PeLTSLZ4l9Bd4UvP~-CmUyH
z1tbOv?I$64HEJ4I{fQ(z^pAZzIp!0>2GpQ!1#q!z#RXC%Xq9oT*m)hd2;o#Ja{Wmt
zr&35gAYX9ip3Jkh%;U#hDhRWH-M%y%NC_Sfsek(6nsA%g_3cl5*UR?9gueo1$l#sW
z^c-RKl%dn}d4U5)A7IO*x4jc(<rAV;p5<xV(xa}XchJgC!35zyvQ<tDH`(4yaBX0s
zdV1uyE6j53?US|UhrR^#Szc5o@~%R-Kh~Bi|1M^`a+goC8+G9>9qJEv2gknJ&KFh3
zKp7{&;^fUu5-t_0T^=oUQZSFifN-@#y{grv%Okga-t*QEJ6zw<C$-?OAR{wg;XRUV
z*53qCxjd_#7GGp)_$y2)vL>3S*z}XwfrH(*P@hGF%zv4$U#e$iMMZZJRNKrQnSYb{
zdue|K437vHvr?6)DfW%vV~pwDLewZc+!0fhnz#akNe?5jAra<TJhxRlKe9f$s^$e<
zFk3D8R}f1_gr?IrKuN+igBR5nw|PM`k?`P;L}WtgFG!gA6=yayG=!w}B*CZiB-ne5
zGZnQGz{J~Z-5N^?SjC@E=My{gNxSFmJ>BqM!dJtR8~oL7OlWj-kL$u;i_Phji5?!b
znYGTRLr|Gvllan4AT)7E-BJa7%xmtikyU00EpUTh2{t6R!In<0h7aTXtSX2JF;h$(
z7-r|;tFLr1xv9_<dkoC;MfX5&h+<P=*KT(~aH{{Gqhmkyr>nr&l@d>_^;I|a)_>se
zkU<8FAR~%g@uwMeW~0N>Q%!$Ni2SKRGDjN{vM{M5XV5OZ<^BnUl65WhE`SsdtKQeX
zEYBp@{}^zLmxlyfj>isU3<J`!9MsP!_3OFFZ+l-@!O#&DiGAIx0OU*IpmSbEOiMAc
za(M2vY=1$fgC?#KsF?JP7V>#aAjo1>e_8_tBbuB-i<x5<^b0THk4jmR|EmtPSuYEt
z-d|E8EepF9t6!DN|1*K;cPIt=q$IyC!)L-{KeT|!TD=E|_mKm~*k9&kJAEY6R;BUK
zp?UMPepmi8j9Z>ZVHbOf?i*>s{Bx}NTOmBed;`BAoNAN0j<xLN&{fdPT*~eE3>BK^
zEBvPwSj(W?fQYRiD#!+YDcA0<n)iPn*oK4_k3K7~@s^B077c>7V~!R6;|gnc@d&S=
z@VpSKy?hYqTKw6(S#7*p!g~<eG6vCjeFyGiNzeO504bQX1B&iD>ZJoAej1FYm!f=V
z@p5#kKs`9<4eocH^8Xb;MeR<Q^uOAGnx`krU-^e0Dh;wm)cc|SL71p34+UW>KDSkA
z^awpY@&4nn(kj^^TgdcJLZ`RK?VD?@Yp(>vKNXZ6eA$C~VC`0}>3)D$!SqV+XY3-B
zCAWM5xIoyZHQ`%SS69a`s`{nuxr^*pSEi4zvK@_HpC3jF;k|$zNP{v688beTdtEU?
z?zvVJgnYk~DTgc}^iT!c<AR&C8cXD2Yg#V$*w#BjA_<p29C0Cr1wvs&Donob{L1K-
z=n60XbmvYX3YBH(jjxoxBAe#g8P7iS*OUNjun%9^zCIhf^xB8`-|1(krckx}gbYpD
zr(Z#3=Z5#LQ@dTVj-Xh(GQ7KV`ZgNClEz@&mvx7Q?cJUeMnm4NT><(&4N`)~sz(9=
z!MXniKz+1&9==U}BnI4JlS-3WMfE6{UhF%m>Y|2~{G7NWKqXrnt6Hr**czPg{PbPe
z@87?zEKFtdU^~!j@<Z0>5Cn{|jzO_<{YokVzQvVBE#!oYvGKTv$oBEcaFJhG{!j;C
z{rJ@v2xlj+3A@X91kYMq7hD&Z(hkjX4S5xoMBzQ}8fKN2zMsza>xzsX)`>ogtS<e_
zpnPNO+ERNt$NE?Khs3|XMHiwxpG$hK9)+Uup~#Jz(ka^1J5f%lORz^U4JqRcc>YWZ
z6w}WOCbXnNl~50=G?gf?-x*VqI!GYDe5uA($fK|HOq_j39x`A6nMyNx+HUQ(C5*2)
z&zCxAR#ACBfc*GTMTOVg3IY*-0z__H37mg}aK}|cE(hmHNjn7&*}Czn{064fWPJ}k
zp`mel{ub-Fgm)lRDhUOD3^iY>HVppW1G(4+O;-`Z1^}WbE9*4|J!+9ANXB*%YL-+?
z7e`kc`(c@|vR3@v%PgGUQvFxDgb^*kZ)eT*>`aT7Bz{15@A;<}__y%u_IU^H%gcMN
z{A-wc!sRsOR<b5;p=KtZ=7}w(99J*T6`*?T*vf{Mf*`UbjGr4$C|r4vP}ovpdI%!J
zrG%7|Iqig@24tX*;+o4tq%36e`te^5bF+|1EL}F2eGCoxL-jLy9!E&H>I?)yx6yCj
zF0*HxJhuo-^o}gc(giZHV)BeCOM#_HK|BX|r-HseK(=iDN=8Zzpb5Wp9+{BY*rzy_
zcvt{gPEB#_;K+;o!R5HhzFJvX>2raDUXB^6U2KP9v*I-qhHb`g4*)VupU^F(xP;4l
z5|)ZeY^K{g$GiT<M~DSsV(enA_4V=D7M!|?I-LT+MWVuZUvS=IA?qob5Je7p-)*3p
zNJDizL_@EjaJE+xil1-|rCSeG;qtzSd(jhvY60~P6*b#B$uDXVIzr)D-rHRH5ZNgI
z3w(tPRDVC7ug&ErPdPz*3ZW@2PVn%q$1aca=m3$i$()j-%+$;JfmDB<DdK6HOcmVA
z_m2<&@O1-irEcE7!Lx0r#J^<mIkw89H)NpGQ5H(g2j)IU(nNiH-z7NnUbWPbIn!^|
zeTeKPhM{jULL9q)5eZp+9N@ppr<Ny&p{?Nl-M1gwQl*5<aJzPa7^Cl#f9$`!is*in
zPR4w{pSJ8%@~_PQVrF8|M=yF6&x<+q2XNe{&d5n<L=Swqt22)gL(mIz?g1o}NrP^@
zlvstK{FQ;h!IXiown5)CD}ZEM>+>6O&PzdpY#>ayPHBLCb4T^i=4?iw?d<I4CeG|u
zh_+FMYNMP(wDG~z*Zia{I+Jy9YUAfNYpcJ{)XN7fi-c!ONw4bHX=TJ9pcPOE9iAfZ
zYDPY~e>zpg^Rr(E!r4QWBCIsRRCL5H!A2GZgc?=`0wp$Vr1<WkkZ;lWOmuV1%i`AW
zR>EL<6?ENbgR@Y`CvtnruU1=mK||s{$q2NlCw@<ONrVlL$WDoW+I5b_+uQp^0OstW
zU0+h~?pdZ<C{C#?O9>d*<^tfIr@=GYnv=<mD<SzhE3(B5snzpKgQCndBq!sSL2Q9)
zlN7~<8NEp)E*}bdd-uR3)Mw(X+EEO*d4WX8-RDCU70z89<d+`OSFVpg`IkQgbHL7M
zrP{xmTC$BFBEqTQceHXh<aD%vj05j;p`~P5=opnd5mm**aGf+Hm4TGC&CGqWlV4m{
z_4%kfZ*Onk43!~$VEXFcH~`x%i@=rc%Opl*61OstXTge1z&Q~CKh6Nf!MtZLx<mee
z4w)*lq8b#7jk+?d0qsKDOaEmqK<6;{(NWu+QZu&9@s0w~(tpX0+gz;y3jJ%goYx-r
zk5j%V9qJ96_$L)$UOye&lJ5z<jz^F>HIQVWD06-SI{9L~0rCI2QQ$Owl(1R<XqXRv
zzul|tFcwNW^wJu>#d^qH1@ji`{xMH9;Sr!xIiJUr0poOdCcGIo;A6JmrhR{55rwbj
z!S4wxNqv)eoN4Mj+L_kT#cX0FdI-3OttkAx|Hywj+N^1n&%1Ztj}_(2oPOow&B@x?
zlEvZxU?nGCAOBtMzgjmoSJ&wI0n!dg#C;CgxsWq>ZsRS&sK=?USTvbRo)9$xsk?dk
zEG^&h0p%H9(l#md^{v%Edrr^rgx5)a`t8q<q@34{e>o%k0|<3(uT^FLJlax1+$Tvp
z`jSwrXYYKFD%Oa(7W=?9BN$?#3M}#oH#RmJGy2AM862IH^FmUAP)ytlVanxJU#NLG
z455Svz?w0{&%=b>6Mg+xz1|+kyH^@K=eityB@XQZ7Q{H`;W_GarP3(9lE}dfo0kLB
zc618sf?r{&<o4eCX{gcjoB_>Jg@(pLP<fq*O~IXz*(V#|OG)?{a??jz=jo*-IeXOL
z_Zt7!{bD0qgs@0eWLKaOJI|Ct*M%aq5X(R*)RTaWxCuyHT{n3Ar0ZPH9tP&xeGg9U
zpx!`<`9(^v5A+H64QxvLFWNN}eU$Md6Q-`VHpbm0=O1if{&YgLwBo4(nbQ}?`+?F0
zOJU=e>eQwk$L9iC%$OtC#P4KnvxbQuzZW<hOGd!06OqtcVZc88p8UcQhG9VJwQ1j2
zsmEc(eJP_iaoc^XkCQL|zB5Qvt~96O^ji+x<E<P=|Cx|<hVN==uE7^!pqn$c?Vizp
zs2k2*S;$TkS6f!al1~@*yd}lKRMV6bTa;e_t<`j@=nkwklY^8MUKs+PGZ!yjJhyz7
z3#9-b26uOWQi()|k6`4NwsFGj7HBGdOv{r{Kg$`0j|>?3JB3*9|7sP4gD{Y-AH2co
zO)xq~0TuKNXQYM;5?n{4)K)MK<{;dxPLtzER$$s@6?}et!@)=^V5nD9ky$x_g}0Q?
zeu!kQ+y#!9Pt}%M<$*p!A8Zl|1yK?~cb)HY&i)lzc#>AzW{~APh4aU;l}HpvITk10
zR+6Mg?A&7G{&BL-0=1zHU5Os`IB&#!D-3;<!MkV#YJUi&NRi^N8H1}wpjIJnco_*#
z5je64K(rM}liea!(8D8hdg~b{*HUlG%xTza>d>Fx!nhzV)<<<;6abmf5PG^J(d*Zj
z*U|j{WFr>kzx7#u1A~pQcI-Uu0s`VKdXm%?9h^?pNC_+v%;p7Tv>OzF+rjQnw-h8z
z*akTkD>j0A)gTtzu-xbB*F7MD!o%m;<ZMB6cD0CGi5Y$da7W}Rhw#7KB1XCjRi$pO
zRxU>JJU9PWh|me>`{5-FHsM;apQ*oNVB;10RM2-230SD(Ag#ciR&rTWuayu*4Y<`K
zQ|^bIxA+$o!Sx#%+>V#SP@eDd?v+$&f%9KrP*G8-&wJ``vTy--RRY}^cOlIa)XyRg
zH}^RI_+pRtTk6=dY!G@a;c^;R^qBc1h8=t@>(Rvj(z%2hbkEZUUnPi4bG89A`1guG
zxm&H7uZ6lc#%;BtI9WqCeEr7#)$X2{lC=#3iUDI55S<qK`kZF`&hjy*^(GG9Kl?E6
zGEGttapC5<!CHHn$NF54Nd#iHk&n4YIw5(`hNWhoTBQk9e44HB$2QygY{~k2Og3;#
zHCtV&-}IDeR&{m%bYb}=v3jEj+J~mdVrwbd0;FR7SDdiaKhO1@GeB(ottU+|0~rt+
zd8y7W-d_TUHaVe6_z>SE!3Vz2IYFYFo$et{Z}s$ed8v(#ZuNi9j^}1!$msV2B$`2@
z4T3}N`Tan`g^t8fSG9N+D@uW!VF+IG>YvRsE?VXp!iJO!hQZM@k;-UVUd6n$v?PcT
zEIkCUIb@@n=F_PPh2PG`z=%;Ueg7@1Q||A*?G3YXa&qRjFxZgv+qX~;VS%sJc-)7^
zs5j1?rzF&yg}@_iXQ3YJdC86|M(Obi#4G55|B%mgs5n&Y)KY+QX4m+QR%#nP{Cjj7
z<IoOwvGJivdaNJy?=6@s*Mmg!byN&Gil_tL@b+-|X9`7Bf0czp^uea?5H{HA^fR8n
z4-4<XD%K(B{dtn0!7dz2gIV|}wn|q8b5sf6@s4RV3hEPM_|AF7w8M0YgNpaB!o`0}
zO9H6fj88mq+;ikZq8sE%@1ubS?|k_U7?YgnkMK{O^z2WXyOvJ%QXcaeD*ex9QrV+g
zluB~Has%tsQm^Wk>8DL}Q<Kz-f!Q+4+Tp;DDjAGB97qK%&8As9rZzj^c1;UCdaeRb
z-Yf{`#t7wY2eQ}(53V!0kcuq`?p_{)wR?|I1xeHnwYyfOPr>Qag1iACCVI}*@(KcJ
zi})5$MWg;|Q@>rEDZda+2o3df|C*5;XnHy1E6pHw=;LAGObURuyeFqoC6CL_9-s<8
zj;B>(p}>n70pf@<z*KY02F4-^{h87GR^XfOcmjR@+i*IH%`;TNf9-VDD4WnKW_zAg
za>tt)Y`_i9h4ytqiom7VD=dXH{m?|?%_Hqu8XvWsen`2h4~n%$VmehTMcL~SGRa8D
z)ObHl`6`V>3(IDkn^Rd@hXzc25fSFq0&R1+7Ike`LSv}ktu(gb8S4s4pFci`g)@NI
zf2BhR7T_2(rx6m<hPq@QVUcf-KhL0~ZSd-r6-DGz8M~NEI4|LRu`JXZUEn-5Q7;A?
zR1lhq5+tB20M=o7l0*%a@%KmZLtly$XO(tP$9p$xqXl|WKKE|ErU{&h6TQ33!KH=H
zD{!Bz@2CjdgIAd;N3utvqx05q-a6+cJ#VLc3S&-(w_$ZsxWZ_=e9zYie8>O$Ufbv~
zU+!1uHXYe`m_wEG8fMNbKAq>RK~Nw&?P6X2R#1%~R=WFS9pz1I7?lkC_#7!n10R6T
z#a`GwZdLl0R`XCGmeAvW@@`*qGrDJA5h7g@NLYLOxqe=ubhDej>2cIFCCL#QO()QW
zsT|-3ld-EgPXRE36SZ;F3YDHmqgT;S8LcvirWHlRdxyj0d8Jn!H0CJ}0X@~HjxH2z
z!}zpQH)aV+pgVl>H;;)Ky5P-FB^g*BBGy7X^V@w_^}KEA{7KYk3%!MLP0zg8bOSpu
z)K|Q7`pEKFDaPU3`Llj`+sYs5Mi&nvE14jTdvI!fxw!XdWBa-(`Ta(J(EFcPIj&u$
z+&Y~htet48GrZ{4VCG<+=$UhSotbPE`HSiXbn#{y2N-Nl`=9DKK(zo6@m{v&A{b}*
ziGQK?SN!K$t>`gJaQI`7uh!<P);ns>$un4GOb<{B4MnF=!PwlJJOLN_^3%6U5>I5c
zpgh}GRizIN6lk}vtMcunNcYfztVORx(@m~BF{?!X+Co7Rf(m+hZ}6NF8@D1lM%q$Q
zg8f0xsb4LRzT)xpX+#RZ%D)Tprpuw2QCtxE?sZbY2Q%qQ=F3hG#y||v%M3P$3cR=)
z0$ww#YKhLHq^H)&(d|D?y^V#ZHso1<Q%qj#tx)XMUdhtodr3L!4-kb#>wpXXa*=NT
zxYcd-JX)()rMhTr8DO>EpUe~|Z=V4-_TfKvBI_=yN}z$ICh78z8D2y!Lc>E*z-XT0
z^7RS5U<^8?hpwoRwp6n>TNxY~d9Qrc<%If6ij*E;tx3--+y*A7E!TZr)Hq5n&xN9O
z+gS#f44G>tVWAW)^k(EKQynXtNov>O^`*kaB1mJ`wufD0zN>FP%3T*dn)>GPyCQMS
zpBYZ7a(Xhj9m@5hSB;Y{Rj0$}GPrp-b^m6r+4oRim2!7W)`9zZfw)hTat2}4b`O@5
zFtMjOapLbvuiKo413oKX1_`BR<lWOlQ9DaD>F`eg%Sp|)c9p(mgQOu#joEJ*dWxG9
zJ=wgXv6lO_{h4KshQv9ff+is=^qnMtC7y^p3CfENGs8U#pG9E2WZmSD+q9a9y7|hZ
zN>a9P9HpA^tV)!_lt@(u&?hS9)cFKOT%yx&Z-t^+7@40YT{4{EMqUuT52YZ`nKCGU
z=Yc~Wv&mVsSik@2wc<6kCys;TXG+2k(YDJPo~2Lo^6|+ibJf{OSBscJC1x0gT<mNH
zx7`wocq7VjlrzXx%pzN!Aq?0yyUc)bEdREPfm6I3zBBh$X-wgxP@?v|%bj(pubCPs
z2JOcF4v*TlDE#3EhbBMzi*G&1g%+i!CnXeOJ$DS2%i&ee(s0>J&N7zz%U)K8U)?rC
zfSEJ1xP3Ns$}!gja37-~HFO=r$M&xUi~N6`hARYAm-mPo?!xCM9296cEjQpz5xlH9
zl#xIOOI=m)sR1!mBG(O-_p74U{E7_a#@3T)Z95XXIekjLs-Gc$mD^ogKTjncp=vX@
z>}17bFhe=4Bai;pb|jp@uPt(uCJz@D7V|>cBAO3wZ02xx#&Iw7c!qd&)^T5_&!Bkx
zQ<kD+l!`#R@lLt|?W{1A(bUgfog6rov3a>*KHltilyhV*f=4o6O;@_ON@Y6>#5y`V
zjn-@IQ6;^C9s$&;Dd<r~o988f)zq>pVMyx`VqY_czOdo%GGwd0x|?ES9F|7`op@c=
zB0)jdHDXzFqt}OH3D=<WZCsqw=YA=<<^ho_kw`Hhx>6mbPl=mfMXY$9G{2tGGr~nl
zr#IVXm3oX2&6eNKx!Rvb98CZUgK>RyZ*^zkesnzLPu(_^BBfnM1Jsr~dv<m6I241f
zD5w0p?&-Lfd#CqeC@>T)dK~58U@o0LburzE1*OR^`pN23XAZT^(UL79qqGn=l5@1J
z#wY?)v2*{5oh1FC7egeHwQJ34aCv|_f^+dftl|sgNZZ-WsR}|Rg(?y~Ku<zkHTrB_
z?oQ+hI{+-OsRqgIq<75LDA|29=^NLh?X<bGdn7sKjd?3-_p$5yFq;^T6BsuhG+_7j
z8}6jY6|<=QTHC1#7yI*B3=aKhAu~}!o`tX?)~bN_4=A?IDYH4>D97dK;!aZa#T5!x
z?{LTGHzRhfjRFU=$Z-3@5QdIFEo>1Ox~Y$TAFd~Fp&<HC7NU}0-WHW8?^H^?hK2@U
zckINmCc5xbJd|_1EXK*_`<aPg!_E`ini8r}9AWLHAT9?pb0iLp6Tj<D6TV+Z(ShSX
zhtOQY;L8UrcrTk$kKF_V=%hEEZq3dKU&c0W^GkZEqYFU>boeml2#nIjYx!a9yND-6
zFM@IS;UY2hQ(0IhmEx@u0`YvC9QB&E@ek;?l;Gux@)PJj^ue}23>d2xwkr<i^W_UW
zvNutL^8`Z})^CTPpx~1oW5`RH0*z<&(kSo!LoVhtqL26Mk6lZ5;wY~xns5;wWy<4T
zN6OTrZrCy3n$rAM&2ds{W~&>Y80B;+0FG0F)3?1n?{Gv{`IAp5@S1AP-XPJshak?u
z_jhfT-Eoo*AH^!iWGj!fBvFjFDL>ryb7$UsBtLW7%uTlO$emU~lzft*3_hg$f*E_v
zH=KM$?b?$vsH{XWOiFE&Ik^67zHMszak^Nl^I*1Mj>xE({TzXj;vCF1LGCP{?u~>a
zkR}3iBZ|DmXP*46brOFg)BGo3%Ov8}f)7>FRXpVn_~CSnVoBdHv|w+1%rQKzFyOrz
zG_b|}e7E$^7uW8NKL%t2GI<1L<Y3-TI_M>CQk%nIb5Qk{HxNt`qRs53e1hj|Aqq?6
zT|kv?+VuO*9uw|J{oSGHy$~LmT^^Y6?qqC{4wLOR?$l0Rp?Gm#BhfF}$^vcCO4*g$
z@GGnl8DoWe(<iF^jtx+^9{4j-r8w7Pb4qV-a%ALQ?&+DC!>qN`jihg-&;x|wiPHe0
zvT9MRbx=!pUkjFXBEnJt&Z(H(+C8tq#(-g-mn$T;#yyPuDjZAmE%_+*irUN1>hpK&
z)^R~*dmvAq^D=Hsscb(*)?An)A~AK^e)l|cR0`<T4;|dyK_a;>QQPP8p|7alCD!k3
z!?Jr+XU?jPPycZP7rP#c6ovxLUt3%2LR{Us9NXR`K7%kG{mDaIr!+;UHIxLN8Gm?m
z7P$vKLlK;|Pw?{y{X&%i0Q&{|IlXz(_SD=e4tTvumEu^O;+wzYzu}L5999K;$H;5X
z-;dfNq=)=BZeGzZsiN4Mh2J%bY7f5(wEg(Ci<W^s%eT-{GU`}xw9x)D1LmO8wD;2i
zl!HKvwx6W5@6_K?B}M_}T6?v}b=@%*UXFIp0#8BFo2WBBD{Y`M^VW`cOwUV#>fO2~
zdnozNQ1pPFOB?y^HzOwcNE7D5yAFG1kkL^IF>n;;x4$!q_AAL!<8qhkZtW7FoZvAQ
zrz-Pct^hrE6W{|c>gX|7YKn?azjZUfeYm)v>L4QiTJ%RaEpMNDIwL_0E<EgPocT5A
zj;9S4KPs<9iEQ_#&Mfo6XL<R}-Lu3PPhH%6fK`0F;BPWw85Mz<l`mKyW~<?LFaCNM
z{hnfmo^XxZNN)2BD|w@ImJNmDVNU&alkEde80AZ)CZKR_pv}-ma_f0VMpPmnGh6L<
zXO2Ww$!ThlY#KvL`$$SJK`*@7om)WkQ>xMdKEy*m<QBCzD)`|2m3@k({d_$I@X+C3
zFe-_-#@@|xbq%Q(!dI~tZU5EN1t=tV^-bg@JAQtuZ|^X}mqmZRQ+t$nqohjVdItE|
zIK~!@lHnIg6Zjlw%Aq{uMwpew)w3KvdsR+cdC2|z%zngSBr!6ZSDvw`VO7!=A5Q4B
zryMdX^Cf+Lj|7(5S6&mQ%;$G;`W{Y)?)(!i`jjK!bmC^NwP-Ig)H8u;eqE?^l6k<7
z8LF!5gL0b)clJ8$^YQzX`%rEZ{t`V(@`G9tCG8|A(LpU=Q}h-aOVp=i4YsSt|4rSs
zX3{yBuO1egCcD2n$k}>Ebo!i<tl9;IJzuC@MfiPqHQBBrA;H1QbhgiWd*JR*Q0i05
zs1L)9Pp&iWpeSMMDbZ;ydHE?09u-*^zB<ij+t7r<20m-bSplg1Qrn&#^PbmzZf53y
zWB)X5fb>J|@$@#F5=(8ZKNMG_urgpcr_Nn@^t`2=`pSYpclt1I2BRJtkM8hqQ22aD
zD5%+j_RXW9R<Tx}f`-lxE1T}_$fgtP=co5a@*0Mo^kICTkI^X|7oV!>I!HO-%WO_n
z!5L{rEnvj1t(WoRZCKi@j{tz@kR#m8a^+!Rqi8ba2sD&sYq7`?;D=f2tFp$b_0s#-
zDRvt%NIi^USf9_^)qDbcJHqJ1lK2;{P)LGiD|)pfeo~qT?q3QqjB?23p-2HA-*~-b
zz&Hz)(|gLr%vu}w#R99MXXieoL*oGRpP&spO!oyXIVZ-muf;VB;S<C2<`$EFY{sMz
z6LYB89q-2Q!{nOV@StlDy@uqsxhs1qhQ5OCK@|4RF6kLCr@_HChonCabW-AcdWK{4
z?eC7U{L!Y;HKNHVb=l)w-o($BIw?~?!GnQioo?>NF-S571Z-}*{h65Am6gonO*na8
zmTK6z`I(Pi&+Hj-)>?Su$r5dhIf#m|vF@B8P~J@)6(JFJKB_!@G5lN%PcfB3YSs!}
zd}6<sN<fMFp`fr&`o@%dz7r*eLBC{7+8VRUXRl?BD3jp<e3pT;;AnY^cM4zPldKA=
zIr*ex|FYSl+vA$NJoVcg;kSU1B(J3GS1JGC0-vCwd-@Fd<Ce_q*h6Cd*|CCi)Fi8@
zRp{c8tGoZbGE{jgOUh9*cp%GJSqBB)q~%+LqCZ2pJi}6J_SG=!IpvzlJjkb+Cd+_U
zU+%L?H8!OWlQiAozlID5tJH=vp-2hwmt5n+S^ugeIWKXI*SFb4XB9TFo#txIpn-{1
zoPaFN&m;2E2H+d3^*)ZPm4G&w54C&})Lb2#-u)kes$yAkbzjCGZd{+Zvn|NdVgL(w
z#xY$)_&u~H<B$B|kL*EqcA4;r59o(G(-<jcB^F4nOzxT<a%<scxD04pKKZ#u4poX5
z_(Z44?^-kfsB!Xo&rzLb;wm+&qr(?5D#gDKU>LZXK&PH0x-E&~#B;@(wLd?4kQ$VM
zB+eVpy8NXCZCEbxbai|XomS}ypXY2X2E;MEg@c32w`J*svVB7A0v%o*-_QT!s>bt$
zIKI>qTXs_=h_lt=@3$nJqXPNP%5+BN%G2ly!T}odfX>>1YTMbj<#XT4vorI>Kfh68
zW_pIGJ<WQjX0@WTW>whkizWPz!ky4&P9P#rDE$C@^m{M7B?M?~-a=t)f06Zh2q3Ht
zm|n@rhg0->NF1H;Fm~VzMHuXh=_;-lKWzQXgY_bQF6*Gp#XZY4zAx9Ohyl}YxxkLM
zVdL~BE-!Q_QD5a6GpF~CmS>90q6>#Wl4c>45Tw-=ptrzBp0ww5(zpXBx{sTh>!{QT
z9eh5-Fjph&9_Gp5NTZ^3MVtKxQ`PrOTZM(ENSmAhm@NM)#g<|$?;<}bzq(~BnvhF3
zwW#BAmR6@e!whsYp<40G^qGr!JyEc8N<E2lyBX#7xzf#F93Jx=okxs2aMnsqaROAl
z8;UMxR61lW8^VBz4&L6q#>#TZp<W|g&zxdmSr0*kws7LqX3kSKqSHZ*-9-uzo9t^m
z{x|22zXGQII|F9I|9e3n!#yHF{<tk=TwX^loF2jb-g%B;hCBaK=7y4BaAL%!t%@9z
z`phgur(0@H{mAcT6%q8N&I<<%B=CB_k6$Vm=Be9}SPeS-U7F$9q!%bQJ#?}KMLp>w
zeB(B1#v#78`{9#q3D2V_XbOu=paphG@95-k*3Ae;%I}y>bV1*t4@hNv#;qJoJAdFW
zDl9@17;2Pki@!apW*$J!?z&%*3<evi$44tZphMv}$88!pTEDdDh7Q^k-$Q^Kz)ucD
z5Sh+LV<26JKF33S9$jg}<;5ddZ>gX3`m1k|O6g;cItCO~dwZz)<+tzghgDBDn?m0q
zjpqV9726zzFMl+~?mDEL+1_!oC5)Gm`AP1L(^NXV9d0vuCh09(4a+`0GYP8k$}&Wm
z9zV2u+A9Bf;wv*t5QRkT%tk80)`OoqwPIF)>jnK=iXB8i8=x2+<mG7i_Vxgy4^ZRi
zguS<Ka8RCZNYZc_M6hk7@~C^5^DYP4$g4y?3+PunNCHfSbWqvKfhK7RA0DD)77Z`J
zPo_JA*WyB(n(Oy&!d@6dcfb9x<KS}0s?^_E0B4ddDQZlMt774qz%|XPfaRK%yh52Y
zoFD?%8H{6`+B~>c;YU5l?|TeCBj3wkh1;18B?f`%iAxrgbWA9^9Z?}Sw9^)pG7PW&
z>m|2Xo#LU|G&C9^9xdf%p0I>(!=#<ENVpA3aMzv|(Coz*Ts`A{`U*?^y}?l)bS^9H
z)9s?(aj)`?8LginAxT$bW++J*v_IT1>7wKe3rYt{zVvi&2T*Tx${fzRwy|fY6rAMH
z4JpcRpK#@W|Kc!sqjb=fYKq@HVfjL>bf9Orya%kWcDOp^o0{!F3J`ZdO?2hJ!5oWY
z#c7CIBd782Al%?dhIGp@LMW(Dx+dX6(f&Pq4L=)dp1tNt{_smQP6#+YibxKlOdIHL
zZo|9_w&||pMyk^~?Yk&rukc-9p`<oAA^im=wN~ZMx4#Mm^ja#*(W4v5p;*`MA{-6w
zeHVx4OfwRjPK`YpNOPF);Ug>_Q>lclWWbYbp<UoV?Ep^6@Cv><6(ZF0v;vNDC{?7?
zUC$m$7>Z4s|0XjmvkD$W-L*VXIHh&(A9-P@gDfA|7HnE9ljGW}mHwOG49?c!dfYXN
zRGS#WPmG&0q<3?Q!IPnGP?dxE(@FTfK2vrWvExh$>l12rj<Xd>M6ASbf&WRXpwVLA
zrQz@9cb{B`Py_yJln5O)$^caY&PCovjvrqIW*f&Qdz5yXh;&QwoK-(Vua=~=Z~GyN
z8*?f|o0}tqQI{G$HpnAWK9E+{DULE#-S4Q?pS}G-WyN>6=HHZtsG%rah*3x~H42>u
zf>gzlIzm+jK%(jh67_eZ$GS%Ay=J3`!jQOOuc4;!%`{)l4#I!Tmu*(T)OqBp)0+%=
z;ewjm4h&K0w9vy07-d$lNJelLIm}~}0~1X!fPeIJd$L4j6z6F^trRsxa6WS)>in+r
z7HTOQspG^7{;TdXL~OimI5e&#9EHDpD$FhPH)w*Vr0_}qqmR;126-#tGH&_gEZ3V%
zcS?|V+ADy-Eu)&S+yB${X!7NMBx<)!TlM55`kF)Awd?0=>07Aw$^w4EZ;pSo8`0AK
zzgmjaPCyXJuIpolim)i68C@ufW5AFUIn#GnzEAyINBqwwp(EjV&78_+Bq)IQ16+VV
zgn5PzbrXbNFa0hnRn<;u!W|`wOoYV#E5Ju*F{5C}#gVn_TsR2%V8<1B9RyYxAy@JF
z<fMq=;{@Ucul^{SVoo1|;#j3V$lcAnXCM5*VO<HTAcz7QEP4F>EDW?)@23;wr@Z8+
zvtaPwIhmR3uE7g*D`K}&of0p20#_sLIN#ld^zdgiJ_X_uB<=ffo32V2`W*ZLPfjkd
z(TJTm3vew};!xsdO3InhlEw}4s>5~GwEzOI7Y)*)CQZ;kt4gk%24<5}@LwaD(n=_{
zgVz>*`fxpAizpNan1+`?S<m}mryOWhfGRVEZ-?_*zA!?+Ar=btb_^zbcz*rjN_iU8
zD`8=D<t<!WKsc-d5XQ7U5;bImhcp%Z{A>AEmh10V5&RU45y571*n&&?cDq$r$xO{z
z+HSfFocSMrTD)$yKk$6Kb2GzRP)5R+-Dmz#Ug|9vMZ%dJ9XrlbT3H3^{V?)qN^M#N
zst;vDe*HMllxlT(uZ+i6n~DILQ$nV-b#<{}>6Uk4iQheFDZNncnis5}D)$E2+%zNa
z7W4OuMUA+JmAu?}+zR2=OpLOko<&K%O38BNCx4-Kz~av_n|uq3$#Oj$r)PCDRBZaK
zI_;Z#f*kQ*EOI)4n&Zwt*I~Na3#HU~m>1=%cP_LZ_RaBk$PLBnW*imtCLBQe7gKxX
zqqFVrVDA&XI*VQlyOpWmPdi28JY@nWot<ui1<2jY9Yv(P?B(5tFYPt?e=uMw3@>KV
z#Nb3$)RZGYFHg5FUAXsUcB+B+AC{v)&>KT=NwkCky=f5>^ZVW<IQ}wQd@D{*N;!K}
zMa4x-AL`7IawC|Ekn*ymcvTr@4;#Nco@%wJ++hZ;n&f_pty646?Qd>m5B=!w%8Qj?
zkzS`X&~A7VFL6Jf%UkN>E#0((2byC_61V%RP>`IVA$)Dd9ZIRO=qQvad#y{7E>S;e
zD%)v->CXPNB8@ozssjNeSn=Yr#AhmZr?92nl8+crG#I~V1C7!MkCr6?qFi{S>nC|X
zv>nE7E~ePo8~pj_%63`p{V4_N?x9N?p?p`9dLr*GFLlNL$9KUALe<7!zs8Mx9G`C=
zUp}g?Rup^YT`)r?AAv<BXYww)5KWqWAN7E!rhWbT^~_K$%-)fOO>JjZ=AIaDJTs{P
zJ~2NEG_)YbyKzmYL*8ye-IelvvKb2mi*A_dgs=gPly;U@wt0aI<X2F=|H<}-rJN;r
zkJHCrcvBkRvrZyE$=&m2#78i|H!=-1P;WezEO{c%-}k@?64Ir%w!Xf*4q0U*3j?%T
z=eh>a>X#T>7Hy$?ZBsYY=B{G9)S!+AG#l!VmB9)5G@mm@^c`=*49awi@tAtQWX~Wi
z!T%CbC3uu`+tVt!=}&YdhSLbCkMNgL?G~M98HV;660!<W*I0!n8_sXL+*YS|i!^n_
zn4GI~r>)H4`H`8gFw(gVI*McmtLOAD?B30aGUWzq@vyVqz>cMM@}eXpIY2Z+GthkD
ze7;BCxNCOETN=2~0=Y9N(_<n4J|FGA*LWAHcY1t1xt*f?chA62Z<y|Wg_;R;Z&(S;
z;Fi;5c0;Oby?uQ4%Cwl=+E0_$HrNd+>$(=k$kqmHnU9c~h;cAx&$-XqLp4orkO|*~
zybaNizhJkfl7|GZcq|2loWdY_++!5%3o5la5^4!3Dr?9?ITQ0OAq=cY?VIQ(O<Ah3
z7X*_3tpog{Sd=MSEtK%2#m9Phcdc&Pv`LE|opuB!t9Fl!;3^)^D@51?Te3El<>kGW
zw62nTA_9}}Wh{RmHWZMY;9oYt+oolwL{IFT&B(~mvg2haK#Z1dPDW-Uw>R;<MF%&<
zKp(|Rj-4JPlx?>LC3>yY#YQ#TU9@i|7q^FeQWUY92eQsmXc_1aMIa?hk_(r38FFOB
z?1}H(%AmIVFbo-Tz2H}06@jXfeTb~}n=ZWZvMQdOhAr;>LI9vv1|s7!^}_58!Z-Kb
zq0YkY5<v7RxOY+&z>I<etylvRbJP=x`@fwK14dXgtjVs{`*CNoUZ-}!Y)<b1<{mcK
z(VC|qduiiH)0C!Kh}(L8ip_rg^y&WKBw#aXZY~eX7vxQCB`7rCDRty4@e1xP+%qkt
z^MZ-`l}ya2I(;y(ru$nqqQyfuIw>{qcnNUO#owp9{TP0MyIrgMA%%gloR;P1BF73I
zT|lPk!BkCGtM)K5>-4ViUq2U%>1fL1Ou*e&xI8lfsjW7c{lC}~G!%yZ3Ky9SxuH9V
z1~0nZOa+M>?pjei022_l|GNhe3g$#QOr|;P?ng^!^DpNdUi^}Jy$S}ewLwR}%98^y
zv0brtAYBvssS{`B=7{I|_1Ak|Z&eJbEWnYLRn!^>Zl=W=gD$0VOZM(EM9QmH!WCh+
zaQE1l$WK&;^}&2N99#4}Te76(*{0T2|6B1QB(;Kxk&zKBY%y<Sk_0k^Ryd_c3ood1
zE9wzld~;B%|5S(k-&lh)zW~km{xzVUWv9HcNRS61)$^%@{qySP*zTJ<UuU}?_K-;^
zAKI00>vJR)v(T^k?U(?u73!9RPQx$|qkBpP$j;t9!5WG(GKM6a;}3-bsiM*<FpMto
z#~ZYp4IoCz)LlHnXu}7-4ykxuoBrv`m%&p68%tIm`u1IQ&Ir4+)}<WY?(A)wotEB}
z>S?yV+HM@i-osCLQ##EgzO1e2Ium@ix_C&^ns8kI8@bzY!@S9zRoE@QI<ustBsG2|
zZ%T)c<TYA0p}jN2vADb^d8kmkp~?8_5C(+JS1(=Zu#w#kFO`+-D8+Uo($C_4Pe<eW
z%<6m`j<nq@le`eevO{F_ebdU^j;#Sb@AYoK_A(sn*+~p4u4;Yf8n38uzbVd`pko)H
zU;cmAm{V)>3p3R<_X0bVn@ZwoK?ImzEvh%f9b^5m6Q2%R#vvkz`2>S9^?zt7TciON
z*gSFw$K!ptQz7B7LrcUE<A$URQiv)i>vI3J;dpb^94NAmx0X5PSf9u(Ue4BCFA}E8
zvvD85XFLzKh(_~)qz=W_hOA0kRkpe~2A|a!%1p{y-BxRKYAz~p=fg`W*q$Eqvr{}(
z^H(bk8a6*ZL`Eh?@AlyK4xZm7GIB3>4HF%PSBdX_YG0^TrHCdQ(^VRjUU4i|yW*hk
zf$7M3Wv1_W;+gugmQ?jz4zi?VyJ<#u07<xm*S;@Mq(3{lhMcL_$#GfXgC6ORxllX{
zL4B_CeY8f2ik4ec$k$(L4_hV)4kV{P<mg7TEg^#hEGBkMx%*GbnsQDAs4d5;15O2A
zr`z+P8O3KUffp<~WguIF{qNF3GR<c!=iL7-fRv;CFr3LQ2)pEe$nx6uMR(&*D}%O5
zy^+}9diO$s`3b87?Cyb{3SZT%f-}ZmUg&iu`4Y)VFCwjpQMu7Sgsd@~W*v!PP=cjy
zE+AE<nI!~IF!yRu;bh*>l6HC}>YArUypd{;+b!1Sy<F|4)9w2>5iB`Wl;e`NR(a*y
zxkAx`p#n~a9{)mtdSfLMfiWv7Rw;6j^w*esF7b053CpkJhvvC2;l51eKO47S&GNZx
zJ~8_-Xuj)pjYD^t@5A6tsaT;tPa#w97;;0RUirq=hrc&!N4G+fYURZNm&}mgx7UvA
z;scjYOpLj7dOoNcjEJxvF*mX^=pf|pHvi&F`el2_cdIj{juSnIoLTERb{1$8Xjh|p
zF7azr)#jfV$W3I1a>fsv@zT2FY=isJY8{uupAC8sd47|9zvY5knsg}nU_q|u17(-Y
z(SVJ^FMP3k=H)Gq^=;l#zfo5?;%m0Q^y@2ajM7TjmQl^~O(`8hcCS~N<v^gR75Csq
z{Mf}mJ>bmKGiudyc#<3K?%k>VoYYR9slA%PBhfafOTvx)xiY1tQhKX+uBcL7QKWa(
z)W>;cL@wRt;+^H8&zCplVpUA<89jKrN26Bf>XXp^yjR-EYL7g3x(05t3T~|}-|8?n
zd(q%Qdww?E<2jMbxIcEChaarY>O|_ACWkOt|Fm3<Ga_Y<h%0&ocd6Tyjy^fY?Jf20
z6n~)z0AqREN=i1`o=D77`u{{|ZhzFQdVc>Tq=B(weaG4Q0PNR-dgseGHL}GK{prJ2
z*vK>OM?B;~#PlXKDvBee`^edzqtSkzPa89;aQ!c>NR}Do+12|8O?L0boGCfv8P31#
zvrr!ZQdOupxg>}e2SaY8;o3*KHZ8~V0CiqRfFyj+YNWK?dPzIKMmAZ(z5wlRVbrQW
zWyYFK4(e5Cd)%)X%!(fkoT-0PcUZh=hiCsw<;@iwbhAHT3gFT>@%Cw+xf2^PS)S`V
zmQ}z5+y}YJQmC9@k{e0C=vCx`Jx?0Eh5K#S`9AxV!E2w}SFJnp^uz~t=I!CD;UHCy
z#a?qDnP1rP{~y6VzkUVQfa`szTrjV^ic1oEy|P+m6_|e1ucY^knU0;4uaWd+K^uWI
zpIeFrHEpowDLJe-l}klj@`&fh7XxB<*ESaFt&jtfA6??7NBXrob=NYA76a0<<D*1G
zWRFdnH=)vWHV^+=F>X5JV4iVtx|1+a|L0qKteeN%??asOvXAFpHwP{gzUPN#g@sk^
zo%I^^9Uh+U()Q4@vu?_t<E88UodeCW9ZO#Mh6Q@%98N>myyUx|ta$J|AvoJ@D3rV|
zw{;Dyu-gdvc&y*zz<A+;;ssi1o@*w^z=~xBHMf7BVw1Gmi}}M!+-=<`0Zk}6k)hy<
zniilqZKYtTO8EEVAG+B!{|9L1ZauZ8Q4yUs*LF(UXJ5k{QbALpFW=`%@=dnPsN9Na
z?TfKk>+)*)NQ{`Qj=R7d0l0>v+hGS3Fe1+QYn7NvuN;g&f3{8e^+|J=r;)CLJx_*O
ziS?FyeA*qX-Nyd3YA?GaS&_2m!qr?bQ>R&#nMSssuiKhD$J=5Y=oajTYL;G)ufPpW
z{i+JSn*y}<lic7<Lx7pv06Q0@7Fk}$X?&FaQ))4%^h!&8-Ycx2>-{|}&fVOo)!f1S
zEfB3GK(zL$!T--yU=1i(><uNZh)K7Wf*FVP1Js3;cnKD2Je(MJY0b(B{{6G(dGW%B
zT13KA_>Np*kFI~U(&8*6kcu1O)h)}|_NJ;`u4-}pidAye>`8su<UwA{Npr&!>YvM6
zG{<Ci^hN$3j^geo?H31`$=po1FE_CoJx}kq9}IK9?;NDJv1%ln-{(;{RVAhroE<?d
z`mwxxJ(xA}-I?rVABmWJbm_%UDvpne<8gE~jkwtNK40^y$fq42SCNCp9==Fv=&lM$
zRtu0_8|uSVV5}6g{MV~8UYZ>DV&x_ACjT-2Meg=2oY1gSNs?z;+vcqt=W}dko?bz7
z-gs%1Bl*widPg(dQk*s6{li%2oz)5(?IZ;tI~8{IIvH^NuCk21m6c36xGD&J%?5_{
zJk4mIU4A3+H#rX68x`9M$D<mxMUj~?;hVJtQkVGhrgtUG#T>46$`!R8&W<*?`<-PV
z#M>1)MR}ieZAO*n<SsW2h0=b_aWgFHyT-0%TxW=n=g=dkzVm68879dgUwycg3kH}D
zW|JL)ml1-?qiyCe$_Q?e6Y=Hh@xpzuIl(L5>~wnCWThRWhWu&AiJ#HZ=mQMZZZgMa
zkJ|-#MVs1nNEQ&S)2zg+6YWdvGDe@k#PSKHH>YI3D&EhWX-I2-fZLQC&@jX&Kk7L&
zy=*<dEO)wWr*QNulMlN|tLY_~M>=Yn%H}a^_m=#NMvVtXj|nKsISW79seC!NQ_U@E
z&cDeHv$n0@v-1kOt95c{eH<oj(8njn`IW6DiFYGb{c6s_QTOEl#_P)!SmR8x)8~eC
zy};;74)y+Bv1a~5y8rSd_yUS(z8rw4N+Tnf!dQtKveRgZSLHefxnuxrC^J8)H@v4G
zpHCQp3S9l}`tb~GCPvyxVCG}KbQj5H!SsrmK+OT>8t`#GNUir<gw+d*Sq}7vy(DH$
znHa1#JE>6PLh6Gqh35QP-ZJ9_J^KE#Y&Ij-xtY#KH4)r=5uNMzYBWPsnmThDd#;vd
zgiNUl2}jPmWtil(KUfkpvk41Rc&3xQMkZbGy8rciqtP|;RiT#;;}x*dxE{T8Rf;#=
z%bqbce(1>Gm{F>D`b__L_*%+M3Bn(9?@<wg!}B$V@DJo=rsGn($b!B<E!kOb_0JC}
zOc(a&|55SHL5+X!sTutBYoD^QZ*Wu84=D2B(k}ji+c$0X>u~O7kVbSb6*a{C@2COd
z!WqHV?-~xenCu}1wgIMncN#l}OWbR1I<~CmlY9yN*yC%@6Evh0UQUKp>Z!UJtAg71
z3VQ{_ppoM0OJd1m?{zY~2HM-^3Bx{3()328Z6dw=jA1wpSKGP<?MN@am_-=2L;9gw
z8?;on@}MkzjQw7S&un@d+u&O9YSQ4qtTD4(TFL2hjxz=Nq{Wc5s@lr(5bI>MR~%`5
z^QFI^VmA|h<}yZ}+|R*;!9<7Hx?PMRaGbCG)%1~I{=sYmKQJj+C2uqWybe1@I~25D
z<}f}4@fbNr9}}|kSm_frfC;m$lXZ5Wu>Yo7S|Y(7HgYL>Iym-s2(`i<;ZKDasV4uM
z_;?`0WeFg-X4qriMQWftW@6NDx%xc4l)4l->HBohme({e>d5+IwSDFldo}qm!+kYI
zoHrn$Cy%6CvW7wZp1<zjEAuFxY<90KF*_^&opwZBkV!yro!k4POG0T2_pujE>M-wa
zaP4*xS>7qX?&#PcEt^u{zAWa#-?kP!ur?5MIn<SIK)&aq@LNKPSk-9r=chQ4Zl!oa
z22Sql`>1#23jW_ewWgf;O#c2Ss;a-d&~ad8>cvB%(fnpy{GrG<e5nLn&e}uHa&mmC
zl=&Y6lW*}8M_eS4DE>#|4tPS+gEln^sdbxoeE6^qalH1w+m;I0sOG*mK48sG5Wf2i
zyJ?aDYxfKnp~|?KYU)Y71|+s27Xzb~@v4g3o)4-q+Lp?zCunW{P6(4;bN`*Pc2C=l
z4}n${eV^~__{i{%Ov;Mq=y!`Xdbv;3S(v?e%p4{ekT3moT2achx91t|eOjq#>=xWa
z&Ls61HwCB5JVL!PQdghbeN)so*t%g#Iyk2LxW{qz_^J&*4$i>!iiT(U4kjBS_Qp29
z?Tms;{!}|LIgA_=Hs#edRZ`5aX`6K6xv@%$C$je$%`FvH7rg_v)93u+$RS99>=d!0
z)U$O+BE)Nj#@cD-+D9I3J1GalDNYNZ`Ins@jwB)++^+;z{{4&?oUV`n>+_Yu=zFO<
zv;^vV^ygje7k-ZSND&6Dy`P!e)pq1<i(7g)-z`4WgvGNQtQF_4yoyOMzuI%C;lOH@
zY1)Ot=y}g5a#u2Wxp8edsH|aBO(@p;*0IOugzvE*4e1FPoPH;KQMDjrt?LKbNW|c=
z8li5$w!@6nB0c)bxjIhS@+6-}(MHwcQD2|KR$pNr%*)tqvX7iA$~NS2Hr43Y`Kz+U
zQ!Z(%`BMe`g(Ts?*rpJ*O1S)NL1sqQMnOYu+3`;`JH8mdZu)KTeW=v&`1GI1+_gLX
z0YHxUoOcpH4I&P@x;les*pz0aI@K|+(XjP~O4G8{Fu7>CYAQxSad04_x88TwXo|Gv
zXx=fuw1yMToLz00Ti=_!;4l$VpOw`v;ys#Gx;CYNtLE75GFD)K*P44?HEjVwa$N7E
zXZQ`H#5$PnDz}5sw6-k0(f^HqY9nJVuXsB6R>(eF)ZCwg1qb6&aQ3#xud7IhMd3uN
z6EkH=X>z!W?>NY(Et7cu#Q@zRr7+L$4KieukjDFIZsTjGo<yyKw%yvF0BET$R5fVQ
zd^7jqrGT9rIdkoE@XUO9E&anr4;TT1o1V}8WOY&x5-W^&38sTj1kEw;I>u16><O6C
z9BQnku#+(;9*xYP+IL*W(pG$FHWuYk`y+S!o*wi2(k&RYv5dioC%I8`ntG9_<?A2T
zb~$2xMU&%ai?r8H6c@Q+Uln-7-+!lti}m_OD3>O&<;7MAy)l{VFVbY?9N@*=NH*r4
zs~XI#@?=pQV32iNoyGN&i}b5rmsB4oX*W5lej%vn_X=zrdvSo(aXPFqqzZ%DroR4!
zgY<*w^iVDTP}T83m%6yCDW=6hm<`?NwqroLK$(P}{%Vh7jbWU>Fd~%ULAs{1RA*k%
zSAEuP6IMY?fi&pQu(GzHw%VtuI#gx7Tq(p9=W@CyAervc1hkrtSe35Is;pKYFcLBH
zFuo3B1A}9P6_!b*Nl$;Zz2MLt3K@!;3)BV__3?LlApK)eMGyah_05ECg)1WaV`d4@
zeA%PFAJ}2r)D^I2IyFgh`5Mc>{j`YQXSEMd$doS_1CjJ|WB#hg?;o#^r^4i*;AtlM
zu^EqT);L1qAnZ{gA_EJzs4f}Krb(g-&IFaO$px;sEw=8Czo#t{+_N^hNB%rayOBf2
z*ugMS`RhA;?;*n;c|7bKBiDo{U~H<xvR?;Lfz+1n(`OlLx&Tr2CqoL~cMbo4<NH#7
zsV97nY*`zf-WtprPS&`5R#V`O50~W4=E6C~^0jDEtwo-tvs+kjYPpU;_mcLfvR(Tb
zZ7?kl9G2f`3Fu6;E6iN}Q2AS<VrWcPMC<WLxU8V2f8_FrZ^qm}p<1L2pU|l%1GY+A
zQhRkA&P1x;mR^1xU@<cKO^9!4OJPn(#w(llwL$lX0}SUYOV<X!pMU&E7PqM+cFtH_
z$6bfPM|ie<b`{*3%8^Po{1?D}Or*MWuL#ChVXHFUv2&6!0f}?-8xH~n*D~gmZ?>Q2
zyUl(u)zoC_fx^SyMOj97IR&GaD?t!jn)T(4m}T_OZ0MPkZ+o7v64pmbf9_wZr{Y$)
zdPqeeM#6Jbj<n*y;I(SZZ@Zg3AxV*Qd3F(zUd#6_=L6lMaAO<fu2_PLhl%qA5hEV~
zXVrhWP5x<l5Dd_1gXw2_UNDtYb2P}K!aTz`cp+RwZh!ivFl5A*o9*ql3dn3wBCdJ_
z3uC$Y7h%5Z-X~i(IQ(HCm;CGPUNM6(rs~|E47q~CFn!Uk4VeU*Pjs1$SNh1j80!)A
z+{Ib}%7EOE>`bc$fT90|#0Aj88%IxyelX<ICBWM7b$VBww9t@k(TeTG^?N5dn^&?Q
zDK18@?Xo7J(}|jzk)b{g^3MA)H~L=t9f+8+a@)jKV2)SESoFO7wnrnr_!__4I++`F
z%aQvTd98||Qg~;s+`7piZOTaCs!uxk96?X!1@>wzsnv4SGinGc>v&hu`hHdads}Yx
zpwf1wIq8qCkV^FIags$LRpA^fK0h-uPA>E)$mEmC6a<gOyDl^BPF{RfwvFJu)A?wj
zQ{e~W<Z*|(cD?X;QAf8;&7NZ-gY7pmU*&DTvH@)3aM|N(k*3#X9_YowijWlCK*cv~
z(VB`-W*y+AhGbmP?k|BE`(4ktMX50zomS0jC-nB^XJ<P1@>EY>9GcwMTvqjJ#E;8P
zyMu5e$LyB^k2fxueR-V>!?zTV!%SA|Qpv1qFt@M|8KZM^?8}a_x}kF$jmT<LB1|^4
zT3<gmP*q$+f+6e3tT%_z-z(MCXJhAGdsmG0m0$W{CRz>!&zzpj5!rB>I0u7aVJs4o
z!g?tK1#<rjo(G@Xav0Q51H)U9@vXAAWHu~S!?RX~KX1UMXGvO#{4wRXjEC@K&n)k*
zEo@r{Y=1;|D>i7Y_q{wuv>!j~b|{^!u?T%lo1cfB=HVb$O`vj#1A$mi=`De!%Yoi3
z<_wGm%d(FKt8Yt=mhUvl1EU%?s=j<us=uvq!Z8Aa+jN8#FJ77L*t{~OTtKuM8&PeC
z!P>8|-7Ow~bZB*NfOKS>kG@x4stYK=YI3-@56SC9^5aef4S8C0m@3{EzvOIe#gSS2
z<@D7vcTCM*uKd!Piw^Wk!YS1z#wTrE^qO(($lDRoD?$K#-H}bM4t_s%dEzcOzyOi_
zRi2WU7hYM6{19Ba-@h_&8E5zZ@b%VVQU1}ls2~!8luEaBN_R*~DInc2ba#g!-O`Pe
zATS`^ph$PeP|^+3C2&9E_jk^7pXc6l{#U`7_uYH1wbx#2;UK}!0KcA8t3Bq6_4F&H
zp*!$Z*)D+C5hLf5KDrEGdrb~iGdbP`L1qiOzUN@ybL1J@HGRxGHl&h1cNQ<tS}B4O
z)n3nCF?rMlcgfy#&bigi+j0jsghfNZoX>o!1vq&0(7VWk3&Fqet^Mb&;_bUHOPtF8
zjYj`p0=#UW_^)OQ&0QOmcoF9gC!&q5?2q_-?7?&81u-q`3TpzcVzQJCsBS_1HJ@~a
z-<|T3Dc-<$^gmB2w^s|~eOYPG=e?@e8hpyUh$#DSc%+15z2ESZEZv;f;n!^7pR+fg
zpTmUep9O6PIx1<xHfL)s<?ncm@Mq@ls!7eI1?NX2%%Z18vi&d<n2Fe)py~Qe$1nH`
z?g3@%JKKw3F?M)`j7>N=+Ak)47kK&IE?VAjbTa{EdWz)l;Kil=B!ALDS)P^bXtdZ*
zC`nT{k4LdaaPU>gbo#J+Q>E<ICJ&9Bj;(#X0@K;vcuzr$&d9_Da!mv8+FV<#OWNm|
zi-)A|mj&4Y%lV)>O19cp3)lUH#dTLTh`zF{p&1YWIP9CjqVIE;XweIJ#KI8px->qk
zFK~N#$8rYu#suD4_KeLwz-evhpHBv`<ttF}S1kkvw58|o+vyVMfz5BdCkRlaDji>5
zgxlhEigGhL_1J&~W+fc$g*};CjRYHe)ZT&rVTmjMn_QBwK7O^{fG?i*J<MElmGIHH
zA(4S~2du34Pg?8d^d~3Dg<lGdc8LI@iCZUXS)ux5jQnbTXZ^<U4*<}%!mBnZn>K>1
zMh+T+8Er7ovz}%%e)$&JEt~QkedQoK+H%(LhsXHus9si@y^nP;*y5rvU+JDjiW$C>
zPGEU32@g@USP8%!cb>K*yysR&n~V?X`^im%9kW)Nlh&UPJQXKphDUNlm#w~@7kjn1
z1q;KnIVFRyIxap>3d}!p81;mx3hH)@H6aWf-6>9r<W0|CD4%ye%RsLEd4bH;Dq{C`
zoM+$CJ3nRMfywb#Uma(6NGsO+Jz@D#O=*_*t7d`4zAsEcW6FzCZG?f1{*nhHs@D$$
zlu5hfSPhB48aqcu@F)eiN8(>OAANY^NdrcIl^6BOIa9VeT)>=A`+@6~ACuG;Zu%1q
z&PnN{EH_x+V79QJ6(?{i5qtL!ZU<)nAA1jwkfiUwiJJ-*pHH*;>s1>0uE_!#Y2^6$
zOF90r4V%^OYL;1v6T=()zmuYRov{-#*W1R;=Ih#_(Aa_C35w@>78*LO7rU`9pBgqN
zHjuYkRb$OpYUo+|NR}Rq$c;L#;~G~U|EWW3YB*diY;q}MEX$V(rgTx*@lX@?veU7N
z)v6Gg{}@&8yOs|tfoK@qh|1bdJMN8deqpy>&=_l{+txnADY!$W23*M0^5llQ#q2Y>
z`&wQ$*TxkVJBtd(in=Xsqc;jEV!F8R>UjT9S5`=~%^XeGl^#U32vkf&TUfqGac%%F
zMg@7@n}dd2^Aw88gJ?h2qbI9gbAC5cvx@q%Efr_o4B<Tukkrn$Q+1R#GcD0?xnUBc
zQ@)w5`j^0~eWC?;`5v;p+kSbIF$=5?ZQx$kl2$FdC8dK~q7R-$?bXy(Yaiv7;4vBG
z4_7@bi@pD5K@e?0XNV<%4}!FgH%|uG$eZH885l)9oRTwPC-}b!YG{2hX7w?q?AG+J
ztZb?do^;&IFsObNP4x=kv(Lg`hg-&c;2S^hP|M`;wvF<_XnMPI!u|~w+TnKNF${Ex
zQ`s{|8vc()ZB)H#80t6^nsoVW7b*}jtSSIW2K$CiT$lTk3-POdhHm#yZkwHhSNmfZ
z9ga$WRI4TF`92ub44Pe_-Yx8SoG?9gw(x~iX02%Sl)}m&LlxWRIu~_69aA7bXecIT
zd1`fhXHv3f@TW?1s-=%^Y<F|$*oh5%eLa2OjdEAKl4!>6g@=~3w+>vJ;qqS3hTxsw
zzB_sxPhVH97LpaYOCo(_WFv>m=>^N44+_4rfx&ip1hCQs`63@aN=Z3_UGtpnukMjN
z&wz}E%wLUd%jgT1i%;jjxGiL)C9@frB{T1Qo6mpvkdh+{wt=f&jYz7$%tEGbMT1jM
zRZ5()?bZ}Wr=-Je<G~T*E-Nr%Oi2eZ(Y<%UXzk*h{Y$_Hmu2SWyuyDGZjs0`li>0M
zZo$eAa$O)A-b36osnx>*1H0!2ce@(@N+58}2Wsl7f0_k!*H-&c?oTBtk!)?VEx@$1
z(PZ?fvB1u&&lJT{mEj3IWcd^%<7_tB!yTJ-1h9r&w-}ci4DL@-HbH`6nCdLB{fSzN
zRSNu%<>9{aFnosCh-)Z4vmTP~#_n>s04vK;uI+C9Go@*tX;^@0<Ck02-Sm=m0;9HW
z<!uUjOC3Hp@%*|ko9Gkd^J2EzG4!mPCun-CzpcreQp+Ou{C-MQJo9qd2_5Q*1~n3D
z{|S7|xOy=!2^qQ4q-9})h0*CWsw+=3a9^Zec-!KVv+ZhB91J=%@m2f|_ruGJfVK~?
z|Gqihs8z;qam@_A%iJ;7!QZjHCsz@^;b#KUcI^wCul}eFV6l46TYZ;Rq%ogabPZsg
z%KT|Vf!US|T2*kcv|h(YC#x2A)2xq+obwLl1K#M(!p*iDtHhUAm05~vywy8*I^$g%
zB&>F`TxCObJ>s*+#Omz_{7v$x6QGGT=+|*71L{sMX8HB6g6YPV`nOg&p3u-Q*7`DE
z7Y@cB^j>%eJb>5<PGARHJx2Yg&a@O-#{sZd&75&0%OG%0*S#G-3WWPM^Dvc}h1?C<
z`$6E*9P^AbcJ9EPG6T2;I~-h=zlX;crNO5Ub^nTsQXPMLm4~IXue@ph%rzT;g>brt
zzGqhpNOh{MD9Z7J!Cl@@y*;-%?nw8FMDM<(3AkEqyS-tWsyOnyY<^Q3%AE4xHgC&o
zLI|$C#QgrD0b{PSw%pw}8hX4Reh;}-MZ3i$-1`+cqh)<i!lsY^Xm&VrZInF#-0>{S
zL6V*j@8`O%7vFtj9e_(Lac~vG&;K^lL_R{_k-@DOpiJ%fbXjS;z(X>tJs+9Bv=?ah
z?QEJ?q)GR$OQV>DV5u3z`>gw2?z{Ha)@yZ3mrp6IlNqC96&=&qWq-;>2VCH&+3ef0
zbx$7+Y;@EgbgdV}jNG_+jo8k|siJnySCHui=Cg7_=g3CN@poF+cy_O<&;-0O>yTMR
zQJSvSZcy0oFb00nGDB{i-;CByM1>6tc!wf_lYJ#BK+@fRvb??J|F%qifZ4Pg!Zn`;
z`(@@=lchGfp}Xuasc?{~wH3%C<^Og<q?)mg^Q>FgeCj$2Duv6rbHfk2P_A$ljy<0@
zxZ_A69_@%(z7g2V8PIq@k<60W<9>>>C;V@f-L=`8vwUy!Kt5LFvE6{mSl4z#I5GQG
z&t;h0%~=O_JM!TUpi(ZPDNFP>8ugX;z`@-Zn5P+?Q$2wI=WHLiqn*~B=;i$KeO+BE
znJq9U+c$<Mxy%oR+7!)2iJawPX+0>`+;=_A$p(>8wQV~-bR~ZQK;%uwISQxC4uiS$
z-Y|Ul+WGWRX*}E-kI}Gn`TQyI{2Ao!8vKrj<2hXAgl-d9-Yo?Dw#`6_xYi$;LuX*0
z%Zmkau-4sdK8j@{xwI;6_1-i~f|dEt6%dis@BG|SM*(5}64l_U1Ah=eQ#@z3DG#mx
zG&F0oUsGs+$Txj~qV85acK{=6w@{v<O26xZs)<#9Zt%p!dkot4%&R=oA$_iomO$eH
zJRiYc(Pp@#Pb5-&XG0#_bcBIns`b7x=9}$n*jK1Nu`Zcj$8XEQoBY>bhoVSW-(U`L
zl{i*2II@nH>g#=(@!M_RP1)i5-s)g;`w${OJI52YOV}6#JsA1!=Vz*W(GgW{N^W!$
z`mq@RTQkm-Q^k}F!Su@-yYK;Tghiz_r?y5rHtX!hpsT#Vmh^+A%~(L!leYn5*yzRM
zJCQ@r1iQ%(IXcfcX0z9Ng#C2w=xxqDj-Qa}TFlF|iX3_%9SD9)lmE0^-`Xf&QJ*C|
zyYXLn=#~cH-#<t(4z}U@K8|}}5scR0`qGsHOn8eVm-F_br@&)Z<U~q<x9M`p`=7mj
zuPrg}Xb-jlh@*;*eBAC2;*bV2mj7=4IQL_689py}Z!LBE)VA!^ZYtpK_0Q?HfzfbJ
z`|Ng$PV_qbdYw*G>o)QA{0!VCk{3P*16TF~7qWapv)YkjDwH7-I8a&rZ#}e)?ZUkY
zY}<IvGaaSz{(ioN`xp-at4_j3QeuiYI)p`_;l4Q&;_j<w5r~~B;#2CU`F%pR0t~LX
z(tT5L0T+DA4i=m}kFBwLlfY*S8pI<0Q||eE);QRU8AC1Ktfw<Ohz&#Jn6_rbPL12!
zwXf`Y)okms`eckA>&3aW(%Vgt>)Ff@1P#4dcUn<pb!07>M<$HVuIwY0A!f4InZd5O
zZ2B%UpOaRM-gAEY_Lj=`t}WifP7s;Z2ycE(?qFsl#cx=*L%7c9mQVD#Y-(LICfLy8
znfs%zgUb->Q-Znswh1OZzb)<~%SGJz4B4}Y21-7Ad)Df2p{-b>ja7;S?{25a>s;O~
zS&iMtdl`()CU>7&E+XYS$9BtPoMO)tcdlkv!(xomc~54ufAtM)OkfiAbRBum6Q|{w
zv7VRe4A|U$wRNrjI;04xd#I>cHN8DG;)Ikb>M6hRxK@gXYt75(YT-0-t@F70&0Qs+
z*e30`V!Wm{QVi^3Kr(jmkk8Csiz7TaBUbn#_2{NM*gVI#?t0%`biRS_%zJ3v3mDjk
z+I?tO+2UFTWWf+f<xp$qn?8kyJ8Xims``5Z3q8Z>V6&8yACIvJd>4upmH()79)Xko
zFMR)vb^=IxiU*rfI(CgT==Z(8`XIq$vtcbJav|m!c5lKDH4QyexN*4<_qT5>H@9ES
zZfCfq<QkD|mS1fj83`b}=zaYE`@Vl&7+Wymx3x?+4L&NEQ2+{Z{vSIB^09Tk)o4#=
zhf8)24Dfl+BPYRP?2_ncj3=o0K(8ZO|ITajiR+VN7nK4wJq3Fo{dV6`=ajns4(`M~
zT$Ar;%qZutY#MD1m0b(QkTW7%Vf6=P?_fL!k!LWO_%1gLn_t7MoUjsdM{y3>A)BNE
zNU|%qv{lLRef95PV`y#Fsf}>U{lh7l;=wB;*I}Cvy2IQ=dlQXC7m(+8Q`WzRzv*@~
z$__DF5sTHJop8fumpqD3T^qME7b|MkTISrO|9<~cWiW4>(s;%WZ~rV{hjN{WVDDcS
zplVwI5qqPNVSM`_x1gm${0U}cTjl9*@10<vB06t$V7mDK77JWV!#Rc_5RhVhju@<3
zPm-z3W%thjy87+T!$a{Z5t5qW)CPo)7iRH_(|Ve@`WL34BzKqB9f%(=ddIhdR66>d
zaY}}B?^U|(0ElWc&5tFnWmpCt|AWAb+Nzpi9<=cP4XR4nK^9W8=VqFD)$iDaEw~wv
z8;HT{J(ztIAcXeM(iKJY>P>d~<YY4F45@IRYD<3f2sXo8vVYFXSb#u27X14#Cy2hy
z8*zSzb?D#_f#)9K9kBX>;ZS`+=c(=&zOLK`XZc8LM<(rsEc6%cVv)ao9$@{wox7C>
z@p^s3f*Fg{8NN%-PVxIKkdeW|;X{y?(#=i3>Y*Sx6D61wkB?|cNs(tQ@Rr9bZ&a>4
z-_24XMw>30<@x7nw0f0+$$Sq}7G6&+T6B5S{?&N_N4X{0#C#7+BN_uuwP<liRLk2M
zI$eof@^Sn!YK4JDoCxz`Q35f>?+SUEvZ9noX$3P>s%eyyH_T|1-6>{FA(6m&37W@&
z7O+VLeysW54E9Y_PqJc}!U=(kM=!}&hHn&<-+MCY^l0CYN?A}+zgbSDHt|Vt8MLDL
ztBp^twz_{yuF^AF_h&<~!Ijc<+xdO39d+U>6PZVQt~3n#>fo#|)7rPKCg%2M>B5h6
zDVL;@K3Tlt<f8e*b}1LzOFX-woA7Nb`xNly%-e#5xh2$v9Fgnw=M_04Mqr+IVQag}
z8yOmU{R_jcGYm&xl*A*nV_o<XA#w=3k#^goxp4o@>IRhSOot9MI}n!rm5<(^)MfMy
ztwHAOFg(te>$)98I@`tYZ@#|nmqkSlm=^mI))`?&Vc?R-bR=n(<LfrDAdx>GYCZ)_
z(79l_U&lO|L@AZ95ThhSZ?^Nj;(LWyBP+`wlY{8_7%EbRU_J2q;KfhQWw2UEv06Gv
z)x_z6P&L&--m7Q9a1n6yCM>7p!aKN7?WbjVtnkHQrNJStxC^|N3ODL%iarVNaB=ag
z5ZK(WFSL4*irAn9E7P+6v^<s*qiCHqbnhhg2y0PvriiG%%6_Fcy#$tz($6akA8Om6
z&wC25rtcT%acTJ^&J0)6>_u9>uR<szlXp#N1a&H&6%ZHEYxLKjWN<i>>6DSF047cS
z7-y_jO<Q~e8xi{HV_13Ce215R$d|4LMwaRl)p!G3L`bi1ijdExzO^R{#OI_swHA{S
zqTh`kRY-WGIe6)F2EwIMdnsjm%Al{?DyMOTstJ0uN5<k>ByJI0tM}gqlAEzOt8|$$
zu}{euJ{VYLRk!88g~eJ6w>#;vd^V8HIB^mgxDN$CdKYa-OiWTkaQ71mmKz9j=aljQ
zWj%i}Sz(wv6V!T-p1MxFTTrp{^_+a#;FP@}+<V$i`AX<?a19>gWHD$FfxX>%n<<5-
z)ma&tG?J|EWqApz`qe^rQ2sqQ=qYA@u)Z@~029N})Kk0gwYaZ2o|}ZcPV2p4lbyV-
zYZ?5HmSRu$e>9*PbM!ZZm}F-FJhV%64mt2vu78-faF*3h9Rb*}0|y(IU_m75dJXcd
zNPAMLb3i2bA_&63_q7MAi*orC*0!?Ur+_NxSuCw++g$<=!}cloYtn1^{9Bn5#|Q%;
ziKBZ+_;R80`ny=<Wxr#$_f494Hvh1cQ2^?T&zd->%8Z9nbWM4i^<bPT3N(d<Ggl9C
zj0p=IxFls`_u?WPrnTK#C12}IhyZ$g5x^32*A#;o?C&D4GC>_H2MN~vC0foA+MUO#
zVdX<R*8OUzNUy+a{MtnA6_-=q>!8=E(>w{&XqL+b#8|`XYGZMI2UgJ?@~Q&^{Hsp+
zU-yT&_Bt(9@@iZMybOqGyS7I}AENY!wO8q&5M9{xO=w)UMB*=>pooSljSxq&V+I_p
zYcu1V*x*^cH2sYS?D6+dv_r3PX7FvtdgeyuY2$z@MpaX_OOMonjXhTTN}qCVhzl(<
zvBPV*Bc+lRq7-I`hwiyVAv}<Zd4jNpl0!qeF)hbwqF_Nu$#G#MB;JHq9mQEq`$*?j
zHhGQMn)D~vkR$WXn3>S6=HNKWTROD9B#-H>A8~tfDlKJ^TF}&woc%wwGS{Z}a7JD-
zOXss`a1K9lGdd<b{#mOo&~^oV!J22yR4eV+PnB2N3I(>}+Vvn5Bb^G)XuBprD0s!o
zSoG$vSy^tjn*Tlk4wY=Ne)Vb3-AlxR*hCGv$22n_r=<0aH{qzw_qK_tyrCn52Le&G
zrc}PcIH8`8*0zb}o^}A?devRED<arsaNBQp5W^yQbR~}dV>MlocX9Hd^>PWvl9S7?
z@S*+woXvgCG)0Z<@a&<ohb*$UZUbR*1&|qzY%PBRJ@*|!I=JAAsc~KGUkxaQ2C6W9
za8G$crGBTlB<y|R0)n^ObwEmH=?#eHfE`|M<x~)<3xrXfSXZ>F-;^G`z^13Fq<S(N
znDCpwr{ob?rUxdKn492kalUp{0Xzs+a3k@9c9jidA~16LA%P{lPEcLf#Ex7YL!;Bm
z%DAkFB%X}};!>4Cl3QeSbeVw~&VRkBMDGnsu-M+e-ef!88!leTfzHj;N)N41R(B;N
zubeI^k@b{kb4y6hLgQ3bU`civP?m?`<-~<g6g+)n`94#7SMBim_=ROWgPiGiyI3Np
zVNErsJsO7BvP0Cb$={MB_wA~*CisNL`9hHh(Z3aFYeA{Kmuri(VV=UYdDi+m?>6ud
z=ionI#zvx>BzHc~eem0j=w9pR*(e<P$CrKD-M%@M4X(O6a`;Y!)YaP3O^H*+mL*?9
z<BsTc7G|TisPH%|w|k6fsxs|4NS(gW3>848)d`k0Z!KHbX0;Cjt5UjrBxT19eFm#@
z3Wpd^YYvSKNiQernUS*ko&GF0{b67C9F==pn57(ES~#q(uW$W86BGN^MlUK=)wQl=
z0eYe%IiqeFZk!|`sp0L-xzc#tO`JhB$T7fdclBo_yyEt&0%BH-(8*i(pHJ{pjdP1V
zr_?mkeD)jzTbeqaGD)KA5zGY4gIqx(-_z!^70sD)J<=n0A2$$+)dcpM(_47K5=-z%
zDaE#E2jc~&wP@ZZ5O2~c*;$hqetY>7g?t~xdO$iV)YGk@wd#_p(3iuGC*lEhlkc#_
zD9glQ?~LiM#mfs1_Sm!8f4mH2>W9kOfT`MnF3UwF)SMoMj>~jpvR0;1p>Nk4N9oA=
z6kQVDDaFE69N7fMz)Hv6wSK`V5>5Uvt@sUZzgfEFS5<ckE7iuN_mwz?WU#yjgJ(3^
zS_C=T7+sLPa@48uPwTthyqYZ8F||C1)8<G)Yy>0PU3A*b({st?VQcI-desLX<n&Mr
zLO_4m5wpy~P=w@-3TR0Uji)Ep#Y_7l@$X5h6PecI3hD$<m}l`lNhv7M-Rt~j&k@f-
z&2CLjbx?Cdrg-<iyZ~-&zh$=U*OW*HPcF+ns;4hW>es$kY~)|2+&59QV;Px|y9rSE
zQ9EKx*^pe+^NWQVFK0?V>auWIZUyvj73*SV@h{x)$^{V&isA*ybi3>cHKZS8??(hg
z=tlx75g{rf*tZ0a9gfV!lN_lYBnHKUUfB*Dq6oE%EvyN$pi}mLrfc|<sqBT&XF{^}
zcz__cWia_z{1xht>0`z5VDSyt@(aO&7}=i6sS_4aGrb^blKw|%)lRs9UP19c1_pjK
zhR79nmCd|dK6QY$h~tT9_cg9})&45kjS%&XF%PiX5|qRm*4y(m-)WyVcazsn6vYB>
z2buP_yMB65;S}dqv%{TBSKui_0=@J@Jmq768jZDde38%$s*<kcZ)?d$O0p9XPH6Zz
z$h@JX;?nN-16KOYK-bW-n%;=Db_Awt_G)PH49H)3E1Xj4T<qwd1E}%Vpm$;4u!R1I
zt)m2Z{Q3PeSIhNeOQ;D{Q-SDn0sd*e9|TX-bY4X4ao_ZRdGjf+%dOzNpQ)mOOxVjK
z0pxN*UgcHJC}Wx-jW_A1axxb~#=^@15!-Nk<o~c|>zgej0(choBkC5Mbqb^)vDb*P
z;7ut|wGZ!IB|B{8pj3+acut7$@&Tj@Cdo`45uv_t6axSC=;1HF#J^0zzqETi%QMMb
z*OL}9?ld{o@${(LcNQTE0_w@NXUiojCTV|I3)80RT~`zFldw6&SxUnv;+!<+MV@hZ
zm^ON>^ih{|iPOeFpI1A|nbh`6X1u}NY#uYCxzj}BNEEdW<XK0dwTdvLYQoD+Qj?*?
zhCi~T$5k=>VM%BAlk7b)4;0Dl(iYvqnem!vM(S0T<HzPQssi_qUv=;1A}z&y3%dJ6
zJwQ-I6i^{Vvv(EZ5|8^4I>Mk8ZC~b!ltR5W>m+1-hdGB6%=N=NZ!Bo$Si1gIB$Tgx
zSGb2jFt8Fl6iEdhT1mwTLTfq`tSgVEGueE4+0d3cKS`3fw*~8>#Fx;e>`uxp|9g^O
z6fsjZ!RFJwO+Xb<G#OJVVV;(jeTn$$h%>{qe#y(a=2;7kKWYSh*5(x0k8u8rb&hxd
z<FX{gFTpwFUCYQaAlnx~)^VB<D=Sr)*dzuwQ||NgUw0StBL^*~!-t?TJ{$V_Rdn9D
zTG74uSOE^t_<Gqb=WykjSCo(-2+uY1lJ~0NVFIp4ON(1y|2#s9cw2`0k&as<`&)y^
z%P|ku91z&1sAd2Z8&u+LeOm9t#Zalme}lE9%VT7W*Ilh3w0J?9*w*AE>4PJD?%4-n
zfrlU`i52s;>txNp3bMETI)V|2C>(qp=lP@@%BjfT#^oYRj3ZK@mZ@sbxa^E$!<kD<
z%!v53>VMVH>lX$X=@O}Tn5gKMC1hA)N0m--793Ple9%;jli0HtW)r_9U`yS89!>3^
zSf7z}2BBG`vz@^1(xe^F;LlZ!F_;FpWr)bAkPYbsKGj0znN0>iZ)$qlpxs}VYF#?f
zLMRWrJ`c#5Dq2(OFtm=^?_F_mEn3~z)CRB1EtH}C_@6miyr;6WQu8e#^A62%<)JaQ
zlitdc*H3G5&3wDxmk<zFHA`E}m0s&O{1!k9m^HRMx-#nHWFiL@Q(S$g8{P*=1hRgC
zge!6o;W^`q`G+J845+V8wgGvbshKvOAZ7F2_0|+`w*_<|oNzXtpLoyK+k|Fxo%!Y4
zv%%ZG2!O@XS-L~}JQ!*h;SsWNRbs;nAQ9x#NfXG|U3`N=x*q-b+d4?4;Xc4vQ7jt_
za9@IlH02MKA<NoEvebpCYCs*!{J<>l405#-t97w7f1iRs&X2d*J1zll9cQD}MXDxw
zd!MjG2=pYFEgV_+K;R`y`3Vl9I0Ypl2rSBK1`8a8O2XyfC_;tseuf#;AfZ?AAn>tS
zp_!L<N-L3kWY5QH-(<<pp$2&2fY)3f=^!C@J+WIdSM82=hgy?{it@RVqZ|`uNxHgJ
zUw>8deQ5DMkN0@g&zTtm-wkHsaoPjX>F}YN8-;JAa?3XUrk)7V?P|egiFF(E+7H-j
zMRBK8k~GO}1LzKId+eyJ*rL~BTr|R{?IP%ucP5IXW~FAZVRP9;sE=ixQ$tuebU}bI
z0~@%*P&LJL37fQ}b)`aVWHYU)KPUJ|bhBUS;P0ChGRhH_LAZPph#<uJ{p|YRHK&mb
z!CPNR5*b_d+M2Xa(1e6oMIE(0%F`21Zo<Mo+md4ZX7FZ^&`D1=0$=lw&q{SeaG|5)
z&qf@%i8GySEfy1lJ#LNxXG+ZKvJOd?p{H7f#GxP0eHC<xq@H>MT7yLA2VL#;X2!??
zfJ!)?A>JylFmOTuQ0OV>553s{Mwato#-{N-Ah_;#vbGh&2Ux4uxsyZ)2K%+yMyIgH
zKeXL?rlPLpBIlm0Wd;x7N%#CKk62uz4=C5HajW$Juw7$PiKt!g)3mRhQg;TENp_d;
zY$*E%e3XRmO)dcf>h9jk3@u=i#}A;wWg3?nP1gP#{x4lrYmBWA5m5)dS012nTtsx{
z?;meLwx^uGwcp790DSIWFO?MFLnug->atkTW&ixN)b$^{4mrp1L=X51fAa4}c>z0;
zZlIlTsm`qs7xgL{04TP@9`d{SFRwp$AyF>NLU9s4%MPd$vN3g-c#2Gie<&?c_Jk!b
zQ~J`Qb98}u{kd)94wLoUJ5cX)sRyZpu!djumK9>LL74hT)Theg_N1qg2uqEbpYKQ!
z*+g#d3MRZ{MT+?EjTbT*#HkmvwgDtio{(tl67p+3MuRPm;FA0Lz!Lge!_^#f;_gE&
zP5QnhjxQLdS`LXWgRrM-#Crs+E+oXTkm=)Z+<Lu|HRuGK>X&J*_>cFTZMF}w3r`%$
zMrrXNgVvOv)#W4ohVtghhIx0f`jSqEji<M=3z{V~`$sWA4af*+I(ae1-GT)!dh_j)
z-qNmI&O)&2!5T!e|74}`dyfZ*w_Qlqv9pYD_+QO^eLmtH9H-2KWEDjzLC}!(azuO;
z+O+uL>7vTy-@l52JZ<St&EAqIwb{yj5C-m6zwFnng_hNF*mC-=9*`(H)vios-vhnD
z7G&r?DJIdiFiG7Bpy<f%$8i#&n50BW?c?>+4*>H{WWm=ifr2DOwj%%zWA^y?E9r$$
zw|3&n^DVuUc;^c=D%QB2$NnIauLZrj4s;~<F)94(Dh&?`L@BQsVpPSFLn+!Or$bC&
zyAebev7p!N#tnZ^Z)xz@w4*Ndgox?b@wS|zG1$9>gz9P74;|rI#-9o<04S1?>;Z*}
zxyk>}{(vq!Io``Mu$Z$0)Ao>!vIF$w6f@cz+4QePO(1X11ITb4<6X1)Zbo?!#W}nU
z9(+PD<PJ0f^%;8;IY6iDd?SCRNfpe&v@0n{9^ba1hu}IS{?li&SlMnR7@y~72Ve5B
zO@7oRJ(yU+fc&F}WMjRR^2p)pBcbgGiXT!l=4-N5PC#gws7P+!`X04-<jjB^_mb=C
z;#hW~H4%}Pj10gPkgSm<-hvrhuSeIjIGTi?1J?S*B_?tB`S9`ht(F5-4&cN^h`d>=
zdZ}{fCeP|cUMV3DZ&*p+F8M#)!4byTRmN%H#n%z%XL<WRaFQZe`337gX3@$#GzKjI
zPf|>B=7zXSfG~X;6i+GkpznC0fl1Wcr8%xtOwY!N<d88$Sh^)NIfvv@Z8|#{9=8-=
z6*v-TtA)wFI$+sO8{HtO)qHzbJ*&?Z<Rb3Nr@=RJeSz}}isVVAsvLBxh5AO&GDEw<
zRW=Fg<7zYIfTO2VYpTjhIVyxC=|URW>e?b3)$l|c@}cYj|5Bk_d|_*Xr#rO82SW|r
z`ia^YE?(SU0uAM_T+b9daQZkSro_9AwPNkX`v$ZoaWE)Z%`B&%csiOIk_>ua55AU9
zZ!y^-GGyO#HC-L^P)vKoMk`(RJXzhz4(es<+LlDiB0kK!=N(cu9IQ=X>Z>a`Q--5{
z^KVcjVm$7l*m>h-x>~Ql);e@CZ+~>L<ZX`<&W<kl`{UyUK=^Mcrdu;UZ_b6t*mpd0
z*<NmMPgC{iA$4y!Tx{n3?m}8^Y=agsS%fObO#7MAj>A#^z^`ANtT(IpsrG)H1g4{*
zDf`X!e)Wi*_P$yg+1deM52Wuh+Vt(BjxS->Y^OY(aVbERTz5iUa*zBTl^RbR6Yb-{
zPEn4&YovC0Y;j%QQu?G)a7}zg!lrVkhZMCsSAJHcf=h6jiIzjJ^BN!mmZLUz;^+!0
zfmCwZ<>1rntE;tG@2w~Slh-#`N2WXr4ic9jsazF#>hE&3`FnSO2#`NBQC2y%wu6wq
zz>_>|p$Cah!PT%=gPpzU!IwyXSYw;?fa2nC;=Sm(hdah*Hfmb>Erl<XteVxr*zOXH
zg0fu05c5aqKd%GPSsmcIcj2jTMEF&l&6t`|$IsR>nWHbo;7fZz=HBLsq_1bON^0O8
z@7GMcgDhzjDx0A$#~rQN0QBnukC;QjpS(xGAoxw@^XDgK57UE9Wfz`uPKA*E-UIj*
z4*pRoV7Y_Reyi^?CYA4O0wQSTC+!CYT&`9^Wj5$V)ekO-tjks?x{{+VO_;GE<^f>Y
zU+BVjk>MV9CIL%vKRvLKB8d&(h7AjAyIM1Wrx04fFF`9YkxpOpuBI^82e)dY#lBe;
z4l)b4ts8yU7aEq{kYO0^l6Gp&b6P%Fu6J6pw6qZ_a@|>TtxTE=6>xZFeAT)|^bAoT
z(V-oc<tz}@QG@>IYoehyHT;4(mtvozB}=Rxs35#Wz?RNziX18Qe*6knzyY2=Imt5v
zR8+tZ_go<Cd2mLu_spue+;`nY^;sU~Bzx;@y$~SF{Ts#Z0rEVRs##}cAqeTUHq7_N
z%qGeoqUAXmu2Z<6YZ+cQ@2h)wrv(CKdin4ksJl<OMkLhp#7)VBK8atj;)wILGbbcv
z3aY=v1r)rAd)SGWW>WFaeALv$YrGIAML7<w580xofm~98LAsG;2a@^+Jk$7NwJj(+
z?)d;laTAV%Y-0$QXBxBHmgYh!MeN@_g9j&cmKr7V&>)$H<m#zX)6cxu60^P4xvS?u
zXYE<~XsH-Vqg-%8Yv<CinQpz{cYCmP{xvGjNtq~`^DqY+LFwh`92gI_;LH0Qofr3D
zgqKFrNpMb^U@R@e{VcZHO~<?$kZQV<GYt*noij;zYgt-G&+X6JdNzKzTUrsLdSS(X
z{MQkr&o>4<MwxaB7sf;g_c7U_Qj#>5YC?snFfoq39H&BJid2iwV|J`M*_o-xAr|uZ
z&fxjhOP3AW?SYuL0(dy<Xk5KzWs-W-qB!~^AFvZh-Cj~YYG%(CRj%HG4K+t{ML&6&
zqU#h6VjA~IM)uAL)^PBs-$ckWas<JyzZGTgvLKi2{*qx*4k21A1h*gyFP^EqS{tr8
z0B>JxSV*!9C4-Z`nNbT<z%0hjSQEvZ24?RGT$eeCRVMg*QZC`7k}urzh!6645irKQ
z-5a1txEb2;AN_CEEnMdS<+|D$A>slaBMjWnARu<MqIth+ATJ9ckSdv9CkLk=|C3`Y
z1mg+}`-z1n4}JVSwRkkkZnab~J(4cAGfQP&wWMG?ot`NeN~Jdu@8@VRdo+}cd7i5F
zBwlDWkwSvDs=<=un|^F?u_CRq3yX%)MnD9b2y(HHT>EuhYSQbp^G*iS`Vu0oU9}T5
zW!0fT1tXf+kV(<fdmFXa&xB>lOqQ|7Ly{;G62Fi-VLE56d1<@=V>&$x)axmNAo$Vu
zSfz37GDPSd`z&133G7HCSU%$6z6(VRyqD@C=L@%GkQiwuhCr+}8<AWjq3+Ld_<LG^
zjeUpZ1k7xMkE2~NWGbGKI>#LBth8G=|0%+{ifVf=II$G9GBDKCixtmw?2E^7h&4x=
zCuFeKA+y{ue!>N9Z^R4m-98U<{<!yeS$6QoM;!L=+2)pwRnCNC2X6krI1)Gm*CQ;%
z0#T?3(5M-p)-t<bw*H`9n6@?4l#wi9tT-~5=n`$oz|1s?pBcgj3xKLM`d?$5bJY>r
zC9{Wo)cgykR<8kXAn=jtcS)`iZ<+&3>6Y@ij8u<$0?DxaSP|H&K)3mXB5!o>v*gMj
zK%Rp8nX+55{P=OlK2RQLygKs_rBsE(=t_}7v2JV|PF?H0rFerKZy;{MQg_?9X8z`-
z&tTxIA@gxBkl7olq5OnIoeScKz!-@K33w_O05zn~t)fS)${1<D5|^uK6MRZJ7SG#R
z1LzScox0n8@vA>$ND8Pqx||bSbt2}(w_0Xtg@-1DN3TUbDcE@O;>1%*s`T@NXu%N4
zNFU|dvu_Tov(4`I?f^+37sXZ`mNy^nM)#0#7ie1NoX~1+{+J~QEbLO!95!an*hAbB
zn4d8>DjwtHk?)YDPYQM1NVhK6y3sk!@Dua@LM~Ay?Kovz+=WRhz%`v@j#Zvxxz?Hb
zbeuu%Hn+PG9bxt)>W60oK$(K&o@aMn(OvK8AGG-?&o^hbul}pp+xlPs28oG-lC6lk
z@E}$FE@U-(T9Wd)vVxL!S+*=CS@LZ9Ph$)lPr|MNm=zw!=a+dUS}bfa?Cf@PW(WrT
zqympBi*G)5BIVQFuOcHvr}7m(W5H_EQpgOne=FKA&fO1(esst~(^Ec_TfafqLNlqv
z6YpiAG076bqO{dSgUQZMdS$J_9(PM|;OIq8!b(c9zXSMD`m9L()VQUefH07i{Qh+4
zD(+V2I`mfbaz`6-pkAs&w860QtD!VV*)lIT=o!RAKj>s7m3bL;bhw5$0a_!vT*H5$
zaC<W3Dds&eF7;@?kt`|4p5)h$*1x~b!yYVkYPTY(M?@@Bm=4asf1X&m(EJTpo1x3q
z`cm|>D`)bIC3q9>khxAOfA(@c!0imx>_aQyFzyVKOxU9g`f@d{j#bNO3|Hu2zEqC1
z1wHc+i~%(bW{1D1d|qrRbF=uS_?<q$6NBpqfIb-q$HF%_gxcX|r|5Pe&*6qr=dDgO
zOQdpStw;uZr%GEpX*IvEo^07ili~tD57=0F_rTw-<g*9N&x*clqkzp9DGFLJd+`(n
ztJVuQ=uV$KGoqt2Bc%1LR39lq&IL~XEdme#2|NP9-wt3^QP)?G^Dc_GEMk#)_RaaE
zdEDyk_<|MZ5LZI;!~Jc37hM~l5JVi0jKd^sgxisCeJqsRZ*~Z*0mCN@Gwau41O-%w
zt2q*t=9YvL3;0KbPE$9VwSXz4d9l{*i_2b6yP3E=D@2cco7@hF4ldT5yN|%|e9`zM
zG{>=<5T~!|Y>Ax@0fID48kS5SKwAk{1Yt_4<goKl0zQ296%p3;U-^}&>t^>O{hRrn
zTafhV1Yf;`JC8C{9gBq*Si8h70FbH_Bc&yvn8#|>_<KA?{ofkyU^YRmsP5mSojz3(
zBFSor%_mD2#FefZ94^a(d{NlPauUs%1GB&@Nq5{ZdfksMG4O>e@#A0wMc602Q-&wO
zHKybD5Xub|d;=|(bLb|-)_c{gl7;5($9Sy7u04%W4DU_hZjCf9t!Y6SU?|q(@pi^h
zn70DYz20aivl#V>p8ci5G*cs%IR51Kff^L$w@_%)Qv_mAlwl6>DcIPEfMu(pMa0f1
zWl^ma$*D1emZZo@&g?d9ThyV3ZEK6RDFo&1_v2+*5+B{Z6FjJSyTL6B14*QBRCx?^
z@ge{+$2W5__Vfbta3*A6f;mcx8EB>}WyfB|4+fx+Sui3~k5ES_eeKNHM*8_^Ja9y*
zKoF!bgH<k{Br5EOF-YwV_1^tfL}lt8DJp`^L1A`f0}?cyL0q`4Vm&sl1nOA5&@Uw^
ziMJiHlc)WslSjMog{d-WxJ@ix(st9BG;w1Ox&HzZE49br6x3LV_f1tj{c%+m&+aBO
zMVV>bAsFY6w0~yBR99~SFuI1P@3HdEC<!H11_q*CNiWOGY{3#P`faK#UUwTHG-IA{
zkb|YybeGEjb9EG?*=284`Gu;bedL>QJ&W96=5kUWuZw-cZx3#Knj2UVEm3F_b?(c)
zGh=>u63Tv~U*6zpBw#t80YO-JZ_!s&2EI3gAz@Z(nQSBR&PmQZ!>OE7{MTSoa%JYJ
zf~m-}sD0p1^)&1Kqa}=$nDV(xE(&Ev%RKAkS7p0IHjZYoX&PJX(03|qO7`;F;{Ljf
zm;adV=5ynzB3n2E*7h}c-?WjE!$OLmi={gLvNv|h$PtTUs=rg-0oel&qVzG(c!ALl
zke=x!dD8+x#hO(&aV`^9rv`r4U1wtHs(syZ*#%h%XV2vyzSljr3@*;mJ{c~#SI0Gb
zyS!Q$FGWh7xNXJ4<Z%)o=saqkiK0ahOWs1q!+Y|Cysu4Y$nBaX&$_v$V3!hUTmoRq
zv+t^M;F&^2pd9r;vJ%EO2f6K6L@`6kk~5W>+Zt=wzgwf2Ns+R_0@5NLUu~!cF7$}(
zeXMX8lByOQ*>?tb2~O%A_BKFBMbv#Hcc$nfxA__MG^2}xO4oBE32(*%-D^^Geu(0G
z-sn~}7yz5}+~&Hr@K~D6Z!IH_4<7)8i&eWRNsg&~I6Ii<RhcbGM(%kBForuwHJ*G*
z=A7vqX6p+0jbZklGEwmt@v@xXys~SBq%N4KD)R^r^d$3`oTcL~SR|F-%EQMl&U9Ly
z5rBC3wW*))o%shi&M+LdgN=x5O?4;@%Vx9EK+Fdp=J#7+uVO5Un*`R7CcPvuOkr>-
z=_I-Mc=T!E9T1pT@TIUDF;`VBjA&8!=e=YKs7pkMe7CbDlyGYURw&{4W?hBRR#h*t
z!ZP3^qOQ~C>+&byYE@0qsfa%pDJIIFQb<DXStS5$!*AMRs|!=~1&H3;0!nwxPS&w)
z!zikfcfsM;iNu(FXPFx~I4N$)LgW<qD8M<Qw@+YI8E1|p?<MO)fp-Lwdu8+LTr&R~
z5O-L=b)W@Qf|p$YFLKmC-I!?StL$%TVX_Y9$M1c#es)LG$Am=~^pzD%#<!bVJ2A2I
zN~%>S`a_SfX_Wu0P_hgY{E;|>{IO<7w;YXd9lt*X)lu-|525d?Qnhc>bz3whFr86z
zHGd{g-h#!lf(7jHYBkTgNzt<BebX)pxPK|*&7lN3CC+4UG96O-Z4kIpgH}I;XHdwB
z6!a0)s5#0X&PuhU^y1mxRZMy}43XREB46dkVgcpu7bPyN6d=*%2sn>iWysy!Nj#KI
z0%M~;S0dCaKL}fH;Q1QqvmgpQ6?3CFUJ6rf8-RV?9<E3HTgqG307ZORK9ivo$uDLz
z3n2Icn8&tQ2s=}!)OCjT;A)c8x?0*?__1%npmy3f*MSXrw$@2o08W#}dj1-iCaIB>
zl#56p3>LYmGev`%H3V(iEdg8?>HCuG83szy?I1Cn@RwO)7C!(1s@Iq-j#o`U%~eNa
z9|V^%VU8De%{t;Hy^kb7qn7S{NRlhkJ(>nb%bY(G_$4PBl_zUvL9=`=DPYQK3n;PZ
z-C)L@tsMWuC6BddmtgReZfEfv*PldZX5j%{e>;6d$T;lt2w+ox1NlOm#jW#AqN_-x
z54OE0xSmjOu9|+L2uM5ef*N8KEFUeT+HpCiw7h@=o9ZF6lV^@MGwt^qv+tISi_t#J
za7A@-GUv$}5BgSpK@McUqp!jGY);RfQOO5!%E87*kIMGDvAhJWG`+MtugE;xvs+Ea
zA(ZhHo^k%JbiKFM8GK64VY~rj;CZm8ok|F?M^I%TZ-b7YZaDV)bE-?JrCMXnPz_tY
zy~A@XQ4uIU$aWc*Eo`?v)%({yZ6|!yKD)_)nzGJfL*xBf0#@>gl3M4)eDuk2)rnEa
z_xR7WSZ{rFqR+m9<*cSVQ$Va_nPl@U#sk}Hq*uuHaW>Y_>^vwX{w;D`p_3NfM(XG%
zvAya7BtxdTnemu54t4a3+9#&m2H)R%qkAz?3f0_CyREG(7rE)i1Sh@NZ_XZl|4s0Y
zr;|cZ2lZH&4ggtR`*GQME=l%jZ8Li#=XF3o#}LU&y+nK_4t`5y1gOow$5os{4avjK
z$jGdA(S#XY<^zkuCtUd2LX0T`6TD_Hgc#KaF%>?zjt8z@^lCTn%RHmt)VBTfjK?AF
zz$ZEJFMd^4Sp~*a2V28$#QKA}d3E$%2aKO6y#mRX#q^CLpn;OEZf#&~?cp2v;NZ9_
zo58hGi=ZaG#1WD}MUOLLX&wlU6QVGz+;9quCgSd|Y2~&Q|DFogLZ!4=j)YY~T}q}0
zWBH+7wFy{9<K|he)9-ppN#B-aYp}48?nV83Xq9{KQJpOYU%lv~=#Y48#jOKKRj^;u
zGiOyt{hZjv-|BrymcVnFQai296o%@)8cx>)cEjchM2@0x8fP{bJ;{+UUkRv&E4WaD
z;1?Yb_Mk3Ip+7%*m$wF5xUa<#>tLW0lH$D5@=)fV8P3bUzq`#~uVqXSm-YiQL5q~+
z2A4_3jY^<~o@)}Ej)SiUII&Q!+0gUZv|$L@k9|{a?OQ|A*(0sDQPd%A&R}E<Q;pj}
zrx8Jbe0ZB#yaXTe)Ryg42OcBRM~tcCFyg^%YsRFf;&&aQ+WJVW!=_aH%=SZfp;N!L
zzoQ;~`GmPE$!G2}z~8|)Wc){p;PEY9d9ctc)y+sJW|I^6DarFbe6mMYBe5bk7N#{N
z4_b!Z;?-`|{}t1E{j!@H7BF4W+QZ^leo}r?$Mi|q`rDpbHjPeN_8r$W5UtxCu<36k
z{Y<fYelcUA=Q71mbh3{cIuM!{SgXB!M){<BL+fcZqkZyUIx=CUEW@)B|FDvc*`PRo
zS@aGw%Qzjm=97#wN*--y283B{f8@zH%L$&|xHu{nGiBtuf)9rfs3?|noDB40YCFl{
zfgo!KrC`LfgI}VVGk4&q-?>Lyzv}DIk20TNQY=+N%%4d<;!!ST5l!lO6|r$Tr9MKb
zn)=@ZayANmp*|;GfU0V#%j{=Cs)9H7{qJi1|26lxXNW?O8Ep$|J-&3szA8mE$r+nt
zwcRP4-+G^zb&x1lDzk)i{H9BN`b}1uDq4*7F))uu^Zqn~d0m=1UWr<~F5#IX@dKX|
z#MA2v9D93hgj(I3sSxG8VIn$0qKpvRz5-eRVjLa{TOWW%aQJD@?tE$mLTqY>Iz>Rq
z{q)yT`2$p83#^#j=Iz^k;XuUGz28&yKD&A${B#fWI3`imbN6wlWV#UTtc})naKyJf
zYU?vFpc%CMk3!XpeCr~-9w&kO?SuKE2=)*9jH%Se;!{&qsE8c+k<O{5#`=VTbm&@T
zb<2LYjR=pCQx_Uza~t}^pXIRkJVA5cgVtX(HUZ`71bgx^p>y?ux$in39*o3u{d3!T
zp2KD?#o_th44c~$zM97F@ZYo%FnJnX0<6{9#J=1kyjaz|2ec7`R?Qn};urwlyuHpX
zX@`%!J*ls4A!AIgHBtUb^EJ$eCrLORG>mo0Zj6ObekSVSE2&0vzHs_S9j7t`eenVB
zTr>DwSy^vqUx%$@FE!dRgS`L_@A^Uga?CKkst(f#VYa1G`#qqSj3-#0#BYNA-`=bg
z)$lu!YZG^vWl>jS6xye-p}aOebWdse_vT>z7nQx(fH}o+^Hi<^FZ&k|BjSEjnvr9w
z==ryU<*sN|+h8U6_n<pb4?vN6nN?BxGD30n<G6p7J!KkFeQ6rEu#JDCK5hX7FY3Wc
z);b{<ocd3-$vWPq{8ZTx6X0r>^Cx3w*^;rigEpuq7yb3;=5RsPFRY;$Ji)y>8pCQm
z*F`H!==*KC7(&DFbGd{7-7%+*DLot*&EskK27e?6?CBjrp9Fl?q(IVsjDWX!97S-+
zO0(lEX+8P6?FCg+_gem_4YtLZccqQh=UCM=?2vsg09a%?y9x?1=SrR%lOO5(x&i8@
z`Be;G$JR8%-%$xH?$Tn{h<*Mah?c$CwY||BV?d23?tBeptlZc!zs|UvD84^2V$v%8
z^Jbg_K7QGO>Fw*b&6E|Tm)J+KJMKxP6k<MyFTCmY1E#%-ahX0LL>wi(veB34)3*H*
zy$rGgAJ+dP@ms+Y7`$)>`Z&+y!&#v@T5ljA3_JgZVbbhg=UY!O^C!!FiC-ni2b?o8
zD^ulw^Lrs8l-F3M?5H-_bIiz&_C;B4RSnW2x@&VyOXea^PQW=51(krd8w)kt_calV
zO2ErQKY7{dlGHip7=;j8HGMH_1Uiao3^pu}>x~pWAP5=2O7p7#L(3tMQ=HyZ%?7a>
z!MayjOP}6i3hra$Fzm7XS_vg5i=Kk+1hL|+%|!-VBp;I@s-DSgn)`M)c4%@;YAVzK
zs4mmr`nQf~<duf5V{o7EF#lGR+lM~~j}(ki8=zq2Myo>KsoVR<5l>v3t#G2+e8i&6
zW`!C|9z2IY_Rk~*y&g)vfr}Ukvu8g3tENNN_G*pj@HJ~+x=_%*DNP&=16t|DuG-VL
z@%CXiw4a)+ba2!+t!cv4yHD?A6sN0*22)~agn~R$xDisP{F3pLCehUf<y@8JeSJkJ
zOMY1<{H!i(uYKRM^2y6;Bhm-?%5WM(!Vz|YjVn&}9`^N22R33Z`x4^2Q|ATW?JtQl
z=3s;9N~$IvGUpBY|Ax^%>_03-CV6!4lwWC;L!Zk_&P-cIQYA@B&UDxF9J$XDT?5q~
z2Sd7Aa-6$#9694MvD(dXJCF#E9g0kK^vBZBG-=l-u#61cz=c^npYdg}lGOLqi`0`e
zt@#sfjz!X;smfZ_^oKM<MI2-i5Nsl!ka(MVyG0)WnHlYh8-rnhg4iYVT*tBJBDYLz
zVOd8=G*JGgXhpxr+O(bbbz64oR3UtT0k;bqWA2p_7eF(_>gT=tV@Iivb#kh!Az{in
zaPXkgdC~PrDZC<>UK?b2H#FYs^cr@q=)={XX`2vbOGzkuCjoJ8=T3&8!2fKBt!P^T
zm(&cza3y9Qo?^I8G!e;gu<Xg9=3hO;PcTyj<j*h{(W2#1fAME|Y>b<ZkxKHGOF&41
z8Sepe1CN}HRU_cVg~WZzdQ!dDMX>5SjIpV-I`IVj{eXrsy>ASdZ%3+1_-?#mcU|xO
zEK-lTQp_*WmJP%~f+UxBaK8fG3jJ32hjHXEOKJ#q$Gq2TCX4KdQd;DFT<e4ZEy`P_
z80M7tYa`-s@D{Gi^pftST+VA-I)Xo9TM)rZ)+dpmxa5}s)v8XVH%5K!OGl&OMP;ho
z(DRRpQ8(pBD?RD@EbZ9wOqQB`@v^sASPXdlzUs!}ZwEWdY;(Hs&a|dQ!%wXE+Z@k>
z8|-|08Q)h=+rwt^tgLC)^V>}3+6L0~O&h@*VLu@!vszm{{(**d<3Y-WMMk0>{0@&m
z-I~JspGgr5wUb49y)ii0=0L%zFdD!fiTAec91+{F7M_he_WpFB$Bc(i`h^LDna>W;
zZfDX)Rb)=tBLLyKpYr5xSRPaju+mc5dS+@E_)dXQujH@N)N-5>MZV^s91)swc<p+|
zWGK||Cnk5DG%+>p3l(4FpCKGKQSLrAZ=TgrcHj0kZl({^%%{h4J*C7qE+2toi=OF9
z*=I>IOrJw-e<;6BF#QA{2<IpWbF9X~%8T{$sAsK0aOq6tje&+J8uZ`0c**GK$42L%
z9b-0KNJx^rHWagILgFCr%S%);W^-ggC!Yq}Y`8pWWvLG^Fi(1@$RgP<KAM=*+$4`L
z0Lt77oD)huSA6j;loMGzxHTE{&XI!A7~IzpKXSVfardZ_fs&sMSK;Z<udNaB6u=z9
zMX*@pA`2~IMe2c3ec)i@O#3HkO#bLKXtI(AQ<OihLfwqYesjJs^X(su>y-#ASmy_;
z_Xh9_3*THM<#LeFm}g5dBO8&fdWC7>={Wjo8U{Sc+fxF9cXOn1!vKniX-bH;HTknS
zWy*39C?1^Fd!eTT#V-*O|AGu2rRhiA&a-kCRB1}a#dLe`eztH0l9(@=<$gfye!LcS
zk>OPGEfCq&@wrygoEeY-i6lNQRCw$1pBm&U(ME2=#M*5fi<^lsA+&}WnX!dBz|f|W
z`s#YT7FRl9QZ#5=ADSuD`;PlYx5O-Sq>ND^zv6@{-G{lqtvKil!768|xYIa~ZIE$U
zMGTY-$lFWn<NE24h~UULx<{A)DZDcViSZ%U;=MZA{~`HFs`0hZ%ya~0p0#zYjI!LT
zJnK^(qH(%}9I&J<Z+xw;_O8y`bY3IJ7ASh&%-7tEN21rqDTR%=6&EvJM_p>iJ!8hp
z!?l)W3&)Z)c=01u)S~8?75n6)=}IrqdL01CppZQdrLImN=0<ofYpB<kE}w$2G_&-+
zQtVzkH3OgH;A*=HJ*Y1B1SQ^eRM({qH}e2y0P`kO6_c&s2UemnZb{*)&(Me)?jW$u
zT%e027Vjo#^P%Wn1iA*ymzt&QIZsvwtLTk@9?6L=$ES*W2h)#v;rO$Fa+?o0zYy$X
zx~nYVT#e0R+^xuU1A-E12+3PldaGpr(~L%kf!3$B8r?5M1i{#+`*45fYnRmlj*5&?
z`o_)APzE$7Qr^`%+^|M|^6Adp1^@hN!wenwk_>ah@4&B5_|_3bqH+>oMxmseO6iw`
z5YOfEC)nlnb7sT_Dv%DsBC+wphhU=9n>Z^Lxpv2`bT)(CU(FQ5;p6-&0tQ#_Gj5qd
zb*fR?S_F1tzI|?}^^9T@OQB?57NHFXe~SJI80T}hN-%@LY0Qkt5J_HMf5~%w4pUo<
zaf(Z=Nn(kC|A)1=49lu(yG9i+l#mt>>6BFIP*S=<E~G`eJET;)Q$Pd+X{4k}#3V%N
z1`(A`32D&pT%gbXv)^YQ$NTMHw+J_`Yt1>&80Q#czWYY>&cRC5M#T(0+x<+81Kq1>
zbi-=hWs*mTqou-EO=KZgviN~~6%oof>=hx8UvlnYGat5GQsQqbZWewvxm1hNKW2|q
zW_N?eK;E&u%fx-hZ*+`PYayqSD!nSs;0dQixmxBX#oV)>r^gk0R2A3iest8ZevG(7
zd)5n!yqBM#G#C7fS`mGi>AJSV-(KLn|3*v7vdh~P8V1!uDb>m^`i#ktK6~+HID$cD
zq@TWnZW^CSvn6@GH+xH@)v>m%rs%pySKbs67Axy@-N~fAT9>PN4rl{Cizns`eTtwJ
zn{4tlr!@GAeXzVWe8&^0X2soH47!?Xk<?CaPOpL>v#Q?WN8k^#4~Ym1vFulacy@@$
zr0=GT{&JsVm&g*QV=C*KC@8i-C00VRqkyeI7*EFpTiC~0|BCB<smgVV+%SL|`{&3g
zyT}G1Fx@U8@Mo2RA=SXr<<MyaV~(dPo#u{|b*o|DWR~O8{R|xGw;Hv%7U=ofTmozo
z&8P1E3T!H5(mFo}4J;{4nYqg^2{{?tX(hhW*e&Cm?IMSIzh5-<06+3tYR$z*!cwib
zl7)>1Y&9zI_;IaM_+Yk8a!%ofy=e(v7g;YYSr>H1XWU6o%jhhcR3H>R(Szlxm>n{O
z&c=IZH&$+`iIS$Ngb{OLKZQ2i0ZP9Jl`3sI+}{1|6@8BS_v@S8;*+2a@Su+2-%x9J
zzpT0-T=tpOL4S7X5$kyC%sBhqlW`jRD>aaS(E!G_bxMnIM3KrC<zLkl7B_ltJ(%6(
zQY#(4W`_BUa?K%Yq&ej_Q&H;R#wPWY<XHx4^P<Ou>4}F*6qJ&ue#0nU**)m|lWM=I
zwc1)yYqJVWKgPvwGmQk-PR%<s#&54BrgZY3`{5w$JW}+o;~~F8!jp5VVP#}Wu&t7l
z$bZLKM_K`ex?&J*Nl%D`to2=1t^ZW>8P4~NzKaGr`WxCN3LR+zxb+Y7d&*tuz}$i2
zCTX#zu+~*b0j+MH0wxae4?Mvy-?&UJDe8Pxmc1@vWC-wFQ(57MXt;G^DfEo~XP&o?
z74$bl>WyA`>l*N`D@bMkm^g6x#5G69cys#U+9~U*LnAL}hn@`l1kx$_)ze`Sn=u3!
z(K7C2Ns<F+Z{j5h4fOcVj=NAK>_XOEQet61i9=~*^jZ)9bFsvg5S^teV7HEB;jltf
z1HxnF%_@%$8OBDvLB@vPJfZ!pfrVBLU4!fdu1|~08g1MN%4ST3yV5@)Fp&1t6}A4N
zM4b5Kg9n-z^bt`oL161{?01}Pm5reqUD)OAzA*(i*1ST1n!?Av23(zSrif5T9|RuC
z8gF=|{pu1~O=IeVS(sl#w^|Rgj2FKIYaB1gl`f|K)B7xTj7ue4F?Ry8+F7>3<R3{7
z#P_BjIRNs+3hi>8xw4(%i0s*Fj)>1QQ|(0*!$R#>E+os`S|-HFx`BINGCJE`glZ#d
z4bUdJqW-7E;ldB4+@Ur#xzT!d&*SpNr6(`$9B;DJ7h*+yWEY{-c~2=Gw2Vnn8BZXc
zH@0SSmWP=(GQpIMX0k**aJe<~v|`^|LTg<#f0ZU_-ub~OfuJ=UG5Vm}<)=t!cCE&9
zTNU{~MScL#&Pcud)x(yHQ5F^K@rR{MDv=3=c~_V-Wrs48lB)B}&CQ?t4(%t0jV3os
zQT7SaH)z)upqU2?9Bk34GdC29deUo5?4ILo9KyIFLto7t97*XQiV4)Sqmdkmz|7W&
zUT!RmT@)8GyN4_`@pBnc9CKBzzP?JrfEF@+yYE0j(R3WToN+JvIt<I3?hD=6{TAr(
zJTIANkHx)`P+k7IG};<)0S_o*c}W+bql&~zXPHZUN@pgOUD+IY$7iL68Yi1j*O$pZ
zT41bjR^ao@VEue{B-OpWWk5k(Kvb69&4r^Du^_TkG6h2tVMiLVzIlWK1w*F=70Xr%
zOFsJt1|0OZVjo_^RH4)Cx!&Hwy&D(+X?$QzP_c@K%&#5$IlslG0H>lf!+wZ917YmO
z*m@FA8J!jGw>0RcS7qTJFpdSj%gFraSnh5u;ku(24~{;;9L2oC8QX02v5yFYWG7E;
zlO=~+=Ah<_t(K`hV`%7pHOPF2QCFSUXJf^+Kj~c{B5~AD?mI)!`g7|dlV$4<F;k=8
zZ~)}1Nvyoa3ahg-e)4)WO4hS=>4cq`d}p#1wKMv}I4hWpC)zyiRV0RvP9~9h;e9CK
zxz^m*zI(sdnXvp^`T#8Fo|XwW-}Az{ddyh7@k=>L11m}vvf}p7vo}hl-c2!6qSVCl
z$Q{n_eiA?bZIRw-mPn;sGKnOejx2y+@&;=CH0`y!<sUs~-fPe-mGBhAN<1e>>f&u)
zkeit!f9-Ym8Zgh#kv^=R&zzy%r?-x0x%yt%)4T;qye8FEHf$&<g#Co#+B>PBpmCr<
zx<G;hhB?k`+qt1hC|Ic$t;GUQJrq&XJEoc1JWc*p@~BO_hIM0k;$_`+(Asc~Ufvdl
zm_8BLTT~>r1jIq4@PO837j&dQQ||3hM3#YYm^xG6;=6VqH%?hxIA=%Qh2-ElyOmFM
z-E_%NPc@0vu|9|tNs}=z(X(iJFU?IBkDa+EpOYR~*bGH{9>{T?JmxdtcnV<8SIOCm
z5h!j~=!QBfk2&|tJta?h=Gaj^3_9&cE+Db>gjuQYs`1^^GQ>ROq@pkd`vPu8DTQ5M
zGV5nU!`?D=v|oHa^a{7dt<^;ACQ*MSUB_cp(eJD&&=o{~Wm1<mkJl*7a%dQ}Nb}0!
zJ{MkOzK5UiRbDm}kc!a>fXG=K_xa6Qa$D~ORV12+st&|E0<$q!H#)p6C7>d>J7vl|
z9d~GO8N9gMK(A(2^GvlZS;quhZk(kCQB-cNj1ONpLj3EZyOqP4-73Wx*OuFaL<dH~
z-&ejo7ui-~+TO#%H~#v#TuPf*N_<Ut4a$*XBGv}%<7yYy>NKP_dw*GVq9BP#gd-lw
z9~QxQa>oCa?Xsb~GO*ZPYe2Q?1xj<*5|z4h5av(iD>;3SLUb=TeOv+y7Z=1CL{MK|
zvGB$baJr1{$m2LR?^)#In8%$_KehG5-Q^IDW^`@tPM(|)DwEQo{_T&{Z~`-BTJB3c
zXP9g|Z1`(q%_(&=RfJ~}SAhz|6VCSw`Wif%8zYa+a+f`UknMBCP7T6Nci#A6xl88y
z=JIl6Rm6TA{rlYyeor-e{&X1ID@D))FRdpbzY8LfMr?t>N~u&{`u6I<mp@z{TZ6aL
z5-)OD^Y_iIx6yjCJ`BCo0iFlmR#w&AzlSifO&QD%O#$`tL_}1f2B7e|EeM;_Q%HMB
z4Orh_Kza)01AW_LU^^pXX|GMGi6KR0PBlAF(60uOs3Ms`aN0Ogp{g9BAgAWrUwP4$
zSEkmzr3;O`W=Mx~<OuF)YY0WWPi~QD{!rGq$lmsjKT`!L95EHDTrXi@`2`3>dQhS`
zkGVfK^jL7>oF+KJ&NIxE>@ffQ@kgnJZaZ(lRzptZ6-0#q5WWrq=WaF%W#5u1qB;?s
zvQtZj21#%rl_y7SL<iHq<rIN)sof?c7c3EvjKkYYUo_$#?*oYp<Or*k4vLwR_SU%S
zXX{xoU(>-Zc<Q>~I}M{+C!{=^d&n+FN3K^#V4<W^J5+s9-?#FWA6ZEDvGQ_7ep)G$
z>n@-jHktalzk+`}Zdqhr)Y&MUdGDai+Fo%>C!JYitdgBDlr>Ir`{A$eRj{kSR1CTn
z>XN>tqn6}}=B>@FEgVQ_ef{Ui@sX6F`F;8#7rUG1u~n0~kbrF#X|**FDeV?~=nhFk
z`&{-9*2QmyL35qz#RkA~RbijcYji%kzEo1B_<+Q(3cU|GD4x}UEFK{suswcUKwW7S
zAj3<KtJ$%sFtxKY`QYaW`XM!=U&sdQ&L8!0o8r<h;BE0UI)vf5xpRtO7S6c~${JJE
zBk&CiF;Ck(OLRH&Z{YoWM@SKR3QuA)J;tmNP1W{3Z|mJGRjw*AaS7CYc(_H)bQmd5
zQ0J;=GE;Q#_npU+!vo@0Tw>y<y-=KTbMEgj30xHbwq_6e^t+SO>DtSWmZ$%g4sw6Y
zlTLvSwSgE9>{)XpX~C61P#sVPS0nnLW5R$sEz(hkW|~|^W({5SNcrmkh`|b#`V7{G
zPM~FtMuQCuT52T}K@jTRo~2Bw&6JZQlWGOvz^vnqB0DFu2XNLJzrON${5yXGufYQN
z7-bLs{Qmlj&T%(UO(|SLJ|xAiBF&-kV=2HMWWxh~B|*_3r|*1ve}7^25E_)UFuT*?
zBbM5jjd5K0k4zMGIrZ6GRiE7>vy2N9CK&Y?u|%{gramr-uB9FTl%v?{vaq~BW1;ux
z@f|4?sM_SQ(1yJc(rzn5rTW#FFA2(#THd+4E3Kj@z$Yr{v(k||9?(yHY#p9Bw0r~F
zrW;b74T`#o4_xgQnu@~TlQ4owKHhbz;_Y*lbc<PqVFI5*2xuJ`IyJPl_%+-Jxc6~h
zo|Y)w(j_yM-JlY%OEFzfYN?;o8%(jy6Lg#JnLjKfHM&og*Td)GI)X^LK$4@C;Wjvl
zC^it0RZ)nu6T-3qx|DL~n&zpws^BJrjThUU^-<1=-8w<;FwEQk!h;9G0w(4ez-M1N
z07-^_@H+_o+^f39UVapGR6Qy5>Wqpu$jD$RamRlZ)t@kmrU~I|*AXlBO2T%e2IM`f
z^YP?VJ|vXKhQGLlq4^Pogl5Zn^?Av4J3#uLo++lfo4pU2QIJH9<IyhcLIw;LGx<o6
zLs-P~0KXOiDZ04BZRt4^`^;=j6Z0+7om=~|q$k0S!An|8T7frmUsBOO-GsY#7u+<h
zxyqg&G(i=NpB>N*_AYX~&X21{HiqO-Tr<cxJoUmBol_|cFY~M_CKb3>zP@_t0}!N1
zKTD6|rJ95r@|)mm>x>uyiN88aZw6_M_c`HX;y~$;#&j5Q!9ur_^)5aq51!wLx6%MR
z=Y<FssT?$5`iQ7oi^~4!HH6{9DKSEmIAM*QvK`;4#>gV?;t>rw>Y07Ox3Yw^dCD9q
z_wd6lew}k!czF6u)ANHw30vle3Hu<IH9#V!d|lj!et|?)icq~MXF}9xZ{Yr3;bj|8
z<8HaYBGvSQGcNq4$BK>S85!&gGCek}CYg|$JCDGwY7i7RN~V^9%#RIt7`#2@>pN)2
z@VAC7Qb9UP{F|*Ho!CIjV|WBo+^cm!lts?5)f$$5J-A8ZOw`LCTbj>9j`)}0jxHBf
z|6SD!$f}MxvDXr|BMZ!nx~=e^RV6}J6?IGD2@-`xv<R1_YC&L@$@N7epr%MB21d|^
z5YiAW`6_tt6&b~`%RMTz(tNC5!+~`Lijt;rz*VS<jI~X9$Y-7dYwy#m-5-(prS6~l
z#TIfODU-Ctp+<NH0;uoDxu=@5zUYE>=<71Qp6Jo9{(Lc%*Dfe6*7J2;B>Zimz+^uv
z-NPfokxJ}NFu|cXqj`4vJaF-I=;xNs^L{3@*99uMQkzA$M>lJNZaZUMkW}LDdZY5A
znr?ODDm#*8rGklfk@6*0vXo@7x(E#fd#y06ij`i?V@TIhW@nShT=gc`qZWxcCH<C*
zKIo$03~0#_SYneb{(!IJPiHk!j!i(s{K`;XcqYNQ&=5SXS0U}J$(mZ8CbLz!_7-I{
zseZ0_jBTMAwhrPUlBMgmCcZUrOU0}$clta2ljz^?Q>x`+X_7*Ve;3$+m`HB0oKTa;
z)b&$#aS_GQ<XZ$-t3E(|Fu-c;tOR~fYd<H$dH&XKAGRnW+vxi0ivN<uwk-yWR}fY7
zN~#tq@o}{E7eLBs0S5!L3KkQ>Pz-v*mU^<xSpH{`Mkw&~Z4V+Ox&FkWC+V4CllW#z
zOhHVosA5O{>0Bk%Vm?%!y1yi`A7O)$>S5K5#vMd}5g+!e)#Df8EFDwOrJ^!GBwm}k
z&<30f>IAow(IaRZ<MlWrD&V%$FqW0KrC-I|A*(bXlqP-U4Fj+sesy0+87zM+YQ$~@
zaH~QK?9BQ@`_e@{Eqg!q{9k!Uf;9w7t|Z-oLxR&JCR>2?8uS-jD2KV}6RZ?x9Min&
zBEOr20fejd=e&6Sc>z=r_Oa^!k&37ogK}n`PHP90J0#C9W(zQBX)Q`|nJKvrY|s_%
zp0Byq!M+rRlvvb6R-a#I6B?E>398RsvOqtuSLSG$bAfn|^wn3tvaz@&D6oXD{^TT<
zw?Twj)lP57X_L_M>AI9=qKjyUql2ATGTJ2C;%y%g#zl~AXyMupaC=big8TWa(Jaky
zJ@Z26*xEQRiX|!H?sxT>P&?Os&9(jnv+z$#bFSaSe2!VTUkqG3Nx6P(h<H=YFM(Um
z_PwL4LaV8+h^W8ysaP6NW+s4Ip+(O2#92Ht9dsH`JyX&CTnoYbAf8=YHYvUBC47&?
z2LfIP0s81^NP@#)kp8ssiA|CG+%4{)hXinT{jk^!POz6Ci6x{nUaAgOWI*X*!uRy^
zn6>c#b;;{MVYw6=D^&$oi)xw(<k>`PmFgP_6jifYio)jYW%5b5p%HAiEs)*p5)0{?
zh+<f(y_(q4*DIg8%VQ@lg2NuT@a{-4id1>@_oRN^HKCH?4&fODX77CACIr)!W;pw*
z>p$>=2qlvZJ#_oYitW<UgKn6kBLdZrAVsvHZIv(Xa@GuJ5`~+7mV8f8OJ`&f&isWT
zl9QOo{|*?suto#drH$}q6|R|nt@!rn)z^nV5PPRbMfRF`+;=E8XpBHD!aG*NDm`3U
zJJ#X6vQ05QRHYug<VF)Eg1~4o9wnf**QtwtkxVdi$~3bgEHL<NXE}lb;!z3pr19hG
zN|B`|5}Q?!>^RH!^{ZaDUvOHhL(^vjmEwkW;I2b8{t{7z<hI6kurjSz<4LjXSVV3u
zkMe3-*X_3M_2l~<Y)89>zk?E>$*Sp1z?0l<DA!(Mk{k5oUX0b`im0hM-(v0&vPKbU
zOP4uh%Gp&#{ME}SD<(^}3FKj4-Kk&cl+)yWLuMf>ptJhATmW&rKc$W*3tl|q*wcrO
znOU<DMYb>XPL|u&QTx>xKCI|?nF5;rWJRq^k#1?K6+QTmVxOM<pHAu;()C_+GABoJ
z^-9dceG51`D(vYsw-m0Th(pZ#YPDnHb`Y_zCtR8_;9|Y+tkpr|v&?-<7$2N51+9AM
z9y#Wu(=BFKo@Hz38##M1!7_~7>jrF;m+_2pBA?8>ORLHC?YMWqYj+5^nN&4b+A+zp
zFORdlsQ(dR`a|zQ&p8m2F1k;G8SEDrTP|*K2v@%w8bQGSn?%Ewgu)144s=8@dLuyT
zwBF!KxCQ68(`ph<FFoyj=#GrSG#bs`O439HV?ckw6TjfQ<v)Pv;iNxY$#kr7`k@zQ
zWJl{TiqoV=vjqaTcRBzZet`f^lTO`Hl(+JUez<o|-TSKFCZ%RhtaRtaaF4A~i1n0Q
zR8k*#KhXK;g*PEGp>co`Zzc%t@u(s!DV1h98n4{z^Ung6o1InZJJy_Wik-a@-*t%{
z*m;84T+;8>`$%uR3i`Rig_{q2p%=6bd5l5#q0&_1RV%|&pi%dxoqwra{$3`mBJ3eG
zwN4Z2V^Rge?z=Wi_1)mEXSgE&tc@3dDD_v8x<1(~42ZOjoR_&BS#j&sobUfXYwj!e
zFfPO!?ol}+{h8v-I-UTFTj4$zaH$`hBBoM$9Qkjy)Kouh%Cj5dy2)joH$x)F>IVSM
z#92zaIBjjo1qp$NZr^y@%VCRGba!T1g)Hi``iBH*7#)2JBxv%|QOL;)LR!)~u;gaZ
zoMq3`_$jC_RFzcKjSQ1WzM~SVFgfnrU%7a4Tr04oht<UPJ~*$`j&Qe8nQHn~=O*P5
zd|;PvNG_c$omnGV{n6)tu`T(hnE7a2%N6H6X6&k>58VK#v6$TTqNtC_NnWK?0^-Yb
zyyiZ%$$B)e-v2~QptF3Jc(MG!7$v>C^rp~}1tMpTBIT0ZpMF#;X%x-qnLGy-5~Smq
zP~xNe5M>z>@|byWipVORYpT_YF-;RExLWV|!HBkGaUVb!nQ7NaFB!9a!Qmk9QvEuI
z-rerU_>r;dkMJv?_#Za}FQ*C(I;U><6!Ch_>5a>Pr>`O|{3F#^W;;Rko2A+qgc}6H
z({XxlO=E7Jx2SvQQG3ENo1-ahtRaP?S&Mcp;yG!adS(%7;VfRsBDOyY{+N1-Pv&1^
z)q_HgIL3TOU-<muPn5Q1s(79m4VZD{Tn7LsL8gotSBlQ8RUJb*DOXcC2#5XAcV&TY
zzJBF=J{Y_0SS{^%YpJSGV2T`jeE_|ohywTB1{k2~^4{Px23ECOVfnrtK*}C!H`ar?
zJ9W{mBQa#e_X?r@@gy4kNbERLewT>5{fGXBzj8UCmcx1X^%aYMiMCw0l``;2eLeWl
zcC;(yzKI4Z=(8WFo*qYJ|Kvd`Y}VrY@9&fO&v!Jm3tLw}sXEN{`f!76IDZdeJ@vX1
zy03#s58q%%1FdXgkf!k@nwP8zxn<hf5tkp!A83Q<+*9E=Oqoav)^xP@4@m7K%cf>u
zN*uHy!=SbH=bi~;jLkOk26}=|l@X93n{wZ7NYj0n3X=8%Jdh|?B@?5Rxl}Q8Ye>Ia
z6tI(|(CbH+9pyh*e<8R?dGlFyoG*Q=_(nTpOf#WL;Y`)NE*=_2!}e5XoZYA?Ys*N<
zX{5X4DytA9^yRvK_1XE)?@krJ0)jwq&7jm6Vk9>K!d-3N1*qW$47hCilb+~yFQ^EN
zesF8n&d)6PW1arMtLQ4=82pZ0`TzTFs~GP}t+gfPXPEtcA*08<isfp@+X(ZsTvevs
z-v>XbQF@=u+;Py)pP)#7vwF6~ixkP+2jFM|k#lhsK5wIA3bf@4OzfyFvHr!_E(^1N
z73uS9&p%{&V|uk)USBQ`e7RKi($|5Ao1&&n-3OGp)cUs$&TsItN774YYo^9Y(b4I&
zv*!s7HjfJIAQ%j2h_b9HEfWni+-fcs1(Ok9vbhVDQyr78P$tYzQhVEF=o+P3MZo;;
z)tZZ1$Y=cLuh7vx*O}fTWs-q(m@V)^EUOLcuM+RrE!A!(S!a#Ft1h?=o@x)^EV~t?
zyC@b+IiI`uNlM~35UoV&ovGy%l3OU4H#j;L2^Bf;T&Sewn*Ca9H_uTyJp}BXmd{F^
z?|!vVPW=Pe(XEYA8&!oHz;M`(3DzSsJ^xmR*9_P5!T^MB0i_K|F#}iiw?X$7dB>91
zjrA<3&%{qcrMuw0vr3(~1$RY#SG}<=?Mjs)s%_xhlKNZQeG+NUz^~1gzaJZ0Xr;QJ
zD&j!Q^ozpyGtFh*#DWF~$<{53srP^{3wZQuwew=Iw?et}^y;|k_ox}J8EPO_<o11G
z^A`|NKVeA^_@k4ykFjxwJA<kxCEOS;lH-d-(UkOY2u&g1KfCW(>H}1{I8pcui`WX6
z`6z&5o^n5TM<p->U6iLO<T1C7yEsZlB4wa0OHF62etC(k$T|@d<2_8BsQqRkyGkqQ
z)ty&Kyhj~R^Wf0AuAL$BL;gceHk?{97aIeHICe*H%@^$C>z6JnP#$QbC^99iW=XTF
z6cP;GSc2PZP5iKwrPk;&lBQ3G7(W@H8(0N3IMNO(CZdESd`({(FKySw1#zO1p<3(f
zgtj8zC9h_%oUJNdm^5CeH;RQFqu2dCo**9^=M}I=T!l^RD9f9&5%etFn=ay+c3{28
zy*1-HXa*V(h=&pnQ>E+$Vk|XW*XM8lp&?`cJn`b%_xG=M`ZPtpDA7|%4Q)M9!zRAL
zxkEFce8+o%SrAsF)dHKy4QhJ+_%M3SoO_=xvUO?e+w=Ep&x5H(iD}b!Ub0}IA<?|e
z9R%z7YkE;LO5%Kn;(zvH^+BMb((Aiot(f~6yJZ%t$l7K3mCUHuYjx~Y`U=nUs6a)w
ziu8$nlSPw=2d%=^Q$s4D?*409Pm#;YZfO=0RHblr-TVE}&Jj&)Vb`{L#@WJ8_M3s}
z<%jAAP*E~!HqGev$Z6wuz9c<5@xvkY$p$>M2r1f0)!pR(Rq>GsRvIY~6~T;34TGgt
zLEX{)*REqBla5p6)2Rp_D&!`N0M%q|Oyd+5={dANQD9KnSSVKuD)PsaTGG>fg|dbP
zv(#p0n>x_=qx5wf^TJz$F9)GBSHIKHcRtfBL4kp^&qmQXY44dp4PZ2>TH2qcQ~{q@
z1vX{0JR9ra-RrSmUD8VH{LX$qi&?7|LQE6kNoM-#E0gr)ef|%GnYv-;oB2kXDF;O_
zEOMHm`lb#cn7n7`!}Pm=(F6Hr5$wPS?s)VjkFsL!e^$(;e=zVafi-%sqX+-{F_(8@
z?CJbI;Gc3q%(!ecCi=i@OzS=0yJZe&VA&HvQ=(N&GMQCP2G(aTcZ^Hk)_!Nbpx4T0
zTT&4cZg9J!;E+<rF|1PT=FC$W8P<wcilWScaVd$A#0X+DDq+&Rjhq+}_A8&b?}G3>
zjuM!<XqkQZoL4SgM)GxxYr6^5acK(cLyDhe_cj16b5-K1(dt~5i=kRTT=+D@N|mRJ
zipyM*eT>X+O#T5vG!Ofu?pP<S01AS9^J>x+1VMU|Anl&P^MUPUANj>P-LUCA<$_e3
zqA;guV%zkJ`Eb`^%VU@XGP0jTzEkVX^v95Oqt>sP7J=)MFqr{*3~^R^K6F54oAkrE
zG{Bg~lk3Cqe$<<Hr@DI8O$E=lH;Co@=Hx+IM!&KK{FC9Dfu}BMvpf_GdbvZ|hCok)
zI6?OlDIj*pwDy7}_K`or<Xz+6wjx9R0<%c5A0cLn1=)o1e#EuLtDy;_OkQy)&THMy
zh!Y>(Xof;*(BP8G`4&Bv9~$vyk^SDa_e13aQZLfB^C@vwNEdxDTuRQuJH7gcCrdd_
zu|)R4T_1~DvhDcDH;=HrYAXv~Cys-}-ezpJ0q|Rm!;Six*QF@su(O%I8{r&8_MiIK
zjzZ)kvY&UWF9j^8hQN@YL32OnzTKQ*Gc}L?V&&F4NVsQ!bv7aYwkAEwzmI&;i>%7w
z!6$)Q)*t)l8L&I7EB_xUVeR$aq@^=Eh1voGH^nc#qGNXO$C9ojY>^GiE%XEN*nnvf
zJ`v(RK(i^ndM;=zNn4MtE6?U)L>@F>9)sl_fpJ(GA48;dbUjy}aIOgfDm4K`pdm%g
z;va|_pR-O~vLwvVxByB2=M*^9N*a$t!=K}G4rdE7PV#}`pRvUqD@Hq~>_yW?L>j0T
zUTHuJ^-Vr{a!F|HF1Qnf?PHpjy8ucs$uQ`$S~Iir!G(76C&FQIU+4n?9M#u4$H}m1
zyKs40i}WY?6%wrl7xkXdE*5h#EdmlPjUls662LfzeU!NF9wxaVYbexp?|#*4L|knV
z>l`)ePI0d+*osDx$vdlkr;@DM1435~3(=mWam}=?pRBy%sr&~$YQEZu&IZTL<i7Xo
zcfk^oNYshs3yPpeoiG~TJcMm=Hg1{$g@d@_VcI&OZ=Y-(mq_@!!M@Re97F|fsj;Pk
zqpRD<_$<t~P*QS!>b;|uUkcWApk_ZnB(y|~DTnsSQU(T{^mloP@YX@8{fbaLrR1v0
z$jvy(?`4O)AkP%4^$d|_tfH65ysKm>&uBM_YkkgLr`${*EuTWjs&4scF!l{XbfTl{
zb@XG`4?K(K5*Oin)_(_b^m+ptuYl9e&*1rfXeF<-m99Hda2Cc$*UF7Qo$q)T1Bl*b
zeZnQ>r%U1;#WkNBN3t%^^2|WQ|HeMZKtG!Wtc7Xf#`2s*!AVY&HT#c7s|3B|n9gE_
zt`DH{=^Y93DHyDe&0e+V4s#>iyJXH;1~f9<FOW>_JNmruurs&rx<YsAiF>uF+_a<v
zBL=KC-aB7aMzqhjs-2ju59{w0msBe9twwFqM{yHHI?!PkSQ9?bbvujQOmVhiyz=5%
z^CQGmR$qFbd`{pxN3Qt|0#2X+<4ZZ_L~YXcT^kM*nxY7vV~<P#O35``lAkc>tT&Oq
z8~083^U&&Fk@DAK^y^xXl@HfiE25=O)(Qt%MNBI*v<4OmNh5T|F64iwG(Aj6GeNwD
z*{v--9N>8h4L&CRsaVSp_VT$Jm+13`7{-w1#sM@%&vk3F&jFLFH%h?KGut*y#DaJ2
zayPuf9%>l7qO0UuNcnFUXPMwN*n(KB_!6@;#Wu*ouN7A%Tb>nm05-hS&`QUrDVDv?
zcMS6WoHP{|rG?w!<~R%cI6}n35@4F~Csp1st@r}}pVc;jbI^sQTPc@C2ZUe1d?zkf
zr8!Pn_uH+8wH!UOuw*;>%;2ow_`(-w#$_*cY#@GTD-W+ZeUtEfhkf~8<m05Gc?4oW
zt_OAeZ7uXH5qEUbWwJo+*W%!(G<#8$vHVnyZ1l$L>AMs^TwbQ-8IIwdfkLZP2Ax@p
zjFW5a_0Y;EZ*UAj$j8ey(9HDemm$dxVL!|Mmwl}W;V%TRtjzmQ!w+45lO+y4+%)QR
z*fZ7)AXR*!76Zn{ZRy14w@;Jvmt&IY&}o`)OJeAf1}GAbBRB{`GNNbyz&YS|ImI{t
zzirEs6PYJQmHJKHuesh!`tDe!C?r8Ljmjc4xtk}cBSSqXrOb3?n4~O?aMy-nx)i1Y
zeOZgEykQ}BqGDY_Q@aM&gKxTE9+Z&MYkZRZ=nesAUMr;j3~NRiRIB(u%(c%t#2IM#
zo#!6Q_t{x}P7<uK5UP$>F=qJ>=J0iR`yFYYz5LJlWpYhd@n98@arSjQ06(kn{Xq9+
z4B>qsw5(fX<`vBYityc`ae>8=V$u0wBDk9Uw&vdd;M_(%=dPl73MtgHE3yOwd-30g
z5_rbBjZZ`zJO54i)GQ7QKmr;QP<bA4tosO(IE^6Nr=m;Par`A<YvQ4lSN}~LQ-fd|
zt6(&L8;zLPTf=|0i0hxu-~=stJ>v9Xvq0}AX&3MdhsXoMuO~-owI+H}?_6n-mtEQ+
zIOx_Zusq4t*5r@9=@dM#XAO}zlM>4BnY%|<kI5C4i-OCR*GUZN&u7!@L2l+d-_1nv
z3gBS}VCgIqZUIE+0o8AKc${7Yp#S6|?QUY%!LoM(K*43#$am-PE}4yqz0xxwjG|vc
zOwa}cmc(j1*o*6-K<HE9AJhu(YlN1Q+GYZ<Ov~(D=XkmXsdiJ`Ure$Gu6L^Jx*ZfU
zWvCI!ko5jnC^nlkkn2v7dHjnzh3{p^4X5{aemX{Y0Ck6{wL9^xRRQjm`Zv_zQ~u-*
z<MxE-<a`FL)TM$>I>UWVCA3D^x55I%UA)<Z2`5zf0es#xg)*~u!tMZecyCUPxxynN
zYy~=U{R=6VQ>_?wK3>keVDeV;I3H+dQ0!kt=^-;B{p!0~od57*G_pK6tRhS(oERji
z{5)0E{CA#o7Jk;XU&|h?4o9U(7)?R1ei5b4f~as+wp6mMLZp^p*0`iXTiJ_%!dt~|
z2zt&)Is(w42UbAt0hohIGfm*1-tRw+(CtJ{^*j?_0b?wy@FFXYariFP^Xrcv$J-Br
zfvxBcV5^U5V~(h^-$0{(r|}q?wGe?3sF3_)ZPJboDJhqkeZ<a1`|RKrEyEbd@X>-F
zm!S%Y&~kkZ!iUC=TQn5r9gwpokfG#EXyAjL6E=sCkdYTEED4coYh}P&`9kgdfe2s9
zEuAQ|g<97jkbV?#Ke=+ieHS3{dVRBanbyPZ#Wt|rT=f93aDdc}?JBN|I&CoLB@=|v
zqYq94${Om1vZVYRrf(%CoBbGT=J_^t0Gj}j7IauBW~IzRs@rHKI=0ihFw}55a}K{G
z*(}r)^vTseFpU<WvK<!JHNe%Q=70rx6|5yjzxDu5PEpxkwwn~4I8w=F)@mvQOCV-X
zH5&39wEtFZ3juuncG*05;7F;2q?rID++%>E@t&uzgK<?F4macyky`26OCJW|y-rTw
zhqg>w-ykhr?t0dn&@mlgmKfA5{e&A>W)PK`txNFMvAjNdqD%VrfIJA5zFEAn>2iht
zElNv4iHNQpDBWZD*=d8&JFn2W2aiC9wWR*JTIW?qD&dTJ9K=P}2{0kF{aBgb4aM{&
zu7?kq9w%pY+-s)~tp}@{!K7&flx35o0Z$1BpmCORa52Dk?#ACTT)nN3Xb1!XFHgiZ
ziWwM3%DSAmH`Eo5d;AXyn{D94KpJo5XPy1*H*{H-S#%EiUYwU}_*Iw_6H%W3ddT*c
zGIwxb;b#--MDd#|z-Mtm@D9OC)~=oMiqbn4>a(X7QY$`z2m|fGcX*k796=tWX9=RC
z-*G9{k@>&{MGR7}Tk5_bPC)K3p|j~3$iX^E!7}rsMW*^lC8f`o!~VCD!bDPX0AF<x
z8wvwfhyN63!+*$V3`qVUI>fLvjJ84>3u(E-vbhAj2_s^plBO<}WTm)f{15=wb(5TO
zzs=L<sJ_AGeW4?cVVPzxumh82AuMIF1CV9s9BLE?3ZXkkGN|~684}JGeJAo%zSxrW
z$Vdm`+Rk4?*}QYwXW1l$f-l4(cwRitFJPsac47Zukd~ixf59V(Re)Tc0P2fd=IRB1
zpf6X-ZBGp<znw7xn|*$yF{9-SYlvR7FJh$_#)lL^dO4T}ufXvK>Hl3hD|cZ|*tu?*
zayLZ2CYftcV@-KH!*@f$6Si^c1v&b#G8oc3010JPnrS+tO%zYlGQHx>G|a&xT@^0K
zW(G>z9=jqyK=UIT*7Cc*`~93J*vZQHU0|Lf1nIgP49jAi<leeBF61j2)Pnw2Op|k)
zxg6}+!E*Zb<Xp0zkl)<opWk&aVJ^%VP|AN-E5PU1{C5xVv%$*D{a~>F0fD<alWUEs
zLIUoG^?rpL2MZKb4uByLUZzC9FgI9tOi0@t(?_qqL(b0kR0C47lTj-bGER-5RFfgc
zpg_JQ`-WZj-#KGLzSr@PU6=%xG}Soa5rjsru!ruEW179UA)Hu6PLOKryj2nU9@P6C
zEIXLTX19?$%i1XblJfXCaez1aq3E!~V+zP~CY^kUd;9T~1JjkMsyG*qWjm(qlW%At
zD%#UUb+8lqgKoK96td7NR5}qC7=ZCY*=7kCZd7|Vp)61dE*;6n^Wg<+*%CEaO1PLQ
z?GlI|USlUWM;ebWTDMeYKy7aWo|WWnLo)~-q7SJpFuZlBGVxHIBJT$0DSxca9l$bH
z=tjH1rANa{=VB%Jz=^b%Rqhi#WEJ+^brOWjIpptp0qLVxaN0?}1OlpGkoY75)ab+L
zj(TS=dj!CdC1jAa0|!{nFWwc!!^?DQb+TWXH##t-OBjQ`j^>A>#x?svZ?a=Yl;UmK
zBqb~@<Pc%f?Q{I?MxF&DbcA3^IT;cR6-1=Za{7hcNs}w_pUPGZnQ`9o*9b>UOHim0
zkMxzcM;C*bmSJzG5sPYO+*Baw3u#eDm&il}m%Bq2d<pH}$Am;*Sw_Tij`xz0^svRV
zvK#+?@$?!069J>#q!wH7Ly}(fQ;C1=^L^wji`(ZV;P}fTn;|DoTkK!CvWW1W_SbGL
zn<0_;ykHB=>YwdlJ-ayc%EvP_)sWF1=0@(&CgkXwM)Q9j-9AY^^?~9{qll^GxT-#O
z6*V#I+6i|01%kvG_Zhao?}Co@uT8qxe!e0bgmpCSe=tEt__9;O^m(DwGfAYpqI;GU
z{f`YGg1kc2Q>3B@8-OK1B_0|*D<YJt@XQ5I5a|n)@DXYvA{xX&?c7Ymm`!m5B1KcV
zvHroqACt@p@r0ExD{Sa^M}%BRL6x^}iWm!pC`$f&CodUJu*{XQH1vzwn-URa_QSbF
zaVHN@%?<x-t@Bio4dN0FPk>VGJ!v&1u=o&i5#{;%%1C&tXlnR{{xI_fgN#OG#DWJY
zchg20p<aUhiaS!@IT-=(>O~rW#uG4CpHUA=8Vp6o{af_OoVB1cb-MMRx<v+V210Hn
zi0r9Cx78weS*?{UTIz3q6o8a6)>i0SSSV!6ozih3{nsB!!@IO+*v0J9lODzpY%aQj
z8bkRb!)T=NLa3&$&>h`osafpHi+l;WbV3T3D^X!zk?%ZG!@MI@Y=gTa+?=%7|80vg
zqLb}p-<DA#Qp1eA4)dxa&698U<Rj~qk5_Di?Jt64as0Il=zlNv46=0o#vH}m@IxYJ
zagGphXAY|gUIN1M^MLj#4aoybWq2LMP;^!vQwG6geVPSemd1W9j0HMmhl{ia=P_j4
zUNqV`32CS4)tOKyCAqw)fqN%EJkxCBp4PpSu*P~3z9uVqi#DV;h8K7HjJ(T#Mo}2Z
z<6=aszhQt)@J9A_Qm{lC;~I#3UP20QKqfp$VsHRM-PucOe7({R8D6u_;APT)OjjqM
zq_d0RXltcMo@%OxI_(j-u2=M2{TEK9o-tyah+HZN=0Urwi>$?HzQ)^sJH`zO0;+NI
z4+&WjT`yTPF4n1&|G6C-`4G8TV<jo@f^`FnMBoLxNqvLe<bkN;D1}{er#u&UfsE7$
zmHqwCmLU`tPEZxd6zq!hcq4+L-Y9K&-xP%$YX6>R@9!qs>=i^S(tm?9clkeOjuts{
zYWmM}rJiXZFNHNXDfZu)+ecPX?C`>M3V0}%_bL@9&;QKp_@6mn4cBFzUF^8^Z=J;m
zPe`)9zf_Vm;dd2@(fvF0a`0tpPOGLyutXs8OTmSN^54_BBdz_@Q|#Uh@F*&%G=`J8
zzXS<#P_rqV;6kwT14#w{9?F;Q<e2Wwr?KZD2hQ(5Q7s0(<d=)i%f|6Pi$t}+huQ-F
zw(lZBFA_Pe^-CIg6f6OmzYHXnW4}(`Z)E@Nl>xJR{}_{mf6AW<`PKigjw=#a1BmIr
zJ4WGrIPxe&b`gIW!YaqtmRP(2*$1!s?Tmj9wc#&u+_lW+I2I+sp18er`rlg-Mz#nQ
ze=>5D0Mb9=VKlxOg)AhFOe%1sjG=;b2cDpjI+bu8J_Zmia-Ls%q|6ge3CCNd*<~^8
z&E$hWD~PHg=A7+en(xNP2_SXeV$=%VM1Gx@P3bmUaah?(e{vB#D@1tKlf6?5H0A$!
z@BDwf2*Yo707XAG&R$BqrMke9aqkC4PV!{Y%{PZo`Kgem!2K*>yBvKXB^t)QET0us
zVW5?E0K$I6QRUGp2()kW8l2ukKDuws?U#vw?RZ!#3?7>+s8b=xn3e1jsFMHJ`{9a}
z0O2k$-6%tgY{RnVBXIIKA7C8<8oCPcXNQa`xEEoxEDd+zGo!WJ3m>Tn=&GYN6hfp|
ztFSMp_mHl)R1!RH3IXe<;p9)A4PX`JdGP!fvYh@54A0gbP4x^xf&Z<<;NMA~{u?zr
zP1Vp(aKqow{^@RTynp!8X5unM+lwoj{Mq>b>S;oZCrA)yDQDN9kF!ONrTb=$@AuJn
zzoCx7yHe2Z^){|XIS6Q`qwDLsz2hmH80mB`RiQz5$PQ=OkQ|~vgmT3dY0^VY2Y*XE
z!(;B%R+4K2PYUS0a;PJ;aUhQj{U~~YtT)}Czp(;5f&R;S%l!8(`Ec~w!WNWdEJb^u
z%$Umu!mG41>GK9GiLiYraGQczi)^mWVWQSt5*A@~=hWTtD!|OFBRBE0lDT|K<u;Ph
zwyoNl2BpB_r6#50Z^?8#P8s~ai7({WC^^1Ykn!2sc5iQ2`qCRS8?$I|cajrRD@D3+
z;FKldv=JK6H-_k7h2Ovq7s%z@u;+v*CqU*nvn>uUAFXy0BK@0=qdf1J{C};kfL(s(
z->G&%4w$eFCn*|>4>4D!M7h1Kl<ciCGWiT_hN)Jd)CAB!{<-)Y^35tF6>c;}i&3Ia
zq;Z@+eS?%oX>~YDYP;k<9(UhO(jiMt*=_p7*Wg^fIc%|_{=@s{+{#1$#lMktPwM#M
z!0I@-ZB4?^>)%#tKX;OUQe&H+Ya#^q!E^uFkjN9c4(PBK5&i`L=L5_)VF^W8UM*Gt
zAGZ%FnYNg+>hWa1L8I#`ez+DWILySJ|5aMQ$KUmo)FSLa-6}V*qH92gIJP0Tap^i0
z%|~qRE67(5_Vrc_AwA<iI|_!H+C_FG4OkJJoZnAie*M2czv=?oH43y$a4?@tF@7Sz
zfPU}M0pKW2m>J*<YIyzi@*$*3Djl8n!f&T&=q;ENF4OmhB;IU}Ml8HqP0OeZCvaBY
zssGDaIYd@-meI1N6pu5*%ADs}|Kg@W5*2^188g}O8WfYmI^@>NolB#=?)X}clm$-i
zbV5#1QQ?199MO$7I7*=<uyPT2>G@5)c@+I_g}Yx3*Vs+}_)F%jCY?Kfz?Z;eP)Ui|
z&Xaf(Ho;w%5EXcS2jGvhNlqQjQXRl#2jqOpFz9gzz-EEVA=zk=Y!&NaQ>UreTQi}j
zwRK#=REr}(D_;)!zn&2J|DGGK$O~x8sNqsU7Rg9ECaP~(6QSsgr9S+kxGHiJt?XxA
zt0`1en~p1{)Yk?OhT6HT5tA$?J*CtQ>nq4vA^(#-3vz!AeWR`8ifsD$evQ;#z5kn%
zA2+TOcwRHj)TOhF1;Qfd-V!{>3@@C!S?K=m$@Jm&xT6YYDuA|M0A;b==*;Oy^d|TJ
z9C<qSf+EsH5N?z6KI)(@VHyJfWfGD9%xG-A#6yY>yi44nXh_SU(fJI=AUIA8QgwG)
zx%|Dq;&1I72Rju3diiPnZslEo4_ZWU0`fj2Y)86}*}@7fE&3ihh!XaMJ(%sSimPc>
z+2K@7O-O8x#E};DH7|{Q^WydI#rucra*mRZ3RApE?72f7Wl5U3q*vMUQ@*J1e9V>1
z`va-(3$)O)(T{?pmsGUyRghhpFDOZm3z>jE%`oZYy<S3U^3-0q>gj*qN{!#3T=G~1
z!Ki93Pq=uHXeI*f;+vF|Y!N-2#u**7tiHT5R<;eV^Cdj_nAR&m9LErXILl<hqo>l>
zTdasznDVUl9Y~PR{V3$KE<dCw-N5JdC#T@sadxiyzp2(7Htj|#GZe050_n&sCN}A!
z{>DxoCAovf5R(`aG@aCfSDuetvlYveZjZe2XatxUBzJcK@|Nz%isMkCeWz%>*?Ep<
z27t(v=OSe_1PF)Qp-<txma^?#>C7{Me*{y7j&|m~A7A_Sav&qm@fxdN!Ve=|{Bo8T
zE>#Kj;k-b*NS34Cq#PW#ku}mLE**#~rce0;H>u9P#@p0^A<O274SUsbxioT;KFPqR
z{=cNp|6Vsvw2qcXH_ALE-JqGiE+3-(&gjzk3w_dSY~&wqhGk_TW61`@Ae9P_Q+@M%
zCvFMCgA4nz_h<AaiO|QQ4Tm=cX?Mv|D88G9OQ0|qvfCN3*iTEhgtg-J5b)E5)f;OC
z5nhPr3c!*jBj>C9!2AtEnyijM-Gq=(Mw|Q%CLz;ZsyN-0;Jf>2brm5Qt3{0kMYgZI
z_l{Tw-G4UBr5~iHs;eFylw#=$jQya=>99npP(FS6)u19-*mZVbsdB@B7p;8TsOd*2
zR&B`58!-e=VpeW1&0P!YaSSRfP=2CWtUt6Kj7y%s+rL-~=JnbWne}t&Z*;$yMiIr1
z8DnEL;t$>5{xmUt_~+^U2J$5)iHE2BU9b|lb$X+plDe&gGzw!A(t(@R1FXdLqm*a1
z51Ir@6COS*9zJy%1BFF6&v;sLSZs__iMfX!{)8_{FwaNi6h&vP`t4eCnOJjeb05P+
z-3voebS6Qjm-}4;>$&BEBrH2q2YcLzoT8uEIz&FS4idFRuapR=2I+(SdvU8aB}a_R
zq4R!(PjtB@2gZvAQg72$n0~x?e#&Cz<^YyYZIR43e)i7-l=q_7ZgUKi?2x{Q)JrmQ
z4Xn{<5HK<w`-Xh1uNm9#sj(Zk-(S&XL>@JYl-0D{WckQ*ajxT!?9zbmEIoWy_|CrE
zv#6hKD8qxfE$ci~Utny>KH85of#T*SySO*<KHz7(B_w)k&I!CF#`={4x1`6~%V%<3
z7Q9D(dKjxQ#vWm?M?5rpMMlcTcu{zC8^jF-yM$$hGN*q1DJfh`rIfN~lBRTRJNh8L
zAw$Sr(2_dWoq1<IkypD$thf|wqRXh_YQxfV0a>a~cn1O`1~J#%E(W<@*IQNyO3U$f
z%Hg_PGBKYr_`6K2^&Z>=D#x*}oiXff$5L)+%h~3m1dmp?ox@p7<i_<$^`#no*7GqE
z6oI4@BchVS4uxrtj+g3Js077iEWD65+kSTJD4YSDMpa60PP~F21SH(Vu*C3FPl*ai
z-6o7zT3_ck@Nx*?p2k=qBXqN`Tl*G6i#EtfwbeimVG+xsht|LMdTq{{2b1SC&g|M!
zqN5`UiHJX2H_*Q=oZg#{h{#|R4*Z>`c6jEF7Ez~l&eRJX*LcS+ovnRkmU&$YLC>p<
z$|647%N^#yu^Mj$FtkgH%=8`Keert{MPwT>{GeE0E5#6its?w`0`ViZVsDp=f+Sx`
zMV<$WGSkhE-5S?OZNX|xwkV!pg~d55`z-2hgo9niGh4xdPKA?2z4>=hr)sQ|P_mf5
zLaV`lm-3FWS876Xloo+1R^#^X-@5ev9@zJ;PF@*(ODib&1-Yprf0ws;MmsQCv0P)u
zrIM>4z|K4-+sWSd8Tk}HF|4I;y;W~^FMEE{mfMetc*51)E$MH(m!mEv-C|Tv?av-_
z40^<<KJi?8sYcKKw`}pAHf7FOh2BAre7QitjE3lK${TQ0-j4U*uV<7TzCXfjdwl9D
zFwD<uN4@%^dc-+D#%8^V9J^Egze!l94!9+UfBQVua}I~kVf3TZa|uo!U5_9}O+eYL
zg7bOq7A=qYZBbZ>8gG2|cvknPe+rBBcmwqS_gsWx2@y!mvZnMM)XR;6KdqY%`OuJR
zy1p0LVvm*mc1@}*8g-2lTU`vyE3DrJU~W0&an0GFzjCE=Qf2p9seZyUmTl+XE{dmf
z?m86qa|s-*kgK>|ieT_YgRiePpu<gRP0!n3!$cXLbG_qpROa$$d~|8&t{?J*>NNg5
zXE_=xUIvs+s0&_3P9fnufj>_(Es5Jo>~KDs_#$cH*7x1Tn@ZUpRLsb?=_H<=L)rLU
zyD~p^Ce0KZ)yS&8^y;uWtF6yTZ>S~dN#kQom*SiuTs+wn?p8LNEvW*T;TUn+yHBy2
zW~*(`hK%<pY-0$1x#(+Mi&o4RE{(tDP_rHq8hR@z($udrNE-0St!m(0-llAvt@y$(
zcghupZl#xgP+h-=vSgH=kdM2!yv41i#TzZ*!fX0rt77M_?u(h<)P;h;(Wvm`_N+;!
zEO{#8Zo@t$&UBlX@`Gv3*Y56A?nDdK%w1f}K&x*VB3EIHdb#o<XX?!~s);ru{m$xO
zKv{$4KGE@#ZeX8;(mkWO)%sXWGEN$WP4Z~v`ZJQl*i85*%U*`PYuse}i-o19A0wbl
z^p&V+L;aVIg#LULB_g-dL5474%dT`iV7EH5_%>|(a2B5qv7M@1;20A3`MhuXifB8W
z+eJVA?TB+K-n~{TptrSJ)$>ZFCXq>Y>)4{0D6xHqa4+9(r8%f~`u^_1g9yD<F#!^~
zXk%Ng&S>G*vszQl9JI{>#H#q+g-ix7T0~<BNanO5+-{G!YtM!sgt-ptImlnPTp4Wj
zED=XFW&VuyyHt(FX~Z9kX{1FWQ1eLy8tnKpwAlJ(_Fo*;KRK2@2mIFVC~YL%P^+rt
zTHkD;y;sVUa`|`%Je1H!`Cj`<rX5H;?*k{LdGcM%R|(WX_LxNw>rxGtLF@2<TyTds
zSMx?QYY>HL%|`JEc+d4-xI2+fwnO;+y;ZaU`4OWV#h+(_0=}2pY-?oCWK@(DUZC6@
zu>F4h!SBOmpBU$<W>@_(B~|nBFFkhV_C#dS5;mnyR(W@B2=I6;>#CxME2i2)o7O!U
z3uMg4Z6t@ihh<rPeamb0{>TP)47NIzcw)lGo_IwuorK+pzp>gVh<xn)laH<NUji?u
z;d*Jb>)h2BMck%VMuSuM|AH^64j<3U#h~WJYWB!Llp-VDyk2Ul!^ddZmX1O~y@BjT
zi$gY>hVNZi)MUXHk+VhVj!bbn&)ZWEYSxp488{nZTU&-2xE4<fT)%JdSf7Y*zjZ7U
zqq_I1o~n-UerJa0O9wiBj0V@au1*}+)_X*<(eBy-?an2I{KOv7r|h-lI_)FLxGv#c
zAm568Xp1tWw2p4F(BJdSi|1b)r+|g%5=t{i!++7DHyDxF^pzY^YBuFdhWRl(ch}>O
z;s2ZPZ@ju^ugC14gh3#tDLOA=KVQL@uFZ6p|L+;M#i$Xx5Q}MFzU?$TWNw0iYD5mr
zk?8zm(&@8AjB%GpC0*H{bfpPi<uYojkE8p2*KTp(dGL|T_319kDH-NIEbiG_EFRfY
zRq@6S4&MZa2&Y<iqqR}d>`fZZd<E=Q4(h_KQBF3hl={?luww5%tdB(uOFLYw<GJ(2
zN2l#vr3{ymWAtI5omOY3*Hf)`{W6=eqO=d>e(>uLq+<7yMKAa|Vh?z${Ujguw#__i
z&mT}0SevsN3Q02XYES#Y?%QFjNot(N+U}wDldv_3*|B?Hxu<6GPR-CA5q~|}ID&%9
zebrgPd7Dn}Pk!VvL^f72_l}4cvrqX4l$2`7Fi;|#>Pvo2cXXE4WPiPNYmjV~Z59!&
zduNd|$R8<0iETv|&A;u-i<W(S#ZW}g-hEkU>wboEOV^ic)(-8wb;S1dCBT2@cjUk*
z)SwW!97Gv-0UcT@+#5mC@U>#Lu<25)FqhN^;nQPZ2-io1UH`1|lVnq0kInSC^K8h+
zTXOj8<jea;S<h_6e`eH>K=4gRl8~Ee0jA;0EC<!&)#{<eF!vQ_nIEHlp;F9Lu4%jw
z5y0v?cl*Vnh-qQ{Mtg_<;Ynu2sx~n0ZC@@j-B)iq-ocQo^@>&;_ARE)lwfU;*2o5W
zG$gU-6fKtMRz>7H&igvtyXM)0CEY6ijbG244?~)$`LlI@ff_BI*X*y-p#t>VfsT<<
zoGv6ev9)$sYxD}dYwoPY>hF5OdwFT2Fg>j*GdhamMZ9b=M5jZ07U?w1tXth!kk>zJ
zC)&^ll;w>%2r9u&^(Q>usg#%h%TC=2C@YdIHQP9IlBeq5Z16F2QRwC@HZ6U=q<X7B
zOLT_rGzK#fp&QpnS+xxT*LNvIzoK3g#L}5Ke8TII9l0hIT56{;$p7wT16n$A)*&~+
z-n>K>Bf+`Ttf--ND_W~E+9v<~`}fYeoynVxVUfc+rqLJBUbZz~=qwGypV*Wo?d5nc
zZ_Ern(5UOXOyj!q3)*KjX98iaHdy!dOMCqh#;ffkf&BL!Sfuq$Swnrap!Aayw0QHF
zd0ylj<&9@`o-md#P<yc7uj{#!@VJQyxny3~Z+vv&<>Zk=gt+j^)1SVUV{o&hYh!Iq
zH;j*k^pajbQ9yi+-FhU?@w+Yr+5YgG2o*p4UJW%4_M8hoa{t<b-%p=As<-|2rB5m?
zsN4UCN((~z7X6-+H-ieLUcKTSH6)|M`|rXU*q69rF=@QAe>%CVq=yrQ<#r2p;Jw!+
zL!E{Tr46pH7hgTGNobJl#xjtVC?70EqYa@;cw+In@V654)=;`FrKxgls;xOS0Z{U0
z+8Sepv&IUeQb{h9kzcfDY8M`b*GJifH!n;2y^zIVz=fkvpz60rh*jk3r@gNvg<H*E
z>-c_sHNxwQfJ(($@RRFR5Im`hfK;c-VHb$yiU2-8(4O@05CNN>ewc`-^0$ER%H}V@
z2b+TM3J2M~{;>m(-<;R-gP*Cuz3Fx%&=*o0+}`nn;!i;Y?4K@Eb&EOy1tk~!+4$>T
z-uI(ZZ#9+?td;4hp<Mi%0gvd_TX#$Y%8u5@sueMcu?iO(aY9eh-m}Xnvgprcjrg=-
zx6Pg7Bo<I8L#4VIyh$f5(P)D5#Tu+N8UEqI#WAZ-rDda5%%9WUrMC(ooLdC*+eY8k
zDy<%JclQ1ME;#4G;@0!@$Olw*zc_w!49EC=#%q+toG8rIFP_n!ie6d@wxGm@J|n-Z
z_V<@(wyVCIvz<zj<X6iC2HD$Eu{q?-E3wSTYb>OyWlTjTeW3n$Rd?B3C;pi&g@@PL
z>N;@wRS?URq3EOCHgVN%uP)ch{n{!-2l(jsTB!I1Rid8_4-UpB$+m4hL%|A%UPh;8
zv=*!*3LO2G^gE53HyU^Ip1(dCf35QRaOUc58rxr?$h%(n^Lz5o_`Lc4PWee1#s44E
zXbFS*)%l{LC3dZhlN}ZVJM7vGmOGY1PN^b!jGwMypT-d7grxF5t^bVDC%n<Y;t^dp
z%7#1ocP=z>rWOqCVd9eI7RnDQ+p^RPd1QR?i9O|v@=L=ej(vKyF2KRy)`gO2V@uSH
zNIebyud?r&OTF=?gX*T5T>{I9lJ5i0G=jD7^Ap}%s2ob`QTj3K{=Ve`(bD*=t(BYp
zdOuf=F!X61ENHoOdun0@K55>@S%!J<0^)wN*EB@1J~;!g<7&&*D7UJXs|@xaeAiXF
zH~Psa88PlHX<k|W)zIyC#c!IC*4jG)xqICZ5tQ7y)37!^`P*YZ^ucauM}IyIFne07
z!HS2^y)@GM*74z74*DMtCkwozXE#Ll_xrI8{??hb*qmy&`V!(7@8Zyg)J0FcLG7zP
z8#?g(IdR~?q2K%sOGftL)uN0cTOzZlQ+KMk-c_$}Ez5B2*iJ{bQalh_<t^%HHD%-~
zDpuX5U7r2?<PrbRYEt@EEE2U^nTx#Jd<8N!<!rZX{>Un8QAEGuu#vHS03B?90<%&?
z2nF6=86+>r>LSzHL|tB;{KPa4EQM*59Y`cM%~NxPK7M=Xexf;KU-Qw0w+-F*Vk;N&
z|4)1G9Zz)||Bpv1lA??vquiy8D4UE1N?BRix|MJ`WJPADsQWe>sANUvu`_ba6pHMO
z%#gj3nfZNP=b*aB=li*TfBgRW{r>48&UwGD>vdh%Yd&Ak>ltIgJzq(;T5rREg2~Wv
zyQRLB&XooCPYiMph`+Og=R3Go!hOcq311$b3pOl+mYqNlJRv3}Mc*2a<zC|gcvZ&c
z`~p!1e#_`8`}Fc^ERe5Utt(V*{QCBY8NTT9ii55mlc?++YQpv!Qvw6Y82(NQU$7J2
z@2*ow9EeE3#J;FJMT|Lzs6Wng98cb9mt@t?i#rB`4>HeY$!&VCA%VRXlh+|=`r!=S
z@oNedG<sTnejCg@7`fChWj?s|B~eGP-e*sP`_1U|n2<6`dIg40A&d-{Ip6Bzdp8Ss
zCq(vXW%6zP(5QPgvnPkFhf?}<Lx&S~urB(rC<Wt*c6mcV-#mHnS{ift`(YO}E;x^m
zI@=a*zM`44B4epK*5o=>SmeGk>mJ)wFq5ex`mJNOK-6`_guP;@wMv<NWv;9q5{;nn
zJedri7=AC;Hl4;^jRi7??}M|2E3WnG*V5k~e6%&L^et+mbn0R0Y@TB7E(XLkAG#X!
z5%Zgpd@iD{yK&-Qb)DuW3)hQmp_+FS6#KxAf=6T)FPpUEwaHF)kL-XJV~Tl0FbEFg
ztqX1#F8hsY-zU2m0%ch6))MiDsrfDCHZ@p0I;~k3w;0&EKkgL}dw!(B_4zOa+C-(B
zDSKNa(@ljSW{k266i;khpwwyfQjbDlg}%WIGvhdPdNIm$#2|^0!L(;u>ti?GlS^Iv
z)iF2DOP!IKWlyM?j_h4h-&5FV;t>_4Xvvury01mP@wwGF<wqy~@g>*sky?)A(>3<A
z4)&?zgMd6Z4+&3~MkRE0kvTMNR3S0aHTu+;D(AwjjOzKb=Hg(jR2GZtfxk>T{!%y7
zEy%qkpY@&a($3qzG!-io`f>L?)*BZkpabln@Lg|b71G(g{jX;?Ve3cy5Hr(UO&<5N
zJ0y4V3c0tuY13ZJolK1ORs78dyCD8ZycIEAWI6i6GO>1R?4w}b$?mu#%$o9gpMrRG
zAkWHz6(@Tad9>%$Yf7pw8I)(_RUyCOVC0?1Lgme<dDl19%EQfD*F&FkMB-E9nP$;4
zsiuslUT<?Sa3Upj6q+0qz~hh{yArNhlR1)dYdLo%JAV{A2mrha-8mqo4-sj%t4HdK
z{&{W4tS1XLLyZ6z613z5B%+$*PzK;9OsA8;m^Mj)oy}BcVq2;8cMC9_B{VV2@C<$J
z<#!j)?-NcrJk;kBPDM;Z^6mV$G^DH&Zj-k{-J)E>aPGEPE-eoOrpCNRs?`|dChh<y
zCZ^XsGht)gj7DI|3G!%2X7NqWXy<>IKk1{n#jNMGeBpe4#|0n+^PrECFpt7Q7lz7&
z=ENg&Uoj?6IoqbATnVYBZB`oozTD}Vx|R%Wa2*gfV;-Ai-93kxl*XsZZGpgE8Jt$5
z?|GltZSKU&UFs}f%sJ7n^U^e$GFPO|riuATR}@VFEX?O|YyJ*!w)w}rgd27>gB$je
zJYa&FuW)J9YM7?sfh_=ARa&4M=w+XmtSN<HZoBmN_bM@ulqJkBRQzFe_K))AiRSav
z-q2{2_4J%}P9Ia@oLmd=Lurfmon4_OO3MIJEB~Cdl{LU^VUITmlxxmB68ea=g$_fU
z;-<Y>y)tuu*Mki>FUW1m6`RO$B%CeTqLtsgU!Qqj{rjv}g@Ek;jb};+lT3MAo+IN^
z<GZH1?EM1-$BAwstB$<HUPjMjCLz01;*^ZK1ap;*MUuxa*9dc$$qNX_GI+Y0_{f)5
z#BY~$GoV{`1j|{<9`-fQtni@zXW7oJADvRhAAg#^ac<%FuG`73X-bUWnQ)Fq2*+u9
zGjHSy|2ZZDJ2m8)A$48{X#5c25~xEwhD!-jiI%cYv``!z)K0vloQDD^GnvNGT?_`#
z;+x$8Qv3q2#Q3phYed*`o|>ug$g6K~{G^tKv<tcSD%^wg8Zm_Z?Oy`}0{L_Tq0|$<
zgYPUDN`i?PDZxnjh3ez{=Uki29Ys7l*{EoD^KcAEXuYZS_1KsDyum9WjBc;beT)Y^
zSN*{S`-wC^%42;QbN61ytH<`)C4J%=6Hj>8mto(i!zCx&sLLmM3)1-?ioc$;l>11@
z{Wko42BpMDYDphfNv`9B%kLl7CKQ>Z;Ad<#xV<gj`exj?XU3xAU69YII=oac`#t}q
z!kt$;Pc)rqYj~X>OKBueDHzLo^UH%lpwg%sY-yARs`K;nBUfdf36~+y7Fas6iHG!3
zcchV43qY;ZJsgKK!9?P_X3re$fCipt$#7boP64%W%i(sA_8?%e@t^pM)6s>0m6OU-
zDI^b#?_WJM`mL0?j5`NOq2WP3)!|d)<weqq$!8pYlQqtR)8P2vo3wvQhX011%Nrv`
z>3zIZ=)$gLmE_BP7K~Lit=jvDs^ji#h`6my%vtg06;2!FiiF1`W8vT1$(g#G!&UJ`
z&sd5o<5P7pmDYK+O%7_!qNN{bs^l5EQ_Wsv3Z8C#Cowh32fo<%{HF0FNKZ9DRiMRh
z`^-`ZAaMo(a9lxnpW-@-860088z*|Oc*E%gJLmvmQl={uvjxrWSHRCZ(pI`%EqWUK
zG0XNnA}wZ78K_Yn5m8$fB2F+Y7)SdBADQoy;VZ}GggYV`_w_kSeZ<fmlZI=whwQDB
zRW_CHP8=xJq9WWl)gD4Rc`_8Fbb*ZFGp(~6=OP;K^#^)u-bg~?LEeNfI1@#=$Lc;F
zK4l)Nb1E<v_83R1mu%APQ2kxDb8q5B3k%!=S-!rwLZ0(HKS-(ht*lx@#wYjRydz9J
z>}~MDeY`2q+A1V(DO|rt(DXd_M?}>NWr<_444Rh=2zG;UCRG>JN`y}CnQj3-%HaJU
zbv_={JK?ar_}#oVQckYkC#>2vv}E}3aW7rLg~toCX-{dfwN9bq1|ZUfO$N>m)tfI}
zfwV}fcW=(U5XEo?UqFKkCP8~dV64GSAESa6fTIj+u_p0e^XAJsgRYP6HE&{rhVE~6
zMPyq(hRSe9qsz_*0jCt-Iu7>n9O{~Am+n!KFX@PD(@R0zJ5eWE{oSUbrU}si3Kq+s
zisnyhEqlLAZ#LsDIMd&L!=a&r%dV+&gd|m_P2HW=T<VFDOyh^ID&0;NSDc3u6)3p~
zZOaqQL?wq@k1rtHROb;&mPD!JGx6bTk{!IAj2EC;d=zKL+@R07P4{CrdqQNo1&^M~
zyYR`tZ;z;g`tI&z$xnH&p;wt?%6zFdPC(*#+njs7?Z!veok!h1sPl&~8?6wGU*A3%
z(`IbJIqck09~Kmuj)_WoaNW`;RQ*qp`QFWe&*B%KEjWQmWx+JfqcGSV^80PoZaSG8
z&J~UX*xxNOeTEIvELl!jnNO()Tu6s~hSBo3$L2tp`ChjS48&vLju}Bm*bds&UI<o+
zMUBxbu-a?rLc3T!qVde`1X7Ntz;#zfa4ikX0~=fiF0jOmYD0J-$S@jMeuoDoJHIP8
zOj-+czyWY5#LPb)u-HCwS_SeaH!NB5R0cvapAzGD*+P_3sZiE|6u$kYpyWerf)2~y
z2(EYQcbT`;6cb!SR@1v-^cRn%o9c#X;VaUr61#-#72A&}@8nRmfu!NX!VSwd3#*}K
zRq-D?Xrj8W@aR!sIfb6o+a!4SvBy4G@Ww<bnkF75e<jDqwO1G8Bj?R_ZnB^0o_x>z
zV0~;X<#~}hW*SF%j(y7?F*ytuZJSsEO{2Q6DSJmuu6&nSiM6D4SQJb1r#n>jsp6GL
zb})uB<<mvm#f?_$KHZO)f}9s(irBG9xSP~*=xk_s*z#0t?3~r)WxYJ3r-E0N8wHLU
zeb7r<TAnRbLD4BbH2C^RW{NA;OW<;Lt9HS+z$y5X3}z3a1(g6gU!n?uThZsIj8>+N
z>|^J^#sn|Vy03_$9w7S#<SU!Qmd3YU9eEF}j{+sa)4Cc3=pvQ+AU#X*d2g4@dHF;0
zK*5(_-!dW1L~A$Nwz-u5M4y}UnSQM+2Ui`NXXF#(#S^jDl;oPyM_(=QdCDp`3v+1r
zbC*=SRzg`=*+=9R^#N0J?=p(-<I9zm$a8&U-=l0oR+pybEF_hx6I>V`_ubuqKd<h1
zh<v*^!xa`9n$j&+YMw&ba<}$#I~~zUzbr>-@78!_Li2p3Mh^Bj-aXXjFCxuHFdmO=
z&YO(16^*qq;J$#*rQog08EDBl5WLW3#>sG=g(jy|s#nVv`(<27<308_O8Vz*aj7Bo
z%&d}E&$~Klga7C-YkFV%;DE%tT)m}^tPZE)fL%B8f%K;iEV`=e{mp);ZD;Uh_|mmT
z2E<+qcNsiNn8{zY{`%8xb9dm5S$zp01}J48o0|kGxZ|M!xzm{x(OnY4)NGb4Sty5Y
zSfLXB2MrhyxE=w#?>b0<jXAZ~0jJh|$dsoLT)DYW7wl9dQ-0jn{Ly~t*__&@Uf>$i
z&&e3-K{l{pu7qDps^55p8l8w8n+zncVo8fo!w*@JrF8Yiv$te}if)&1nlDFor@Ya3
zHGA*1yZT|`QTzQwEq(>kVO=wG3rsew{N3VY<e9JvnD+twjvBc>HHOL<q07O7rqL>v
z&1nx(aFBF&`5M%^e`L>zGQ~qji|>jD%G#caY-oI-w=dHMOCiO1k;N!m7hmGauW#L1
zvQn`SPiJ#7!<WLA<z|x5g-;?{dl?*h>{UO-#*THzhjX9ky=ZIcoodtEml1bMpZ;5%
z&m;B2*>$39wq<@zvKnHI<={WKQ#+0ug*C~Fj%lFKtv%Eh@C_<(bCX=x{{5<R;9KRS
z8s%?C*CMn4HBGu(*A?)p&LeGJIW)=s{hh*v#KW<OFx(u7GAfa`0SHKEFI6)&ZzB=-
zaiK25yxxnDHN6O3If#rimSB6jNFZStF(wS&+PFQgbruLk&H}}&O1pI6qj8sh$$HVk
z@0I2C3I5fNrGj<n@X<3|k(qnFLu*uB+!08nVrTRErNAa`IS>2EmW6wuMI0kYs;;>~
zf_C(AXgVaX(>K}h<d)tdPx+K6L9E7Y0KKo8+rpP3h!Io5j<j0iX?k|A=X9H1RZ?!0
zuQ?W5BBLtzD%Akn;bqTjm=+cp#KQc6hFYu7yT;f<zs#+~h129qGX9uR@6m$f>{?ni
zisPIEw7BYWC(ipUI1swBSoSgZ<9%9ZD_!%2n2US_EIhny@ztflCVq}eTHCsB`s@n4
z^oBz;kJUtux~zF+H&?9i&PYEFyFBUrFLuh5xt8ko9Bq_=8uUKPtDe0Rm~VNa6c$TX
z<dCm#4nJWa7q#Ncta0yHJKWMaTo~gIp}c4IB5sEZ2Wl+vTpF@>e8bXlKN<R-oeZ?X
z7U~`s1Q;%~G$p%8FW*CoYmiIk`}?^!yTZ!cy#ZwsM&Hn%`>A_LkwVZmp~VVL%phcd
zFNr>ul$eEAOc!$}(Q){3OhD^pXrzTjK4R8oynCr<9!``)6j^KJ>??2-b)Cv2J05gQ
zCp$!2x%9A1$0$P|)hzX?T>CB8(_^7PESW7eu~O0PFHg*tP}0Uxp5BKmFVxZY3+%Es
zE0LKIx!@SN?cmshq9X9ERr6bXx8`Z7Tl;`FM6ubx_~u7Zb{)=PkyzzDiWB>??_(Gr
zD^pM|%7Oj-W`4>)x+}w{egpMencUM14Us#1?r;>lt37{dxT*5}1wQ>(0wv**jAYeu
z(z+?ayV!hpoZ=J{0|DF9M9ndOr&JMYi9BYOExq^JZ=av$D$sTK)R=Mdjmc!6wBYRN
zo5J=@=R-PN2ug<`U6>iFg*j(o__B`W3-Zx9@#EtvVBeP8vfYd_BQS;I#y!K;REJ9A
z=y>zL7E`l?f9BWzqOq8`tpMnD8)=TnU$g_bpYlX!f8<Q!RVf}GT0Nnv%hf9omMEn-
zmhhzCy$QL~u>H5%MsIvnQ;2q7$acr)`pg#0=0}|vMCsH~xK6-+!ELdJoqt<Z=>`aW
z7Uc06jV#x|byb0k+VBAXNp!{g;12h>Q<Y;AY`j%v{7U9`4nsOL$JKXbrS)BQoSo$r
zQ<9RRARJI_oc$e&^iCyDAIsibtw{Iww{U)C#>$PvzTpvOB^5<{WIgoQ*`Edl#WtjK
z`P?6tc=?U{{*@gGfUto+06V@C5$*i<^4u40?1!uG?0izO6pEP4xd^`7w|y6v?KGym
z5@H&3#|YgmrlHJKtlD}eFUyLLEq5IiE!ul2mXeMsvu!JsT?geqi=IrT3rS|QVJj?1
ztB(5pT3*$`dJFMNRQH)?86KO_-mTKNY|#1&0@fbW<R>Ve_(HRQ^^jQ_R51s4^N{`w
z@}U5v7*p)lAn|qqk1o(deSr<iDK@;tf6xWD!TmQ{;?gtkA-(z_@}ZeBuyicdeYzSR
zTA!KZDh)RS$AbLc=-9gS35K6Vnd_I3<yNQgbDwz`-VoYNZ8Ue%ss33<0CHk8Af4MZ
zx&XNhAy()*v|l*QVGjwOLy3*<;Dbd&lQ}O+c%UmGk|p~l!)EiQqS%+>EZMmh^db_w
zyevn9XScRL6y+z$SqeATX?11E^BA0XXDMAeTo#oO^Nl3l%VJUwv{-brBI`cxN>I{N
zJx(<Dom8h&g>|F48q0m>6Y9J?6v!!pK?`E#lU7p9zu>#0PMTAk<D_k_VkB#b6L?l1
z`MY{1V}m)T%kJ67t=&AmJu3N(!(P)2neR31u?HjcGQyntqaJFyY-l^PsfDuOOLG;}
zj^o{HM(jR|j!6|qs^PL~88N=HLzi`hW966G-gZ{B-T!vEaj>NWDc{iiL-mRt+T|Io
zD(x5wvhl)|<=E{S-w!WK&X>t7r^Oo)=H7BiKY+He0PZN|<8~j8mc4*m7k}^m^Qb}r
z)B|F7xP0Dd;`ebm?c4NBrn6n&2XIuYrYf!61TpE*C@n3u@TnSdZpq3M70PPD4(}h%
zZ#sh#ycv+4iSAtN6CK>d?|7oU*X8RS_VbYBz1A*G=OG2?+2NT#XKevc?d)Y_m<z<B
z^^zSEeuSkRaNUj_aD_FE_FQ&Hw*JOSWF)3)#c*sS;lrx7vO5KqhFHdlz>rsNHZ0>8
zyPZ<Ip8`*^I)-$Pzkhizi%E=qU;#|hfR^I?A~79*31e>`0{TlB)E}m9+ti<P<<lW4
zH)uS-!SvJO#)_WdeEoWkFiUCShovh*2?GOLy~Q_r9yH#%E)gpbzcbpiNEzW3uU3`N
zar}`GBYvqaWWr+lPvfgDbFF6_#r6BELiI53H2qW#-r6(iaYExf_Nw=F<=sB+tis2x
zT6(tXnrJz*mUULlE$DpweF;d}EY(E&k=e8_63I}pRH(^R5lJYiXaiVdJ%hHsn%EF1
zmuF!MZT*ZhEUo(zUdf}H6QB>$uYFL{xGBYb({1pa5jV5t)S{-gfw1mAA-pY%<R~D4
z2eS*8uwC0GsC6zeu8fYG<^p7|{+!{rhlF!~C{EJd_nXy*UT<TkD%&vi?3G+F6a-xV
zZWHJx<=@sMPb)!QTie|a>C=?4Jh(&JR01yf9h$LDFGQ9j*PYJBHx<8TISx%O2rwAr
zFH;3*a1<xk_VGJ?OM9`+@)@!elppD7uP2@Dp&%nyg0Mvd*VzA9=)%!s33BqgQy$2E
zx$J1ebJuUBe1`J9{JYEt+{fsin0;aIu)z~bmsAc8?Ag~uDZ!{&VNohRbF_FTT`AU1
zh0|vz*~du69#pN6Yu{SUPc$btGAP9qZaJsp9yH?}4TN@`Pwow1IqA=Fc2TOP9F@M4
zm&O8f0Ye!WIxr%!JZ-chjB@TgAyaVEu@WR*94-~6vF<lU*KhhuX-xJ*4=wK~gu%kq
z+R7tYt(H*?QasfdsnUf)O5aj<1+dWL4M?eVOI=fQp71sbDS*5olRakPdt3r@gXVB1
zF=LOIiAHx8{+0!WlE&e%{i?2wI#(M;CcAdHi@7dOhNs+=R(`txH_k9a*SBX=irX~4
zHXO4QZc5&gS!$Cfx{3LF=gs_^Tb44p!Kk(H;|~x$+0mVU7&&^o+wx&{+3^im<yw)u
z)0t`7Yex_RZ(~&o3jHltxZ1biI(C8zNLm_rYr!0UQfCz3(3(?9iSN_+=96l=_$MP7
zZjM7L;dx)yoI*D2wA|;ZSAD`+X5J^!!-Ym_p9F7*ReBu4`?Bo2C4doW+r!|5Xhtng
zrPw6aZkXU^@^{{u;z`*gav|EGjTV30H?u@0OF71Cn0sTg<IWUs$E98h%~C_Xio>F+
zQZwU4&DKlDo55ATlV6zc<dCy6I@~a=r)^74r_~0gfSP}~-+j5C{?gkv#NYoyG_Q+B
zr@eD3Ml_n=rHk6rwMVKR7<ogcsa4cir?$w<o#=WpI`;Jq`?7!}$0FEc{!mC~jv8L*
znoILTg0x>?b^MGQM65-lyT*Hfk9LW$#Q7WRr9lg9RfxDb5TG1RTwH))ThbM*H#_V8
z<?OdmA~2kF{REWRN11Q<84c8LMnTe~Gs}u|+5@BGql;TB&yYN(3_XrzrQ^#1nN)-z
z`~G%OoHaR}qd|H%3-#k8Jj<hf){mVOiJ#njQntvRBdb=4c0dPQld$&SEZ)Qisiq!e
zfZ^oQvlOmKJ5fh@vd?82+bi9DYLqfZWY^pWn(k8lhJv7i^t<wGQR$dAqY;CsOXcA7
zxlRH3CMKP|ufN0DV~g(6vjw^U$~&oMLUSy$tk3J>+8F&u&C+5h$rNf1I`}7umt@in
zy)&Qaa?Ks%y6Wai03=fj>uh>8_keDdwyee{#NfNtYS});*<c>R<Jn@j+I{4zxg+W4
zVE5;4T_|(!w}irGBKHKisVa3mM&HYek4C+L%I6GygGFw;4NqUGL^WiaMy_9%9Os!C
zdtA79rTuVsLGi1){R6t=kDGt*Jd*ddSaDX94TuNk>=5^x&9%ixj{J7ODH;p6gI%Bc
zh#aaZh;MGXWNU^Me)Z%(kK9>ErN2k`;Tvu$n)ai4IeSR(=M<`dB`JVEr{wQXx+lAX
z^7Mdk%c9)L6sc6!AmaJJ(#HXO*(+YXMeM<ID%wN&;F$~>k#Cqk&2jR6V8m4oG2iP~
zdaG+{YRs;S7UxcI6^GJ|Ts!!ob$Bn`obL`bg>hHUH@n=ecU#fUvUT0l(z4=9|5Mnv
zGpZSHf$?5?dTs8NnN-z|FjPhuHJ53FYP`(I1?R>&2!#02orv~ZkY5s-4EZ+{+RDu4
zR7d-}eBlg?wP%-^j#r7kvt1(2GQ9jf5UEHa(k0>_z>>yf=k@a0FW7Z|(d(RVoC1Uh
z7bXD?qkYEjSgn2$doQa!&EP6+#g7<44cZ)q-Z@?nUfX4STPok!<JJrm$Mp~zij0{l
zPEc!2%zNJ)&IBe98K8aA;mQ5tVbZzKF-we6cv2?b7;g=bx?G!NFdg<>?^_>9xwJDK
zau#lChOIhQxIO8XtO~Wp$&`frnJE#Sy-1~B-U<#*OX8kWx09Zl66iQ;nBk+1V$7aI
zg`c4Z=cT>4H02;i#s#J5y=B|QKHstft=g3TX)gL9q<12|GMxj$lIOJ>E^CbQThIk8
zLgprXiCS{pu}rcK=wI}OMh3o9_R5Q8xAHZ9EnHbB^sKlDF>gJ1j0Vjq?X1P4nki12
z?dIK&efIB`GAZ>5Tnd{E>3@OB%)OHnGLVbdK8UzT+{Hpyv&+w}yNuwT@Fy%=LbD^!
zj>2w+lrzXZ)s{|~c>_V$vl+Nz$0Bww3kRC_wU~tDc56`{lK-~}ye0|*=Pr9Q8j5*9
zT%~h8&bND-km8zyV^jh>%}z><lS$V2gv=o0H|_gzY$#PUL6d%*m?8SgM0P@(-_sK1
z@lNH7_W2|vtbF5Nx$x=<C5t7XdF&VD7%GAPC&DsZY)?a#J9tSifW;;z)hhaw#{u`*
z+)mA~Mi<Dun-ZWs{N=_B;Vr>m{*+ms@E=4;@Ww-^PCj2MTJWGDJ2W(M=NJ$dt2=l(
z(!9l7y5{_v+VH;H<g-p6sf_aK25$1|XQEaa!I<NX7%PZM>u&akW~Wzlmv}4ibV>u6
zBagr4LKmn&Wi@jxmTP1uyvIhzZ*QWOFT_PT^9TqM#lcZyPS&6wPOn{?S)X!zlIU@f
z{s6hIRhW$B6SNoR5h6-OG`adQ-#|-0i`bvNfcI@MhpPqn_IBZomMom6@kRzOJFDGh
zUeX7OD9C$JtLH7Wj}wdF7(e0Vw~$QAQ<STo=r5D*giT!sKGD$`Rc$vv;Sum-b!^$~
zKdKF$VxLzfVub+pQxE)E7aY70M_edyf#9b;0XIrLBK#~*OH&bn+p_Gy>GzWgSg+*;
znlywhg5GmLKrHPrgxjpg7)}NUR^yjaiG}SBt=!VIWqMfDj)M517Aa>zz~;fSTT(fW
zPrt~Ez+@ZZR*w$R{KB8=V71o(@sv|JpnbxvjKhx@5yi2oB23c3(h1@i9kDtEnfY2f
z0EcUjX1jd<Hudds;c?gxky&twjt?Lx%kepU35D`S$71tWmc~`MLav`wZpxYwhkMfM
zp)og1SV6<q7xt<pgiEdj2x*6oa9(@kc&!z5V;yK#ftea^nH2EG2cgx@@a8oHNNRB5
zEYeTW#M?PT`X?H7Ep}WPyu$CS17H_#aPn*fC_MNGx&8@+8|$h3N8|}P($Rba^8udW
zBox{DlIuYht+m)fmAKn$P;xow5wid|=)xP#Z{?zk#EFq_yQB*W&k8`bYm80?rnp==
zIhSTp#;^s502im`n+gjW2NTL{@$RK1l|DxHb!XXpoEK5bJyC5x1@omE%dEB{TMd_X
z6Mrc!9SaQ#zw)BY7N0$WbqFyL7>k(1?I5^IaxomfHx30zb703Z?6so^<DAn^S*yP#
zH<jd&p{Qs~K4A#x@LrNuQhBRm=X5|;#IQP}+iDcPHc2cB-Kg;=NQS2Z++RIqi=u5X
z%WW^n#%!Q;@}h#jFmH^NSUdqn=BG7RJMwOtL%4YckbmI^Ls;A+J}Ex4x>=!D=TNxN
zKJiA=72Vtv<15<nYA8pUb?=@%XMq*heCxBw8K0}iIRVIlm1}QtlfIomcahHma&K03
zFu9kC*=yB(z24?#u2ZK@MWy(6b#-Mx-IqQk8s%oMJ*JW=gfyu#*ye0)@nyJ$;{|k%
z{U#^Z>@<ooTF{-(EnLWTG6-RzCBu1-SzTTX^^;*Ht)##!@(Ju-^_cT}+E}iAtpdO?
zMSUnyqZ1)r=tDx>;5x)TStjoC2ubkd+O7E)5^pE>x@`&pdgnoSU!pgyrZ_wJUG&dO
z()hS-<vpt+MX)UysE`+1`2AVo;US5xMM$vg?Dp~TM)zhSN?)Z{1@&7ZPYx?fjs^&0
zHQao;GuqKjs=5+DfjfM}1SL7q#12l~tak2rv|nF01zA~h@DukYZC!l6!!^#Zsn!<N
zroD`(ns30R2j}AsO3t|S_Wvk@v2D2s`bbnnyE#*I<~28|m?B9LqY@t0?LQL$w*0>?
z|4yS#>_${ZA4|2*<wI^&eq-plAl}0SyD9va9-dwnEFC0q09J6M)wWuyUbJAsmsla6
zPH~sY2Q^m}+zpL+XU5%E7Emsu9#xVG;FLFo?oW83MV-M0b&5gAiQ}EI9x9vxuV7<D
zgM~}A>>QW`ulM@NaBv=+r|gBg-agsrzSQI%Y6<KCM->*u-oeu3zs#j(<ULan#5Wwe
zNeA$EXw?MF$@Vo3dE8EJFxX2n_Ny9;jGS*5Z1g?RIFeZOV57H|W4<!OlZ1^GZ5+qi
zat5DPyO?&hBXe?|-~D@q_6)i<@q$JNuZ7;VG&!Q?{1~t9O;8qd2YVm8al4pt@r1>e
z$O{8-vy$ehhJt?y^YUotG9RW2Xp#1#8`2RR_He9)B}E|c9}Q4dhyl2`9=ePMsmjXO
zUI7b>!W%qXKQh<+M$>(HEpw_Y#*}gg6?Idb+lT9rf6z4C-L`><PcwDmuhm<)But!_
z@iFp~$(hp-?YD}NP+@DwnnHI!?B$*EcSv}}EXXrtg*H=YQh2B*L<Ee~K*0Ab@+2nz
z2Czy*1GdC2<D84{;yI)FI-z67E{s2{wFU1iyACPU<`ms~agI*FEvO+W+;wqPAE(_7
zUmCgUS+SdqjZN4H3W3xMSuamnHngR<^zsajuPl#q@j_>=^4V}mzZ~4l?)({a#~vD9
zCb(jP-W5S5QulO*O($NB1}uV)OkVjUqQ`RmypjE4?-Q;&fNyBgb7o;Mh)Q3J!>6)~
z0uHMq6y(Cf!IoD5Cl~2v4*vB7d!SxHGU8qs*a13hxjFWPUUbB8#Hd-%>||DUJ|C(b
z*z+HU>oMwLrKjU-rPahI!A7aIFI(Gy;Z`zQ>}H}~Xc)RLsiN<W@Xg?FW;d#`iWk@o
z)@1<IQ0#$oLG)F#fNzjQbfcb2E$#beq-F}^<X+uGP3kqH2;U2SYnw-p$&R;kYVnzI
zuHY*xAq{!ZZUGWYj|{)wW;!n>y)3KY0<hGj)`@#k?5Z%_j@FBp;GbPQBqi-jNtwfl
zp&~G{44zocVk5&0(>n+ezr<l_CX#yhLlJ~e%V`s^RAt5iQ)SRbDuseY`*Al=KCCov
z4DA~<2YszvOxg>qznQBz>k?ol^$54toUMDWx8iXus$f-y%M`W@YWm5&ngYdT(0frd
z?DTFsxEJwVump7Ljf~u=h!19Qz6orb8U{nisazfmUydKjDStgzbe#P9bc<lvgb%Pj
zh(@D0?qqh{!3A)A-HRvEwnT0n$)D}O&wsoaK(+!fRR>Wq?p(&D(DC*Ly*<PQI}}?q
zHCV5{SUUupwQ<%u=+~t^uM1hEI*-jH39up~NBQz>DNNmO<KeD)_QlUz%z?r%-npNM
z0~^h1tpk%4<OZpWkE1N81fdcG{H3o_jgq#jJ+}wtn_%x0*n>*b_22u$3(M0ikN+vW
z7t*OZ>MD&~n1?>f;+nQmiWVB@k{VHbXE*Tto|a@oO&S7Rv)a7dr<wBSgh`ka7Aa$h
z@lNF*siHysnpRc=;Bmr4NQV&`S7>c2JE8f`g-42LX4fYss}AZ%DJ|y@;&1HqL4Egp
zIjFynV_@hC5kLVTx4a{7Yid*_;PwY<9!x0*Do@p;YI|h4=}V%`b3zuw{-#EhD?~nz
zk(0bU!M<{Ismy&*p^={MNC$#=&1d1&;c!w0hXH|u=3{HPmMI2`!l^?!ZFj&}cbNS_
z(ApG#Jwa0~>sZ+{$Z8@)aPqg0&=d!ef%_v*_{Tr-K5?8MLc|42L<P)l!r*TzJN@Dy
zZ@|TXW_=c8yN`4T<3Jt?IZ896Ac3|SY=1p?tlCT_P*zYzt*q_Pl$xbWm><F`l;K;`
zJ_BJP+f!f;4Y_To5?0Xd#Zz}AcjO_OmLU{RqoLs4<f(rCnF#iy6Kc`{{kkvPVhknH
zfhnLc;am=??Xq;vl_vDt>|lc%Zw4V)!nZ6z>czbd@N}BfZOwP`FYI#|30`b7ghMwo
zpJicpsY&ZBGwQdYpv=(XC{CL2Hic%zoUH_rzGzY6R8~(O07;RRy>yI;q*;?u+~b))
z^=K<0X!(G^)~{<y=259*zhviA>4`s8&O3!b&Y%}kWR~1}xe`j{WgWn<^NzGuZAT^y
zxLVJ8amUMHkxxZOJ9?ucDR`lWeML;FU%Wb=&<0tGBl+_UDalSp`ajo)&1Bd?7BdzQ
zf10Dq;Va+62S=^kof~XTcFdggY)c!Suw6jL&8n?@4~3y#yg4t)am~AR3p07c8kFIe
zMSY0sexB4;_yYBxcBCmv!S-v})v8L610UbA0^ji!?vr?+3`~GXqRS0NOPce8D(<?1
z8BZju>Y~pPlU4xuyx{mAs^}v`L=%GIQ{Gu#>RfSc6e5Pb=CPqc#J%}Fd_~+94rQXG
zoJKghj0B_QL;(0*9i-mW9DJO({KdNeKw0{aBM);+DJ30pPg+(!yB^60yA68@yAVO1
zg5?q+>G(Kqj?cP*(Oq|LC(}I2`E^c|LI+_UPab!Wyg5Didiz8E**x&(I#$ZtSD<y^
zJW7l9nydRmTru{d?2kX;lHI;3u);zZ8dQO)zbZZXl<3mHd?i>RHK?N=0-={VxFJL^
zGch#%RPCna;05~TNC_rND;G*La3$BM#;{#`55iz0M1U>?_n4Vhl)3=Bpf>3eG7z{m
z$DV2MGRfg?sU_QFC|Qm@hL-A3nk)rewB58*Fk_@~lYySRIR|kCNtz#YimCx@K!SG^
zX<|+2fMONO)7VZl*^JoM8b|}lBG4j;@(*cEx=^SCMP7GsKZ`gW?vwj`ta~}(3rxld
z;W%H;D`z3qC!=eg)grcq)lL;meu3ubM-LP5cS>I1JCt{4l;a?8Dro?BC~8){2+$Lr
zg&O)9lre8O+Wi?c$bAH<2<{&ab!^J*2t-wuU;{SD_hi6*Bhg@3nnreUIYpneY?qVx
zM2ekmTq(Lz5fnYQ>$SEoX&0LL7Bw4V785g-VPf_{@_z|YG+}q*)5S<>NhkD~{;U`D
z)H_iD@M=5cSP-w=%Xz<1dLt`$Xt4FYyR(eVYNj8h+y>#6E3=tzS^7*33TVk+K+z^?
zXs*>V7fS$-HX&@d@wHPI^eg8a7zHGg=edP1Try7)0e<ij8-N;PW+0;1W>0F%t(9kK
z*t-BErsu7o4rdXTLR`bZX~z*C&~aBoB*o7in9{vD@};ehH2x)CRjQZDz(<?mgpuhy
zmy%*oliB3(ZhqZGLq9}}!{ip+sN0E>2sjOs`;DdDB>V6{iwR3zN$*~i;jKHzk9FL{
zK3{XM4jj#fulAWo9J{EEo*+^`-Pl|k7YGHFQQ9k^N(vfvr=ZS@AIh<0I}V7zI+QN4
zr&0?=JOL?AmLso`KMtqy2D7tSVEAJIYDXqmMvbyBcd^$Y$CU6Gc@8M6oYKmrybR(P
zJiAitIV^A(bmiHJ>4p+I7hkQLBlr?MUZM^$OOrkDk@=0^Qcg+z?&P~544U2d{$l6w
zuu1g}nC~U2B9hi+&L_ZU?H?awlLC&CI>feBlY~y-Ak^)wy%Lg>%qIJ*RZ!^I)zpyv
zd$N3~*i_A_`m<c28q*Kk%A+*-Eqh+adF28TwPt7+`^p4+z58OByM~muxY+UI$8}3?
z0Fis#-h}yAutkOGWxcIAL*_qRm3}$o7<eab25Q^SzXA4U<kQP~Ao+cC_wL<<Fo)~c
zVL`SyShbU!5?CQ^_=U6m)kN=KROV)Ra7T=@>U@zID7pnM%l5g=vjd|*c`#6FcS#3b
zQse}<h?<%YsAH=I!g^*xjA1|IEkqFHJiaNKryrR)gzwY{U08FKVMq48Mn-NhWqBwi
z;Ye2rzne8Ee>cr({oc>$B4(7VF0T*vM`j~f)XK1OvPb1D1~vS!xH|^+s~r|8^(}M4
zqNo!Pd^*T00V_Ow%QCTb?O;u%g5-Bt`9=R?yNis$mTfPUCQzeg+U)}C{kpTqFz?if
zCd0PCvBW{J%x9sfpfmFYDNb}b(#wT@J0M#XtOuA^cztG+D=L8piy%ZsJrwL3YNzRy
zP^#wz0u*ZI@?A_d7CKFUL{LIM&lcNR2QdALE0Z!S>N$yDCy*QN)G-;Ro!tpMS>b?=
z)ovKw#kB*F*C_MBFjIf&E9|2!Rx0gutJW)`2`!H6y+r?C7H8fN&e3>w4Gmfx*|YGa
zbLq8GH=aRnd)7V!!z%DX9*==LTCDk2yHp{wT9@Gz^_IBWF1T^^{9{8WbKjTk;(Kuf
zgeVc_a)(6L(>^GCPP&LH=fP4a8v&jhuj~q{CR)ts<9=D@6LpbU0D6o;X$iS@`D%o6
z83Z3h{!*uk>yY}O(Q>cR)&<w^6-Hz4w-$L)H(ja&bM)w-(E6xl@4zo;ZVxK|YQ&fs
zAZXP%?@l^5tgs?uuO7Q<ooGrgB-hGcfh7AOuv4A7)5d{U*MNZuAy3<$$4%Wt$STYG
zj7Ceypc%MKlxQmWs$TcF<D7&n+29@aMdOAmt_W?wzBHhK4`Xo_7!x1Mj{{3)IS9TK
z|B#5&GV0`X0$p>lSu|U53}F`#Cb@XRZa0ZlLfzr?>WByIVRVL_`-V}o_PTR{D`0}I
zdjnUqv%rEewX~E&`isCJ@^kWy=PT+hc3EC+^m#61J743`vz^w=6E-Ff{g$gffHLI_
z1%fYoD>LwRR8T7rGaFlSYf9}S)RWl)teh<QiK9zv-hxIb)FUTl>QUJyp`UP5pm7>n
zQeO=1{5{{gAP$zwz#J}~<{1h?9Y-<Yi(j}rmxvA}LV$TL1@Rk&p>7fcx*@nm1%E|x
z0YFXn>Z4Q8uII2;3?4u&>4xolhS$y#$qmHOT}*ZSt<p&7SeF}x0oQ#ok`M?eqolc9
zr+j2Uw<XD;2hP=i9z39+U4oixRZde$Fy~IoP)}kow<bA2!2)N>c2ZOKk_`)B|BzHS
z8xotIXJ3&3uMO(kcRtC0)BS>qhWI#EXgV1ccs00gWFAJ~nMlsk4+r*TQQeipm7#?$
z#k{wZcb(Zw`ilYVwNY+&b1o)3zR|{9YuIyt8```U94xEss^VYtdxR03u!SqJiA3&~
z@*}D|1BBNtZ?42zuV5jqjO9#*8Wm_#k_#t{SX7APlSLa^LQMG=Ewllrg=SvbEO@ss
z^Y^VLMER1DKcc@F7V`pnY&2M*!xb97`JnQPrF(ISXhlun^sq*Wtf_@tMQB9%^y^X}
zz3v$(i`H$|97(5%9A3`I!5oR~T1>M(aUUC?EcpI{__gUB0GaR&mgZttM@-t-1Bpd<
z{CQI(x=2hRTGJt<9;sWh{S-mb=7SRt%y%6Ok+^awNf2XJY`ujtLlMNL`LGmm0O6ET
zw6554oFoHyA_EM72&4IVxHa;)oJobcx+|Q!Olj>xWxH2j4Ve6hVW>@+_t~9jO1`Fe
z_8<f55YJVD5pKH=J7EJhMsJmCh;r&r*jnM&0<I9*64u4;PW{u?a<$b`A#E*L;?{E5
zH=r9>@|tlgWQ=I*RnaJG=wO6?0?#~1W8jcA2A5}e_cobd9=idUZFmiW>e{|n;J3^C
zN;W~aws@h}?quG>vpL+C{n;fLfaK(l&PI5nDunmz%?ay*!ZJF3eK2&QiG;t~Penq*
zkdYhET?~qeE>nn6dg443@I0d`@i|o)D@TnY3|q^BnP|8rP*g*8#ddW&A%-SeJ63$x
z)n8VY<7ct&CUS*PbM19lQ*k~;4<88Ef6Hj`cyC&{TTw8UnxK5kIwBf&A73w!Lc_D{
z5O>qYcQNay?V=nw3Jlv<d(+p~V1a_f#6m^LQfXc#br8qNalXVG{&cp@o`PU14$%-d
zCo94_&}NvgZxbz8qvRJ~NfZL>FEmS8J>GdkzY&`^%;mPMI@$wqMd?C(QqsqghC-kl
zL4W$y9SU89(^FJ3L5EP53yzKC^K0AJgn~<hshJ2bp8rXu!xUP0zkcRyxRd;5@J}JE
z*`;S!MURsvCSVw$Rb#)Z(C5a&cA25tP{mmqqVtXg<%AVX?OHos6bHfKQ0B1y_2HBm
zD#l}r4>IgNooS#l-ByWrYCAz1PlObC=E>xv&mu6+AABX$K(3L0auPRaD-1I~Uq(w|
z^-;S|!_uE<)0|ziP9*6_@ub@6C=%Hu2=g@$fpKB*Q>Gqq-Dr0U;UJ|*)5yk_(P}Rv
zg%o!bi-`_;ysA2^=|NxUcwF5*SfqP)C0<&e2=NcHd}Nw{w-zJWa0xC|{x1o^nEsj9
z=MPg6oEXq|WeZUfx7AOFguDZtxB@z9!F@;juR40_>8*rh*Q`rHKqo;)zVR?>KMx+3
zwY*u~5fFi?w)FKRE*A~Vl38H;y5Y!Bf`MW)HXmFyEvv)L+@xWjgzeczT%!SxqR0oI
zG-K5&krw@bqMvV20WH80ogU)p$Ndh)Qg7d>fe={e{=`b6z>`o>$u~-EO<ok=V3w0f
zQ>%>|Yrp1Wh|_McZ>cdc7vsYWx@=zc9O}GQ2+HUD{m<hSp9f<!8Mm~e&U#bhH)x)+
zt0gMg^(~6@I5|h`U)Ca*Vo1}T#P&noDx7Ie{Ijh2CPaF0a~y5{$&g(XEs#fDn~H2M
zZ2r~*82$Ap>%y+eyu5eKP_Igpl@^V9`uPEKMcq1_=9Ak*tr&1hRv5+Kh3(OR${l?&
zjimE~xekq-h)U+OlwN!O>XDI;Fw|@s5J99hdEMuNR!M7&ZOEr#ucuoiKbo|+pM;TA
zw&pxUuOb0l9A2&|-*S+SZeP2@`1<xF9*JG#)QtWwzI)3jBwrDeO4~m|NF5U2LXr~h
zIIdTX)Ah1%aOhQ{9^27ye4GMz1L=JAre@;zw}V)3#4(fT++gYv00zNGvG%Vm9_eke
z_bB?R*w3DOthpmMSvuplZgE!KKS>&@=ra}X9vwkG6})Et(S1z`yxVW6!uGt=9D`gZ
zTo9c7ERR}_^-<HnFGOxdlQ0P&FOsn_d%UL2`o0z?3!8_K{sN6bBtt8_a1CgEDs7c%
z2O#;6;R>iErpl9$-w_>?wmw=LSX|qHsWr>EzLq4nO(Q=6bDn>s1*asi2`$UE09mzn
z_Mtj&%!dMSge#);_h12BUzrDiBE&s}U@vHK)90DBEoT5=<WX|M;kEy-iiU61f)^)e
zy6oi=`J=mJ!v^MCXHTEdAWklaTy9^Jj^N$84}+(2-V7>4VBsCuC}9CKfQ+*sDy7uB
z>qV?MP}91PN>|&B*ED7gD|FfF7&`nOXfXV3wO8~4jGSl%dG~4a2X>&b`MRcVMZ4}D
zAU7(r>wc`MFuXF!T4*b2E3V7@DM{uakYlPFiJB&!!bAUDX8T6#m$#EQrukZ;O&<+f
zkgwrJuFmR)mPNf>GjByM0vK|ARpEz=nzGIInmekAYa#2mYD0C~lSxcBA4j`?!}-D1
zyAjZO8GWy2)iWa<EVT6y+2h?;c7IW8p}SUn?h6jZT~nunMKV$W;Y?hFq6lilG||IZ
z@1eiNHEPS$GQ^E`Chd$cvdxgcwZA3W1YHKC2|JO9ZA#PEHw$T`lwUjyqB?;tPV2Nw
z&|7~}9r;iom{6?H7hSu0?i@xc@lHM%o8|jwkI{AwM&X)PmHqncD`8q9JpB^C$b$pO
zD=z_g<+Ho!JM)Sh*<P5ofcqFDEOwBQXF!+0=kNxeu*ybuQgm%u1|;EC1+B-Ze~|<3
z*w$6A>!qcEeG~7&P&E1oe_*bAr5t)J068k^u~QS3y7NUSOR>n9djf{D4fOSJ5jLJ>
zEsmK2R6C~H>cOTpy+V=(j%(BY5efI&GrELpFYf;a_}7>hT<p~RH8|q=oWjX+BJ?o<
zd@ku%Jm+|G;VGYt$i~9q&r4jOUEQ5cOIGE9b3@3XS=J1<U*vHp6!kPk;hI8Nm>etB
z>WFE0CxeIww=iwzG^|6#4c=uo%{I(KzhA2H3Eiw~C00V_#79P`z^Pui9L2k~qXlGP
zLvPG@YDvOst)6m<a?YAF&6$xqpKCK1@-U;`R@n&lHCO%9IbZH%I-5|50}DG@sq9d4
zby&}s485Qx0%mi^n6PeOe=S0-PK%7ZeV3WYSBa3YGjGoJrjCt<JSDy%NH(fLkEbWD
zTlc}&W-A!jQkF?0(V*W>Hr%-W<xmu|WxV=Mk~i!K;t#Ukn}VrwwSs6h4Wp<Ev`&+-
z_pzJyHxrI01%>Ut`7N#XyQVcH2UZNBvOSu~n#P8{8pkDYr940g`nv%J@go#p!>y1i
zIBRmDv{NuXhHEPK;(6UvK1o?5ufCMIzxx4kE7ScUfQgoi6V`qCy0KhrBF=00B8|)}
zzUZgYmaGir`EY5e682U15*axzu=JAg*dxEJFh>m;PK&}&GWEPV@zuB(3XSVnuSz*7
z-qdTK(&;q~NLH_A2a;0ixyDrpD(&C0468?0eiMaZJ}nZI@qL5^HWzKLxCo~sjoA$y
z4xAy{Xw$6eYqqw?7!Kn0z5)Wzuj5L+Ap6<=fG0b8QpAo;6#5I->v?l7;ed>!n#QPy
zocQS)8XN%VV-Bmw*qK<6i09BM1)w_6+h^mAzo`8Pee!dUqmlEf`)%%#e=ot=fw<&L
zzo}AXmj=g{t4-B6>R=whM3stjh}}jKM^YPgG4?LXyM7!!TDxiH)w!<iivtXQD5m_1
zK6jGkxSdoBCw%9%QQT6hM-?^i#Z(SHy{zu+heD*Wzadw9FU(D_Sl@0G5`1tf&8>e0
zwr#+%F~m_AncP&H&a8{vnn+4_9OQu%cBxpsmb*<x`B6<hF8uJk8`B@CabR`9D#(G1
zLS;hXr=4aF>!9rY?AMGO<y2bH1<%rX$5~zkx(Q{XHAZmP1>{-F%vL6V3{^$oi>SqP
z&E`${!RZ?x@eEwwu7CXjMB<f9=h#3xF)3RU;li$bg3yoL%<k*(OtMbn?6tt)FEWJ`
z2T)~T#>XEpfb1hakOMyGtl-ruUO}Amy4yDp2_IpaQ2I;JY;9dYvXnRgxL;Z=XG}$|
z*0Fzl;72>hn&Dp4>1*Th*)@k6`p5o=B`#EiC<SbZq>hV!Xs*vW-~z}hpmi+fm;LtB
z1967CKpbkHG)aq*|64>bhJW;K=Gqg=kqc4f>d^FKFZ>uH`jD(Y)#-P_#mOW~H*f%C
zXV^l6S@W3!&|-xwj3xi;0NChN8#1?umOO;#s@mXSHSk}^Es-f8%?gES?Hy#3>-uzU
zXzSxx-XD>Ge@u?PF!k`3MRI-yOXJDaIUY)Zb+|d(5&ExRmpTLtNjogP4uENocma^U
zAiJJ+k+rv%fw6GDc8Zr&=Kb5Nq4JguQCDw=y8|RdaE5fMm6_T%iY3;^1{tNz>;L)N
z4^jueLIyIYOzW~Znk?+*2K|bxo-v|h0Kcfog~{jVifXN864#b~eINlE#uMEohnLMr
z!eW8(uQNCx5s=z>SHsJ{y&t|b5LpCZ*1Gg76@*vh>cnVCXOo64seyv{&|9)rpa^IB
z3NA9NO68~hL;4M@8)c4s^XeuFr3WcIYFRC5!86`LXt!pg|7i>yHJcy`&b?)+NK%pS
zeo>LD9BC#b^ZmDXBh`&mFHy7Kl2xEEt%4h+&p)kukaK=*7jVdOK*xfxwxSGaQ~kq3
zWSJ;}`1F7YVHG;mau`m6q`mL@0Tw{~qVETC{sJ*sUkO+(GF*u_Q|w$6(MiPJ03=S<
zsfH&cA;MZDp$tIa3+sOr0r7BS>HkPbR%>6CV-n*<Oj4$<)QgE9-^f7i#8(0~uX$iU
zy?#|aWT<dJXX1@j{l>FtO&sO>eC5{X{Y(1k@6UkWM7WX{Cy%}qJ_ajXen`M|ev00m
zWFCm`$w%RJMXm{UeRhBS0a`zRu}^tT%|D`}wF&hJ!>sE836w)Ri?v<zsDI3HZ9KXh
z93w5{r%$2LyamwOfex4KwOYr(DOe5ZHlcIB__e?6Ps&^;QY}XizFQfWL-d@{TOytz
zmGV*aFBpxV&X(~`nEaz6+r#ic#X}rlbc>Z7Dpn_mgFAffSZ^uWQU7(uYj2mmxyi$z
zB6oHS_0=IfmPlmuTJGkSEI-QT)LC8x>hgbiKm--I`Uh+DVfW&8Qc>mvnZ0c1Uj4N3
z2Jn@(Tvu=3`EOrWmByh`Ib~jH6iI7vlY?<O4@N5f`1G2O1VR``Zm?wqFA<ggcj3ct
zRP|)-n_5JwkjT!H(^>l7UxU@5-*loRl<StHbxpm#xz>IVP=*+8FVQ+3dipo}w(T|q
z6C5Lv&Ogb0?VGDxS%Z$&G3j<UElhRuMGk26D-vc~O?9A8-T}Cx#39K+>3<wO@fm<!
zG{8rQL4pZKMz308zd^KtZ+*l0fLe3f2Xpz$YuA3G$ieYd_qNgvZ}8hLa3o|yf7Hu>
z*`I7_Ipl|R{akN6{+ES>x2lohwD~DurMKM$ghrGX=J-!u)n*-tD(^cq<*yHE?bYiu
zvY@2QYrJKR7D?&|$LE$FmdiKS-^K?XD^@(7Z2e5Fe{JoDB~Dsg6Kn@x0NrWoq3v9L
z0Qr;#_|Lk@`3~9Zk6O<*!i&~_`O^<RTjRbBd4i;H9dvONy0I$ZN7`B>TYo>W{+WMH
zX#D)R{3Eo_o6G{s42@EzVaCR^6dIPS9tL(h)}N7tlD(O6Kk2)_3S{F!qVw<0ja{59
zxAsThyw9Z?-^lE5;$D@j%l~8Wy(rVr<d&=V<5%nNA^iX(-ldx_wI0Kr00GwYlLyLT
z!aMKw{_qqAQ1f=#d!-+z=3jQonz)I>fnKuUs24l_S&o05&+16ZPz0oGdGcS!`m-EY
zr-9oGDsb-s*PmbhZ(Di&GZIHY>ss6V6gB+o_Fw-F<rm1&^c@;J^}m??`T%OIVRU|v
zp8X|w{O9?v&5i@e`-BzFB6{}!`GY@=1m_1CiW?zq9{=GxWaQ#t0uc4m|6=y*pIO6N
z{v{**Kfm|?>ieuq?8grgJuo^}E>RL5@_#u*SrqyBJ(T{Rhx3<*v7(q)EQjjfHON0a
z?w`}5|M0<|7V-acN2zGVs>x4j!-fsCcb8T&`R#1Vk5E1(M)iLel$`8<Zosvlr1h6o
z`ujI1#>h`LN#>mTPX}c`haI1y$Ui*n-{0&&_Ix<B?Z53qI$8qb0ha$XvfNuW)5>H2
zNmWEpQW|(ar1>vew#Yzsz=_M@KWTGS3Xf#D_v^0XPkQHH-~9Oqhh6?7$^WD!4#9Fp
zUj9!C_Bs<Sq2oR4kMz&~ebZ3VlRd|%rLV>2>x%7v`r#EdrNQ`@?f*$Zc-^YWJoM>*
wdg|ZC+P29f*}>-Cf7+b?|FQXh>DU;LKesa}@e#cW>TJVVIpx#ICyj6aA6luM1poj5

literal 0
HcmV?d00001

diff --git a/docs/static/qat_eval.png b/docs/static/qat_eval.png
new file mode 100644
index 0000000000000000000000000000000000000000..18e7e22e51ba5fc42231efb915de0fdc871b22d9
GIT binary patch
literal 224659
zcmeFZcQjn@8a9j&2?<gVT_Pd6s8L4<qDAkWXrq_Gs6j#!LG<2x7u{$P5uyiUbP_GP
z=ykl$B)^<<*7v>VkF53m^R0EPHD>JDd-m+-Zr6R?*Y;ZZsmxUZN&+k_tgEt59;;$u
z5kRr9aH20=1Y3w+@2O#7U6HqzlvI|Ll%!X7cCfIvHOInw@;XKfUq4EQs>S`8#3hnf
z&)=5E(cfWs{+2{@l<JYX#C7_&w{8Typ<>o7x4+h^@|8u>NkjY%VKp@8{)Pc{{{3q0
z5WOP~+<`%d)8_8Y4fN5B%ehzTQj<G1)-Ff0dSVC^=N;3Rxb}-Dm5fYz<xfPPU&`MK
zz98Q$&av=VCisGO&`C=i3Wb%q#wmQi8ZC%63W-&|OOEyYv1BqwG~qTq`WjZF27S!J
z1@UN!X>ZMD_1CCJ#SDQ&68c%65?Ce+KP|I(I}I?3#S;Ex!0KG_Zf3iI6)M(QNr0Q6
z988pj_w;&(HqLvxPhxO5&kGXHfYFQNANZE#eB6$;gcAIQ6zIOr@9@Z!v&6Pa5Rr7}
z)Sn8TTMD7wzjSL{DKoiR<QdC$SCfLLXCf<^!bGl^=%=2n=d+ui#<9}tv>#fPed=M8
zdJ@n@TYaswp3Cz2<)3%q_S6oq!b!I;e5B`p@lZ07ibCv}TJ&uq)$tFf8KmF64MjeA
zlAvDA`#VYUcbM~-2BVr{Z_hag9p-tDr4!4Y^}k8R4U?lA>bw3kX!k+K$Ku1guL?-;
zZ@#+0aC_wWL)Fw9<owT~bmQAYscRybO=I3`i?iL34LH*{)`kbM-FNG3=1>x&7IqVn
z?+Ky)7`I*dT~fXNBkkqGKy;gSxmd)DD6V3LNF^e=Fsb_lm(<(CqNE~UJR}WYmEAcr
z({OPTwzl7WC%VDebyaiQf~2FH@O#h_*?e1X!C;4c_R-g$ERdgFw!T(XU3A`bm+<vT
zu(ZXoZG_^nEBx!SY75BGYN5E;V(<JF=y8Z7d$!(Yw_dw!J12hokmk;{ci}xdbkwB&
zIGui!?JR;nFXcgL#6J(jtKP#G33^EU!e9T;=t2Hnil6k?L;~I(($W4jA^mX6*+e7k
z+{-uq?4u+74Y5!6gS4J~4Q7As{|U?V(t}r4Ayl(sb>y@}dJydtC;p8G)E(qrAI&6~
zzF~i3$p~?DLDW6r@9MrZfVUSIv>k<p`8u-ZFTXjNn^vY_nNyg=dN|ABNJF$isO9#O
z&ArpXTvI!%>YS`qOUtS=?EB+K%x3p}Zzg@^;alU?mr;+dM+-q%jD}>kdub>rn#2x@
z)(B1L_{XoGkO{v^X?<$ERIXWkxxCy=n`b19M&)}1&4HC;$JH`2;U7vw!xT-H&H6g#
zj0;cqo{B!D(=a>A96RbtiV&6*l40!Y>9Ta1rIP&gT^2WNPP^}EUn$o88AxHrL{WU}
z0l`Px^N;LDSFtwDE?l?(@%bhZj$J-OBX*t0@0;!D7BchVhp{%Cm&M}k-@1aZ(x_cM
z4wf&N857wWi}ZcC>VXX*xg_!E<}3U!#+18agc~jt@py~=?diDD{u;)j`M7$mZps(-
zpI=D7TorI**3ywyA6Ki@uFeb5>N0?D7)X36;2jC&NAcZjH$Gi|FOz(Y|9c?roo`Rr
zBHw1;PI!f@LcjCw-V=(7iv^EsZdZ5u&T~2A2nM^}5r{Z>LcGniP1~*vQ^)6%C>i*9
zpK2l9#7abnwD+-P=1Z#w2%Hk}qOVg{44ycm;f7KT14~wri(GtfUniIn-J+T^RnaDh
z_5V_ir_HPxreStfo3ODj?mb5_xmWNFr;B|bX=aItT5mXFi`_7K&e_5Gld|y|<fYN)
z%{iY#OPo;SC*@2Y*F9c*d7<!;P2zG!a(R^FD@V#{`KcGE$9E!Rs~8b&UJnxD6_e%l
zpH3=F%8NW*yDN5gKkCU{pGeU!NjIgwM{UdA%MQ(+$~McE&$b`btDqcvv8F(DC-2?8
z`8&>n^<m!8-mgzzocd?VzR&hh&AczsMcpOWMI=YKfRmH7?O!NWo$IMKS1>l*K1=|;
zu*bVcv=@_@n3#|ltot@m+b%-)<+xaNCG-F}U0_o*QQ(49Lz1qr4!al7X|)uf-$-Za
zd_A>duJRry&}Co0yH2}aa#6BPB{1*yuy(#m&ewb=**UxviP~(JA45N0?m8boI>z%X
zW0V?_iz@np(ofgPfoty|ELzAUZ2~l-HB(2NON2^Xbd{=Q$2G_O$0gQH*Vo6Hs_D47
zf&>G*Nw{LU+_;|dAYiYAMubFCY*V;XM1^RCd=TRZ4#aCjC9KFb{D<3v2f3tC9X;ly
z&uEPe&6?@Vc!PMPc`e4`gC4|vZv0ABw3Np*$cmgOa@W{w5|f80LuCA_eWTC@7bZXS
z(SJ6MZ6ymFy4Yj}`|KG?`j(x>%Xp1la(JMRYs9hin_HV(n=gY|mN7%YSLv)M>88&L
zW{^4CIoM~JP%njBjAD$YQ8301h1B=1I@FpRMFFrkNK2>{rD-A8l*PEoacj>wTWfKr
zZP}QCOQGO|NSk*GJPDrm^0m~9c99Uz5WU!&@-^nM3m3b2VjYT$OCpP7b@_Bet4Asq
zb;xy5dNc1c#tz4OstRiAP35c1Cl*KTYnrTr$Lq(<$27(a%4OE4*4p=z)`dH+eTKh{
zdRs*6KJ{qIe@=N;dDC$wV)@pF_WbDlp=o3LVf4?Ujx>t%u`ftwly&gX`sMK(5==K0
ztrE8KDpM*y)OQ_qJs$s*{+f`9U&(vfbn}k$*mvi)m~WKd5X05Idr?UZNj)X4B^^^A
zMSFdsPGB`e!ii1EJ|ls%-!|V5WFhBL@{%l@m$3UGjns|KjVq0*Pb*UICRUjZN;>d3
zG#~J9a?r&pCH5bP88qiMd(S{;@O>A3C0bH^l^)h4+xFS_5&ALtC7j<r7tmMQ@ZR`|
z#YX=yoj099S(xi~Iro;~I~`>UWglgua+|Hm*}2;<-j%;Y-bTTtMX<|aQRFMMLXchc
zcu#G8ZS&DU#|B3o4|!b5Yn1Q#zdy}3&%Rs1Oz`+;=7{uEXiZou#hKcb2aH0wEQ?NS
zFGk_-Ex+G#8k$@AZrE|sQTDba#W*VciIsddQ!e8OW3w#56Wyp`KKSYUQB*$@)!mS&
zB(*2ZubG9_j`MJz>OgXYk$ly6_r}#%3o7$clPtK{-Nz%Acb89>@rN#1%UZ*%>5f!R
zp}u}XoIYxvY0p_l={-1hZ<OBHf7K{u^H_<yk!R$YNbhc+e$rUfLXt)*l6CP7YddG9
zWJRq-%a_+(V=+AMlA;>~!jt1--L*5>zeFS_nuwU~zkOQJRP}hAZ^&iwIKiiaYwW4u
zoirAQK9oP*@j3xjyTF?hJTW{CJO|5reL@fQY-*mlolrLjb}x!BUtu{l;Skf}s<lg9
zZfxJ#=wIrYsln2D*PL#barE)~%c+n6awJ<WN1x8AO@!Ll#LSl1yX@A?{49p*r&~$0
z4lDA!a?kFe;yl@>j@i*AhZAAuH{$H{_v_WQkL458bl_th3jqr)-U8nm-fUjfd{+EJ
zd%4EBo8>#pmqME&A1zezS6#Kb#c$)UszX<`SLIM=)xO8aE(;tBdIHJ<_xW8lUTE<;
zRE^d_=Q_HIyNWc>8eRev_PRC8y%ygV<@HW$cy0N{b!+y{4!&<X*b+{UXxnKRG^f-x
z8K2D2ycX^|{eaGJ%WLhcNJ(>(b%P;4jU*Ss%1TOjiuH8DM_5<9-10V>>zIs{TmmKA
zYMOeQ%uhauwKrRy4DA~Ulend?)1Mf(g~vkdg+4u0AAiN$XT4_A1zmwYwcik-_N*&u
zFIpH-3WKae`Rq!BGQFNHsH}Ybo^_#vAbgK5j&@Tt0{-1(Vz*|3i7BnonPpMEW4V0D
z(vRr)Xr7`k!OXI$zb17@#Ql(bpHp#Zs!yP%p@!}lxrdUZv8M?opXB5<+N~QM6fD^J
zac@SRi349BeMGR?byO6gC0uq-zrjg#&l7d^TWFqui$imxhU046x|I7RcezdIG<%Ds
zN7=E!#LT{1J&dNF&avg}(PZERF&=RmBocBwYH%9AUw8WYOVoH?pOT(efG3Ao(suDl
z{q9llbmUC6@67JU#rAN&!?Ul`0`+AlIcp0a(z=b7TgLa|x{d74zMdTzE;XUIa(7G6
z6N&C??v~R`O@7-ZBQk>>Z<K1%bj5;wnt9#{aM3Sx9|or3+)}2s<HkC4A;+qEhIMOe
z@<~dj5FHWOV^}WD<5`FalES&X4toHrW!cR08>$zEwZD$_fna4w4f|CtHpwRT!0Q__
zD_c7DTayKBk3IMg#rD-a4TTN`q+pC^U7KG;l?xHizn-;Vb*%&()hF+RJ_GBGxwfo@
zq9PUxczp>A7n>3b54^$#4>4@2f4!E*zK?a`*LEB%tYB*_+<*3Y3Z5}P@4y3d%<tz5
zkwIAa;IHf8;gOE>XKw;%`h`EQaiYO{SdY{sWo5y$nwhh?xxI^(gR5u5B`dJuvf~pS
z7c4BYdzc5dtm@q@@cAffb!}H|MFk-<2RjavXAY+393FO#n9soy@el$p?aW<G=soOg
z?OlXCMDP6CLkPUaZ05W}|7#al8__%3ipuno4$kKE{2W{yTzA9>=;`T2oS#_;sXmte
z=Wy_s=p8FpS4SaEPIq^A4tE|72WLyp2ZDlvoLt<T+}!M74|W&0y{m}_yS)p;?+^L&
zIgia<%$%(qU9BDL=`o*cV(I{M6}@u@bE1F!{QjQi9@hUplfBD7mjy166Y~z|0}d|E
ze|<JMR0OkCNZH!M+*aqYwH;V9a1JqkelC$;`~Sb*`S%(B<4Em)AIZ(n&;Or?{>NMY
z&qFm_%$+42?7%r)#r|!te-8f7H~%?MgcEb=|FIOm*ZJ30u+U-zBAov+niv6t|EC;a
zM{4WGO6uSlcp2sgTMqoX|N9xd#&+g=%jP$Pg(Z$9`}mQ%2lm<&{^{`J>5iW&{Xqu(
z)2$rZD(_jpGxM*Fu8t|cH<sF5Gu<Th(z+?d%>P*BYbE`gJEo6t8{GE;-pqdy5UG5o
zR>RaVcGk0s$DG6sXA(Y_-JVFGpcbIGj&q6rIo99&67R*cpjWP3%(W%K#w8KQ`ioy%
zxR-|KCI0FV%+A-Z(<}4b*5(iStM3VRCdvQ8_jeZu4!V0+Jl#T~+?MPwF6`GO(JM#U
z{LO0oI_Sxh=i<FDjK|pi#srvk5Km`B{q1_tzk7$}pLn^oLgz0HC;nVqvGi}(L!ACL
zHV)s70Q1VfbusWI^)LMGLE;iPxKKviZi{Pw>tHy1^%wunk;Sq6UjScLxD?xa=WiVh
z7wUZVFGCIs=kjHe`~(uVB&ol3Fc5H*f4d(43%LKAP5*xpaQ+BfDEe?N++utF%VnDD
zfA25bc#Fv{Pls|9lTH(u6_EFoU0TledEBR9S_Huz9Df@n*k&B{^Vf%pw91B=LAazO
z)BI()h>wGy&SmdI|K*v}%|UqDCaCrL|NRNsN%O}V+#PrvXFpVhj?w*PVy?>naG5FD
zcz?$4d^p_qVuxbEX3XDSH5Lv#$nO?}$<K(c{bkl&VE_mEOpdYs?bm(|k}kVrq~PPf
zEDibL;J`g6%d)@B*8@1fvNa!M7fJpyU#E+K14lYin*P?Zga8kW;V>mgKK{ET>VFIl
z)S+|VfAg31_J2nFuM7P@BmP$iQ1!n^{BJ4ff06iq117(={V$#VH>bhI{a;P|Z(u<D
z|I3;vu88M*_zi#Oc(p8P%rb4N`2A-}fFt?&rhF?MY*&U078l}-`2EiI;>MmuDPD(6
zI?a7fcwqK9KE-`n@TX5s^#y~#e$j(u9h;Kso=ABPoe}#Yo!VlW_gw#c{ph>mQx$h}
z0|;{rTG-+fgnYC^R)3(3{P@~}i3Pej8j5wSb7HOwN9xY=z3+K%f^i7{T++_LnKZVA
zYHQA0L|3qJp?BWpY_rM3OTK(DVYtfrZlnp`hBM4%1|S7Vl;Z6_@fAwX1s%Q*AfWh8
zpYUcpXUplJ_s@3n#iFuiZl1n}Svsy?rJDRg*lXf-%wsfq!h|<|T&21_GoRt?FEHah
z<hnkN6rLG>6Ts)tw5M6wLF=X7{FO}Gr7N0w@n|Vc;Oyi;AY5eo)q%m7X$X7IK!)TE
zK~EnhI-gyYp)w-~kLRux&rT0d5(It75CK-^D>3AB;0h&gC##F0$2Yv4r8K|9h7Cmb
zT4leORHbq+LQ0_T_agD#NVnJF>FTk4g)m>pV_82oUl3IE?S+<RUB1B>-$Ca$S!78>
z#owclDl(Srhdx>yR#Q^EJBOU-i@5S$1uPl8Bu?1et(dGmIhQ`cJRRSoh1Kel!u_P2
z7Kl!ljRw=pm}{M{u*@A6m{{Z&bYi!4k0?xfrOBS0OgBcbLlXpW_-qQk)ck?#{z8|%
z_s1+3GebDG19}-16V)|2H1(aNDuKD;=fWY=Y~>$t%uBjIhTcvmqbI$)q*U3<pLDc8
z;n0+>cz&u$hYDR7Qi9l}dT+~e(yO&R*~`<t2wizuVaP^ID>8b8g8P%z3_7}9Trq|Z
z%C`gDj;~*2N8v}jtGAPXBC>eZ-HaN8py}b*E3sdw1h#4O^<v%K28)ei<0_9i4EkWZ
z;N#&X7GitDYKEd`X9qLH=3-yOd!4r_yKeDdJcx{3nL_Mf(gmex5_pxLi$VHr{sg*c
z%qbR)e#TseOujK9MbC;8-4v5nz!qZ()@Z@<1s|1c`t-qK=(C7thM@0Jjk9C;<5`yp
z^9Q}Zy(CZU=4_eFA3HKur5`OUDut5iJiE37RwS`@+Ozv~yPLDMy>S_jTz^2{sh!lK
ztZDzvX>vj+YdRS(>CIaToK3rtIv|t+EA`xTv4fHvn&GW;W#;J?aU2GX#-HnGEZCKI
z+R2T0sT>-eCcn)u%HTmYEA8#u-u}WJcR9qTxShT$tUX7VFXu4>FIg5WI*(k?ms$Dw
zNc7Q7IoXTQ*eH|)e4Ym^UOFjWGy2%3a_b`@YJC8u@1nT#naW|<?i{)HP~Ok4A{qtl
zyS#em9VvF#bXUK6Y*!_Sw{4z}iJ^CuH@$YGE1qz30&1q9yXFtn_s7LE^jhZ|D$%R$
zB-gbmejl`qEQ%YmZ&>eX-04f|Za4BfGyfb$vs$g{+$XpcZ)_8wt88F3<Jfl9q97->
ztEA(J86jKK?x4l@Pp>l+nol+wEEZz4h<Y866e|{uN@-$-@>x(jlljhw+i!rwfRj~A
zPk9wd(Zi<lIjm2aZTu63$Y`Pvq-ym2H13lo&F5&Z^V{$_6^zqRjbmdh4~WNW>Glbi
zY#0UPrYd%aV%^Rvc9W5QUz|%BkPli;x8*lGEDxr=%8pKV`X%w-JxjL`gkLp(O946|
z@eo4q?JrCg3Ffh{)ek3T&=zDy-cFnN^D9SE{f{i-O)hSZ&F7{0QtHa2Ez6Y2spUQ8
zI~G2faA<-1k>4Dk^DfO?(A2fQ=io)zuiN!2gYns*u#cqDuY*OF8_q3>`kls3-<Df2
zTpq?mAKUfb5WRwX|H@&Po+-?J3#M}$ud>d{FKhHmbU)ie3EPWXd}VMp@)ewFaPQZf
zvG2e7$$4@kF~mL)k5V$-eRDcvr>;+EHQJSi_w%*vG{OV_mbr_(!IP8Xy^pzF*4}pn
z?JqQ^KY3<kZ8y9wA?B*UA_?Bg)XBG)%A~UV)vfwh;DIPp92sU+t}R~M%{6E#W{X=c
z(O8D@+E3PX3guGeCulFS_S%?In6_aSD+qUz?nQ9dI;p01YyEZ?E6qViN`%aI4^RJ#
zk*_;1B>H7R=9o|RJzfr*uu+~y*ptZ5i&b#({B}OJWUuX4;?<ZCB(x|H=~gvlg)kJ4
z<>Tzt2{@>S=q`nj@l7Q{F8}GIJ0m~X)lONUkNW*QTi6bky!`RVxB@R;<xUZTZTE8s
zp?_qBCmOg<Ar%t1?>UUsFD7>9udeN{Pb~FX-hpGoZk&M%M<q~KmYq@%<4?%hI8gV9
z%#i$GB~_QbkF9Dz;$F#2A>rQI*pR-@9ugjG)J?{BMzt~1(sCfW)8DNdl8A1!nQRi|
zgI<$l*FRKK2OIkN40{o+b`L@^Ev9k`7OZ>aw4$6J*1g-Onz+}!8&+5$s^JnoSZW~5
z<9mA8NW(OiX~75Iv#glhO!S+wpz6pR>$~3(DBk!XUnQ$Y*QO*!&ls3nfU|KcAi+8}
z!FeZup)Ketk0<)NLXHTNihGNv=25S}j7QPx7)r~?hjdb%G1q4AfGISvSJiN6%b4!c
zu-@~E+HIbH>g6v-Bh2=3nC>L2?xFHetR8-*_owF<|A@0v2yeS8z}o@>X*zW{W`MP<
zG4jBe*TMhJ4QL-aKP!xYJ*PCp&}UDhayEc4NX$%{8)wG%q(sNA8Y$u;>UjGe)7GZn
z`9v}(J8<DAEXpoF1~M$V*=u_yw3s>Rw>7OkT&}$rGC&xiio*xHk1U>ee)Ac|rk&Yf
zwG>ioD!3J=D%eU3$)8sG>cA|hJT9!3Hk88Gt5Ms|@gO#*!&s7M8~AC6LYB$i-X0*p
zIgY4J)nKU?-HpeT>>oM48S0AZxiv*}DVue3VbdJDk~?&Mr|$<g4gqc;u@VA-mn)n@
zO@eck`CYr$PSA@h&)$glVqJ>**D7QYcppr;TYyvYgCm{phuEVa8P6*RB&00zWBT;$
z>+e+!OH<iBo8)-i!&cdI{rD|KHTkG@UP{k%><c|BMP(bJlci_0qnV@+=ic)4fNEyP
z)MTRSpLk3JTOPdUVAM;JUq7rWPf>gFzHyF)Pq{J?w&T``iz)r$QaHoxtft+Qa>MLH
zqUP2koI|1&t_QhZ1J@X&=hv&gUf??_RfHI5E7Tfa@z*5Tf^6R3J9<{_pXfYgTiM&Q
z^{p+`w-F7HMGX#L$1C86^SJlDTyBDbAs&FE(<q?yF3Tc`QMuA0+V;|)P<o;{n;uBS
zy^_csAFF3C_zNrPSf=nDs^|<s_ayw)Fj>;7DN0FfOy98;FXN~uzvKfSO5ZF@?AXd7
z3xKW>eyELg^OFOJNG1HXa^*I?l1=BYxl+0_sMs+R=H`kkvCC-%ysL4`bOxSYJ>%W<
z%{D`2SJ`s)xPrusE@4oSE#N4pzlBlod@io&Vv!<lBJ)o~Py64@FL<tq8E_4-faFl(
zoGbVgcZKy`wb#xuG^W`dhfluNR2G90F_)8Wj{}u*c}c3trIxF3dEpxXpbwfn_Xv8+
zo&^Qq?wQ_;Urcc~#2}0We!Fp8h$%uEXQedTWvQ>;e*N-r@iklj-t410DdN3buhXS^
z%P+fNz(W;ozFzJ<gO)Rp3B!FrBp*|o2zm7m{=SIIzb}IIvdH0VpapOp0eQCfkMlc1
z9|r5<LYqNt!Bn+<w~W$$B%Tn)*{v`&R#R|@nh9qQAloLmPfpi_uz%tL{5|h)00`0t
zxqlmxaL?}ggg});b?3oyURvTyGTr;TI`?=!htqB1y+H4wj53f8jX$Mbeq;m(E%Ib}
z`YVYYeJTc+a&fh+rO)oIcrUe-DFd(!lQNGt<>lckNnH5g{7>WoV$dDj8zY8wAJ^HG
z0XJK9kN&bL$jTXbSgP1URvvHPdJCt7k?UC}$xfNyS-0!*V7tD@x0m;5eA#jMs<RXY
zriQ&3J!gClzGhm;ZnM3>!s)#uJ~qK-8967O{vNNw*<pJ0&9}*G`4s#nM1QVnKpAJo
zdnfduXcq&Cqs#245DC~9F1}dQ;xXIl6%YV@gTB=b8X;G%ESYcs13po#Y(IHaT&)1@
ztx^_{Bd||#`b^P#g{Mb(#2%?y&;tPr-ndtIb(k%7rZEKxmv9T4ySZD!7y=6Mo+j$(
zXCALnw$}Ch0+)wF3Oq4BibvrO>>D)~k+^yQMol`69mz&xyG@h`DYU82XvE+lHe@f+
zze@(0sLR&IfQYQ9NClKW5$h6Nqzl19`n8p~m)ofPG}49*yJo6y=F0CI8DVsmSJ${g
zSI0Jr22FIyViv>qfEWJ6g_7p$bVZP|^cR)PXf*h$qX`!Tpz!lX(^XB~mfg)Zh@q_?
z+B|TseWV0tcy_Wh7HAasQ}cTIS}0_qy({~WFBC;+czrYU`+h=B<8gR~O82yB>T%=O
znXiW_fpf?a4a#rRA|498T#D%yJjqgF*#87`qV8;}*T#dBwMwP=2N=MVD-%u|k)|QE
zGjoov6<kVoxud0pmFHVh>N;Upn*drOZfC(>b@yc%YNy9Pc3K1R$*&%&W38|h6<^mC
zfPN09^R==E-OtWO!zLwcuD}m+wi^ZTkWLS1c`Rxs?1d{qzDQE!AIn~wrK2%w@jZL%
zn{eL6S{5%b?a_wm9u4_#D(r%3h8KHE^YKd2ukH(UJPkT7y?nhwtHoxZ?|N7{A1N<w
zE-0{xfx9Q0EiEeYxvf<{GD9d~QgjLi4Q{;)w-3kqA?Is&8!L(M<K?`j)6$x8C<b41
zHXnYR^gUSzm&sje))9uOH*D4#c&99WpmB>ma9A6CFD>xaZlY$dCPVX9&8R6M5Aeg7
zs-{^9;K3>Gea8oz4z4~w+B0Zl^X1v_sJqL(4mK8xEBm-D(|p{fSH?F%bGNgIG|h|_
zS4_EK&`r>s`p_v;g}xUQI_sNNMXOI|@>E;MTSb`64He7H`Bsm^IlpkvuGh}+yH7d=
zQ}9^4)%tvT&~nbVK3>gJREj9Ho@s7!w;wU|vfKG^f%ujW{_gCZ_>IP$r<;^l`iP%`
zFFs;;lyOu$=`3$Z*wAVoIFy&_33ZJ9%9mHc%u+x-V;p!jQ*3+jp7qMiGBD$JA1#?M
z>g5=%?NkwXg^sa5-rLgfUjB)mPN~+lm$V+owO=0MT)IgP8q3N11<vIOtFfvjT4&q^
zo?+*5*3rl2WUHhLlUdq3&W0C7Pq*4EChMHskO6Hi=VzOX?<9#{8{`f*jvR~irDZ_N
zEUQbiPl{EeHuNl$?D)%`@|%2o5m2<=u-QBv{^X4Cp7pmG;yIA9^>JkJ370!I!o`mB
z>yH+bnk+?*ovKm=nVY~LhJ@+o0KL84_zB9D?+_T)Yzi7~;Wzv4Wv>K}%M|$eogTfP
zlSOf^`>t`x!>i$oV}UWoqbr~a9BGOF>Q9g?0?uP6ZN!jx;4(8_klX`b&)QmmOgwc^
zb<;j#+no&32Qn*oN}H7A0J&FA*f%7kih6m@?LX|M(DW+PvNe(&)>wf#7_MpaoY$WO
zB!EQr4-gpmfMZXeHm51XaNdMIUghgQ0tJwwo^zpf{aB<HBGAd?Cdl5fR?)o}yBA(3
zz=ww#LSXs`znD%Z0jw`$P8~Ef2e+Zq`;%nsJGmuOZ&*uzC?xVSJL{nnbQcqCN}Yt<
zH`eM}qPr(z_uMX=CzsTWvuyG-&<VRbtR(}#8);c?bUJvMId_qkbTViv)^D`dVWx4t
zjyNsF{{p^{*V_AF%!IFTz1}|u-hIp@{q|NwZLuF+%v(CxunM|YCai(8jz*yTp=)2}
zz5r;bABKzWYtOrVw?MSmyK*3Y-08R)&+cgph?-bSvdLPie2Utm!o`Nxv<#8@lIF!4
z_?UT|U?S0C2Sl`k+U4QKg%^`TIdAXUZCqps-u6ZrxW`2D<t4(Z1GBrZ?DXvI(_Qng
zI9{-n?6B#NI5CweTD&LVDB=chNTrzuEnhusYIZUbrItV*Gx=e8)UM9IOQq;8lyWkI
z>dDGkN_mHoRo#FDp&&k;cex9wqQV=*7pY^~(S93k)w7EU(pdgD02|FYMIKHJvcTjE
zKtrN{NX;^XW*?i!u8_t|XLagZ1MqqUY1RihKeeViMxTQUNh9zfH~WMT$u~)dJQ_*m
z*R?mafzgroJSi!)Jiw2--5{~YwvO_lSpGC6bAo~ea_>~6L`zLSjmOYVHwVtrTfE=T
zp_lH)P#*$Jo{V8TzVZk*C|;csS9EYeY!ZpdRCR+s0~XPskm;LG6LWIVkyc-|66cnt
z(^b@4NwdAyD#!KsgVTL4X0JVgve?bK@6B4F+WRXGW9g3qlSL0Ed3MoH4kYbE()x1Z
z3|DS?`4u3#KssBh3vK^I<7?$xvau&Yg+8Z{MQT(X@ox6cg_Th(73n?rx9Ugy0%2Xt
zaF<t|6&*dI#L$Cy51O(E!0UsX$<Gc7W~KZF16vK7Jf#*nIh2R&m<Qm?IdRE^9CaUb
zKuu>rv6JO5*F0PPacI|kQyD%e%OvOtFQ8(X(l&r0HNtQv*0?EIl<Zey(2|{@toeg>
z)m#qna|9(yvG}B0ZPVO%t1{mj&lJ%T*}dKdah`@R34)86Zpnwi+AJXl#8aB(jb_90
z+_f*II_%&a{QWNh_NPXlt+XcxWK5DhOxYXJ<J?a3gP+&YI<F>^$qD75cS^`#0oDU7
zJ;B%I;R3ZEi`o-fsZSwit{v+e`2)F4{b-O)1zTrLXu<<jCdsbR)S6S|0m`6nP@Xfz
zeG)x4;4$u>=qX+fII5dHYFyzPWr87|R{q(&)#1<p_97jD*WBVAS=rC8)Z$G~3MP1M
z)Hen5^4}V;b82(a6NB;2_}QzIN#|fvm+{#5nw9w&12l}(HQh|#<R$6${<oQ#(uR$d
z7#V&e^d8>^8an2rN8&UY%e+(btwwb@pPDH5uHxB=Dn&^}w;!8*H)Ghu;Om`FH<TV)
zCOZYq)%YeI)ccL)JC(>tVEGS%R$E#RiJ-QvM&zgu6&vNM^jm*AHfKPw?g})Id)+))
zXWKJ>XJ81+3nUV{ukNP|cmHxP&f~yID2-nu3I*MmTSEu7=^FJTlu+SpSu2W(c_(a5
z*~5gANx+i?I@X<TSB3eCyY3;igg2WGQVn<o6h7Xmb&>{Pr2r2~!Ir&bZ@($tC&yZH
zlcmj8Fkf8pY^z>b88N}2)Y&+)*9JwS@4En;SQ(8Pc<o|&|6IiDRiud_E1~kf=03;E
z3IQ~Y*4D}JEAve?CD8?H#}C+eGt2etmO>!q+S!VJ9AP?@Y+{9Z1rc0-k!#~qMn3td
zWR<0Loyo_6cG9Rw;YR)#i)G^6KSN!A1%mtqX}^UT$c9^4%IE{;^sg<P!nEYx6iCFg
z$qKYW!<3QChKvBGlPvK~ixk*M<K864ECV@8@l9_74PxqtG{>r&(*~X)`+IN`39&ut
ztA%r^lrR-yXQYsszRfFw$852sjoV$yVtW#79L!ilv`QH!8G!ocAA?QVzoV&LJ*=C8
z?|_CxuVXz-v^LB@tE~=;ui;S&T|*=7n<ChSrc1j_O|D^x<snak5w_@Pfs_jk#8;;{
zKBfSSB2txz6G1Gp^`X)HY&C}>zd+pZ?0B%nk0w}GSe?X1zdPNYd?I6xpzq1}<VIPd
zakm^wvG7WHhwF%r<wD=<Qmq&U6<JjAgpY;&7(=)SH}ru+>IBTwmJs3OAFKOyz4X&-
zXuH~@e$Oopxj{l#uh0UdL9JfZ08}>V*gc>8j2}W-SUluDnzk#d5u$}&APBvYzl<`Y
z_WuYnXqHdpeSEzVd*(5aq^yTsDC>R4^7r28PG*fdSPlC;0z`%z9FO|g??(n*q|}tl
z=z>iQ%6Stw*jd}%vZWhOAKtDI%b6y;IZ3GiaEJ5s_JnO^=$u>SEqyj;1Q}Tbl?5Zt
zCElFpD~2iu9x+w<1$4{OcHNLoK*7KDvA2vH3V(IR{QB6W+RqO#xE9Q1=pBm=_`dPI
zTX(n&o>vGUP(ml};tPiAnQMH8W>hNtt#FVoFV0Yn?X1&*m_tadUPmvid(_%bC4)rI
z)A=sx>9(Pguxw^&WcTTL_}%~NQr)zA%fv*rfUx)!ChKq9dS<QbZw|HNh#yupaXbQy
z1X9&h{a^;9rv|rm%5g3A*@#}VEoq4o2Wh;mu?4<H!01YzY|*9ZTByjw(BcJva^R_;
zGQ#tesuue`V^q&sJ#3nfu=Lw%#ZL*Q^}N5ClMP98A||hLSTO2laV&}tj@9apM%zs|
zRUeY?MJlb{FUTSDt5sbQyTif!kabivW<TqByAtG#*S=agBpOPw2RPx^28K(D*bV!)
zPTP1d@SUA#*rX$ZPOSkx>vQgACr?m<<<Q0ra@C%c@{X#mY9Z_+&7b??trCA8fip(~
zGPY*&=x7OYu4AQQ2|~Y*eHC&*aL5+@ROIKU0ng*<i-9R~H5ns8>u4g#=~icZB=6p)
zGOB9ZekUuV6qUaV0Qp0w5;WjfoeZ~L;&APjX;V;D`z+obD8zVEzxUvRG3zk<y(H-~
z?h?<Z<?TDtMMnIlO_^i|_xGtN8-vwSZgVKBm82BOVCl6eJK%x<X`E7@FV}>#ABb_p
zCuEmdPBpCJ8;^X3sMpUcAp}swhilxP)5<?`viuA}wQR0U(hdPIIf+w!g-rF#?89^H
zX`Twuf-q`@jcxZp)Hf+~#a8eeSEgFiBJ=4+RyM=86I{=@<>7m20--x=x9@-C#Tf!L
z2&-S5Y1!>AL)L4w{Lrx?+I`pc8TT2Vr@+_*BR9rt9X5Y-&>TlpPT%-J^ES1lgD*cr
z=rasuK>pcr>8?*%UJ9d%)@53S!Gp!tv+6Eh|HR*9#Bb`MGy4MuA9~HDFCIt9oga2U
zOb?3eu>zI>rE;0wNDgpPbDKmHVj`i0!|GbiXpa8%?M(ppx#a7Yv%<xMqHC$_>uw*w
zhdY7!)yq!~j8`4ps8%kvEq;MSD`lv!%a;JuC%sXtoSqvX64T+cKbEIF(%7G=%ZNk}
ze4u_{`grXak${95vkSTYP~J5+nrtHyeH<<~-ZIrp!*VG{Ta`q6xLQ3NWVsY6Jn_|A
z)1Ir~Cb{K@fHRoylvHS&Y?+e_WUmgD8&O1D@c@-#rxDYAoPP`YOuB1xVIssQ?z?W5
zvU~E&NLt3Dz?5}Z>82yIY)SVxEVHXCTk#AYo!1)@1lqx}^SOb;`lZyQ+C~Gd643}y
zWVitjWKzr9)vB4VC&#~hY_7YP%r?wPRc-j~JV?Vi+!VzL3fzk9@wfOA1}jnIPPbyr
zVs+w4T~(>&REtdYK&d9*8N{OzV0-5<gbe3yTkZWBC|hPthX~+P?EQ5w5+3DjfOG2W
zSe)~Zej^fIdxw%Lh(*qjh*AxnHJ;;tv>qmo*_1m+TTNB1#_4pi_S3q)d`EH#RIsN!
zUsU0-IgJ(>Ye+8{J<dx+{bDC;jX^r6GxU2`Zjl$)e}BUoG$KD|$XSAr8$Vd|J+Po<
zQm#zs=jaIfr(sASuLDe_sRQ-!8*No<z+}9gDhs$4_+_Rrxv7<zPnoB%y{b;Uw~jng
z1zrJHCyDNjqA7fdFttV>EfJUG#ln2g&kh2LR<zvRAa2^ls~b=wsABTN2USYz4a(_@
zQ|>eCB`yGvlZw#7x~WN(^VV5Elq(|+zlZE>=d5OH4|YqeF4C>E!qo`_pg#v%CILmM
zZcAR@UtJ7>D32x|zEY64xP3$5I+CCd5Cf$39+Zn{8W{sBmRdR4nBpW?igcq7$7PqB
zhB@|AYG-Dq05S5zL<W{su~Jw>X5at_n*Q#%?K-fX)L;{IwtXe!C?TuCT>dC%1oNS|
z{8SRTT$=ax>nzRJXG@Rg&W}+o1SOv>0hJ{V=%!mtCC=qztFe)a2;T%vQ6|>CZs}sJ
z!xobmP<Zy_;S{{i^G_@zq{zM?Zww=j0C+VKP#Gy7Y#jGYZz-(+#6euuCU6Gx&oc|D
zkTNhUDvQ(7DQqw~Nie(=msI%vzPk}yI2O(r`4bjxtDg7=^%Xs_)|7?S3!BX+rO)cB
zR)S;DXYcVNEzY=E;R|DdO+vTskdURXrC3D9Y%A3F${ALw?l<p`+eGZWz!bUDmzR4~
z%5%?CzZmu367g`H9<-iZ&C$@3J((6Eu6WG^l!@P?x-<S6)QIoneK*Yi!AM^!)uc-e
zQzsYS|14=>hp(pVp9qRnCC_Sc<>Hh=!RoGrfx8hH2Ew~n9})@9zni`NA~#MKS}@?b
zvY)O!?sG6Dxk_qdT{a%4OORW&)Bzdp)zw#Ze@@VO)vcCBA6?!?6f(IFCW}Vp-7a=A
zEsVQMOoe<SvuNIRhnGVw%^)<RN~O-1DE(&r@lQi;QfrmFIG%yR0W&j_+jcjw+bNpu
z&5y2vJEq0p>W$l}SJ)4le~=<KxQSpKW+~I{dn>;}Al3Q;nv$iBSk6t7m_P|?$fv$k
zRWE91IXNw%mn!k=dC)Px?|!mgE5rW%t{v39u;Q~}i`!^{8q<l>S~(z7Gxjjb$<c))
zK*|yjD%V~)$<`p^_nK0z0PXxx{?fAo-?3MF1m^<9kzO|&eBZ}Cg3^r6$Ytw73K%sK
zF>rRUF16(KN`(ppt(s!n`R;ZfV3d-J9AccyY-?BPG|j%v5Mc-gN*q}{!U7Eiua;#x
zvXcmBWzmvjlN>)kTVDX8E$)?xc$I76OX7Y6oWYPng=#8ut<D!4&93S9W*yQaH-_!J
zm}NsP4_C?EL=Fw<L%o`+R#>cOlH#0c6HO>^_>#V{IbZoh2UOt@T&apVo88)KBUW0g
za|dnC=$UkNX@q8aF3}+vUb@6;n_lMhbLn{y?6O)?OXm8DV0hA@<&2;-i#X2EbNSsP
zX8%N}Ik!hC!gX2I(GS@?tm-b)>H|e6r(3jMIXe&b^tgdcOhK6Vg2^(0{hgIX@4OT@
zXSpMC7+WH_cR6k2w-hi0>Virw0W#0Mv*g+ZzO2%3`D8XjT*Rrnaslk?{453nU%1l&
z4VPgffl9@>kfrNd-QnEDoc9pJL#4c>S!q}yW+_J<Uz4G})(|G9+#TtrbG`+drci@T
zpu&JHCOL>Xh{7I}F4sk87fdaI=@PZj#h8Wm!34`x3f)b*^Fx{U$U`uXHwCP?bX&Fx
zk!o$Sg^~5I>L0rj7phxUK2rhRP$6i#qMFiO^DL9D^kxHH)e$pqF>hJSbVm+M^d$TU
z%;*mg2YaY{fpZvQ4l%e_rnTacLzZKowgBoyJ#Hic*&uO!pm|cROem!WzcJ-r8%W-x
zfwGmp2{DbJt2U&$a_yh&EeFq?1lHDJ_L}k9Z0hv<h?#|<KR)jHD*Qg*QyLU_XZbvM
zS)8=Ny>+i0>Ss~mKtwvv6yGNKTifVwOPCJ}$$!(bSg`Opd(a}uj;vwEq%G*BTarb3
zt{WOGjNn{HIOnZs0rRe#mH>f(;cD>>q1dK_X<^qZtrRh0YsGgDF+q!*F2@fy7&?|p
zH5`^Q@Pp=*X}^Ica6$DJdel}^`F#L1%xGlZDoa-XQqN*}f;JB(qM__^C}4+9gRh<e
zL-v|+-Ls>eOv`1xT2t&c1-O+MR)WW22#!4;4=}jRyw#PMr}-veLW|x!Lwo=XF1f10
zYQAPj29Np_;VCwxWrYc`xCx#-Qq6Tc!4PX45Pl<qQcWF$`%<u>#)VitGToQ`V1=Ip
zn%g5eySr7hOi!*k@z|VlFS!`WX+EC6N3c+m=oMWT_XvIbB7oOMMWBfBm*Jd5SL*@_
z27EQ}eSwT7uqax@pg`)2u<;{Mf?52l0$+k=H8R@utUR$LMko~wdvv}OwUmCS43;bP
z9I>_lLl0|90oH{C=cJfMi=4F*er2_#$Nh8bGvva<UbH7~8wNz<44Nl1&YR-5XO(18
z8iUOO2XuNo;h;P0v5YhOW33*-eBsGDIj{GcltqGvNG&5#w-)Fad;B2L@Rf}jNQwO`
zB+kV55KdaJE4a|(_RJ2i{WXeZ0A{)cF{7+qx#oI&YDaOaGcbS<M4nQC>~2r&bFzQc
z&JTz~I(-bgo@nCmZGtK2z<X&tD5D*%xo(+wZ+_z_92tuZh&P$e2_qtRAP-Urc^s2l
z=WNjOJX8+s-cUJe8q&UK4HOG1MS?4ulZ#%vKfXqEM+;Tzs;zg>J%sM$n7l7FzsWUg
zWH^T*=?io$1#w9(UHTOB=-6JR_KNWlqm2qt?$Mp5@#h6lql-sBwxx>-Fnqul-80oX
zr<rBxd@Xes8mXo$1S9yaEm}W<IpE|*5wGQTbeG-PLstb?-tBFd0~S03p~1eQ6{Guj
zAqoyM<tdKNWil35MyLv;cy}|rR||}>isxf2iT78GUx{l!uW(P4)$HO~;Ae&R%8luT
zi1&g<o^RW?t687~)ns@`wfV3*zX(i@X<^j855vWKEkuf_Z~Q}+@`j4*yVrU~RE$H5
z?l~ue@e6Dbq>Ij^tFW=6{=kB3IDEmxbQ^#y<p|T&e9!q)(*UL+WAJ#wTKKLqkH^KG
zJkndF$ij5Qqc|64>nRwj*F}r9q*~#aG($AaZM4bjpu+8|t$(6ylFT=L)pU!JuII8*
zjDjnX6NXwUZ8{bS?O!D+s;_9uz99$-x4Fk%=)JeJ3<Ll~=B+dBZ*cfo6|1?C=rn+t
zpQs6v$pQ7xrINg0zq`03`3eA=!0oHq@Q1u34DCLsS91ntMi-U*v*Lq70??++#MS)h
zxJQM=G#<15u^ELXIq;I*hS<-0)cBcnTcf3OXRt0(E&Z<vB5>zPkes!kDz0s8Kq{oj
z{BFTGLwAIj_3Xrq^Ube-0I+in*-GMHj%B{d8&w=_*=47>ofuP53#OeQ&G`J#sop43
zhbR{=HKoR3AGGL>V4|S5V_;1Z6r{5&F5dqXq<3(CP_=n0zL!1!q^ir$MlN2GbYwJo
z*nvEjR)0fqSM~WbX6C{LdDxylbOp#3Dgm@v+AcQ!xLz~C;cn*IPO3F8R@otuZqZn(
zoAXs($Yy~~8t+BBoi!Nme3=Leu&_yR8@JADTxU%KXv;yT!Ky~QH@i2>k?OWG&ueaD
zfU)`l2sv&cKA+Cu15MM;&knlqOy-B1fZM)or`P)R2Gi3XJthC2#~Y((EVo+2Ccfbi
zvd!ir75#+3fWf7E3N#?-a5+k)kLu>#9|<{=yW@J#B?#GXcC|pFT1)#iKKp?*gO<7_
zgXPZ+7&0<^`Alks9VyRhY&B%_6#@cOrf-6@D3i^e{OTm2Fn~Nx)#ze@SO&Q{GWSnB
z)W4H0Gi;K8aqFalGWb%H^-w2=3{Rjd7{o*sj?NV_xlCW}<rz9JlWd)q9yvomM3fN)
zU3!6c-zzWSS&oRBePtx7IJ&9&(lGTyN8|aXVK546A}mfl@C2g+V4Adjc02U><zZX2
zOV71`?q(4GjCWJr>Vj@S+fu4m>7tA~;Ilh6HU}h$Lnn<yarkCDSJ^G26#2h&7vWq<
z0|LHAk?Z*h9V)Khv!kAN@l>PqCu;1vp`yyIT5bkc!7O0Eb3{AD;=YA{sKE3?hm&!c
zrM?ui*s#>8-$B7V!lTTy%smTKa93j<pl!w>(_n&Hp-X=Z#&(UHFZ`$|Az<{k9gj~;
zo7~W+rEP+@6b?bZTDxdKY+^fjp%EjG(Nij6h`TY6R%M+g=HuKk2ibS&7e!e>c-3th
z(dI}#Q82nL1j0m$&A4ZR@rxn5&<nYRJ`^`^mP(y*hk8C8S&18|S6L-R>dUBb1`fYW
zE}1)Ay$D@C1*~=jHR)9#70Q{Z<}F>4AaU};-!&VEV2~lx<=d~6V>cD(#0T~m#?c`l
zldJe`4=0R0RDaonB<RvSrcK-F{L`kDNTuhtFtMKdECW)$k+7H+SmRfq^mA4xx&uMS
zqG&BO#h>i-`U89IWF&d^_p(#WV)H?|%)$g2-TZ)*CS=kG(8PepsmvmG_6?bC@{+kI
z2d38Wt~-{PX=R@RPjB=Ri&?d?mc6p$R$SnC7-FnQ14whKC64s%>leDly(@o}h?jbx
zMDTWD(QHODt2NGk8M8=YcWpZArVGUgQTo7%DcWxe0z9}+XjcganqXuTc+&x~%(%%D
z18eocyivbr-}v+M<PrfrJ711Tq4*G}PYc^i5TY1l>pX;vy{Ocn`?APY`*3Sql6XcS
z{yUa?g7}Y!*d|03{)vbdmn<Y}bS;R9{J2Mm1C4${^l>1Kk?s5TWWd@DDyfcm{5y?p
zbuxrMrqq>3)~Z{w3TQx8Hhi^dv2hb6=~-JPWKqBJS6Kiie_`6@HPVkH{@$2sPOHPx
z4}^nkzr#b=&367Qn$kyE?!=ID`B$Sn)ST0M4)IUy^$Qb}_(!DCS@+!VA!hI!5p!Nr
zJB?VB$rHbQ5((HJ@)jV5)S5>RUKwr#wL;=Zcz@K4VJ9a67y5Z{-Y2~@YNFPGt^&#D
zI3FRi$gbD*LbrC;2to;F(nIn()!F95O+Jn%$Eo>6KUCFzTV+8Pl&Y#Otn;5?bdc#W
z_)>}_N`H$|J;Wp@m)y|fwzC(I9Ut&#d?0J^fvJhWx1Twn!31g+Pidl`SAA8+$Y(F+
z;0R>21U;peT=si8)`b-q9cS0VS3hb*5D;cb$PmXP+&5Eedl0Los|xX48PRPf6u2b!
z?*Ic`iI)D4P<i&!MyEv~D>bV6I0rUT9<f5oZv>*ni8HXuZf|?G3^MApSEJk)Zec6N
zhr!CeD9{F-by#+27-57r3}?kzL9Lq8>&GvHVsvkgGp5~sF1|zX?6&s(&|h88T1*7!
zZsp-I#K1@zz(~uOzK5+sJ=L7KY|w7^SCLVfVc27|^jnKvY%-*T#Z+zf=EZ6Eib|(j
zxTG0{5&h8-Jf3~U5cbMDA#;S-hN6z!^wX=(vmfTYUzpOUixNP~gCM?ClRXCdr~uCS
zOT%wP?cj8e@z_@yIl)NO90s=+IPUjD^SH9J1H`pIR}tKTJ}z<@c!V!l6S4$Gut7Ct
zr$A>Oe9u96CB7D*rbra0Wh+3jLEFMWGaXm;8ccK{RU3Cg*nkefdS`%WiozNnnyYj1
zF-@6n>>j?vO5)DB4H$rO7;{6<W*cKPb(tM}?Bu6BSwMlaukQx~&df#)fhpIaNlUkL
z(0~=}fF5#wu?$Fa;j5n%hr4${!RlW?(n=0H0`Z{Z@%}p1iKKtsoT(TXl#`{~3r+#f
zf~%K&8F^7b<Al3&MH*SHKBA@iFB8_Z0Wdb&Xr<i?Q~zN;077`Nx`IZ-L3xuTCi_nT
z66|_ZQm!X}6hs=l@zehEzW{pceYeb(#xgeQJKj><sD3>PkJ0^P|Bm?AJSH=MTK!_o
zaq?ZFrJa5Vag6nNsqdEdQ@NtwnUU?+97bz3>vliwDdpQ*1b`A%tn|Nx+$-n4e9&L;
z4X98>)ltfhxr)|P|L_)*Li{K10CI!0QUAFilK15YASb6j!jU4T^4eR`s5BE<D{qq!
zpcwD)-sxTP2I|B2C$g-{E=hJZmlrmHR6VRWP7M6#0Q&HQZ-AU$7QKS1-#=H2TXLG3
zI;lMdJe436ZwoXYeZ88f7ihb&pP+p4*D44y)GScr*{~P@EqcTR<maaw^3%5JTjH@7
z_@em30~CcZ1xy^fn&3Ig{SHTg`8U8Lat;^fG<`<ivn-Hpjd2qd#;6Kus$Ud%TTP4X
z^vnSeK@3j<Qe$DsRWLk<8gf-mg(3Jk?%lJajKlXM-vHmQ-lg+)@IwMxWgG1k+B2X<
zb*1%Mdmytw2#Oh$Q+&!9VXeDhoX9y?bTz(k-~64c4Hzr`iqM7KB9C!xhGEuIc;TWD
z%P#kmlUoAz$yq{CB?pJWKuR7Cp}H5Um57pSv9Z?gZ@r)uvM^!|I(IkBWD*{d4B$rn
z(Z0)7Vc3fL2(dX!^`*rqkhra``b!g&{jp`t?<!Xk9wg$mWy3X%Q8x^gKL4dbFFHR#
z=9@bJ!PTDFpx;dP&&oa_R`<hynNtLRY@PuZ%71iuaqEx%4UYR=S4@>8+<vrB@fdle
z@6t<(_%aas8BD^B9Cv^)dWEGaI@=yQK!9Jx|LMwSjurDsAX_BZU|e~*3OY~&M;f2_
z#kRhDz)4-p8&>bV+MtgD)ows=K=3P{mK?}&4UK!CY~@aVS1A#PCb5>*WoBtQcFCR{
z@9or-jTqX7B!HQz)w5Jm^)=#K>{V$Ngu@EsB3<0QnDY1>+<P(JP<nILfNdG^mZhZ+
z%)d>G7RAm1?;ufvyXuu0D`;2mf#E7+YZ*Z92;l)sy%hVtdptvob;0XhPyv{!KTQ!r
zzK0OR+trLE18myw`w6HGRmrUO5IJ>2Z1{RP_SOdfGNgHVXTE#Wo%l4sNxW&gGT40c
zo%O01I%7rU_^Z5N!C<4NCtcj<y)_8>=Um6q)GB1_!-e{Am_yA+0@la6g{)1gYX3n?
zWO~x5=uBT?2dU^+Bh^Itdx*9D4N!`5zeiZ^iBiAhDH@1S!~Kyv%9ZkQ9Popup3S08
z-#<-~vjd`ucNIf4Ezu`=zYy<bgtYF7h*b0LfS%Q}gcZp{r*eWupKQ|L!43&~^B3ZS
zf04}M443m)mxySD=BIE+$yK4Ri^u0TEl~DaZLkrYJS%xhg5uq>ET`(vKx_pe>lw+G
zjgnZkHo!yU4FNeIZGAC<@_zI%iyoH)(1mGbXf*Z@dXK_;`A{#mG0F?l-Yf(0zE-p0
zDntcq>@c_SFru5SQsE2s2Ot8gtG(JZStIM;f{+azuZcw|dNEsX&9>I3^HmpGM+FSr
zjHakQ1HRG6q3P%Wx`vk{Ggeul1f^=r!C;=@YGstu{QMQ7K78d^#Cj*+ObOuCQ0@;G
zq3Aif^H)NX1C4%Xt40|+g;=xBss|fWk`v{q>SjqJ-y`$+MceW$gAoWDU#HO3A!AHO
z9U(joq(;Jr55QRHU8Z;uid`zjLU0tQLh2b+{$%Ikz=G7hH^zpA^)k#0=I{3NPK^C%
zI>TyhP<@y?Qv!9~q?G>Vqnt!10+Bq&7-+qeP1X~*3~ufTw`DhcRJI@N+zJaAiqXZb
zZ3D{8s-WkdO6BG?ei&hI>}lhDIk|-*KQFh&<kJ43Vmi&^18|QJ=&RWlG{i8><7G+Q
zTnuil{Eb`XYQJ_*Loe`EH&1(wgBs41;ySp?nIIhdxydl`S0&!zO7h5LzQDIP=sujU
z(gy?(DuXS|YPokk-!Lh}E31mx`rhbO_(-L-Ta(zUdAkwl<2+xgt4_(pdfi7{Qwz~e
z5q9r`ty7TVs&2UH00f6oukzx#GLRq(v+XZo(B+%TZP11+OzDqOUBxqr*=`F0%HqeR
zM)|7-O<d#VaRzr#Lo;i}o?w=8Cl1N~JrY3(<lach)dIaKQ(5)^U3_76_qO&(L}qRG
zgvtBkcXkg3Im$8+q9dUm%*!F1&6n2ICI-SS2y(z^4V3^qlL3X~w3U|?3g2%nw<kHn
z^yOibHQO~{3@hk&`ZL(?=Rh4|NsTp8*AUw#&G*=Pnj31ZoQ8MK{Co%8Yu2a7|1iVr
zd46o_@OR7W*0Ue{GrU>;4`pv1R^`_23oj9rP*G73kP=X7B$WmQ1f)bdm7WNQbPI@z
zlt_bgx5T7FP(ng#PPzo?l5RNn<Gc2|*WPEJbH48%FRq0ynBy7GJ?{HgW4!TP7@2#p
zck^A~(4<Vb%{L|#K;gBfG$xy87+GaSVf^Ym24lYiLSH;$ex5voxrvJI`<*Wzj}#1|
zb@2?F(f}dkEwPRz8zqkX*u%Ls`<13VWkV6P82dyeFGnBmn@9NMDV2qpf81*0S-7W}
zt=}pbwV+vmKa<wudc`sW6Ddx3S07aGHx?ggTi2lbQC6J#%Dw;Mta$QGsTN^458F`A
zS==u)dLjTqG~2d8fwVs!9~p5Ktj2@sw+JjVf>UZr>gjCQ+(uAB%sekLX4NeE<R}#r
zW^(kor%rTR<6qSU*-iNOao3Tl)Y<5dJ)&4?y9p2FvDq!XrymiOH6c6#29{Msx}KEg
z)3&$BfOg`DF!=*`UNi~)Vb&@pZ~y&g-GG1KLDhcdmb2Q#vnMRvzUxmGg&1mTU>Y2l
zA1*5(GfT=>_i0vR<)q6xoR_TCGP?&NTPigE)%M7AId{KLPpAjk|20>I<7Z+e(BH@o
zhxwpR+zrQAZ0>NOTs=<?#^azbj0lrN?~=9$r`xBj!~6EOG>Nt{h)Pf@KV_>D*mbR0
zK!AgFMVL8JyT5<_ps>ijRH1ONy=*(Io;U&zCp@;49-wq-v(aaHj;PVo#6p}UV{rOd
z@KfG<B4!+>{~3MHUK4t`MPKiiQ&yaB&yioQ5bb#K$~Z$I?#7Px?Ypey;wPu6kF>fH
zp3wLc;bPaagVMj;6@FO8_I%-|kCxf__$oP$8cdzJwa!7WJ&ke31{vA&eP}xcORsii
z+GCR+<*7W$i5e=a%w&y7Ua_9knu2pIsy|ar#a=;9W;#DsirfHr6)RbDXZ2YQr}N=2
z6^=wIw_$Xr918MA`=bp~i&)D&(cU^J*{_%xNw1Ci14*=w3pfh|VD#KLR=fQ|jAL4s
zz@T*47_|CWq7u~T<Cn1WI`qoIOnd&l^MwB1c?ek&i0;=DeA0XmPQ~SB=dTi{X5lyX
zToIwSPW$ozCb}6B_P|9=-7g2Lk%U`9i8KW4Xv||eM=Wna`Q-ao8cszN{=fU8d_b?w
z{sPby=?H#i+onKD^|hZCqZ7hK>GqwPDB0qFG@2jP<An!ueCTkVA`{<DO{UJU;oM)m
zEXLNKOqqm@YM}l40c}ROdS{nwY-ZTzf7G%Rp;#L|l{2X9hCKaOR%N3OL6x`x*<lB>
z;Ttz{M*PL<FCV)%1|s9a4+X*HU!TBfHNBFY-zEyMsAO;fwO0%>Ty?w6>p*Tpf7{!*
zKjyn9bev{gi33(?SAS`=a(ub+DD_pffy&W7WtLT$PaZvK+e&(@6~*3;dc6kpwblL1
ziB?X~8s?0MZ1tEym;X*ju}$~ocgCO~RhfGGdRiLovd3b*%F<NR%TUvQyhyg9UMg~M
z0#a5GAx!#l+JL{0c673-dx9yz@lVVA!i46rI(;dnuRk!hBhs@R2x)=r{yBALFn7Ml
zw*qjudB$=E=pcWc6Tr0EwSR~veUUz?T`JdVW<@h9*6eD-3|_sQi6>F>iTGw5S=F+{
zeLOoUycP2}3Hx6lj23h_7)q~<zXqD&{+OU2Ir$j|7tJ{JE932`5rD8D?ResjDi;-2
zvUK|Z^ki2?M?mpS?i^sl!SRu=j9l&F(=LVHTc2Kd>oPcKe6KVQJ9R83Pt^u+?p4=w
z`(noL#tq(5IovLH8+pqdd^p^_3m6e~nUhtm7R`lx$6k5<X%P;-kI-lNxai@}pu0+r
zMQ#u1pE{kBTl5}$ox^v@bY6J%Yq5KMQVXZUL6ev@R;F$CFrU><vSRAw`J*W+dR!Og
z{3Kf)x~@ps73Griqx_QSi|N##CO>*ikg69b?aVbUT!3OZbWqMvU|Pe9Oa->=mC`|#
z`WvweZ#|TQ_CquZ$AG^5J?mowO|yp=^gRz?v--H~tmxkPGEwhCUzRhG`dCG4>;7~G
zlu9jrFhHuUw-%q(rDDKMMk-~+Kkz#+k|LJhes1ec{^m7`Yh6_WCp8~kED&`HBTz$X
zx@puqGdA%Ze06XDAKj86GyiQIdqQN?eDy`tgPu0ss^H8dJ+sAWy~4K)GQaXjhr?C@
z;-24J8sz4qO@{5dFr#zo9Jm21p=>qZU7+A<O%Ma_7Vr6K<Qz`a!$D=e#Hy+X9#Uq!
z;<vBQn-IZ!Fi0zo-p(^w!)|(vj7wwnH$SG0T-o8|S+M>*!-Ox*c9+VoOFX36pkE~?
zm~VcyDo(#usoo*&@P*VVF}^H4Qb&?Bnto(RbLj5s8m~0s^lYq5SC3;VSAZ_=<q5F#
zFAw^B1~b{K(fL~Q2fsoUU$zZh!iJk5km6Asj3_}?xjrWtfi%`F7I9r|-AX$fyVDjM
z*ZKnsE9sX24zs#f<(757MuROPxiXf+{=hdPG^Fx(4&S`swSIw)o3YO)55e%|KkAEP
zKZT<K0%&VfNG(dT@8wkg{Tl{xN@qRQ(kq0d1tz1ZZLcP3QoP;mJBGP1!FgiSAOhzw
zO^m-n7$<j9S#N_LOLM({vXyCt^=HHzInb8rDR2R}ZuVKuw0nF>)@ZcWkF7}ZV?#Da
zofQ->BGpD;MK&L9DEpty*ZeO*o1IXgUfmPwsmH>LSNRk{USOsxY_Zatp{N(v(nqrS
z>`^mmB)FLqTDD4RS8S#h)WT=5Gbud>ck>c3Te&o2mK3{mX?p7sAHi}-GM`B!PnzSY
zYN#wbrg7#JZV?Bk&E$guG9m3!>GN3G)RnJoHD#*5B}a&D?TPomP#bnG%I-*sJZolE
zaR})Ifnj0PpJ5%4KnA<<qrcDY$H>_|wEu2Qav^R38suN$7ZI64f7L4&nvyoNa?pp9
zx)XoE)Wow@e$3CoOpT3DYqOk-6;bMqe^BGL<LT@@bsV|j5Qln;Xy^%7RGbF@e#jn`
z|C(D68L7-KzJ-rDmn;OpSjeomSV!U&XqADH&?Hg%&=;<*7j0pFN29s0*QF&(jf)8H
z`<%&r-6Z*FuC!-w%GFL=iYzIedcDo4_yn{@fevHNrUkx_Mn4Rt#!{j+Ov_04F*ey2
z7Qz_p`9>&l*Q<hX=B_+RHxM}5ec<)MW*F;MQ$7Ud%<Je2D4#MY?mQV`k&h`YOG0cX
z{cg=zZ7$iE--TQz?*nWtHhbhX0ZFwQH5T;~(bGP#xBb;w=Y1ZEue5a?s6YzK<j_K^
z`st)ozLk!Vp;`igs2X0Yag@2L?$Z2ETP7L)^y%j(fK|On&R0jLSAdpS5V(2MU(U>o
z91i5}3D9S{uEzKYDs=SA%?fW1d>zi{!`kO8KIngvw3^$8-Esv=_N|`Qt*6J(kqCmz
zA{+6we=D`J2v!k)OZe-FMJ37|bnbZ>Z)74)4S8@X^->3~*gg>fZ&v?ewzk(_m1;|~
zD8FqWBC$7_6<(r;RU#+SZiY)c2<!Gwr-L$TuR9p`xn2$x^Se^dljGwK?x4SLcrTiP
z*tg{)^VzMG-)dRft#>;1jW2Iqr@GI{`|OA-s=0jL1;Zj0NHLAh)%z~|Uh9<V=$&00
zRt^0w_hgUU)HkOQJN@c!aI(l3+&WXkO2kg{X$)K;pQeHYe{>g5qE<2vSEfgr_xg*c
z(ADwS&{rOInXV@jg>BNpSLY<%pFH+27jUfKI_#|+@2Q!F2S$qaD_Sw9=l}8uDz2;-
zShMcBP^Z)I@2{pDP0L}*JxVHJCU)wS+T_2<JRcq6p;HL`S9po#k%rn%2mi>6`<R)R
z8y~Z27ObUsLEY)*a1U_9_FvdDm;sWO;<GIEpTnUp2dWofi*2EqAU&=_%T!ObN(@qx
zWoA+19*R`1`nj%_!mHpSJQ4o57PGF$QC^q2z?_|t>TJE@c|s}FWD;)`E!JU?UvYD_
zZTckHTt~kYo_9w2tU$iM#7QldS(!U66Q>*~M^*fN?U=$@h-NgY+`mhT6k#+TrXjh~
zm8kTk*~v`f`K>OM#Z2GTm!4VFw>*%x45fPql|VT5*uB1vgEBL#Ix|Oq^e#&|7dz93
zCwZ(=miqPrSYbWq>F{doRXegRPA51J+tAcnt-;R^51zb;Tev2>Ff?+anPh{fkWE>c
zX$MxMyY;aWmU0^x?oPZKaUmAoRQi6fG22*5t<);_=)@&0V9{5%a1#LdyC4x#sIOk6
z^U|Yb{#-DUx?lY%dBJ`A8e+<vtv^e%$(LuKEvR1?Q4NZ$PX)F6*(0M(?Bi&Q{*mov
z55n`7HJWUASGCx8qw^2SNm(t-^T}}P-6Of!W>J0Tac-%eF%t#G-Pi|*_UaS8xocaa
zn5})tFTgF<+%Bm**W;A+{rI+gzn9(*^^YHU&d+4@tg|c#-Tr_`HHcTd0lLcc5@W%#
zHHJU9H^<SR()xL#nzf(JSR;7fm~HW%z?)2r*;ZSokW|NpzNa~sh53lGz%?xMOT&aC
z!`(cWy2m<>uj;3ddZB#~uNR2-)I2G#Ng#}gbfF>B=@ixVU);;eh-Y@uL0aQgK7MNK
zX!Xg!(bTaX$4koHlMpQp+_LX5gd1s#jRqaGeUNQ}>ag|@S6DRH$Q5N@u7MDF9pkdo
z{U<v$VN?0(9-5i`i4q5;o-DoX78u(;*}RmXKvUwzS~j<_cTkO+3RgXt*@zdE<CV7+
zh?(V+mq40{oTW81sgg(MyM(4CSCyw0=o?#KX^kvOF4Oz{p)~3pE0miD12#;$#4E_u
zdovK{QMp$rUU08_x#5Vu52;Q%hIn*EB5;^D-KOq3p1Mud2c8w8LGL!B`TIMJxrhgE
zy(o98*QQU9t*GTjllxkH<oTW8I2-M+-(#Eq*npu>lfAGe4H$l(VB@K(_giU%bhzCx
zSlDDl?K>g6`uDfU+-#$L_l_0WyQU+_FdI)^>yf{Nr%Gi_N5mSd<tug5Da!<Hrb-jd
zM^-TFA}l<2%zGH7)FuNDa$Kg)yrL+R6zr|AH7#!EYI~4BQ(E$DWTm<zQs2XTguS~1
zPO;}Bw7D(Di}!k$vq!2od*n<&#?W+LZ)+iJMLtmz8rX&CyqFbN&>)XF_jVm&t8BD8
zdB7}QWTSoVkHyVO$x`*8m-p8FGW508efUCD*VBrHsKT;}gDG&BFxlqxYsz)47UPmL
z^fIyiwEo7{H^7fE?NjSxMO4^y-feSz6Pg#7ap@iLAV<-kXJTCY{qr-R2aJOCD_*K@
z&YLLJSO_<*cg-%JUOv1}EQ~2<Qz9?pWfsgyetJ3mIG|h?9lJ7GMOhYpZ`Imscp=xZ
zdZ=J&3rt>(2eYLMrkiEoj_g0%oPHWOvc(alATZBh3*hY;Q*LnY^IkCvM`|<sSqmpE
z*|95N<X?<v`0?zhXl(2KM~<GGnxECi(I%N?{jJF|?B_2)hsVX<6|nU+AmL;3;OyXi
z<r}18i9ey%Q669M<%;qxQs2>H$t!t$d-Xlt%hOi^hkdJ@K|dFG;3K~({AySwVQ0(+
zG5W6%4@)eD3({w~3fFQ>$NTMbjB|O#C<?8;w$UzOy1i0bZ8)+*Yq5U08ZsWz!R~^$
zlR-Q>_Z%Vj$#mISh{|=fVvrevqbl%n<~*O}vha%?(;zYVx-%e`g9f03A#oxSJOxE_
zbQPn!6lM0U$!&#yOIWe^<$1L+fTXvYWzuSt5#1~X2XYu%25+k>@8z|!X_KkaYtwm)
z4vo*woTqrw=b&-z6mBbGD6A#7_!CI-_a9=FI6|%u`(tYmZRF(^P?NAKg%<mXY2mPu
zWM)O)bzyqKicRLdfZk0~OTnza?*XXOdSvARz2h=p^z)H?uN$ImlaFwCi=FyfxDl*D
zteEgR3|2G1->^D4p(;MZA)2mTW`!3yb^l+aBJ)+H9NGQpLM?g~f&ICZ4pnts)%lqK
zfiub<GH`fC^Z7fV(CMs|YCsaBEb=Q?UX}Z2^5B2_l^+kvK``(06#NpS#2G-pjc-1R
z`aqPrnQ+d&EQ|dzkos09OGQmsF6`5{R5N+pFgnHno85HA@N%Xmsii7WZ?cK1TW$cd
zuph*|vQ#o$@{AF^HJ)w33i@hp1&mQwbb^Tgm85c8-2ftm(m}H`1AOSZS{$&`?ZBYu
zVTH^1QeCY^T^FtUVc==&AZ??6C58vGdloUntN;4s{{sFW>bx=~_9H1i4gZmr;RCuT
zQmmtk$w(>=SBp!@7L*2e5Hr<10LyL+a{L|U+0yyG<4GI!@^BeH(tDO=YGqWyCu;|m
zg}j2<D<*{1uN~Amm(=+FL?(7k;AF>MhrUcwyYC5q2{K*J_htk~JI_Q@9%i;s|9Mbq
zxL`QoLwLUFqAGAp#O{oHit_7zf9KtZ@%P0M!Jc;srWR%%Jhuo>^?&>zPmm9?UIa6r
z80}+P3u6xWMKVI7?Jt@QigkD#?MH)}VCWEb4Ba+kghoREjc9E$t*-&uA`%~EQBdQ6
z0@s&8eyV{#L#SQ=Q&yvrr)>7(2GEafi(@O+o(Hj>j>h1J(Ih1!`hzI&M1KJ{yAe_V
zHsGWq6XHU<IDjoU8l-ah6EEG65C!;UnQ)-c*Hr-8u|bNxUkD*5bk=%VB>QQl9<N>i
zh90Gb{-L>0s|f@uV7_Ia5Ci?6H|}45VASDrZEcyZ0_GQkqsih5f{~8Jl1ssr#;19&
ziaCRWpF&t8NEQJd2BDKr7Gb`tIGQgEF|cD?&=>?cgCM^HnEQ_p6Vq|n-kc+UcILwM
zIeYpYfJj|V{m~dBaaJ8bAy^66FBol)*eVv}RCtqftp5Zgb{5YvQyYT>P$5Z9QsSXV
zv7YZr@|hn(=gg1QRNaFgf@D?1m7&>62O7>%3Gi6!75a6jNXNoVJ0!?%AHwgjr12-T
zs?>5g1{4)NNGgC?6$r!i3+1OpAY(wf9{<l``4eX5cNLo|ZcO+PlU_0FO%GJ}y!-3J
z{dRZ-)L&?d{LAK*_~F&c@SF3L5oPZ@&Lz6GVb!$RtUU_-{77!afDXD}=;Ux?EE#;J
zarY+Q(ZA1YnuWLN1IQNtd(w6oBWMhZ%8`0>G1E`1uXPOO&`y7ALh3`{KmsT>=;=O0
zh{>HrE%=wWGUqt4@t&#QYIu0cdpdPud!=SakE122&nsqV4B&4Q_S)TN8z7_!50j*t
z1x~<>Z^$g=V?-HI7Ngv<9GmemfSC>szh2~_`_{E2D^89NHbm4<>7rm%QdERl#}+)O
z*M?E1V@+-(z+?wk04vfC|7JCoQdAbiR_7D`l*y8aFTi0e+F#8f{jqsESRxDbhcmBE
zU*H6StWwiq&^YiozK7R^?vBVG)#GoX%>`^*RmNs#?=FzAD@Oy?vvH2w9s&H|zQQBB
zQ%QsMDUzmf#|Uk9-8cF6?o!3U4kF*Fay*y!?Hoit=z`8|;n&iCNqcvLI{o`8C-Qoy
zB1Hq)OMH~iKZ`#^J~$`z*d}Ho+!r6pCZ?U{^&QI7=HD1F43^x_Hg1PPC9qzc87=Ix
z$qA@b%}$8-HIe-}`U32CNNQrfhNKH@RhpDJchzpbl=E!`9{(9Arl|@j?+V}Exn-}C
z&px>+!Lq;@<*6Cy2}hyc#b1ENh8>tC`I4?{buNum6l;R!p~gTBPt^lLm@16D>C*sB
zj8&apg(X_&y933{CC`2#YV)OnS8=_8vi(~A7X|b$@})PzQN%dBJ~tlydB004zW}&B
zhyH=Ezt@fqfE@GxIJcVTp_$&7k6pis1abgNB7w8;7%9Pcp4Sq`DC|754m!Y1GK_G{
zQfzP!N!`i$qgRTj;@$V*rnKv}kCH~$L0^Oshh?Se8f5(EyM8TR_{AmUA<q*T<t>4c
zU%Lak_v_x3N87`Jl{UAK&DeGpRSVt?lc_-dpiMQ-WN%VgnFR_RaUw(~QC6;1CG_((
zN%fi*9_kppTWj77*o9R2*ylxl&LEoT03Drysq_72n|A1i41WL_uH#Sda0*XB1bB75
zi&=4G*B6{HHRZ|8mXC8jp~zK6vkyYGwlH!<V8`qb739|gKT>6`AkY#u_E+4pUUfiS
z<KRfNJKSB<bKFEpGDaa*+f^r@jiX+W(DH%=4_PK!)<kyWEk)6ocl#M%$kP}jb$Skx
z0Q_&iJcf@XrNH08$4BDamH?&J`^#h^rRb)8@K~9(es8{RRZ*YeQ+Ppx;SJs|FIGpE
z{m<H;!qrlS>X_%$ch3aAUnZv3s>kb)A$54g_R1spzXy=>n0?R$E3yyGoj|c0IBYbT
zOmLZs{`hTtF6O}N_j)qrR-es7I33rm1h=BH0YIat(SK#-SA?T3Wo8)=@Rl8biOp#k
z<Ed?lR_&(s1J1gE$fZ4R^Msx-7h`H;4mAdhbvvEz)lC!@QAoWzJX-ba?AQpt&1nb9
zhcz6rqYYj?RwY~DJWT*SZ9#{<1P^r#5UnER<kni^NiIw<0gwN3&sS3w*_}9D3=em<
zV@L5K7%vU}gxCGYXTA7PQLKjZlU<L@81eaxN70YhgSJv$fo@{-I@tD2V7st53zPnB
zg#CMckPX^*d1COsMVxgITxkFqUl0g_oN3oVl4=4<%o+IM?Tz$}Sxh%&*QAh0!+s61
zk(ce#iCPffuPcszSOK8M1Fe<9W@;(jmt?Xo-!Y|@+8lRP+VFg6EiPpa!WgM^F_kbB
zP>dSHSO(h9Tiga;UUj{MVp=c=#pM157Q6R`(khDI6WB>9Je8!>{P_r72TgA0^<UME
zgs@lPTt>ofe%PajlJ1`^xT<LHP8K=ot*F|PT`^hyAkpO0xsCsbkNfl4yzFpAjy6?R
z$JBJE20Rg`Out|w40b>5z4G5ag<9k_XxA%WL(K`fJ!5uU&3ga2Y5x9-b_1$d%OTUR
zzhHm*-~_5|FKBK+7Lr<NYP?*IsmWy=8HnAVZ$&f%xxj(UKwQMRd!0PJkH*}19VsLC
zw-!x7zqR6?JB=+$!6CKGh9Ozk-MXY(%E5N*1(c>8t={%na_%JBwoEl~`*tW2ybGw2
zge$382J*2bs~{t*S0KHfO}S@~q<ULv1IZk^74P)SDt1BS2r7DuymVlueYYg3Cc|b3
zp{D&Hwfey2O!6CsXZ~3<Xq6mKjfMgTPP2p+4mJAsZu$2+!o>oITzk9#7hp%^;9KhW
z{hfZ%4?f!7NeNPc=i#Vku<MK$1}a96d@tIBIe8!I`L>99<WFLeU4yYA>=_io!$^(#
zKruL_Di@uW4)knuHKbc4HDcqOA$9QO26nU}s6K((Y2s8t&b^cB@-@f}h=#4hx;iD{
z6$3NO$Nu;4bs_JAzyw}^($K>DXoGzaQoR-N1j+X!(52qr;Pnyfct~pU&j$PN5#t{n
z(LW~!_%6e3vBa5^Ddcq3qXqNO!T80U>$dGrZz_B;n*s4;muW%u`g<e_0EmiY9S{oI
z_EKcsR8m<))uAH#6QqKvEiv*=SzuYR;sWojnVAiqEAw1$y1_)M7JhgK6#wUBOm~I;
zj^v6fd!&;%1I+E!1%(>SM6WcpGlMmagM@f;GnM0~xOPfJk6ZuuF#do3t^fHU#0VkM
zeE&nIz#^+HEXDrJBN`C5*mgiN7@vF7Nig6`dI&MJk$xp{ewAy4T}M7~<^$dRc0kE3
z_`@lWA;i)IauVC+$tc0Gn^3dT5KiW)g*0_A46JlK?q7u=ruxJX$;xpN&vxb}dK5;I
z=?pAhY^Z`j)|bB4lR2=5aU($7ulKkpsUl92|12Q?@2_aZp;Wk+qvTcU-B99OQKWiK
zPd7mD7lnj@?Q}y~ME!Z&!2)9)UnxZFK$%aRO@Mi_7)I!^c?<nJ>r2~9mF6I-j+PMm
z4Yk;(Z^+vV>W)$1rr{&OE~Ho5(|}2JOu+YMD**<~@uxdr!jCVjKt!(ck%CET_sc*t
z+kyo(q0v*YkpFXS|L@xeqRntoXI_9Z<Y_(>#V;e~q0mk7zP<kP;Yu-Z7_lPm`%b-t
z1BcL#22>Ifr=xIqg9R3D+rlH6v3y(~9(qfW53mrqvBPI13u<oQ?@4Ne;7SY3^d4j{
zS|PfL>dq?1RjU;+c~m?9`2;!;(bEo{NX+mEd_t3WFc*y2<w@gXa?!Vk|8}bUzt<dj
z&u`y^w12UOqn-#wYXT9wUWx(y`r?75S7q&qju9B7O&1)4Gf{>?1bHdsSX>mdQW0YD
zT1MFabg)k)?fIHqci-$rVr2-})?p*Xvg=kNk-URKaK<|)tU|9j0|xx|Saq}HPhbHq
zQ;6cEE31Gx8H)($D(1Do5~XROT>3Am(f@tD|NUL1M*yzk)7k5f)p?%0Qw-?8kybgY
zwip8^WK>x@v?YcR`DldvRxS3hQvwL%F$!;pX{`7lJGkYju>%pXv?G$z{aqwb7nxDZ
zY7klO>c)>a!C2FH=bP4gNq#TEnICruMJ{f51ZjTp(99S4{NOaXoc;X&*A7oaZqB(R
z@E?`r+pVVO<v-s@)d&202yRENeSi^QvSpgLI7X}kq^dFSkOfMXAt0m~X={+R9)WNl
zq*=#jTL;aYbDnR0&Gyg?^vo>>ZWYrJ8<lpQv6=?3&>aT;F+)pp-6`^5^CDbIS`UW(
zF%rc4U(Ue)*Dhfuft!<><nvU|Xh)X#GhbVSV5;?-C);Ip(V$qPwD+NogvCX|2|Az<
z(+q7w;Oxag0TVOv@c=}Ub=~<_NbS8|sk(y|L2l@pV_-{-LE_%+)eU&Fv4=>>bzF6(
z`G%B}ibhiHD6qawTh7Ba;s>x&VXRt99ySMyOex3){=dJLO4+d3cOIWUdx1xA>GS>e
zj9$}KXsKsl#o|QhpXI{pLe>42d9Yys1btpRiK5V@Pr5JmOL`T!q2PIpaUGL#2j82y
zW(%z8w0piEGQE~q^t1DbqNMJ5#lY+R4hfao;4A(Qqyd@832zH8WTqfRmC_tU%~>B=
z|Hm!;>JF0D3Ilb~9*E-tJO&g{R9-Y5yY)g)vrS;QV;*=Y&i#IF077i-xj~Z<%iE{%
zwZyzPot!w-P$Dr64^$JTO(5RgW6w%^ss#e0Gg@;-{NIz{I4v*%O^cMUT7F57to+L-
z*Z)50^KNwknn#FQf|=X#4L{741ASb}j1zZ*ko@U@N<5CRKY_ZSo{{i>g5BDKfzIg4
zBXaN{@PtP5n14hjd>@)d1;m>6=XE})hIqG`A&Y{onLi~0oCa+NIwa73Bv-(@C9#oW
z0?%|XLy-pZwN|^3Dy3NrRn~WgEY@b=>D%a9_k$RSlxYEP99vQ&Bm{<V{-LY?d;j4j
z<OMpkD0nVoo2%pFbJD*+ZRM-ndH4R?3mw`)elsLp#M{`Zj}&*5tW|)t&G<9+f{VV_
z?JTA31MAwo^d0J-aDHt@D1Am?E)+=ngQIw(0BzO0<OH*9JES0>kY)@y$xY&&O*Q~x
zGGaXVReT0V=QOWa`<I)WKK=lL_svn&9_Qycw&$k*I}JM_E3)-_=q=Ykt~i&4tSp)y
z<XmO1TKZU~k5^r0Im~CR$95Bera0bAApIFwEgjkTzVjiC^@-ss>lZVo))Uchij`Fi
z>`XfAvNCOWr|?qo*xBfqZhw6LI_#Y+)4S9gdX?f5lisghr@phJXVX1MSlv(fy0o%%
z&-KS(afZl-(Cpyd(1gKx$Fc7hZ|BrFffTDl|9G7YK?J^W=}^cm?7)+X_PZ57&<^dV
zNfWtgK!F?^It-a@rp||a+*=PcDq^rk1DM;qap%~xvR~#qicE_ahQ#>jXYZMie?^i|
zE(D-Z*@9{VmAwOwbkf_TOPEbwBX-D9Mz+Lr{D(u-X<K(XkzRK#)p+b=#a)nscUpSx
z-HRI0mGUX?=H$h?56W)VkPPxoA3;~hg<b3pSHPRc4Yp;yNl)R-MA_SRMc;3>9Y%U|
z2P7h4=QN)tv>;P%GN_n2FWCeF^-KU%^b;JuoPXZ@FG;21+wx1|f8ktw^%pMfU#IZJ
z{`1RoB&X!JEuQ{_PacTJg*Ny}iOcIw;bV)4W4>u|qiyv3Ws@Wmo|0g~W;6)0_N6v3
zNTg-%(_YU`VO-j-VO)kThWd1Xt9l-OxvkqwmpM4Rr!KX$d!{vUK;I)%v<jx`=Eb4Q
z@4K0TROES8#~CIev(7q~S7mW$A@Z$45@tSn^dbg1q}!p~sT$sc?CWTR=H1qr3A`dF
zQy&&!M25`J8kw2xoWF^1E?%?3SuQ0LaQ_8IqyM6$xuBK9MrW9c0(pYgdWW?KcZ6k+
zIq78##^ihTUL=CD1dwy5hXsUor4LD?!(o%Vu?jJt>bW-)m12I9RU9j2@<vKY#n%Xs
zvS0!ks$JOWLm&E(mmBl_MU`pq1-M`7W1@lK&=`EoXR!BYHWzpIfDY%<KUz@tIjM*o
zs;TXkqO52hvM+2T^~a;I;8+;ROkwEwl+F36yO0-3R<LUTuV?mz%w<7K1(7`?gu+hM
zH;pG2n4`7*c1fCHY}T9;Yvs0F)GfwjiBS3}oT}nHToeYd+D%f-;|Srt0TI`HbGYIi
zw4{0x|M>|2`84mGV#7C+sEz-weLHjZ&529wE51z&Lr;3{=iV_riR3W_weUDPpqTXI
zlbziE3rF~Y0RWf5zFiy1uM<tEqwAeJ`8n@858h_fIuSt-L8QML$%?+*(<k658jW<C
zeJ1)GKj4Xl{q>Qj0YOjDnMV_6ML9uR`+T{gopL%!VOj`E{4;AtMcTYoBDNBx==upV
zTw2c8xUFU!nA*&sk8ieJq$uJTKQQgFU@asAo8l-u(*t>Y7E8`D4Tefh-Qcn|7o`y9
z0E@^BsA1U{&dwet|8QV<um2VvRCb~L>#}yx%2<`KRKH_Zw|BSz?drL1M6M!2TJw%(
zX!!<P2we*OAnc@$E`7A4fYn2a8;HGhNYF8*K@^fKcA{Kiq<80zOZ$+R#e9WICZ4Y+
zo5`yM5JtWu_2oU_Xt;aSTp*CAZ){%5yi-uZ1Je08LAE8)Q0qDX=V3re4C?bIQ@d{!
zuLT+(3dY(Cb;49jS^_n-m~#2@PRD0?o_+IK>i_AbgD0ltgmp{gITJ+5&t6zK+%2xu
z8*=Sa&Wy66z<jDxzRpl=D&2Q|H%BI_(!E{)k+|;?p8y9<dwoKLF#qBl2~PIZlYa9+
z1?jUHWG$C4OQ8YJ>0{hZTYg!j&v^Wc-dCD=mMbT(GzK|k_GLrUzvfx15vG=y{|fdz
zOhHDHQGK)pKQ1pL{b#VsV<r=0>yDPKktB7QYL)}>7@o9L8H$;7ko#)1WnNK!id2mf
ziNw)ui78{Ivv$k!0v805G@2tk4~ED2KzSz1I>GMD6<Ee-#5Bmx)FTLs5Eyo5COVn$
zAoc2|;P_sUGw^3VdNNIqhCZOl*L;XY-r)%`+NLL5Ihxmv5BWToaJ+eo-q=a<yuE|+
z<Gy&RsB^xBc;Yu&(FsRpL}|kcN>Zg_*pYjpNG_7Zit%@9s!*HN!$J}R-^0Soz1@+u
zn`r@}rN!i$S*w*ENYC62z(nMWD%hZBM+YwGb6#&$zmAL_iGtc857Z2}F1?XU$wv}&
zx<<jpLnF`A{h(rHNg<<!@THX6m!b%T96#=&xLz|@EXDF->H4!@UvT8nnl{u<GS=Ps
zA1dje*HG+AXI<Lt2+vy+Jl=Zl30xk1xZJtYl_m4u1e4;;PG+u_7oTrElT?!t@42CP
z@s*hVr2!yCxQvGhQQN8%@1DEj?w%Q%>d(o~>w2__E^yCNt5pX*Lkr>LCdw}MeLtM9
zYI2bf(~QF7ja|<;*QVBW>k=7DxyqX|-^1OFgp=!<;u&`jk(stA)|9Z~>t&?iCx}%o
z`;P9CXyV!XRd!)JNFH&Dv$AYK7WTgQ%vg>`<flm6gjyt)vBIj?Q={W+#c=?YAfIK;
z_H$op`kW=s7>ILvISQ#cBi-DcLMpZ@zupK`;WOswp`*~prCWg6N^j#Ye>+<Wy~|aF
zFzkNRiyVb7aEhxB)L_p=zgQ*X$#JOrEV})0HBl5G8~uEm%RFc;c9NCc%Aq-U6Fck;
zRR?b_9jt{brD1=NYpPa;jMiM1G3&{u=){-bx3Vi}HHYvSzuaH;c0m3xHjIHD=H=Io
zBjo|Qr*eZJ;PD9i&3$CxD1YYbXVhS?n)93g?Wp_nfWCBH9su%!d&3MLb>VoH*7z?v
z$x~l%W-@s_A`lCp;AQT?8H9$LrUnx7+1&pE0kehO;aYRqFH&iET<$m>5d{#;NZVUV
zm#LYsmUz_0-xYn`vXnJ~oQUbtM}u^2xxOYsCJt1S9rv;1q<QdRep+W*F-lxM$6d7O
zmi5iaLV)YY{5;GZ+{g(C{AAazoPi1<ri`3uh%PFf+Rna6c$vTG)&;Ua*@pPA{j{qq
z-}PM|zi7~_IqSPT`LTA)^W<pjQ`3p&`5)Z?Tz^_@Moig*y@8bbQ`(6?w#{F!p4C!P
z@qVpFWx@0H95=3LE-+|3h_1Q8sJcvT*@D$<PGkwlwDAM}6SX*TcMQeSy|Sc50MU;m
z)|4KC(<a!WO3JMcnFHrw{>zn=B9TQfA9@1g{q2&RhYhiT?NI1KU(6nK|EN*Tp_F+)
z#6L8cT5X0MU-j6js&$M$_!GXiFyM2nD7=N~hUp>1<}1-ZTaSO9Tl8LC48q<qU)LCs
zCMx<K1{w}lmW<^!+Yr*_)Fjf=r|`q%62sT8_D}>QnpEudEY_}_4@<b87uLvScn1(x
ztvciEtn~NsaD72~^{T_6{{yv#jQOpNY&_oO!rAD%a|~VCfx<X7q{MNlL%9=5*fmBW
ze6d7F{E}WhWHehVXV)cL)RYM5Kz(|oQUR_d`tM46$8t6X$|=9y%Z}YIiOZ7(U7^~y
zI&zJ37|Bigk+1li7LV5+cU!%7J$&MV!HG{#4UZ*iwh>hD+L2)goah{l<`=W%S?_cW
z19_9d+FGWx%Ps=hMNfG^c4Y>nWcx<twqBL1grHd}`Y{CyuMP952eW1Q>-wmpSmhn|
z19SP*+JyN7U57!&+m?Aw?o*WG?|#6#KXj9j5-jyx4^7~?8lT$cx!0zDCO9r+;TZwO
z3I^s7f!X=;{my6f;tI>h6=1iN=$@kb?~UKztN+IP72o><ThmHuCEMFYA~C>ib2$em
znpikPsa$MkB?CEhpU{`9xU?UT^|yyAZn^*mhwUZeUo>u~r%f$bj0<x$GCe1E)K7lD
z73EpB=bzH&DLO7(VXsjoLLmWn1bsc5>Gnt2fqlnE^e((6^~ldQdyp8nEkWU{4p*-{
zpqg8F_T5kz2*p5ej?KCu&e?+e%Ok9)C;YJ92PU|@_BU+Dx>tsHy8gZJNL<KBaQ6x4
zkt=~nA9s%e(}6%!b$kfzuPZ8#y6tv7bQbnjk3+vqfdqh*4Rql4Ut>T|OE2?oF>_t5
z9TX{7EI}P+@2kKVCg89%FyQKW!w~|!0zJU##Ba~j4xGewUx%}MZa2XPw3}&rbww!D
z5mT|MI2W&=ORYQx-P8YY3Y<HA%G0B>BY`gS-nn};P$VAnCA?@LK;Lu4<(2b(&wp|E
z1XqhqAAf$005<T!`4TPCws(!tq(&-fFg$HCk>{Tpf232zmPszK?FI$+`AvefA?%%c
zD>p6}E2I(ZFza}V9J(nD+#yR2iHyK<frqjStvnFCXp!fka!nF%(!RCWUuAzNAThn?
zhNP3Z=q77@ck<d=w36uo&&Qpq`R<0s%{yLTqwYe`rzY9wlsPW_kKko*qRx3X1LBF|
z9$6Oh9K4cc3`{L@P1$$&A#g3XyM`^m1R^kbx93O^WfJDFZmo&31HyHUmz0;92<!UB
z_+1eOG8*yx&7piB2V&#Ra~BK@dDAFzoG}_~aUCvx?*E4pAeMOQl<Pv^J>W-4N^=v_
z3vn*^ISQSlKIOU|R_L$k_geEjLld*q!|ExzgjX|N>e`mP8{N`0jS<M-B{JH(uzMEg
z;_XL?aqGsu&d4<n@%U{h438Q<(^}Bmdd4sON_u0ZDx|}KzTYU8=EIt(jrBJc5HNcC
z_R^4TN~~2=o$^S}Nx|m^LL^(;uU{=Cy|97D&oRygk^BC+?c?`Yyn=b|U*?m#s>Dc?
zS~M754K?w6?*Wk<>v=dugUpP%%!IF@Tx}9~ISl)s9L|asR)=DFqGbw&pAPDPvoCsQ
zx!MV8@#Jp?O2!R9TgY?1<R?WIS%>f7Et_A@UNciR4Bu#csYiFPjhWXFVcpap6I@sl
z;%cJJjP88n`QHY(e^$|}r*L`SGFOrKNh)!BrOdwtfUXI-z-I<Xqr3_j1K)U4;+IG!
zj;{ND(9_;M+i+)G?B3vjmF9DPQY7{kxf=*I2B%=_2%M4VSt<U}AkUQDw3F4+#2Gjh
ztv%oj=uc*pR35@`k2y_Y$5h>If$*fvna(F&f_eTK%r?J<xcQM6;{kMw&)}@)MFxY5
zGr)S7L!A2Zgy(WK61&w750A=~u3nz0*utpw3Z^83EfzF7XMCy=kqdwT<c9@gatlkG
zRJgofb)1O)F|~Tt-b$ph=(*S}!+ray-TObt_svf)8WMMwKU*|ga&q0{$RWIS%SrF=
zS9Jf)E5VXX68{L$au1~BJgeOv_<}oYMTF{;E4Yz;Vn3vCOT!b9T{uVgd&<3H-c{ld
z?$|^x?5U7ODiEL?ye-5J(=;r;>3Kc;+JamoMGgAC2T}N_n=gL<<rRS+rd+FasfVSw
zCQCh-r<e5CsU;&(299>-v7CbBl5m?=Jr2*)&opOt`m(B-Qdmn#_}z&F+?6x#2-rer
z5ev{{n{Z!^+SL=THbZ_qUR8b>!)e4?I8_PnQLH`$^`U32Muhf$g|5xVvOkYw-AAr)
z0TaXZ6|9mzcGc>MX{pM1ShvZvvC^R78xIpYDdRpy^O?An$keYn`xT?xlfcIEQ&0jb
zbr78?ms7Biv?(Op^o)qZ&bvrKJ_4BskZT*dx+1yokjvEicE8OiB_ewlp|UUT=d8d6
z<fQ%|9>k4A0;c5`9+3CYju==@cpml|VFCX{)$Vmz$DHRIprtnBjmiBkSAOO<7yt{A
zq{e_Cf*u29A8fQq%y+kG7X3RAlJ!{=Zhq?^)qei;X1vp+ko7{XHUGKgFt@$wNZYSb
zfEfikXk`RCh>HL(G2ibu3tc^jg6X93gt&BuuFHJdjAPw_uG<61TAKye$3S{eY*+p&
zGSWy@-GGobE!!`r&PKtq9aQ)nFt4kHSVY$Jr0`V9r2ZB2jfIM!0?HY~*t|H&7XThm
z`Jz3(!6a?}kp=KLbxQqT4S&}OE^_>8lxHc+)~*FwM}frYMyUhbc5tf%%lnd2fK-WS
z3%SO*YaX<4&m+JeJK?!94K$W<e&qtQEqt10>E*0dx+HNbKVG2DubIanT9OXO+6^jt
zHqpGOq63omU%?k|4p5O0B6w`_kJieK5KAVlPU97CrmzBM_e_T9k@>WA0wj_Q&nSBC
zha%;t1IPq(MEN|F{CWl3tRlJzH<AQx=)3FKz>6B#0k--}<7Ew+N1{}5S@a}Zu0Tx$
zlG0!uDFIz_dz8OV1y^v$tBgg4d#c(p$te||%V#!h4NaChG7l8r3|th<Lcml*#F*lu
zHo5Kw@zznIhd+te_+P@19D_t1%}GhWg1adC*1UCxycci@cvAygV<*K<?#aI~#b+QW
z(W>R){~3Ej!UgVCdn{CtTyz3t0R@%wJ=odJ(o(IW9gJoxDVa<;Y!Bb6n~0{8%_tpi
z&POR?r+S7`U3Q?=<pBWrX|A%YWmr&|TAh;jT8CBkToZrScZceQYL*<<{k_qpBSa*`
z!#^AF+K2&@Tv{43|KzZZH8_cfhd$G}Tat|NwZ{G93P(^7)$FY})-6)|s8cQGtk1;4
zs^3$8*F30FA&h9PfQG)_sbW$40>nCN)oV!5MSm882Ht}%WvcLF&p>X7Qu_K>^wa+A
zESJX{TS)z%vRO!aON~lB-$mXro&c1@nj*yp4?8BLm14tfQG5LTGU|tr(G#+q+K|5@
zhoma7T3?Zj;QsI92V*-gXG`uM@2$d(c)Q2*wfdTNmF$;d)eabAa#qXk$O$g{YQ({L
zV*+D+k7d*Kmo0QsvD$*hPx_vSs49})F(yRCL!+^FC@Y|2zWt=G9NSTZ88lDc9%N7c
zGrs@(pzso5H1Iu_3^hTtC=}d6J1eGV<<YJ?3hGshY(>%-o;WSRB=SML!^DKzlgb2;
z86^Ya?Z9}BMMIfC$U*uUr=CM$UA|yin}P%0Xk{eesQM)^)kr&J7&dUQWRh#cyYCVD
z{Z{i2>h7uPEZv+|Z9EOB<6{WjRY)C9V_V&aLA5$U?WBqDEoMtP;NLITQq#xEt(tL<
z%=7k5s0@}Rg`=bog*Z+X9vb3}A3}HIu6_$xN>=A-yrS}}a%U>fm8I*_px?HRXs>73
zXu^jR2W}}lD2oq5A92ZibsA2|O$Hq&t6?W0OM1%CcCqg5_e<W-jPSI$ZHgPBL$JwL
zk<eu26pt7zEzO{0SPQ$-m7q{v1Na%wtj60ro3qkmn2U&neGl2`Pb$ARvL_m?kFh_#
zDqF=G{vFFsYC1VNE4Q!rbg}9?<=MS$?9O@e!ZMrz8}iTohJL@7Z`ilU82R3~!NMB$
zdGT$yqc#6c$;||xht33E6kZOk>K&mcp0-Fk-I_H-Z0fP*um8a12TQSwC=6Ya4k})@
zA6?l}*zldl{5&4=&noqpmw1PT%sgM1_Byaepy{QM_K>SW?~ftJRSKESNJLp^qqjw}
z7br8csS3DOTUq_11I#BI;bM!ZU6G|T?<MjDFP$iaH7mgZh%R94$>sW8oN&Zyh$Wnq
zbl`SMs?9t696Q0~k*c2=P{EavbM;+d?wf`Z^ic8sGY4B)qpP?KBbr`2--=f=MyvH~
z$J;v~6e9k&$`l^UgMk1tcWbz+Wz27O9O=y4cQGeYOE+s;2rF+n?Kvm9Vzbng#k~Dy
zit}E$={ml&;Qt|sT*TR6nevva`5a+Rg60$D$dX}>`Q|%vIm^BW4!!mP`X;$wDvSF_
z)ZI@!4i8;(cv4?n=RNtTJ_B9w*M{TQtm)1d4CCTvyc11g@H_w6i~~Rh9%XwYbQ9*x
zvl#s1Dr0&A5i^4{Us>1d^3_oj#9cgVmciF=hsjng-itrnCKFm-yU@)y{G7zxMww(3
z_)(1;)a<!HCkhr(_))x3akzH*!6+o9pmcQH>^ev=7^8UXWeO@#1chKPQrJ;m#*_$p
zPT}<dwZ}Op^%V6?F4ygi$0s{$-uRn$RYS@MKR?=z$*qBYIc4*~yM#U@4yO`~KsV$i
zrpeu_Vy-_TdM^8L61X-0+&6(j8P#tQ_`*ws{x?`iAE@0|wW36!tG^vlh-zxRej<p}
zpxMe{h;W$XV=8&bQHP1pSniL;W09AgW&5ou?;nD_`w?G-NN+o{aSnohY!Rc&gCQrn
z`bTxky)}H8OzU;1r@Jy)qmJ34Nq;Sc=qkI==@Z$g9q1eJjy_Pccxne{y41pW+SIaW
zBvYm{g#I<U%dp)%c)GizM*pk?P{UuxtHbs?YTAxQyqTEtnbAze*_|DRi<!s%q~v)w
zF#%nfhw7p$aCI3Wy8;|5YQ0YC74Osqy<?1RRoyTJ<3Q5d)}5aAf9;MQSPW>5#<s`U
z(9>Dx&@mKAm)^@+Q*~D)u+ox$6oS3-(Pp-`KuElUKIra^A}!y^gyKbg#@*@TodPu#
z(?j8IPX(j1#1|i4G|O;f6e=QimT<Y8-8)&VZ$&w(eZJFtHKl0CdvoL!QD*4T2j*EN
z9hbwLg{Rnh5y!2H-0l21Ai(`{`?6b5CkltF!{<labcgKrDd(h4(zB~sidoY)(&mb>
zMR9v)c+_q`YYp<e)n+IlEQ!Y(Cm0wGL}t}FmK;Bko;T(MycTX<EoLJ8qZ~sJOl})z
zZWuLlsN;-e%}kwFw-QR<lXkuQBz5OUP(B4c`dLXx=Z^HwHg1Yq^@1ROjA?0x7-m$5
z7QiCBJ4G25#&^>yDrON_yJv?!#l|v3-s4AJld`0IG<12U-QO!y+dX9JI`+zX_2vZC
zT=M#U8Vq)y5mr}t@39eAsveP;zHnYWy|+J^QhlRGpxxeqngo}3qviL1!K8&BiN&0`
z8Dp0GZDJnM?FgGR8qUqvhYMHUH0$>?4<2d3XLt@Xe7$bbWqkR!Nv5v2Nvp;)wV_XQ
zA(Srq?lb{v|59<YzR3s^8=bg3fxzpY<+|eL%Dy<EP+bDNyDE}n%()7M{lC5-R>WT)
zGbDS{M(a>q{j;~9UOx8+lt5-Y2EBYffwIqJvgp_Q_lGnYUS;5&+>r7w&Cd(j7IJ;<
z+!f77o{By&r+Z8kWS;UFJxE(3e!n3oNuD)sPVu&$)~C=nkC6D-hx;I~PEVn-pi>s@
zEL$9hts5N_N)uG24^5)&)a26Z{O!B#w1$xeTaj^s(;+<e8F*%lV%N2<L<$mEq|0mW
z-IBLtw{q@Ru(2^msVWtd=;(g3JE|x4xM-9TD3s*O6|R|(#P?y^^2*1*(yjSdMHH2K
zgJ%mowsHdWFJH7YniJ)}@$KZ|yJWStNJFyAJ-yGWc(@Lx^(@0mEaYB^Dn2wul0$}v
z(7B~w5-4B9J66(6He@}!(C9m@&-h?<)@wn2>#19c%VUba++DX;{0UJJd*|(nJyndy
z(AuO&Zk990FkyH6s(bAm%e&lEm%TpMb9Etff9P_Yup@Tns{Ut9$|i{;T~pCj=K3i+
z@+uHqt>@n2)6NObtC;(sEILf~D*M(U`ODQYVHp0Scg=fyIj@;Ze=><Nzrl3A#Ui5*
z3>Dwbuv%V!OvT8SB_K>ETx##^4iUu+Jhdzw=xF6w62>Pvg=!BEN|u<cDWi*;&mFZV
z_u9+c+GjlCGBGc!aRRkG*OosEeUgYl%4%)z35&kYVNd@J3SPANJk+!HxX59E!-f?a
zIQs{ke_zD3(|>jSCoHhZc}l)K^{k$A1D>pu%QM9x{`>x$9v{;JTZvQRKg0#aJfb1K
zT_(^(TjI3PFmH6N=fZTe{*ELrFWQ33&h6<#C6%FagtObtB&XVoztHI!A@+9Z?Q7ap
zx`t@z{-4@^tO>%d^{%Y&CaGf{e!*6RMsO_uX#Ue7eKEKUac68O``VlXd&`o6jjuGv
zoKp%%Ate*K)V$_59Dh#Bi{yBw86JNU)<s_%n{z5dRHi?hD#iiD;qIP);3?si%KKWz
zb>8!MBjM5Ritp=3=;-D~Y+VFXCR4}CP!w_nk0cUu`ewF4&nQIl#ufowIPI&UosMf6
zX6@|%@#U@aoOJXZ{#v;X9*Y`VLMe?w<R(!`CjAx4<#0WNTZ5+NUWRoFrOx5Ek{g+W
zO!*$w7~=Ncq5Ps5%B|@%<Cf{cvf8b@%7!WdUoj#TP(%i@0|NH?h0n(Qeg#4l^YLcF
zk<Kq_98H{MLUmtU-Xkvd<=*+mB^cFNV*rM>*z&X1Ki*6Kvq?XksBYfZ5y+0ZZ}YSw
z=UT?>M@;_fc2I*~kzq+pAYRdnea#p!<6*x1eZ8P}T&!%LUsgNZx!+3jiJSHvI{8He
z*6!6qlbkTOrO0Wxh^UXd#V4log~(`hhZC8vNA#Vj1(bvfc-mo2?rs%INKq{Fo-8iq
zh~%06fFPfkQ7VUlq<C!QN!r0e%;GjWx8Gif))Teytnz~WUSiI1@6N~g*nX4mo7egs
zGh7MG-ZV|^r!(A+DIK4?cAyYUzV9b_)m|n8HYX>tIq?ayt5$Vyg>J@}ODd^YI3wE2
zO@vs@E=y;uU$HytM(t-6hyJ>Vd9*%3@K1<OSW&FmeqTDi$}8F7U^*ID3t?`rWcst~
z0d-$hkI625?!BbT&VIZFUD1Uzz4M$P(cXOI_8uR_Ty$&`1zH7hdC{i=wOxbq2(3T*
zP5Dz%4!w4GFkD$`Y*}CTzFPH@V2564SrWZ@8lGCHvSa|q?T>o7%#+lDe|noPQQUQ&
zA?z?iGR9ndgsj?jxd1o+{k4;*^=gl>aq4>~z24WIpXLE>TVE?)BO*zDM9^poP*(Kk
zG@I0rkc$s86ExEk(`n8YzR>CI2LO~uT`-#`ahAY>9qtDwchnM76YcW7^YT|qWrOQ`
z!}!m6e51dji`EO6+2`$eSTZ%QsyA-HRCxi_9j+!{=jn`5md37Yy6?L*e4pQ3+=I~j
zf(plR|NJ;oOzO$?*7IZH6GS-6`0C#yUEn}oZyUaLO+ZA&z9HCSGlk<uWF<=u+lMmM
z?fcpB_m%fSRuY$Kn>L*ne-A|cB-^^eY#l~{kHW{ru**(=w$pRCXX8Xwq*vO6WtGxW
zjCc>LaG1jy%)SCAF)#c2?9X2cNBe343V;1Z>%F%hOXu73gmq?YO>4CmPU(2sBYVq}
z_tsFhCd4I?{A?AqtR&|nxhzXUWXX<rZftE*XWvXW9Wew%^s~2q?Rq0)S=7m`8c4qH
z<$Fz4H!^IHV}9$79Qkr1(6K5kMEQ@(bNF7DSUh28WF1{v1%&PV8C^vs6-q<<_2>ih
z3#@FM^F1^AXl0pJnN}XmpiB(lMb5u*|A}M8-}-Q?{e?;#y&1#Y1aYZdflT;^?i;n9
zxs^d2Ohum)$}*in@?qkgb>p1p+fq4KW$}&=5pP^1uF58!>1V%wl1;TF>1gLDV12cd
zd4S~;k_g>GZ)cRbbRb1StdNscD=L52@DE;S@R{IskX@hAOZs9kCz}jWT2h-Er3!yR
z_d9FpBN%-Qm8tsB-uswp2VsVXbBC-cqI7j(H_1$OkuX}a2VZlR_O0y4nZ!GgWG|A4
zhF<0Vz<}4h_oY|AA0dGSFXBaxA02&@l4|fYzu*!<YZ2eq_h;*vpXne(sWoC7xvj;W
zK?z?N4rB4HHF-0)p4{#R&D-OGY?)b3J)Ty4WuHYK;SOEOznmdNR|D)+9bMB0sc{g_
z3-#-2T8d+jK4i}-F`SDSvrC%lSOl2I`DV{`@ydA6^ZP8`^FPU1r_8KGCZ8cT|MT3;
z26W$4+`kB&4?e|#D$ok_#7=ihmcL6(-xmc6(>71%p<G%}ktH@WIF8-0XFuLFwPUPI
z6rc!xA@?uSU%_PiY1Z=V4q{2Tq0{&@QrE$J&Z>)b30idW3j(CN4Ix|Y2uc_0y0xJ=
zu9LEQi|2>xXs(N}Q8oql=4pQ`45RUuoX*(xdQ@7#w!|&#UE_v2Q7}qfe-n}4bGTqZ
zyL|+-W?(LzilS0+NJ7#HV*qnttTE-n5`!`>Z>W%y_dgg+u}%_1uSDV<Mxi8=nK!1e
z4$7s-=u_!Ig#^)?E4^Tx8>X|Ucbt#2xm<}azw+dgR5%INJIRpqzR$4!;Ut;3T2f@(
z4{cvfJXhZo0&&mefx>72lWv$_$TPJ&Of4=*ap3$@WjJ?nArhiQYjkz!FWt1Hw0HvZ
zi;wGC`ahGsEHF&hy$j23(juGQ5q9LyUU}P$e>JU_bgJQ{I@_x^kD%h1f3*2ozKAH2
z2-$ZPNI)lA<shqsAoU%u(>U#~pf1silaooGFhdAW$cx;Qx)N^EJGG<=<L+b6?8)~s
zoKzbbI}$a;JF?3won%j|JT#DXMg)e8L2R9ri+AhR^8q_{nAEn})ALQdc{E$C^HUf%
zxrJb>oGWV)&TX}8@(&*>dh1EHgOocqi|h&6bTrcZ59pe&7>TAX+`D3aduKys2lO}3
zsr!Zw5L4S!ev5Lds>f;7vMJRW-74e4h!FXaOq$qZwFUFloLT#vwSr2aN*<oem}-!I
zkx(>m;5vWul*|`gDL3>kD=EPC<~srIz_7$pU{@5nZ|OYaOQ!eEH^0|?Tj(HZ2jRPK
z>X<WM=L1#AfzjP7qdIp%A7Ki&;<-gic-uu|iihexWTD!-h*>L@Bg3#9HqOIsh7nvt
z{--b8rQLO3r0kE86hshoKe#vNvxZzDU&iZJ<^56Ub*YE@vzX{qN)yu?BEK9t3|p!@
z*4()g>9U$x9BTK!pJDFe6NqSP#HiIMRG#z*qA&|6S3kfV3WaHb1>d{Q6QbpcGP{3h
zn#YIz_PI%PpTt@9b<(cdJ>|UL47V4f_WExOJ)9nkR+!E^EO=id=kK|h+W8CaV|k(G
zt*%d`5&!#97aa#3A~8#}CNOKRz3FqbEwK|=lKimv@larV8XjF|HK5Slh*GYq_fo8j
z0;Od<zPSL{WX|@eEsD&V$F>aPt4Mj?sJX~jk4u8f|KpeBVYBG5%^UL!TwWwh#iZf!
zvH7W#cOf&|O2>=uI7}tHX(#o6k*#a5uJcWXg?PSqysC4Z<^=dJlW?7*yT^<AC-2cQ
zGt+@%o$%(fS)5YVy|P|KC@!BCdR&|^JaQjSsXRjUdo)9rdWbqQFoJn00i}tQf65JT
z+2h6w+8wsMT!>t~X%vFcx?41ra!|@oM@{OyvWM50H}Xe|1~|c*B0+&B)3y6w?7d}F
z*88?LtcVH%N=S<!9RkuRA%Y?y4bqCl4FVz!(xH+f-5t^?9ip@#4I-g*gM>6Z^Y4ni
z*52nl&p!Lp`;KwGImQy#&Hbx6uX#m}duMZj<|{Y8_EZ_^o8q0|3YwE4txY~a)`=q|
zx}?Js94kVk?isuNDG?BM*=QBLduaWRn)5S>-gaTWYI2P1NZyQE?UI(g;47*zdsgNw
zCS6oHRJU~AIUGhKD-$QjJJ>DEE!eePDO$GDq(^UTntv`Lw+wav=cf}+wT>Cwsnnm{
z_WKe!XIg#Imw<IV(H-mL8N=+>D{_Pk%^2zy`Z-Y);bJ+nE~V!PdR0~@lN?Lz7Ez)b
z{a-`^8E+|YwRti8tt7`ejZ@5BaRHTU^Qs&DD@e=mUAA-dI<fbWyk6rxI~-I=dmo94
zb^o*+;X}rIs`4r<H8s+~KoZq<<1-WtDfbgoUDkO7*6MjC&`f-K?yM<%3G+w$7`$4l
zu~e@cg6NBWzk#lxr=9*Rhf$q_&a}k3P65PuQod(GP?u<%jG%uzoB-;F=T94(cO_GL
zu{Y7~{VaRiyd$xL2n247+8q!q+NXVZv#!IHk%-O{&NgE!*oj~B)FtqBL}KZYQKD_G
zZfj|*Ti0j1v%=H&Y1r7V|G85Z>vV^qmUm5~IjhAph7>WQrd{7Hx-q?p>~ngv-gag!
z*xky!Gab!2;%Tvklr4K-KD$PIXMRsP<U04`CXlf?SCKl#xb|lq#ozXaM#pP<3s+bX
zqYZ6_-O@+D?++~~g!No$(|$#{GMMW~%+RjUo+5rdn=x>5Zz$Ah@KEo8mG$>Zv%AC9
zs&YA9pIvL-(ZpqSIxIYAq0VBG?~@lYZ(f0LgAj3zf{BES)$`Wl8o5IcY;xF`QuW?+
z4eL^rg!Sm&eSdqr964ecils+~2t|@4f%hybFe?N_oAssj2%&bH1JCe1KmSFg_TK#D
zE_wXh|FQ+J(N9xcOC58AskzoF6$@<^!XY+VmQhxX&hWc&d4icCn^2d5{^qphNNG&@
zMke!5*EqM`50plAOgI~$J6Y1o8KVTQJI{gOqcboeg?8(Mgjh>l^(%dN4*IUq<eh@E
zV%8lvigZ%fjDHlxbe#y}L?>gqVrsv8bSvgwS{W6s`-p`bb=rGnP5c;+Bl;{v;CsIQ
z^w5hjAdqsNAnwtMLZYn2KC;z&bBEU@8dC9yi6h+1r4&l;<-1<7Wxtl7m?~wsp*rIP
zkeIBN<znSm&ltb!M{^m)*c}qLk_f*uQ_9`l&C23!di^d{9?R4&l~QT@ieJ4|^LB@g
z3;4$!=5~zAkW7^8m97^2rR0dlW?jG4Vv@P}929nJ-#E?E!*}gdg{z`op!4)y=iVVF
zQ|A|rsl0cpYsU>HM!_~tN;C-9n{IT^b>0;i?S5&5wXy{GBNnzbYDP8LKXWL)e}uB~
zW~e0;xZCDwn|l!F&`Mk1&LL4yGOwniG)Te|Us=m<#FSc#VcrENKb1hQH^5Jr63iH)
zi>DVmsaL-e_S-x(2{K4|MSr1L@&_j7BcXE1e5gk6{cAN^NB<NUuy-Km?qS+kzs0G_
z^+v2aBOY@JV?4B3Z(qsp)K?QlzcxFk3Flkn*ZG#0b85AWw%b&5RcX?FC_wYRx4WkZ
zQG}Mfsn{P$1pEDnk8Z-hwbkDUUfW$CI&U>3%qpGyZoINbHFOI#MOpg}oa8f3@^8N2
z<-1#<)R^2EgA67@>6_M&n!#ZJR=c($`zbFNh0F49>u$v+%`#=i;ZNt(g$8i5?M*a6
z6uJ`op83&`#c^dr2kyGbM+8fW#p};~lS6sOp8c8`=7T-QoP)DO8dUor7mhE>D5#~%
zl0K<ic=F*rF0P4WMSF`<`fFWMb8)`?Yss#vwKU@{b;)v#_%>O_$iPjOBHu}y9A`1w
zYO2|ARC>N7<n3S9J#d3*tDg5^+Sh}cAL6aGC;7iEJ3ldA|K(V?ss;s6d)a|E77RYy
z1Ec@eF_7r2dtmaF(8eG-!OfSop)=SfFmh`3U~RPnUz0U#{c2(VQsXPtAX2Az$@0ZF
zocnai_iKq;t{avT4?!Mzp@kv^&G*@2xhx!Y4M{$#2)eAdHpmRLEVN5IelZ_x^bEFO
z{8$?I97;*Se=Q~T@GD?tY4o&0(J^hFcxojb&#=2ilj{4T^GKk@3;I>bDoc|1S(?25
z+9v4>OB@zn{z!??*=L3v)okPCbP_}KvEQ@$zztB0?b>g@fr-A}4Zxe%FvHT0O-kKD
z#8&7YNYZMr(PiU1{-LYmI+?K+RRQ`lFxS*B**Tav5&52ZQrJcx+rKPuVlz;r&`Cy7
zuzK))RiXvs-PgojP|w6;nnAxHCs{dxjtD_EWMi5%&`3EUmR^0*&4n+Xb7eNsU!4@~
zYG6f0;h`CqXN>Bz?Wy^RH7K)Q)z})E!GLr#kH>Zb3l8`V<bdOJNQnJ9;4<O2oD56P
zj?KSNx%q<nVK$7SnUsTNaFfQHqe`XdJKYf8i>uxFwVcCq*%mE1pQ`OT9^J4et3h(?
zxhC3x1TfN|y1S+}IT5%q|42_oLD_{0Sm!M;n7|?J0^YIQLv|Qeeh)~>T#DUO$FxCA
zdVP*MOBh!I>*`k#E3?nmoUhlMb@+?^JkL_~v<2&1BgjiW3DVGugRI#G8Bve?c5Pk=
zU(KtzgtAcA=#|p?7{-+Kb{&W~@uOQvl(=Nd<x+|G_>V9Kd2=2}rT=If=2_5?q{|d!
z+Q8xPhA6u9ls5E`-L!jvPOCGAGB+xC=fq{HIT+q|3X3oIGf-V7jId1Oko9M<=<U~m
z?pbF-v!-PH$R0=@498Qaf59QXUJWoSC6(iBqmAaB0!5?DsqP}#{LU!Qm861}pWgwy
zidUGQ=Ja*B+>S97WjR8K;c{Lr_{2lI&S-BzAlob+PYmpO8`gZbuBwa!vyGIo<B!Og
z3e&7?KrM%$dRY%{_60NP?Y(gzX<JRwu79r|+MyGlkdFeUf74s+)4@{O+8W1Yq~e{-
zmHSp(Yh^z^eb%xs=sOF($X6#!zaQx0!Sk)n-%-d<i>`^6ztN+@l%_7F)g9=1cfgvl
zJrT+6)d(Jnz4Y4XiTcD+Hcg~|6!SmoIStx^UORv(DCst|_v(Njn3+fDWI=a4#u&`T
zf#BS06&!(jL}^8ccdosBY~4ONn0-TUs5L)qEt&*691*VjD=j_sC*wPHLlHz<$gDhi
z?bgxZL#|r3IE|U8<Ue0&^?WDuPfBXeMPTx6xJaz-R_W*~Oy60z#v?A5cebiDqd>5&
zKowS)_Qk)hFgaTN!Ppw-oqLp!>HJ<gKgBZ!=?uBf6d{^Z6?!P&G1QUry*+Mg{`NR?
zkZO^-2C4+iZVc;KF)d9`OGu#+SVY?1wbmRFP54#0>p#VO0_zaXYXGC~SLg@+TL^>V
zFmYde;nlRI%aRt4J;JOoJ287$n9x(SfU4ihZJRL)44T5;n;8+CsD~O%hOP23eXdcN
z%1&%j2GNUK&&w39Pwf-eQJ{XTdZYMGwBy?U<)%i`gwAh{&1^y&M}+lM=s>cdmOAV0
zZm%0#jM*^xIkY?s^*!zE%e^eAtn*U8dbyck-VyIb!GW2WmV4y&><mKLOG{A5jH&P8
zsEh@vN87JNNQ&O~8~^np^6I&atI4wbSd((JL1AH<9xoe<`XfVWqo^#|Pe|ZN>3beC
zn`KAMr2K)Y{+USLFLFROf6rf47n2VnG}peyBsO!9**Z15Z5zJm+^Tx|DBQqT*SIII
zDlNcOy7n2NX-hTFoE|JCw3m-zDecQrRXINv4WaW)010EX)Xe<tf47iWX!W~I?3`yZ
zfDgpNhhSQLBLY09#(>KG?8tm37|v=<_OG)l=VZfdN!XG-%#vH$lkdux{9O;(1I=nJ
z;1hh{23BCGIpJT_rv_ZS3Si2ZnR`wc@ta2=%#@WAh~r9sCq09NYnVKZFscQ9IbBBi
zM|_$7QE6-2n*^r8gpq3WGi3`+_g_>;{_HMAm5csBYDR*=+XQm`VdvUh3Hq@q`WVdx
z@sD4JNGZ0A>VS+TiF;ou;cKTT@heVrVKOVLhkHZ7+sv6>Y*E}{?&JD&LxNsU=eWvD
zlfZH$vD=y*)3n#^;tcMZZ@3ssqpC;_v(Hw$3076lrMFHOn`VN81i(14)62GMgbYPL
zWHg8{m>(L0q&)~IzNk654`zQw2BQ>DV<m3^RP_9GY@l8l{)t7{oya%B;&MmzFl41~
z_g*?NSzUtwU@P6rRR|x3v>pgK*|#h<uipg7r{^5`lh;3nn)-AAW0??UU#vp{Ft}XV
zL1=0_hCP}1Pe)d%V0o)IDn0k-B*>;Z``PomVt|<;bMv?cRyuqrS=mB+AMDdtoDwBg
z-Jsaw{?}qFfgx#%&?YXB{K|r$X@6E#=u=p6#4g*re#5y}njsJpDbph=Oz;L!T+gnm
z;Q2OQ!1;t2TM-9V4MEk&`a!&UU@4lD{-$7bxu3J@@+QAekio!3XBP&92^#3gGSa@$
zI1LglXvVh~JYX<gILKBZ5*)M_`USoKvl9yN!F`2}#H^Q{#8t!B#8w5W3A43G*dX4q
z-5-F`qf)YV*kcPsW$Xt92W)8zT=zQ+tB+oROD7EpLZ+Iqoti)SV(A%kEihdZ*XEb=
z#toFMm7Z%I(&PggL97FV4YrpfWn+idSHrJ;>v`#q)ltt&ll6d3T{NgFGDBOPO_hB<
z${N$K+I}^gqYr2|adx^pm67N?go^v0ZA<(`U%dRaLlXYBLq1cELH5r;wA1Lo+_5bb
zY5wv+GoOd2A7Ij*%67}7MZ22z8ng22gPmz{qKI_+Q#l8$_1tj&N!4#9no2)GKcYE*
zlvnJ!_jCtv$;{1^Zl1iG7BQ%dx8_dF)8Z5|NbmuT+lM&+)N0f5FXp*9Q*yHf2zb7!
zlM4w{q|RQ)DMLO4Iaj#01pO@r=nS`H$ih=~NlU`M=w1hJ?`Xm10j>6qV%Y*r)5ZRh
zlY{z`4msx>&zSx%ZS3d7J83T^{FTw!y@`&nBtMBspNV(M$V!^M_TtK$A6jR+A=fuA
zVdwpc&0#<2_YK59!&oKLC=(hl4M6%X6a+{I%g^RbYCxez$mvL+grH7xEWOC{iz+7l
zz1@-%YYex*AJr+NVv&nNR3L|mBLQ2qKM-Rnt8&l^HGA52QBqX)x85!6`La`RLCf5g
zi{2*8dAw(7<tIas=<%+84bsyQ1wE_BH1(xFL{Nso-khmxN5VEckmjS@DbK|x?;PUI
z)0Y8je*7<M-kUwU@iZga$WIqMB6cme8OEGXs-OqprTf%p<{1NnsnI#tD9lo7?U~JN
zrMm@xLNSMjJ+<{khKNP8&Au=CW;%sJOSY-V6bK{zZ;`e2x%wphwOV7eB&&4>KU+`p
z8quNQ)=N8Xzuo*l@))w1gh0%tk;d_6V#jJnl22S_{(%egoV>dE7MrQcJ8r2e*uB>A
zi~$JUz<S>UtE6Xk_jOA)O`Nm+Ku_-nBd5PtZE1>?i{TtH(JMZ@MpadGE(2FWxjiEv
zI>{+0-&5~hu>FjbtR2!BUGgas|I$@&ai6BpA&7CW2G@wiW}#A(dQf;j9&M%MTi+<?
zl>%zt=f}%K&WOfgm|ZV5WLX{V0!%p-Bm#RsCmEAst=puxa12&|E)QRa@IbgBChDkN
zy$=7dd35I;00c7vbHCjJ*mxcYrIQqA(v&65s;P_=ai;fu$?GR8FcZcj)RkYoSP$hE
z-xS*xwT*1-VF)gY%gBdNt@Yy^NE)!5dMw-~A&3@mTz(lA`5qhOY3H7+I2=$NsY1kc
zWD_+$!O&$TEp%Q(MxRrKX|;-2=BPf4V}X-@dhY#GgSz8DGHbf$0uIvE^^-MmP(7NR
z>`izFkzO}#C+ZKg`(}rIG-o&e-R?Dpw|7nqlb-5@h429)m9bw>giB)YXqw}xA>Twe
z2&)B31%Cx_2V^P0%OWGt4M;38Kl2B6)pf4wG?HPOwkM!-9=Qfr4^>FVj*^k0YHTb<
zRW%p<VvtB_J9fI$fdTuy$pS-g4b_D7eL9)gZRX?r!KU1yL*H=KrRR^n%ts{oH++AQ
z&_kE3By2!8%MD+!sA(Xy^NDX>3tK@z1%csW<$&8r>9@(Sx<P`Z&znO7NTqarr6Z3F
z`Z9rk?aS^H>_T63^@_uS$p<I;G-)g7#y|7#fy_UZ9V8y_Z<Jze6u2F+Own&mHk`SX
zyJrQj6+<q(4QOHdhE8Gv@US&`4c+!ux&*=j?dJGHm{eIS@rDMk$UE7<kmzgnFhd({
z;s!mXw(c0PZ=}x){}KfwnkW#<d6^fFU}H|zLbWT-Yf&^&#(G>9{b~l0JCPhCH5oSF
zmXfC-f{-;P0szSQn8$U<!tGXL6n^_w-|{LFR6qLkNc7M(&YI<6AJpn+NvCy>goy9|
zdRA|%G^tGZTeggW#X(mHk-lFP;&DgMcs(!X8nQ)1bG}VBZWMH4n5wm@TJ=vRx}_zQ
z=B9Td*?@aj!-nuxFfa!*#+C#ulVw_R_&5;{pIM<;t7cMi0kd7vqdDJ~g*VXAM_Ba`
zJq+iJa*H4lM=~croS->D)*RNXs$V$H8AibSbwr>EA6x4E`=$v{P3&}GSam`)4l6pp
zq5j^4c>Q5xuQNEU-Zb>WyytrjmM+v$L+D!Zn%w~z{0#ji;7NskbiZC0#!v*`nG!}A
z2Xmz@(TAcMP@0y51+MQV{@gWnCBN+&vhYv^x3+<yDz#tLV)9lUw3|KP)Ai<UN!ZoS
zO>Ub0gckN-Ek$v;fgd8qCv`9n0e6MM{5OH1UKVC2#hFkxX283a6+Qi);MWWPJGs*-
zM$9C#<eVOY;aJqz(q^GwI24arwY5=cMf^udtGibEmG4vNfD8ffwQ9uuv6rg%%V%;0
zHN55ut0~hTPk;23jay}Eo+6T&sH=`t>vckg85mV8RUeQE^<j>_UT~=QHKGTPL#T3$
zxKsMEyiR_bFy6rM=BBK)t4ugI3l#{<a98UJhzQh4f=YGf%=H}seY~(o!-~b$wW@ia
zz^VEOQ}SMnl#a%+Dq371(Vfz_5}s*wLSr%qj~QeWsJw!%vplk?Nv0e^q>K)<rXvY!
zQg`}*ci&>`)o1m!H-*U_f4|>K|C+MYaoa?8MOxntaN47DV6NTfWl?QX{UHo~ET&eW
zM%w227otlGJvz)NQnhX~s{31Y1-jKDqNw+D;{t&>bwU(pN7{RG>sq!FUC2f+v3S^Z
zL=r_D6)&uk51dTq37{KK=<x8pF>W`-%3l427q|*u_`;z|-Y=~@!>3>?r2C7Sqt!Xp
zjaLe(ZZ3V}Wn?GW2-gADud`*5QCB_TFsC$%>G)czqXK5a!B5*;N?gsDrr8C#`voCA
zv&5ppV|s|CU>x1?5YvT4gS}(!l4!Q?4-!QIClbND_y~Wb`|`cnq59+PfUhZ<Xuq%&
zEzE1avZ}xY)9(qaO3QVXX0$xAujMpi%Bg*d>N65EU;VK}ZeOs|YdRX#<M4HFPH%H?
zp!Xq4B4w?s-cn7WZ$fzLAk`UD(-jQX7rtTLR5mu|fGuU%Nd7nA|N3cEsqCdUqt+%$
zOF(T1A_8ZLBy!9Sfz+l~Nblg<zd8jt&UK(YqNqUv&FdfBGbpBTM`j!<;2xkulSvx{
z_y^PPBi<Rrw<k3vNqUQCCMWgE+)tqRqMuAXkI9B8FXyFJktnkO@{=Zzxf0npgRjE=
z;Ip-yR;{zTXAeeiAD@WcBA|bC{hHEm#4)i3yzbj4;0zFo(i<Q~rBSe#GJVU@JIday
zT32<6V|Q7Q0pVY3vD7U+{H}ZK`sP4RxBXyIE_&^AItR^V<Fc~FDd|(ZkJAJg(p(z1
zQ%l7Z-?b4uW=v6?gO7dhidUY)EQJ;8`}SA#F^r+XZ05*2o+fF;`l#}GctZlWO8P-B
z*imV-`EqXDPf%~7i+}xkR?(`BOVw(iDE^pF=e|&GyH0|;Z3vCP=CB^PNH~(1uF-v3
zsAD>b8N_9fs|Ku879pR!n|;@Vb2KOAz3bMES*lgHQA&6OzJjQi^5*_}8Mb=&$&DYF
zdr+$x{_1+onImRJ67#q>K$s>SGONgKNt65><;P5|@RgAUYM_mgH^m2hY@NS`nLSOF
zUzPx`iC*aF6k4n4bRzhji8HJu!y3*=!_4m3;=NQI3;8ZwKWC&2aEDrKU6-;Q4eGHM
zkKwuB&f~7J_lyB?LoL&a$Ksexl;q;0iA05(OZ?wXO|*B9B1RRY2|$^bPu_Y_SCG>9
z&~;*T#<=S961Cz$R5GQ;OX&ey>F6W;$V|r}T@vK6+(p#@EsfJ!Xtg?$R}Xa|qTx9U
zy$x-}A)6)<;+tc*c#4>h=^WFeeuf<Tl)#Y)K#NLWs*4Nte|c~n!_+8x9TCm`iF4hQ
z5yP5ac=d#D{Y`fxkQs=~oOj#qyW;!MYsKl<AHj@<Xd#PgrRpk39azU=!erKD?JWGX
z>Clr>YnGy!8#O>S;dMrp^%f`@#yMEz!U}-eSZ09F(-TIN{S*~Ziwx@C8?f43$taoA
zgVJ%>iNy3oH5^#I7k-v`pS9o?sDb{O)?vXpR3G#AkM@l~L9fYD-L@Xi#;%&@POo>o
zojoM4on7H|VtSZes^>Hglk8{l_p<b%tCg=%c9XdiI>ZH4cHG2>7=d5OxU{}vi<c;n
zVT$Z1FliTC^Gn4Zjns~qVm7b=#aa$UZ)<fyXA_;&CP3q+`7Hi;6gYa}qr&LBom#lF
z6XWES=N~-3h2~#;kV<*P7#1*64SbAyY-}5jG5j{(`ZxPf`I_7@;QV6hn8^`TDmuW0
zpN&0}hn_>5r1&`wiYoDPN#4sSJi*KPbps$_;Tint1p0{qZgs>dZ9C=7Zt$@++WAWo
zcR^1^C}^ravkg32)ZI-``^y(Tky*d?7_Q8?354JiCsFy`m)uiZVmoUbl`lnZNf*GL
zCy&?x+W?8EDb~Ut<Cz-p98)O@m=XHMYPH1-S#QkPvanM1kAh<1>=mTI<eIrn_IV=!
zeP*Nmb<myrk>NI?@|qpCTjpHN#QiG62wbT%7xUuhRK;r5(qI|oe&0|jTYZ0v^7zG6
z%y5@Le=^eTOk?QnZtK2GpEV;VWpZBM>>iVmd6ppUX4WOQKhmX<tEcf&G2B-A%h8(}
z;lTr>kL%G*>wEiS0})vt{@kX>sS|;c0&6IF<Z%(0e$4EHXW!TKRNUv|Ftu9R2OC~B
zXDah4{KA6FQt&1Lrnc8ZVi)Q7csidXqX<mPzjb?k=%q=K2_Lg|a?jf0WGsH^af_M$
z31G`+tgpo_*TpPyxl@-p;xE!zQd3{HtnK?)?@hvk+f|bKi@!ka7~}n!z@nQY74TKd
zM%Qr(RmYrlp-vI@z||vC<G2w0xMN@`=Ksd)7)3ALT?~q|GcO71FngR9-ZZqq0ZIz)
z%Wrb$GI{OpI&?R^*P-KPUUBF$!Pkye?Y(nparhRd<sg^gHiI@va_WS3&DTnKKz&1k
z0<V9V#^kKnefyd2{W};(*IPXe7T&l^oA(lQH7?ZbrAdr=-?sy}wfp<<zc+rWHnplw
zVB$K-o=)MGUV6#B=G~h=<+4N}IU$|j8x*bkG@Qy1j|=F>=lW9REPLniIPo<H8|_|t
zl^!79^)=&H_Q^D~62}V;T}Ht{sV89E^#K>(r0hBB;m!MftM^#)RLYNDzqU<SKL!a|
z$b$g(64v#S3P0DEjX9<lB_B%r+h$o3W^<9(_SMMfj^!6-AD+9cJFrsGn9I4Q$?ETC
zEF?vy)<@Qx&Q$iG&*CtLF?i%TLV!PaKs$0u>AsjP%nGrqlm&WyS@<G)E5HrGNP3tx
z1&^x}VJ`{4p?`$=Bt5V+EvKf6^CsBO_UC!^t&VL1rme9l;R-QyYO9dJH~zTnP$1%1
zb;>yYit1;C6fR!AaVPV_bTmZFaJLJ!Yin8@6&0=BVE{!$W}*f^n`%E@{9<GUw|9Q+
z4dh|Jo4E$wOn!vvclk%zt&eNHk;ti|d8p|EdA!ZMa+{+C<>WHM=4~+Yyr#F=)035B
zy~$8ygI1GJIuuwRSy}bIweKB44x<!)fI2xp>`vnmW#ftZ>_En<u1KR9QDqPbAKQZh
z{9m^!cTuu<xTwj6F|$Uk7WI49q4c}AsvpM-v1)n~>GKTtS(q9Z^r+tPtHP{L!4;yA
zN*MIE(S%J$|5L&<27i4R!cQKt#*t~8-BL!w6?|9t@~0x}sTJtoi`*Yyjb+|cvzq5V
zsIghBr4K(6W|aAssvC89{@0xNNLq}bJ-@R%BuWyAKhU<$<gL)5c^FueI$SpY7Sj^5
ztg>P;TawfKqXIc4Cs4w7zcW6O+d8nywr7`5t_$54j2T6O%gk<ty7K3Z&tY<=5sQTR
z3bS4^XbyOF7RUdiI97A7@B}siN;C3l)&{e=An4$p_E7hMV=5*4@HA@Ke!{QL0Q1>B
z8kf5?hF`SHqUiF3kWt(0*Kmb=?pWx?OBR-2Cfahl-0Y;i7rLS6Z>)K{2AtceQ8?kT
zHI|>OUcW9LJpze*KmzC)^>=&kO)k&rq+_lkl*+1toj1qUHw6#*u+d{!^)xX~2FvRR
zXD}_QIhm6)5gC)k)JH{YM&>!wA#zN7Q#Q%X^D)j$))rJ@iShF<yc;pM&s<?S8Ckw^
zk1<#HA*E<s$`1a;zL1={w~OS%P>2zDTC0{$xeAWCs5%Zkd0_K{Ws2GS%`snc@lY-k
z&2c<)u%MinOa4{{t!QV}(3N!Wrb`0Tujdh4D7;ZHocO^cwm|Tt*J2wnOK8cwoOV(T
z7P_%br0F1oNF3>|1M2X{#(R*NsYH8P$?ez%oH7I88qUx7(AOMoqj&6a{;J7HqN{CE
zU5>n6_lQ_6@4X}YGLK?sXkuI1DEKV2;~2=QtDd)4=L4+vqozD)AtEG0g@RQC%o3_B
z2=hl&P(%F=ANUM`(i`nF)%&U{P1!(&cus2Qw@Z3DT@|e@+pEu3QP+`qLl-T)H|TAj
z1Uwfv2Sf)PihG93?nXJ<sdSY+Na`_~s&Uv~dr{l<^TF;8hUq?c#V@_h@7zqWMBMIG
zRn#^nP6oGFzxxWzEM?QAu$GR!qpYjJpuGR))meA~{fQ0xst4npb;=5pG1t4%?5Obt
zF2!GzAn-&O60alaUzhTKqm*0(T6&3MOfmPXSdn|mpGCY<c6u+Ud{zP2_D<%PxpY+m
z#h~aQcA3pi>z3bG@FXH=h_8;Rx$mlfO#R^udy&v~AnmTIZ-`L~L_S>C1mkTpt7j|G
zZUa)pn7F(b%9W2WMe~sCno`&*wA=yvRs*%AiHL`b9ewB3RX0>=fAd8O%OT8AhE}S)
zH2jy=Kkn+4F}`j30OpBR=_V*VP4a-=<NeS0%OPU=P98m%3YGWN&qmgycDbBOc6On3
z%($MfiE+_qrM?<8OkO=06nKl(n`_%Hdhl6rK5UFt95|6}!Zo(Fiy?13q(kSPTbwmD
zs>QLDsFmy+D^Alby9c#>Sq$?;%$*QvERqV&ID2#3kh-2xF~+s_RoKDZ)$*T`r+o%Y
zZ(eD?w0$Y9s6Cpw{<PbsHQ`EyjKRL9>Nt-wQJ>Y5Ie|PnxlL(D@{~m%WvN3U#j6sr
zDz_%8PUKy%NKq6!6MW9UXq<T~THghs0b@5y)iyDRr6k^d(ccomTcH+!e#+&f4klRT
zlX4SPsPwM>7<bumtFI!Tw`xaQ(<(Dp(i3f~d}iY$GIBXSP!-}P7B9V#4^)(JBy}2M
zF^DK0@mC-ls|IG1upqeP(Vzmb^QzN3d`_+(2pWpV8iJ|n{#~<MfwCc1#gtOeVI7(E
zg`h8`Hz|{=@XQhQz8qz=a6HLe3VN7RvRM(3Df;BxKMOQz_0PvOUwBMb?bWa0Az@%o
z6AL`W&QCl;+VA^^#|CD><@pBUjaYOig<R+*w;dX*3Exrg)mJ9Dg&vMTQ3;55=T%D$
zDDrCC&3xK%BOZGSP#a#m$jYKKCI&o@$ee3}im<ktFW#Oi-ThI1M=%Q1aswJTG0mnV
z8z<Szb?r5(DS~Yx=$)pIIpOzwei%6r^?3QCMJw6b@8t`}>6|_G)g_H<Z5c0@!Pc<Z
zG>t<|NKSdxPvc$8#ekcBUy*nKtBH0~?i+RnFQWlm4;)A{U!GLKvt%wwJq{jt`6!pZ
zv4TCVZWQ$5WIH~&M1`8dxu@caM$7}oa+N9)HLORc1NXz#=6R;tFZhyGE0`}AWl6>5
z6~65e%DE=83NQDK<_pt?qdW(<zUNTp<>*jxsX1pn0E_y70fmRTM3@G|_hYt;FCUD}
z_F7Oog_~6`m^RlAT)~gz%lY0m+^J_(tMB7K#W@rpTBo!BSp;YGMYI@0ySnJcvW;k(
zpTK43+)TvYI`C#OZ$e}dx%<>{!mI?hW%^0pQ|H42;F1JRKK9uNAYA9PD=|NmnHvMn
zsaX*C>~AgIORR<gWQaZ5NM5l?@Br^m?^w-*1iKLwG9<~mNnFdsbsWzYEZNr|aFe4?
zqnR{NF9<AecQkghi<u)pTv1x&xl|;S<I|aS>9J45lt@i`&TJyjd7#1FHSoEGb+D$T
z@?}Uv#?~vK*^!LFB*1+^6fJ<X*l{q}R$7p-mixDIfn)0s>@LZj_it-cW>cm*5)TBc
zo$4D7RiE6$>9iW2`WQIy{0W4Z8FIhiZuJ!u61B(c|783@^e^4juRnI5MneoQimG|0
z+AcV<pT?9MeDp^lOTva0h)(M3-%R}0r-S%<#R28%{m;)aaorn|@Vd`^gH6jdj&c2a
zKFowa4yQhky_dl|tl4?L*))V(twUvb@G7}^K8$BF4w=4kt~h+T9eON%egJ5K#>)$Q
zKPX4^H^H-vhG;`>WE$0tF`VkqdHVbn1(}F}EE8U!Tl{jH5VOYw-h|K3l<J8ywss<J
zAanb&e(A5s81i9l+#3MP`V|;4Y`jttsiyHejsQfoJEz2bpC){u`(zk3(d%|~c9dZS
zmqZw?w~k>2TCKBxcmWLe{$wrr!<K=SLB*2<e<RF&7HSwX@NNu>IAZ>AZN-7~^3uVz
zPQ%{2^m&Gyy(!G**-`K5*1@r^IkqPKtez40zu$ma-s(5{s4(%QOPE`e$Y&R##J9C`
zS;a6NocmD!&kLZyd77din?}_TG5#-sjwAdE+V~%qj@_5gaUWyM;cGW)`|hzG%{}aL
z>AmRjo;ry}%yu-Bo2q?&_%paK^dLaLIh_rR^EnZN#RmWbB5vegBJ@@SGbk)0^*MH?
zngh8IKey+(%e0}g_-@JoLhEs~3@@^vK?@fB;GqxUBb+L~T~PBq2|Gay9re<^T5suh
zV{R=Xzr+Z8uwXTZB{~l|SL3;VUVyOM-w?loy)OGYf&*Tt>|+rxe_3!|quUGmWg3Dk
z(-wFJlQveKjl2>0&_(9NQNudHMneAvW*k7huR3G!a}NLr8&G=$c4gLFP;7rhOB6hJ
z<UDbpt94wq6lGVV<JmL@yS2>-I>JDT01}SIQ5Z!^S<6MezeW{UiT_b#rL=GIHj|qz
z=jTXxU*Aj9GI=zd!kypdz*>>yp(M4n<LJULC7SYP{VNiNV62RHzd;Hb=ZL^t=?!=Y
z3uYGq8_4WYoLh~e4$8<*{{DOSe<KW85n~}(k#oq3h<EAqo;!`Pi~bG_#jHVYa!?R3
zQoA>oDEcFR-izA?F;?M25N*_mfWL3Naj>0mu&nVo<@5FTvvAJ@-=q|HmWH_Lb^>#{
zFS=p9>=_#K1X3GJJq1~^9U>%;MP@G>4!Bh4RQj^@!4FK>1y2Z-jfo9_2+bis{8u>v
z0-boALkIJj+TExk5FpXLdrR{&LerG#msc-Px%hSY9l@?*>ZJ6{F;E5gV0P|!MsJV&
zcihE8oGwZ33gYcZ?+C+&xSm_fg=7`j_q+Pst|rvbr^Det!FY~1De;Xv7@)NP<Zs3X
zdBG(xW27JFb8>*MpfifYARyN3^}Ad!xJnNx2|BqiG;Z}V`qahWO))>N4V2e_VF=<>
z9a_}le|#+o=Nsrxs$m-|Pu`Wm*a68AA57kjPiQ@(Zt06*VD}<>kc*Pe*3McRum4F9
z@w;D?mcLjvQN3{Ie!N;f;VN)KuZOg*d?4U8-=O=GIE78<0mOcq@$L}$Ex?1!A~YVo
z+FD9>^zG<=T$X$yEbJ(E?;6<B;tj(W|A`%h``AI!^wA%mz!2KV3y1ec>Yd;qKIaTp
zX$-Mg0q}iQvVMP-I10Ffq!dL=G=YBSuR7?DNUJBHTB<#7j$f&P<~<f>Cm&^@dYT1F
zKQBve;VpY=i7a!xZfW7{OGrIDoQS0U#6ja=1mpno4!tWt@W{g>Ddq4lecGp6`jgdL
zThaJMR=*o?gj_@p|7w@>tExTwi_<d;;ZZ0PXPD>*FlZea^pFcSqWy75&)g9s=R;E8
zWvjq#RW>zM@x?%cp~JI;<IVMH9wwht=*M@&T0Dcn9jFFwz{<N|xpRvP{N<tmYWQ`v
z%z|+>uVDNX)W%#83E<cmk1mYB0wr+Q(U042df3%CZvp7_Q=?-M_7e&$8`+~Hb)DK|
zL2xqWk9)2Bwmvl4+{l3W6ZEv^^8DY?Q;p%0?!JlU#cz~c%edy8(q)lA=NZ$<_2KLv
zpZt%z5*@?DY8tWqKHO}|fwMI+3a`iy&kkbCO0VC+Lj7TkUkN;b1aoQLy&nreAB#xw
zGca0_KjB&b{FHR}x;*XcU$_=*;n%p(RpxvG)cY!y{=3j=L@Y8`%m)pLT@BL!>x#o$
zeyt6}NRJQ9v<mmY2GQVJeT49PMRm-(2CKtG28iLerBS@?V1Bbt1MEZs%a<e{1>8pb
zpVe6`F3$>pcvF~5`}g6^AMdHVn0tdidz}e@45XV78h`$n$0(3z@CIVKT|*;c;t~1B
zFN_Vd;|EnR%ZPbF={k(GX{31?3m*~MiV;{b`V*Vjj($&qb7|VeD^Gkh*BnrI`ZNYM
zy$50pwTyVqBdIK4@`?I>`<~1sqy;~Mi?ZC|I2l-dnrRekRN6Jad=x$M3G_epZeOQD
zJ0o>Uyz_L2!kgb11%G@Jv7}gZgqX7#nt1pTTvvGz%c(#g&Pd3{<Z{|FDS`Gd3X?u6
zDYl2^$sd<$)m^ceK*aAS!=Mnl%2+svc_{m%$y01cZ<OO-F&xcxJ#A74DTyeCNowZo
zB^%nRg9Qy6RHf2E7EO1$;(Zqn<n=<Fly8>rh1%7K*6}>T{I%Wlkk2b9q<xD@4n8k8
z-fzsdzgz=Jm(k#I^@uh}dG!g_P0!EG0qytp@7LuhPA_)i_}V(M6y8`#%;zwqE*e|`
z^ZCLof<K*<74S|sUnlgSkMf{%PnvBoV#WMpoBic~^#A;0(pPlc{$;z1xFY|&pZ|GZ
z{Jw|(_Aj21f#1)gQxhLvmw)H)|G8kuzamzSNtN|w<qFmF|M}0JLO&OA$}{FnY#A-~
zU%~jl{SW@DPyE|o@US2dQz-c=Ah!E&{=naUJ?!h?batNCOq%3B`Oe1Z-II*Ut=-rE
z`EB^yH~ZgwE)oqia1MPk_~yoc@|{&7+tFg~)c60|J@Eg&f;S3br(7A%rF;0_e71j#
zME;AvU=s_=HP&^y@vl(Ff4@L~`@Y5W^<k$76h4q?{PULjcYhSV)OlW5uIl(R-k1LV
zul_sVw|heazL<iweo2J)ALTA0FZ;KC6h30NIV_i*(0L5X|74T?@4^1RZmIuj75?{N
z|Iatt{~qlB`FHmJ<Aa^V;u!<=P;Mo3kmre*|Ff#09OF4?Q+bd$$eEBuzoc0;EptNv
z-Q(H`WZeIY>;JzxtAD#ku^Bv&IXB|)_g44^u&{#SPW>kjWL8Xr0;cIW@XKbQRnCs#
z`2L^V+c(nCBeb7MmwfZYQcKv+H|ft64oAoM+Xw!C{zkw5g(@+4bJ@fg?*99)#y?&d
zUoUtyKZJZv!~dUe(Ni95xKQL^bz}ZVKm45vs>-L+TyMSq2T$!E_jM8$QdOeac>X6p
ztj~`Dul<!hS?2#_1I(i#ul=cbs{iDNNiHJg)g6)0d;iI5{qIu$W9R;Rh1&lv^&cnZ
z->oSBzi_IFr-5i_j#xj&AR({6ynuP2Q~t;AfQ|_OD8sMBVkD*W0cdeO?Hr&v-V*gd
zP_J3U9@Y&>TKfV9>HDIJX{XR6#N3O8(4%GXk%P-E?rxWisi6V5&!0O<j2NTacn!H!
z8eS8S+!gNxwcoHXFqBx0R|2@YOhAJDE@EuRdKWP$248o=Sp=X1RZC9KqXT%F4Bmk?
zq*K>!!FdeEf-p;<pVm79`LOfMC1HJC*FD43wV4jR<6=_4Izi%M{wYf_)rsnz-tB9C
z)YibcjRv@K=n%X^1KhwAxgP1;EfKqNaCO*>@*&b}eFE5$m0;b|=vrrht*4qMmqnY#
z0|0?E@?*-l0S32$(SV>$@n5!n^$Xd}BNzsHDH5wq;amtnW3%le#R&*MaEk)%YE9Pm
zt)IYi#oKf{*>Uq(erLLX0HKJ+VN~~Rr&9eqa9skIj__!tqCieLgy4U(GJ5+;IpW+l
z4DYGSLgByHMni;W;E20XCjxj4>bbe3ZnbK|%oG8IP=m2SUx#LYIY1+Z+g73v8!;KK
zU!Da${zFjL#^16tTtMJv0PJG`sWSVOeup45+T}<4D;Wf7uAgA}A6<mOFIO9FXcTOU
zo95|TbFPPW&PBn4t5LZF0jd*r5R70t;>cIWLo8hc6Zz^-K&gIYQMYFVgr%J*V33R*
zQRwkJ<VSpXcfbc+>U!Z3e9NOxAj}BUSy)W}H71w?kRwwL|CSlDK7_423n58}6gM&&
zm|~p}fk221B}lhzvu|`pjLA2>4b^r^7VW`08d2NG4?j-cP&&HmGPiiX9;C-o6JNk>
z8rO0iA>@tn4LYPm$_Y&s*i;Gbx!7~%+6*6a9aXWLl=c=ZWs1Zr-K$^qKb*aY7Ei5U
zRIM_rDHF2wQ$jRLZ>aNQefY6v$n&MNc->ukr-$PKKTAUONL_b?JU9<N)ZSoF010Qi
zw!CiDex7-X&c2>}FWZbuPt9jKeU>E;F4#@>j|oOM?yq)mBCcvSpdFP`!(c1+KmVQ|
z7}v#~9}+L(6=G%dAl8MS>bJ_@!7qMCjjC9J1J$L~r1e9(g=6c9&ppIuHrHZwJI{CY
z-A31i<=bi+TrnVLpket&2Fv`Q2S~hMwb6=jpnOR>?Sc5_C|c%$@Crx!`47Z2HTvn-
zdpg9=U?B4OIo{nidkC)=gzzP57WXeVRuQ+Nt=Ngfj8YPq2AuDq1WB(6;DIl5#dN3-
zr5WP6M*#RsMfl-Q9n`wHi*F_HxGiURw#pw9+3AH#R+CZ}$Mj4&jC7Ls0F6(T(d0`k
zP>;+Ouv}Oi*FN^KeVg^|3!boG<NzoZRf-4!NggD7zb<<>fzw$2)!(JmuH~`ggj?zk
z_{f>>$7U^R$=s1$c@LzL$gCyp{pHz=)(hEp5F+ejAAXu@RMPC|1>d3eCIDa6%SEyT
zCeNX{$bJJT-5)W)kW$mA{JBzH{HAUM=T#4od9Hj3WTud@$}uco#;}c%DL)_>TON8B
ztKRwZ66DMt%>zd`2=S-%ov5gDEQ3+VPmSuH<(CI`&3dlhf=4d)EZ0RxYn=CO^*$}|
zeJxlj7m2Ssy>IJC=dpv!_(JT#%9}^ZKQ(1)FaMPJZPV0!Io7N_%$}^ba3!eax0E_~
z(4>Bc<mhhFr{kyPbLj1}6D-yO+r0z#%?VbNI2lkNBy=#9ZQy>_>&6Q+j7Agi<O%|C
zHu`R({=%z+?vjBjd@Q2jF<YziwE-$xfzdvV;5LCh68}Tu)@8&$D*5?VeGWpAu7Xn}
zMDP}^4(7zwAw=d!{HR7Z_~HV7Y1csL5iAd*ja^5OEy)juzLri%dP`JYcXG6LhupkW
zk=BEB;-q*Lv6yK!ea-m#UM_OqXWjn>NfiN*WKeZmX8<xEcprqRmJ7J$(s#D5zRaQg
zL39#M6^#BxTcb)-F2c&i4XzJKMAVi_dHC&o$mF-LA%!*cqaz$@9}HG~FN@|P7PeLU
zi#bc@(&gBI9@Vz>Jy&h1YBl?K6ZWw`alejUpXm?3+~$tP9{&CLRD!*4)}}TE$EG*?
zEGH}kS=A1nm-Z{k81CBKQm|I28`E7*E#ss&+gc&s(?gq*lnbATp=8K0=g*&`kJ9)2
zWN%Tnc}LCK;xUiOzC8X8{z#a6=G4P7IZ0%4(0K6@F3DxIn7iy%sNQf)owB#$+X~Sc
zW5rrV+S%WFJCASk9h9w1E3+I)IB&>5=4l*Uv~j6l+`M8p{4j**ORm)3JTezNl*_EQ
z>J<9<24#OZ)2r09GZt8=9Tk|rwN!`Oe|@B2X$bbr*?rr<d*~+;Nw#Q)Wis)aW^FPL
zM7O;5ZO3FkX)P4Y%&4laRqx4dE!L2(7^~`0e&53Kkl%VyEx@2azoQ$|(I%r_UnW;7
z^Cd1#r=9b=oD13+rmO{qFIRWs@HE#Mcx~&U=d-zu^-6V{e9iCXe3DlRSV3?NUX8k_
z^%*!w0)s+3KVJ@OIPirTOO8upX_Rx{wt$qsSJJMS^b5||q^O6xBSUo&g$R+27@xPN
zE2tDV>~r%~0b+KxVFS{s9CXQgFr~kZZzOG|wK=xn3iccR+ycQK2n=@Nw5=Z!hjx1`
zqbfZsDZ`tI&L%NGcEly(U7I|KbEzYJ9fU_KDRj47eH+^|T>&njO$6bc&2nd2!K;wx
zgLLevi@-(JVC=iv6Se1tgvJFyfZjaJCxZD}?<)Hxs6$BRU9yC}ID~4*M_v{*66s6H
zVf{lJ=#Ll7dR0D_epR?t+T~I*1o6*|d@e^nSN1VOa4m1jeFN|Ei~HqY&0I>Q3^-Ad
zsyfu>j~wfvD!4HMf;5AN;Yg4G@OGm;4d>yG+ybeP3$l$)yVygd{IjRpS%F@HuaZd(
zf>qvPPM9qx?^B%d5T{PU!9`4g3Ui53LS@mD$PAKP`io)t7>4Tm^w^_U7TacDJ0sQh
zU);+n9X*%;_3PS|(c9aj)}JM5?gYsWs~)^P`$qT1N>IHvS@v#SHC_Z(NjS?<)pJv?
z-c02S3qvz=Tqj^Cf$WzH)!Ai4J_DDIl3aE9%+l*Ko-br94D$7`ZyJ>*jvWeORuf~`
zWQ&e=3V0M({2cl7QEKmKJE_go$^QJpt)A+}x@XM2MHrvOMzwA+h?SYuW*cyyY(&<h
zPkAKG5>q~AACs;CyG+{klvGaI^(=$8w6s<*No~1ffAI6r8Fe#j<ZgFU@CTUkeNk|j
zM(ntelFVBObyJxkBSZjF`S4c{3zsMqX<5bbzvY&%^MVeFCie^DnO(p~G4OW>3S0?u
zWBtHOe(PlT;NmWeY3@ojk&4RY_dyuL+k{0d%yvVberKDi>~iN*@(Br@*9e{8>nau{
zzsz|_flH`}N64bTr%m{^%RbR@LYpgE_VZ(-RhNx}qmyW%&}SR8q1Ln0)6>~GrF%01
zY@ORsH)W>tb;vC*tJhxnP(1=;S#pi#_3s~CR=n_3-mF7GBXG38y&3N1NI_{vEhcc$
z5~9rB#d=NMO?^smm04178gWRxZROLlPDW+<v?0n<`!($-aCSoYU;fO2>(=s$rfPU|
zz6l0VVv)FndCvaVuw<j0fU)8>lZO+JZ*<9$74oN%3$06$Uba~nu=1VAXpWIRe>tw$
zqg<PPe5sVYW))tp=FzGKG_3BD3~a#ymcUbWl0R_R>RBp$Gi6(E4r^zL^d0$L`wAk3
zFf#v|@v&0$FOBJpjwy_lyyk8%pQENFT3Z*-g=ck2zg`<Cny7PeMr=7f!x|@ZC-kUB
z2Y27;M81+w)}E6rA~h5&ef=!HJaNw-<FR-Hy56lL-XYCw>hr3$W7h*~A`G!(TDAJ4
zvSP*q4*Ncu7?7$;P+2-wFvh#Tb!CiYW607`osyfD5x==md%teF$*X<~qtrW@J|@T@
z(e|G6bCux>3XShjea&~y<M5boiyb-@o{<b7zV7hop#bBjIDx+HIOg7tA24s9`c|3e
zPSY_!bNK}hIZ=+&l}x(6ATyGU+h-l_Ds8@+Ks;sJS0}xi97FB|7Gb>baX3dUhW=7a
z8(shIrQo2&=bjT*I6M$)yV^F9dgsy{jAfrfbl>ec#NvG09wILt+8YiJ!Rx2RTx!_{
zYO(UntEHQ()oVeYCaUc%?~9P!ML4w~d$-Zz8RSSLyjd^%H<^6<T5hR#K7r@qRt2PA
z2*KF1BIgvPsB6s}iS3n6-H227qevtkJ;{S=`690nE#~X<-ydj(c}!_POe2}Q<bY@!
zlLu5$%PH4F>E)gkxqm8!dRTDS>Sa+<J6A(T*bi;k8=UPB&HPy5I31@iL(UqR|2GSr
z4GynT_^3f(^IUu9LY7b!se?9z{jP>YQk%z+#Gd*X*IQ|AeE!ZM2d+mp4b=C<+|4}A
zd^HvZx@RZ}zr(228u&f}dE%K447fWBeRm#9U!FT!rKg@f!T<WlW|7l-DU6ztXcgYz
zZ?X-Gdm%{ac4(z1;xOY)9F*euYK^_y!tD9i{Epl83i$_EO-2z5-S^sU-L`oOUW#d=
z%l@GIYR0Pi+AF)tB0^19M(CW}42!9(ilU{|G0L>RD2|y*U*am;JqCTW6VAnFHY?fG
zmehK^+iAyF_ugD39zVkJh~VhQ7SzRWc{YMwMYC^`g(^8eIdJv^7GoQ+rb)7b7l9%f
zk^kclI1j!Y19jxp<I0xo_cQ?(g=Vz!4Q!RrMvbMei^3&CT{7wLtg?2)_KJj@qDL1?
zEaMW~t(V(K2u{N$xrOI$bqKCa`26e-^MfuxiGiAaQ6wV#C=(MQi=<xpWNfu4uX)KK
zV9^6#%Dos*LLnMBl~pf9x-lf$`A-Wqe!RlkqVe=1)|qqIPd9zq^dO#CH}#1_XN;h&
zsYZxeA|g=18F?!EBaBHIf9PaBHJG>ET|26u+*rd$m8|-iP{Q*K>BJi9#~hB&qi^&-
zNiWipB4wSAz1~`(bd}-Z&~OxOb9;KEE?HFntOmhtv8%eUqU2kcf)9riZmSW^oNYQ!
zVWW_Gk)+frRT)>QM(->-{r!aHFHf+%W(!YM&VdfbN`H%eoI}9(#|ez>uc~>kMd#TM
zsav(;XjNRMyMLK($XD#@k|Nn2F1brT&1b8WyQ4{LF%N5uXVR^f)cT@#k8ef4Yc5}@
zQmN@Z&VZXCKN@a^Ft{1&;bx!}Z@8>?EB?2e0aHhAV6d~d)l9ls=PJsdj6iiTHpFd~
z1OI{11H4w{-&TAHR@`$$m1q2R-R1t!_d9Koo<-jYT2Q1Ca$l@NatrGr?l3Rt%$KkJ
zNnXA&YSmQ5#XYHas{Ms-XnqXZuJ{hN7z1n<d>p3&wCqN0)=TM{2_KP!&|)q+qg^sq
zJPqiA;LH-O|L3QXwb0_DIy}+bJuq-jQ{$fZfJU*3BlrnaGJ$3sd`%n?qwuDWJ&%$o
zxl&m>6QSj_2;NQ|Q{2}SW8lT_Rz5%C2=Nvl*$g0zZF|NIoQEVf4IWm)g;V#uL5R75
zhRNi1E*7|h1fH3q>(R@Md*;XX;MxvV0cI8MB?>`qLJ9;EPmP0Ap&P2C;?ddMc3vY?
zt2=8G^&X)OH*?_n4@8c5b}rLCZ;llvc7hLsp~KWY{0$Pb6jz6LD#2NV=FO8Y+T4$I
z;fRy3$wklJ4_$fuAkU)#x~+baj&J5xAE1TqZDkne!D9&d@T9KV>Z`BKyQfU|5*Tmg
z%X!wbnQQK?gHQW*pep0~)VX=irePwE>3#m#vdKX_zIZsw{f5X<W?>6bTwolMyf)3>
zN!^#69=4Qn5X<yZ3>Ph97r(u{a!~24KvwpW5o)F^iNk2g70)1L(TQv0zE*1Jb{OGl
z<&CF`f*!dQ5vq}?X6l5F1bc7t89uCqu=`B)E#B8^Rv^HtzU9c&@__hk=tU|rQ+mly
zu1?q7v9AjATg?c52nQ!TIyMG#Uoe{*=j%f9goc~)z=JR0@K@O5=H!%|Yv%M4t#3@$
zJeYiTM*x@8ny~mA?iUAoDzw{4Di}bnOZl#Yzxf@JM#n0rVDnt#|KLwE%lZ6zIu4i7
zr*#J=-yxa4glkp-RX1ec%;{eFahdN5#IA@0=-(wF(#K#PV#wD6kC4JAt0fQ$JKRY=
z{bLm}f6c>iyl6;%L|#L@nY*CMoJhiHDa*v<?^619_L4Jwa8_>baG+PbJbkNa))!NQ
z@&HcFgo($HR_Jr!3Vbp{D_;#7xvK^^K2t}!kiST_R^zaPXOQ1PgOGv(_aW+*Xbx_y
z&Q!7pY4m4z#OCGnM{x@7N_$3OP1|1_x^u<qcJ3oT2YUlNwfm3HM5au?N|_$17+&g4
z55M$K_DizFi{|I7&5M<D2{}1Z&TC*8ur+f>VEu+USJdt?{?-V|gk(S6;wLiYe1ECJ
z=*NPk5zlmN61mReDd62`i&S`*R~C`oDz2){C&N<k)}Z6(T1xY6uKCVZQS)H6L3Mg`
z+13w|3+Tm@8b&%nBk!0u=r`!fh^K(F<`=A*lb)6g1RJdt>tu(^ei|PiV2kJCPf&+b
zfV-mn+IVd|G|o4z{F{0%Jv)(46uD_7fZ_smIj4x>5gcTS>I&!>M?)#AEmJ(D4XwJ1
zE;Mj0DB3F8Yzp8}p>_J43g~URaxS=)e~>(XcV>@dNYOWD_pYZsR4xZbX!Fo&ZuH|w
zIP{5&P-~YGGzUtf1=$iiN@7o4T^8y00R~y;d#iQoyq6E};xXu-Ikhn_-1eSp8>GR5
zj0eD6f2sU<6;&8j2W&>Zd9)*>)K*;sW7}@VIUs$>sY)qiFb9q$@wV>BF-A;pXj&~t
zC`xtoDG*34B0b?F((x?~f+_jyk6t+{eS|b5%|{=&6pd5@tk|3fJ{DCeq`@1^e9hhd
zK@GcfouMQ-*dh(JvbT%Z08z@1HrWbq&4N+<WT%^mO|p$ZvbD_W>7{$2k|N$Mu8vRq
zmJoO9EWs5Q$2wxeC#5}7Bc+a`+}lTIN1g;)ezlGM82?O%JEoJiFS!gktZ_^)-2>dE
z>uB4{$_AAP1+q++j2=w$aGaZL?v}(Rxsmka{95XRTX1e4Y#B`_K9IV)sYY>{;J0%-
z90}+4T?Y|7!_VT1b0y!fzqLH=hJ|jDB`qPxK}13>c51xH+w%%XfbWxYBvftNQ&n2!
z7DYr}w&&!mf`Yi;UIz@O+-1xEX9L&OGq7~GsW48HsQK+pLX%_@x-eVDDAAd;5js8r
zdDUcF?)m(is9r&pDe-<Ur%-QHUxwrSWs*sLNga24v=FJFsVfYAIJf{p1;<h*&<zv<
zs>R*DI$m472~SwI^o6}Vvav=9-I#UIL<!yS47bt(Me`WVz6IpL8~3J3qx^UhTAGIg
zB}y@y-e})v2|{jJM>5m)qxk8OEe(mWsHtz#4_qg##`1N9&g*t>U}v8Xkhmy7`*~4=
z7w<+;1MJG>I-z0yP$?pSc15qmwI<cMA@2CJd6IS2iXRDI$y_$Cnv<S+MLn%aF=n-9
z7;>oqa@8hwKRSRHkouI`TE<s6-7Yg?gCD8g1NAo!I%ap@J&0^`P0}U~G%9JcG2xi0
zns+t6Kuv`Ur|@?4yFtxt`tz92-+YwJjWrAzdQ*ynI@vC8bDS<t+ka42M-7K^0S@H=
zUeiRLr`Xkvr<%)e7SVeLy`CEm&Sb3=H^sI_wwDn}*QM2A9^$~#eYx!$lM!B|@$Kb>
z8&&SxZZY~Xy3xME9T7_*1)xhI_}oHrc}2n(J0x`4wHAnx`zEI-_(yn|_3_koKbiJr
z1bXpGo(*k(bS0Lhk4o=;96yKOWf2CrY$fq3;I$;PzVkWZCI!R=aQ1&>b9LAbn=1?!
z*>5#jLx}!?G$S)k>l_K(HjDjj5-jZ>EVy(URvjxvv_FtcLJ`_Ww=?PtT(+^A8!AeB
zrHfw>KmVW8tc&L#Um@{pHLn8`8l@2HZt?Su?I9hPht_4CV2U6#)e?MP_0FIyZ?lCq
znH)=mruj1394sz94i86g4V>eP0ZAq3eFiw2Qr#hQ2p^e9$zbMeJ)ZT2N3B~3zc9B(
z_BMLEd&7V&h1^iSPCUY}<q<%{M{_qDs!xerA@Xyz|6uZ=B<1O=6qz02x5A2H+BvB=
zyJ~Ycz9)%$J)a^l;0`*L%vgiBVIX1?!i!qlo>lT59T{3b|C-xDy9=kW=Lv80Mb->$
z;;}VZaddZgR2{8CS<#>pkHB61P+GP}W7l(PBGO#$n)Om;WO4M!!b|!&jV5X#_U!3C
zSXk{p7ItW+)x4zbkA<bJ$E+d3=vF96@r_Za@%(N9@8rcAc|=T~?@5GZrBh{N1<=UT
zId}@pNOE3Y4EA%|n<1V9jL-Th_uLihPv0Aw>aIXAF$3bGW6e9Pe<suA;HO2r`PX;0
zh4UAj8nJo4;o;fj6}K}7)_^u3sswC%1Rxk!lG&0piIx5Ov|UT32q^4@?`^=Lye`k1
zit@cgxtc7ln?`tb)`qar`pmwTyc^hyF1*=ajaDK0KocwLRk7NgEMe-UPx-z^96B@Q
zYd0J>rq5kMXZLPkxdm4`xTTdCvw>ku-?i4lqd_f8Ic>t-@F+{k8ZaV6b@ZhBObW`o
zGq8l!LyzS2=7Sc|V^T%?L7lmTMy}%qJUmafj}KcKU#R{c(%w3(%B|}jmJUfl8YGnN
z6a=JEX=$Vpr3I8mB^0DlKuVC1O(-cLosxodN;gP@l;}5a&hxx+eQ~|-_xtncKHGcW
zYpuEF9CM5@;pCZ#0}DGlo4e9@QY6ymYhQwBU_>!(g%s+tO1`MO|6^)v;h3N#i1bgU
za{&-%+brrw2}unH5z*&89TC7$eJ^dI61bY2hbCQXm!y=i7)S4q@SP7CQsH~k@5j$h
z5?<?VXcqqRAy@Q#Yb2u_+hcU4e@@reKk}8Mpu6Gj!2ITkvSr4*8ZpVZozsgAU`JHG
zekm}(HARN`x|32OQGS*&<&R}wIZQv9RNszPBbA|rG~vvGS8ks_?HcvFCkemeuu~OI
zhQeBCmHolV1DS?W$#)bnA0+%s4;anjo`{P=es%YFn7Jdqq-M1{F+M2ive4iQS(EqD
zPkogiu0;+922hx$Aw_F%-$m;y;X)QROa#&|8~uJBEQ0#cS;AxUlP-JMKL1b6sJ%d@
zMI~BC@+9J87fCGlu&;z(=A;!)B9m}P*9D#!+vR34yXbfEANYWoFj311RLy(Tl1-ip
z)<i3XP!<YM+(yNI9ld=?Sl#?v7ZlzXAg}OS{swM;g#yd7qZh=<t#fi2<Z&y0p)kU?
zu(smng)e?as_gPlAROyg7L}ClJeZ}qGNok!hJg{j;As=jc1$Stqt{aucA5kktLnBS
z-!6_Qs(s_7tZkAr(9V&VKu{gzE9N}Y&_esDzxS0S5)sB#|64@(YN;_sAc9nK8>e-U
z40r|I6s4H4VQ?r2eAo+pmLF`{K7v<|iU9)mu}RbK#+(tb)n<gTyIh`AXxrmpN_Df;
z(c05P9#43ipODu!PmL3)mr%B}yZ7UW56A8KAl_3w1t%D?*H^oGOC&?OhrC{vJbRvA
zdtNaqnB6TPyM@_?s=w0NM9DsabtwLx1dZ00V+%5_4%yqvCR%VuFP44S5Vj@J9!#(i
zt))JG*st|%zZ*h^*L5D&+ivK#>#}tv?LS?{&11w~^9>o-sw5%{KUZ@tKQ0IsUU1MC
zKzhlk1oLlxA-~|Va;H3~`*UKC!+?jF^hNbkwgp){Os6rILA2H<kq_f8*YFR%2wQ`Z
zgMHelcS^OUkb%Afmi$;gkuv`5EgccH-bYmSt$3*7SK1FXY1mZ|FBBzO#PJuWHA)f7
zlUKLRFI+70^H&4ehQ7SXDmVMy$S0n>Cw%I(svKbg!}p;AvuF<b%Jk9}c7u%oruhYq
zC4A2SJ$cfgq-}1(Kq^^EOZIDO!7x;yK|45S3)uSV#&IWotewyl&Gxl+`#IXD&$keg
z!{}}uxZK{BYNg!({P1yhGKQeeORbParKy;^A}-?0e77tZJ0n6Nf;?UZ4Ca=u#}CzV
z*b3grR<QkvAKt~DnJ7H?bLeCIY2@1uO)}*wEXTA!$*@O)bZkN0j#Y;Y(~f~S#Ol7k
z^H&~|nt>3hZr5dy7lYIW3v(v-o)ix{?cKl7gTxfA=iYK+^v7oS(0EO)%=SDB7v2zJ
zy21cOM4dQ|BvY=xb@VbxyQbGmLD&QN=X+q`*#~2`%=CKE<1<axI+;rK>FF93xDg2J
zVh@c};ug|AWESMO36a6UFVCwQ;?BmpEW(<k21rTb6LO)aLX75j8Pvm+X;Ngyt2(cK
zRxWE4g(NMn@)w`AQP@?pP;V8ZEpb8-F3X%_aOgRqphd>JZoGO)npw3SJg+q5H!tks
ziwwlMVxt;D913G%Gqk4QlbfH)$L)F`f7;q#ANigLJwn>=3ld;ALbDvJt!^vX9B{4X
z8UuLx_JH~I2E$ln$%5n;C5huvqqqmZdoV7VNV#mz+Hg{#IyVxoyI8*aR0%m;da$pl
zzBLV{siy^w>C^jxJ<vPv7Wu6<H$)!Mp2v+H1D!@L`a!+{_5v7oG-F(BIji7@t3&1w
z?mbxokGM<PnR`lY2Yd-Rnl$&`-gDadW<475PI(ldW66V8;@ZLTI%o05t|8^zzSnbP
zMK;?|q@Mh^7oq8{n)w?z``t0*LGl6aR9dehFjEz<&S28iMVeAPn%PQrH9wEX?GLw4
z@cI0<$@8`SLcN~|L_YoviirW8D_l|e#k64w-pm7`S$Z_p=<|?Kpa?{YY4vK@tOW-N
zc74%|{z5Ze_~>n#6niR|F3@=zt8m7L)wN-xl{q-DS}~&M`&|%a$(z4vm#JttH7R+@
z1_5K`Hp@Q&<2~N7X7;<b1T{PJW9TBDv`TdP#|KHu8P?bL>fM{4a5r(idAA^@uh%U3
z_cL}fvoz!Etw&SW&_$2$rUH`oCh$#o74t~9DnKjap{1;ZmZ3Cc-6%1Zzp4_UiFMQ@
z{2avDUs)p5868cm-;8CBn<pc&;$2BTWb%r&*YXeFL8K5Ee9`!!YLsNDOiLP{;@JEa
zxZIjyMmp2!PnA2~Go#N?mkex^9~zj0d}4m*#kKw}0RmyS)_A^}?Ergr&g`!TpvI!Q
z#m2A@p=h)C_mHIZC1eIK+nRH2a0rM%^WCc%MenlKo`k)Rmy}@{9xrS<Dq}@sEg+eb
zF6|k<(x0Wmn8J^(*Ji9|obVo(#D9(DLe#C2*S`T}FN*+IS#4cZ3UEb?#!IGJP<WF+
zq#rMRYf%JSiG%SHK<y;W43iy7LfCj}9t2};KevcRBr#P}P72;se4QmY1XS~w+a#W+
zZ#|m7cEk%ujK??7UPMDR0f1n3nBd{*7hM~=cB1>E>+xQ|_*4zVh~NJuMr4T$wwwmg
zk40aZeSLSzL5Edd&G+!t;gA9W#s;K~x1ZQ%cmkHX-y5(cYu+w{nMCjJkAdUeDn0d;
z{f`OCL#*)6?LZY8qyBa>#f~!8amt6jxd#pQwUNq*_2#CnxZO$G^mR@XeIkN0wP3;L
z|4;Ej^gKQ+*GyF5k~hZh8rkQ*p(B6T5@#`~8mBzaZtpVAnJw_oO`!xgMYiM}uStB|
zgxKJLxvZW>uL6NswFkt_s$Z`?0&orN1#azT6;*sVNbS@7j2@I^@Gcorn5X!ocx0@Y
zk)z-!*%WWOOs&Ez({{Ci-I@FsC?Gl64vd>WXRC{c`)t#ZE!nOk$kC#SYsWRI#jcwU
z7EB`?X3Ya5pj}<r5u_P(r~06pBB9&kbVd^tz1>cxkon~=7&T>~cvKC;Uj~8MckT|(
zcUMlbOTz6t@E02hLnqhPQVFovBw932#Y>N|3FZR>9Ocy}i;1>PQ<QN9e+CL@_d7#1
zDYi}ig;^S`SbP<s&#YKix>f(Tj*s36lCP!5u~@`YYp4ilh*WFoE%&5g5bl8^sMR6+
z%;scubx_K7I|ABx&9$EbDaK~~yDM3VO11k2%|4!SlW6VzT;kB5koY$n0v_Y*7Fwk!
z3C_3Ny0&}cbk#=a!eU5eVg0jH6UzOIP~B7zO;x7dtl68R*PJh*va|d%)J+>;N|oQt
zNZ*PwFlg~1o)_>G*#w-@{In>YGvZ-4B*)+Mmms?E5tEvd`J?17Y{i|_;u$h=$8Jm#
zW{PZlMlwjQe5ANYE{#AfG;?U9j+P!aa+$YKi%Ei*f82G~0GDh1kg}*mq|R|9D-xsA
zjg$G$G^*}OXFDVl$EV32MzsDJM|T+@Lc9*lP%<_g?pE!v*V@p1pZre>nF%SRHhu2z
z$)C6hZ(x_i>aj(m>I6G~%5Ja+K!kX@uo`(@?R!;aEk1|B0=5a*FroC0C1A!$0~&#q
zT>8pofpF$#xxatTo_aZRd&he4dY1Lm--}RGWLIqtC~&;~M{>nR!^FGvyD)`B5@N-r
z>|tEppikL6e~<iGRh8;gHOLB6phMd{QXyDtGXfA_YTh`%b+NJX4|`8JzY5{=evKay
z8kI}f@qK6&Upx?gFrm2zb%0|pHjTxnRQ=xWb;t42+q(2eFB)_ri&y0duN#?&_%*a)
zg-0q}Ag+h@S_%|@-+3r$u@OXlXEXxBh8xar(?J|7EfLst#09}?IfOW#&j8EK9TPfx
z2FN^eH8gU8Ily<-#nz7SKhd>Vp(lzpKyPB*Eho=bPqq>xlDcJOR6NLOrQeF+deP}9
zs%hIf#IxSXea>Fn$`R0pIxqQBwoW0|CC$lPH0Hn2O!Aj1RP<y*T#3N9q-BvGgEZ$7
zI=>RdJiWmE*N}Efmf~6ac*uvS9iJzaces!{g4Hqe_CI$-gdq1@TkJ>CZPj0bDtu$o
zzfGIjWasZVR`Zq-bByG^I(jblQ8oDO-GaSCv8_^Gbj7`E1Lr%SNy#`7c0i}Sg`?j4
z#Q(1yz`5!gIs?tQ=Mi~=$Q5xm#8=}=M`Neg0648jo-<K%JAa`%kZ^J}EW%QPEM}o^
z@oRAm_+HH=!l`ah(Z_rArpZPu%TkV-FvWJb(k+DaQ&32FAC6iP<6LY+s%d*)vZXO)
zr;Cx{e1Z+;*i%y0NdX1Lo?$8Uw*zdg1#FT*`S%WRUcM*cZ0WCULm*Kk!bJS-TLs2v
z0*@N-E|wFD_#AF-B-&?+-g?o;a6q6O`SG#%QjhQ~c;fBGy(|IN-g8HnqauX(CFNE1
zWOZ)FU=!GDBaLNgj=&guoa(hiZ6>~3Ouo$=LLcoaGtFGcuH3?Y3Vn4qXX7I<XdCt<
zN~K#E)8-Z1JOB>F0Q<c``lX#4PL(bL5%f2PWuIm^iL|y}j%i#PjZpDmfb@W>TCmPK
zwl9D{#NyqLba|YOY4nTSGYuprPl;Q$AUHHt7pC2g>=X6W2*ZyaTl7-n#h40->0ANx
zikhfY0P6)q2>?ZjQ@oI@;F1*hd$VC(ONV`;npW{q|FW&iZ6o6T>^Qd2So@gLfe*e%
zK*jNC&7-Oq^@CQjnBtp*z3(@1ye*Z-#)?j2|Lp~Uk{he9cZhtH?6!Im<(fitc}q%r
zn%H{bV(fa&({8i;Fd6EjH>>9`uSI5o>iPrL#j+yNkKa{kTFAx!$u@H%b^bWHW2$yE
z+q&HONOnuxjN1BFnmc(TfDeDxBK~8WWTc}WyI~QC2xx9qt@A2Fi?f*Tj>|_VKjYjD
zu7lI1Z|K~Ypd@}%@=$BiHb^-vf_i31uVBhHVpGVvbsbs=<7=e;&AGD0u(WaU?DBn2
z&iMGY12Fwq++Q2&8WGEgda?t946dy7=_p$zlu!k+Zc7Kv(^$mb@Y=mUQiLzp0W(+T
z_J58I%xkG-;V3U!;t-t!ju(ETW3yVO`lXxd6xrq+L+Cvv2x$$cCR4OrTb5u^qN9Ju
ziu8L3jj`%p&D!2zpOH71RA65IDst4ZzdG<#v3-g-T3xD>*1CB`hvyOS5%=l;a$T8-
zr2ma-($zOvgb^-<69m^q?ZAk5yARD+)d{^=%6;B4A>J}~tgRsY5w&$GqkQ-E>HE>O
zZ0he;8gNZTDfqhjmh+VP1cI@sYrCFaE2xJk)lhkG-h;IKx-HCYLn2T&M)gYOGqW?G
zVLq*rHG_GyvQHfOCaOPX3Ut+$ez}@26eg)vYD`;^k6LU_BP`pNAl}-Soka@yD))^w
z>MhGuWe2;xyRZlRqRs<_$+ULCK>A$m!?n}&a9@Au)fFCp6d`5DFzd9+&*F5|e50km
zP?c!w#p6`1275q?HR(1~9Mm3|LMERX&F?U%2P#vf$RwR~vVX=Y%fy9rV!ysts~pKF
z(kecPYz<^SP=q}oX|athFZOee2!FdY;5JU1WoM|7vDL$S2JMzPmEfy*vKD5QgXcYS
zO*!kJxQ*c=i--re9M^~>otV?Rbw_Q-;3Gl@$Kaj$wi}=__QbeH6)yefXr4$iyR)qu
zpJve$1Rx=0IWI*OIl?l>k#S+-fL1y7attsP0RG;dV|nxr(nwb28K`d_eIw)Fjhr|9
zhDu*TX5FL_KOVWH!cFSKpf=zpVa4`s!?p=Z-r01MZ?%ZMfsG4)LV(Nt3a7~*YLwfq
z_<YgZxMB{Y{EnvW{4g`YA+t{U>4|55ErclbiE>BU?^ryb4Ub_<`7Q667WhzI+hTjB
zQJMzWNj%zL+jy6O9lP6yrV3)`<WXydYo$`|nJc8<_jI^L_C_xsG4W;sF|L{)HBV*N
z=@>)!t;;gUtC>*DW?J7NP300}a9E{ABoiMSo`g5QvJi>?1BDsj?7D5&a!pY?6g1FL
zv8_y9j@2HlrVU>DVp}qEse<S=Z<u8IJYo5wQD0=yXsIu*$*a+5p4Ng_eb1<9%^+jy
z0q>TDHP;zkX*(9)-7|Pc7TvGTKK-0F6K$*Lt_qNN<!VAA_<U0A;7n7gE-f>}6^!h^
ze;k%cv#E<6F;dZ8NGr|!_Nyw9!;7#Lp=_!BtOqPCV}}Rbizw3M%|fuW&I`ftkOzIx
z<qg&P`bC$7{~B?2BUhL@quSG|!|G2}bYwLlzPaMV%x?2<r`>EH_${@|%Xi~b+XWF;
zA^?my*k4EndC4_$%}El9h)p;MeGkT63%Ac1E4ETLGyVDE7OkrJYt$y-Onv^O!43B!
zq0rwGRz&q+@HuTOao99u46XEK(k>ESk^W(bw8p<HN{C0=8z<=+a=!{7wN3CSXP-CG
zBC<j<PGWz!DBAohZhh0*E`6ogeZ3Kt&MK+d^?1b(4P!1kL82RaLMyo%gY@NzEIERn
zKS_@lscxLjVN>;3%HP(B_6Y9=Os(g`?HC%v1`ViB#jo)2V`4=S;)7|zhh!Yuo2oC7
zv|1U5pO4x6wdp3Mak4N?84@IHREh^3{z)Q|oEp)rBy!VP$2pc7;ljuuT&oV9*3@Ce
zdsMR%RQ~S66u)&;a{#X|89%ZQ%z<TOUn2%o-5iX}yf5hvTTaGR^B=kbRNn0_3L7rq
z3A_)hywd_jhimo1y5vGLRMriBUTT-9Fu%%Tr-Fk@sH*GQI;ZdRF}i8db^JBqPB+>1
z-)_@`hw{|N=!;eLCyDy`Au@fw9N*7x2t%dRZZ{$AU7F#$feS^Fn_bhV*0le$@*j9T
z2CuO5T(VT^e3h+Z#{$PKkX-WYCGT;+nZb76ID$~m1tneQB{xOQe7)n#_^Gu2&bU={
z(xm3VRSH|PbueBSKFDA_k!#V+_=py!e0`0x`$}XKF8=6bE(7(A`|TuVyWkwqB;{?~
zn-dl&nbGkw@h(N?H)RH|tGyG;V1KzVLuG(ujYb#!A<r9Hh0Hs!?Ik@%4zpF4<{scc
z+tf)P+q^!OTA$T|Pnj_P>*Xylz~go4E73=<<n~+<rEXxc<{Qrw;EEJ_yG}WxRfF4h
zgE{{;##Oq{yla%j8)}s3r?A%sl)J#3_8P;(&@ifM7d+m(#UJ_&vWmF|OqHm+q4f!)
zj~44_tpx^K`W7tfqUW#rs_b8J@9(spp-C=!gE_XIWBisw!~V97g%NW!8#<I&-t$lW
zxi45PUqx2((s*<KgRj><IUE@3d1Y|AI-2gz0#oGOpR>~&Kxx;v;_lij_a!tu0ZoIm
z7+U+`*8}Jj=eujnP3s>0DG{%89KJkk7`xuodp!N{-<5&l;Z1E}KFABRYR(B;*7O#)
zhr3G#t?!tAb|eWTLsQ6^OJM(q)CS?4t@#0d9A4KsOby-8Z?DUroEHcD$gLmHJ2cH^
z)<54=y(s4g@PWvnFCcDoKT9rk8qhr&1ZI>nRnSZV?~ZCqw_Q#m4uzrV09V16reLX)
z3wLzI8y*L&B!4J2ddp6ExX5CywF&2igW=SYU4jUp9~lXA1)9sMoMBp&k&g+RFqEGP
z07s+O2)E&0sU#cH7+3#M59MlGjDBq9Qd{4&EdiaPMo#r(z?NnWrmiXe5#9lIC!gbl
zv#?sfA4?CGsOxXA2)xF_DSX!8k3oCTFk^GFzZ$VWDw%fg9nri6^B!cSYj5p4JxLcg
z>;L{CG{Ry9sz7m0za4=_R$kkxB86cKE}>%h<d+weSqA-m`p7by{j<y<Pgt(YhGq6e
z@X0;wr6^$~AsEC{SN`d04L%$Bt7DZ&fY2U#C2S|*>d>HtKVFgJZ=EQ$op0!J@7FB%
z5aT$j+Glm{i=%zQ_fb;oa;4~_W9RWw+a4Gmyb9?@n;~#he~>*!oHjfHdDiLxyQMK*
z0>O&?2Hlmz1^=|Vma~%Q|2o6#WRjW2lrN*_6HcD7vzRp)#4d`vs8#ZM8}ln3kg~tw
z8#A!a4W+wpdG)J_Sl8Wn4zK)MfeD<EAth_jLHt~!_U)b`lIq=_NY!PFE|vbkm-&rh
zkO&FZ9JnTDPj|0L@z&hqg&v}zfP6Rj#faB>AMCO}bXHvfF3SwHVZM1zA{zw*KiMC@
zH>w_=j({Dx!NEZ+uf~me(K_Xo%Lh-L-bJ$GOv$`NJqj?B8K@J*HJXun3rrmUVL6$K
z3Ds|Stn=Uv&m>Z`tL2%7$KbL{BpZr)&7#a&;645HaHyxcgvokNE{<Tvi$9IzsXO?h
zc;8)##l3Y3zBJzbtIu9d_91ejO_w|$gzz7zC;J%Mk=k+A0OD~Ktfb>43#z_g29&4D
z%?e%VS-JdBYeBfiKkXl(hdoc0aec||<Dpu|VHr2QG`{{w_a=^%x37P8R%%@f9RZh;
zYFp?Et#M&s?+_@Y8IpJcz4KkU<3ts7r^6BJmfR#gSXf<_52`5V*P-Dx-#9gN6bpF5
ze2?IaiX+2TA4Qsh(;)LHr+NS&KIic_bbt@~gIaca&>zf({@`ELz8YNej`%0`tf=$T
znn-2gGV;%94J=;3=lVo)S|}e(#4tvX`X^?gO^Kc~Pn5Ou6JUSjnV~Kp&$G2qeZ3T!
z{*&msJOA9c9DmrEfSqw!n<DH2V8i!w@K`R5wWEbS-wt@Gct=FII{m?vL5?TuSw8-?
z6)w7N&fr|_Z12cVlwp-Fmh3ie>GmT9sl-i@^fx5nq*U|fZcRbSwbsG4(r{K}Ze&Q{
zF$i_h=8ww9R2;ra(9t7f*8CtRO7yPEir(Bg)#C^Z#!4Swi}bxk11K|>nIVdB&fJD?
zY2RtGN_=~TI~Xv4x*g*W_pIY|7q0q`1U%n>9;LtS8)*cw_1$mytfeIz$E8Y@MIi#0
zr$Mac?W{sOD}7XbxL^`65-Rfz3)CV+s4BwX+<8Dn-?D(r5E?IWmUQ~z$1-9q;am&q
zk(TbBCkknUxH3d*gSjy`S|0+_X2kCrPa~Ay1LYXUs&kj(iO6;pbQi`;+Jmp37^h6{
z_>2}=xK#59n*cO>UQxYt584MFET&R}_2<qfHoS{fe(K8`Z)MVM)!jc&rlWHkQEL^9
z%{kD^S>wE8s$FX?H<Bc(<ER>Ih`{*n<br0pq>vf0+1BHw$h<jG82@+uEu#PEE|OGV
z+rbvXMi(9wcE|~d3Kg(wJt81!ac-VV$kTkOvXbKrK<()+J%I84V@YG01K1S)4XwV6
z)jAYs`8V=NZtTyd-dLT69BDRl0dAPx2vWLaDzP+GI$Exk%Pxb(pHXpN)AT)l=cnPw
zT|tVa{6Lx4_+!`E=SQCi++;E}_s6oNZExea$xRq(5Wn7f0J$v9Tg6jVUCGRM!VEK|
zFGn6Vtyicn1KhTLJCxpO_p!@UaBlMK$2x0hqu8BcY18=vh0Rmp*_DorCeaCp`Sgdt
zgzQnh^BN$O9YyxHI#qes-4{h;wUq21$g7!0#Spd7v0A<hiWXjxtVok=KXqva1D(~(
zEafN$m(N1<r0hKCFjXlIBQ@Luy)6~NfD>(b2C9?G1-xc11ygA6DqLO|7i<p(W|uQK
zEelNlcCsXkTG@im%lSFGl+YH!F`}4xfA=)q0ZJf~Cx3+$_n0-w%}UO>Z0&=%VbxA=
z%j+^0L}IW7Y<zTE6~+#L7-Ktqb?GA~I_u)>7pjDQyq0_ob$!u96O>vV?|GV2nEqf4
zX}~Rr1&+Xq*_@Y}H#R0JJT9YHl)`%>3xuKkUDB4aEhuiKNe^O#%hC4YMaSi9U%Zgc
zCHXQkkuKoJ>KpYW;SOy!iURi^E^P`g8`+h(Im526dFl>y&LO(U9;8c?Dc=hTvw}%y
zi$dBi?mKAR_rTp4zeZeh_ZvO4(?~%|`6pm|3t!fQ5L}xb3Et#vy5hEijVj4D@vmex
z-dq?{T!@=TGN;=D{<Z?yh@pIhL~p#^g<r0db2O>hnN5&D0}ErYAtNsrVG17GBmp#|
zdinjAcR)NHmyhy(;yZ`FP8~{D?XtonSA2Cqcc_@FA|2qc&$M<xldenkxV%Rl-VuYX
zn;7K!rbl+>y`}W!9cbFTjU`91p=Zfm$mV+jWH5p9^h18q&izf4t%m8Bmh`W&l3G}m
z<u=D8B_UN_%HOu2AME;WGc*q6@UI%h(k&?V)%oGe>evb{*}>{`LrdwI;PIEy^6dcq
z-Q@*F?LeL_x6iPO2ei^*%4+5&F9o!)5Oh3OEPhc33oT~X`G;uo|9v5cez=)eUU4?r
zH@bTKW}GGeEIB9%n@~jK#)hy*qd5#-aWg+kyJ$;rJ_@Z>?uBO4oFdW1^TiC~cbJ!4
zpQtFz{=RJy=K(X!#3bD;KOwTqki0WkHeYK69^Pa<ie`T0@W&#X(D=ys#V>#yyod&1
zFl{DlfM2A%Rhs!91d^9>OOSBoCwiTulEQYwW0Q`}o~0X5o-HnnWch%F1f|vl%C*Ql
zlgzsSJ1%EhWX0))>OxZcb7slpVTzk&R#Y;;bJDwgn4kKV%bUL?3emT}bv28+a#Na&
zS}|(!dJAQ`!JE~*wb8f<O(p95F+vfy8y|KyTLmQJPn`;Df9=-nv9sj9MwkIBT=TD3
zBBMXfijd}zqXVLziSdl@Xcn^ExP)iitS~pDtfwV}Ov<Zkf72T`Y==d|I3rJtLqkWl
zfX7H$5{CTH%$wEVyh0qCa|%j+{n$T@@7{6zTp&y@SIJ8w5(B8zJfKn;r|*HTM&!@^
z?^UF)v)x>*b<&Hic`(k1!nex6M<_AEk2v;psF5Y4qf=eOoEywWaU_2$=x2LIiDamD
z>eM4}5?k&yQbElz5S`9SF%1rB()zaJpC5j2=!+ZF+yjizqc*$!j)5^Uzrf#ZrV(_i
zbJ{bTfJdZzfpCb*EEV7aQQ;`hS1;w`T4e*VL)y|^U`X^+FK9SCGh;|LIO5dsv_epy
zQoQPGyF_Nsj<d4W_m#8NQ!eSA!g^M<wRJol%hq_`E2zp91_R#k&2C^ySsVG`V!b2=
zV3QpS-H^P*g@*shispA;5tuq8!Jqf}aswr$v9l~OVFDkbE*!m@b7SoFl^djLFOXim
z|7=b|GcqR8v6#P<#8!dsVO?<X98f3cmTIArDYbrBSqa*<;}vgkt^Q1&$XRHoS`FxF
zHm7or&i-heEnZc5J}i6A$>?QAj?8du7KfeGuAQNvx(<bjm=@MHnsCX6iwotmC!kDG
zm3w0!oBQ_lAiE>D-tG78Ak$DX0z*P%3`zWaU#h*Dt8MT}W;K3xyy!%|);c0sTYY;x
zPK;NpG$EF)lXnE4JM;}P6LB7`$F{W0UnCpE+r^Jk`&THwGjSVM{I&gmraZEkPjK(g
zs{F$mU*%W#{@z+;NV=P38<<cM6_ST=Ph;xRRn6QmRXdwqiuiNMUTMEiLP2&jf#3=6
z>|Zaatlj%DUXKuq!^Y)u`Px`1ux8_AO@*l>J)LKA?%3rV0}0K3wGN1C=<5v_vy<9R
z>kz9LlCpmWC5aZ}VsXyR0tsbVD{cNuKWuasX8m7nRKa-<#rAJv#(lAX+M#a89q8XL
z9<=po?p}{6ge^gvr2iCm@d)xuDg)E;%#b1Pqhutbm0=8n>_?9Oe*ALHv$K=09TbU6
zkXA-+RJt_yp)t_N5Z7$95atDtE5E7-ZI{dEU{nkt|8jyA(J~M=hEXG4gOVVBDzp8n
z#?B2`s9VLx$AYRn3<etsI#Ak5J3OjA&>I+1cw6!3WZh@w3#6wkdkWXsn@1xu`pPYD
zqq5hm^h>iKA_JpM3NWyA{!~uR1P1%F)5F8EV*NtX;^g3C$JdG!JF#fgH*JUrISt}+
z1?s;i2(Yk=Z;|=;Gy8d1o&ybJ(NFtdKs)~HnQ3b^(6sKGkpkoK_Whf(UwDiao>q;P
zN@_i*)GMvWJ>G_b%9R3obFDWRJ=r#&LY5LxI_i?NLs8+Z{jUH%H<zQLT&W%$dT5Gd
zPuCVD9+~Y?lD-O)p{Tp>lb>}<oLyr~W|QmQ`UAywdlaFi-@VsXa+_k4Zn_9dwQ6d<
z_JI=6pXgr3*{1mA@Zp(p-i>Eji6EO;g8s!7`|7L}B!6<ODE-+Dnvp@TcLA<KAJdmW
zrLp!C(iMi6xjk_OR2G0QeqrOWL8Llgt;{}oYhA)0OK~6Xh}Zi8wEipaboD@b`yGI1
zzBe}W5KYJ9*$R}^#x!+%J;B7<Ze8n<`$})4eqm20N{w5GCg%4a7?3t)LrkHI3<teB
zCX}W49PhWHFN`Jm%DV^ryS>FL(!QQHe?Sb~8?QW=0-*@_f`r@`zpclcJ;Td74-Aax
zf=Fa=6|b^~{-<HBL?pFPD`JrF!;2&+;;1)8&^ol>q*aP8IgMtu*@|BBs`5*q;dF~F
zJArMa)|jPKTR_QAU0zjI&!xnNzE2c79)bwr4$F6t?URO~K7=rM&iE_Q2NZ5V8h<;?
zCE}LL{oz-nESIiu{B386^0YC4fG$Lv_15~Q5?ZeIt@+WPHS$8?CjMH0WrK%ngAnR#
z^-Hw}idX|yjvy2xd{m$D^p(X`3bvdrsa<Hab-0v>_Wy<+MQVf<JH~V{6iRluGO3Ln
zjB_UFSJbP-F_KxgU=DJ&NwvF^I6{f12x6X^6fU{)sv;ze;?qgD<U&YEXPF>2YC*p8
zTamrzW5^SH=IKec&<ReaA=N4RRQJ%fEx9l)nwGWhUm1A=#X9L?l}$pD7E1mjBzcEY
z+9dvrm?gW{lI?jE+hs-XV^ltJ$WI=7JJQ=KNnjaDMdtb(%S2xh!MFzlYo@>9CcF)9
zF6xwLiw@$uoZf}kd~GGs5m4?ATOrKIm9qb|ztiJhlO|c)h1E#hfB<c&UCs{khKy5q
zqGhdw@<-FsgFYE{s%SLMgO4>6gl*qs`=-Y#N&<dtRt{PQaVhWp-lf-+75;ecSKHB)
zQ#u#ty+Qx@ItJ79VxgYvA0$uXul=2-mMmK5z4c|DNIb;H@!~})$|e$uDLjOjiDOy|
zlMDYIt@KT5Qai>jYnxCTZZ;YyZekb%a{8M{(z+E7(C~u=GcZS>qxutsg{y9tGA9;p
zKaV-+&*GveEs_d(9No_^_ZiWFWph=Q@uQsRrve~%3<y0ebDS79k-_UC`$fQTm%_+~
zNh2}gVlh9hb@YYrZEH0lR%{sopBNRNwX@$Q{291*9W=r;!a&Os7?jz85l${ThBJ^T
z;Bt;5Fh7koG2L~3ev@GwsN7R90u8C}d3LB@La8M$af3=dLeN>~hG<0%oW0jyeNR@i
ziPp#t0@<uo9}-&AR9iUu6L606&V4uvj=Qq|i5e7=_r~rE(?wj~R}1QvP<$!bO0&c&
z;B?-XZIwtZ_t=_Bt-1ahE%e=0wCNWarljvZ=R$6Wnj0}|;$!MWVf4Bo)TZLU&Ly32
zG?%@uY<Dw|gD}SM{>_OmE8BuR8m}Ze*+=llNs^<97k8Tqid}3ADwlS{LAAgA>PlIn
z3XfQqr*;?qspH%~tZjWNCzn($P*3C{qR1quC8j|=fh)(zWmZx<Y^hCjhlN(hdh#2p
zhPBm{0b785Vkv>dF(mY322|<cYqzBzDPitL2M0O}=9ArOj>mKqbra9%`B41Nj!XY<
zJ8lmWm|q;CUjv4~<6<4LStxG3ASuuw_!rPEHz=)y925DUT*Q~He($p2sp;3I?q(s|
z8~L&aWFJ2e8?O{?4XH90%pA{xFc{3~fYavQv~2|*B!@cH2>);Vg<^D$AN@)RX+RF8
z@@pk5s<6;~SAvmayP}s^H6b0PGc>J2@h0wx7&HOs1WwlSWbD3<I8=Kpn8hIC9c!HP
zH1LFnlG<oJLLYdA4~4}Cw)f$aK>w#)86s?Ly58vv35f@op=>q?YBETs@dK_WgZYLz
zT9=7dZyHHk6DziFsQ9tjdi{wlY>T>b#YosQX1j%Bx3P%rC%eLdJk7Dwm)W3R?>Xrg
zq!|w3m&=(HV{@G-8Z%1m(ulpRpzT7a;Rev1%gPd!miyZyaERSIP@yWYGqI^&Arnt^
zEFXK987aZ(EYyN@KwjrF2Ac;)hiIaTX$Kj?ZNn|7g^Zh>DdrgqdsVF{sp8a>Vj?~b
z)qSl{i2anLT)!+b-1`<NUaew57B3hc_!46Xdi}vvht{FT912pi<J2mISN;$%g^(@_
zY-Y`?=y`VyQ^fjz2T{t=J*GqUnyqy`vvc39wNWaGTdZ2a<tH63ddHf)DjpFpF;Z~&
z!jIKN$66ZE_4=dTfyc?V{;w?g!}Ya(q;t1BQu`oowO0<2R0@Hl@-7nFKvF5Xm?m5z
z8#mm&`*vioIH&V6csj%-T^)LqY{g9EuiFoOnATM-lr1af?wjC1{{Ob!gp1V>$=wfm
zMWo}8b$I)uw5=Tgb_-4HS`QU+I1gsCaHpuD?xD|yd?BJfRmw-=x?HJtw)%L=Pdjn&
zW~p`OZoF&yP$u~IwkNLGFIlvU$97T{^|Rt+L5>!-+p5x2PZru=kMHwe#l6u<FKh+?
z_IOPWMi8ScT2P_Er@=nFsM|4Y8o#W|{IMt=JrSNYMfmp!ZSNrC!W>MMot1>{Ur*$X
z&Czy@Z`g!1<W(0I>=PPksqCv>T7=I7Z|TUcN$xU%m2RPh*3^U9v1RCK9nx2Rw8W8w
zIb<p$Dyu+ISoXdY=wE8|K8d(~c8L5)@O=OEGa~y>XBljQR$}m;q^1S#u5UJ5MLIFG
z)L!44ftn@-Q6gz$M^?VnR}yL9H=8o>ljx^g&40`FtSeQ*LWbr63Dd6M^2c48NOhc>
zSmjXbL}E-a@i!H3+fw8zK6ROg<Myqs@C}ukMPPWEA!Xoq<Wv+iE<p*hg)n-E-2FPw
z0wegq5dOCD8~K4am!El<^3poBv>l_324aQ1+=zB;983-tJKbE(@<u!h1>(o>y`swC
z8>Ux(RDOO$v@%lo9^+B9U4sW%9m{>=es7wuxffi;5jwRI{c|$^yDWZN+Fk_7RnQ3?
z9<EMS`o(pL(yL*CNuzx+{&qp!>ZK9GMR~1A8u<s<^*Yv;;m;jrT2VXvR?o{Mk3Euh
zSeK)GQWpOe_Kbf9^lKGdlv^r1?dBdxkBeRZvu1Bf>i+>r-ZOab+4E#b-*eTZ8B4pf
z{=lolKI8r1b-qBVK`VRJ9LN5%f;UKuVI;6-<P+`!5Anw@i|I)CyI<w7>bf8iV>+<_
zDO_W%_8?T?cb(stuEn5)2Ww!Kk4dHqUA)7c^eYu~V~pq*H`(4f2iT`kEL_%(4O0}S
za<z2%1B<mEuKW|z&p-JVE&2R)HExIb1gD?xdO184O}S~Bl4rpoY3pr7&0Hc)py<yf
z<#8l$$|6in#U`Md`2=G@{f`yIx23)J`;>2hO}hJ@G@#T(pN8U%>~ec+awsn*YNny9
zyr?OPCbUKnM$IaP>L*X}o2QWZBw1zc&#$l1RsX`wXATmhr_+v_$5RL3;2~JTI9Iu?
zFWrWneS`9GN?RWED;h;g5eF)kTJuneffg!S{?1~H7uxr47CS*;+*NFNA*ZLzM4`D@
zNvPxoMQR|g?N1+B<uU)8Z3h9^ra{Mmo~CjXbD&RESQzth4Mr0&M9c~pi7mIWn%>D_
zxOf1W+%1h}zFBedpfJI+HIWs<adI+K?~`o)*f*=U<^*URLq7}1@|qdTN51@tHP)uX
zzCMa&GRla4tRQlo!n55ap4a3ZLdA~z{2f@9%aEUT5NHjxIRRMi8`Icpz$Vmn#$on%
z<I(fSwYdc_Q)aW`&Qhc<ev#Dhwj=J?Jtvj|0kJJmI!Cxf%_lAjM~_*oq_8#=(O&Od
zRP=hFu1&m0;$K7J7yQWUcT!c5>H(}x8}meKb+XPcE(~7u8p#Dbt@2l0j3f9)Ph2RD
zHF=1`wh%RKAmPHA=X-!iCJA+KOICecocHM8L2<G4)Rz9czA#6r$p2GcaJ3_vDv3w+
zP+!~%l`*ROFdQ>t6lN54<S2iBLpx4>`%uGr!phz=z=-WOPDLi`NOt(~1A?U2wth(@
zE#e{WGFbX&k0v=g%ExC8C+=79AW?Hls2oWPn@%%z--~9YBe&bCwo_hbkK{8ee>Eam
z<rL*1Lacn6B3fh~@?iPJi!R`Tle^c+Rp?pLxR>eugkf#UCNsh~Gm2lVUsgCn^#v$d
z)Kye8rGF?hy!dcq#Nt9=lm+Q-gIsI`RjdEDXdbUKc9|mtN@q}=Ua?Ys(^-1IGAJ9%
zbICt=lyQ9V)PN*NfH-mtAD_P@Zts3=P=zoRVRP~ZaGI8ky;rj~(dCTzNM)bwNh7dR
zh#$wxPob%K39(W-A8liP2kq2I6tW&LAf<X`(B}4V{@biSt$ni+TSK>P-VOxZZ2nl0
zgR{s+$bScuub~yk;W`>$P`r)94+Ni=lZs}`=W_CP%Vs%xc4@w2wmI0xne+(r>!^%>
zgtSDIkBcqQ9sS|rYDoCRTGdE+We+WSlRn&hGAi6W%99!X_8|G^8x`I@H+__kVz>xZ
z6EU@5i&Q$34PDqN|J7z}DXNVRgliQPk<6Bi=(=(;Y{VfRS5?Bb8Qx&hZWR>d%a*+7
zb)=9~nELSLLUYXmUfFYCOX(U7PD5mKXhDyZP0gK&1K6f%Ux-sptKQ9u-KIt{?()9m
z#$kM<sDRSvmMR32Vtkje36fa3b{8XA6b3#(6m95GNAP3z?_M)W^!ik`vPOF7&@L;H
zO2ta6<A_MMSWlSM-&M#G*c1t{28<htAaV^&jooKLOqwqwxwpGi*rH?k@VpmBgLst-
z_*To#_s*n{D6)4lPBSlS|0awm;HstK43K$>UN}T3Xpa>3`I{~!<sf$(79G1EV>J0W
zx*Q86=J`?}-zh7sJIT`%OU)UYTpM1)zA#>@Tb(FI;U+&}G?`GQH|?+W(T6W*C_>R5
z6kPc{usWM&XSl;glei^%H}BTyiCyIo@r7BUrj9MINS*Gj>7AA#!<zKO=5mK3%<OD%
zEW@L!v{Z8^WamJs!H8}xlU6s;xtJgDwraUz9Lxhao}nU{-VD`hjI1fgR7=)vQdjCt
z8^6x0soE|01=`LpPlhQ2OvKYR1uFG!64egZ`gn*H@Lix?G;`zAEjx*9z^-+B<Xl!I
zR@=J8X*MW@F}ya_NUN6PbMR?MN<#EmTP2l<oetsiXpXfotg@<r>LBUYi=o|O(~|n)
z`S{R0c#9ek-WwH(xZI@@bz$kKYWd7)(z9CBx|3X=q0lGLZP~9%Y}ROU??L{vQ2)~#
zjywnRTJ}(F<_{6pPBKfl|1?PEw?Mc4UFs)zg*1mHdb!&E?yt{dhF%?T{6Qj5n4wtr
zUQzltAYR5M1fA<3R3mitdb(Hf@$<*`ceK}`abz6#dOa^vj3weBlR^U{y4NmNqH3p`
zAWaP``l4I|pwOwVnnve$py5K9YeZFjPRC=_-@0Lkd3O+n{G;g|O44==|C%T0wxEiS
zD8KJ+GO2Z#6al1(mxtGn?_QVA{~a5Yl>g(@;RdV$)N1D`%PX0y=to6`TX*xNz}w1c
z{DgF`3|g_3*k!L16VE?mj^_`tG20#VKcaTcsLuds<nAO>{__RqfUfRZOm-;~(tfls
zHai@4ie!JQ0KK{aMw!Y2+p0H&Od#cy!7ORF$9mJ9C&Vc8ClO8Z!8LS+27L4dH9d1)
zwQCD1S*xM_q;m4z{cd=8%>VglfN9dABdr&y7fqRBO<)kH|M3cwmZ;!uV)z9-p$!Wi
zG4@ac=bV9jmKXhCKEMt{GRk2YjStR^H-0k89QP9Se0qsnN`oG|Zj|3PW{O;f3Vypr
zsVi?kI_!RTJ;2F@CuF2T+eMi>B(35d-xWGQ9hU>pD~aNM{jYa~Y+8jhJW@}XT>E2w
z<uCkm<KQi|=sjc%s-~o(EQd?*30=7hsbgSycs34$UW`lhjcl`MmOetqs_;%XV?Oe}
z{O>T!92dQrRLTgEu_aA2)*mlmvVgzPp+f7lzr0zK@FC`TD`sd1oDz0Ics=l5jB%OF
zI<baPoUnFkLn#gf$fNwn+NI(egAlk3aQbigmbqDP^J*cnDFcqd)$g2!qR2-XNzmxx
z2kM{y9S7@~EmWiLKHL_AAkCvo2qr#1jS3Ci=&{7za~=J!WIi&(s_FWqZm_}vVWY>6
zIHVb?(l5OKI@4nW5OaIv1ut!Pf-VE}<Ga*8S-!%+`S*P)7y8fl{OhUigg1bI)ecYr
zl*%mpW5%>__VNKlxQ0sjKnnDWPcX0K{ohX}aDO=MNw}@)&<a>8I07Tvet4<G<orGL
zBk!ryM84^jj5P_or^Ev0bmTpeBkyVB3vNlrO_mFD2;J&V1Uyo1HQQyE1(jTL`$|>e
zL5E7-hk@|4|M{Xyn4Lk^JJKVu&RvmkS<fIH^5m!?NTJ@A87zU;*blcw?m}BOol6U8
znSDWJs~U0U4l;rniI=UN-xdCO;pPlzoxw{2)*%XMm*JsC@N2(`UP5Emq`+h^jLTvx
z8Ib*xNH70Z26n$V3F9M9<(v1j0(?2R0`lYD!@(PxcHsFh&-BWV39|r{O5?yIu?OJH
zCm+Ib8CZqolmq-q%bD_(1Py-QKJIVWZDo+Im;GuX)A)jiJo-4WzwICv4?UbQfzQC}
zFABP_C~vR%nVGql99OfzKGf+x3;b~o6|5oWumz24$4!y6Z3_7J<COera{DLsS<Ld>
z|6Z1rA`}UeNpXYUasEB$?@SmA9g@`o#8sxOBZh4R7$n-KPz2du<SvrYE{%wQPo=%X
z{RseM8TdjBFG0OJep%mGtNGD6$sTquF>I->0m=_AaAWDwI^C?dnEI9By?kbt@yZ{U
zQu$-J@rUIAUh4`e<D>rhyDzI3RCHIeT>EaxcmL~1{(Fy~{|IFCl_PM$%Mh~#k)%AT
z<E!y-oI;tL|DGL=Al<=nXt>-3=<h41l2iwT7eCxm*uTX0GT)EgVUE5G&tOP;{~7Wl
zWxQd%vf2t(-YvXWJiM?D>(9uC*`B;BCpzug5x@Jjf?6dz{ejRg&It%)|8*PvFaIMJ
z9gW8BZ3gWv%>TOV|LZU84M(VM)IM>J|1C70uhjV#`5!*k9e-eHsPqwD4fwB7?LS}h
z|L_ZKln~K>cx|UBoaO)AGyj_>Ie*|R8K8S*tzcgQt@i)=o&4v&E6f6n28UKt>*W8F
zZz1u&%P1q?efJ4Q$p7#){J(rGi4@jc)T*#V4R+xF`knm8|0Bael9v8}qsm|5|NnO&
zFSYv>ta);={ut~3$x<n#kt17>d{Tz_|Li3{P=GbZ`n3k_3Qfe8!5(olaSXZkmOc8C
zp4z|mL0TEf5%B8m5&E<vkgh)ELmizz<XQd}d7+x5m`GD(80?c5$06<*t`B|Gx6NhM
z;BXv?=Kn9hl04|b{V^aM4a0cK%+_frsCAP8R<lR^22Mw^RN}`a)<0<{gF0VmAfyWE
zGK_<G!uS+v=z;I2k0Ugi3f+KxR1P=z2-1N1=60W_L6lW%UoP@5*hu`44!J}7%XjHp
zV%c-R(93{J*Q4eR<^Ut2lTQYUxDm?If7{qHJ^#dV&|rOeexxKZ<A>o|@cJv6zbCFR
zRC~Zz)$;*9%N$eM?J{sAsJuhao%yXo8XC&uR#8%VJ^&)vBa{t$P3#|l`II4Unvci0
z8O<<z^;as2t=fjC;E%_TcINFh3oL46X3IbaI|7B>`*9lkPp|oy@KikLvVTDzWn>C4
z>v4diChKp<uns{E^A_pp*@MXXV?HR;%i#S_J1QIOAV_;xdsF`lDVWduM=u$e&GzRc
z6!WxnJ2dQJWqLOq<eGTg)&zDpZ}ae=(s+9#l~pxiCNdMz-Rowcld-Gs;ACwev%%K~
zvZH9T^V&68*=bG>x6BYj6?<fs``ldtqMc3h%g|p+9T)84p4WR0U~)CKHzM+N1iXVi
z^y;uZ2^zQe@A|)oe=Xx*DTYDobIPOvW?^yJ0TtKtXARs9j*dXA+B^-bB;VSE=A2RU
zTqhz3tosN`KQl*2kU~vRt1noW&$vrxGjV)N;L6?f#b$^WR!x;0OToB#G=m|w4nN*(
z0(d2FC}MoPwQHC><P6bBb1tAi|GlHU0iwhlsqF>~<fd*<d05;oZrOs%HMrcN4T5p~
z=DE_2?VEr1Zf-KybO<h%v}^y73lv;1Gl*Tqx7vpmU_lCyYs!Ef^HCJ0gjp@<%5KVA
zg$?T#5%0@K?xr(Pf*hBXbQJt+jM;Eqy6E`LWj4UaGb~xstqP%ky90DuDe;_YTM=vJ
z0s<E67ZQx|+BSIX$>PxK_`qUge3qO30to$xy7ckFIO4gGz*~q@E`Vo;b29&0nIU%)
zCRG$T{RQrahuBM=q6YMWp1lOC$Xp}?lN~ENWa2|?#mkWSnNO#nyD|>9YqBAq!kG5O
ziY=6*cst71rrJ^3ne2z(loLR)n^n}qJw?)Ck9<DelvS<*SL`8oFfXT>iV}RuyeKkp
zX8-tS>&AS^+O5vC0aoHyH$oF4ABQ|AFs}<t#a;J|j$ztrbhiQ3>l6BH3k<U1$$|FC
zKjYt~Io^m}b5t|jZw+wTKWEhz@PyNd<oyCB!63l6Obpcm1Y#CK(faHcSr@Fm4vHFG
z*8{Uwn;@S`kx<C}8$GR)vvuEX?aCkZN!*@XS{EDJJX*V?yvW6c7cx%;J@kxhuQ~qB
zwQ|fa8+Kj8el4!`=957$p|=i=Tm3qAusU!w<!svwh8EQx7djQq4|+u30L8{9Z82vz
z=!@ztgK|P`Sf(p?9lKC{@-#n8c2Z{K7^LoGT7JiA1>{b#uQ4lt7toXI^Y<}I<9%w5
zx^~EVXROln2q7;S<vp<s`vr}DCv97wUq8pvDxGX5(y|I}xvgQhM?9>_VL<mJo+z^)
zSsA!$g@R14__Ti0qLEtCvq+nAhGjjE&+j^9)NX5`x7YoWQV(N<X8=!g*{s=9e+U82
zc`fJ?!#lqNnBO)tNU3N^X{f&~;l}b^N&G+!OWkCL<VJn|3q!9!9tlHYQg$J9Hw^EG
z?a@p<fG#e413r4hq3O3(H+eO#1=!c7UW=E_sufO4S`HMqeiSij?8vE5_lGG{KN}+C
zd3T~z(ps&nUqZ|Dk<;}G&ArlsfTw9!Tw{q3zHIZ7@<;gnuBB2=&GV5IRtw0MY`1m`
zyq&$-QPP-<X#ynQqSJii!_-y8&%bW@7LG|1f~O8rQb{caoq=ntz11oQCVg)kI*xDs
z1g@g_rNIKQNBWv+MUs%?GMP3+E%ZQDQy}8Bmn{`$rPc|m<@0F$a*(0-w9qCh;kh#I
zaF4M;fMHOq@CM>2uPxRv*kiwYTGq}Sc0J*9=cQ1nZ+;bSfN{(7t`966nd-@sjGMRY
zHlDmwsX0Rq$c;d3Lj2e=>(m$PRmG@1SX`fr97p=EYdCBN1pcUwr(MlAQ;&K?<g2_|
zN4!qd@}sT}=6$}aBF)zJ$Y6XZ;%#yjwx&{b{~Zevt}=sy51UWF9=F~6GyAFb*Emru
z@mkBr(+DhCDvCj=R`CQ(wHH-w-wfOaGzT!pk7ND6jsvyehThH2c{^}wcVA<`-DBcZ
z%Kdx%{W%>~T8FSK9<DVLMI-1rl+GO(pMQsu1F28=We5a?U-ps4dO;KRGe#hFrLXqL
zWVMIK+6@!S(tgu7Coaha&TLCDRq-k~*jO$Y;p7?;t5<P??nt~#YuM<^4A!15-e^c8
znOBY{I$XQ)>>c9$mOp;0>Lijy-;mn|@hB#Xzc*b;I?Af$lqx{stmsFA?XNbdf5^E$
z=us8c7S0tUGfAtI$*1_fHKK8E9uxQ2CE{SQYNtn@wHO#Uhx7fWH%)n*<wL_epsv`G
z+-V_8|Js!E6yb?=IJ*@Nryo1q{MJe9Fwk}KO2&}XPpe!~W2L~6+HR>syU0ajq@4SZ
zQGVFNkao*xmt5*YEYraka+iu{cS1gcllSQq2U$>(ZuF_2S6>zWFaKu?+R}rdFhKHr
z^IqID<H?KFpOH4@Q2^(|McbT^15CGO=C!s~Pbz_q)_6C*o9X*<*|cSTxbrzDwq&mz
z^#n-j5s|2QPp8mm>(v~d1|JxCuM$2~KH;>Ew37;~{J~zV^2F7*dQfA<Wi2&<PB)v#
z;l`5{5+8YIlG-_GYYqPwH_Lf&#$t&bE4rhce&67C_xsJWbh+h#tm%hac2%(9GK}!_
zSTnVI+PdyMZqa36Jd*V9__<a@RIN`zf7{S)d;!fOGx+=U_@g$NGlhHE&*oBs+5D9)
zv<XEMhBfRSBeM~vB>*xv|E~Rn9SNa6eco1yQzs$MHjU<B^7z`SPy5vaGUt?&j!^Z<
zK-9Zy@#`4^OnhBg_a5_=auAAG53aRIok~+I5aSp(H=8gp46SYcq5tWfdxc|;4h;7S
z4rR)mexuS+Kdcrj3$Ap}&}^-paQ8?VY)~#Txk6KShyN-&mjHtsTD2mGtEDtf)KerX
zL)A^Zj~U3FG-a@6wQdeKT@FZV2;j$**P>!+>eb4wiS0539vZ#xEeiUg`J!jBcQYfv
zhT%4|Mv|t%U=+XILi_~oylTzgwcmloIGF}Bs6Eb?f-*5YzLDUMPkhFI@^aSt4L<;O
z8q|VBnnrw;3vUWsq*^&+vo$>}={i?iL<k=2&^_n>F=`%2XzYJ6l+i+!t3Q;g)xs|4
z%9TD%^4X{P)iU}q+a4XH4NaIQCi{>3J)2(Oz2<4j(CEEEmn|LM0eL7_N$Mv&hwf9(
zlp{aMpGD2SPyMjMU}C|5NM}oRp5@EK-=OpMfaA*G5%>*6!pnaOt~4(3-p^fiq_)l7
zxOkEhCx#i<bqWvyDG9^%Z8eloO_Q&=6;XRkc0+=o152dD^4GJ7h#)V_-B@QG4*8(@
zm}PB;U$_(b?}s!$bGn+nh8-=tjhpRD6;6ow{NS3$JUKhEo36;_)?c*F!3+Gr$d`yr
zyDmSDmTLAKhfKAgo6U&<n*8aGaTD}UB4T`Y@fFQ8>{ZTky4uT_uK#Xeoe-vdqU(SV
zW9g|AH?@B4H$A*ZRKjs(+$ouI?0)^4a`I`Ni_gJYmPn9akBJl^o;|G>ZP>bz&WD-@
z)z2LxP3VU$4m;CWazl|A>TtDeNvP-ApJzB40V59#c>_Ovnjqgs<O*DcH6?63p5(*3
zVfc!>C}Bt5JCC>rLdActeJmUvH*G9H&!(RsP_&RUeegNHdt_)oD9P_9qIp#Pva3M2
z?tQP#Mj8zJj3mIT_nCPzJ85g#u0dn)QXsMP3XNpbQ&9q6XibP7t~iOO_(n`pmtzo^
z-KR0X5IiYjf!6sAX}-n~2RXV(zXj#3v4(V|6V((Z)=zUkCd&jg9Y}%msae)mFr7+B
zxx#V#4qY%>!+OG4Hybl;>3r*t<}N;j3EM-K;VcQopKpBk`?W?sxs4rt6`5#UCpt5F
z3i$!IvoGR^RVPVhw#{&vobi71b<@k8I}9sL5X>jGDMH=*Kck4UcBiU=(o$-rkQy9N
z;1a8=({LlS(u@aVi@ydRhnno;>Q4G0C{Y!4<4-C#yv#`OqZkoi@L9wcyp7o$hu@uN
z6M|2~q1xA5fAVRJ=Z`8t#iK&5@A)oHjC|_CB|yf)FDzYjxc_<?(|Ce^@LNo_F=X3y
zqPdQ$d#B*bCN!12z_G)aML<o=rkz_POG0~`F%`oNar5=5pDih}%Z_YNzEqLK?=PX<
z!+k+59T2==krRStzEbf-5<h#cJylqjZe~n5p7^k+fokFGTG)@gVVtKatD2asRiYPe
zu2c+(cGX)?N)5kqW`2_w6Fm@S@6Z&$g1$q$<J!d&KOsS8{k`6M6h(Lco^<J0c|D2R
zGps_bHCy}Z#rRY9flXl8BDHmKin`{JsC?gUQuiOwIL7?4>XUerw_4hP@g}lpN&S0e
z%S3(ewU5&mw7l<cbGbPdLR!@G#bv(c<-H?a;YWAITQc@r1ylHc#nU@<>|P&!>Ucwo
z3!iLP&`U>Wuj(3sNS}yowNYcQ0~UXnsN?vN^exz0A93bJF!)F<ErWL`!k-2<0o&Q+
zdoD9rwnr0vcf_JIEU5Be5Opy4wC2_+>no#-<(VHh!EF{re?yeBI_x{ZpXgl;$~WC{
z$B0J9h?-UVQo%@ez+cw>$Av78@GymEq|F$sU3~R)6$wfbbU4J{V>0MSp(|QbaM-OR
z*G&0;k@eO=RetdruXJ~JBVED<DQToz>F$(n>F#c%K|(^1M!LJDC8Qe!LE*0bJLlZF
zGxuL-oZ0NX-t~Utc|H&S+J}%@<@rvK9V67u<fuA?La1B(z!z6oR)9qLrVyJ*fW2{A
zVmpa5JSpVu5){NeSdYFZ`$AajU3A|y%%E288!y+`>;Ev$arHsmuuciYV-<SvUj6>y
zYHCExGu5X#1HIU=DKCfV1`)=z_iU(|?J`o$y)~47IR}{IOCcQS+s=)vpl3PrSs;fJ
z$Ge2QC0@MX9*~m~*97$OD9!Z5H2&05ijolIRFWX5CH2*vDQ28{orQzShA@I_{y3g-
ztWP%#lE8&&=me+plcqlP^~>82lwo+@^7s-P`>8aYUc0w;0B&*i7~*7SZyX|vGmL)Z
z$+=MvJ%`}^?fgII@ZkT>VGi<vvTLG6oiI8dC>3-Qa$hbHG4x4rBKoK0%63r-x>bOS
zfZk2kaqLgBen@#XCg^*L-dOLncO%IT9lNCnozzJds~}>MA3%qfXN+3<eP)c1iN0%`
zj@6h3?4bpaH$&$BsiE8-+U977#uD-U3eE?st&RNpgv$V+IYMG^T038FZ+=M?TU7Ym
zj1!%{WPevXQJ+)x9KD#NsaCE;nP^$UXG96^Khd!Gx9LM4D6CGgu5z=nFaxP~exOQU
zmzA8dsXMV*|7-aOTQrF#deY6&c0fC|QZt-lr4KC_y?<BdH2~4^s{?CI@-drN-7Ru?
z_cs4aCodMh!ArF;L3~-n%XT&@<L^SXU;j#HzG@Jl$wfWtzfvm)?uiH!j5bmMCr^@&
z^WSgan~688U}l;2w!pJk2U`@{tR^q;_1QL}wJ$rnd9GbRXC85VCe~SdUZ>D2T0Es2
z@xOgNz_c)Oct_11cIZa6Ie`Xo*`gC<0%5Gw4?lpDA@gg(v?8k4WR1l-Ox#ZUKmDGK
zNo={sd^m`TctjQkqn9{QI47m;QwU}gRF%^)gniWqd;das&(tr*`Q;E7V|S8XnIz7&
z=t^K-hs$F>pJ;3!Y&=9}h3n5TG{7Pi<Gd88gD_ZUkG`^X^sp3G$3oX7?uLE2I8DQO
zO|9Nnsldv_`-|89MISSoO>Z3k#xfI9=GJPTn`(XYC3_G=Gpk%RoL2<(c25K(K6Rbz
zUQTeBWB1!&@Kw>?!BEUNuKrgf+HZ60^%>jWhaxY_6d(gu5Hoo&Ka>uggbf8j(CtKZ
zM7j@^Io0(b=HF<mih@CW9*tzUz<&~*9mxakJ(u1ug`9n~^&`e)coe5lSv?ctvN>sq
z!hoDew>_A5EfJh<XmrB;`qxQ|Y~%i8?tia72zUN$zxJ_u=cFlJXUAue3jOM=ifbH*
z8|Zn)>>!Uzzn7I(0;G@MRs_6VF;g^Rgcr#0@`amBo1Y_aR<~L!AdL%={VCv}S7^PF
z+L$MO7>AHo_d1D!7bOeU#UIxfUoAhXg-LOEO!3C>(xNf8u<XQLp`#_z<lg)hTYW!n
zR{{>H?aE2eL7Pkh<>_ynSi*XR*N)vuBUj6~OC}ovJLwes6dnChJ~)!x8T1wBD8jkY
z2msD{oLZa0B}1MSL}$ADcbl}gd?L_OeLhaRIYcCqvPCh1nrWYCN%h78127K1e>(vS
zsLdAB+s)^v=5HJ`l*G=17{JP8ok~CyQ5~LLfFXlkKqS*(0<%Lr#251|4`eo(jQpvF
zM;?yB17n~<=jacA<B73=D&6Vi%A}j^>NB@6XC|if_~ZQxkUd{qn+Giz&9ApaFk7e>
z5!h0<`s9t@mw9rdIZZdE-GN!$G+iKQY+-08eSf}E$%my3_7LL;0DjAxxOitzs3l=b
zB7eK31AdusM1x6kkhtSD!yy1}?&o!DzqPB-A!x0&Z;O6+0_QHEA*zY<(}`A<4Hn>I
zOfvD^qKWQj!A6k4=jQeFibaNj-(Pg^OC+ol7cZbh6|pfH{=C{4Ju!6ETg$}B6uxh+
z(F0)=Y;z9%108nt$U6viOdue5kx2X4$1Wjku^vx57pdb?w0s$FxzpA8-T1$K1N)iR
zT&WP4KKY+7l33*yDpYnhpEQg;T=o5s$S<_^p73}EXepbAnzs~k3+^j5<8ZUFO_pPQ
zt^J$D%he^LUd!{i{0F&oK`H}3{IHwj3*5kMMBUbVMpRG8e9$A8dE|UsbZ*k9t;qz7
zchykjv+CE$4%ixDon9t;%VieAZ3*GozmVz=aR(xLw|YYGh-zNxlYsT!w#%%gHkioz
z?~sRwIKz4PjGYgG-}!F1+8Eh|@{i!><fH$1>Ieg67(K{wQ1{Xr#at1EKr+7^=rebT
z{^NF0Ugwvv8LWV=UI193n+eNz;)Rqm7;ZZ&=z^!e0oU#zi_vdQDAuHZ)C_>!2pbD4
zFwmgxWw`fDIt~<_xH5R34sp6?5VqHQF)M}R>9GHjj^1UxvN}RRX{n+NV6YyjZ~E`H
z!LKV)a`_8#&ZHpcU@7l$Z3woJD~({NXI*ShtkM_x9i4{NiAj>|E#NAlLVxA!U1rsy
zzE@no<e9c+5r+dB_I<s$M*3E{yye>{i_o($o2y&hHsk;2R*7<&XgFZet;gDRR`{bT
z1DLY~<jBjA`F<J6KRMc-6ixNK){>A>^?lz18)*sv8<b-@0K@6>VxfHP-3+r7Wkh?k
zA~^B%iCvFqyNiEZoJGs@;f>;C^Um4POlX&2%v(-J*X--^s4Ev>^S_n4-b&9O@Q4XP
zm-SYEcPKKsOe9Wd>p#+bf73EJIMN|Ovim>7IL6cFB6s?Uf;mSm%0#znJ~N+5h7H58
z39$%F3P0gJfGxUZME?_(LZy`-y4e?wfi{x%PmRP&Bl{hGAwOcC_Ok)tnKk-{-S*Q;
z;$$Xf5d7G&JO=%sG|}LJAPxN(UO>9E(AU18QkWpR1mW33@V3OWm@k!7Xrah>^aPfd
zwvyJhxl=-DD45w&6WCb$5>p79OCbPcuK1ViAS+5)#43jn<8l`F9a7pNHgZ;&sW_MC
zm}91aYI%iar~0pYsqCiYBW9z<7+zzDFjvaXYE;_-hVN$xXPTEUarra3=KG!5f(>IA
z>Y#}_-W|5R7NYp7=zEgJ5fmQQH&tg$b=CNiJxqg2$*(o%g&fyfWIn24ZUcwbJ9=)y
z)%?55{H+7SR)dy7a-5fuVGQdW{9a}0`_oV>xpGo#`N$}l%gaOp0ELn4{#Iz2FN_e)
z?-hFvvRcXvfjuur_}VeojCW4+ZGJK$-_UI;gRf;dI3YtNt%@Wl@8r%{bG{T2Jc`9?
zj7Gqs3`!N~BUcED+_v9>JmPY-;5QEkbP2I#ixHd4_Wwp+eu7_Q9V@c^=ncp17Qfx{
zGvMzIRnXoDmT`3yp4Ys~!X`k^7U#0hH7O|uBM)4j+mh{VnxNf-kO_r8Z15*}Tx(qd
z*|q>0d!uUcU+-U8LqQQ#IfYuc8IV2d)vLmZZx$p~&_ofllNe9bO>wzi(9iAwL;8?+
zhb%yZ|2HDbDLGI225yzF2aS4ZNc0qT6Pfw0QO)n2ZIia7UHm{d<%K8nH~H4PC^rtW
z!bJQ2Vd$IJ9QgUS{|5@6P^}Z<&{<#bo|rl23Fi{bx6_wL;+f_&?a4qbt|9V1-UUj5
zpKyuoXDo!xUxyD7L+_K#5huT9o13oDYu1jHhgjqN>5C7-IpqQ1CE%g)y})y${s>%=
zQfaLNN3;SS*7PVJK6A{meKEPPp54Ndp8|$LExje+XUquQ?QU#Hg8$(4?{=x_Ry+yT
zr>GZrqRzyuL9XT#L0aSG8b}R71-qn-ufRGr#MAZ8vxwYfm<GegOAQl#BjDK|X-B!k
zDDu65yB1RTp0+-hv-uKeCr{F`c1YRm=`jQl(eeW=NS))%?39pJub+Vb#qU&Nb(_2=
z1_N8WU(5$gZbLdUXFGlGG?%L^vhTqlAhRII0z2rPgjl+Gzi{@_%s#{`I;v|Gd^y6d
zPUIvaN}apRHmZ-C!l^WKW*LxjX1X4h5r3O{i7sI`f|@m?RIIPDGQSvL|Iiq(g0ukt
zUN80Gnl|DGF0btQumM87ak~AezsvnhPJ`h{O2T#^&cIlw?P_4qM(qm+1k{swcm}@C
zED@7CpRD;i)+6#nZ-KUe??LjVYt_aJl{f#~C`ej2i%+u9w@X}9({}qx92CNH`I{W$
z2byh@xd19}P>69up<jSt%*`6no89L5oz02m;W@8hvgNEz3X(aANKIBV$$m0$naPi-
z7y_k=R9*)lHb0K`JkX(UUm<_<!du+75Y0(7I$m+qb3!Mri?4Xxumyf&xP%I6q*dtU
zvJNg6u#U$gvCXz5<>HO{|5N7cg>)@_S}1wUBXjBRj-h-tS-68pS9%EgtoZ|=W8k&z
z=<yDg6f(w7q}e3a0%{gh<v7EjK)71EzSTUp1P_gB3+$`c-&^93-PJibk4S}lr2e=-
zA+oX-aenbT0fc}CBJ&5E9A^>8Fa||hl}~m@=`wld6(w@ouBrUN8~zg`bFhu84D~Rz
zE@jHanb-e8<fSJT+<z1R&cP&rLM5@h;i>6*IO@7XXw1R<w(s9@&a>DOu66|GsYE{-
zfyHxUA|`<;O{Gfc2*5xOhp+7EheyeJt<kU7YPRv-#Xq25>1qG4eQ5mtb(*+b+4$4D
z!B~xtI5t-YIdxr=v$EdPm8O`IUU}RdN|H)s!qN_&vzyv)(>rs`HsZd@G1`c{RRI@L
z)ANKR36F?}jcYa!Zguin24PhPI8G}_K-hR8dVsb4cLD@s&7Fd(+kFx+Z#}yP84+{8
zIRmAI5SL;!Y9d;`*ER~$zwn*J=4DefPdXCe>z`g0_LIB>bu+&~6r1x0bdnAPXq2C0
zUIB%SnMRqSoWTOH6P-YL7L(8s{|VR`o_%K0)`wGx=$Ri*qHDSe`_c>Le7}2B;m<Ip
z-SX~J)pz%+c*TUzUCg%jh3sW3)H}3BW+#33@c&{l5(Pe+0Bo1@2lys?xAIrC$={8X
zeCOfg1YXO0p*tWIl-2r<UveiwQuzhr8m8-W{fwxb*e3iTD?$x)?vqSQH@DI&C5zmF
z5an@bIv!vm{##7YcAiN^ecYe{he=tvFIQ8l;Dm(gme)m9YqyWrAtoW0pJ5Tr_@KJ$
zeIjcz;yQVd_qzEoOKnyOgM*IELo<sRKRe@a#yi<rML~zFKsLIH+bhViK9BV@HI)i%
zf`o4hyx-T#4vg<$#~4CC&@XS7!oO!yVFONmM{v9_G~>|BB;S)3dgk}mi#^7`nU}`k
z>!H5DfrsPr%F70;R|6T?0R<qV*0*3!Wpj>Y-=m2zs0BUgr>eJkX7R7d$*ri7PIkkF
zx<Gtj_j(VSWf)fD^Pf-8&W9+k<^zie<#&Mru{4ROJ=}A}=H))v$VS$@O*`yyH`K1U
zmHPJ|aev$oOtxc2P5=IZj$e3(dlB%r#bJaLr#D?5fXs}Isdc{#ura*MQ*5x8C<NVx
z*R|msyQTdjQz%<uLO5Q3_lwIDDU(dZj`k^RnZN~XlND>Uc!9x=K<dqm)rdbxvd@{A
z;;44Sth*$d7C4=@zoI-E8ooaqu_mbNQ$~m{2{@7uQ7>a^-)q|RnwB0K`)(jPX{?4N
zBniNv*$%h=hvqjE$7zUVTIxR&RY4&6XugMGyP#@s=1jUHdHXijc?Cd&%E4xrgD^7y
zP=$Nn{;>wGLPtS1O*mPTX@rE83tqHVWy20lo9Jt@!N3Bt7+v7tag%(FRs00)9@EZ0
zXm)N9Igh5!iG74mI0R;huYlIx;zGNE)#@?Akm2U@`{WRvTwvN8?7nyHSL|Y6GL>D{
zQ|@yP@9?Dxn*5>iyAXHycQw)RP*%Bvyo1ey6UzrAcPBnb5r2PxbhxGIZBWFz4YjjN
zPE=l`0;^jq_Z!pvP@=;QSZ{fVIkTi?AE%9@hD@;B@j_`c!`<OgyelWCfppbxap3SN
z*CukQBMsrF6>IhczR`yp2<<;0X4vrqkLb$J7a|)VwrO`9Xr?GX(q4^n@796PNOe8s
zd8Of?#605``i#%*;pN>>ExuJF;kzLyE8qkq5uS0+w(;!w3alfN-SwK!9nO^tCGzk2
zIoDdm?rOjUU+rY77;vrge;XoPF>k|QQ5HZY^4TfSun2su>;PTXtyfDE+e+|L&EFmQ
zlh+{c*ut|3kIDqO==$MRg|9f4r9RKc9l98_gzMY$;76fcXsy0{9wev4H^<`3l%01c
z@T(oQfSOsvrFB|We!QX__Z|^fYg$dja`?tR+%s6yyg`Z(cHXMo+yc}Qe`YOOle7%S
z)SEwdKpx+h{TN(MJ67<?dna2&=Bc#^UO)5{uWNF;boOzpeTQALS|~weLeXS6MeH!^
zkhcJC{YcIg*L-6QKW2km_aL+1R0hrRU}#4*dZ%MNB4Ct`tKuQL`#;=VQao0=KB9%g
zN-HKxsG`#mubALaNqpwI#~(+Qe}@CCuP~l!TEcS!_XX+(7=4L6!;hczWx%VJf=zhn
z{~L0kmdOba%}Fg)7MTwi3DG=Xu5LjV_peu8p*+e2M>9qjY}hZsJ0&!j$2wPxIma{b
zvObm|)*u<)t1$6;Y>81s135b%fa|*-8hlRsXcG#a!O|W_tL?n}#73h;9DNG0OcI1#
zfMvaJ@jq)akSlTa<7Uq!NR86dxwePSWVe*%$D9Uk9$ri?i@&Kjqo8L4K4jnDi&bkC
z0YOJIu~T;qR7&}~To-s2rZA3R^^w0X{RG}W@TXk8{luCHBsfB^>g$mEl!8LY`wmoz
zjMpM5K8gR?<$=Nwtbp#K&6M^Wsy|g;CQdo-v7{MJb%yJB({r7~5-@5}xkMZS6|cZm
zb-&_MSw5$pYUiRv9%}|8bNJcB_nVsT<R)h#fRbx)-foh)O%flbNhId{CZTw$s#jy4
z&g(<JRzA&%KmR}W8GGR{9`k&<IU|p(Sa^p~|Bv*&=ewV)tQSOwS*R*qrHP$DE!WXx
za;>8+C>+vLKnnPr#S1$oW>di2c$!aJz<O6v9Dj8fKi{yo39@7=7RB&3O$2OS<g~lr
z8utx?nwgQPv=h3@ZA8qz_vmJ%%?&SLr8>7v6h+K&`M?v%VYDnVyukGi2Zl_ww}YTJ
zQq>ARLw0kST+cdy(gC}LcChF@u9>bqi)29Ptq~<9Ur205??Ip+zj5~qsv0l;pX`f`
zXRtY&!3RP4Q*KPScmg5FwyYaNTyWanACVGL;NlHZ#|(h84R0dFMW^h`f@l7N!kY%~
zQSqmh4$rG}utLO87Tfg{(=X>X@9|^58oLDR|3d`sKF&Y>G8A%4K0KNZ^i`)%X;G8D
zC!_AAt;$t&g-<jXE8`mO@Y&uRL35~C5s}A0@Fc9(JYolO%=$m*S_&@jDtQyz!eZt4
zm<b>!Jxb}D!IhJ5Sr9h}k}r1x85AbOyZ2ZBySgY8@2ncbCJihMJ~+bf*TF{3Uxm-k
z6v)-+scK=u=owdl0d6_(!xj$m|HMN~^&^Ds0kO8fQm}J3pdT(@bkH*jybcFH)8<Lb
zPJBMk9`DgD7=_FU{DvDuki-APwHS-1XogchS-{JssSog0r1xS!YBYKg_xSy(@)Z`i
zsqb*&ldw06jdNcl=p9|t4}Aj<Prr7`VPfqZX-5A5A!Y6E!v}xBk{g^jE9+CXYeN4!
zC=_EBu86cnxvTaf`mhluhPa5LvY9^>r51m?mE4S6nqogKwG3psnQ$>QV=P@5kE#m8
ziU+r@7>R%XX+Vc{UdzJcMWo3&z$F#qN?)k^E_V|=K|fE`2DORF!e>}Kd`!M1?n~LD
z2ENBpqx6tSX8^CJt@;b}7J$s)UwOI0Y--F8xPvdP`!HsE#>z<RtU1Xh`y_EiZ)jwD
zmJMI}7GjS7bl$f;kzWI>4v|KaAS_w*U`sEupq@;&oM;bm8&VH?{*@5AM@<rVLqZec
z7w37}Ya!&HAMfD<1i`Qsu9IFIGsL92KsGLk3bAyn6xb)dv_GiwCmB0awj1p^vt^jH
zIaP|rLw%4wQfZGb$lB|A5c2u!USK)(nZyhY=R_1*5_qA;e$?8*V$!)r-(^0WDMins
zZ0CJFW=e0Zccu`mwE>-ig;ZY^9=tg?*gp92!9|ulA#N*ei|E3U36_xAIF<g|Sbs;8
z+`AZcmxB-E<B*8O9@LBDNFL0gPA(K7jmuVca0Ih{blF>kk@zwMG9@Mxl1l>%X*}rC
z+Uk6Dkcv0#T3{rb;e$oF5#q&l&~M4BBMbKfD$ZLP-SGY$7gvuker+GZWOSET_*-Fi
z6CB%ML-!dzW&>g&sO$l%)hHGyhS~7wJLp-Fpe$rk1n%qX?%$>x$fymNxMo;GxnnS{
zfw9H*b?oI|y_J5vB0ufeE2vw!PREL|*28`SUPR4(1=FG$akBmG2t)Xc!OY$h@a#6D
zOho|*dEN;IYAP!NG4WC_U%u0U4*fmwo0PjOKPdoXsX&4~qnDgI+!%Fj+)-IxHQf-z
zN!`2Vv&M=2VO*gCvhJ&p3FIzc=OXw;5~<BG?i(Bs4dQq}-|*W=`=efFAmUX+U4F&J
zEASfXSH&BJT{xh7JA+Io<IU5{7f+@ImzoLH;9(%Up*;*oMCm~|1||)?+Io6LI@aMS
z^59D&{p@KN!34AJK0eHyJcu^_SE`M)pmtY8m~b6(73T?wzI7j$mSZ0f0QNO#d;bQ=
z2pfXEU}a*@3RxL(fMLz+uVN;JGf_#c8g$l=mE`^iLU{x$j3yE`k*NGWoMjpS25MJZ
zeGH>x_Zd3HX-fpfqIVc|El$fPNcRibMuc#PZ6=5&H8vV}jrfk8^Q5_&o`9ETa4pHI
zdpky->WfL>1bDJ8urVk-0dD%WKm+)l+=D-_1Y9|hZ{k{rr8kvogMh1kclDj~65i$P
zJFPxJHYREBM<{@T)T@Hh)fk?=E||M&`E6q3Kkt&MQL<oBTxnk%IIKKj`tqQkrR3Dl
zQTvHG#)%b_$H+RifMa1-f_I41r~Qh>m|Nxa7_8>sv(g!-B<gpyVCumSV9IKRL(^M+
z52Lc3>=f(XnPBd8*4@1xR*=NqKu;(tQi|+L74g1NN*ls~`2K7cAH)i87U)$6r<Z$h
zxADrI5-hB?n1Mey1_^J=iY~FdL^6xVTySmn7fVc%F^-E7`MCXm6Tybj2$#*C3Z7BD
zEvWbYCmfH{yaA}yt{n-uj5RITlMKrh(0LFM-XNn13aes4u*_)WF`>&YV?C&1?X}I0
z;CKsO8w%f+kXoZge7)Su@p}+8N4HO~G;Jk=;0;GAym=fP*EQm5U#R5W{1eJiSZT5=
zKUJ8ax^PT5SG4EoLs7k`X2}m5Fxg~kdy4kOQpVqX!YUTOL(f^hLgflwT!`}Z;urIU
zJ~eK~v_=2K5fAS3p}_-iFTFN0`k*bgS9pVc?qB*PDmU=xAd?K$(;y)%owbnB_P5~G
zGj|%RIiMvI0QDdtV%Tq;X+{*{{48X_KlCHI2`Hqq>1vwKs6Jy44s-`&MRaPnxmru0
zV2f1i(T)&f9cK_Uv$$9*K}^?PBJ9wO|Jk}`UN@0*#WN4j2)P*)&+nL#{qO?ET!Z$G
z=F4R#+<BFpgHiJDP7FmcJa3)Zd}dFd|9Nl_Q;v3VK@5pOZp8FwJ$!;byrDF+_no>C
z_i<JiUKKvNeqicFOQ5Febrj24e~lkrRD}5-<{_BPA(x+UMLsQui=$tSrEPuP7*lol
z*WPO-8iot2Wi?J%I~=o)k{|yfN9O>FJ%scqq#iC_j=-&gJ2q&6n`n6p9m_2`9Pn)z
zJfgUK-q{d+cb3vIG>HSA|HT+?Vhe%NVw7kCZ$+fm$RUn^8PV6_NpT~psQ}hnK&cY@
z8ea%PG8*wBw&jB+MEG&QfOur}h5r5s=SXfcp#|A>mrp7=#3vLQPNLWj!byCDN4ww3
zr;8Z-k-ZFz=zhUATx^odvt0tFlw0nXU`^*C!XJLw_B^%G+A*mn4D;6$N2REsyn;xY
zL3~2|0w&n&f^?fz9RK4s9QVB-F+Ppxg{f43;9q!}sHvFfiVAqRU&gpnH$};BrTWDj
zY43@uKmL|w=WALJ5&60<(!QA&T<UB2sIxw2U|@i?sJ5sw>l<tf`s}spRv^&!mc)VM
zPoyyp_-04q&TY9d@Qq{W%XMwXRrFIkj+O9@z-U*XJG~QD#K)#hmc_1B%rP1n(d-nO
zZijTwk(i6XB}gr~zPJ3RmKT^h^z3|)D&d5dZu~VImp>%!{U#!^t&00eUMS*9P8}Hz
zD)q;z(FILQwW8;PBBfZ1GNcVuiw}Fcgfu;c2VK~UwpT2R&gds?<DyN-c~0z&BVAUK
zlf~LL`^h~|<)5JI`#e(Q;=?<^vsMBTw}Zr-k020RJe#agb)|GHU4SEx-78}xIe(hP
zK1_c)iBNX|?m%uTn#mhG`qnEY6>nSQ;CEp^Wf2@R9I5OD48^$4Pzb4+WM}CwLW_*E
zK9Cu*?#-|hq~$htE$IK?rYfLwg_Dju56^jl*!eZ$%NzV5<QI+)@-M6gRXZ;X6ne1*
zdfJpLzULP(-h6*|(GKcSQel5#c57+xE~hiKmB820TFNVUdO|CsHjkV6f0ptBbW$**
z<CIVyJ{)xEFev_+yq9T%B`jz7j(K;szS_jZ@9*d{QA2+{Ryg#&O~dp|{>N(xp>GCW
z^khlpB4;qKEf)q^%<>j-@h@*EX)i%j+?cXzch<vDi-~hKhT`$B=!>)$ih~0ybA{Y`
z>7PO7(Nv#~m2KjS8OpaS7fbukvjT-mJBEu^=IQ)XOckxL!P#u&x?b{xWbhgi7XTkO
z>A>bdYO}#8ZlIsvcYzx8jgsCW1^ctdnDE@5*EqjERd@j*hs154fQ+`d9!Xl)3U*K`
zL_AVeq;-Q1`N!aJ`Fij8xrURXDqb-181hvgYNCj+cE@EbHGD5SU*MlZZgsQZiEjop
z!HHeQg$?*(+FtiNdG0eQvxxc$^4_rqkx9d0u_a$klm}f78cG_al|C>yX1hN_9Rm2g
z@ivJ4FObyM;KD;QZ@t3Tj@eiIR*aWg^_)80XG~MBGYs!K74j2(A#92<7I^rtP6jHv
z(0lgW-+sVUAlKIH0K&s^*q~|{eNk$1WJl+oJTjLPj5Z}2BGT~@px{;FHOpz#Rtf&y
z4vYepjiH^?ZQ$80TBQH{hJGzl%o>@^AcEiq(k;^d)J1>hZ<S9?soTX|=l|%@Ot}^p
z@uIAzQ8uEQfcXVG>z}$8XW}*WI;Gz54$NLDi7_h>F|U51yLsIC`BO3<l}mk}(k<0H
zlbQRLa<`$aw~`)1I-BHU)bs+p>*db;@U^DvgVg-~!}s3N!wpXI$P<si3ac3L2!?Vw
zt40hIy^`9}5x*EY&fO#H%8@Rx+yp6xl5-KPKM@-#viTnQAwv#b9LP=7VAxoSw9V#*
zUm5yI1X^LsS@mVQFdOpP`#e^!S|39d{8oRU`3;YEH?4!qZwDCudk*02vdZBZ&0z9~
zdGrGxz2%5d6;N%1KLPuLNAC}aX26Na<|zo?Wnv_&a~#Q9Ta4TL*wr-41+OeY)PBLx
zSSNUguC0K(RxoePISwFsdq18_`ZTnWKg=MXn_mB#z+indz6v%5%AAdb6fV7QeV?du
zB&Wp-oyV1^I21Okdu#mok%c_Nz|gh%(m+mUG23CuMb0SL@OUnMUU-bBtC9b1O=&>f
zwoTgmf1iubU#)h^^@f`0J;LL>HR`^??4UJZ9oEHAx3JHNV%77f5zdz+l->_c6Xvgl
z$6|$>a6JTzbH$d`2Z;B%5|!2LD)^vq>n>Wd^~W15?W+qUdBpl=8Jn7g78m?NMYg5A
zr;h<Cn&hu>bHkAFjvD)MqGNj`u|#+?kQl!ZQeIq{EsVb69uHm`^t*Tnw;M|&Q{WWw
zAB#h){e&faAy(z99^=Yew0g0>kaoQe3N)_QV3@c+_^z3tkVrq{cTi?Q*%vy#_(jUa
zR@<Qck7$0Oq4=F1VVP(*Sx>33na?yGgIy@KBG}Q{S+OL)iK(e~7vi?GIEd9%HP8~}
z-cWtK|EX_4HugCXX0dB|kMc{xBNyIkcDz{aI7u(q(|Wo93(PlrooCM0Gc)Ev)S_Pe
z*>@#B`al5rn^PeHF_UgX+mB!}h4Fr|x|r|@6y~49jv!%hPgDMdX=YB-|9W6s^NDbW
z<kc#h438;yz+Slxm4A|<46F<}qO058P{oiH=g_CknS)JMj!M4BhN6}@FUASjv}@;M
z&ICbYLoa+SCtZG)tx5}fsBxZ#4JNsVI=wD&*D<rVo~s<ETd}PXSO@&f4rSQcl}l0y
zRSkZRNRd5|2k5v3!;np5yr$7+;$K43{?jgL9y}&3=x$U3<k9cz9nBJRM9ojsLl4<%
ze*yiX!wFV{RW!lxJR#4v=M)Ze0{AD{$X_xvL%~`nNf2z8cY)uHVOH=~)XNu~4}@V<
zKI@f>eEi!&pN9sW=NnU`niw=Fz_d&)x_e!ME=41GDhv>B{;_?3Ss@=zYDR~_%H3>x
z14AQ#b$9h8j&Xj6+S^TAR~3)^Cu#nx_%F>0<op4xTX~)vDBs}j{F(|N${zwKb)B#w
zW^pDQ)YU9zl0K}NlRC++1tmY#mxaE&Du+I^zH?{jBr*iU1dYN6{T3>lsh<Z0)5O0@
zup){sJGyKPlg1t3#~)u<DKbk&5P#Cam!Gza`No_YkTsYA`IXyVD9U;DQH^p$X4fXc
zx108r?ar>jep5f*J4>TOQvqq#wL=k<<Ed8T$j;B<1&sI1J^Z5XN2v-gxkMe(xm(L)
z^TJ5ZXH{We&i-=d#8b47{eVBO4<oKbNZ^Yt!Np^FIW^Z108mfGUl+~7OAYgP2&J5i
z`|nPE;MF9&F>ze>6OLe0TkH*6x`0l$TtJwGqH)Cswd`KMLe7?0DqQT$p0@G`t4B<6
z-h@I*y8uUVrIpaCO0Zhy6dW>hIJ%-z6o`q))Oufgvdl05s8xFwBUh8INv!@qjn@&N
zK_DcQ*w#T&q;PCE@&<yT;>AsKW)_YA_)7}PJX=EuT5#T>!D%1v_%6C?4&7Q9$LAO3
z1|pakAdzY|72dQZB<=yx{oKLJFP+ZJQ*9;desqyu_ZNVYVvR<mE!HIQmE3To%2_VA
z!3YQpK3Dm&S5M}XH=MkF@7)_i?i=z2v2E~o*gn*q_A+J=M`qrlL|1vyamDT9qBh!M
zn-5W0xJ9f!;ODub3Vrii>3f<(kRWvJ^k&?X*gWV`_zQ+A$^95jV@gv>`R0|}kohK-
z>tUX|p61RQ{59{wecP&2^$pgSckL^_(M_7GWo{Ym-_<u-%8?mody~Qy`!wP;CDBkg
z(AJSSBDS@vSBZDaut?gM5nvx*zM~hGe#a5FwbYXnj3_CG+CAX-Rv_xi^e>8j2wGf;
zB-^x&ZeGi~t9hF!$^8gwsUZUpYyXPDs`@0RD3)C>-%L0nQAlefCb<m>xhk9uOWyFF
zLO)jf9_)XtTKbank@yB>mU4U@)jSSGyCb4?=FG`2;PFDB`PUFa9!J4ynhNGqUohV;
za+o=7xFjcv9JldRPV#|npKL4_>KK&`{VoU0|9+h;^s_br+Fd|^v$764f8+Lx&~Fv{
z+@jUEL?og(q=OsW{Fu@^0Jnf|+}d{thaA0n9=s3LB&j&Z2{Rlt$smwWrQ7(qPOZmU
zXA`7_$TrM)t?W>8<xtvD=<GM`LJ5?2c&XTcKQ}GNDc~DES&^ED7QUQgi(;F;MYbb8
zRgAZVSF#p0!|3l>F}6LvsfAf~EX)*yw;t}yIk&8RdjCJwkRtb5b0il%n%XMj4vKA&
z0bU50%)2=LR3Mm_@>1h;>(_wiGr91AO<?1psR)WuU4IafD3*O{vVGVLFfaw*VIa~V
zE4^3c7%R?DG9h8{$#Q?bv-2opGAg&Y5=Wy6x~V*Ap?+o?@}^j-F#@ceLcIb!v4!<$
z8obId?p>P!by;EjmO66_2!;<fJLV=fJB0$Ztt<xgx8+I318TIs>}!rTbME!`(jf5F
zPnJJQ<+?kDF7&-{q-tUNx-;VHDDHEN8#Bi3|5*plmv7Pkp~qx|B}tq7>!-iKyx_Y2
z1d!~cJ0|O98jx{AJxa&!8ar5r8RF9!{X}rnJBYUq{*Ktkw@XXy`)GSjCzW;e_0R4P
z)Tr&>le%xuUBr=31JSO)P|`2h7sq$YVspzy?<gZNriKH1)+G)ljkf=IhRoqzZIjk;
z;%zCoFYk52yruL`!?+qn6`wUP*uvOD3K&moo65J^7C&;f#8qSL<j+#<&|&<bu=00B
zXNTVGM#!E`UIfPw#MVQ}!CIxvv$7mVRE)2WPhh{0UECD<i?;t!8QB!oQTvt<3hgWc
zJi>a(<jF879Xz*}XjJDx_yUmSWyT_&35CqU^p{X51*|UOyr3#d+2b;F{WzU&*v!;~
zc0MfI*tjpCnkYJ%^{?BP>iLXWqi4HrwJnKe%fk=NE12xiUYFgTo*Lhi-U6<}PZJ6T
zqJAgK{Ect(3^!<;gOk1AB2(mkc<KZ~C`P~tc+{U$$rYFppxSXCzZ!$~D?y$$mv%c|
zuE3WeTlU7EaYA}Ep>cn0T50LN@XTI*E~3f0!@F8p-@>+|=_Uw@3H|3NF^X?+#3Wwp
z{y8A2Q8M1?u(ci8a5yJLwjl|6?CTE3S2F)BIk2OUR0f~nhRHaUTvlLfd>gUBH~;UF
zw`A_Bw}OWyZI6*a@-!%XR5+`X7iZ30{vGd|H85-|nh>1LN?S2<Be8`c-n=aRGGm+T
zn=!2R;0s*>Zfz;mlrarGqsqGUAuby;nY2M^bd`+&{S7mRxov>-bZ`*6fT@C?MTD0D
zdixlZbPYbUw@*tyfdV&YywMJC-v0OwREm%u|I{y=gE$XN2+$3m{<=2IF>HNI=rV(J
zhG0kI3T@s12@&<@3*h16|A38`x@b`p<aE48^4=<6!61*HK@{BX--;OhPi$@YN)ybo
z1&PJ16$jNKwC~0c0Ablt`=j_)&TT#8yzX783Q*FF%`f}{fB~M)x7*1f=kN|qfWoGj
z%qL-;2~^yE5K5r@ar*lV9D%LxG@*IvGJ^l8SDdZi{0atlyraU~?lbV7Ul<8?9^+cL
zZgE=U=@vPb%wL!=rqg>0M7&%%(us;DkoK`A)g$CMF%4Y6&DjS&l21BL4c_(Nm=9~)
z&jcUuPM}4!MHN><=3Fp83W%;TJ(N&y84u2OD;Uf-O$+QcnLu-YczwqF?{{iaxcTq-
zAeu1vjG!}x0T(&Lfwnkt$A?62d%Q9QwW4{~pcu3t0iD=E68K>qMkmRrJ+EL=*E<^a
z48~DkTNDh(UUB3j)v23?F|M+mfr7((7N1`jI940|8(;NbZ~e6tL3;b0eyzbmq1e!i
zinb!GdlWn$3-?Bp;LOiUXM$_p@=$bnOsc09(`-@GW+yQ?n~B+n65cvMuicG`0UD4v
z!Tfz@2)|qK^L`=h9;8Y&L)~zbcPtQZr8~PXf8c(L9Vr2giDM9*b-BI~^%A+x7qyJ%
zW9YjNz5w3(_4c!p4Hv;a-6_eCrkvpLqJEBO^$-3BA26w${8c;ddY1Xn4S03@?+GoS
zjuHQ8yIp4ST0WMF8&y|7yQy_irtt~7A56lh&R7Spau!*q1gjZ_i6aYN{rE(0{%Ko3
zw1EN@vZk_CQ!~*`@W*A%dCY#So}VW34%koWpFiMmcu`CJtXKGWc4(@a>~vD&a05f<
zZty~fC=M=)E=3(ye!Ji9yd}e1Tc^eoTIQqJ4wfwfB_boxLHJ2>sSuK*fVM~1Gh;rB
zrNSGyU&q-~4b~xcYrEZH9GradTQ6Wg20KyoCRU+X@1YiFdQeY)_<Mh;gNMx~m8sl3
zGpG@!KtwQ~DkDxE)<|ZpmviwYb&hX79Sa`GpynNvjw!Bx<&YW-Iw8d4e?aS$Ts3f1
zej~ydYl<cem@BFW{AHib$52GDm@7Wl+@Lt#$IECNpnDN%8H6>Mb#8(Pk`o~bV|2#%
zN)@eVzW=rxkQkyN)7f1B2EQ2UE*1E%Uw3=wQ4*V%aoqD@x{&!y?e8$c>)(j$>Cy;*
z@5?}_K=h~n+;&UdU{MIA{e+>7jq{9~{^3hiKEoXZ5w*8(mXji!m+4m8*<PiJ8xlOF
zl_{G)puv{n5oAF$U&2{>hu=YZ;2k|JuS9&8`m9*PdE4{nt>o_>-S5JZs3@39ckTn)
z%>Q?;oo{~Qbv|iW5k)e)9=Ws+*7GvI_(w7ZTzigkE3Ec-)^-{NyAsTcqE9iG<n?|_
z=|<N}H*Hkc=9*^qyr7F=ALUp_QmG$}M>s<<n}!6)w~7wU+8+dK3wu)^>|b^}P~Ey7
zRO9x+JfDI*5=Y8ndK(eV#<Z`)&tu^!9R9EU?mxf<q&K6T!=mN*RNLoXmmqNbRU@RY
z(b8?Q(fD*rO7C#sJE>gbx-gqo6v9RsUVvqH8`tGxMC+;;!ClNlD0_vTAe}+u%ofiM
z(o&kFSLgWyYAz{E&pZa?<S0j2t{aC$3XT<Zr*4kx(v3l&xq9+H2K?{?&$A6ziTF+w
zl258{<U10)GubBipEkcY=ox;(UO9)QaiXs8a%VOwXOF`($RMJ+<H2Gbdp@Ij@#4kv
z^Lz}^>i>m1o){o4FZ9n&O4l1BsENZM*e}-^pHujLe|KU~?<rj$W6&R76lqW$NPuw5
zvcxe=uqrJk-5=k%HSvl62@jH^)F1~r&Hb_er)xs)+jy7IkF1l)NnMYWP=JM*`Nqb2
z;Rz~t{Ae+NH;3b010ICWHlSK0Ist;Jg?xZ1?sR#tZGzD5x<9$$WP1l3RCqd5K>A2N
z{1xEcWPcS#fHAf=wbLh2{{v_9HE=k^HlUp@Pr^~59Gm9e@!BI$1UhI@ful&1_%B68
zv>qt+7BmCETUMh$7#L55&X<9(uNG?#<SEaZaXx|T^%U&8monnL!nQ$-y!T-r2WWI7
zrg;VdfjwQx`x&77zdnOFZl*Ck^CamLActVRwrFhySbW5zRnr)DT!PmYqp4yfp-{+C
zZUx(V|1$tnoB*J;m=5Oy)s%ZL0BSl-0WoElOY#LnlSaH!<0F*WJtOVjX#YdK+$L)l
zokCDk=MInxvOnuj>Qll(L2U&pAVSzSv;e%jHd)Ee=fGcXQ=-2v5lwmLewaKbF7wT1
zZm{nNNcC<RUhk!9bXeVV(Z#1o1JOxP4%TuGDx-PGTQu`8%ZzPLVCL3uUbqC9MrEAO
z;N~LFhMa}~f#&dgBx~>uyqO~;8ukQS38c}8anPb~!rAONo;1!W2Q`SDgWHoR`xbn*
zh74`fC^1ojbZbxW$<`Xd|NBl+>PaxeKVKnuF#~EO%5E>fXeeN`9sp(t<$_p{ORUK1
zq!x9R$_(&bb<lsLLcE`3W~oygVbsu$V2jppcm!c%7o9H?;WF<=gi>qnO2H7n6?I)O
zy9P_~IHKDd=<+cyxDTTuf$_FxmBO(N<UBJs2-ly`FG0~#vO{2*PoXmegG9bns^p5Z
z6b@APkOu7sNTls1D9<Q$2LT9!ZZ*OMOZ48D^BJ1CR~qnVFQfDEN?O0Y=pfFA@pqhd
zxy^>e5AS9ZfbF=e(`<r9HDKpdbPW3Cvv95p{S3uR{nN14-wgYUumY2N@b6z}{0%`u
ztMQ*laYas}@+>`Q>@Zv-6ap{v{j>uyOkWct1)C?W`Enh3?K7utqqRu_8UG~ME72v~
z<ZB3W54Q8T{!%oee5mh1Bx~{Je(6M8clJ5Ll+q_r+coRKWW%A@1K9W{<-48%)`%&}
zW9@rDfQ1fJrr<$hf}(V2=UuZNHbdd@=KP60#j|gPZIjbC9{#3)s#2hQf=BEZ;S)u;
z*sE9u;I{e3%?YOPuB;ZZ6;(g|y8u-21Q=GB=AeC(iE3G!lLVw^P}W{@W65NbMtYoV
z6HIePzhRQ{GI2ju-WDv@=)L54$pSRqQVX?@u@+ez>I0=;qpK>{vPmaYuR&H*!vG2!
zo0}8R7(>{%p?ZZN@oF_7mG7oSYc>S_7nl<oE|X~{L}IHFf)W=UO^!3puj4#jE&zET
zmjK5d3p``n$VNU%jKn7cQ1y3(-6~Kvl<os&M;zVDOIO9Z7>B`I#vJ?PmfYW`t4O2b
zI$TA-NAn3UgD8W>_OcL~<MX3)zp`FpknZ#x0FxK1UQS47foL4U_f3yL6CpQ;KdAu&
z&-H_Ytg9QF)$T=YV$f^Cc&L!3TAFdxXt3o|q!`U5h@3y@e1A{;0BZQoaxO6qe<|4!
zu2E>#TkBpnPlt4CnK|4{=0dk4kbm9O^(}`gy)Fx}O_>5Ijj>wSQvpwNONgXqKw6sF
z5)Y(!GCGSu)JQiLOeuaF&23&u9F9eGR@z6augO&8RPiKukz{*W1^~$O@HH)%;o06J
z_%A}0{AdG!5v&Mu#7bMISbtj06XrflD{y-*ILd{~rguIT{pCzQ%u!@w5vlA}a?5@t
z(-EW(Uyop`<xk&&!*BWWA2hX0_?zlstR`f;gv_Wj`1v^)G8SnOy#&hCj@*GevbNGp
zLw5`V9+qkVSWU7pc0B=74Qps?VJJv!DIG@pAXB}`>r{Bsv5GyU2PHHtOYOOnglDVC
z_;Sf4!+BYORqC~u>_G8$C%tR*mYh8=-ZhoaL1EZo^86x;i3IQAATVT9VZE6Fn0G&L
zp^8S3&@Q_D0~E*5cg=&Ob}f5mPpeYK>l#$jb3WJ$`UwBHYQL$G;d}x=Ntb8HJ;jdl
zY@iZis!=So;VO|vn9Z48y3%e(!>;nCt9`10JwFmt{Y8#4^M2vALpsd7B>6ElU>c8r
z5sHNoc&9+fMWAH%-{7lo<OF85FFP#5k)YY%{Fe@AxoZD4PMxw;r#A8k4zJ-eYIwHv
z1R1mw8~rF}CPwz#;ge-?RAoX;uauVOtS{SGGHrT*4`jYNOIGP*3*XajM-s7p#K`Yb
znyR@XwiY}EuT<Flj2ZvJNOCArMpI?A41V$B-o30xqG4Ei1l+cm1(sT^KNYzxd9m0M
zsqf-beCFYuGslz13O6q(?F4f@R&0VEW>0M6)syqVs%*}D73vxbbnHC@xbeA4EJOan
z0(H?j?%1KPp*$FT;N5fff`f~8N7V_wuHxm@YxLExp+LE}>bOvurpFlDKn40hwt>>o
zD$?)Qly`I3s98vo?|Pqs(({6#Soc771*C0{WGLT;cwqIt3j1s<55X4E!8qB{%C3`)
zy?ndm$}@va)JLpX4Y#C*rs%vkGNpy+R}lgs896Necz3+SDaJaQd~4E*t~fu8xH^nf
zdu57kGvG@}5Pd*a`5n_wiqbTY^`8UqK>Y8?wvM#PlGp-9c}z-=ZtV7+7*sY5d!Z^t
z6N&~VNA`_kOM;uO>Vu<6t%Jql+0CmPTU`&T%tfrAuQq0F0+NDWedDC&>k+#m0{~4l
zrWrQ6gOC;{F#Z)uD>_cb)MtSY!X}IGgIY`rF}771KrCv%z`!9&5s=vJS{FG<!75%8
zj!x!$*L3|%`}^K73Qd~KR)z#|3h?bA9f6-=f2q62@$LOF*Ya*bf>Z4XptWqHlmgkw
zWMnxtJ6-<0M}+6^QSg#D^6ZS6NMrh#d;tirs~YG+K4F>RIO#hzExhZxxx(TpS;%Wo
zyB_<lbC-&P^6a3CC81<-%s9Uyydq<vL2ii+Mg7PZQBZ-HjM2NdYtuCbnW@vMUFkzB
zc~X_Xr-XrexT6YABFmM&pmx-Cg$>S4AaV{Hc0x2A8xubO$jc!&?m8JEcfNByq4vGu
zC<hO10l>|XSnD7Vr_9ee+cT|&3C=MzpI&t3bHXm(gZYEzcX0EoSm@v}DylN5_|-Bg
z;^Hw{80#>?s3(20uh5~BR8oYEmcb;>tb2rtKhf$mipgw$#Yw-I4&~oXK)OjgsW}83
zteEv6g<jcs?!t1^t20+})>>ctLp527Qv7!<R0N7-w!OCvYlaW&0JO!Vt}fD-^j=eR
zVA&#tw|ft=mtlr%JNFalyU=Q!<}1{67oh%2Ly`;R$Ppv*u>2d9y>Ar61&SxUDrBR)
z^P0C-pgNp`gk5XF!+6_InlAGLoI^WEB|H-fEw1C@R+nKiTT_`+CSI9aUIqZKZs#Rn
z+RMGmopnFoFsNclHWHYe(Bxtui_EV^^k`U;F%G38P(&Qo?#<tZ!lJYZ1lm$Y33hnT
zC&7*(&En9@MU}l;+^C3d8QSwV+y9tlr`k~7mca3s<ed*nD3FZ$7js;it{a_QK(I8R
zI#;4dW2`Cblf|1^=F@AM&ipM;tE>)_WYFN(Igt&$HbLhUeDu|Fn6qwv)pSkykB9EY
zkI1=7WOGmxDa>oOQ42g*mg$)Rp1or*byLX*OFe{ac<l^d?ZgH_OGlYsNS#1&s<x=a
z&ppM$X+LrrItfRCdslxD=ABxhDzzDToAZl3HP4f*SGkYqq4=uko8!A4~rFLa97
z_7Cbm9II_3lNfMvoX5)3<u{(e^H#J^ti@$)J1utuZ^v)7Z$8kM5pzL|W9jlW2QFUV
z6P79G9qoyLu&CZ-hPJ6TE7}(O6d%=v8_5(0jl$^Pm0pzRezOJ1YR*>%&6pYwx|DXF
zZ4RoXuYP>j+A+}bJv96QPOW5Wtya#QC5c#WZ#@U>gkXBbMNocuvK=swX)sK=O{Ln)
zON5@FkTvkzG1+bqlksc%hv2OyBMKa-rtx`S?UqP0&k==1HC(~->!dThsOm1UudrEG
z#lu^J>I9mXS??Io{dZwtgqn7GK}b5mu;<^)p$JPmbIA$XI%I@**FguOnGbq<G9*Gv
zTtO)}PGBPiBmV&(b3vM0U+@?)HOkD4nRCE-Xfhiz58qk2;}n%&w|>xenmPv+90x)A
z#>{5}i@P-q+r&J{!{v@8e6)-TIf&yADHE8LqwTx?{IVJTaJ{9Cdqnj*UPzs-au(di
zKQSa7$5^VWaiuxlRKdUs=*pig0s0j?!GhQ32pKziGSo1wxo1A1x!Ce4)zRxUzH<Q3
zBl<~)o~lEiRsX}@kH*R9duA@9|L>{2c*|rOX~#yJh2AjaF>f-P@<~2Gl0qO}*d`F>
zb1c%wDmV7l6X>=e>khmNTvGs?DQ&|w&$B(Us}KUt?3R+=8QFoXoN)IdIIyXTg-_CK
zzKTwBWpTgDSnG3nm)JC(WZ0qiFAv6D>6k`plCjoJmm3p;>*1spyer~4uik(6Z^gY5
z$C%3BL75DCnxhh|)Ceacuh=o%EgebeDle?TWSc%vcw_5`DicJbLdnnOAE%?tp0|S!
z*fs2Pjvfj^Fr!%~IlvuE``;bhjsbjl{`Q;y!0_Mn72FcIh${y*x04JzeGm>(oQx-9
zXCnp#H(R+x39pSjept9@6@G^r*v?C^@yI5sg5|73Bq_VAk_D*Z_{hETap4Hhq;vP|
zVpY^OMT*F|E#SM`%9kZCmsp<Wvt$z$z7&15u5@tG8`!K&(Vhg35ALYNCj0q7Pv*D`
zHZ6;7Uzv03>?X=o2bWW2X}e_KvWMpA4ze&w=nY(T1igWaS|UDu#<pIpml}lK*wrdW
zFn2zoU7~q{Fz58U6n{}7vn3R9LhsDp6&TR|E>EgS$*D%UlEQ}{C#UP9lU^##@$3hV
z@U$vkd%0e-<0&S&0EZO8EV1o&h}iFvD1%nDd|WcXb75lB^v~GcfaW{nQ46#&pTC$2
zqpxP#0OcI67Fsd!sDks_Om`UuA9ta2esv@wH^iX=0Oumba-18LvOj>KFXAZd>4#5_
zww{OwKA^ivyDi{oQC&j$a2zL1+MAB9>2_5)8|wY;MY;`RhpH^7jDgy}D+0qLbs$qK
zjAWCQ62{BD_(_V5>U)hOPRG-BiwFzS)wgO@aAZq5iRXT%C0_JiI=T>x`n7<ImS*tm
zwuQ@boS2_;@RcGY8<o)l&U)0=*mIaB0-j4=Xa?P<ZYvaF5BO-2->lbxvJ&aYdZAKl
ztAbyiim2~Z>2d^^L4PRlyK!Bc`B3SzrDnKGp#So61zALQQf0`s7QhG3UU|v?0hTJw
zg~v0{V``dE+(&j?4&O6!FIU7AmZ4-x_$yojmF2;X5^)tifp*#QH<YYiL31^7z44iS
zt=UIK8atOSMaYs9EVn^6|FHdSS2C3$i^+T3A9sX=6uQ+$D_sVB+pck01h*`d*%Z3s
zbBxf07?s$p0L-qk(*Ldw$0+v|4$#~K)m=7c?U5{wKi#5TcC)I-h6D0-H|I8mC!6C8
zD2Z=P;<-3t!4y7ubLRIDr7v3pvGY$NVPDDMrg-Qylpj+%4vQ;!V2yDDW8u(H%AA0U
zMmM>itC|34EX7?^{mUc0w|`|0({ZCqSkS4qa;$Gw`ySEWdJ5wCsHVB$)!#C%Fs7Hc
zg}-D?+INm~TBe7wt8gK?r{G^aTuh4SD%11KKUBPN((>j<ZRXj3d&C7gK<a4U`z+KT
zO9}-kwhPCxoO3yjf8gapm_pjlAqmNX%(MAy+=KW4^aHeI{ZG8Z0tK~mD}lrAL~&92
z-zS~YEd-g;GQu(V@DvUE-8F!bVO<<fM#n^Uql9~Y4NwtbLvZlxDyAzy>1=`%Rx|l^
z-E(t&$;xJp`*@zN%o~V4{M{v%?Z5r7G)-Q%JE3F@3*8pzv04EJMGDPk@*OX=Ig{=F
zsL_Y%FC``b{ZTmdqmL})^9w919>_h0r1MGW5(<=p{65@kw@TSiE4!jNZfj9QiD^z%
zqd%ff`DlV(Dd)AyM`U9fn5(P@Jm=Zs;-CJOz=`vFv;|0{aPiOw?!iu{!9CtOp0%Ue
z`As~>WoyT^&TYLf_;9|N>d)QU$}dkqkL_r96EkA04hj4M>ID;_XFxy5tNZ~h!kIBS
z2mc~&w2$DT=e%SF9ecs-VdQpP;)?f#SiU2p`=y*Jg;D%Yw0lTPrrc?NQQ2^9+lExk
z0h#T4iu(h=GQ#Yb>b_6aP%gCWAFM=}E)jIFXCT4LOl0Ok@p`|z!>Q!Gl60*8&oaw&
zmC+paIFaRSbl-48CRl6kQL)e(oZkP6he%OA2SrcN5;N~{9STL(zkaC@$S+?nyl@MQ
z>*PMOs`~3-E?{l`2TWuF%yFiGS<n0<@mpz<tf;Um;qtN50h|ND!pJV1L#_!uCZTgk
zsP`5Tcfw<M0uQd#Yc5_0$+tC^G1ZT&VANw))obZi?_YV$B)J8alCwDx{hkW|Gi`bt
zx)TAF^LGK`=6@5js_)V<gx_pkg%<_59J>`nNjN2~2IP!D59wRb)xeE{UE&OfxG@j8
zfq~?hp2=WVBAC@r1=?u?1b=D-U&l~3YPBz;Bu^Ekro}%lyH&SDP4Bc*0Kiv%$N66%
zX(!svQ@5PbvQK4(+BGefztYzu{S=GSO_pm%;tv*6{||d_8B}H4$BWXSbO?*?5Em)k
zNJ~qnq;z)*(%s!5-J&$o4br6`-O?@Sxt8y{XP-TDX3m-Y_3TeRGtc9C*1GTib^YrX
z3E?imYjeyKR-Z7?HYqwO!LTEio|6#9p%=qiCtp}Hqfh(zyA5NBj+ANRH@iHO_p0`1
z{~&)n@}Rv&nbqhJP6d8*W)l3I>k%vM)ZuXTLtavA62Kkk0#cah%|U_;{5`MUfa*B6
ztAP|T>^3Z7v@Bnjt{<0MbscOsujc~qT^X_1%OWn<Nd&9i5Tg6G+F>ImDw_mtBw*oL
z1n&Dz9^)p-RbyDYAQ1RGwp$6$(d-K!M+m256;OIYP5SZvl2ouaDYQ)PZ#x0~9LL5f
zUj{?4*IeIi0QN=|yfn$_xfCR-{+OftRDh8Lp=-r&J|O1`fWEb+k>iMfuegFfvJigM
zuOb^y{c*vyX77qP6VIScmA6P+5nVuYl2z5TE*({ZdIJ@zQ2GSeGkT1Me|IcUbJyAI
z#Iln`#KujpqaOnTCfMehkoGquk!}M%&}n0iCtiTBR{<3qRZME2t_&n^r@-d{YFAWi
z$n<huQx{C8Kwq>;iY?4IY9pOJkJJ2hBD3v190OZQGQVv->0k`w6HsUS!(l^54pEFk
zX+KIqw{3ha4})p$L-)!MDZ9}_qv`!kUq-}+y=nXm<{mocPp`@$KxB4B<S74SpCmDS
zySM`!3TaSQXQUz~?T*gK)<t^1bq=28SD4V?GNnwP#h#KViP_JmtlX;ebjbDEskfqy
z$&`P$($BHMo{MkJ$8-BCj$l;Xpj7xXqRV^W$mnTy$Gpj2sGC~KX}1VhLn`Z#I*Rk&
zbS6Uy%wi-3{#&2G=+0(e5pTc`FtmNQ)@muCxD3a5j%091F^-BTJ3>3i4ki34THg%@
zqTWX1a5iYh@A+7$D{8>3(Ga@YF@Pd8mNVo!<p3!fL5VRp!Ltn5!MuF-`N`SWKUZw#
z6J<9~8EYkxtLjzAtp;T@?y7t$RGxfIlftfO^-uq3w;q0%CnjzB66K7u|Fp4^)Xc%2
z2~m2IA;`*aoX*Z_bY%Lg#_kHcf>}<@5PxFp*#8p!G=%BjQgT|vu)1qdZGL!#7Mdqn
zNsJfn#uzIXG=xC7EL95a-z>3xbm}UqXtY#N=aO78)gcT~;?4z<QtuXvUnOpe^|WH(
z;}xEv#O^;qm&4@ljXeTlqmJ6oj{Q=!ikoxVHF#&Ccu}&BrW7VLdIXnzgd8ymx(eKZ
zgKH8~x3MD0Nf6WxH0lwVGh`xtoHF_LKw5mJYBEOd**+Os29#~*J>J;Caax$dexLww
zB8*kn5I^mXf=odN7S~g`hXixWe2=a}3#yg)z%<71@+0@_l*2c~nmB%7i2gNO=(@=|
zjddi*I8_LjOi#N9iIcJ?;0{d2<+Q<L#Y1Q?)=G?UQjk0bgN9X~pd!DSU{EB_k(YKW
ztL73qnl(;rSb^BL|1O2707X-DZpW(pFjBMwoTn>ZAFN2^RRLPIeO?tnWVS><VKA4_
zL=@c88upBi$XD}F@CD6=0bANo7%~@!m=-Rkjn#uRhA@c?{~nUlG<j5*NtZNPy?*Ne
zu460w2^R6*8-D|3X%q6(Q`x(1Nc%@pFdHfSh~*m`Vg@lEN#AHX_DCC&P{$fLWe$OI
z(pQl$l1crNY6qy$P<lnzJo89%qUT^nuF#j8fwyZ;r`@=UisSloMj?PdL-Csi*Bi<`
z6Pq`pk~yl<qVdR9LRpoBG?I58Y{vffBiqh)@4PKe>sUAe+HfKn^l5QF7gdTc6ob4l
zY%l$RptW!!JN8HBq+_XZ<3947Tr(GJ!b6y}wTf<?W3t&qb$BN=&czz&F)c{D&?}G?
z4m|o)841_3EP?R_)-Sd#-e0Pp-hTBjxZ2NtinO9*o99dJUd*nvr$Q`0e3$f~N&I>k
zy}jam?Uyu$xiQUj{1!=8L%+MRFFHEVPON0BPG>s^Mui~9o5J=&sy=^sqOs0I4s&Tp
zrWSNA^Eoej_vUZ&-dT~peq9)4qNKj%r{61>VILn8d}`kgAYH9XpQkhC7aEzzIaE{s
zuw;59oxUM6^BPa+n~U0Y%K#l{{!CVOD6DP|UdBe1X10)M4&%RRmzZjho8LV1OQ%n+
zCoC5*Q1^IAw)~WM5!h$tt$yJCQs?%%M@B0(CGg2q8U82ejClDEE=AKaVji!8HY3Qq
z;$lAw<<~OjK&3m4wjR(cD|wTJn>(;v;s!?q)&-cpu3J;IdXAO#qrlmb>*dFf+6zS`
zmSwNK+~WB3Eek>rt}2AA2_uk=6B$;4wnO{1Q5Q^gXqq62Ij&hS?VdU!jrj~hIPw?x
zJ4jCBxhFqAhn<^Z!nqfNw|lY&+|WeF^>qLUB`CWAS~Y}k=-T>%%SZ58mx~YW#5GLQ
z1JN<MMDMonHB!4efR)ck6FM?VZb=VtupsD4xW^rY9FipB2}4Mqe<kY`<Ew>>gD<S-
zK2S1|OeQiIH)KsV^lT0)ohu$(AEH>D*R^4>>*YCR5qg7<ZDI?@B8PynW>ghzdar^N
zi=Y+)Gwn5)lq7-hn7pz+-x{tcUhUu<@T)x!NB6yr6kIKI{Q!h|yl?R)obEF$A+ejQ
z=V%P(y|d+Nh<1{CMT8mKJXgmndO9d0fvhA=hxjtz6K-ht7%NO^3JK>3fm1c9p?wbm
z4>Or#7d%Bwb1I@pY;UyqdVvgM83uGyXuNWyKY_NPoAK=J8yy45pZS<>>$EBBSal)r
z7PB6B%i(8up-r<y1ig#BW=!%W!Jpwnp$#1Fn#$c!wRbtPs>!g<H@f$trB;_N^h_dE
zrFa!pV5YrPXW7ELrV#g@>Ul21mBeiI`3H#xY!27<V(KHar}g^!GF}N?`bvO%FXRPt
zI=UZ%Z7<s`oLe?d0GMjxs^Mf5`VjB~X0g4}u(qEhglb}pWVq7b&}ZY>ih-^wU3`nB
zKmz0x##98rQKKW6;+0gUXb)+)u<r%hfcQW^2JYf_d{YIxQCGlF`w+JOOX9jAqHD##
z`;GR?L9ge22j!&*TRoL_i@YhfxpW<xIn($%x38c+ph-EO(netrLBM<H;^iWPs`#)U
zuL*KM%d+)VR_kKK(?<z0!>MHykmrSys53ONnRP`K<}1FcmD=f%7!aI<Km4i?Jc%1`
zznoCX?wk3{%2RU1z2bfGI_=B*sI3*Qc7hNs3Ku%ntB7w0oUjek5qIajcs}tUUJtSj
z`>DTDLzoHVtOKlRlc5XEmP=-!(qAL!Amq3I!MEK+NVc(u<YfSP^arIw*gHkq(Z~V1
zWY2y0QO+mvk$-HTN+|lej!N@#p;_>I6C|;KbCK&{G>AaQK+^l+0T)pKINxdq+|U$i
z#ID;ZVWmS2%u_Uyz51lkjXp#ua~SPb=?{Xt?ghh>4u)Dy6aP7cjtaQBtwXR^ekQ9+
zK$spMN)2^awFRPWHK>G{P%Iq!m3U;k>|M3zK0A4U!TTF-fxRlAR3V4T$3`F6huA{?
zNF$@MwkX|WZtCU)2sqNQZYP;SgiV^14c7q#6`kyFP(&*f{wZASUg~!Qf8|XByp!OH
zcCeCW=s{UUl+0A{!B>evR)33!9oqE=W*s^8dYekgx%l<8zdDP6u~Vpo7g|@B_NCc}
z5FA?^h^W6WRF&O?ka3lxrh8G2cSvxB%G6l0_;*-H49pyPaI_-A3qr}(FhtYoy5{C9
zCQTfg%5i*X#7N;0>cl+Kd<}Lx7|_0+Qx@nCU`$D&1T#+1ZWy~!96^cJ*?>qdEK(Ja
z8fg=|sgnzR5i3P{kN<7$HpJ(+g)yHr)NUhS*9e-3@8^u+M`HNL2oe!P;`tRYrcEXC
z2=9oJ$c$T2rz>4W$)c28!;C*f=z0Yyr}k^^wK$U&xX_(NBk6*+XI70!q=(f^gA&o^
zl!)+F1D<qki$m*(a%v`(`Rj29C=?+vp341SHY`WjX@l!H`+h^!9tMP^h6(1WrC7)Q
z>T-u#JccF>=C@yp<R|S2S1;>Jt^B6KOv{|bRuvV}h}`_@n=^kX6-OaVGy2hctseiL
zNr_iHKnd|Ab>oM5dMCLBnylNJa8G*z8T()m?G97UQ4E$hi*VAW1Qx#}>%?Qs-6Bx;
zWV$F&l;g!Onq(^a#1-W&b&0t*5e54CT)TiyWm2+j|I(k#h&p4uQhqN~4LzNM)+2|h
zd>#s0aR$d@DtQW2{h{~6@ISR1ZlJI8xKqh7jeZ5Ri%F+cpOfj*F>p%D`M(7kH=SoR
z6W>o+ntp7^vuzY|Rt=`pk;L`V+Wp{lz`M^<yn)JNGrtmr7TH<3s%|K!?Anm2krPSM
zQn!m*nY-u<mt1{rzTe1AoBEnxj<zZ#tmFCQPNVyhETST|&IjZ;dmdt(`M2Y)d4q|r
z9WmqIVF-M&uwD=G?4)E@?h2P@EHGgMs3{BH1#aO)j16CYPt$Att^rjJwrn8s)l`~d
zZf=CPU@v5$Qxf#%&MLD<<-&az4eLybpf*kC9Wkllnk#}xjd6z`pk{_pTp>s_)#2=T
zv0LN8p{F(kqE5y2J1bOxCGn65*f4a^itV>BcLJ!M9oarcZyd{)#U7ahnCn27+%A)x
zf@1^<mpWT4O$<6a;m1pps^z7(1cZzIjME=%Ae1m%Gmj-2db%Vb(Z@4tb=NMlIO}?(
zq*te|&z@}+8Fsx@x!&vnb_GOTQKy2y9QqZb7`3ER^4+S>3Aq))hlXhg&%hLmC=kpl
zLi{y!aO?~G=Q@$GdXPB?^$Xpt@cn?iBweGmGlB0N06(ZqFGAWhhqFkgoco_?_3g+f
zie0lSTu}|wTgk;@V++2bFyFS~^8(1UJ5P9&2Ig-ra*pebOE_qH#fYL{@qbo;vJLaK
zQx;jziMX(&e#88JEc_w+ngqr6l$j}vJ+7sUab(7bc(YTX?ST}faRY_;@~wV6Z`9hR
z4$ov*XJ8S=u<0<^X5+Q+Gt?;M?1G(gESc6B2F7#}(w<+1^OlcxF#*wH|1MCg*ELI7
zw4}PuOV`>Z3H5YpkaPPXJOXnMm9Xj^JO`e6`!=GNIxFK`6(82Q_3e{<>Drm|4h(Vq
z)EGrRoYh3LJfgfe@$El*2f;R0!N_@T`-ylP@vX_`5)cYWvTAbC;gss<b#(v?$m{ix
zpE?Mm1b<Qb3SqMdon{^#L*F#h4=DqvksO`H++EM#oJiP!B&m^EX&EdcJK*-|P1ZDa
zeZunzD$GqH9&UQfzd%OIWLIaeLp-_#>dBnEOAa<0rrS;Ed+?8P7z6oDzrfYWvlBrz
z+JEnq{rO-;_<V@gZ=VVKQgLo)9HtMIL2(CUS<?xm**Xp&PJ17%Ua9&e5jhl$do{sd
zsLw7Kb6`Z)7f`M`6-JY5+^xgoNk^0@{p$8jur?%flVA<8o9Hd!wVhC%LW}!yo=q36
zUC&hhI`4{NfMiZcO1rJ^eoampOUjsLA#00whjHC8Xc@1mo50-k2fi{^L3?;YUi4}L
z;dT@jZhn(d?1Gsk&&nqZ;WDPjy67(-r=%j@7ocv;qMwn&#f@$few2Zdu2Qop`47KH
zpI%Uy)RO*7*x%O0h|U(WZsQ$GS4DB>pR?1LrHC@*Hy8cY3o18%cpIzfB^dk=*o#)h
zO+X%*tk^&%+xA4guPpkr?BbX3)qS~}u9Al`Oclpe+FB<m{-oD0Mn}3NkMQTXM>(G{
z&$Ta1hGwR31*rl{Zv-J*V<#NJSRfNDaf02}#<32ENUNYb35P>yYVnb|>y4qgSeWzL
z8T*J4x-^sVRr#?gJaA90u-Fhrb9)M`y);Y0a20;whVYR{LABZkP_?xK)@>G56HbHA
zz<?gLfiMs`+Om%)d;t($zJy^An-q!SvhRP8x-f8G>K{cMV>d3#TzksJ6h@k_NZ;5s
z2(u(W;06Tp0h4nTTbt}Aog;z0pI_gXQKO|G3$0th8@~2fG)7%Or@$!QzGv!y^j1DU
zWuaNyqsk~@DyWvnN1~}C`YyG=UdX>+oMa0b?upMzetP+&Jz?Xq>sD;PAA(LQ7mcc#
z%LgxK-u?Y&@^dxUEc^_tBo3!R8gcm8BGRNeKEq5)^?vR2ZW;wb#GJZ;uB006Qfn<=
zZNttyY=lKKs_O{fnEHRZJD5BiPFO*dM~!$fyY*gFPijr|lMgx01jmLTg1>u4;z&`W
zNN(JGw0=;>Md*=xp=Gcg+GxWC3Wdn5%d@uhg&t8wuN4%9$64VwtOL*#Hn&)BGt`GQ
zqKBBWM3tiKNnYJ8pw!1Oulj^4${CwWu7qI`4A!bYiLGTU(yLd1&PEAPU3x+MO`P5;
zpw?dNc)^)_{92yVvd>O<KE*cZb)!grhb9oaXi-vgrby_vRsMtb{DjjiQX%M;ltO>|
zL}6|p!6diYCiVID5XhjLd^2M%W3)r7#(ihVSptcng;yezX&{S^=t~t{ioX#lxYW6l
zu+{A^(Y_0&NQmpV@f{TV`r5kgiD@f)5Ka9<oy}Oxz`pL}lF=HmX6S?;G&jU9a=@c6
zRnNX0N=Z5@<p4RgFJCT0+Enu#AH`FbDKVb$T?V2p1pRuJ9)@;Q3P~hy4^A_)O8{0&
z-C*Yy^wm$@8UtFS_uLB?h&&?)g+dkZ{WsgR9w-o;*qQsKr8K<pZ`diyKTI@Pq%Tai
zbEr;bZRH+$g5nomcc~~=bddMOC64Vz&^p5vrt2ecRaUHgpo_=^*;5yr`Hd*F)o$$*
zS8Lf&UV4!>Kr;!8pnf&g?{DuUtGlM2n4)3X`E!AxbH$z1_-y5?)H$o;$cQ}Wyw_O5
zkX!I$%}loYr{RD)5u1|VLaBRKJe|~_q+jjQ#W%wyD>7aQn%}s3&6QRmyObPOz!1*_
zQfU^KpxeRL4F6;v-<{%T+^1jUv`b%++$SlY#`|zbL0=%^XZWA-j&kD0Sij{3N^{X3
zMy?S>==;b}W<pU(BdGHLu|+eAwXq>b1S=3k+zK{+!ob-V5b_q%th!tWiCWRF3s}cv
z;5QFK<)B32@_ZS*OOsr!%T#)qkBMI@iyr5TcKXI0aA8o~yVWQ-2I?ua%lcK*(7?zy
z8uOdZc~5gX>OvV&5L5&jK>x~6J3O?39VgyO^-=TcIfl<gx~CIq-Wp|WkLs`6Fbgp<
zMN9`(pp*Xj2AKYmwl(%&8!rg6Yk9rwlB9_x4P8Kjj6~ci7zXhgCF3_S#lzuM7vs#D
z2r76<^~YL!n#H^+R%K%k8T?vygNyH{0;%IG!3T3g>)sF_^$gF@qRP`;M&aXU=nCxj
z12hrsf>M2N+6R#6qc@~z9m$H?fV*K^u9NGic!qX(HyzI{=Xkv-XDIttQb)L?*URLK
zixXcQG0LIPSsG<20|}ylhYt^vn2S^78t;}ZJQo~YbD7up#57ul@GX8spP!T5Xf#T%
zBpE!Ks;cqk=k*d+qLD@?8E2We9?E61#@Gg6gdBeYO|4Z-j5b=>Ae90^AF={n_MzvS
zv_a+`*=L*0rvM!({rr3HLGQb0K4l>jgVW>0K2w&1euUbpuzZCfcw5=7MOFvx0RQk9
zLAllaI-U)G;0@I7fo(U0r*NZ4dy0F{{G@h6I3V!LkX|4D;%yM7nw;CS7Uiha=gyDk
z4geYSs~=%Ln)v0GS%m*5g?a;rS*a0laPjLcH~Ku4>k@E&)}Mc<yZtlC9c$b_HIyFL
z%}2S-U5(L!4Oi@?Jepl;*(V}97XB)f>z>*?P5>|6lMfo2t$+t46*aa)$Lr4b{c8<7
zUd1qO-`DS}>!am!ZkP-SdMZWh(e?g7-SN_JQAx*M9O5TObLnFCLzFH)El%JLK(Spb
z<q;Qs79%;6oG0^>U|7%61*jL*_c6Te(Ps>GBHO8Oo2J3+<W)d{XpJz!g*SHjFzl?Z
zL0`2iFWkQC{ZU{!DR;RpYy3J*#<%AQql!i+M0!K@BEl1Oon92W6(OgcBXF}G^UP%{
zn0`mmjVHa(wyK4W_`=ARG9&@3qk?O^%!jZX^;tC~;S$eADOW4g_D6_~b%Tf9*zevu
zBpxm!Lr_vvedCxfpU*ARS92ot8z;bIDjkB2ex^k5+k>5%wm4*7nalLMWzN`36XVQz
zjGspjChp}9pdj#ts_ZXM>eP!<ja<06?(gIh(*F~Yz%#Fs>iP5Znx*)w8b$}=1re78
zlVH+^3G7l#C+bSrS=PwXPAyj{Kkf+Sn(b2+xcop!ytz#zv8cN1#3dd-1fTT57+*a-
zy6+Va!w@*c3Mt+Av8*4aWRgjLvXiJXyjo01F}`!8^ukFz-s{<7LE(GqWh8D+8|p-b
z@l8Fcz2f>aK=2M6uNMzIG0E}LH*FwoLos?NDAemjH4cf}V`9UExow-@VV+>IlMECK
z#8P~~eG+W^L(-4Jvp~U%7yW)dnHp_m5P{l#s@Id>x=?L^;5FTOmxSXR>_m3Ylu`8G
zF@M5!`y@%XPG{AWt<u;QqS^@@A8H?j_8pk0bb^FL%!R$VUI=HuCq&>YgisW@-60IT
z)y~%XRhFqyasO2MsP&3Y4wbg3EWd&`LaR(@;E~CD+ams(31#=D%ya+;Q3D()W!*Yb
z1H`bf-U)FtxVfIjYRPJ*Gyzk)U9N{TnGk)vbse~kMF`(xMFsL5Wb?G|r7G^{zc<EL
zO)lUf?5Yo>`b8%geas5nq_yM5*h%_jn)an?0IQ|v;wXMDihBKBg#$@Q+}ad*Yr~Ov
z&@BZ=`@X5m6NJu?Jz^erBPR<WB#cy>&@7vQCsQXh#hmMnlg4|%KbriN_wE@z7@$UP
z3><xP2Y$c~`uS(#yaOdUWex&!ZH0R7>aBbo*kxr0vD1$u;B3u`$d2Y%T}o8EIJ*7J
z<X>pPE~Z3MmmjDo!i-Iz&f0$(EOp^8cNo}YGnJk&l5Dz%*!Js-9!>3ezBw3x@nGQA
zTgkAh{lS!Y?P)gFdM4fnmz7ga0YS<{EBRewxr%^N@||iU@&p~i)YF_$r`3OJPZy+r
zN5^nV7ah$069720TK63b;oEb!a8DJ5Y!}(nw4@}&o~^iIM@6kIFl8!y8+@}uAd|zy
z<#}qfO~y|KS(B`7jwfPpx{?+qilakC;Y*>H3n<_rTq^2xU_Xgc?7b}+rR6F*)+wea
zo}SwC8^#OU50m<$xFw?@SmX*iL4)3AvP0~12EAuW>5R$3C~Ev(eL9!iNtXmmUn@j3
zuB4`YjN9e;$`2Gr<kd9|UFg(1nQOjhyT2TP)A-8$U6?}tgD{pJQ8cl!QljHBDaLK#
z5ygj(J3ggMOUb1L3^>dnXZ{RBM8%rT^ax<Zl5t~So5R#G*C9?1w=>mYC{&F*d>^17
z^L$eUA1NFDhcgBz%b-j4wt|wbJhVP|n~dI;pMo}-1tREPbp`aObtY&Uw;{^fv4XCn
z9EPeT)!)b4>m4!dSO(MQoEgYjEYd=@AuqIJyMwkNbj|N$i9|;^J~U>VR<jJo7f+vp
z<nA*Muxy84`j_m?6|;E8oken425<Xc3E~8aW)F|QZYo0CAXCOn-9!ch#<L&q_@k&-
z9n^?oRSUKi3iV=5aCM4Z#?rPG&UIrG6wCzt)5+m23g-@fw0zozT(^YqugbFwHV6NV
zI+`S5=|0=AUdP@%2P03GUBo$OjAmcc3qn0xRe2rMl(91rJAN627S7ePXj}fQ7jM?J
z2AWSi(LZPRKaDfAD9zmVj63yTxGQ8@ibtW{-9y!4lRSb5>&7w?j-H{J@Ec-62PHml
z+b+wgRk6i=vb5w!NhCaQj5cSn;FxkIJYNyrD=g^&$oJ|e_zc<;bWxRU0=b0HL6=NH
z9*JFN!X5>U?H7Y*J7()SP9m2vYf>RZ0Aisv-;AbP@ZKak$UesAG~v_ek~7bdcI=H#
z?UN$um<BTJtJIfMslT-ikux?tZ(YAGpur9HHg9`+e9S91O?_ToAfKJ!Hq;mI6#7?&
z>X*;5tjjaEccILOVa)nDQivXgL;T}CkE!=SDDVeA>tMi459L;zsaU~Cg&+0>>BNrS
zA%J^)A(Oz+%5%ZsgIcVQ9RNLl!J93JmG14l66xvVE<{6T;+<6!`9xvX?_Wqc2;Q_i
zvQt=tvaEK`MtpCtgY7@u5MD^8qjSNKsA`R&DM=or*)ye8fMq{3M|(Ct)9PlU73Uhw
z&SH@iwQcL@E{FJDFzW-0#iviBGix0U2%a<i8ACk}+<#7EHf=lIcTLa6cOVJ66A7C&
zt6Eq5q85QOezj8+laVJ6Ae_GY?Iy12JyT#;;xBz@E*8w1SNrzcBz9%VcE^v=)DLbG
z$Mp{MO7t8et=c?o$4f)rDpPjyl~EO*&(8f}o{3E?<NHRPgf22LyA4u7l$Rm3MH+H%
zU$nm0cuZapPHInHAd^%7e#lk2a>PkhL7BBp97q4j`@Sen1W0c<qTX|FMQ^H)e-7!s
zfxG<09LhY*fPV|7u1_+8J|hm|25sB!xh@csF{&Sv)Vs7MZhNk}{$exwmPD7HY%XQ`
z!My=0KmC19b~H3|ZV$EO1FjJg^9MMj`c0NT5`grP$Hg!Jc9y$J4_ORTXJYTj{Vu2K
z`+FSw&dNx$V)4x+x|SYoa=dmj45`^?R{@Qt<EL*o8au*xlvqMTftTt|>Pv)ZI9e5D
zB<-*&i?1AW(PElN+M;8TRJ#^P5P0bTT-hMF!(1yBFwl>LJG2>JzKHp5p9&xIz3E58
z7Mf8J6<KOGe4NXxcjpMNN4guz>DF47N2t0Qj!tTfB*sVT=<s{M|4u_3E|<PekW6qD
z_x|e8g5SQ!h58$R>ToL%Bc&Y;<>lIiFfIgeaZ-ya#K5)tbrlf_y`<t}onYBT`!T!i
zBn`fYr4UkNGG<H|MN>F<29Ur3$pE*Zfg>&ZXSDfIaED>7vQ7fvKLh^?9v`jl*a|_4
zwP*>)$gg_IyWQ#gC}+OY?^L~cU$i<~>rRnf!oM+aqYXOQU7?wu>egQT`-?(Iz^c~#
zW@sId|5{~SdMX)W!+FUag$UZsSHZY8L247i2(j6aWyE@i+g0;|>>{)%4#zQ=`2Kw$
zG9kMjZrT9&rJrT;nU++1@|)qoW9>rYf=8&5;1OqZ!6$~t1P^u=E+UB?_Qbo;%%lU{
zzK!8H!z)IE2dntw4s+Ty6&`as;RlAam{@>$5**4~9%KaQ=)=lbXr{l=EfM%j><APH
z8&g{bZSJ3e4+4E9_=i;&H6lkBe^A!-dCxxp&qCuI&y5H|{Z}xUtooIr0al$TaHg$>
z`7!pxKmG=w7u_77`DU%(d<MP<POO+}19dinKkPlhLV*W-<J1*IeNkE!7VwR$G~csx
z|L3=mAXNGA=*BtwjEDtXedbiz6;Pz=;_O0-)JLIJQAE<_(fIT>o%sT-4vKCv0vrMq
zZn6IRl>u0`p0)k-)y>W87u9Akw<OKO`Ra~c1~wyTIPE-))i7k@bGc`{0st=aZ{%5?
zWyDer(83`u{WE!AERaAw1gajNQ^8Tajn0Ohf=rS?8gmIX#POJaftp{4R)?iC6>Ho8
z3B<!SdaRQ?ZL$9MT1m*@=Y>hzgIc^osJrfUja6KvP;iZijc^oLBXP^95TIGii_aAj
zoshIsk*Uok#;F*5!~TU4B?1hH>oz4t)N%tH=-<UaIC>7IKSr^|lv4s`L5LgZ@^k^{
zIR@IGQK>m^=<{ovBC8X0Fj6JkVd6+@hHV}vtMfpocuyo4_ZWyYSJS6z)1;@L{Cm#%
zV)?R5`DM8d9RCT2<N&zCc=~_|4Ne5^R{>YOByNOBBd}K@hKXae@(CrUk8U0detyAv
z!CX<EeKertm$$tqK229c`4hnoxy-Q!XnWC;%1biR|GY>bFBSlg_``G%=+!A#0#&1V
zAn|Wf4Y(w$E;B>`YhG6a;1M>!OLQIpDhPBQ0Q10-9IWy*fdEzYM2=wFp!>zt-g^8a
zAV<to_#7F-AmR3ffB`s2!snQeys3rtFDmH7^DUR+gL#xj{}Vq(gz)p!;~T>tIS^vN
zjS&{J{OJelzZVfH1p?mWY-c$W9sG{W%CCoux~cGPN8BYDxI>|Eqb0VtPR9q-T@BDy
z<wcd3B$WRDen0pn=^Un20D!6kM!WUggJdq+K<w)i!0c=af7{#umcn%~rHMnp*mL>I
zpqNRZrx-=Z0wvpg1k>mGvjT)_09#pT1zYKA0C|{fJ#IaOKJ38GQnZ*Z(nvg}mDRTI
zzu&@+u#am*4iwk3lW;A0K=9jsq1e6VguNgm3J^u(rX%#62s8*)wGo!5ZgV(B#44XD
zjJ+X&COAe*>KGIH@*E)eqXsfCxr@%$OaFc5EzT_fo>YnW-D`uvbePT7u8($C9B>Hk
z>-l-PKa=tv@a`PT_dpuu1_k9pej{9iwMIY8CXa&UJs`X30hd_qYD)_fVtDENOtfSc
z(u#<uYW@Gdy(x8<fSKtPV^b*Z5GnjT_Jwr%=zmT_JuZlu`rm1KTHw}sTPZEd{!AQ6
z8wH7DT`*eg6S$wtb-Y{8z7K<E9S5T3e>`j0z4R|S|M&h7vql0hj@vam;okxJ?{)mY
z`A487?8E-gH~UW-hUK;Y_XqiZp4tDGr}V!*$p4=`v!$04=^VY@fSXx8r>Qp%>UYy?
zgchX#8C#RD)`0RsBg|0326)8Q10QqpYN70K+%g1&u{Mo8<dQ(#A<95-7f)phc{Tjz
z1p<kO@e)|WU*FUO!V)tIJcVgyNo7_;!Prm5rC%v_To<P1ZJ|$0|DQwnwRk=?Cimal
zP3%JeP*%j;qlto=uz*En`Gt)6!^!)<Hn7ACD|WAH-#?D_nEVDR7gn$}mFm*14l<6|
z+k&5f32qZZDZ1(nwq#YX$ppez*Mr$%U8|2NRWSAZ1E7eCT$UsC!S4G!D9o*MfQ8dM
zXjkoGfQ8k3Z=`<U0H7)lcmq&F6@an*eEfadi(O5~qN@$ttF*fAo46g$j|%`p2!pE4
zp+A7{`$Otiv#aqp80}mefR*#+K-*#ivqs-XlOMf--POKG3`*ISkKlurgB3ElhFbyL
zvkKU~j=&O76^wc+Sj%iYH=r|PT2V1BaATy6#J}{#PR|B#ML)5BVZelCyU#O9f;yCb
zmkC){-Kdm}UjS<b?JdrS|Dgp?+`pAek>wC8`p5GSI7)e31%oQdpmIXU%L5oG%mW#B
zQ5FGL{Oab7NX^ky7Pllur5hlo)+#VsXWR?De1vtrdsi^>Xj{1z%#QpH-gS%kV5m)F
z)~~@o>Ekccy%=<8o!G{adF*!A0gxU11SrW;hap6Ub*sJ?iiZH$clH@R>H)^s_c;N~
zeh*$!eW(6s^FSD2Q+`ks68KJn>YGOsvw+6Dh@!xN<Q%FFCVxx|uJ0#h(B0pIrA#%D
zYnj%yF8^2s^5m)jSRPl^7_>=0D|)P&@Qargt%_tVUJ?JB$NuexJ(e)(fn19y7p8PK
z4=~R^ib-wj0tM4PCb7wp%pblhNRh6sBo%Ei<gNUA7l}KB4xeP|k<id;+3|wyLA7RB
zgk8>p#Bbc}(Q2fJY=3X6XodTAm6{2QFQ6eE3y`>;lDjW<FPp{*SMl$p(<+|ndR4GH
z44kV~R`RJP(HOm<tm!3@Ah%TLiF8X+gr@yDHb|A1YtEi&MdJ%{>kYwI7MgM=NxR3s
zQw#yRGh>~=1H*Q(Ys{UYCWVVXG!uACI6J@U(qaD$(@-$~JKX+dC(~v*w%%ANneN3k
zOveCbTNGzMSVye`k6euMr3+}?Tz%*8tp^+YZ(x6-RDNFCvI`+ximfl{7~>pWjHRye
z8zlEw%=0~$gCBBy25OG{pe_)@4&V?!l&{`tR_iWJ(4;GI7g$yBOzd!!gz^}Ap91jg
zGWf{24iJ>f69aH>^WY9&PVn{q0nt&czb=|1C-a@-{Bpzz<J!(*M$$7hF_(`N({}J>
zt31%)?nO~P2p00XnbUfE<tR`4yXRaXgHx*1Dq;o*@UXc9?S~_vwWbzjKj^ve2LR#l
z7VuLGa6OwMTb1V>8rVgm+eBUWChKajI^ND}$9f!G&M4o+xXp@K%*10Feg$?uc7x$F
z?ijVg_vF2fCk9IZSnzU`v(~872+2BBEce7dLm;KxURH3R?BFlpnEwLN_stz+pyMoT
z;03=skNz^a9NK<C$tokKJGFL2WGg6BtI@4IB590sPYMbJPEzImTtAIz@dTu2zlX0=
z(xm-cvN!2htvW9Ea#yVa=d_1z`>Xg9{b+kMM%G8HZ#2^iJoYy-7;?%*WYs*>bBphF
z)pewVTzF)bV9ObDM1?#Nn!}CT6#!HG4Hyla(wfh9$F==Q4h>n$x^dXcu@{VE3b42s
zjOzu48B*o{<eIl^4F<jMr#0$lEPopbSQJC60Fd_U^Sth8XhO<s)sz!{LoNMY1PhC_
z81YF-N1=DtbK{|z43iV37!Xw$4OI7$>3kNT)J)?@xS1&nxn8@qe_00lXWjwF%*57z
zz$4`$OqKd!l<%}?9JT}oe2u7>BxXN>xZ?2%&{rQ#!wO|r9jMdB5dhi=N8nx=4>gX{
z4l6%Q(K1|e7fP|dL}4@reYOzp-a_r$0}nDzQM<BbzO3E!ilBte94=RhNWNoMAftT^
zG(3oP=y+N#59VIv_wwgv(Of)xJO$`$=NNRk1y>>2rPwA-JI?bh16v$CCtjytp3{vv
zE7{AxW)$~4vzo}U^+mi3YW0CqIS)fB8C%6QV6B?>E^67L`b#WKkdTCURF?fNzGJ}u
z&G(BNW57*9$FybBZjpQ!a9nsO-xiI>diZ}oySEjj;F8FKFH(ef;z`FgJ@)~|7zO)x
z@U)YbXj^y3snu#3dzDqD(F%wd8?L-H)6Kz<29gFUt1=hL;wkLW`H;kG?2q3rgo_2#
z>#hE1&K0!YfY|yDqwg~MbZ>eQTZ3z5R7Fjzw(=#oVM@I>Zz*VvP~g@6d&7)kOs{`T
zKL|P{NfebUs->^(x5ctu?bFXFvk@#MYB{t39QVXWpylx$ur?ZES_C;T$>O?(IOWR@
z+KETMK|4mgNO1#&F4qOBIA#N-$^9#{Y)x7Sjx<u`K_{)mg@9>Q_MB&l|22PpS7an}
z4bbse)NhaHtMRwfRt6SJOV{9-?0Rn}9S%6~%o6xi2`o%F!PlJCRD5$i?nc+1$|W*>
zz}wDgcpaMg_hDDmk1{5GZ9uT->1pQYRqw;QX`sj={+$YCVBtKtbunxr0jEYh+{L$;
zv{$>);#)3Hw7praqlt)qE#S!VFsSgs+NU!#qd`K3k6SlyZf@THxyb92)N;#aaaMRH
z-ix{gT(Qab5Fv{&u78bciHpA58er2p*u!Xp*Wltmv5yZdC3pbD+88@e<<#Gfz|RQ3
zlI4+P74r*lij133<Xut!p2QITEy=@JAp(<@GgRk&uUf_a8riq4<8vY_!Hsa*<fI{>
z*je5&{rbh-GO|N!I)N-cNsdQl$?rbDqyjdM)UHp~i$4Kv&m1OOP_ur_+ID2Z2E-dg
z{Ha7p0B{~EpUj;abYkDUj<W4R&4aZ;7fRR7|E6Cryt^sP#mqbLC_5Fmj2uC#z0G`I
zok5`Y5`vgn_v9lu_#<bj11n_^Qr%-PXp|hUwD}iEvmtnHk@3ypH!5WlZDT=SJ9<o6
z>(&}Tv4y-E)Q-Vz?yOy#gqv~ImT;Q@uAIjat>}O!ND474QX>bPm#p~OVJXHH*gYf4
zE}}7=sU;LiUR^=wLO+2lO4*Me5&ZCXThGVdzKVNI5?_kt(g_t!x`viIa3P&fhaJ`p
zsGyR#-B#N-L~Ortt!>bc90<#sc$L47$vrh&n&&UTo*|7te7dGK%aKVd6RSSm4aQ%P
zhSyr`HS{9l(Q%YyGjOJ_$lTx&^ML$Fvy4g9K0w6=Fw+=K6QTr}tW+FU02OtJOtC`*
zeQG$j;~h|xIf7ZWr(x$Vxr%av2!Hd|u>Mb3QS#b28cMcmlp3g?-kFZmKynU^km!(r
z<@=Y(8(rT)jRjx<8=<ay`Hea5lX-Nx*dbsp)xnaS7^P8r-yjLH!dTDC4KPzN-(*tI
zcprW<BtgF-kqa)qtjHI_p-py97jT4@1w?dDyv~n7=|dUCVVp$==)YM>TpT<sx35<9
z@hswj0>IDZ#WLz?AWC5414^R$tB5C=;6f?+E$Nrk&G*u(tAu%O5yK(bSUkmWi?MY=
z!eU^nz;aE|jXG4}bzApgAS%V_z&t=C)>(|#P3->uES+EG(FDyIk=)(l7+BLIy`b9g
z46*SX=^K95ppZH<<p3oF%73br8E(IVxbBTJTH`e>WFsQIu|Ha`<awPoRpi$B0F;E?
znlRjZBJ;8*t=hF0H%djYob$(j=WVnYA(BG$e`28qdV8?NJ%uW8wO0ael>O8kEdkHW
zH09{t2$FP4baZ8*Gf6Rr?tulm0{e@1AQCQFOYI1d&gcId37h|o1pT-_kJ;Oa6iVZ{
z70-c>`Y_*{42Fn)$bhF5vhU(J#~>NJz@o~hGK$GsR6&(+<+`<qknMkloGrO(&pRM6
zzjL14U1E`kQ;9Uq+0TGLxmY(Vx|42dJEt1y1r=blBaMZoS&{PCrfYKW{Za2DTDU!(
zeR8@*xBKxY@b`*gL3l)?MF7;CTcgl!I8@MVFrmN?se5*O^uQhD=rJ<b#a<=*`*`x+
z248pE=}Q&Iv$b+}4O4275zAPN3r#~Wb046S)-*-L?)?MYat2Ew{dYj>ZqOrIAa=j}
zbpWFRbO`Tfb^QPd4-Xy)i3`>``g@$(h7sm#>M$~sJTL%v2L#E_f4pywf4x9-_5mwN
zxlH0L!uv>B#u~TPQJB9@d@Y!!^0?<7guYu}VLlKs{%Mx3El&yvCokH-kDz$lW%`jh
znLkz8S!lXE788X6AnZTJI8n<7P;+-EgOO^3Q#%=|biOJM)4>XhTItBLmRAf1khW>z
z{bCdyxa%@R=rnc@dWR#`BI)Ot0#^F3+Ch2W&-1CqFJ4m=szwy~3*))C>Pdlm_3xK#
zAO(GF4O3j^V-ef3XdUnnR}BQ$g)FbYzw)*gl((``0p;~=vN{Hht0{zfE50T7VojaR
zu2uk->U`nf`P2V5vTHm{U-!#04Emmiowbn%z{HEb$@#IccqzZ(vqwRSocwRN6y4Ux
z!Y&T=xcj_%{qxQ4uOHC3V6>yDGQQMLL-_)QahTjuNAMl3MxKEY3sQtSbkl3WuX|sG
zST>6%eF^{Rb0YjYRqp{TvX@TTsZgwgWaXcM`_5Fxmu{pn>K9IJeNwIYXliHN7*M%0
zRKW9&*&LRF_Suk2C^Bnr3&)PM0%{Et@gS&S<6k25hGE~VS`Ez?Q(z_~YR&zN3c()B
zBYaZ@6PXZDqtA~MeSCj)xbW=-DMc3OH$IiopaWSUEw(rwGBqI}R?v5~JKP4-C6J-y
z$?VGV$z%r}f3;+nwfj<*kfxsIH(TVMrSq8QbQmK~UQQ&9+A^$G7arqZE0%nJ@BDt+
z!S<fozZDedd+t=MrqHn57BIK=xx~$3w^c3-LLs4D;RA9h?E*#${iNY^0k;;_xJ(->
zEb`#RbAT5QYu_AtUq+7<A?!%nx1ULqlFC|T<D1&v!yH%CaRXx#q{g2~;(a`0kMY+o
zVJ)7bGf$*hm1x;$ztyW@JmTd!atCS|!!v6RGXl;K^5$>eIg~llyE5~K50B$tA%S#g
z=|I^tdCq*#K#pB8b6%a2u9}zGkHn9qqMat!*g#dp4NVEXPf^X-wH=5Uz&|2q?Yh0n
zffc3)m+Ylh;HH@UA2)^Pe{zO?97^6N{ih~99`C3pxk57w7g(GcJi#RS(<IZ{>&xp`
zu5|_P;JX;hOvchVj%6?~5b8}0coovwsZY;>L}Jee%JtkcUBN`wGa#24qzWIBGZ7O=
zE8UaxHVigf0r=zIe((N6x~MJ3!wz7F%{=<S3HqPgAQ0w+=!0DgI#m<q6zlRHKD~kT
z$l(Kk*7v@h@q~HxzD7fS-&09DO{*CKz`fI<XLu=I6a2eni7C$5_asvxx8P_gNy+54
z`vC2RR<2iH-tn_`g36`y%QX-<*U;<bggKRWo(D3D=(-_ZdepNy!dj?4B~4z^6HV2d
zge$&-LEvxBKF{c&bt;)ix5b~@`^kK9s!RKUop|ymV0GTC#xTd^F?=63=RgP!*!O6{
z$cbD|<e6}Z?mi3Wl9u>7i3tpXuFqBdBR4N21g^z(AM2n7vQ3n3Ga3Ha{oWT_4)wWZ
zhe=8T!<!bqhd69%`T&D==%y-sb@NGj1H9Ue-&tzx2*&^O)f(SsG&@vaD@=aioIbEA
zIZ)P{0D4{|lfnRxf$(dCU0GTHz5gG%_)qJ%ton!OBSZg1B((JZQ4SPo*ZlWXSAbLf
zX0ylRuXMf@aL&q?9w~!Z7!W9o$l8`=5Y%tXBsq!#$`qbf4X3^rAkE;VnbPzE^K#s^
zJMb=Hr9OOX=i{~BF9yJ5S?+w$v-_N)Y3OSfdD7{b1MH7d%Il=OU?BIZgmA)oFfcMg
zqQUJt8@j~mmDfq6jiW_Zx>eyOBoLlR<tQ<E6MssyN%Yp2gRmQji}j3??wlRN%-%*q
zyK$p8D{%mVTFnOxR4y%hoqk!p%59H|6Y->y%3G5VwYvpnr0;5Fz0c2LEw!VEw}84O
z1dRw|1?7ibB21tK<-CZ@QzQE6_yBB@asI&Y-FcM7ptBjQ8;cgHPNB8+WDVs&lI*o%
zzjm4oAUO)Q-vb4>ggwhoLVN3+#Gvb8e>_etP&4mlJmCo4sWCFbu9cNTh#92Ye15#r
z=3&O+b{NzMOYbUXsKuU^_ri2|=Q|D+jLb0lj4+$#8Zc_`ok^<in~@>`jRVn~-g{9S
zE`PHQ*3NJI$h1_nu*Oms)>sZNX58C>7d(}u`Szv8`(@`6<-B7%Y5ERCj@aY{Oc=sk
z%%gkftZWhuc4-%Rr{{4CATa#5PZ(e_tSo}{33EkL-?Uk!HfP3^msBo7NuU0Df4_&9
zatMvu55fCMmjY~Uovy(e(*o8pN9a`v*gt?FfRcV}1O@{EC%)^DITUDc1!DJsgrTfN
zc<%#9h&S7VSkyU2&Tj;dZc*D8oCaI=Cr7Nnh?R;Y5Dej#NKt`g$B(@}evxW$UN6({
zK^k4;d!sjN>KG&Cn*+D$U99Dm7-Vq(rcx^}e$VSU%suD4;Y!c{2~-({TE+f?35?oY
z7URhVA|*v0@OijVZ&WS$Zr?V(plKV=PQ13SwnO>Q3ATgy8noV6#pjMcT(m8vVYhS=
z0Iv{2!CtDqPr%pEl;7?T&7WdVpz|bedr1IV7{Ak&Tl+?vg^2-45|EQ|VegZ$TFv}d
zlF%R|x|Hi3{hekhPYh7}8&%$>S_RrN&m%Z%)F{nBD>xmJoNv)?1>ULi`IbWkE%U%T
zlT4o;D?vUHg2DEPhv>sr66?&&nTkxq1<QvaZ-ZIAk#CSdDg=hXV;XZe9d9k1?jsL{
zYjJmL+l7MA^1F6EZ+0RlurBm|&-a;49@bEcopd$%C$c+l4T%viPClvKu9#$ky<Uxu
z(VI+Uc>H@u@_ERCm?`9&d4@dN3pKaA?L<2*bC$&I#7K!d3LGN|MV{F$-fk*{(<26@
zA0{SERYtF<M}yoI%%ULct-yR%7k$1W!f9obMUmu1G^MD>B#JeDJJb=jJAc3dlT2(|
z1?DNiFwZ#+t<T1d!XP#N2Ik{qwa(>R%+a5u;>s6^*-VrdoMdzm1Z)G+LAkZ^a0-1M
z222;{U-$ql)R({ahiv?E&%c`YN_h^+<5%>xsa^tI%y~o6{P%9#w(1!hpFoJMYKfdp
z+SGP1Fhq5%!elA7jcmKZYMHrcVVCZ(i}>5Q6M>s^$SB7^Hz~^*Z$C`65;LyO3uOs$
z007f6EZp>YXjMoMN`9^sx>Z2CwuJ}u-R3loZ$mJttS;+e+xk+)$we8bZ@I#>Sq7yd
zLxq&7AJL^g<eeAn-{6>SjsFx->>ps<_zni0ljDV%aR}cCpJ~@d$+Y6$ffnr6f0rN{
zj@roi-=qgrr1lJ^Nq$BjYM}SJ)A!24SL(_h0a$@8pP}MB?22kTfUmq=6ycf$1k9M^
zY>K^Jrsj>X?qn$jh*8`->Mouen##(jrPpGRL?wb5VZ~>{VP`qti`z`_&c;zVXEF5B
zOD2>^Or3>UyY>*~|5|;p@|Gewhw4?ywC4f>)>^N{T34V+;;Y)q;`j*6pWs*^@~zY2
z%5d}{L%C*9={LY^vKQr8pnI#BC-&yqK29wlGy0J`^I?MRU9sdEU{<61{oOMN_80_E
zs_*__CjMr=Fs=IOrtOp|bGs7$1Od$R=^A`65&ANC+9x|91&PqoZG%;qFoms`6kR|p
zA}zA@iw!VO6402_*jTAU>G}=djuP=JhtJ7G`&|9z_vQZPi@byBlwI}bv9TrXCJ&(9
zSH*k#!?rzYKuh(8!>TO8X$vT|Hy9)3(5F+3a@Yrxd%>8^7StLq*j9DUasoOZfN-qk
z_O@iSSPssA&gaMe)^Ls;6pP#{ATWCkxPd9D3O+E&&lo94T0Xi|h`^ONAuOjdJ^kJI
zP2p>p)TxKQ9x67)(HWSk*VxSbu%re4<NrCE;jpv$gLL#8ao|^6c42p-=ar+=Z3-8$
z`yxZH^M>z)$aNJ+`W}GKiF>7HwUA$M=Lz+0A^=DWAdLiuacEfnd$$!7J3iw90aku|
zEbpYMIEp{UoTrGJCcrA?&+{}otW#No_2F=&*7LI}_)(KM&4S0xMVPf}u%$qyqbW5^
zhq5t_e+S|Ngw<Aq3m5lQfsy@vC2*}$A(e3f1xz-N{!!FAQ2Y7f(0TXHCkT_L4yHsj
z9}$P5FcFx`B!THkf@A=a&doXNmqnB7nzm!>w?KWcT!=g1OM4y8_i7hE08+RU@#gvI
z>yl&J^07Sf6$9@nkjgw=m!!-LA65&@M*X^Og)a2G1jfM9kW0ByAbHW{k}ZpBz}7hV
zsvI*dMe;%sv}LE%r=Xu-1OlOH=Z{4<DzQ#|G_lYTT6N=W7H@?R+a!*G!d9gKBKoZr
zP=Wgnua`e*#Yo9=TWG00jTUv3M4AfWI|$D&tEd=gGj4=ktDV<9de!@ICrvaZuEOp|
zi;^1Uv4O92jHNq4a)$d9*%~*D{0P=FZS9R9J2P&O^Vjd!KY&tB^PF#M0f@1)XyuJM
zcyWXR18RhqM7o^+y$2dkHH@RD3jBbu97c2qOjN{dzV%XE^Ive_JtSi*eho9fxB(gI
zXuQ@W_gU0)0+L~snb~a3xyx4RO_>eh`9riPvBdD)2wu@EZb@@im#o~G`^P&|sQXMA
zDK9EJc`E5TUL>J#7?Uy|H*aDIn*^&@wA6vNM^cvK@J-5>3E1?-;)>-hH#S1a)q3O5
zv-*MfRGtwnlo+WIFy)=oi!y7Gbf6pzhD8UkDITyE{MD$owx~5X<*i*c!1@;;FOu)|
zh)r>c1~ODyhu4w_$E9l7u!S$<SAa}kmzm&4DGd6zA`{r5$)pbLPG%xo{ZnX*EG4Ap
zU9Xz#`B#FU;QLAkgRV8E-+;CE@}z>vtirvzar$+^!(@}g&wzSb41F_rl-zs371HQ`
zagxEQ*%h0{?jJhE0js))fO_MEzzf$S9P<QUOk%H%2u6n0cASO83UL3&mY-@eZ$`x}
z|5K4-`w2!|hw}blLFWApHh29k`u8sG#4AIzjzh|p4deApaK)LuHtE)8pA%is{v_za
zC`*D*K%bXe#+=|#hS3M)4PfP1SN^{@?zc>*!7VYa$g?ClyopNg8Xw1P{1CWlP~U=;
zD_*LULoylYM~wHd2;e||Ty<LGNNY~h%T)1U6q?0KDTI5>(HsJe9$+QMizO}%^J%Zw
zIh;h*x$13jEzmwyqho)hNFDxpn%x2hn_j+AwEKONOkjGx+gMSuz>Oyw**@r<6OQus
zC4xWFIZ4|gL*>kYfj`&G<47g;wCc+jTAF@#nsVM+445WsW0Kjsg@<)9!>R<wVEQ!D
z0JBOQnzw`{Yea)F-b^_78F1|nMQVd<pLF|0&;X4&{wV!u%6kpn|NHwNQn>)P-K7^^
z5C<a4vRo2FOO*Fasd7{O3vZx}a`yZuU&GV3<t;eG5up0a<k(05{7<-X*^`@ZZAT4J
zwF(?DzMwpl{|>a)qV&jP?Yk1noHOfwvd_;xDXE_<e+k7T>|W4!QLK#t7QCsLy*&*Q
z8U&oruuf~3FUp7T`TXG@q63Pe+FbWH)}vfKm4r%|-@1KEu18pXlAw9!4NRdcD()yi
z0)f1uvRzm5#V)F8S~NlT0sP|7vU&sMX=gv}DrNx!{u0oU@vx)3$_qztd_lU|;(5f6
zaSU7)PEwxKB5OR^9EiEtEA$t+oRm;Y(BfXz;6^Z<G9Ht%lZuXED(Qt8X;%gvpueoc
zs1zOB#Ji-_uw+>Mcn!-KE%{&9LrGiP)#)Y1pR1KD8k6qjGj3#I3`Q8cke+oyHrsvy
zDX34XN~w;3@QOS#c;-h236y?C6?d{i<5t1tr<%gS5bN$KpQhZ~Rk8-g!p~VN4X#Ak
z3t;6y|A#!9z~P%Z+dl&+^ohfK=CW8ZCS_L6N|n~$2DE2IL+`5=0IG+Zc1?z=w!TfN
zK_F^%Tju3TZTmeHIrsZr&VpL{>Yv5pV_=}Pu}@c=MMVJ!;cps#T$$Emv;xzpQbcp^
zW!NNNjOZeUL9DA-B%83Na2_%}9p-C3soe;QbhDN(^#7tFdAr(ftR0AZ;!BK!nFlNT
zl;7jk!iyF>>F8odwdhUh?SLX9C*M2JwGde=L~P0kx*zSOEC3S+A5h|cf~gq!fE?aP
z1Y{Uai049X0cp1J8~-lZ2{9pbJ>(Q%wwjcI%IeLKdouk_H}`ae4EiwFrUxJ+9Za=^
znF<)EGk@6xGx&w!OrK0<CNtF-Um#J3kZUYOMr7csN}3xc88iW_+8>)0HoQ_ShpemM
zj75McHYr!Q>+}__44Jrw(-^=C@l(TLPsKZ(+9N1ipPE!=N*3O{dA7-y50;NJXdxOT
z7EvT>=Dl9FB;Ch%WuV-Zb@)NXX%^1*93!kOuP#7Y`o2?={t;%oEW8{p?dha|4>Csu
z4+e$M;)3B(@i*Es5!pbt)l#~3Fl)Y^lJ^VFiKv)VXqW$0TX<}0El$~HT>h=ntc-Z)
z4x#ZF00|4c={|>SfYtrt=|-aTuGHV&q0Es&NY*e|Si}U28G3803TR|@mW@F0WdwQj
zrWYlg631CJjuG+ijdfa8^uK=evOgDwCVd4AaSdhZCeT9s0gy=q$JrH?mvQ{n75i>6
zJ#m~D^@fbJJzrs!#gNNUO;XiFg@^fisnBmKbOVOV&&5|+T;WTg-9l{Ta<xwJ$CKFw
z%hGBnx)5uabQZ7a-SZpvzhL;LaL{XY#%vu!&Ehu%%NwI0Z=@Q0{w$j+ud}*5Fa}`1
z+#IvP-E@kMYGm7=RfTF$_l;%GKnoY<%n|#-0Vww6V^yGkt2@-aHh~R5?uCq1y*WYy
zOGa+bK_+*_l<IG6hWTnp?Dqw=*N0a<{G~McZ~<zi3opKp?p^UGpy{4ICoE9YTISMF
z8QQQ!4Gq@&zes!Qs4ly%T~tCkMG$G}E-8_cZb4eQ6qF7HB?V~^kuC{AN?N6)8$qN&
z>5!5}8qd6W-goc!+hgqSoHM?^9M7ZT?{}|xuQk^-uQ0+(SFd;+ZKG&ebm^{R9*IeP
zypc<n#(ncj&IU?to(qJI2UVm7U%}cE^Yd~N-y>B%YklL7&Ywc~+~MWik9@h6OifDn
zw=3}pa=$1We2W@!O>Ppc{j(^F<;^<p@Y-3o9VWHxWb!t~%6tvx&4LNK&j;%j-*lOJ
zya;Rm=xjcOoG23NlZfmAoyEo~HPYnJr}<}anIGU@p7(BYc(`o6rO4*6kROxDT>o6#
zE9no7(6v*Tt_|gc&H+7POaZqZ)BnZ=9NVcy$RYh+d5}<t!ZK@Fa=Vqpd!Dep5e9ua
zCsHE`1C<}3pDg$`AaV1ECcbTYYmeQb(FYF0Sf`=y8aFrpS@XtM%1f>eaFY+hn|9Pi
z-=V2pV=Po#Hnu%v-IP$2Az9?hEYUQmDN_m{7wOjQy>SX;h?)hD6^H6YGHZjg<Ne)%
zemRCdKxp1gEmj#IL*e&rsx$$+_u<^2g_bhg=wWhoAfx?*YG8}Q`YTmcZ4Z`bKETHl
zEE5riz5VjlN94JIFQ>jd2cL&0N})$O(x@*`J5+slx>zjkO$&-WFOZ;eB22f;60=8;
zF8?}2qEX_tt)QtN;vP1-wdW3M`op@2ppVoTY%noQO8nBl1~0!Teh@JuIO5ML9zaZ^
zb=sWtpzL*yMiHx*q`F(@GjghA@v_0>JRgVd{Q>d}#eEh@<PvE?>^D0F9lG_w@^^+O
zst97lPomf6EVRkD4>=2XW+%W{VJ!;`wvBj0E<D?0I8|8&khG_@`|1$e(2O@Y3T|jN
zBCPtyW7w~L@`}88%@W1r1@KAS{=;hQNo$}e9V};;Nj@4>i9ZfoGEUMRcBb8`OIJt~
z^K`kS*R1EhcaI#OK|Vqwo<!(qkh6|sPDgH%#qJL6w5Z3g=JTySlDD1CIskR47ElO>
zn2>*Hp`&ik)gNkpPT0caQKb(CCDK2FdzEd)9y`F~$e$mA8ScE6J4`0dgQjrJ+;dG^
zsi|awoJ3x-UFgX0zI%k5zR$ML@Nr|TkA6Hiqs8OZiJ|BE%)Tu@IJzF$)ezw7fNA67
ze@>JwOY*;E|5+{cg=(wDN}g;`Ey{#B!Z{_Ho=CMM@+zSBC&UCH`iDVR#pyd<K)AXb
z_NW!PSNc0FQQ}AWvBBL#Rj!zCD72m5iliqeRDvwO`#xh2lj&!HGeU4Z_s?8{@Y5Xa
zT)?!byBm3#uaY_%wXpKDQvp%NUrdBd+~GYWH0MVJv}e&vkY&FpuopQOTi3s@^Q^L0
zfQ&tv@YVv6p}SFSM8zRx?aus`*0A-Q$vBQdjF8w?Bif%-*S_mBlEf-zAQk`1*mgW1
zf1M*_f7!$m{IE$bAcaTte$H}xRm=@P9v79#({Fkg=<2$s_PVOJ@!j5;yDh<O<|d26
z@714i=MO3_=S<WZZ@VuT<t&$7m|+Voi0|Vv6D;ytw&RV;xTo?-rkjH0gv%e*2C(OJ
ze<hSf?4r1bm7M<~<g46PvC$czS+kFM$e!=w6%gK=No|d`ggdiDa{k*HE-6wN@U?w{
zjsn}T|NXfN2{N#@s30*-q38i3ybRObEH&qJKE9v=b$mLp#!aOF5fr&aD)3`h3ZLDJ
zkg_J`-QSQG<h`55USKj@Q4q<;PT@?5F)Oe{7bGD9#ap^ic2GEk$-Ljf58Y-dbesFg
zwlU_Ra#{nRw*0fQ;_^)9k2jR;EG|l6@`!Jh6o5Y*YM&81tgC`gM(^mRjMTb$=I2TD
z=P0N?yk|<%6Im-{OO$<|B?X9KbBY=g!Q3AP2xpcR2qHxg0@8-{`Q$PJ>JH9n?@`E5
zi1uWZ;f=St*pfZfwgpgVpvY&I<HrM;UJCL@7PIQQedgrX7l&8CeFB?xW^9p+6g=18
zNu|R$RDwPHpa@v&{&hgg-%bxUHhcPVRp!Q55^GKUyyZ!tyxVc2gE!Tx5FUA!*hz?e
z^XqNvz;e=ZM*AR5Lb2$us+Y!={?}{o#$XJ#<77BadH(uH2&}Enr+jQ_sp$ave!ao_
zWL=-qB)O%Xg#7PAY#r){yEIzc<~OIkc8{ElUAma;sn`&I<%ufhuh$Ii_@0B#1|_jA
z8-Er>XNolHmEJ;*3#<G%IN;|$A38&L_2R**1iS0k^Ni-(5#m6cn!AGM=?E*oW=x%@
z9`gg3D(`+2c5r=_D!H<W5c%|I&GE8-0FcP_sS36<rXg4EZUWri##)OXz$FRfT5c)z
z$$Uw6@BBjFnT5U`N~PDPK{DlSJ+Vb;AD|Fl<yU4%HQHJ}lO~dX{v4V+%;lBwiicF!
zPg9BW@KNQKFE)q9;tBHXENV)3=X)<je402O#B1b8@a7}!ru7Q0j)~T$`SnwA`w0Qc
zsp6)RM9a1V1#KGv8MVsWYZup0(Ot`{o3q!~+?}zucOTrz=q#&UEf*#Hq7wWnY#ojI
z*@6J`zF_rw-ZWf9meQX)yp>Snzg=)%`tX(5j$#I9>{E#2<fsrpy3V`S!n?f~@{O_3
zb!KIak`MG7fVp8Ov=bFo*~*V!b0$34$2Bd>%=MOm1Enbsgmxur?a}({;fAfc*B>=2
z-)2ws+UY{cF&>4BYPiN$n<R|o$RFh4(QMx#A`5GzFLKzHh>)M{a`pY?alq<mx?IBB
zqE#j~IBLydRrC7@QXJOtg@5*U+@`0^F9xu=L!+e7d>=N7Mmh|W0jDCyh+xU{L(8Wz
zG~I&$dRRhKT8+dvM}9Stforu+7j%++qC^Srn#m7_!i(f@hNJ7l=It~s*~zpP)fjii
zLdqcWqk(|;Wz{Z?=Yr+3rVtta;?5u7j5cmJ%n?g$dD*iYK@f%ivGd-u*EjA?k^b0*
zV!@1<0qbp2J|*r^b4r03TT&W>mS(VMvwFJm^H#rPD~~fqZDe09y#w?X&18G-^<5dy
z5k1NV8+fmI=tM~*d`Tj@8^q-o;w?9d9FNOm&!F|z;Qv6L9u$fZw%yzAPi%us-CM#2
z^4(6dA6Z6(ZS-*0eihzm)GDpJt`NtwZUSdUC30q54SJe<k~`IsbwueE+KbCb%LA&~
zu_e86jf$d+KEr*nLx0KjN~y{FfGh89-O#(qYYRCG)z*wfPqpM}m;0G=`973{S}Pbs
zf2nD2^cM6nSp|gNLVzaSoxbq}lTTd_4>wW(_KcfF2}eHJ^k&Mm>H&8R9^)z5aE1SK
zd^Ft3euPv+OkG*z+j#LuBQU%v!jj=9kCvlmA-Kyy?&kEaFwbM2g62lHG?`2<gamPF
zyp76aUiMF*N*W<%ke7X(e4Ffb90yGl0O<Rl*ggmNp#8{_Ny15TFr4=MMSU?mIHr|{
zWZ3g6{LSLI*HwYp<g_3!2_^HMiy)n|Nf&X>`U0bd=apfV{rfP}zov&L3EBn!D?}df
zy2Wj7fLT~dXmUX$0!3URz|i82S_kn>?FwqT&5ZjMn%N+H%G_2mQJCOy&hK}q-~PRz
zBJ6YOQ43m}DOU;vAk#Ay-Ny9H2zaQjH48UK-2PG+<|eb7)TY*X=rNjs_ND$4AX0p<
zy-0hMUGS@wQ=;?UvIP-bnva6EWB?MY6O1P>rEAX%J)xThJ{yIKJi~7B*dcHO49ND{
zK81$k>+lWLf!(h6=9TT6Lj6qG{myJ9<T8Y6SG4!8u3Q(v{s815#Q>@FXZqho<J3=d
zHU-*4%G=44mJk8RKAq}3nNXD!K@PsoI@;jHG-<-;^={HL!tkZd^RtuZ<z$qu?sd9)
zlNwqZlt)i#T<_})uB~>zaxu;KDV!o6S<_bB{vt1*5m8oKP(D#PmD3|^z30zuAKMpO
zk73ycppoW@BOqjZZn(=WPU|s@l1nmdc?%p%wF80h`t>MWTUmwu@`06eBtKFz<tazz
zXcr}eruMIrktacrPRk;>awFxPb|Ihp&~CiWd~o%)dYb4kT>MMEEl0*WgzX9p{q)-H
zMZ;+*&Sa(*ly#$TcQ~$WLMO9bJqPs3p4>U)cg7l+PSLBqPTGmhk6s}na5UbMRU&Uv
zbcJEE$q1OCHJboc?8~oMb?6uy9|-EwHJd3?EXr~BbtZPtCc@DYCU;5Rbnei9ttjXz
za<`<>TAXT`V-|{Sz3kkf4-DtuNN^@hm7jq(6#gCw-klqkEzMexCA`$sPN<a$f-DqK
zp$QuXtu_{R7Q!h~Y`+7y?MV?Z*lp{mHt~gkt!{=5xo6s=<{0UKxZYKD%-$}>k|K4d
z9e#m!tlyEHJ0@f_pC&s6M5ru$cAqvzvzRTIMzZ%Pt>SC#iKx2WnFeW*01m3>in;Zg
zw)vUXM?U#nSFozyYA=Rlq#wL=ij)Ntn4ZhQI{hyP{*de-tG%!ZVEky19($*}$96Dr
zlzLt*bP(Sc{y8Of81_|+zCJUil0L2bPRt6|&8#A!{HH5B>Pg-iDhvZj1EZz!%G2NF
zTIUWVdfhws<!^0aw_vf1bS};a*VV2Bi6VpHq2Jc(qpTM_#Ej+=MF95~>+d$wLS;tD
z!#!|1m^bO|%lqLAK6c0potK`q#xW^UoHa3jNgAslEmV`4tHe1_KLY*x2mHI*h;3s=
z#<H36jTThgs3XPQU<P&_lqtRiOM6TLDsshRxS!T`M3F=lh<tsVVwA{cc{%n3V$fbb
zJ2irYHajZ49z-cn@UjuQR#Ng52rEktRn(fdW2R623T!Z2o1loRUu=3X{NJa#C}+Il
z-ROwi6<MWNQKg`pO>{R{iY;3~75UXvJA|mGu<RtFUuC_o^lXD9ttYRHl7Zubme}Kc
z>AdNC?9PUs@>7^P{E~i<=AnoF5Bhi(&Rx^Fm;`G$XX7#_$JgGhIB<zj$>MrdJH~s)
zJA0z+@j3JELQ3NB_OjvvC$p4&O<RZ3vegG*jomMNxX0vpeS<;l2X{=4&8gioOV0)N
zX~^29;oPYG(#>AzahfbEFC3Q1d_3?E-dwY7IrcoK1{fSTr1hhmSlZ_6#WDY^p$6%(
zRDv$#b$rL*+mgR)j`)1Jk!~BF1BW@AaiVPbvJNNid;VlRoiu<AY|9g>i$v*=O?_g7
zy@;>%yAg9FGjb=WqWL5F@PbvWLxKYDXny7ra>`jIkg|<Bc{c#Tcf7JHYQALodRye9
zyd+FA1Cvppr*r#>A72Vzl*7=%x&9>b3L#UZj(xlM_LyNTv^(E4Y<P*CT8R|`2QH!A
zOEVkLN7<k4T;LUR65~Js<UBIetv{^KTkPSk&P=ZsSz!>u`dC#>W*156icH}Zxk%}<
zFiR}q9}15lj6DJYfoo6iBM+6u8xnxpir=>_nznkQ*2?(O7*<oZuCBrhCK<y!5z0qu
z?Et{UdBd%80#NfeUnU+ER-4R0PiXtJ1><-ghBgOcg$_U&^*_HOx$;a_S@|g}u$>{i
zs&8<QK@9J5l))a93=n%|49_4r5$xZ`-Q_WyUuObQDH>W2ftN)*9$0eSe}dlZK4D>v
zy3R+wAaYDg{H1K(zOTTE6B0{%kFT>CP`BU0z9wz%{b*I3Gpxb+%4=2<utg>?JlKp;
z;oe@%aalMOu@DHYBWTgBhXsyM+<H2B$T#+4>vqxTOUstK6tw>Ak(1UvkKR1fyV93`
zkGA!@y|O9CAl(uWrF2%QkjRim;$QD7Lbjp5Nw3W7+`Cxn>*MyPr6|O_IfN`PbCn<C
znO7z#Wn)9n&sOws_`rZW-+8unSQ>d_ALJnxp3fn-agS|Ogn18epFL;Yo8*s{LSGVo
z4U{ZB%oi<x4w<CbD&6rvW2GN}@n`t(oWhM_=e>JI8jIO3Zci>Hrw{ooB|Sv_P4{eO
zF&+(&U~NKwM3HeY)odfC!YkPKAoGr(5E)-CbI$d0^zZ`#brTSJ)YEJ0)BjfC`Ldw$
z{`gL9w(yu4+VH&g0i4GIuXM9KC*4QYbmBu*b3GGmuDt4zzKx_xJkuUOgb3b`4^!+v
zN&PJXI(l`#k?<7hojkzw1~hg7XLs$u@*=UqF4)F&W5#y`_LLvbwn^7ifP42OP)y>i
z)e?E{u+*k30pvvxixS{L5FwRKXSO=YBvw$YrDGp~;sD{ppC$`*IGz?YvGG8|jMbFH
zUi^$!TTYVm{<W}GRcOvNPe1HfN!QeO9Rf8W@&(uMO(5WygMg&{vyCne=t*Ex><yNp
z?${8s`e^%w1Dj<ypHOw>F>n0($cL0a)6%$H3n%A62}g`aWsshg=sXLA2DZ>AUU0cN
zUZ(d}_$gLmtgqP2j_kj9D+2YCrO5vK230#)Fo@q);6{o*_lhf150iJ1h;=m<aH}Hm
z1o^(RP~4KrZ;xW-yw{!i9YXrrrQ2_=I2z1kmpBPLe%%x+4H(JWaecSUS5=IB%rT4o
z)vgas4M5}j5fS^|O4>O92K{1>O681?5wCbY{^xP+2CAokx<pa=^Z{neL`V0k*8u-S
z6<*j3<b_qfi8p3jgtS-qj$Ib|09n=jiY*3<FpHS}$1(UYgn4R{{Em<th7Xs-w|4Y(
zd3$SZf>)~u?WFUbHGcoq%3uL*D5XY<C6t?CblMlwU$#$zJs<PSsBo$2?+)z4wCG#w
zLK@sKy33sw(j6L|i)GQ;sBb?R>g`)0_wQzarOOG@HGW?(L4Nb!VNxQ4S#r3P;TZ-p
z!zUT+$L8N_G_)I%;kcaJ6uq9@SycfL?3GhvVIRCtbf*Ms?z3ZCZ`u_yqAWk#8l(kJ
z#Ra;q4q;laJTAZX6$a6w*sb-I%Z|rE*XH4X=txlig}F@B)99WYnXl=t<2e<v_)z=X
zc7?nwa)&}s0TzC&n&ow9eqt888wx%k{SSYQ0Mh>m*yUkc)&cvI$;?lxD6oysfG?<a
zvC0XM&dWR0i2dX^1vK<noYMZoUUW6ux#xZJ%h{|hs_a%{Wue)5G3ULhw+0pFK%ql5
zV@dTpk5Yps>JyVH+sG}7(Y<#<HoDY<Dgt-5=Mfd|u(TQEO6*6{B33rcsA^FawpeVg
zs%p|abv}b*A%_S-*}8*3c>9(yBJQYnGnd>ddntC<$w%q{`PP@zM1pFI%)o_-fT~AP
zpTPkM7-|nKcS1N+>uqF)UloLHzCCiI9!VG7DISZ5-Zm1x-n#RE|Dnk&#rqqK`0OPv
zthivwPR?s4<rlA`Yal0l`@JPP`zt>s@gi<f9i8?>L~<8o66lQGkv<JGi=?9*0&k7W
zXQejAti_gU^~jVy4NuK#-2j;H*yqKRk{E_WKEeAnPIiY%^9&lF%YIZA^~r21cMH0&
z29$%n4F=!xTe)k-0$bv~8`Zy<e~TJUVO>5G@6D$*C)M*t)=K}|_L;mKOj(M;HGwMA
zoqK_YtT@W_UaZvswLvliHRMGI3?T#l-w=^mi?auOh{A;oAU5*Gyb-tk1Hh#V-xtWi
z3~z>PQEZ2F_Ys47!hA%gf5+jbQV+o4tbakk=Up|^;sjdA(4M8|1TEAHB!Atac!b3B
z&l>)oeRCKu&v`}gnptRQ&z<rw*mL+df`P%}^M{M`pWj?D_#<Mtlvof>+TJZVqTkZu
z4g45fD{3U9$B0T{_WLbva2spy#brQIHA%q%FcYg^07!Vr>=Mqmay_r1uLC))UWf*{
zIjyksqj@L^=`;Bp9W?y4PmQhFDaMi|b$=@_Jfuy{fnmAx?oPTYS_unvKp#X`Pv4H>
z2SUK^yLV2{<TJ{#5{Ft=Gqf@p3V7RRtU?i$52Y#ZfffBwCSmsoVfe^Px8q^(HAVN8
z5t@6>*h{-)u5|Fu13*~4_?MfMgFrs^kX>tkwat|r_X3E>`dd1?H#FW~tegt0oZLSv
zcSI=>uAsI@sJ=w!9boZwo(WsO1Yw6j_s7J>EMQN)1oYFOC$y3_8p!aYhG-a+QFatP
z(Lj~qJTNp~nlB#(Qbm{ez|V$pjlqn}2f*7lZhHzTH5HlYh0+u<z4o8RnKLxz<)Uz)
zkukVRra87M_5&pT-rn&`oib_9vIb%^qvgH_JOnyLF5xvVItTd6&f{L+koZWc>!P?b
zxhx;er5Jr?!bZU*^4+Tk=ZGcBBEuF$UyVn9o2xyB5MnF(qIKs_U-@*diFkg_>dx4J
z_vOz%?y(Jk;{62{(55}vEe0Os{S|i-wNw#4DU#(EoNS^CO|>>1kngtm*wREHIHh?F
zX%fDxZ0-P)$+iH;^p^XgaTzgS4HR&v`zS+ES77PE{l^$g;ZRT0hdOt_juJoid+k%l
zGK%^K=#L_icZ@)kRJ3rNZwa^zm6@)u@#>NAoLwR^H^-V4<`cj;4i-Pi(8hu}+Xvhu
zQPzdvi!mpGZPwH0t3&xTn}fGYLF4B6ZMWX+3pdTI{L%%_^eymA+0nyjYSp?|#rC;L
zbv-9JY6!c*CY7?)EGlXbKMb4{WAjoV?(#_Lx)avbPfybFoLHPMR*?C(j=JenWCca_
zhhPP91mcmy%-{(rvU)2KoV{-#nF#;-Ba3Z&a7S?>od)k2;n;u}ibqH)Z1KU>d+lsK
zaNUwwYYaeGMj3&d@N&NPRF^nf_y?!tClqgOzVTh&`TvZPj()Gmi5kaJ_Z@H|)09%f
ztYwW#>D<A3+riu;CzKLU7T#egOjtq$Xs`4bBxDehz2~<UZq>UNv>E?TL~5SbBLhE1
zZi4rXlo;yH!VofNeapryH$HEdWcdhBU}GMTp0;*I`p8IN7zXoGk{z+(w~5ZP;@KNk
z+RQFdi@N2NuX75+#f2i{F$m2J!c^mg38xT5!`mK2u}5~~fx3d=U(!!ehnjW*FbJ>u
zlS$8nOZizFXbg7GzO@}<$V^)e{b4NYDx(Uw^?2L*Y4#bQ<4TGy;-=l!jDjJn(180z
z0hd~Ym^w9)IFBEdc^VWr+CzlaQGER*rCl-Y%rkG9_co`exn!oij1nYRRgl(Z;J4wM
zP4lGF4}()#_-a<kh}sDI+`$Uro{mj}w@E(&H2!#3)MvOk(A1}$On>5M!!2Wa)1D~c
zV?Q!F8~mb#`4<R+c}ZnuUaPd-eweN#ncN8BL2XYcL6hZT*?%KaSREVA`*4FSSVD#o
zX|HoU2S6~ujK{B-L~2PA{$dM@PF?>kFb6ZKVuv(#!3srVK-^<%reAc+ukLx6J>vGl
zu&X_(QK865?;qxQ2!<U;5!g;fD_@gtTDqK_d4Nu%z0RHVL-dLO(Pr3s6Rubow&&y)
z2!1f9LUFmP=!9-Z;Sf(_Za-TeD=Rx{Lr>&10Nh5Vr)NHqqs#|hA#(o(EF?m={^=jc
z;ZrdQi3QhQT|KhcTe->_tiE9wiNL{nFK#=)Xe}D2&<mZcc2c~9MY9XA&YqsQA=69$
zmn+C6=+Fbh1(?DcyvAyFo}OFWLLwn9P5=c)<jAo2b8oK3%Go--16kN_@4XjKexATA
zk}c_b)kd9)8FWNPl7H&a&ci4kKR5aj7KWp*dG-0_b^NlTv1_Gzc4MTqC1Dn(q|XhX
z%ana4wd3G?GV+Pug2&JPL($Ge&q=TFx6)rRDP3O~Zzg^H`h}%o`mf|-ZmL)pBTLtt
zH^4_$=)SUuJ*RHa_r%Z#dQbTs$jPMry`Jf92-N80IlptN(V%uY&b5M@y#j9}VTK{H
zd76%>+JqV=%iY=EoL58$VL;ZQ&l$z<0T{HW=hxSP*kRV|(nK~;RRr5KpIjHfezT<!
z<YQxajX&QJTO&|%{FH#${QCZFu2*}{ugj7sQ|gVZ$qEb|d@!OlDA7u|)nJW2K;$(1
z<i~oU@v<?$gOEGgEeAbox?IDc`UfdQ0jE;G$bM}&5f*-^Q5RxHqdtZD=*LfAE`d_}
z>B~&U@OSJ5*4Rk!AYB2JnkIj)Im6$L8pk;w+j1lHS=aH$uYdBeg+m(oCwxt<k0)4R
z_9j_NpbVJX1Sc3ZoQm#P?%`69k_#QZ#Dk<`jx(z2ZrxZ#J^(R(Gx)5uRoV`ori(w9
zA6S`gko43v0g_&#BDryRGQDP;l^9UIVplqOZa>|iQqr^59AqLZk6``=ueK+Hq`tN{
z@L%r*AZWljvUdcbC0!0{0kh+KEli#o_zO-yt;Px5!&b43dBF9^z6?pK$Nme+;_re$
z=6k>}%j&I_wFFF(E0otn#}THA4$U8=+k1dzwoRr$9|b+ZVMshCtyk$viZM*WJ`kPQ
zeXcM#eo;O#R5{SX_|Zm(TZx6-4~DV-_5u)p=B9O&VXr>;O&!AK<r5)PL_jT7wE-cJ
zMhfILK)O)0vyo0=ZNa?6&V9z-dr#f{0xu8Jh(D9<Mq&K4J>Rh=Yrg)Tbd}q>287x`
z!lGXc-Na4#+U@e`#}1g(2^5{(`{B=lr7WtxQ9<+vBDO}bC$@HhG%R3GB|}9{TW*Pd
z9~<Szw8M2#o%r)Xcgg?~E+<jkj}QA_X8cGLu`~JtfWv7N_3fZ-Bz3NP#yZyjUUXo>
zr@fXy#$=!Jd|c~%N3~{F8av<M;<eB8DrF_zbjcyjr6w#{ne~pt$DPm8YU+--K;iBe
z{^`d9)8F?tQGMi=F<h#vSkZ2&jUH1B@Vp=j$ab;LW)aCj-)HPaI8*p%X?uqsK25N5
zC5~*mCkfA=YZZ!&YlYu1Go)32@t)u@o?K^QpwfV2@d@)r!cdMT>}CfltNgaVKHJ|J
zYJDA2Fn=X8qq~DENgIPmegp=R%rBq9yjZ0&ot0xG8byJ%qZ*#^XEvXE1<usBT&x(!
z5XA9dby(%PJmU%q$$Bga_1CHJ?RkVgNA{(4>WvNu-zj2^zh-)B4o@Qd-EE6jtnVrw
zn>e`9f20Cm=Hw!Bm|&ff&4#}c^siQ5{`{V6AR$LJM%n<;XR^GP_?p~MWMi?dS>iD_
z%qJ`CFr_0oM*-trYq^&j^#kDalx8G{LZY+FmVkuNrDhNBN@<jgs7OshbJr*${|=VZ
zd4kv)UGqnBXiPzTO*u^yRojl?A4<ZK%M2$o?Mr)F?-HAvyh=7L<8}`#{#>^Hm~VTC
zctl0+fDe`meKitjv1e^;wl&jKrt}kTACXm{L|NAN_4K`vXxOD^)C3gTO5Sg)c@9!c
z;l+FyJW61M8W@k%q{P#7*0_G<Q+QLvil&d=S)0Vf_FFfvHnyQ)MM8vv!$CDjjo12C
ziv6uc6#F-0PiB021xNSzFjQP28eC0FKef~BIMPCu^}VE3XLRMeqo?v2x>#f9PmI^J
zJ&*4u*hkpyqwJ~`e)yF9hgSV_5}@446O3O|@>19MHM*kz^ac4O#$%j0XkF{pnpUJ4
z9{%$*M8IgoQ73(FD(;Q|v9<XZby*qj>4N>&`=aiiyN2>onEqKXlJFMXnZLKmt}Gng
zle5epJ=jvA;vIQWc2&+XsbZfx`08!d1(*Z2^b>>xb+07I8!z=%{f*$b<1^ijbv2W)
zV^$|v5aS1byLsmBl>2n+Sxk*~w^8_lkCHL-@6%6QA<4p%Zd$TQOp73sPS{68bst18
zaa<akgv1KHlN5)Ve17%l&N-u>8xN^&(fl$i(@Gy=9xv<n1fBm87|jPDb9JGpOF7dz
zqtH^_7W+iP*jVp<BE(b+^g8*SK<q<-U}__J|Db_3&3Cp0R+>9JCg!51Pl`($`}j4<
zeg-IdLWtCH^o>4$Cypy>yrm<~r8MmC6~2M&Ct3X}v1Bw!c+FKp<2xeX$DOZ*_Rrx)
z-__}!Be=ajV~HZ!H3>VMnrE}HUzA!0HKd5CnPZa}fqHXV->5VrD*G$MBntZi?KvV6
zZM#t!>o(wsrLQhc=xwLuoESVvYLkS(0n4rlI9QFe{sw-cO5wB<`SIIsq&}laNDy0w
z$VQG|cOd9$n8Fk%>Wg$$FNMGEFfbD49JU9QTWE?U>xS4UAfE#F4pgIl6kALJ@@b#4
z6ZlJv`|)I?3Q2%<oE(?e0mzS)s+yR%?WPVsXg~Fr8+N08ZKd{G#F#H$aS&}czJ$H*
z_ovhWDU*2kOu3Huo|m!3Z5hZqRV+?Id7-0Wkt_5@!kCi>kW1qkjB{jfi#@kOFNl&N
zo-Tfz#(wwjN<rjnmOuHueXcKc?5I}qU5b08m;(B0>yFLuQ^+k#d#)O$*2#GVEB5G|
zMfK?YJmC*v&f-K^h_ai8)e=B8;&Sw90S^id?H|UnroZoRvP%nV#HnanXDF+9=~dP<
z=e~SieG18tD&s1-5BD71uF$T`=pU#gr^JRTVLb&#;X`Fp0`2#nH#Z~~2j+k2f;XYJ
z2*Kxq5<V%1iwZoMvW5!0=anA|Dh2p8sd9~nOKqt2#W~p3r6^Lo``WFiKlZ}f558l^
zCeT&q5q-z5xw;R)v^w|qU(Z(q?LO8WTh){F7XGZc8qtIGc`8L#7g42erK#A>`Z2Vp
z%*i#r2$|~q&I={cZfbs0&~9{>Dxw9v5W$?|Amh++X|@=Cr}T#Yj<K2lOSCvukI^sB
zpZ*0)d+eu+cdCF0eGHgkDS}`NHeag9lnHL<mgr1s?(3=ABl?_=R=l&J!sioh)cxd;
zMmv1;aKr?Lz#$&`ohY7qpX_phTul}NqW|(vK4N<2DurrC@Yl%{9QHXoemQb1wGclT
z+cJB7M6V)NhcWvUaTbilGJE5{`Xl@4AqMhoqf3u~HgOEBYz>=GImU06yN%G4=S58K
zSrh-ZORsOVPALe8t9nfNCe%56+rnshcTtU2M3nlBt;p^z^p+A6R_wc=6}hTB#xO2%
zemJivX(pXqaDVa)uuJ;mqVBL;i>AMl-*1F%XQw0T=GV{s_&ai$>|&Mat3sWvzc|L#
z7|KmzT8Dp1t~Vbho!*CQYTC!ch!)cC@!`_2>EHJG>@Z31iDVIb>HmnMZdW5$2pO~b
zC=jNF((3UC(&ca6@`1}Fcz#Y7tE90z{xxu;4A}lW7ByCLw_;<h9IxC5-E+UC$}N28
z<<5w(!4iFg%sU;ov-sWYT_dvZf%`Rk1Gf8c{2D)_HlvM@qC)-jV<YPru`Bpd<6p=h
zqN3nq8e7l&Ugnz|u?3Ojl2Xl+-xKdr4%Wv9JJ{}(2V{~sOHhfPX50y|a!h)=2IJ|o
zhf5YqeuA<YHs1O{@46r3F+L{dzxUIigc~`8=T!2GJ}SbmJ@1TtZI!Z?01LVr!|jY$
z_Myva(nEHU-0C%$?eH=Bv>CL$^C)A*q-Tjb^aNZqWtHK{n*b4cpZQ`D95Qrqs=>%K
z68_mcc)@Zq`q*ONb<$i#tb1x)7i?E*hu(lV7O+wl#Zm)L>KsUsl$23(e*52ngwswd
z>|jLx2WFQCO}eIFPjsb)-k8(MA_IqWHmq5iv3sL(P(9Q|vtHX8$6^!GE6KYHPIxvB
z>0?8S7b!V?0xCl+F&FMoc5#>_=v!d>0v3n6_6uy6PNCgX(ldH|?lg4k30auSEDf2j
zF3dW3c|huy+yFPo6F?=b-ZUVM(ms8k=rTa%)K|Flz*k9|BhlrU`CDEK9pP*q5psZQ
zP@$G`7s({+dN=f6?)T07+c_WR@NoCfWw}rJ%vD_qy2zYmqDiyQR+d{|DC)=6?6l}i
z1)`kRnw-aclwI1H8)4&e;$*uox_-d@In*R#b9cm8Rpc%32PK5mLd$1q6mFVJ-|D*O
zSJudfvTA~Ov6!i1#MCK2jPFTKf0%5W+t2Q`IrXKbOj*_0+Q-<<kQ+Cs?8e^xZdzk=
zK@Xs1;h#|}pba`!Nz-C{za8F^i$25Jo-nNJ8^3o8k3j<+mAk=MPgG~>oJ8c>aC_ri
z)L771O$SxSLf0Fu!jM9KMN-Bl8JaVVsF9c4R@wE{rv(0*n)`<BrU&Cf<1B2(BWp4J
zN#};OLx5@wtf8Kmp~n!F4nMgzu9uMWbi5xwru6-^T^vf=Lzj>FB{?~Uj5jcBEzhnz
zHqJ7M^1Mvm+!Pwlt4$xnI!ox9C&I+*fX~HscW2W*8R-+b#eE#)(2dqw=z|mu?Oqj>
zw$pV7pU_*y4tDOW7r<47t=i3~M9!rl)`;f!@ne-Mf(HO}<q}A*bArYIHD!4&O7!j<
zl<?v57Kac3YD|-OI9tzF?)vT^rYN~)rKha4X~C7k6E@k=mlECT?xaS9kZb^JOSAjR
zHG)lIj6SzuI#CbRp*I|;xM7rf(Hmy=+9op*J%-SpBlgC(N1bcv7`nGp^y}Awo5xs3
zW%~1`qN*phD!mW$L21P0wL7I2lq_!#X~IXyz2-b#Gh*_Wl5=m07uERx#4D@?5<sCZ
zD3lHpzp_r0>)oR{5|+=HB=P_<xR-v!$XWWGt@a1lal_@DW7RenW%V(?#v{|0tOrZs
zO^WEAf{kU_HVUPB|Fss>n?eq$fE9(3b*c>x?DK58$u>9+IK~@4ZS(3*(Ue_V&5|5^
zK3EeT$r{bn7j}!Y%mPjMzON(u!_>df_W>lf6V=5HzHe3ZJ*QK0P)5OWuR%8`B$j#O
z10h-{HsxL^QQ~lyB^T9hOB8Y5ZPa3<aN=zL=CgOuPmsqM+5S%G+Z1V%9<63aGxoId
zg)NQW?S@XZuJ=@a$T3$!&PIhw7B+Z0<;>NX`pH`VXT@|5KB-+T)H$n&GKpJKP}sbe
zW1mIIXnwb0kqs@3VNI~4{y~hx_dxQ_9T?ID$;&uNTi!piRM&O4$W%&~ZE#OP%7s(B
z-cbj=yFVDar=W;0TCCu)CV#;Izvr)uQu(57RE(603C-_iOJ*xkjn%PXbpH&L161i;
zgt@{~Dzbw3-c3R9)ZAsVD{;3xpyT`Edpb`$1?sSk%L~{%yoGC*7f5raYrb$&g!|d7
zUAEHY8Ef0T9G_a}$GPgh+~1S}OVH9VgQd$uNB*qIdD29RvFkFeL`&mb-Zd&UqWH&V
zwgb3WAFJnz3}@h0+(UWufojOp(uzhfQ2177*1vKYotjX8K1`H~=;>;_V0;3ch@A9D
zI)Ue*Of8k_A5WC(DcquUp^v?Qb$qZkeOST6nyrS<$>`Y>)hKU^IWkk%m~1j%-6!mC
zEyYtxFx4q-Hav*SsU@85?ogodG$8ForitPXhA!?G$WwenbJJ99Z3BRyYkz(#mV)Zf
zMC$9_3;es8=@j}F2T0`U*K#ZDv2J%^TpFrea`de<^!S4>es#aqlK7d1+|dgEnExf!
zC;5ZglVai&cIPlv=f#YNb_ooxOiGn*L}Y;yb_$lP@7PsW>J}9P5uL_6b?XUVX3~&w
zA!fESdS8xmyq(T81xZesYvl&hJ2UZ2b{wOdoE}bzF2qhc0A+A|PQB$09Gm(H!BzJW
ze7CZ0@M6iGoiLRe+k+r->b}j(fpbp3uer`QIWL<)@?A5>()doXLD*5jVBPhDw-#O7
z;tU#is5%CgirvPV{LDG|Cx(UlYCn0H62uNvx(+LMOH_yKehvJp13>aWELh*s`*p3E
zB@_rh8p`W;bov=BY~CE`<SO^b><`f$x>EUh^P9w2*8VRCIyWyGm+~7<&{uoN1mW4D
zx93(s*HXXzRrp^&@efgFHf=e#RSA^{vwVgQvDuem9hLZ9oonb-CB-UAOg%{orYccM
zz8~08fBNcvw9-dRd+E@t9O)S+=DW}CJ&$#bH{#d4iTj8u2uk9A`)p=>AVLf+Y;Ig7
z`+|_NmM$wOR+3_*8XyD#Zq%l-2PS}S*KO9Ha9`yYY44-tvygSa{GjXNC)l7MF1!BH
z3!J>Dq_TedH8^BA;jI9Ke3S!==?Sv5vYDU06f*57@TW5v;nT2VdvtWUG%S#BB{Ox%
z_9l~(hyTlX_+OT_8U(0tbx8e;Al?WcLm2#m0g8pdyd;;vS#5A;^dmmxK`s3=03iD&
zV9|urMWC3YnJ5I4m|#AOf4&(jIoRpqVkBliM4!Mz8CjbsYP?koPjUtwtcz0{jULhe
z^o_@nWI@KM*NJB8+0bkRahlKWMdB1PY9{3wT-i$Hgc17x_R^I)BdP*pyD!Mi<f>PG
zPW(=~_a6gCAfXnR%IjOehqA#&cQWdOao#eJ>fOzK`e_iKY!hhh?$i6GV#A*>Lth1x
z=wNqNruf&yc@n5aqdE-{`qIdA<^fOQ;m_*>jK9ur;@>z=gFjmkcIiM(hbzg;#knDt
zu;B@IuWauVHrqay|MI!~NYO#?x|#+JzPV9hQF+(_@}?u=)wrr#S1$fhRU(nqyzDw?
zN*M9VVf66KvOQuO+Vfj)SjTw&`C)#SVHqng(JM4zRo;Tn_0jY4%sPUu&tjF<>x#7I
zFgBh&WGi*ef=6hEjk1x#iDHmxQ)OD9VXm!zmHClwm6N`}#Xt7%y7GTS?*zJr=e|ch
zrqZ*zV3)WFwii2y4CN6{&pj~Bmg>3TH?M^O(qCh^QJ7CjQP4te{bvX`{A^@$OXi~N
zhc3f1uHC!G$#P+4UQ(#*St<a((?0>9YeaOh=j`EHEYq(*Vw<N>TaO|s8qe-Mj?FGK
z;?*1^9Z3DhzWm}RA#P_XH=IB~;Q_!}<pK2Ip2jt9+cX|CC?!BE<BC)0!-IzbqzS0>
zz8{{y(!L-F+*Jp-`X0cb=za-cAHyW^OcxcF(Mtp#<-Itm6+KuBNZqGia&fwN0Q_`d
zQjXEjP8N9bEsPW^yakG=niwifI50;ZK3@LTD8DoFqmlA4a6<UU@BW`({MqSvfd=9T
z9oH0Gr|QNZr1W0w=|I%exg!vdFs|-j^#|9u78oV}sDn>9T8rqe#47&f%$i4lT12b+
zo>Tvde8wtPsfphH6^kR}#e?0#`@<9yJgqN1uW}HFX+hMV!uihmEruHjs~XC~F|R|D
zhuI0^|Bs#F0oExf(Wd${WxfDvCdjBZtm;LE94L>18WBAyLgknOw#qseU{!)|(%Y<&
zw=Y8+c{bwRNv>U33$P8;)M2@JTztoJ26#44*1HM1&K{04HLf5PritY=t$nq;t-a^$
zUfJO%i*?va+wLuj{mWMUf4_nMv9bPt`=3%wL}pnJn8N&D{^xf0pO5^%8VUb*|K+bM
z>ld2*LBAlC<-aW2fA@F(ufLavj;cCTB+FMy^zYLA|NY(m*I(!l!{XJfAXSOmMRwi)
z;m?bcf-f1zia~~4qyPOT|6jkxfB#4B6QeLc`ec#slKwyZK}bbiLB8abwnpjy@mGwH
z;-GJo?bYSf=_C0s8|nXgqW`(;|G)iDZB+P@x>@A<SpV~?u#rPg%o`8O>Gu5B8TQ{l
z-~aZh`YY4HmsGxrhKo$b|A$raA><N?pbF<O+%G)=Cwuo9sC=G?t9@vU)4;!fw$$?*
z$oSn8nwM>0e&2Qk;ux3MZt-AGOr~gOB9rMw*RdMj`1i#3@3)g*l7CmurvIM39escI
zt@48fAWQD%swQ1I_Xe&fVmqLxbjyJCKOgF9loYjFOAQ1_o)+D__L8&XzqSp?sySl~
zSyMHyRX8(^)odEZ<Q+lZ_zdBmE!{IT^S@jNv!n+EZ?A446L*?t%QqYmM~9o=#O7zS
zYk>s*1-4cOHuAr^DCioxte?RqWH<#_?gtZ(OFZBDo>vDS55UCQF-}K!`_I&KN5@FP
zkvzZ3o3dNp(<eWs&zI7i+pkYixqh7mR~m=*SESVe5eR+$0K{}2KxTV#cmROWGvC7&
z+Bz8dJx8bupPO+wJOVKAamv(5PGB~LeXVEkwCzk{Q1vF_#Pk_Fh;}^zAaZ0?NS$V{
z$HYE`8Ppymhvbyj_W^M}sf`Lm%=(+KJMWj)`vQJKqlm?t0z+VtQ$t|t){*KNeWwK8
zk4JB6;!8hp!P_Sg+mdpGsp$Sj{fWaox#qR)$b?1U)pI*0S;ucXfKgYptOxiudBBo9
zH<%k@o&>dWBX}~Mnc91@+)ZCcx|=C5k61E>LG6@zFm*098IAG#hm1dc#r5vUSCTHX
zAS(6DG^rntR*^V|Ph1fCXhOaR1CxEk7<AAE=fJUIlFLY69XcNoRHVy00KZ$rBJk}&
zBO0Mczxesydr42|Q`n4MB5p!hN1H}HV!eF=)*FjzX`&yMxK+<HBuCwCrXe~a)XB@A
z52L-T@sj8kLft_;<t`3zI6~EgmDkP-=qyQ(ua0~x(&OSFCKI3fAboZhZ523ecSV+H
zZ@Ij~oLm8nX20L07bb$Uxif&a2OST=x}}oEjci(5-g8TO?4L0kx-WwtJ%-DW;V(5_
zlll9WN+hSSXTC}b3yyJMA7}fk6ZYkx=zx8h42@#fFAvbZ;EG-w2`%;U-(E$gnp|bA
zSEdG3c&Pg#H{sdN>T~n(7w^U^OqK7q6qP6Bm*|vvl@-G@@^he*1Ei?WCL8P8h2#8^
zZfD=)``K_+C*VGh$*6tk+Fp6QzVQju!soB`T~{~DJCw`oxZ7{IBo{n1d7Bo6b6{OC
zaib1bA|u`v>2zqV_;zWVf4G3bbf_dusU+zVkDAQX*tDdED&wd+w1`lfq>CEBewD4~
zZt-Kpe1J9@A2+6za{{K9{e)PL@v8$~Ua!ESI{cTLH5C!T8Irg}YU-s`uw^iHxs_g$
z?(s1wW{PNuoX=)kf=>{`b2O`RCSoF!vqovh#J_&B>%K5RYA4Q|6oo7s%I(A%fW3Q;
z{Ntqm!b>WoJ}U3$_qCt(#Lvl=%3A8r<3QoA&s+^KZZlzZm8!Jw{NCW}D@jL7`76g5
zH6!XNkOlk`lnj6>(nM}Jx?;`NQEqh#(N?Fh1x-%dRrH>kSxRXoU0OpNy%EE#j}=#m
z5>EXV#zR=>)=!#b{hoN}(b!kk7F#X4k^2|W6A>++0ak$!<bR*RMdJPTq*e+Ik)R6c
z8O%rb?uyI?<_d*c;R+obHa#Hy+l<Szhj!&Xt^Tut7(xB7yLW*tD@kW2zoX(j=ni*+
z9T>_z`ru*zj9sgp{SRBw+wmgfCv)sBb%qblM&*715oj+Mx_0mwU(f%IH9=CT1EYv2
zhdp9noyK>a{I9G;I&en_UHv-lT=&1^U$7h`_thZzs*~}AShp6j=*>1`xk;k(G9N`I
z?Y`l~<X*tn5xayHpHem+olP7(szb!YhSsjN2QQ+h&YFxLOaJm2Z{ex+>SG<w>66Wd
zhI|Lds@WieOfF6%O@7_7SF`6irH_X05!X7X7`;!(DP8@^bECl;oD@B>CB~MXCU#4m
zhf@V>P}Jx_jrm_au)bNUG3i;5;O=`(-*g+cNFLwcA4mV(DbKoG{EmYR{SGJAllj2N
z417G)@TB{;H#G+_CfZv4+uh)9H^i<`=F<xjG9R<?67oy|3;d!_$B6T_>;^lrAnXRu
zY0(9Ug*kbVQRS@k8K}}`kfFouF74mL4rX6EI_B5reAq5SnhHm^*GmHkEnX!CeK>(Z
z_@RH!y~qKlc_xu70!Ht$g?LJxuB+Rnyd#L2Q({S52++uBwgq+W{`39SMP!U1f%P))
z7rU>=HGRiz$J*aQZx&on@QXSQ6R{YQU@xVe7YUe*iQKySs)r+F*on^5k4V}UQ`h<o
zw&g()$=^g~V7q~zip4X@aqOk_OH^FzXr=-0I@;R1GRk|cJNmFco*{P#K0~^2LMjp7
ztd`3oI9FP#&%evpuHAp2{)#w{9+l2I{CD7LJ!jSfGg1+|R}a8UBqYM0)LXK&Zyl3N
zAkzGDCdsqv#L>nbr@RxWmx^=n>t3M+T9bqu&v!y0d~=khmmFH{1xT4y=XpM}y(&J%
zRdK#{W9FpEmdnTNV}5?5RILke!;k6ypzC&?$q?LP<p0#7Pw1+XTWqHq#_g&lHg{U#
zLmrIR@DP2EIPZmn{z7UF!4-GgT~;2sm9JNQb=+k-JC1L}#r!B-6QtxkU!&M2>Tv9@
zE!DN1Gy2slD>Uvnew@kqYQr_@_`Xih!Svtr&(qbezjDjuhC`C&y7Y%7f=;eY^3;f*
zRbN!tNA0zVe^*$7xbBrju4h#AxjE0jtySENo~yURAS<YiXM7ZP9Y5+`6z7Z30H&WU
zE=I&7-KZ7av&G%;2*xGBJzBcZ%VomjK~}E5#c(xY)ChK0Z2|wFCnkqkF&EE^)0oQV
znaZ-gX-_8D__tbwvt3G$%ODh2_{h}lyWGdnkTHLHLV-4Zyr?+5Yn3l7b6Yq%v*;LJ
ztg{-vBx#xTffi<;&p<1;C2EQb;?n%T0kCIbr$mBd=M?M7K*0Bw?qOD1%nv0m2D&y>
z;kbQ{R+MU^Syz|=33d_A@q{EWJ9NjgsX2#;G-j=VzLLfPwNbVW{N-0MJFt%P!m}i6
zFm1^i<_Xc?%v2H4z9S&w3(-*VS;4uIvW!|WgCB!25jzv2v;FH+L&t{5jM8C}38JQE
z!28!}TN_V|)_E~1#h@E|3kbjsHj-&SBcVed;6IA}1)nJ#;ZCq*7N6afr?g*~H+*xJ
zAU6=kfkye;!RRLth-`$>ZQkE(w<?H~w;?q8jAHYnxNb*z@ep5>P+hfi^+k3s_^|<n
zE1S_PYdYbByv*kpUUD_%Rz)grn~x1%f8@F4aBY6FeAU;bFU9v|L}?|*stRHT6w`SI
zbC(l<Bb48mR&tR4U8&*cbJkp{5qWoHdB%GIaP-S$;M8RH+)^Qq6aDBJU8|UuG*{B&
zg|-%Kp~n4ZYCjpD^R&G;DZEDir}&Z|qS)ZlF#4sYl1F~mdNr7j-u4T(mTBRmqZhJe
zU>YqPc}?SOq3jT+w0yd6|FPAW)@5R+$@nUD9*za~-wDyv{3p4b9tkkex4x(}YZs`r
zN0lB$@7i+~Lz6rIK*b(}#3-S$=+im5M=XI3AkKwXQ_J{Pj}NX3*D#4unIF#JF&)WV
z2p^Fb5bWc(6z#sh^&rG0<E9D;p~DNaE!-%S9zwsR5KFiqyxytgQu=4?<Kxj>C%TWB
zH%FYoCB{KZpU;~paE_{o(LW?n;Km?~NgrCt8mP}O$LRC<$)5>0=Z&&+Bzs^M=8BSA
zD$K(w7PXQqG>gHJ$xMI!L@pf|omZ7;6~dCM5JJ=y%&0F7K#;LqTb4ZEex*o0#G~I7
z=Bm$oIn>m|tnD*hE%X_+=4@9zt$LDg64ii-Y}{D*^wXbbU^gSiK;L_Nbj3Doc%e5Z
z0&z5JfFoSC`_gYFjP?cIB#a()7%n`{=I)5Yo$8T&px;d`=_4kmcRVa#Yxs;=|B^gJ
zwq<;2#2~JYbW$2h6|%oSh(WGNwnyzLWMSS>X7`&~x8m>a+rO>x(6fqNX+k6G4|lQd
z(*G>+a=#+$QHH3A9#T6EqNA&yZCDn2lWgr7C&)cr$3cep>n_Mc(n7XAajF`{RYwmS
zeJ-M1dhrVFCTba0Y$jzq-$R4XLWGxf-}OZtuH{lnKNunOm)`DMOvYboEn{Yk!ghXj
z%Qa%n>P-2M!nZNTU2w8^_hO#kF~6D716Y=-L`rM#%lAJP#Pf`Z=M{&I!ntGL1D^~w
zsSkJS?8W}sq;lwxO{&ED0FJ=~KHV5=PS~X0Kiv7cR<Uj4Y)aOa3v7>0A<n{3W#-B3
z0Ov*CY5^d($Ss&<<rZG)zl(W0F+a+W{BpTt>Iw89GClbVrgbkef~LdW0Aq4s<rqNK
zBq-WzA-MfjkNUg*<t%1!;kKrPhLlWJq+YG{+JSx@a5suMf^&YsZA4HICw3mN7|Z#_
z1-vI@)ox=+{wOyWEfHSL9UDPs4T{$JW;Skpx-+<4*<R6EzShxHSTx%UUV)kWYV%lv
zXo$QTpNf^R3dsVNa2jxT5l2B0{a{o<B&bBAf7;5o&A1Eh4pNeW#w9>93VQ1>S#w0!
z{;5{xEl%O*K<X$uY0s6@rsQnfvnOdL@jLEZ+1=%rncu!4I}6qC&sHGxg(wp|uE7^}
zQ{XdEy4ftX35v1DqVm)VXS!|UHcty<uEhrs=dq)L%dSJ^@1gehucPf2tzFEx<lNs;
zx5r#F@i6zOG*7RDq4zh%sSOy853zoRHXdH1N}0c`&2dbY)F;r%hvoTy7cq`{+EeiN
zyHQ6&lgHZ$`I^<`k7FVV=PO}qmZd+V7rGl;t&><5jSqxJ2;E;>_(n(xp&P9RS${Pc
z`OquFM)u(*L!{_xP;?5?v8O`E?h4dq;g!20moZ#B5`7thN%DaASIFoV)Aw=>!uVK2
zc2-3lm2U``#%Iz#3L{(lVCVgzU=i0+K!jAOsL<_|`+N2(daEK!+LkjF(npp@{8blc
z9qFv-AC=C><KA!BrmQ34tgahJ$SerBzxDJMqGsFZN#=V*nf2f&V$waBgJv6Y)wqUV
zbI=-lIp=aSWjE%#e8y(%wxD)B#;=;=b2zx(a<$;!&iS*8Ggrow$T}ZYQ;YewMdtNd
zS~sdEHBHKyiSOZcyT@W<vwaVbWonH`kc~KQUnFb|{A^ep)r%oX#Lmp$QpDNrbLewW
zNXIcgA>!JlD)R<tRA7PL&dJy!l<5>PXqJ_=Z(v_DjQs;vxJA_8;2ar^re633*))=Z
zb~IVc^qAFgR+lpc`;a~j-#3w5l_9#lZIFFaA(CRa5zV_WpUFUr%IN(=cG}b0SmN5Z
zc~fC}(U>t*Q9?m~8P6U=^AuTSo-+f7xl-7`ilgTb<M+)j77<cv#L@0@mDjmLlKU~+
zdP#;p`TIF!akMu@@%h{Fky8@1%GFnu_Kz#l)Vw%!_yHx6hLnWesI<EmcYCe%u&;a6
zuwxn9-A|pb2C3bsg}OB;rAI*#&M)MVlvu^OI~GBC-gumO!)!f`m{+zj$AR_z;-kKD
zb$gTVqBjc^(xBP-c6>vFwf+0E;Bdhdgh1PyVmWUT(^5siqGc|Tw8y!P(?SXzx2@e(
z?p-pDz;;47lPKoep0OF47FrxN^D2RtY1}@k`)3^4UMLAyq$Ji^ri3K_DT)8Gvk2<a
z--420{lE#$^{`CjN%?h=k3fm7tYIREmSS~Tfk@-BkhvaNwFIW<^pPs(`DT998$`Dm
z-KnD($kxavSq$cfB5#K`pb?7k(%&TwNiMZg7@NU)ks11?!CK#Z(3zK(JC|cBg|ogT
z@E9(b?;~)P3ps+H$b4-9GuQ{Q0#OYuS?T1Mlk<ujbq+vc@2-OJo4wWSJ%uRX-N`4B
zEn+gN8w)@9nka8nBeKBsNLq;gSpXyDFO6X5cLIxRv0Cb(yAx!aARY|BAVW;eW<8M&
z0<SuTn9-lxxJF>>y=Zk8bIQ9gabWxLQWdjf@(U|!UVRw1>N)j9FV57b1MnM7^sPxP
zN~zJT(Bx8W>Zf+p%-i-=0M<yxlmJSjb$b;EGD25qQpD|Q_^pbbLl2VFOJPHn@O#_g
z`u;R$N4+n!UUCyCs!pq-!$G2zT+V^p1?CpDU)`Nmb~=vDuZW&fGMHhaB-EH2xW==;
zD;Qg<?oR^JNEWAor1tRg>84T1c&gig68@LRV6XJO?-CwHzld(V2{8G(J)rqu3tZ|c
zSP2%jNcd2q^U(_-9LpQGr4}2R7Q$_s%X0FBe8beO{%~Y}zJ|*=&158|(6S-0E`Czj
zx~cYSSxmUIBAIF{Z=D237P0R)?{Pf4iJ&~}7s*97bGN#lHR2_%Px5IF(!|TP1^NrG
zw!?+iAvG|pY6nI-*E=j38bOvzp1-R@_Xtt)5m!r547slrRj6wn!W(MD!HQvCAarR{
zH6&S4^(EI_5|Cglu2okC4(;tB-53HRF-VFCjSXpvC-4~nhUC4j{dFx@J#7`7=Th;n
zx4A(M*<syx;g?_mkruZSVk-ewTWaQWG_BM;2#l8cIrl&)BzZ1t1>mfas||;|UWZ%q
zCeBvgnjPt3wz}Ii9k=ftL1#GeI?{7@M)V8kPE9OvD}A$RodigC^0R2&`tO*J0q`Ze
zasY{QwypRU{GHo6PC^rt><a<b$b8JNr_E!=U&0E&HJeIti`pQeuAmd>ont#fXR&yU
zG0&7@@edL&l`nS3lwDvtcEi#Y9@>`WMHkJ4Qq-N?^`F(Q@2Eu}jO1f>lP!wN?H9jZ
zGbqT<<<T<>^@zpH;_*O0@+AsPb98>XnR~*VkNfUjRvDfUyC!<m$>#DT(UI915$l+{
zK*H}wy+I?}W&+J_#a<v()><`!V@vnN+{GbaqN^#XN>Yn+e4n)ET08r4E8(8Eh_M<C
zORO4nq3ycMmQ}t=C#!}BPyfMeVvVQ)v#G%G)*`Fxq2Q>d2)1epY~DKNypj2IvEEKp
zU3ExRWJ#%nJ?SV5B|UHNh2XbhQ7kGTV4e&8u$yOjoiq22>E?{Zkq__!ou_cUO+R9b
zcdr8oNOFB|5*BRFbrt%}Vzt?_7Nd@F#z*bcul!u@iZ;tC^a)7nXRLw8BMC+gqih(Z
z!skYpZ2h|{Q@Pg7(0r&SVJPN)3UP0w9C1|g8J}bSGWxMj*&4U-eoY^SCdtx~lJ3y3
z$N_@W7!0?54<?VOO!)z%OiGV5h~#<saN7Nu0sn%s{7@52ssy**KMQxf+u?8YikBVN
zy;PO!)Bi))TSryhb#0?62q@B_NOz}_5+a>ao9+-v*)&KfA>G}IbZ$}_r8g+uDX@_S
zDG>zx)(@ZOea{)+IsZBC;qBOC@442R^O{$v02A0&)x_XGRU><(Tnx;gv1;*eaou0N
zNv<NQ@mh8YiZS$*<f?c8md~U%f|9a=@Q-pa(Oqv<$fwoqJCkTFN{=B3rRePs_%y|S
zvie^Y7g4{9-}2;der<svhc8^QcKG@30+?}#!#;+mPIDZ|zr!&>_`Sq>@Y)*P`G0=o
z=Sj1oee2Jx9Z3K~rpgbCct<3~PGDM1&O092bbHMc=zzemk5>UDAt9B<Caf0I2?czL
za{W>hgG)B-VC*IjR6g(vl$ExCwOd<*fTUZ!a_$QPzIsLIdLPwUnr;72<9NI^$xRzm
zab5snXi$1Hxj!N{eJY7x+nE;^8G%zdlup~{JLB4tT7;BVso@UsWv06^;P^Q93kh0w
zwc!NQF&3uCie8rup!SUGW9i^L09sR@aFGMsgd$=1N>_n1V0<lv$TR_mkSbOO-8X!0
zLR8Na)Ao3IJ}I340otDnz?jxcn*<CE3%2^vb|Eu74xXx~X9Sfrd{46<p8`?jADR~z
zLw_%xr%(0lgHs(^_B==Y3Xp(f6$w*3{HT0>e!<b3UH$=l;t$lb&Ce>Dwo1h1=OBXe
zUw~ul2Y&%Sdyoe!z5Anx=`r8=0~K>W#7*;x#vgY(Eke?E0MffHJ1^#a{PXYr->c`p
zH2Q0z+&>Y25muLdUw{?r`=pLnhSE2>KD10;O}_!yxQv9X2^**`S_VFb7_lEW+RwL2
zWyx9l@0QLB7?SbTYvhdXou@^KynGn)?fSxh-0pw5ZIa~h8Ibp05`!voAPK{4;%8Ej
z(UDQMPX?F?$7vb$3(2TXo?A2cPQ~QO{MN<K3KSi(*|QpxT%{6Ow?j(OjRv2L@n---
z36}8`uoQ1pcF}|&D9^)WA;->3@bsEd-WY3HBX}QvZl>X<FKNP_>jSwX^>}_Ss~NmY
zt5x2dq;P%Wx1bY$et0HGa!aO`vBY&Fs}!n(o76hKM3W6NVqLCO>HQil$-LUm{I~>1
zHr`+aEeKUP9r8`vf23X$9GZUE<y}8yF3WO{WsE}pzUg0Uc>NlQ6$_suFXh1%z#;9o
zj)!joKdrjl`-P{l^kJe$ZJ-yFcDki4(rXqN%fv<suBi;XdACdzFiV`0tl{qiK+}N|
z&Ug0Z)4Mx#yshA?nr5khx;soqa|+i=JGW5=NnPs?zq_~DO3Ta%qek~3tQvAPiu(QG
zdq+8#0i!(3)2DB02i3@ok0;>-Y4Vz|3;~&dyrAdqWj8^TjI!y%0T7e?f*jxG&)l+%
zN#7dvhwjUFJv;^afRMl7amow70)OM3ndF=JKQ=QO^N_Fb!yIfpaPbQXCvbQS{O;=h
z;Ei|5$?6D8<=8*$D@ve343$`Hb(y@&q3dTVE;~w8C#ddE4U8<OvuxInl)DUna(Dq4
zPs!ciF7El}gWY^wJyBCrabWkWMx1x~D=ifqWCq30Z9FbHUQvD}T%7d$RCfL<eI3w`
zW!wB~F`HJ+6!*a!q~3D`_7ZXT+e=cX*^XpoA1xyM9^e^LEzpZklC>lJgwP@ynsZ&H
z@^pazQ@vxTC@7+^S}UD=fuZ2R$cs<$j-eL_aFz6X=uO&J+?%`yLc{lB9`Mq+U_hkM
z(81udCmCEyi`4}tuuC2;37IWBxXrAeiS!xB-~1Nk4LKYK`#wQc5USU(fKLpN*zR9b
zld}ha9LzxbgRQmcMCtQat0gUT^|2G(JD%X(V3^pfUGnr5z@a_apHBe|L+|^6{2I4o
zVWtsYGc<FOGS%ymF94@wkWh(Zd9`o3%A!|**kM5wN)@~U<KSwi^gj6R_B!orH=GQ4
zIhGy3zTpadp8Ex1!M#9QES$(3R&-M-Ft!xruS6jtII2Sd|8?#U6o%ydL0kFBUK<O?
z%4o#vzbWk(`MiB!0+0aKdbmD;{8OU5flTuS{KIr7!uuIEm^l;}LkQvk5!Q1F;3*6<
zPTIF8<Tn#mO$^)v+AKqsV)TN3R!+kj3XiZmOuV=URNDIX%?-C@@~}s>sesnt6aQhr
z$J7zOFJb%L7ay`9oFSVb$;^m|pEgK&{N?@9bZ9sCw^!n-N`24#tY=|WmzIJgt-DdR
z5|=OcRYFzI4VB(6&Nn)sVNzwWiU!l@-AY|mb0zCr3Q&JWyk5#Q-=|L@k1YF6-UqZH
z-c8`ozX3PoPSw+9cd!Y|+maK~z`nu&&NwSr+kKx2Criw1NWCee@Aa=DzGF9nM&r3Z
zP+U014n9qWH2hMRxN;MkPwdl4kL79?0Chd09qjpnyy*_{THT>o4qh)GAkg^(k(U8A
z?D_D%WbN2lL=8ifLVn&)FkktXaL6R77;O`5(Yi(fkL|8~Ab)@9M&1PJj62RDEl$YE
z0*U$~Rg<R@M?g$jm|R&A(tsllGMA>Ja+jY^U~nTo--=qQSxjX7$R^>or#TCg7|`E8
zd{@K2$XR-o@q^k|WK(ek@Dok=!xh~gKUg6WL~4-`8CW@@r*=Hr4jGd)yW}acOU|bz
z{Xm|Z7%^(KSyPhkh}GDiUc;c=We1xT)e(7gxM<r%d)NgHOH)a8F9N-&)vY@(A$K^E
zdnsO}C4LVuiyVA8xw7b%=D3!iL25FtN|kO<K|8oeFE6ruve)Ua25^bjhtD}GjSj<;
zj2F%szyGLy#THPs>0O3$rij<BT=ny4efQN@&ro6fNX%foj7*)#vJMdPrK5delrte;
zsLS?!FAjRc>WI(<I94pwBe8NGhZ2_~=YgneIhXCSpvnA$nm7}_biYukw>brmbqrF*
zNC%y?$!6dRI)qGw%V2Am6y8h`vbzq-xA^e3UAXy7#3>Zr60{Q<txDzjUKI$`JxVq}
z^%C$`1=3fD2f7;Op-Jj@-R)x1`~(8w_`7L)LM%ERn%hARTGi&-f=tVx$oAtEao|lw
zp8JuKfYTw|t80Y6-iS>48_+_O$9bSCjmm7Z!MvezMmiv{N#)BRZ;ZHMz5+&OI`T6&
zPWrN>e%&S4F%<^Y9XAku7v%&V9=QYw{0o*r@Vw6eG-oQqkNfD0Y%}(mWQR0mV$3DY
zHVi;TZqlFVl~)8v-p*r{>eB2cEH!L{sL|CJ3SmB?M6h)#%Nc(aVPjr{@2Y5Y3MQ;S
z)|qfw>A%FQiTmo9P}<rw!_N!~rcL3&!#%JOOL;H^{9uULrPQr7r@VvePr*^rq`G8E
z`DR;MPD<#$b}B>RiyL2+iJJ`xg$k;>S8hk^ePL<<9vj_%!KFjrWUF~&^Co$m)@EoP
z3#<GNecxzF1GLSU<`I!dWV9$fVcjjs*&MH;yO@5spA7q}!u#djy@^xEy@6bYam&cu
zXF67?0=lGK`mHC~w?o>7&Oa1hP#JB9$ZWj(%@qy`G^4b{QT~uI$~Qc{Ca<>p|E|%Y
zq{bJ4Dn+>!!G8c@b?V`RiX&}sE90seoa-B2$h3blYTI}Xy46eBth@vy3pJRuNIAi0
z1M63{-8DNxAe)HKtNocV@b6tu@zo@dRzZDP(?zZcp?eLifJ+(M_EAUeYm*-7Zx0Fh
z!5(ykNy(h%(fbcs!1K027c1f^;#hD!(?x*T@!k!%GMYOb5*PIb@?B&eP&)ifFhpZ(
z9&!Yl>nY;Ge(qL-7im@(Ac%}t85ebnB22M8-$-(D99~~Ftng?M59<wB*J{(pfW>7!
zp1Ijf1sjn!8-=M6tfJ6-;WI(B<?>zhySld%{0l`2!c9&FN!5v#f><IvbCS?M#_RZD
zDq)!GH!K0Um({D{At;5QE3m;-tR&Q;|IL$GHa&OI&RlJ6ObyoVJMr-iXvFZ9X}fcy
zmRzplXuWT2m>o%y<LJdoU+?dkwbo7;WtwwY5S-3`dSyaiS^{Vv8h#a440bVeJ<<Zo
z@j33^%jCp!5ApW^!nZ8z`>w92q@iV(>zrE`!w{^=$j^x2onnY)kRWl{fFt-5jXk3}
za7{8URvhd_-=X<#sMA!Hx^m~etylkq6D0FRG7y6wiLspwenk(Kqf}mt3jh$*C<x|X
zH~@e3;@(ONLfyS3GphptJ>M($FxTNYmY<Mjo4o`xG1FuK^Dz&;g#y)C_)nU|+?a3|
zu=RI&X{5ZEd2^KAy*>OyH?q@xX1tXOFb()?L)nsV3b>oCVsR*%Gjo-NzjqAtL%p7p
zR?$_C`m^_b$ZRLbqKc-J13R0yO$3a&b<q^j^p~n2L$XXn|MZZ79QiJa*UM0kuU<cA
zwBlSZyD5dato*=H?_}xmKG+1eRErVbNfv?k=rP>LMwNtzmGc$)ylAZU>pQ0v&`&I;
zCM_mk$v~73^e^dwJ)HU=-w%%N<IT3a4%tdsWM_{23;15<U}8;N?KiCX(h}jr_uyWh
zX-x@^j_hJd33bWOucej6E3Ri1p@-cUl;5boKbDz+y)DwK{dfJ+O_}=vm$Y2YxH0@3
zqe7iRzdJ&Wdl@KUOM}AcMlh&Sg@n4zpt7f|RffaQ9ZuUK!_xU_Z3D0v@b*@sSuw)m
z5*?dX8q{aZ*7>8kG2cF|dmn>%+0eZ@E4dYvPtGyF>Zyp2#)5O;4M-=!D0J_TU^Qh+
z^8-rkZJ}x-8T??0G$+OZBXm;dhfPC5FYa||^)pvM-cOD{pIySto^i7V;sMG^E(s65
zn(2r<gDb>)p%tF#I%GrMU{vQ|J}_Qy5W?rHXjr*R%@=C6dG$UJH#hHYBjkG#=W2%2
z-Sy=bF_PT`N>@lIio6K;N>dnO-7>WGlsH#N5-WZI#Q72$fDSqidB7-^0u;l8kNYKz
zBne-+VPcPLtRlAW%dvb8FSm^k=216-ALB=Fj=?L&#^Mxyt?J9B>0;6exQjA3f(R7B
zt!=O;97U0!Td*-J>k}!oBQ+K9yyg~!0`9Nf*ZKZoG(=j0#yA}Joca>C^-hrVSs#2u
zV@1{LFowM^-DVGv7ouWWPQl_if6c|7kZ`r|&&OyHHUTnS=0vwXao=;6n2dLfcK9n=
zc_Oi=@onou+ks5JR2;JE*-k2SUBv1FZWVIVJHhb4Q0mZ6V4>Ac?}q06a4U5~r{$B%
zc;uX0)MH7ysIgP&G$*`K?y`Bt%>rQHSI1`pI#n2YNbP-)=T^nXrEH6WTOp@yeHELx
zti863vk~>zu<BS#DHHby?oCXhkgC}E<YltvX(SBl8C1`{I$K>LyofkK<G^XxG>#WB
zigO@F{9zz`NiPZ1tm=Goc1_|~uM5enXbNZ>=KtF^IPLcv*W4^Np8Qn(z)+1=NBg>D
zdHSzQ_5_qHWFYs@g#t=(u1t?$$tc<c*vdATwBRSO$wygqv+)cJhJ~1VTjSi4##6qU
z>fl1|?$$+~2%(?#|GzKfbbNlv)I>}V1#R-RZZCXRt%%%X*6$66ATLOI^!?)la*jLw
z+V`Laj!8-PdQ($OXVRfT7@C`FGLJ{b7u2O;9MSVEt>~CAuN5e#4Q*uZVmAwgk5A$%
zu-feQvMF!m-@(4Ob{O+oHfzw_E7Y>@*?3UCU|yJl2gUkBW^(y~!%vc%vrQ$5s`pG)
zDEemLUcbSD%$_hQZi#;~OOH?Bzg_^kQfXXmNsj|k*l3lRKHp+lW87<K2if)?mP0O9
z?()T|=m22ma6pdbV^%ML)$Wg{D;?@H({AkgFNg;W+lHjduGcdh8nU__BnMrxF$^JB
zIeoRI6-~AY{Brlqr5Dgp29zQ7WD!1aQXIFH;e&)v3&9iJ?U%c+KCJcRi3iOx{?;Lw
zP!&5Ff7bvhC&!pVK=>BoAj2on@3|v$ENTBe%U=x4pK>6ux6C6kL^oPX0?L)KTEe=7
zU1^&sJPF%)*R_gei|~H1?nL3*8%>$9#ewQ%!e8)%l9Zx;0;djFO-j-+&Jz1A!<eT9
zh39YVKzo~reJhB5mdl=tsB^g0A-BN(PQ)nEyPN3^wcqcz)uXOS$dW{ivifu&_G?xR
z8v=qn<&U<9CdrZI(}jJzj-X;yNXp)08eGGHtQ?3;rQHxuBcT85AkubS?VMJ)_xzM5
zE1{H)slGq+Fm0{>d^wW7T~8u2I@s<Kfwh3Y^h~{}>~|JSPmp*m?{$hxa$<pJ`Lm35
z4Qts&19d^^HeCtyyN-siNqa43pVYzCfzYI^PbFI+e5#&<P}y>v8>z2F@GFiC-&5sR
zZ{!P0uduZ5hE|I(2giL6nL0*zQIqQP#E+_%gedm~K@x>=X}@qP=%S^0UQYo*Lo<WE
zWJLUSPsh7*bL16s!(8z-SLVNe38YWhw@KF4%0eIQSUCgC65<rCv1q&as0xI9f^?S%
zu)LsiUfJjrTE837aBQ}ToiLJ{q~2fZbDNei3X32mI_eabIy{ENl#fNoGORL7NPy8r
zWTg9CfzH+(ZkL~=ZF})$HesH(@9;Yr(IL$;@$OHY;!q|9lwFcCJmPg9His7J+EZh-
z<q!|e0%cxRQn@@0AC~3@3m?EPL%x$Zd_Dzrd_oHiH>?QwH(6}@i7J3m^{dQOhXX3K
zPGCIz8;&w1C<RnLHbExPB+wxo$RzI(!@Dklef~#c9MXaj)eby?7kwE5(sm(2ha%BJ
zf*=TXIM*D=a-Kb-;ZO_seao39dix8(e0^5AdkQN2$qVA?V?g-3f5+e_7_|o8H7$Wu
z!I5Fc?{c+jEx^o^K|euy7LJm|f3}+WQUUYu%U$pE&V!ww?0<{f9+42>H9NY^gY6!j
z4UG!L$b)rLNv&k;p_lBg6s~%A@djqu)<J!0#k~JS;ON@@F77d=bGhxjMM6;+k}%0w
z#yP+ccST5G+w{wgT^7=bpJH$A6|Ye20wl#)y?nfB9g?`39)QKhHYTx|m+-%ZitwA%
zs=Mop_&1CN1j32xs1He2MU61|k}0T$a=Uj+%*{)`x>dzrR{04@O<7zb9-e=|S-?M;
z59TtkT2Q;1?6%f%Nj6V+HF3{a*SD5!`=8S6ZelB+F}+}^WG{+NpOndCgXS=n)t3e)
z39Fwj4PDPV;@LN^c({nx`x$JT0E!MREmmw@|Fm*9amEq2Wo2iIXK#;kOHT5g7l2hv
zpN_gkK3@-Q-*bZKDeEzHhxO|gfW|gJO}f9<(-&yN&FuvHg1{viNSuZO{L;_z4=5tI
z;xV<B%_bDxL}^IbM{Y0*!xo)tt>$@?+5YxrIB;n3?E{y{;@*V*REtmg5B*AN?OWJi
zKO17egRD3tz+@n|l@rPwDlBBoU#diB8@{=*XkpD!7TV|pjm_xf-wEW@A`@60;nZHT
ze&Nm#S3%mZLwIuzhC~Y{4dS|s=W?KcE6sGsZY+skv(^v(2?oLbIlu(4XE&&e!Q8!D
z_Jcs+kVKB!niko0b5*2ONH~6RE|!4QVeO7J%V;i%&G9mXc1nOyy`bNLk$-_Qlt1j(
z;Q+TFrB&1~1^2N66>Lte!nm`8Klv%fY?wnQ_N5Dqw5D$jD*`=@0sFR=bGg6QVjc`|
z#J)QulkBj~04!$elxX><c|?CKHY`O@A|qRQsSpKuj3L7(Qs^RG*EM<!Ed{`k)B9v@
zq}tLljZT#oMr2KBb@W9;a8e?pM4UHeN@4+J5H*tMN9*g;9y?CVc4sdD_yc<+kV((l
z$}o_MPvwx+-y{*-4jO8DFXDFAL(GU8J&IX)xKxXIf-#lO^>vBxOD<$e53c)Hg=_9j
zuO?88v$qnu{cAPN|45!9rvE!}6>cV-bZ$zkOyZS(q@EqdIiPG9wkj<nFQ~gc+^)4t
zSC`Z9BdbOWsdinA7#QV6<a8!w)VG3H3@0Y-5n;ym)I2Fa!9MH7t@nyvnstFN@~K;v
zbLaX60b}>HKuLbanvnUL(f!Rva=tn=oy+Rqh50R}yt|cTA-V5oqv~_joa?Gw<U41&
z4<7mQ&?*hGReV(b%U;0b37Tu<w#a>f6Pm7zpZJ6VpFW{%6G|$;Va!Z~?<gxe0~MJv
zL*(AdS#AW^!#hs^b2JatvE-!8jbt`n<xp?xc*Y3D@9aUY_E#V;Xs<Jzy38w#uXka!
z?>C>}43RgJ7e+BAsr)Jr@ls$YMs;>^jmmhCGL*E}4%i$_eh~%EB^QuQ8i9R0$56@2
z=O;6Y>7m<T^+tW4<Mj1}dRt<B@$Ei{efjowsGw${s!AeWau6%$L3kL0?r!xmDA8=E
zjyrKJUo<G2$*?{vQn!&*?R3A61=}IOagAGe7fGWx2;e)FhLxAEC|G0mjYNNtOLu|J
zQ%;&BhU?93t+dAxU)Vds*MeVn`2yd?cXA663{J;Lc(NFMm|Y8EVoyV3*bde59r_mN
zxQlg^OTytB`V6GyPT|WV?nu@83dd&`u}FGouC(lorjS5MHao7YaQrCQBJ0Lpko@{&
z!GcZ%X#|jmD5nrA@0Vpd_pJiEwl!i<!K~k-UMWr$M~BrYj0cezm!PeX<QZn|-}Nq?
zz6ynZ4o8#~mV|Z;)7CU#Qh7dQ{R7Mds->r}Gz-8SQV1@@BJJQMX!h6pt0L(Q@SG%v
z8v^B!DNXUn7jG{^iSUO1Hk*%ItNnzsije1KZpTvOO|)%+xo$Hh+wW`~-bM&3CEc_7
z<W=GJqT~I9s}w5YM2c;}yaJ|Q^LB(VbCxlhz|4WIv{VD?GyA7!C#O)q9mMbJwdtOI
zwxKPG&{gUYwTovDEYf@TZ#;_EDxF*ZL^nrB5?(Q;iG1VXwwXd>N9LQr4mLj)`PDtN
zETy@Wl|!-wj{m(EbNd&83xs$aZB=Nhz@17u+km)CR5TD56i6~8dK%?2^+l}QAU+k5
zR>6Oy6(q;<6+U>I6mAo-FZnQ-|8r{qJ#Rvp?}wI^&_Z*c`u&0I;jwRcWxiiZk_`Rh
zv*BM!Mf{0Uq{pRuv9=S1DhN@_09FeQ)M0rJd2PQWxvNdTV%ZVb2B1Jeg5JK$aMLjQ
zH!2HYFd@vq#4ihX29T<eeG{VN#fre9=c=rsg50S_=5JMGNsghPhy!tVf-7f4(H-mn
z=j>t98avq=y*y=zj=Kb9Z;S|}y{9($*R}VN?;;;?AT#7q=b`mbs6#Xs<6g4tgELS2
zE*!!H3hL;aDKR9ZoVP6m3puU9o#=&VlpVy&b}NI?;T~%`dve5YUm%w^^q9iH?4Lq_
zy~(!yCXx9p+>cBymKtn4#iLD=khU*lB;yN@H_w6o0;$d@-m7;@i4NyYSLs&oSeZgZ
zvOkk@>ifh2nHjYXw<5V%nDI_XMa~PWoWoFdSMCyO*E)r9t+?B<(RXGDmXr+1L-(J$
zvW*It&Axy`fGs+CUvvV&VMDc*eLh4;6XhS_fTr>pKqQ#*+rf}Kc0s(PS_fBxxP;>o
z#w-E6Qwhdf1^WSikl$*3=_I0_aMF45&=)>)Zf3lI@3siuWw!;M%{dRSWQzZ=BQR7q
z$YDOL2;kA~^AEaB-AgHrFI+&_3jaCQhK^8_<YH<j=371pe^Toit8ZiKH9^&sAIf9}
z@?wrlUSt6buGqYp$u^nQf*r!2^0asBk4;NCM{W<fc{Au3oip|s$S$D*iuA^Hi@(CL
zCMxMFTg2xg9iN<90dd(Kbs`w4G#`FnJgG<(3+^rSXjev=%!=u?Skxgtf0d`=<}fS;
zeFB)X$WMcF%%U*fQ6;ZzctFo&ZRU`0$Yt`j+)n3LP`0X{<lx3^ogJEBtUhSK&8R1h
zU_o~Yrhxiy?qx20R8bn!KG<=72mH)v96cGm4JuS3-8{JHsTA%f_bV?z%)hV@%O#K-
zsQhv47q|Z4$KwqV5HGXq3E8|boh4u`nCHn+d0A=-DU$aJmPTKZbZ*V3$cz(nwyI}W
z>*@o;fQ8F9k7XZ(>FA!acQmSUD^c0^{RV8NKQwY&ji~tL0_>e(S<0aNMzG~)>kh!J
z0bQU#zXeFWSGi(R&D`+V82)hZBxwr#FH5NBJ~RXF2z;x78Cws9>;{=}(4WS%Fc_~P
z{W=(jU`+1IeVW4JNfY0sC5il`|8n)ltV7CYTCHQ|-yv-@y>&p-D<_8i3UX$ZPaVv9
z0)jLzYQEd`lnW^UH&MHx-;zx(>H>+Dlv@N_wT1#fC-uNea$Engy5@xcvlsTRkKn^H
zYb`5e=eZl&AlM{SVxv)SK9qo-4o>@xR_dK)SOr1BU9eKl$t^J{%i%9cpCAXb4BNOr
zktq*XzDkQTc~JfBpf^wyGGwjWQN_;@SLhHaEd)2zf+^c4HQrgwHJQXK<o;FTCqx;-
zwh`jxCN;hfZb*@hcPk!Ti_Mue#AEq?s^>(LR0I7AS+dd&Ri?B@aN?**lFO(y6z;!v
zYkYA8{KNRa!9MrhnxqeR<~n*Oss)osJg6(LL>@GI4{EjnH(fo8#T(?YYf<ARqM<IP
zk9($_I&ome<t^+6J=&XKLa)-GG!Tgwbx<HRH7w9c0l3oaM#fXV_N|iA+P{F)P$O&d
z#+?$QSGmI?iwj92tgTV!z|~8ua8`dpUO6=QR0FoS%cpIg`ywhd{ZWbi@gAhn0ZNNn
zrcrX%aaYdxB35dTu*Ys;>6QUGs4f!wv$8=9QoT_O_zjdWFSY9uh*0HF|8ZCISCDb~
zPq095!Ba{MB9OliGA`}V(Tee<Mb3@f_-Q}?V6=@lrAhD7QwxZ+VXz4AMTr2DODtSH
zjDBE@Y|cQ{L9*neUIA8NRhz(PCS(@bvBiwcsAZv(gL;M@LVpk+*muw+c3rl22)TYo
zPZtw>&gEa0p5h3ycH0^GR52Ez7<<)I5Se=1`7Zu3^Imj1;A{K(<e-LC2PU=Ev}ppE
z;?AHrbcB7?L1%K!#9q9p*L`(Z5RWd$x1*3NWmlouj5eI6^x6?~!;;q%LDG`~N>)fC
zrnEl3H=@dCgq77NQg@m6L{zre4HI#YS|Q$f)t=$OH;Hr}s~`27UNBGIYzkR}6P;H2
zUn-Hs*e^U3A<w5ZP7qk?M!s!g>5)90PRr_rsq~1P0<y(gao7tphbWIy?Z0knHx3l6
z!~$l68tf>(5Uui$Tw^|5KPFJwpeaO`0mZfo%%XWJ9YfDeYPk$B7t|(j8?yhW9n>~^
zy1!LMPKO6oSF(#+-HWkGllC569C8K8d5+n}e)2<g=oXxYZo&OSVWqP+z*H7j{rTDR
zMj?q=LQ1rY!gyJFq}v`Ss*&P_9cCqicuans&53-ITgd|FOin&4KfJ>|xrbgwxaDqC
zX(aW~nzuPD9i8vEO8@H%zlEg>aS>}5n0ALhTuIW_SMbV%l@jqgn8(#sT@LwQt#;bt
zC*3xxqFI@pNgwXa>nJI$NZ-U`8iL_I;RLA|uwHAkQ9V)j#Gk~#d~^=w>OjCxupfvg
z{y^yhk{0@;me+4O%~z&c&s)>}HJ6l$4#}>e$gfC{qp%?GI2PJ^vv<G^t>VWjEc+ZZ
zxLI=!CuG|O=m1H_pH07Wg!QBQ!4c4#NpJlHt0<W6FQdW~M*0dXX=+ye5plpD$><V?
zrhBWPR|4f(z3N#%Q<9FS7`pta?dzI}Jr-rOyy&qwNaoy2kT?|9jswM^?`d@UduO)u
zFqO)jUq@RjbMy-1hgA_h$1Ut2JTnHaqR-lad;9U~F<IVPu06|h@Ps19*(@M8DoxVb
z3K=4P$-yM6E*HXOI#nlFR);LZhy#$F_a6h}MDmf0$<~){&%UCmYW1yd(R|EozgC|h
z8DaA^;0>kRmQc&$vkH$9@Q4=vp;pgpPJZ(eTaGFqmaDDs5Ad{WE`EQFbHC~@`vM66
zV|T*KsJ;DQ$DJ)rv?cx{P4<+oQjKIR7K0keH;4Xpb0iobW3uGBh|&`+dHo`cYlK%L
zA3YQy{ZW7@9!g>td6gIgP#6YkBZo~pnX<6BNG6>GfOzWzOzEN9h-GvqiFyq#UrB#q
ziSNBr?vl|J4>ok=SwfiSm<QKrsZu-oj{UJpMOZrAZk?+~(TzML)sGsLGi6;!Kk^Tb
zQ5=U%FnmVR@kyHiCz+huQbveE>RG~`s{;%)gSyJE9#&rhV%`A#^v8SQqFc`xi_7nb
zP4LQS6^>Svh^}UN?r^S5n@4bJ>0vFI{bbVDNE}1gdk%56=)@?}I0l{#2^kL-kUxH@
z#!wEtRE0DNr$>~W0cW<=AKW_1aHiXIw~|sx7cwX`%WTJ3vRiagBZpSO*wAr^VB3en
zxw3a^?R8^oE$td;%t_XOl8ceL!b%iGhLgLIN*4e}<tADIQZkryVBXc+TM2ch8C?b$
zyIiQR&7n<Qgi4PQogOhN!u3X{dkYz(Peni+OMUWJX!93FZL_hrcmKBV4x%#=9z`Xl
ze@xma_qWVea6~7}5x{vk{*c${Z%x!9=*MzFF_kD(zeU5;_*Y7+(WG%<iXt7qfbLaY
zr>luEo=0Z8ESH+1&T7l4s}V3yAsIt~I{#T^V5G_|Ogz}GrmjSSQb~g~c>6>q{Rt)@
zmrDsicJ#3~*9AMC4oz*y*w3kx{x}UxY^7#tKENtcqn_5;#PIqR49!7`fyxR?|KG~m
z`cGw5QL+HaU*g-n0mmc5?XQXZWm6?v@A~kzL-dp;92;^c?bX_JGdiaskJBUgR)n37
z)?$|rc>jp4x>`AXzx_&2<tRkfIG(L^$)wYNcKiKvdDb87^i(x<!{wqax<U!sgqF<W
z@qU*FMwW=e>Hwuf2Bv?(g?n?Mo`I`n^H1&=RBrR2+`xjd=^^`s1BLmyL##g}-<1B>
zzmciC05+N*u+C0Td_h5U4tA(x9+bwgyaH`{ThcHYqSSYIGz!JhJ5Uanneti7T>5a0
z7)v*u5YF)i8+Ch0e<K@3@KhC@Wk%5%@Nkejlsx?0U#{W-1}nKyJ~7!ul!C^OY@b7g
z!xy{ZU!E+}ncxY1zftaL>P8e1<?LxNMANtq2Ou7h#nodm(KJ;>$e99$xP8aHyaT!{
zpg~1-Cq-^3@tCPB?cTm`ILuH{G8C``(g*92Ia_bt4IxHJNzS9znwh<4Z(1UX5R=N&
z%i*t#rs%4;ZUEzFQ_Y9+n7&z@h5C6i4{MQq3|VHK?_?}x46DUCdhhT>C{N2a0FiM$
zvXo`}_rYq0Ujj9F*7Eg2yo2`fQ^Wm%|Kpv1ebo^NIdP1Su}mtz*urWC8WxsSZ{UAI
z{$-Vk91;h=qh84H{WT+(mM!ly6{U2ngGnaiRXPtwPNrn7s#CTFGvEa*pjzvAvLqDv
z7w0F$l?8~5OCHW!ezBQ<Z{51iX&QLzE}v|NWSfv&KXpz2dFt%Zv|M7iesIW;ZM0o?
z{mN&9&gIqDw4l^{t=$k-^KTfJl0feH?DDQGKIAv@C%~>tS9%d;Sqf%Q=h@LI`^qq+
zbGqnua%I0c`8SX0mh0YlMeqz%(DiYEUcNY`h@1rcVF#u76`r&5jpMCR?wgOueThPg
z*~<_Czf9H#voe18n;y(Dhzg($3{L14tFGdc(T@RDu)}^8A;6QR$AfNh#8bRC>@4XA
z?GVM;o<UZT-eXdNr#L16Lai)Dlh#8{rr-Pc_?M&IvwgtJKj0mSwc^2a&fBq!FoNt-
z++qerP_a^p&fk60A^c<WmymLk+jcTj^vFK&xbkD*)Kx;RIH6=R=hdq1o9Uy4=mc5;
z{m7OPM8U=gtbE3`ip_=-H*K2COW#=W0c?RfOLZ@{h@xV)0T5=P%t+V%hx?ZEoPEM{
z;jI}rZ#J^gML;4)cei~FS;zFjr@-RHXVv3y3Zxr7KImL3el-m^?6nu$p4BsZbgiJ$
zs`JTBgDjZrMUIVv#Ekx)PqphSnFEL0xZiQOOe87`keVS<srT7(_Uk>eJJ?1+(WZX^
z!T3VYI*b3f1}NbR!hhu2%ZG}L({C_q`ELO4M5X^eiM9+gUF>CT=_0W{-9j5wa)b$g
z06`(i&nYsZcn&b@>ETwi1<1`wNm=zDY)~H+#t7SK1yAC_mcO<Z{8+e7eZ>u=WyZ0T
zLVMmAOWmW}|GA~K<s`nAlIL#SFCUnc6eP}gQ~m#2QxSLQhu%su_cy&j^R)p+o;W9^
z5*N#OX+H$)e~i9Z)N+P_UfrrLzjDTyC}Hif?<DI|Lmi&_=_mM-qx3hnQ!q}Z`YG&~
z6mnLDX~bQ(QQ7t9ObOL-oYCg0!j&%k+9hK`4BQ2Wf*RxL{HIo4N+qd3mB(w9$Gbl7
z0VUHbj$i%V7=%$}_m;f3%d0>29YOw%cRT>=OZH+ULYv99>2rY7S8o!PWlgVjVM3Y+
z3IXP0#1rCz0+qjhz(AX61YRq!EU805R=kZ*9bKP~aGe0zDFW(5e5KKwjA;cb83h^T
zTK<rgF2fLlC#~BTXmb?p%wr8O<;EVv)`Dw!;%?V0il{O$+5^i15y?b9Ck~dR7@uz5
zCOsoP>2K^64RrB2#;x8~-((Gf=D^3y;F$wv1$V!F0+*L%4^S&Qv-r6Hu-PM_2;Mwi
z3Fxg%{%|}RKRQ2U)fs1jIitQr4+0X>J2Lm+P(t%uzvF`#`zlHs3cydF997$VC6Cq{
zmmz|WZYlb+?4uoI_SBC6&a&1lJ&+0i?@O?uQX=^#GZTvsHCGy(DL7@R>AG(?(~Iti
z!s*^}Ft^>*ESyz{^!#uXu4+~F3$Xl2T3;><5Sh!fM=+|v%-v!MoON2Cn_Viyn!~-U
zU0MuM&T~kRkfSPK<jLnPD5c-1xF)q@gUL;m*|yqGm-6~@+JFDjsGh5d7Qx~&NVqvr
zu_J(Y*f5!9b<Z`swBovn+DgnLm#Ck#=V@0hl=yPv&EUM`h;VJvCkEltBI^Fb+3_j+
z@-QUd3$IC56DC{LDH!kb_z-2b<mVI6x}a-x<uxU`>nvfGr|TtgmNDfyqp4NRtI_U7
z0f?qpjJt}zP%VE5kl9@^Fu@hb<T8~tgM;U@j5-Bujl?A*(p)AC^lHX$AXJ5Z<gQsM
zA-|E?2M*D|6y_{fjWN1Da3US?XQQXUQWYuucH)_rx(|4X5?UF>0~_djKe+f*Ipi{7
zVOqkKk}-z_!qTB7CBqOvV|D0M6(k_`a@=p4N6{TboKG3MKOD^g^-`fSrp=e}=IG9m
z52-)tBE#fA5^1kl1Cg&omkfO6uBaQ9c!?0`$+LlvM_dbvwz}kS(sti;LWRTQ?6<?*
zHM8|BBALK}v5b&#55Qi2(qGj-%JTa$`!|@MdZz=|55otfyXZ{)4#IQ0j*BwmfHKJ)
zpsw8^&eJhM577Ba|0Um3ewsNz*rBuej#UXUv6g#L7|E>Nd@Ufel>XpjCis$E5?)HR
zBUrd6N#-+j9fGJhLkd?Lb@XlWe|`ea_;cVd?rT~BkbyxOfDH11eD$8tnPMd`)&aoy
z1i=c8Z-$81D7F`D^Ce=Eb#)YYCwxTlOeU^=J^~}lOXBC5>mq%+ArS1<@bJao)^DI?
z2lo^D!9pKV`*`vN*hxo5)n60orz4p!KA$ficfY!Z{(ns1s4qlJT5ac&--_T{=ZI_D
z>32M$iLuMl>!I0g#06;AXW)*k(DY}aCmlz1W(#1`7WVJl8rX!$y_5#zNKT~mUd)}R
zQ~2u*iL6D`V;oiJU1=Rzf>A`PC)jJgtOA!$V{vO3&;p<3ck38ICAQGudO>nsV&Ao7
zml%fh*6Sc{pw<aIRP}P|p!0ug><2)ZNO6asx_3NF@3*40bp%|XsJGNAMN&7FoXZu*
zU4vx^>qXjk0am4Ag<<ujuCya4J98akk*hSk7yk=<J>x-vfdHu9I3ZWkNe3_liGSEv
zZ(G@5$=Cy5omxS#s1+Qv#nEDeSE&}!NWy%+dmIjZ)8EO0egWRJ2AQm1Blvj)SMXyB
zk}fyJS5wu2A2R0Ak)ENRv<d-vKT$O4i$dA&;Hkt#_63nt)W<}VYPx4-r`GSaVw1^5
zJ{URvR*ZG?nyW&ch|}jR;t23soX!f6fi1FFcRB6oam1C|qqqAStlesl7`#Qlzd?I8
z|8$Z;&b#b))OYcSZnGVPAxK8|;XrAc+|JFW5X}A{h(=9RDAINT_|7BI&*~ybEKRD~
zw)7*M0Z>&XGX4>;!gciqfp(L^ivDCPps2V6ttf`BQ3y8tx%2Z|H2O1`L;B~D4(Ch2
zL(Nbn#E}3tK$Z-+_CF%XJp^vqE{;pe9+2P8hV6i^eXPuhv}J~3fAYhXb?^=d9uKRf
z{OyPE;zq&<h%&6Q6HgnKbR{y)@<V}Pu|D5rD?4;!VcA3^*ZqH8Sfkn7@2@Ycf~36W
zrK5@&sAmxWk@M326i|=5bv<L-D}dL=UtpFffSW-~^J+1ErC_O~h&tZh6`)n>EmkHG
zTuV@jpn7GoA7pxAW!=o`JH<Eo0W!TP4*wa5aZBbCV>Omcp-zb3oz%n;!5Q#=QL)2(
zDd?t7IEGrppHSAh?+v6D*@P8^$+QAwmRak?6d=w_?~f!FodMQPu(qDOaKZM{)vr&}
zkADW*(%FL#`TU;CPF1gL;sKPM7G|~~#~}|s6G)z6xy<yueHPv^d;*x~Q9*EEN)7M4
z51P1Vn%M}0j(=5Yt-F@XSHK?qSpY7?Wl)O<^~AXMAogLfL+%gI?@}SL*H|4!*kQWC
znBc%81kxtD^(LgByi+J_!NtZv$jYXM>MX2Ano;h@_+MDi<EA2qwt;X+#~;vX9J^Ti
zZx4I|Du-q`A>utpkJKrmK|ilk{Unjp$gC<l>*39`@6}+AEfv%E-Uccz^ZS5`Di9DV
zec}RQleELb!W<5zbh6xurRSi&!)zMlvB{BnWTyzsEkLb4lk#+^4#mv_fY*^(5y=hF
zM}tu<AK6dqs>JKqgh{XiMNTLN_SsqH$KNWA)|M6#a-8ov*;{x*w+)m56_mGmw#SP#
z8F2d_Riye1!@2t3p^Bu$0^H;X<eGY!a450!`%1BMnOrH8vYkO{BL2L-&cp-xI^7WX
zSCHC5{RI-Oj3{Deql`8_lQu^<G?onLrhx12kpVxS7*)pVLdn!$*T>`H@3+mQ(CfNg
zyE938WE3i{Z@jz~=F6V*W!Gw^?GS~!u2Z8;2tY;UzSR4FTzVzLKN_LuG(H>rM+n$r
zO3IsCIxL$p<)y@6me1)BOz#FBIaX#AHt%$mR|gXW7ivLGmRNo&1`HAIRilx$?R50C
z+fpffllh<y8I@FQ_jy1W@-=}n1W;*1!(N6x5x-GPQi&*T+_u-`wYQHU7!Dnz#?fg5
zG1OO16tSgMb^?enZ3=Vzymtg`6vuraJ+CuBroUC$e8)_J<pG{CC$I8ESUOjgJUZK2
zFK`Vgwc$m75#fe35n@W@c%ILYaPC6FbZkj`P#)U#<eXF`^ey1Ox}h?Jj=nxx%cC0-
zN)8%LsD%7%y8K76mA{rXtb|t`tO;MyaxDbnim=2l0;~Demcq7PQ=-X1OOBtB3)o&+
zEt=t@UkLhW=C&G$RE0h$w25|U@rse$3_>*n-i~yo{%MJkK`0(N-}qT>rXi-JX*RGR
zRYy*U8>dYN-!7&z%09OLbz8yfE4_tA%W;PM=S(odT_WG|n<Q!Kjf;W}4$PQ*p9c#N
z*Csjz%mKBK6J-Eq%^yb6GM=!%Vf7f!TlM@<R^`hz!evvKrt2_F+MKg4qTyLg&jBgu
z8xx>t5fw=Ufm~$D-s@jGGbrv&v(Y>SoB*z16M!(p2e9}D2Fu;$Hc|iNniWw^tGA^V
z^Rx$@RkMe9sA-j}3Rhk9Wu^U-q_us(%zMck=ng<NQrmv^wy}nKRkveij)hGTFK435
zE1=PedpMu>oK>l3Tp68eYZQ#01)AyZ7t>VN+s-ykqhrLTN}VLm{&3Dl10SzC(z^L8
z%qFkZ;?n6I3@qJO?INyk$xsSnPP;7EPVn-=>WcdWhVqu+<&R1cYOSRaj#x85#G3T}
zkB1lN>VAQ7&ctE|lae*!H8}Dejg*mVJfF-4){x|uJT^on1=J-xwNNd3TyniS+v>B6
zK)2CIaYYecPRFZ9KH6*Jf<Q7jW8XdutKp?mm+MiU^=R_=2a{V|AZ2Av`Ws)5qE(cX
z@>Y)Sy2`$nue*r(?tBWQTDJPqW%-3?Z}l8pQ$A<EWhMyhiQ9lKG3q8IrzjA+lpnjG
z*lLPdzk+oP^??#MX!U<se95>Nt@HnTg_7~=j_XCGR5X$D%jB{JPl&BRmcntaFj9Ua
z^AG6qM{6L)ZLtrJ)Xv0fEonUV8r3h={fui#svDZgXQgP{z<|fLW(h`m)w?Sw!Ex3S
zdRP9cJboZBlm89&OboDJ4fHy+fvoC8y`}Lxha{BY#cnlP%V>Du$~Iy62AIX0=uszu
z^x9w&tdMW%BMQ~jGom2Cls<tpPwcbcB$OaWNwBi(=K=e;@av<)sMTb*usjC5S*J#-
z;YU~<02O5CFzDr_6(OP39D$qD+`#rgnA&=OEw%5q04_<YjP;GGc)!y?AWL77!5|H0
z=;T(sYXG#yZ~O50S&DoE6s+df&39;Bvj9_J%FW`TeUC>aDilCe$3HAH#$f^N-#?J3
z1ikgk6<P5DI{GS`uYf>x1(}%W-mAK43JljAgL+$c5Df%!7{S3>l!bJ<1$yZ^-4XP1
zeRS;0@;YPU!!k28cy7gVB{Ei~*te`lh3<Hvn?2|<V8d>D_Pl-<+OC$N>57iQotJLu
zfd?No{l3VBZ&_bw|Hft-;{7(Hx62^)<Jr~3@2QKF*X*6he{Lgpsa$vwerWN!#X$CQ
z=rC*R`<=^NxfrTAcQn-Dbwm-tIV)NM!?JyfmxeyP9k81Mi^8s;ULbwt57+fN-&w7;
z%xwhctqc%p%Nw}M)OzWiQ%;H0L<Vj(f)>Hj`ce%Ru+}nA{Q^ya_jzQ()=P?aXP#es
z(}W^j%qZRilRGm}5KNn<@KdW@?<hH6r6}F6=vHq*TS55JNpsnn9bKVfA&>C6sFD$1
z9G>4%e^G|9(K)2tR!Y1ixWzR~sE9qqv1w(av^C6q6K~2l0gM`l-+>&(o5EcGucxp3
z`Gs2c$&CB{z-&NKSg>8%@H4bhQMr3>c&Z_HAq<;PBJ5a&NusrG;h--B{czmL2zl+Z
zyX=nDuR*lS1sF<MJ3|@7OmE3HY&f}QXZC>fT2Ak<R_0P|bI*xet!%d_(iq-#UP4<z
zV<WShqg0^?#N(<j805bZTlufGKF(jK2{B2c^ug|d?t!UUx9c!>z`N=Mc(B`0HRVHl
zJuc-vC`l-Rlb`FqF+!AOnOtIl=w++1xY2w0PKP9Uayx`<9lii7qYcwh9+UM7uzW+`
z)a?n6+2@OJQ}Agn`Q7BYX&&?qq|r_=5M?`vz%pbWr0VO7g4nDK%Y08Ke&Nw^2LG4a
z-L6g`#Roru#dhs}*8+e85pmYBr3gvWm9DVjvm3$>mhLVG3!o7_Q5badj_t1HW|8V)
z_=;LGEsx{rJ<XA>xCE@KPJxh%)$r~PA&=E4L4g&JL-cXAWz7#b1<DxE{D|4BI(s_x
zRyXV$1+jJ;7x2>ipc;0ra*h_A*8s*W`X;k^j61q(Ss<{(V(g80E5HGN)5w~mp|@4S
zS9{Ke3uTNjq+=WWD6e2m)X_4`jjKFwC*WRzLqJYRvMzSgs;KkK#L;|{Jgk9*JWn&l
z8+|~zgikh0=JM9E@fzZ$YF%^c);Z{C%I_v`Q_kXt=TuBn#LN1~=KhN_vX}pYdKMo@
z;;9%?@oB-`KqL02Al#W~nWsQ`_NC=)Vd$-fcy;ARyWnC~Y~HlCS<^n=FA)&k|J`SG
zIdqi8WESy_3rbVUD}M`H<j9aTGLKK>zR;FVE6iv8J9uvPNS(-+a681AGwo{UnMCae
z@@KQTR^<tfx|5mtC8RTsM~BBx0O^H<YNfdexDckDNL8T@7n+T0Xl>Sb*(MhejcTWO
zq($pMH^j7X&rUv<o&J^AY!KUK2wk-6D@~J+LPv%JEGC*>N3k?V<BUYYM}05jRj-eQ
zvSJ<oMbovFNg-#kcYDyojV4H-rPrg2oDk}&y*fDGId1&W0tT_gl)BsMM?eZ_`w(j+
z_dx|@3W&FDD}sxzjQ9lg5dLE-g0P-DgnF3~H5(!Hy{i<Y9BXeWkTJ+%$Ofk!Bph9U
z@U1#HI?H866R_Bx5sy~FxPy4L)TV+o4@snuU1w3)VI#itm>4sfPQ`^LBHsVt?$}|q
zOYrTovC!)8RH#5eEFKTJ2geOEfU7?Y^rXCR?Tf#;rJoW%_BK<OBl+lNKuB@jQ{laq
zAsVwHCUTEyGfe8qhWL4)gIY>t_Cb5u<u*?sM=?UI-Sq;@>rvgeu}_5heZa4(#864o
z#?d89IfEPmZq^TxXiP0fO%Q*=d^zmr3;+P7wiRt`p0d6rbEa5$X0{o=zYd;3)rj1K
zCuOqVfN(+Ozz{@rMJ+kZ_a(<FXdB))a#jCG-?bVYD`zMZ$2<gXaVDRq(cLSGr6RSJ
z=42ycTS$;RN~SdF2bTTm=gi|W_SNz(6=Q*-1-_DGd<Dz0?SW4tex>!_sV)%qs=>m-
z;5(qaoB|AtMZ}v=V2{e|7_FeBx$a@G%N0$*EZW5$y2ym<o%29^kLt43)&(Du7afEt
z1bpUBHZgn%-<RxCvO9wHF3`7u#*J26;9l~SzFm32g;dVOg7U}k2c(T_KBmtEA^`s2
zRw75U-#<P2Xp5OC!pUB+tSmt7o)Lp%4Oy^MYgbPV;KEJy(HUxZJv%i7LMFQE0FG>F
zik^=2i>wX%<2TW&+Q+OW!!rrT!m;H@ZX+{VL1fx5R&&D&OX4x*rb^A6QO9#VjYg77
z1NBv-loN>|kCKl2<R)5^IKz&nkI>IYI0hM+6b?yXKNM_wK+|rPSf+5PIS;6cmS3y4
z_Uc`w#!mq60h|Y`Z+iW^Dg+M3*?zr%m$OPMKBXWSG+#y?o}aQ0d5z^IDd55{Gm)?D
z?Yo6^U9C`@&ok6WF4el!+CJq2&ch2Yu8%${YhR@TzG|i@qrTFAbQE!e1m7c^6O#w)
z*KQx#^?A6LgtoZ@Z3>fSh{>F(q-&)&Z@GVq`1YB=r1e}Yx1CKc6X~&}qE;N%+7}`Y
zdo#Ebux>y2bG$kB8%&fZ9Uq+}=hgKXWB&y+?NX#3vN=EO=uD?ke$*=*tA=uo&#rp&
zFPQ0_YVthrxBPI7N2okY5UgY5mc+*~`nkhA6YYS1&y!NOBlWS3215}x2aj%aClm*M
z1+l>PeBL-AM1#XdfQfho0Y)kgrO0Ex@6nb&+PO^+=(xnX9Jbz+wv1^;QZuAfQ?_AF
z<O)Um`v9pS{fgP)EtHY6afH`MRVem=EW`ofFbiIhYW%-4nHc`Ako+f;iIp1)O$rqi
z$$OLdvNMMl>-Lp-+Xj_o4iwUZsZJW?LdW&q&@_s8iFcM4M43qz@X+GZiR&_vu6`DC
zr-oLaB6<oZXng1^2|%J$m72yR$bnpLAm`2WiMd@2DfjQk$tTh3{vjE=bx@l`DL@u_
zmb8C>vx4QV+Zwzki|>a>kb`oc-Z)Y^XHoSJLhq04f(Vno9~!Mf_8aZ)Kyj1FDJNHv
zb4}eXF|f(&_{OjG3k~C5pR$lzKK1FKZ1W$`t@aWQ4==WY5CAw*ZqdRt-Et=FXIS$d
zn4{x_VB82+R<7v0)8V(Sf21f(Dn-0~fPB<;^yY`5z~8LY%XdqE=_xQLT6eXMYbf!r
z@kd!InyuN5SZVfpqc6}Fw^?4|SX2YMHUqAJuR{pgiE@Kap=Agv5Vlg?`5VK{DDf`<
zZ{k|J#XoX@(ArtzHo!*t5UekZ@5)`pEtNhjHkxUZL)W|hOjh_?!@3BNQx@cOC+Uss
zM^NoImHhQ;*X$tko}~1cCm8uSY-~EleeU|OUH!pWDZBCtimmDE>S)yKp>s37O|>0r
zIQYXwF$bUap-cQ;^gf?sLd50+G`H55Mx-|5GJ>wc)^`job+j^4K0)KhK*O+0maA0X
zSKtq6cm?@GmdW((R!3P+6!=YfN!g$rh(JE|m~A4CFDEC?!V-98jAr^ws0b|=o22>j
zjE?$JNd+&B3n7IBTivh5e=p6a>z5{d>sksNCYlJ25-;xcQL?l4tzY<44cs9Ehy#&q
z6h<#Cep(V@hCV?(B^3sSHBu`&nK0#Wa-tL(=K$S9pmWzCUM5MfqKS@MYG5aAmK+YW
zqTQj2y@O{i#39?ENW*cT)^XyQ@EJ&y`g)@s;fjgLZUqv;JYSByyXZDD^CeDz3vChZ
zfxY0VnXr=agOpBsBaT>eHD$R1(%@kE#M_cjlVwiI*fjB9Lr%p!IZc08qEWJGc?8`o
zI2>Q!)MBx#9d=YIx>Lk70S-v;i3{l1uK*+^tuEZWBCoacJ$5b7>M4a%R7<A&tj!ff
zL*@p=HkB(tlzT9VjnAQlD`&ByivniOyc2f|GTV@kws`uayu#>8M7vti2%aXYPdVEe
z`mFo`Qh4E7ij2HB^bWCjW@$Xd3!l|{)$Dn`l&ym2gNnNMfU!GlX;RlB3L(ZPmQ0$g
zBdHpaWIA&zIkeCdj}EKv51k%m?<LsNKdIF%CC6JqpCRco86SW;_osy0n3hsA&NkZH
z%~fGqJD8~FA&)tesTZW~Km8kgB{c<x8s~pQO<<1C#m%xuTOz1Cc?N7xCP;Rl&lfyc
za8<svvhf&^kUZ4`RuOfx6!wH7Al*uePbS@m#vt>du13n-O%mf{+}>alz}>Ez{0Or#
zPe4022&dl-U(I#nm<+cO1F%G#IMwER-`gY94h1a)H-JiVFV$zvJpEAYm<Di(VtZ$}
zGPH~2SlAPq!uM~WJFpQo<*J%W;Rq<FZQT&D3g@Lbey$i(F?<^+`lp9$)}p9}4S0Di
zws?NM$yVI_9$t$$yIsim{SVQ7te;P2C3JtsjQPuuDgPnn<yZhnSbl<QIe40)!P7J|
zbM@`Sb4uoN=ueh8!L1A`#HOyjl2c3-ru>4!q_@gI-)*K`<%$7AWrOwX6DctWQ}UBf
ztj}-0Ure66I5%kpThcIc?W6<qd_%*_qr+cMV&}m7WC3Fa{=PMSEGedK*1)1h=*!c|
zN_$ZY$Jd7_Bms@#k0`=VBTNmGcna<dcBH;4f{sM~R*98iK0h-;&}}|)ZT4lz$!7iD
z9tSvju4Zoedas+oiijAwgTllg#&JcRe=@l*z)!-4RP5iWiqJr=H*g<af@8H;)k_t8
zFK-mXLbrj)XkLBY=D@Vt$erei8FL*Q2dP9=>?QC&etf(0SwXmbEy!sJM*qz4sIA2H
zCoa6Bn^KSLKgm~ubY*?-N0@=qo>;JgX5sB{esj@$u_m)Wm`(+lm_uy>B3Ue~&CjaA
z;2-zX*#|yE!#hLwB-CrPv6q3TjPUJy!t3CxW!=v`RgMa{mZrRhi?4Ov&>G3me*zbB
zeun1vWA831vRYO#PKMmi-Zo%kyVK|~6EIsDR?&p=AS~^@i8-+<p?{eLPt*AT@Cgbi
z+cUX3;yZb}5BCd(9vrX3oynWPL--@CLck0z&C4OXy@C@UD4<kS_F>a<7ECM1f78m&
zutbCv`q*g!?k*Wt@bvFDILsRnW^c*J1%F<eA$Dg$VON>SeyRw+5}0?A+T9WR`58@|
zw7vW1p)XkdcYGYQ>5Onk{XN0D#Lftf4;?)klJJ-RIz<~(Jc_xw_w~_`a-HkFQ5Gy0
zA+EWCKLEufC&eB)opGw~FMw?kl;un5By&oIpO8!*SJ|N9TF{>3kTX5izW{48dtw!H
zilR<nK~Nr(K+JO4z<x|`?~bO<R{94xLv-Ru@R8{yG0kdD*q|xcWc*?+X$VhNPhx5<
zHGt&EWJx+BQ+z$mTwCp%9^p}-K@OYK#Z>w+{W(p*cu?P%i-&fmpT$MdV7>pGb~{Am
zMEcl5O2QS)A1}zO!@W}W0RT$MZ_WCD*n8`sEZb;ZoDx9^0j0Z@?vNBIk(34z1VmCn
zP(VPCQd+vDML^=EyOb_TN$KuT0ny)j_`bc*p7Yyt{@8Q=JTvb&e%}oEyw82#>t5?x
z*Sf9+A1gikRO`mf$dU5CyZpnd=joN!+IV%1ajB*!N1kKi+D$ttZLv5vk|DjNAq&+@
zj@842^5ZVsrK`5$dx<C4^F34-dsJSRX~qpM_HvkO{dPg-Je6<sj-K_N@89U;(2A_C
zGvfW#yeBszbKiPYQFAazR%Ns^<Q#<qQ7cYm^zT&M@t?bBJmeb1`M4OenA;cp?(!6O
zEMFk?uLGl!smo!jM;Mpic2U=Xy3h=$rV{e#`~AS!_alpsIKtQu8hkQsLK-SBQ+9;G
zpHEhNSl>kKPZn{l&U<(Ef}h_mPjT4F1uQupQSOP$Z<woRTdm0TsgGVS;I}&AbE>+d
zrwi*PyIlSa^*kb8kGn^pe>el2nB@zX$4q1f_Pm7(b6e3JKR6haaz8N@`gWPKTxcG@
zpxe#If4Hr*H_2Oj^#Z9&y$t%DkmsP}bD$7Ly>`JO^)^8GQdqz|y?AbmB_oB$bcr+0
zy_r$b$dk;+MVs)|<2YYjN*;1vcXXfpkM`S>l||(ZeU|P9rx<bktRu5cH@wL<aqL`i
z3wqp|-yMXmh<~rLd!g!hDa;G!=$0|&U?!P<{~^ZZFD9m+`Y&@zziiH-8DeMp<IBWV
z=S{!H5bDjjaUu3^-E8jiE@4eBmx$y1?Hy?69%3-w$*sjE#j0=8a{aa~yK?D`S4E^v
z(8}w}+`DOkSj>_fu9}Mg-w$@ZbYb9dzPVaE@X0aU{i^=!gV&+FCZ?Vh@BD!s;_l<`
z&O^^+VB1ag&UPw|OW~y1B3Q(-D_UdJ)K}?SKbG#R`lkIyxm0F%O<OOJyqN)c-c~-U
z5zj;0Uv2J(t3)Q4`!Rd2Ot$Ycy6z#CZ5c0I)}a@bsb$-1`|jxb;Z0A7IV~l85el!u
zD;U1<QuiHTQ7zYbKi<x|67>1AGBzhm3$ncp@**#%a0DCY@yd4_l1*RvR@RlA4VyZT
z?69xA&lsXIIjF7+efa~b>!F@&QRdDmB1!hQbdFkYtl1WJi&R&PpN%}akK#x$vHPby
z;26^Vu>|EoLTYbCR^A!$`lFZ=R;uqo8zowr3lRm#zU{Ro`e`}DXP%McHa+)`B}{Y>
zTC~4uWj*2?ra=(l2w>cmNRQwvoT4pLH$g_{UM6-kOY!fd^>9fGMfzfib$kl`EF$!d
zMQBEy{k7V;JKGpPD(z**U__iDe>t*n^W_heKkCtSG6pgh$DQ{$<E12wsH}qVAUgx6
zwMRvp3<llAk&->Hq@L{@i<f#?iIx75S~)s7dvtT-G&y1A7(~g%%FVYU&~UTl=r>jz
z#6Ou9GRt7V$NEZ|S1h*9@|rvvUH_c9u}76<VZrP*{}p~_nKNFwZ=69`O5Rv^6ueK&
zI>kdqK5?S2+s157U{CUP#bHk#*}3}TXb9`%3XDhVW3hMt2@VZNED0bad54A@A=7}h
z+?!<Omgj3_;0Nq5+@TmZn;1&br)h{27v@3WSOucu!Ow^v(h*#O6R(nLXwp8*N7(G#
z%H3n>Zoc&8Hay^0T#K`*P!qWvdURs=bR?o3l@`1$l^|v(MPCp6vQ9V}fIMN43_Kx`
zyN?UKPa}@TgVW#(Kf6@D_p_(Y+9#sC?|7q>vzyNXZhNCPi)M1tmmhFeDI#A#n{gLn
zbue@vO@2dLesn*5H}5UW{16U^4}4hSLZFaKJziiJh6)h^uF20P*E;f0w7M1NwL$s2
zDdHn{zQKj)^XGw?|FsOu&)?uTzQwUPo>JA;WMw^nUZoUx-eICrG-CD(@Vwcpth$lN
z^YSym>m}*o^uuB#Noydbpdh&#g0`g6EbceLfR2yFo+Kz^L7L4dWAJE)o6=^&ZTHRj
zI>^i1kF5jWzj+`Mkn|>rsAuCpZTEs+^5{`Pbq8bc8^FJDs|rm(16J#!id@&#sneqk
zHixP??ELZ7?;zeGTLzlI3}&WA%4xh<D35KJ*e$@pg^dy69g21&Kt(_sA>+#?b5`6;
zh>mgo%4N?YeBu47dY>4UoCcO3u*n?H_Xp@HrES7fcFp(}ywb;rwsg=E9Cj9%qd?Y(
z{hAL<LcBo)XY&rAW5C9$p312U_Nl`YXuh(XrGG$U=0a=<=!w1op98r9kSg}sbLERi
z3o$PO6$lQk?pUrbV4-yzZr;}<dpBS!<zb<`wsR)PAE_a$#(X6K-fBljyf@Yjby)YM
z+IW0sc-=lS7{i2^d%KLdS6`zYmEUs4<RE$nZ}qlmh#Ce9lgzj_ioo2(oG6X+nR#Y<
zP7-cE^2KG=aFW4%VIH{CrR&or=8Ag*a)fW8NXs4#0}cEjkSclu9a6U9khV~&VCb23
z7z!h(D`7}?@N<l(=%AJSiVvJQHZVe-vfYiRhx9y<`v&Siv;gp5-lm1)uy_kOc-)~D
z>Btw5!4Sq6?za<lg}=|z%bX3M`voHZe*g_fL)s24rH55F2)@A`7prV4xnr%hZOa9v
zCIxR)XMpd;Yp^Spzb6O|A6m6?AU~vW0|PXJ%F7pjwfJ9_FMZVe8K5v8z<wibsGwuR
z<p>JXZ=gL93==>M#RZ5;z<hBl0SQoG8Xiwpd@6SqiBtHgP+{7P@ikwM2N7M-Cn6AA
zyu#<SsD$3ChYfFb{z}I}wNdhDDeL)T7Q<uO>Yw$FM#>n&J70)27e8NlI@se&8v>*8
zSa2RG+hxDvYBXG}57d_iIc+$D()X6*dC<F1rhf#7@s?Zj|9yHGMkn$-IV6HdCk~|)
zB7U~qL!_D{tXhu`>NfT9K#_F?2G^%X#E04;0T6@SCaoEWl*0H|Xv*AwZgYXoGe@GJ
zHDdrF9rx27<dxjTaFcuytn6FPi0q4X;xsSa=?2SgB^eQT!kV}I(&vxMiiD6&ve6){
zmMd@y1Be&E@NA!jXP+|;YoA4CJeucKY+)Rlr2(%xr49DMoX+`A(fA-1!gv(?w|@hy
z5c}={E&eay=wA2(=AoDS8;=iGj7Drm@?yxPz3MEr6BQ+c4VOXnx4?1<I3`XdkhzeR
zCl-+5Ml}7!xjI+f-S<yuQ;LI4?R?Dtf;g8Fo=ay#vmy{V^ix>5bTtXPc(~DTVN38I
z>9*!^EUC1vKdFet(#D8Zy@9_SmjKWBbmyyvKs;elB<$(`*+<3>LvT1GGz?eS8~KO-
zCm;HFG<+f7<6Stk|FdU6!~M)EBiH+FH9q2h^Z@6N{Tg@R|GkQTmhb<)ivQfk|JPmx
zw_6Jw@?b<;+YSoo44r)4P5}!7B$}On{F#a&mh!#)VYh)elV3sRBj?sTF2w{kL4^JS
zN+4fAJB<mkP}<i{7Ggmsegl~a6EU{}Bn|Am=u-Wcro;*oN#TkpH??3*#Mw>A$7L>M
zIL|2l2^RnU=@X5kJ*aU2QVb+d8jc^?Ss)gokH2QfZyw6xLh$rFzsqn*Sl_(*d-@$C
z$_=_8NvqSfFEsc~IMC1!ubtRWlv&S1p-Cq2sOJjw>aUUW0CoxD_?4-mFfH;KJX0c#
z>>FWfhz~rH^HT+^`mQ4J8F8F=Jd_iv51h>}K$YbP6P?HT3eH<o>#I7&4i$iueX_i=
zq@x@E43VGI2hWYqK^%qbNSH=kg?T&4A-bidVVyvN0ye((BM#8?B?8AaR~sRJf_<or
zgP`=%y_+gwPzU+q!<jm_iv8Vri*d`i@{}PrQ}Te3Hn{e5kddcRItz?cOZ&-+Yg-fL
zB)~?z3OQ2wVq70;q|P+@lGu2GfdCSBFH0C@1{jn+dYdZwG6*I|`|pT@W#?CrVaOfN
zqNStzjz=x3Q3u45*wkV$G7Y?e5H7DE?=iRP&EZ@iT@aN+l`Jxl^AM&+<{{`4ri^kh
zwsnDYJAI$jsa*;DZ1DAaIj-_5TT{>!_yUODN1?ySl?y3ZtWvZUMY{u$%loXx&iUtz
zsg4M1Y;n<ThEUV89SSl#3OfWjn+L4;?UXJnz0VDz0k<7e9qzT&qJqP@-2PHg`=Rj_
z$1cJo)<Un<9_dd%Vy*w+G+syrEqhyTf&<6+gEP4NKYbUD{|<B4^|xVq>UO3=X!0*c
zI+5FFb&uVdT{?DKh1Uh*#4TJaLJS-*tULRPwVl`R8+6G$ZB4eGIe2>{8ke1FvNe!R
z=f0FOTFu#>rbiXTtEhOqHX<OQXMtheB|E)yFf^<GNDQ6UGU}RJH!g2x0osLtK_Xr{
z-I&W@h{xX(_U0_`u%-pLO*SDE0&TpZ40uEOeWhwS={be-@#=T5?wV6&f`~%u*$TBS
z((X5-Y|GLn*|CFmmZCX~{03P6x>p&NlO9$Aj7+NK#fle?DBi33a&2F?YWyrIj2{fY
zZ%7}2Nc^EIV^!e)7Ychv)cg)-7?u(}w-3;D`+rD$bEw^#e{?N=J2PC0UrlW3YOCO#
zvY0@taO+?8@ofQZApBtyuaF#I9Zwps7a8oDbBn+q2!d^XZD0hPtNQ2+s)IJD4jeXN
zn*~@OTII{Z^l2!xI7fa#XYiItzXyfwf;D9v<??Nr)k6b$LADb7A%U6^lY<5P1?UG{
z))AcNf}t{DHM0|Z$EG2Vbjm#HMkVm%ODln9>1dY-KJ{5fj?*9Doae^SR7{)A&zXc!
z=J7rc&OK#5Qzgx5te;0bfHVWW-;JGJ(R&^rFjs#10XP|N-(P&^!-tN0)z7={Wu=mn
zvd9eQ;apXJX|Daq_=;wC7_l_$5l*I1WRG<G-u)&D^H+F7Xr-(_>nx=Egr3YyRc+U7
zB;zpAh-m-2HBMTEw~?*kSrMY?g<;*%$FA+XcHf}8Nn(X0bC*j+vVI~<Mf$MoX6Q46
zaM|$y#=ftbUR^VD6?j;K(Z1Go{bRjlJx&;$UCbQ&ktDOX4bU&)S+dc0&7c*Xe1~eU
z4Ja-z%prLeF|}9{dHW$%q`pu;;KK5l!>HT<$M@WoyWt7xT{-EGv{B<<+L^bIE^Qv&
z$X;0we>b_h<dHV(wJ(dt`b=8oVZ8fI^^tl?QCuM!>Jodm%|YN+!1P;Yh0&N7jMCr_
zT{bZJrOyrNJq`vO!s-&R$Qw^ZufZ2m4S%NqgIOUkuhOGSkSdfDXxVz`^*EkZP;OY*
zAR3b7X77@)lMo{~iJ`D>Cdk3jh0kV~9T^Q9-Gc#7%ixO(Em?Hr@wBv_(n^{eWuO#F
z9xk!3WNN<m?lQP>iw@<xnAQ~V{DG!JTLgog&5>ZeE>%u@_rM6buwDEoI&HP1AL&JH
z_&HWD%z-ZPJSL?)omJ{#-dJDmn5ueW!0{JrW<ec_TKQqm`QNO;6DuZrX1uh*i!Rd4
zF*Llt+S}1lXE|h=3!f@yE=}6CG5HLVC@suz1sM-ci&<~9D!;cfn@m!8AINp{PF)r_
zdvW{|DCnwWrDIS8Mnfu%M@h?2Lka*gK(PSY&cbPbKRWLEaG6Ye#>Ll>=1HVgrWt&7
z$m+SQ6?kaX&9TH55xW_3OCfG1CL6Ekr4%3MchvAuzGTgzTv6SSc-#`X_N2zJn0S|Z
zd0f>4ZHN)gg5Os*<_#c5U?VZ26Sp`6i4ixh<YuMkOz`C-d5wKe7551|gZe6K-v6`n
zk?pKX5->ET!K{yjv&f?l<#<<4wY)v3^a*#S1;vj0kwN^k-MrX}6?t;Mf{F>73gtCk
zmncV5tY<)dwjhwSt@wrU#kzon!qk>K#uBK@Vgc12S>^s_L!dHm)3n;Qc1=w+@C?!T
zYw9LIs+xyHO;}yrwVU(qQtSM~p9w!e$Q->_v9LhsI@HHc4ZbK96&Wc5a&;|mlx^+m
zk47tgaT!$z(%;L#ekuwRy>@PM<2dF6NU6);wF&I%4fnCa`=L;xbW{ORvVhQH7M-vi
zP@Q^o_4j>NTgWhGxy{G6K(-7-LsqvRI(mF%Y^vIL52)tlOG{JC!Vv+xjxApwyNJpW
zPJAJ=yKln{TPj5CBwU~2Q{_oL56(FqK2^ouLAk~@{TkodDH~D~_;XbBiUOp>3rb)l
zfgE(=@>a-emST<834H6eFHWOcjlJ?8rM>=6TLk`K(-i_3xX}qRhCdyM7PTnPB6Fk)
zPTiKr{*;|e71c4XM6Cz1-|RgP8pab-*&Gl;D^ls2WPga&56h{ylZO&h)_4`7ZbZTs
z*>9B0JWWuc(W2R#;<@P~XlZp-xaP31z|z#@;H~C2MhAoSHM=;1vw;MwiFSw>Wfz?a
z@eaD9-&==EEz<?cOgQmw{5*Cfr&l#t!df>GHh349jK<b=Ny9Xk*r$uiCZiN)>iPQP
zTwT{{fzbD;B4im_=5q#wls2RXv9BFJ*^qlHn{nPpZ;gYRtke75XMh$zv6PIsu1lFP
zf4D{;p}|%zvDtc$wN9yJwau+}gPdf7&SO{BaOAK@gs=h-k#wH$G#36jTte(*S?m(X
zA+k$ytke&faTgV5VWj)8ZpDS%X5O;FChLQg5s*y+heHojw9RI7N6o<GBG*>%7hJeh
zT!v-E*}j!39kIo8kd2kbs_AvNNu|d9Dq+QB%`aJOlf6h|!CAAKQNf>L?YMcE^;WQ`
z{zqaD_fM_{dL8`xd^u@kw{ekqsrv*bc25b+Iqx(D>w0L<#=Vz#pPjx8MgaFJrBEiC
z6`*hH$u5X*xk;+}6Zb?Fd!Z*6oy6Z{fhslR?6sap5npWE8JyKBxBzYYM}eL>Seo--
z<-p@3ZkFfHGFRN-dUDy}Tv@8sjli-~V=k3;FRe4)t@Au0RU?@rv+3C(%&;s>>X5Lh
zIj_b3YGS(cc=e<@O6T37(t5;NkF-XhbC^4AT&T<hO5g?|jl13`KX1|T=UlsPEp@Bf
z$o0U!-zd>Ocf1T$%cRWA-#rhRQ6YdeMf$qc^%D+x38}$SPiXwtrKa@3Hp_jh*1G@R
zglCT46m^ML`|)t@yL?)~;hwyUEpfg)8jG&Ym(}lHI`Mztb^K*N`Nl&2B)G|pHXRAJ
zKwrQ(pQ+1_jNijL%#pPfUcW6@^S0%{$59wEOyyTzpRD`#I&|WZ%PYurT_!`l{D^!K
z)u!8nvB>dwp-f#=M+-RYTdH3=OB~i9Nqr2=kVSV=nf@wB=Ir}tIh9O1omNmA3+>^A
zI)_lm8*eqK^c6R6s92Hz1=EFTk;`jeOCWV_0|fC&Qz>f*ZHe6}ME)mkBguT`0rnIw
zoDcM)(bR8}%Q;Ed!?+uEh)E_^hqbF+tedGsa|C}6oh#z`g?oRhCqdwoQ(E}p`bc+E
z-1pf{YJpr8$^dJxYw~})f0)+-g^(PIi7Y<XUDE}`zTjvKz$YWx$3vj}Ij5Jk<so-|
zXZ-exYF4`8@C$^nLUcbFj<jLc(Y*AR*a<ANyciO_Bso&!VvDJ=%@-k~gJa=%zAIMq
zkzMiL%JiN5`wfd!ZRwtjddoy<aX_nW`Bl3rfZ0^)5Vr-r#R}(NzcxDA-WMbh5aqtF
z<-4XDo<(roZoz2mH>Qiy&u=RUPFFf^Jy&2zSJ~;(!d@18PwsDz#DRNS5C<OUwi|@W
zj_2_IlQ}F1^I#ZsHrLIpD9#z`iunk~YU(aBur&ptFs_p4DWo-%+njLmytNc7#WPVk
z1c0NP7Dta1kB655(FVk#OzxQC{g_Yb(9vmOhX^!Ks7^i~Eie#XFekrw;ll6}xU#YF
zgobN6J;_Bpz!Ox~;Bjp%nGvTt_vFS@0N-#l8e*vY-NOM4o+(0&;7&-!Y07m6y3Egd
z^}T{Hs@(#8U@G5tYZc||ddBQ<Y_gV&z39q-%cE$9(QwNMvU<BM3el&g@mbgnw9lnf
z9P#9u(s)gq&^Yc#{1LMIR%|%4OMC`=E^Nz$wQ``E53dKXY{R~!ss0Uh+3>!%3Hb<>
z)i4H#O>2(DN1*h#S_|-mKB%P_+Dc0W__QC3n!$j6xyL|Q@z3XSlt@Yd%X>_r7eGVB
zs}Z+w3{};xYHa&iM9iirR3^4~yXa)n^!qf}bsD!YtY>Q7y0Zmqn7BMe^H(V1v&L6y
z5;g`1hwPptEQj;HT0SfcCrsx3pu>Zhq6mqxyI^=Qld=jrpG^g8enn3FD+-(S)K_T)
zYc3aejVW-luHVcodjM%bIbM&g6yGJI&yW?SYz?N<i67iO72V)_^CQ|VENow3i>UMW
z22sZ?g02@h^5rpTnW!$@;d(n1BcT|&TJ*KFCJlKE{5FkyN5;%-o5l4|oe6B|jZ6j?
zT*Ma=*m_;#ubROBC2`7s?@|Lj;W>^umc@G_+CgRYtuAG+*e{A&8dx4x2dJGrxY4y#
z*oL~dboA~oC8>@1ON_U8R@vo0qx#Zx$)O(9;${=bqIHoQ-vbvhh$=rtQig)9?o+7(
zzPQqByK18-OBFq@4l?Ph`<Hf$*(U?ILM~=veelBSk3GVWP!hHs?a}4#!rpO5rzIgG
zGb-AJ?4Qzgk9pF$jl#-RzI%!KP{@GC4rEfP@@WxDDc5`ONn+NeRVD#D>muEY<2kUZ
z>6K}BLq?cYCU&4=t`PS7YEC)vjVoh&!DG2&FAjnacK=`$e_en)uJsI|K^MW{PY`I=
zt>p<i{2ek#7ovh;hPztx;vibZY?4yQg!1HRY`;L`kM;FujlUO?$Dm$|`ILWtYS(i!
zZJh3|;{X{djEuJb8RRt;9A{9a&Qj<}jt?9?i}9a2&++zo<W#2*2!|P#a#t!YVL5m9
zv2*^L@h_8PK8<mNpl<NMZfKZr#L0QbN)o$U3JSrGFR}QgVSu!&S>pSOqM4?Gn9q+G
zO<fBvwx+k|2lozgaOamwlNaw*DnGcSKtm3|;vLS@U;FaCV1dX)wryF(56Yk&$HOZ0
z?L@3M_C_8>7egiga^|xBEy1k_HY1#8M>BdqGs$gUfBpC&bv<DW@!swllAB0Qkj53%
z#)x87&2uw_sc)AMM6}eUsEuzJCjaQp4Hsg_QkfthvMa3ms&?cSa0cKAt8+@lw}+RF
zPGGPn+rhAo(<S!p0wQ?eFo7`H?rf~=5lC3h@QS{6^dM>hQR#<*)`MBPBAjEiY^LK*
z<5I3xU%quQxptOt;tBD+#pU^E>fQOK$_#J`;U~qrbywRCY~-kr<2m?SmDObmF{~RL
zxU=EaA@_U=x*+9NJ&1Opd*_%^6L|vGrCT!X^+}b+cQ7qs9clXoc!b4IrZ~P=L2oJ0
zYiYygiNSI>0LsA=iey?3+DN-Q1MvU;eDzl^%9o#z+zi`4pz!@^$#o=8-){^^wC;s_
z`LLG6wZRTq#Nw^d>=#Q6m<RFdc-=aoda>?Z;vYVNT7mPE19D%Tc(|8`C5aOrXkmyi
znWpX>WIkn2N|u@IV&~Y8ATgCk$~GMqfMIQmddr?HVSP;I{Vd!WyndJCyUeAVke-Kt
z9A2w_)l;)YQWcR|o4<&u)w=`SJKoAR34dXFi{k3Y!35wRwriGB-+;Q5n!4wb+7tDu
zPx+Cw$mDGN2=Tu7slVGhnQJ&rq9yXdq@xG;wC_p|X^i*s`^7ffAuvndNpZ6WbnRW}
zl1r%xC>k2uhcHqx3yceUxKLazHWrV~kKJ1$r6cge<;9Yx<l&*;y;~3OYiu8pA8NHo
zaHr-h{{~o=VZFv*fFZ<ntDyjW!Sx=*Ap~@3#fjIF%ie0y-M!VsaRe7P9ZLeowyMaq
z_QIP#-p!8n16R(08o>uBIYqDC=8H@lyVlc$ZXE<6&qnee9W3|a-_3&i^BV4I6>=c0
z50wr7Sw^YzWfWa;UPqSkF%o9M80*o{PTGQOjyx{Zs(u`V9#v@J#a`*@8!KMMK{<+A
zfman0kyCiKjg`tng-(MKuuF1Tzwg%3RIozQ>g3YKp(3fd!+9td?dui}1=H}K*&}Z2
z4tG3VOC;8=b(p(P|HpBh(_$6#c^;#4ejNX~NAG$EBnl1}?EmVkv)>K#@3c6+h)F&@
zhwA1o-49G}1qv~d*eSqV)7~qJ28z{RpzBPaJieZ6fvoHO-^_}xyXJs6cBG==H7<I(
z!h#xJ8!*eoCFIy0Wjly9;_N?zS7`NJL-8%IM2t)1By`XG`RR}5?>*@>b-f(1lsn1W
zt+s&q2Fcm(5Ek|g0OV#klXCM#7|TMk+q&p;$_p*EHp#odouhQsEO43xEi!!a_ApAJ
zu6VI$kCN@ov%iX2ljLLIk^tMsK{)KFjVs9Zjd|sp8udh;@dbi>!R<f^%fJJbg;&29
z=p4WD(%@cAl%f3TFooUzPQ|hN(w(>fspOS|p7Bw}qiXK6fpLW+eZ`mEg0B{T^Ij4c
z*#5*m2Oj3AwKrNj4R9ApmZp1czx^U^ASf9rZgFzHHaizht`nZGjqQKGHV2^1)t$3*
zdn7I*P{2YGJ6{k1&8Sr+`l4iFop^Iol)tZBT-vJBg$1gK``;Jn8vn4LWpy8#Z-YC!
z0$K5&a1!S+y-#w9Zuv{Or;r`I+qy{1>Zce+{ZZj7>eVN)N0Sxywt%g%KKDXw#PSP4
zQQCR)_n=y?FLKT}cR1L7r%ZyP0h>K_&wDJTCfQjq$oe=PWn^C-!>|+=$H3@S<&Pin
z#7iX=5RzlFQe`2Notb)Dd%gFH`ag<Hy!XNqb6`RqJGD|4{ef1Vbur<>U!?8Ep5U?t
zg9s&qEgd7*Kcvh&p#{*c=Gc-5-5iZhA=kbEQVH{G_+t6X3+06US#bDj_<&ENZ|SG1
z9j%;He5A9`Y<r<@Iq$dBuUSl?pcO9&oZcF@rxjOJo=Yg2fSNs~0;%%r?Nf#)<36Xd
z_0qd`e*tWbqJL;e%+8EH4a=&~76Z$Apn@#xPh?p$4y)Dvb6NRc9YS}LGL%ZBqLZhC
zpZ5)=VTIjV*F}@FdW@rIJU9MI>iu^Md-r@{JI@c@)1#n!vF?wu>0ZBckn5FbGmTkZ
zWtXnsHcsshmeGaP^c0_g)!eDmB^C2=ht)*V*5LEo4>@iuLc<<FS}DNo24j2jUGZ`N
z`wd9mxe|@#s8TJ!mk~(?_r1iDJKtmhW0a<Xk;rhL>{p<YqKsJ>GO`PUw3LYPUJ1Av
zk%JmWh7K$1Jw7w+3-lctn5o#BMS$5i#y$rJAdw$1`DPAybcv)@_Lp1sFXGSOBJCHZ
zm;ygR-cF~trSPAV>p{4?pxZ+qSL1hG`=U`wRL?H;hX%B`Q;tt%T6V2VywnID-=t~^
z*|QJ@jzKP^9ef4qo6ieY>KlObOaWu1<+c1`$qCSowW8TGj!c!W&pQH`-q6WJs<BuS
z(2%-}i9XqikJiQEbggC>5+Y1q06*J(oui?w3F*;mkDIN)Af`4IV}L|ygDYiKZy1~&
z@k6MDiri13!Tw<n5bI;hgjEkBR{MG3S(p^8aP-p~<V{Zxz0Z3+V>|PJ<rMHC`%r(b
zif@cPS9U`)PrcY*Z$72`IFO(7<mbVyx45efFBUT1aKz2WuEcP2c~;@{3zXN(uRXhe
zl0G3^be2&j5`4_m7;Xk!eO(?wpOrf21|404FEIfp)tBFH-9FEF$B`PhY#LjFoxz9G
z;)6py2O-6q!d`bNzU`+sR3u9W37a)5(;v~A52!rgIQY%KWHog&dCi#wa^2DV(y*V$
zM_n34aq?<ueU>rT+&XY~{{g;8($XJw;t84Qe=W6A9~(?C=|;7np_!z?XkJtkUr472
zxz#PASnT(Mt};jD&tdOS!sS&_PaU_nNE-FNFWb~isTxM5F6PL&bCRLw|1M_0CpGJS
z-u4oDHFnrMTfiFYo=#AVZHNAc^HDn#s;Gint0?D^5uwfy9+Tf~0wG}(&<sN{q4g)g
zu!75$TYx3zaKy02vp|~Xxl3G2)D?=<j(&zAmefI(40}FUb+s_SW0gQ@Uj&24sYkc(
z_ls|E>fPVf8Wi*KTbX!$;j-P<zPNY0V$6jfW@#EccN6%tW4FU@ZWqfp!X0co2KIY=
z0B_C|-|s&_qsz(N@|U$vemY_OVSHcn0B<7DOXTrDS_j?CaK1UL`TEG$ofEhL9L(Rc
z1hn`C2tRMmdQ%hL7q{s&U-UR2Q9gnOQ7PM!O4sY<RmW|+PUVx)fvR#+CfgA_nq!pc
z*H-)ASK7mLIh&+?5A|v_J<xqw$f}Q;>e2d&Fm<7C#@f4KhQI5K9?6NLP`7q8iask!
z#u|)Gv0jC1S7yA{ppUJKf5EO>qrc!#Zg<E&H=&)pV1k-v$tw9~lJy{cL<Mz$p4I)G
zgN>MlIumR$AMyWx4B#L308JgcnRwG4wCvw7HeVLPi;x5`Q~!Yc8O3B4b8Kf@oL3(j
z<{eJ-4Pz;-6l(u;*4X_C$V=_q@*I;-A@7Mr2JsEPm?f}qzFiMlc!6i$%PT7q%xih_
zrFn4)OdE7<7vQWoG~wjrqNjGxa_MYglCS;&VI%*1lv+g%Yl5SC?&k0rkif~p7&vZY
z=&+(;a=8(<kdz59^9_F{#`mI=oizzG_TTXINTc6Kb6|K0%p1cO*Bz}=7N}dz%kTZj
zcWKsoH9&NwIO{o#FW9-Xxm>T@i1`j}H6z1lOwSCHhzE`7b}r-3$O8)jnJt$9+L0bl
zeorCbBlWsGod>y@VL>_#@6&yIDrYK;DjnK>A0L><Y{jteC{q=Q`-@%d-{KX$=Vpe%
ze)qAGx!ykeKgS*JdfQNcMhY8J`RB$jrd=vdv3~XdpuRXT8;f;AHVp^G`PO)F1lM}4
zRo*T2V{*^{%udLa+nb!qKYpTnpooAaDh{&G>tV3d<S|CSSSVT6%r8)aA0O0|uAF;H
za}@zE5_%EjV(e2B2@6w1#pYePoh~`-E{9$xDa}|4E2BgAM<3~4zrQ!849?!P=EXM8
zoTJ}6ZrkN3`yv2lZl5?@>oE&1pH`hPT)0aMI^@*6DJ(Cr^J*sm8A9b@E*x<6nvjjc
z>SfCQ5?m$)F{100`VPYs#mTI(JP)9P@d&-1zE}yIkyyGAagm9~Oqnn+hqRy`BQ?l#
z)mZ;67$yx7=o8I+j^D<;J1X>aR%Rh9N{zqRqBhQleg0$jsQ5<6f}p-@49W6Tne`AJ
zc}|}FE0B9=VeaK32yq@hc_>{tr<@o%&?~&gEPxk`sBV~pnca&$%vQuzNtL=M={!e3
z8d1~Xz%3JjJcvUPuT|+`?%K~7^6j69Gg>(+rT^XvUu@U*&<Azq@UMjdexi<`UQ=6V
zpYLMeGNQw!o|Y%emTDD06+GWNVZHb^Twzv|o?QYaJIYs<0iCtiG!tdscpHwLCHs*}
zOYI^cSB{??P+_}&DA<~6#SR5rJ^jgKTupzRq+jpen|L_h>3^B5?fOg%Yris;o+V>)
z6#(0Ip0A5;v<3tSK4*zyT$idbLA44L)u{(r<QiNZN5_2BspzoBM}di}{Z@v^!hpCs
zE0bq%I52o$;-1*G^nRE1K%2?BAHf4N1<T<zVE7nm6!E~Maj#DQ;|f?aJN4J?V%*0c
z?$@E*K0A*S^(&0osce<XD|ESXH9HqluahBAx1qZpEx*RrNWn762>-$+S#_$xdZ6it
zNezK;KK*j&h4hQQ5E{yorB@Xr*M0ykQ{S%rT3rhyQW%_P3nBk2Ti_e^YtBk`em6;9
z6uPce{Dx322xjA_UT~UM?*r|uwkyJNj#2_wT+*TbcsWT}U7x?9#@{C=Zf^<nIBh9{
z@*GQ~0Tlf1K7VV16XWvV@ABkZ_;gZJ%X8Wlm;pRUEzBUPopGXnOJ`Kaf$ytEbOh<7
zC?o-g*n|W~p79mZ5;BoaLWS<WmznGm286`9jOeatx}l3~pus%e!yJ$paetq7ti=D_
zG&EXQ4b<<mF~qfuUUR=iO(+CBzRXW}uDt}8BK{82JA$Z(;B1T{b{(~j3n4jg0IsWW
z>tyA6g23IHT*o>u@Ac?7gkV|Tb5nvp*F@g;L}N@5-A#4k_7<j<ht+$8j@QTD(2j4t
zc?Sn+fi+mPpJDX7xH>c^mDo6&Fw6Bac7}n^<@k@fwjEhs3woctE9|d1RT$$Uf5=Uo
zJbjmH6{$mXO6{JccBWBrZIZD}B>$Mn<H~k6=3f|9z7eT$idaKfnY0Gr=O?9}96xyT
zPZgHBFtO3lT+NK+`+sW)tMsIh{<z>#A!A1q=Q4>)NKVG+&~XyI>e&@)7b=@&KJ0u^
z1P@u@wxU(W&0@KDwjMKj>e0Brp2CxtEK}djd0tQ}oEOvxuZfu4rlr^%2&GP{9d&R=
zHkg;f_(b8azM}S&xAlHlUfQP0!|;B;QPe-j>reF}k=qp~U9{eK|M&L?jx9>t0?qEp
z>Zog%t*ZCQQyV}(n>Z;>v$3L;ehDs#80E_){)3CZn`g_7pVG#tCfN@#KRf-g6$-}A
zBY$SoyE{Ac-y_;Y3lLg5Fv+@^eXv#0OuUyQaa&y*uZ(Gs@T|rHz-~x^;;i<cV+grq
z#_QK<C}FhsnsmlU_?s!_cW2(Pkoo$-qWiKdX8Hs?l&C_lNl-(QVyF6U8)xGFkz)sF
zvSR{L5_cEG-ikN*Rvu)A$`MMI#p-R0e)7bh0W)PeTZ&^4-ZlzI+3mphWg>UG6`-0Z
z*jf6UnJvB6HPk09+$1tOkWcVY54m}is_;j?y^Y$=C^ok1U3Zd>vQ+0UB~iF?@m${7
zHIoCh`$jmNe=nZ#J)?_1lfTn#yEVSdV24~GiUu6<T=+oLD_Q(@l{!W?YeXfd%8j_l
z7WI2{+!F_PQC+qDrK5xg4o_ka6us!U%s3VB5q6BqAK5_Bt+F9T%aMVjgY)BGngsYK
z#hPYw#|0*6t=zr0b0Y}v?n^1nF^%hnlJHCZ%?FEvkei`q+i5w<PsY$`z~DpK_m!L7
z!A{14NWpji{LqK~uS3r}>;d_^BpU_vuB^Y8;F{lB>Ap)YkL~Yuc2YfPYH;ZOptv<Z
zX3S}TSE>2)BaK}fs#xitMiWCEQWGDO{Pj|ho^$`wL`w3AxvNKhdw+gGS>N1Jfnnn{
zUH#@?FgiDQgWI{mpcp^VLN~#0I?xK&)#bd9k3|c~T=JX%H(eQ?7)N|ajFJsF<YHMW
zk0kCjJss*kD7`D~wAeB1GY!6(ZILS6Ym?Z+7uv#LNL6RC#`IYB1H(<$i~$D<`c}nI
zN=uoxG*0p`WaNJzRqhEYHuxPcJ1_8Pr<ncueH<IO?jG==$_q3-K$2G63#?XcT%ugC
z1V)%1XJB9uXa3cG;)C+2o(7|pP*I*wBaEeqWt!c0YhFQOJ8^<VXK))A+Ff~fgK|%Q
z)my|Z-0XYa%~h$LMC0~g>`X&&Je{&trSR{sc4@`~GYn$(8|e3;KK#Lg)Q9plWk+)v
zlKss2b*B=xXS_Q<9*MnLJetggvKF<$WS_30QvJbUPxj^1z?FX&yI%1LC35`h4G!$Y
zaIzR~4vp3ZF=GxTs}GC44$|%~IFfrh{7*JG582>{zS?BBFDwxO)Xt+U!9S1t_%mtA
zl-1I<E#r{f|LHj~<_41c;{t5BHt&Jc!pq;0KLo>obBXbv<6g<m!9DJjJq|r&-^k&@
za=Y=tnCBf44CNbMH+OHPt0i}NN~=d3l<em1Fa%ORoR!~gqk3Z3Bud{=8g6&70xkj^
zbcNDg%8#S?4`Qz}STyVYWEK#GrZ%b#rr?QOc}RVDHe@h#7<gfkC-^5Ke1G|nT%D)1
zX_3o3DTqGhO-+(~`CQ}Os1W%LTIT`TRJW#9=7uyCfiw?Sm)IkMiI&G~HlC&y)lk5W
z?>_;`mycyNqRfMNis}LX*=f*dWi#&8i5v1GQ~of=a6)QrDdiMg$5Xd^3$xolKZGIb
zOyXtDB|^t}Xu~_j&@ArVydC>4<8G30uZ$aNx{piBSeY0VU#6@jT~r1N>Vct(^@I_1
z`;T$V_3U2|xzIJnZMrrTmJQxXeFdywA=84nI>JRqO+2As)|&{YhpZH)$#iHKr`UY7
zNIHyS*CJFL#py45Rz2<)=)Aro)o&=>Q(AA(PsatCLEH)c$FZVw09U<Ox{#6%d6pw8
zKim58iQ9SYSDwB)@m2D#49%c_JlmbyGL@S>w{~ts{(IVQXq}&S4XFN1{>=kxwx7aj
z_jV9l)rsSrS$P>lwPgHm5o;Z0tKY>Xquo63W#2%jw25ufAo1OS;)pkkkJ-dx26nrT
z`CzvO$%8{If6!_j7fPTQ)gWmL-naaSbf)~w0^*vPXzRQfE|Yp$=C7CuUQ$neB@*|7
zaQ}z@pM3!dodcDZe*scP9T7=1h~b+L7Rr75J!DEH*cpQR!d1C7@-r`Os*r80B^vh9
z8sv_=keG8Mt%!)VEs?66v}9hw1agc!)^6QvpSN{8rn!1NpM{2<-NWBmD!5hug#Jd2
z6e{9)3jAY_@@P*_pjHpHubi%EQ;wx5+xnUrSj1-A7&LpK;ed(QilXBu;4RNB)7_b5
zC|9&*I;eOar5uAK*krkLT}>H7!}9PoB>mMp)_0fe_GY;aqp_=b7ps`haF~OYsZt8S
z{OD#}`V7d1nP1a9D#^bE_5Q-o$g_znjh$(94S--^hdAq)?`3d$nh1`gtGD*8uzQuB
zH!v5kcRP1wv!A_-kuok@NwA2vdY?&Puo381A+mAIR76-7YiM(Q{ODZ;0<l1Jr+s)W
zJu97IZAE^F>7yKWxJe3f+<grWY)Wufqf-pl?#sXPG3aGurID4-w;DZR__ZcH-17`i
z*ZLf4o$fsp$61Z`HQR`4JN;d3`SJ@#VzLZPH#f(AG|8;u`AyFZH~kf!3og$+@^wEM
zlLVM_d%DNq%JGv&T;O6ODAMQkZbHTPkv;p>#lQ|F*c1pK8ZY_t4d3>hWob7ULlh};
z^I|pcCqgRsvr5$S#JPJir<7)&-0lDmz}gaf3LWw!)4_5)S+Ys@sGcKz(967tw4Zk<
z^HJd?l7P^!TefZh8<h{&G{M2GvDsBTgsh_~AW>w-)%+8u0c*uC9L75c!BgU(8H}rW
z&D-!Y0fsN<-%D>ooa&p*D{6YGCRnS(YZQcL0-LXfFin=j=(aOD&xc(MT=h8UhX1r<
zbdE0{GpW^W2R`M*JW^ySAm$8XmS+eiWh8MV<38$VrFP#8_<V)ph#+?jiZG=g2054W
zF2+0W%t$)Znh+htm+j>#etVXw7+&G%Ek)x}muIQtwwbrZnXw(U$Wl8YJc5(?&z){^
z)GUzbgOzuSUfm$ah}(ZFs^HM9XyxKzc%93f#3{9Bbh%f&-phk{>HR^%-BT7da)C!7
zs!yUD*{}&|so8GoB?e@?CsPeSq-0v1<fS{!O;MuJ%ATv=VZqFmb1$7ApC=l)ezSD2
zwl4Jvu-*WCUkFQP9K9Flg@YLl{&#+VCf!z2>}v>;J8mn7SL+Ea0?NyeWPo8ewpZk3
zK2V1YVFM<x5FIKgA5D_0H*P6E<Ai~CokPYa-3IG%t^uQ5Z(1{WgubVMx-Yg@Movwk
z%RVt65wex?Gf|lYGkl>WA=~9Umk9|ReF;b%yG)8rebAW*I*q2EZ;W!O#ZC-v!aFZ_
z{{+Vwn{}r9s&lcbcqgY@^Xm1EU}H%p^8~_5Sok^IIw%ydCGuvgFR2IfCKHfA$e*_i
zKf#MTb-hl<f^ce6kF(~!;>}!`o7Nk>rjQ6@7$0?BfaXsd@Lr5-xfec8GSgjadP+(c
zJ$!k6?28I#i60+ue+`KxJ|I2SJSIF@hKs*jfFoy<-5f|)bL;P)v-?K~=hE4d?mC@o
zlkO?*sdA{oL2B7stfmk=!krtw(7d?a+alsM(pESz0I8b^$<5WtT%Pf-YEw~4Mpxx}
zGdc-I7K-a$(NmEtrQN{VkG8b#Vrl%-sdb*U@pqQ?YX%k^wbo4}wf}w>y{2W-X+IFS
z?qn=l2|QQSS|~q{E8o{^l&`%^&Jo_Tulcrre1Oq78lq{8QDb2h>#jG$&%1N{xj6G<
z?$K~M-F*G0VLjA0@s;cYTHkeY_5<Wr2OGuyU~g`*_^dww^R{1a%yq)Bzg}Cw9+`}$
zejd{?keEKDLDKEt(tWi~Uzw!=*sKZ&Cf~mAF@i7Tf_n4v*(;zr2E>hNa~i$Z6FuE5
zwKYfQvEp+iV`<8L21QcH(Z#rxnp;{3Nb@xnz^#F?o6|S)3m%$^aYDBmT@niseKhyQ
z7tWPz-<{{Odt;mXHoG%>Q@c{LE7rwt1y_i0vo%f2swwVuUv>-h2G(xO1DY%{8#-)2
zcl52FB!{DvoNbp{um17P(5>R+5<{};2SsY&gHRZw_5qzZ)*x=F+unrkJ~B^RSX1`o
zyOaXq@0cu{DB)KltgcTWeJdnnPCKxq=n{Oc!wt2VbAyF6m^v3gk$9eE=e4sRQ@8$r
z8bCJ?_os4N8P<NJrCUdK!Fk@bNZ*^^Z+VPF<1&%8-|sB0xzqyhy7usXM*-4Fu+a@z
zM^}w`rSGYv_Za8jJ9ti^DD3#+dc>T*fG!{IYD9{`#(lT0CR7g_X?3djVQT@tP{~9p
z<vz8qjbzI<nF|t@?Fjiz60w{+WND66PNbx5Xo5J|24Yd&L8wk#-VX@zFaycKl<|cC
zST(_XAl0d?$Qf7+busz=7opg!$g#zWJZPg9D>*F?K;8U>*3(<LuK-gbs%y!CO322d
zX+wW_7X&}uDip)=(>`qrvzg^Ti=@CS*(`W43As*7Zaf9jWC=v8lh6M-0mMujzq8ue
z*O%=e9qK#Or&agFU9C)>2Knusdn$j25H<D!U&GW_>nD1<cK70l6{!H<();cg|5R!@
z-dtkCuZ*`xodb_jFjtp5L<i{h8-|*^jQ8EwvLU`cxKJ+7>ILx4CuikQGE1*-Kei^v
zbmG8bRyH(pTuLHFTvANr$&7^Nv3x=q?hwuj*&5;=%f9o;Y@dMY!(GU%?m=di!ZZHf
zef|1|6jxCCqpubhy)JfGeXK#)D#K<ip2X~2K6Mrbv`*J;&vPj;rGxcn2415lW}{mp
ze6N@d<fs2^JovjGZJ<BHY12f!k~bA~inu!t7kDg)VEscWR{B2oxHiokj$ju4b;3Ie
zGJ%^thC5v<*s+#UC9BB!TZUwMj64LQ(mH~!PSIM5rywhN|44aXO8O2>5chw#l7OUt
zP=D`W2js*GSW1!;sCFjW4CQ!-??(CKKl+SW_xsS$<Og&~!sG9uRuQt@*D6PI+k&Qr
zbs+4~akK)e$ZD4VGV&Nm1C`T(PWyC5uGN;%<{Xe~+OQQk@)|0C1>p7Q4d`a^yqx*2
zMi^0!g?<y<@6xPHkp6*8-fo<!#Ja^UK&@lFO&lpbiXSQ|42U|2J$UK6s}>_w7FldJ
zgx-2r^-KOt=1Lv&`TfuhsP20;)EiTO&%Xa1S--J?_aw{BA5mJ;r6XTq#Wkth+b?}1
zd*6%1^DDUQ+|4(rD9La6xA_6%V-F>nc9ZCp2VA7Dsy+{)xjFh{s_6{V*A<&M_YzX~
zXw&}Z*|VTq8d*X8hFHlt2{BL!6;yNdvIHE?)fIcYM1SwL-rpzW*Emz+bjqQ{%_~H%
z#Vmp~J{(E4wRnW@gC6_gj@*APmwWGJQpbN+tOYFxRQl5Y>Ka<JBo+Ez3&_aY887{?
zmD*>EH*te#Kdl3)gBfnV`>Mr~CP%QIXBzqQSaV&&S<I&*`o3<ovYNLDf{#Y~Ao!?7
zE-n-CNC!Ge=r1j5p6e;;>u?TBpYDgaZ+f`-Hna>D82E#BV@H$I2Kx(;%NN>ZVsQ8c
zUjv`qov|qQRs6RRnt9ZSWG7zbxR-=srNgJ%@t$xjN=}~wHYIdQp1r#59ZUjIdMD{*
zaJfx&>rIus>11MpI{~4(yAh^A+F&TBKBK0O28xf0GE}c<(ak3B`^(=8@885sl^iJs
zcK2{$w<|I(N%`f)gNlV&U&0@uBu5DIa5Jx8fy(}>5S9I23X12Wrp-H6``7etTs*;q
zEGRrns@fY#aLI{3K;_%3qKY=W*b_I&g>0fX#76UU@|knvW3evD%Z$}iWox>1{u?u4
z-M+4%?CbznD77i-J7$W}i}oCr{e!Jh3Dm}y(RKw@u<4UHiUg&U@@oFQ=BkWj+mSZL
z(*lb8csM<M1xJN-7N!QvB*7*~$vWkx*8gb0Gt#fF%`{n@?3|&c7S12)fFZt^)+a9Z
zN?@)s)xqd(MmO#*CtPz;$!JfIYmOZgt~ndwVL$H#ahJSqG+6=w_3p9Jl!RxOuKR;N
zTu+R{Y?DtzXP#Yd!iCEZiWzuvfqeaH!*IF6<l1syifuvpsNtw<Gin78H@SLdm!j5M
zj9BU5lb_(EIo5mA#;?lGMV&u$#-#hO>rb1C1j5o<#6qRg#|Q;f+PFz~b4eH~;+s4;
zWN3ucm(NDG@K=Z2sH#KBu)#NPE5X>yan?)1Jx&W|-7*rcXR&VPFF^@(GIHUv$WhG{
z9p6JguGH`7c+&5%Ngmd;z>Lji9*KpmNjk`BRh(?X3w@iXRi;eU*oI80jBW#8HbD6H
zk8XjkWB#!F<(_ck<^7JN*$igBi6G{aXTB?o*i?3D1Vr0WG9Pgl8M^l)Roqrv<=s;|
zeG(PlccV&rq1?=<x9*|)*psn|_!4keyDTSIDRj03ZFp#2JSMZU^mD(UcmE%fJ!<C7
z?;RH!qy%X#c~tO_c!1&N!9Xo4*2gkIol_2}Hyu}?0J)tC^yz2{p{t(Ab!QXK??s6O
z$&{m@Qz>aXnl5?>k~cbn_&acmbCBx}btNr5M?tO^uKGTG$1m4Dz5N14lWt)?q5+A#
zk<Z)*r!1mWF&=2^jc5pPkfx@P%`HL|@+isF#5`1pF)NJjnhEXA7u&`hR10Y~4BST3
zQ9TG`3&M>m!}=<%jMdrck46+|C!@%G0D+$T1`H?jGg;lPms$>S54_y^>p=6s)HY)*
z(v24<gfcnGDz_czCR9RH{l8#@%(?u@d(R(xAsa7<+ae-Er&#an8gX6j?*al&nJ)Ip
zAVrf&>?eo0uhk~;U_=!|O2;}YUs|{egW1*VS^3}Rhmo1)vXS;`XOCftU}5V8y}!_A
z|2E+X{On`-5wC^<bG-|ix2Hd>^NhpN(Myk5-S`2WtGxg7y4|g<mrs&zS-+rG?f;Vd
zPE%ch03o$BXdG#xaIaOa|C^tr2V{4<UR;n~-_idsNs8MlGAF~|!}icGCOs80p4s_i
zTeWpf61PW^*qV=`H3E>10J~&Yl{L`-!$p@-u5BnEUD$n-WsLIZIpCISN<g5&uG_#K
zpu`tKdabs%o|b$e72p+Hy*5v7vkgUZ;adfEPuX-xRSZgS9#Sn&K+*SPLjb3^tQFd^
zA<!7l(A|a-g{)c$rvxSt`dpz0#Q352hOBW#4O@bl%;FIS+6wTXqplIe%E2VP%q%S5
zv*{0rt*A^;Be$F9Qo!lWkiFRl)#S*SjIqmrB|GA6R<%C^8)SHXV;iy4D3q8d&pNrb
zcqnlM&~*E?Bk&P@F_I1`aG|RS+Yc}e=ipj=-v?zWUDdkZpFqw|apW4sc2?0@?uqAP
z(i94URU08MHUVpQyDeH6mDU^9?u&8R%;N=|Py3AJ<vWXZP%gEseYK0X_Pw$3KTzCq
z&Tb>_FIxpw=P*BN%iw1<r=9~G6QHybt%Rqod_3X)0UbuJy}$`6P@5{0*qy8WPHmri
zSCUcaKa!GgpH;^@NWfGgESAurgmINV-YfGk1b4oIuU}BCCzN~Pa9fkxz~X%kV^7CJ
zZZu8zXvZPOh)Qbb3Xbhl4=X9JcFPEo+?UrZ<i9RqiQd!o#*j<E8PK>FmClMMqN{Iq
z0Tys#O5?|WXaRu7)jkcTCcY3ExA9}o<MreMk6E9K9^Fm;V2d*)B<9w^5Qvo{2K~bO
z)<0nCt4VO5F+?rdg__^uO&xWW{b)e~$5s_E(5+Dxb2lXB--glLoS5({Vj0AXXAW=-
z+r(rycWeO`tmTqs{}oZSnVP}RmXPAO0Xsx!CbD+w&jQ`wff3_nSosKVnJHYYt8e4t
z08CBZkP5G<tBCUmF<090H|t9lD?CAvNRGUnYA_~i^%l8v{JW(BXv+<InZ~~$K`e;N
z=idP-TsPK>gcOPntrCi61y!pV!G_j5pj6gh7nOWyNcsoT;5(6)fJ&3~!SI<{fyeM|
z`J^(<4c4E)l(nTItD;Nau^{S_dd`vw*CcOC?9b|&dflNX{Nq2^jZ%Kf!5#q6aQ&et
zXm7~NwpKA~JjM{;ndZgsy~pkU@%@A3e|LfX`7W4-K5fp(OhzA_S>F?Yo1b?ULN`Kh
z>vfaohj!9c%3Xr|n}YvtfsUt{`v2v|9E?mcGosSl=`zG7^_0@w=LVj~Fkv$*zFcoX
zd)np#?<A@RM%@C|RNIu3WM-TO#v7`34pNSP(I7;RKLGa1$CAvdoX@*44VdBy?P(c#
zQn3GYsk`b&c56h*0T7Ue1^T@7WmxG=gB`F4|5Ax(95Ewld9y?kA`Irx)oBd@6;hwH
zbz_gytxEgUqGIa7oyNZ=Y$LCDUO}q=uHHpfbQ`Jt9r;b0yfrMvm=M#N*p(aPn>~p_
z-EP%a+LgaOG~hY%()js7HHq}2r)x<GO!%EFuNdDF(^?L>i@}^0imbYU57J@SJ^(yV
z*QBua%R#l<!E%MfECXb+(s*~NbV+6YK6R)5T#C;#+8O}9a}&DKS<;BIA}e9Y2TD`K
zx3yvG$9}FGh?8S4<5wUAG@YOLB2xo~qx8J8A;I9+9TMCN%TLMl!9p3)A<l0HUT6ZR
zoPdjAl(1R5Lp*kqsea4|q|>JH7KZcDp8xdvkgRM&Z@m4NK6_ExsaJ=}bJ1fl7oF8#
zK)HOTu)v2K9qYaQvXb_V;8LX8@tU0?v1b)~zW~syPmN>q9bnOh9zUTyP}FP_SuV|T
zpsyq|e(E!E!RNG(%qPMV8Im?l6ea7<df#qMH+bItH)v#A=#v(GmP4?{+_Jz=q$KxT
z!TJ?(J%<WK{7;XE`qT6~?g3k;oJVrQ*YV|47n7FAZ@Zbv86b49)*tK(*~;`!#BwXR
zI!}M+b>cq#__}~SFB$E@dG<u*gKeI>cBCWBdKO7(12tSx8;msCBq<#lj@}~(A>}gs
zHlIO&w4LfUC&U{EV@YBVpBauq3BFf<Jj{W8`66a0Q<0G3%d?k*%52qxen+_<Df7C-
z|A5KMA!oarQ+AB5Q_RMaCTyKPaRsp%U|8C0`Jnd#nbA<>81U3k0vd7sHPfEgaWXIt
zQ<y}MIxu@(hks|X@`;7{HS%{eP<*sOXnwMU@WjTrM2c`6zjf6#z|^gfT4damg3z$U
zk8kFl2Q7pspa~j~c5?x49EKHnHzH#KNB~7{cG3Np?aaQ>vP!@{F0}dr(P2ADFpSeX
zS$8Ag43YD##9Q(Ikm}wQ;|1ta-{W`TFrjICphTHPg75+g#fOLb`$QK)3=<KBcc-%!
z<|+UQY%P`AB1$zeSz}A^+CdJ6k*9W*S}y5HgPVoej?RN3x)FUfUWYdV&waaIU!?m$
z<V0z5uYO&_zl38_2X21rp`60gOFzk^_`5k)8|YB6G$vDCFk3tsXl@$vJrIvsg9W2z
zXPREvx|3yke<&Yc`4Hg{4GUY2uh>+tH*lY6^bS3F@Zx1@s&tS*LkV;8y^DTq^27Be
zuF%0U7H>mz9uo=}R##H-!=IwgC#z3VR(@~cobf#V)6Ai`9$}*GT6h=Bxw|jdUOnT5
zB@3oy(tf;pNG8>yrg|s)rm)J{6_-2R8Uh=9<N-kUM)uPo>w<;s`F`T-gZ<R?&wk2C
zMl(9!PfW<96k=IYZKB;twyhlN+NSaoPT7Po5%@ZAV7se3tBGdN>fajY=}8tFift?q
zsQ{$*1xu2I8wyb%cg@j!(BzBTprnBri>Y<c?gd_vBkT>QgZVLue?S!GAhgKjeD-Pz
z7@N781!o2NO^*o!is9x;Jf|Y=t{*{+s9IleX}SJ*!%a$__SYRxAR9aKtwM+3zB%3s
z8TsmIsPF{)A)Q2TAy|)BpuPr_-5RwUc`nm@ul+*}A=4}`y25~djh<@$HV^cvup5XU
zLfOrZ?ZZrxg}MOa<4)5DNe(q1(ZvjTz=MUhqHH%W^et7<6+O}>B~4EPvqnf|u_Y`6
zaG{21<T`^fCx=;sI6-R9!>{EY0H2aRPD94CDb?<$L3h1Dr)n)H$;K`7)!-#WmcS>R
zO}k+?l7<E8zP5o?tYJ5%O8LS<EW(3u5JmuYpM8ttRjLqc8uXKt9zBQ53e{1j?Qbz_
z^%YPt)PC{;V(E|i7j=VdVtUAadmuP{Q6+*C<_jtsVipMLnisD*&k&;U4LS)7QlABX
z_lx{AML;X@jUu$2S;GdydaBmz|6}j1qoRD@wqFAg1VrhO5TqOFMnoi)W~iZiK)Opx
zK|rNjx@+i0x<MGaq`SNKHU6IW-OpNk?e(tx{Jq!m>sroN2e{|Dulu}?^Ef`I*zk8*
z^R5rYmvo~+M_$Rfupao}sNJY1*=1@xbf|F`*{F;(@@TDViqx?a1mh1VRmQkaBq@jW
zZ%4P%X99nvj0fOTz4;f)yIiBV4!r01UX)V^O7Ni8*c9PJH(ECw?Q7u<PyX;NpVUa_
zLzLpg&A%;-1#DqS$Sv&T&A%nLb@Hm%6scVIU3z*&t)N^sF~ZZ#>>gPC)2zRtkoc#r
zB9Be+%MlTt$Q;Q5P{9H=1zpJfrF@YUCYUdtZ<@^RvX9{fr8exgZMqkpq#z*xajst%
z0_5OO&}t<Hs0<Sr`bXDUOLs5`j#Q%(_npsdtz#K}9f-l!OrfMVx!s3W=D$OOYcoq~
zvNda{bf{N-QryOblr|HdS?H8tOMnuzeprm``T?f3ssygw=OFZb@=fLs<b$yst-Kg(
z*qm{+-2}472Dyp<S!{`)TF@I4!vU27ijBqI(W119G!K@7Ao=;~{oQ@J9wa8{#RF-&
z_kVEe@c<*cLi<bv6Mf-pJ6rSmtoe7mawA7=h>w8F&AoXbRTk7<jbg9ufqC*;bswQ}
z%rsc+Z&aqqkHv$TdoN16KsaTG(<7*n!(n|WK4t_6aWD6mh~k`o?$~ycnHu_=-T;M^
zTtK#bR+beErC#g+bD2Ct4Zw!#nqd7%7=;3D18vAyk88Vt@S9Sr3zOa0%iRgb)pT+o
zSI$*lF7SnX%q+#wl^pR@p|)H*Z?!=evMGC7yZ0D!S6~#xJXq5JYA>s^Asks|eUHnH
z>;W?&THj%u_gix(4}S(~%Sd>+jf&<Xt<rLpK<|rLaf5-Judb`W;D)u$*pZZU2k#WC
zdg71E2M*(uWHaV+p$?!`l#ZM4IP>h-elSo<2=WRz;WOAB21U=YfH>=A<kE<V+}rqI
z3VF_%EDuL{jD=H()OovVlNr<LuORC|a1n(DYw&D~h{3Tbd*OG&sFj600=YGGZ$X|7
zu{<vGN`X4^`*M7I1W|m&e?RMAC`|1^6c3`U*Mx}1jre&_w@6Ju43!J@3>drn4cUD>
ztr}I+BGxd;Htvl^{f27f(X<1qj=%f_dJKEU?|nV~UOd_TeDgqe`6_D7kv#deKKrVp
zyl^(_{bL{)xpxG;6dzLB%{c;YI-!v?X1VCgM?{SVY0`xeGePRvKntq*Y4ZC)M=+dx
z03?B7p@5pD1r_;a2a1o^<X-3chTznin|Z$s@Xh>rT-pwc2JDtO4o{!38%5bVSdW~R
zM{sME_?^`Pv9+hdBRYa~vl84QnsX{=Q<iMKOT?HpNppzAjZc_+`CgtYquxS*LiZiZ
zHv{Z@(MVDL4+v(C+n+T*#OC_@qn()YiV_2{CMj%VYis1oOehc-!@+PI13nmuclj{=
z@7Vl{9*r~yoVvX;Gl~t9e`zdZvF}kHC0$Mdl)Y)Uvdd&65TG%IB4|cHgHDq?chqiV
z;trS*wG%&MS|>R+KjwrF=xTL^Pg~dZb52}?C)zjAd+hRAV+5PL$N3?cBF|qI=7>4l
zyCE-KNQkMQ9{9>|Jip)(20^uhHQR?RUGs?K{2pY44H>A@xcn(Fmv~iOJP%Hw8M8zJ
zo+M{}nl1!z36>ADoq6{d=YbVSrJ)Zf%iO-@dpdN9<;y><FE$FQgvL^_*Di!41mU~(
z-2*lWDx$}|>dE7?b3&`(Kf`R+A0qSB-Eg4h&iiz_nl^Wu=Ivr$j91w}P0OcjC58qq
zLqkiIkqw`WoY}_$$o&xYKl`BrazC6o-5jbLj`SUHGUiW-eaqVgPgZ!RA3idMJ?fTW
zp7YfX4tfc7iC4z)AQ<IvN*-QD3k)5|4RLe@rQ@xtk)+}>N~{v{d<Q{C0(X$fnQyG6
zn5CDW8ACiBho7;{An6pn`@MrqSp~S50(xCvV~&urFHGpS-+jzZBkd-Z=#jQwXXX*C
z5U1?le(_IH>GpA4dKj`bT&WA)bY`Vy!HMq!(=Mo&j7G7Nlfk?&J*%3P=*A5r@_i9E
zQ2h~u23_eelE#iIWLg1QHS8=s?XU1?qkiMOWFg2)-M;_$#WM}IN!DVK0DUBQ$ZV8*
zTeNA#e~3;u+2$|4*qHbl!HOpUvg_xQG3lyVfyE5z9kK%>6brW=y+)V#rcZ?Zn??}n
z3phYqkEM(%{Op0m5$Fs;J=*?cf1r5yF6>ij6VO8^7Mnweby3GK6pejfi!wWgvE?KU
zaz%!_rCTH0nzrB^O9W6nW$jvC7b`3f(#`~s<R75<3I;oho8rwIy8H-SNGrqI<Pajg
z^2A$8ux-I$hpTQq8#CkymP|-QEw#`UzZx=3%@#kC#@V-14*Rf%VN-lKU2bmp!gcva
z^ix5r3HBwhr9NdA*_d!N3A@ZYX#wt=qcy>Fb5YhS<cjp0H)7{H9gZ6nQ9C1q7(MS@
zvW#KXDVS%h6%^RH`VE;cHx4QjdeK@!`a-oxT=%l!@Gn0OJ&A9@o=(NhzoJmNu&lON
zmSW)2HQF>K|N8ngVjXOm;DlMf8t(ATrf)=FK`P4hd?x_Au@wGHq)QdrLrLz%q{p53
zYn~fRT=a~@P<-v5v5<>7eVJ>GqP_zt4s4A7AUfRxuV5ggmr3)mVJdpm!$4`4GT+UO
z<B7XMmDjqu^;BRyJ#R0^`se^>KR9^0olp)Mi&Mh*V@Iz%y7OLkp_f-M!l`Wd???aJ
zHccKxaUr&6>#AT>ACeHV_7ok&7W-P8^}1xBu*T#jwWNSbyl_M)ChxR_R3|x2b-RF*
zo7KkO3q>6_mFPN<E6_sq5x34T)?OoUrP2liijo~|JJiE}puXH3zjhH1r!e5m`2A)z
zl;zv*Ul`)zvob8CcD~$Pc?lGavgNNBFijCcrF(0mJxoQfVTpz=5pse??F1downXQd
zzUsV0yscZiNCpDHK;olDcKk99A2I2^2B5i3+#zmpM%fmOrXSQ&n!1%Y$%KbO-{uc~
zJZfacAgxc{^MW@seGrQH+mD<4+gSK>CHrDq$N*@C3^Ubrtx={djA})Lo@hEM5zQiT
z2sXw3Z*(J$`hdmOP;dwE4Lx*4z*{<;y*AKlDB4}@!1;rR^=J4zL16j$P-m}}<%B@~
z0YK0yZs9g@-VC&AaLH*!0O7ZBK$>#&VLi!*H81>*{~|Uat-(pNRx45MH-8Hprr@oR
z<fAHrXe$#+UpQ{p(p*&EaHOojN_Ii9eZDfqz#($g2ok%I(T!p!fmNeh%(0q%Cdp4>
za@&=^P2U7-UI)cwnMhc>%-fUApm}m#rXxPcQZ+bH=<b{f{tGBAd%H9CnzG7(#*A~&
zzK0^Pm<mRet7p$eMPnXYK-G@EN;~=$Y;LsE_wmnOrb6Q&L>6h=fY>xO21hQNyoSyj
zX7mj3taVE%=FG1JT4Vly&^+(|NfmS@Xe4?HP8^Z`J{R{0v&6Gpz<?|N4O^vx(hd>>
zu%+W=oly@G0I!z35KyHIc4ul@xRRe`VL0iN+;iz*neHx!#0FNjaGBs|t)U%&<|f97
zh6<PUj79-47>uRVpyacM>igG}7qDYV<1Dno%-mk!ul|%*Yl_$X<8S^kfqsyRZr~^E
z2Y-n*FfFXS@-eO45QfCEowsdImbEAH+xu@g4*kT+l6tT2*7z)o&SHyC2E(!EGq`eE
za=<nEQ-3w4L5-}RFtLTp4evX2;td->O{J@FuorDaL1LjOV~erLZv!^ui=DJr$wu-+
z*c<%D<MrH5@Uq6cr)*=BfU^|iT0EPbZZCj;@}-<j7EePOP!BT^BMxCYBfUQ|>twRB
zOeIUf38JS}rBao=F87{cRw)|zAP_yVy-~rHu<0iwL(>AYAPfNvy*6f^WBDt#DJUcl
zeE&%lamG-i1EF5Hux&30$#<~SVQx5t*&IFkj`Ynjll{?l?TBCUCx@{Hu?jfvTET#`
z;+d;;QO~6-aR=HKQJ5IPpf-@1FF%*Qr^E(sWU;2o4E~fHW#0E?$zE11iN$GNu_r{#
zBgo!qY~5$u9tFzYvkNS71wA1Z`F|PE@Bd_F1t2RM?}?9rCiVYDJ5s7Xh<(N0q=b)4
zD_7FP5u=X>4)j$bMei&0{zF=Qj)t6fgB-tIfp@-c1yr~~GW&m2%J*VO*5{=LC*8kP
z{l}ob7*Sce`#3pI!ONo?z3eQh*O(GtZNV2yM4@L&e4FPf2T|O)l^+%$v7k-uEdLKG
z??1m|eQvIIJz~aA-Cqx72RpkyD=&g_YTz9}S>mPm)Xd~h==ou_0fD=qC%*U5S8z1N
zYg#OLiDXPh#@;(=#c?Lj2V_{i=f9qI0|+d5Q#bUFqKMwIoEk+hf(la&HXQoL_j`iv
zj+KWsmDFC*XzUz=Jgn0l-0{DE8}Vq!(O3pReIslF(=|0fubrhhUgKS|FY=llzS{4k
z@czQ8Q~L#saMm1MN90B{A6W$8t96xWGK27h4+;qi_~EhA5+>i{<h;7S35X18JOH5l
z>mERO68yqdDtNGB8vH4a8=Z^tK_vd@u2oO4#aVIK*q@Kek0n>d{|g_8{Fa6&(X;{E
zY!S@5Et{HZ^mIP}a`0EcQ|A3rS@r|`jdp6E6+0w5?;qUP&V?MQ1*SP}jkV`9TfRlU
z6Fv>V_@<Hdn*0z8K>rw2@M#Th4qgrbxY?3tv%eZ}B2%V*a7y5q4S~-mZ}J9wL)+@J
zg=wi-)@h)B`hTyIU&APYn8Z{A!e`p~p-3=bED#frJtd}D6COZY`xT3#00>;*1$B)m
z%Sm`9m|OD`=$#TAOud@_NYLQxi~i^9e-wX!c*!)8YlQ=fj0HfEW!8>)RrGAd)WE+F
zEX!tbA9&0Cj0ZuH`1tE>nDM|zhe=t6hQzM^*Dqg-=X{`t-3}^DQ|>&_hF%1M8V;y6
z^3|v(Nx)ic!D&8ZxVbtbq<;6UWD_m@07*XtW2)0j98KDhKh&>H@M)+u1Wk(I(2If(
zX=P8M68W+=csV-1>Dof}VnZr$4Lq70p8YBq66d%R0<ri#Kh9C)9kj_Z7WLn+4Lb_5
zFUVmwL|OW2;mseg2_WMzAz+o@WqBdd%3|E;%o-(P0O=wtbl63$_7MBO$hyFeuw=m#
zTlkMqi}U=KmqyxvfvWT`U$BZNn*|d40T+@U6D+8JjbIJ@)a!2np<luGPlfZV;0s!T
z-X8|0Cu1*Za-M<~`jB)1)qex7igBQWD4rz9-%9~uSeDBI@g9I>q__a<F*eG$5WES9
zPC4(*8Ej9KrU5Ah2{U}qiHTfyU||6=bqSy6?|5)?T}%21EdMW7HU#&VS1h-!=Zd1&
zreSv?c$d%UAJtHf7!Fl?f~n3FIJQ8$(cl!rQu4p8<BvEGL~o8Gh(H759B}lQ({q2S
zB#Z)BGd+VZ80_{HIeJzb)QAQ^ieWQn(tsg9=Num79<mFq3`6O8?;~JD>>la}$e1}e
z;N_KV`JO?$Q&LO$2gWpF5XFJy^a6U*rWJ@KiN&gPigCpM6g#UD56lQmvkg`+{@a!O
z|MX^J$-v+jN9P$W|KBdaziaxREBk-`{i8Vm@D@0n!EOJ~fA|08ja_ko%_;d9!t+1=
zDKY^(w`_Q}w*z_W{*QhwOM^Sbb=Y+BfBaKKA+s_v&TORrDDD4~xA{&7j0^w&f)IP~
zZ$X3|uMMWKAz^=|VBpJFz=T@Sz$N%!>l7>G|G}jV9CZPB>3`ehGnB^LOG{*Fqu~wu
zQH^|{5R?Rnc8Sp)AjTt!t<|x>W*+<6G)x0{Rn2CqOOaIZ3E(d%XaZS1Rux@y$xGl$
zYzH6!Mv(aTo0<nwu_OSvv>}z-n+o%hcUGX!Z2<n0%_ph!czK6}faX7~#CVPk_69;*
zP$>l?`v)?vpgau*#}@_zR)BQ>uXXV(;GRRs-SwL2BKTgO0WAX-nE_Zi|Mh>t6DJlU
zPT0Nj<P7+AzEFn?!9N!oMSvd-PTA}n2>EzxLu`~pW*M!bjXXnLgI%f({9MEdm%xZg
zrCDzFT+s95n|dF25Fu{!N5^dgF-RNV$A5qtMGM&DWRc&-pNQS_4Dd?efyKLkj!ipo
zlA!2v8Po&RzGeYPP9tIKWxBzusyg*0WT4TlIvDrbRFe$`4q58Hgug6{YO*wd_pcqq
zHC|3t*`%oB3-^xp1GIP(Ff+Rn5G*cJg)md?8@Pi9Y`N|tE1<}|RKllw@~!#t(--u*
zZW}a~^{hZsEM)>JQ!!)-{T&L?9y>}iwk|saOhPUYtvBnO*aQZxicp={Kz|p=TrpG>
zNgoXcR6{|#ut0r{J}Npyq#i));v)mc)fcM?EYvLkVD$EdUDwNayJBk|_Inq=Y9PUj
z>=5E1!*ecR$Zb2A9o-J>a})wBRE?lzvj|#0l}7iM?>mGcX(F6qzmFV&^A4xM?F0#S
z4~{G@>XQ8N$VKgM4f09ZOZ0efEayJzdzVTd{ub~!d<(h}=_V0w9!Z0<2&Uc#?|)^W
zI8DQNx2UU1Mk(0!d;mRDV`4q7&Cl!UlFYUEht}6hSl?wq4<W>@rvlV&gCQW&q-lo+
z?_^`HKq!sb$gTS)2{;~xME6`E=l>=G9LCt5HWAkt#t;L5u<C79A&_I=-TqMPNL?VQ
ztVqN7$<+=pMU;ILjOT$_Y=p3f0fj_|dIg<-8noh&g&1Uma&I0uUfwp9=3Gf`KF~5+
z-@_K#_d!~G+kq6!k|h^sP?x+ccD9Fj<%lkmkhvRU41xDcjyD(!Cuwa4DNq4<)&=F)
zo)GvKi$GAvKb!Y%;${m7r>2#U$75?1$j$nY!m9Ty@3mMH1VF|%P0-^|g%3d91|PU@
z!%iOGJh%UJPLvI7<7uD>N&`8TF>QxgO#5#>H8n`pl6wLq!wZ}?3KSGqNpo5^wnsm?
zuDFJ$1)6ULxmK}gW1}fXy9Jtm_;XV63dF=tBDQ7guaIqKmIggArD_qRE1v_^Ga{yt
z1(Ww6j7FON^S4wF>0v*)gjFGFqFU)>9sNUWT)HjiK>bZT9)&-~5oKh?dP$wy(Gd}D
ziS5E~AXzwU>x~yBMc{Iqeb-+MLjr+6Z-}?CL!S_@q6F)c^tz69b0H9_FOH<Y`s5yy
zu3{(*-r9#%0OUm<JKcy<-dE?!EOnw*4}Hs6QL)XjKZ!H1Pv^b8Te(;d!4$|c^OAPq
zmF<}7&Mf^O`ffKIW4i9JR<1T~Yhcb?0sxJHSf%sDK6IVd;~~q6c`hm*V4$hn|9VG=
zJIFFpof`cC&xuUHfnAO*AaLU)qg{;vPAsZjMI&!$9<`}C$<^qvlzCNAH4>MiYC4jW
zriMN8teHJDoVqGA^;I(w2uiM4)~6i@Y`8MxXpQX8{)ewinQrZhOiu&fLakigOB={O
z67PX*8<m3oDrr`#f9P`!;JVEXG-t<+|7wnD8T&4|!lRE+DUkmqxqzqIb4MZPvOK2V
zm%g01A5$LdC!b_hwZ7px0~w*xWN*uY(sw(qs|9yp8mZyN+G-F=qazQLhbW69oe4W*
z79fraEwgwP#vMnLGi`zGj3n!apUqq?Yb<Jf2at1Nv4LnsZUw-V7VW{_U`hh+@r*5j
z*uTy|h)gtyWrLQhYye73Y4>wFXV-c#)0GHVdJ45@k4phgwKFO^?Be03m*au^JND2|
zSVs>Fr(8I(^o5q%`QtkF5PT<SG7<lMsW((2up4srU!eQb-AgiC?)uRIJ^{-D&=jm#
ztB;%ooZs_4sx}WGMQIy%b4FODQjcPM7mQVYsvLG9UTF)wF(x8++QnFhmmr2{YS{_)
z0y?(#IReK<UjglH*3c;SL3ccS1!d8`I+(s-2J;E#NOIbirF3$p>L%SW%`*M!lls*F
zxge&%iyuw4plwT%^*meO%j$X770fo6-jE(@rPJnzhBBN;hprs@YOsj?BIs+xieM}I
z$yc20b$It=bXwVfA!~1Umuun}SkkMnbgm5*uNmJJr(OgU9)L*v?1aZrKNb-rAntE-
z1~w*!9EQn5Y;m&R$FanDRwNdizmgQlpRof~-7LpTrIT1UHa_`gI5(17{rWw+<=ecm
z=kH!us~<iwhX*`o)E(FZ>jV|k9pSV!wKr2!rtfCmjggYCZ9hq8h>Qf9CT}bZqq$A)
z^)w6Jr*0on5bSTB*kAOI*(J3q@zr-D<J9~3#da4TdreK()z}b}_qy#FP6NmFrVW2%
z90jiTTd8A=z4RBSY2$3-wd&2@HTyrHr7(hIjia<4Bk*d3v0nOauoQMkA3muI=))#u
z|Kk^PXEB$>3qi7v12+_VUBHsU9AS#-<$HuW_woD4Q`g=HBN&N$j~N)t9LFG?E`WFO
zz_wYV9)KSz*5c%B+$x^R#hgfz4bB#9^&P(d)rX>2|9H0JIK$|#aj^%_IqZlB!6p0>
z(h=kGV^>wmLoa}EJ1bjn3DgQtwn;{gvXBK!&7rS;`lZ!1Ah3T!_5kp)SN6ck*s&MA
z;B8XKIo1x>uvCqisEFOiP`3W!*oRloD016eYpC+STm#eJX7}%Ww&fb(vzZYWAbuBy
z!;xfz-t+quSh3^-p<o~maaN3ydNPuPlMyarL<V+fF9oXKovVyA9iZ&l-oz#YmgHLn
zENj*Be8{F3B$|c+Pv<Q9#KAh3Lg4FuEJ_-#&vq1i(k3A~mG%Y8c@*)P(CV;UF<&F)
zuO{&`#iLFsmh<yR9eK!z$|~8XZG_~$uhZDT0}s-}CJfL7ths;l9`->A<k|;$KL+LV
zQXT6KE|E)Oz=yDpEVK~h06XJ1rHbmwvQbw4<i=m5O&e|X%fbCTM)i^=Fh_@IH5h^_
zVj+(c%m~)>&tr?$f4j6snskbees3-zTfTGP$>#GFH)5j*b@$*tf$$n;ws)H~<-5;&
zIHT-bPnpbfau+)>IJ5NwlvDlIs=4Z;;(A{bpKq>!wi&Mi-vUZ6Q%afDi;<7YJEe=;
zty`GioEt8g`}jR(qX3V&zJMp@$u}J-BF=fx?u?TdjAzk(AxMWlD#8`RSXsaHmxj51
zS?>_H;|sgfvD-pH)+}gH6|!A&2Ib&=VSCfJB4)XCk8P2|7mwzzWbC}gXIt82<$<+V
zm(Smo{#{*JxR>}5%zTCTdjs1GH!3|T?lgP-Hyo3}WLU4njwKOEGbw?{12Du8^WOgO
zT(3L+@WO42<Mjf~=Nd!=x9`0rk*07oy|ye=`>!GK3lzx=t9Im@E2vG_Y=VDtPn9EY
zKu3)lPr}~ZK1Tl#AV;?NpZkm0xt+Ip`cP<^2M8J8pK_eB?X0=H$Mzkmg7nhkp81qP
zKiz3N{E_Sc;ZtKzN)X>Y)A&bvHbyLcOBoBPuJ%k@sv)hi%A&rHbH3L}vpPIlWEyh0
z-32nAmpI8G>}e`n)Mu$FV$M%2+rqnDJt(P1^0ltjYy&|pFkfXwbU$MOf=j`C?%M6o
z`=R(AG5Iogk9Nlt6J*wYb$Hd$`)(;+!J~v=&5$=r^b~0{u5}E?@vVijvv_Pj=duQd
zBa<6J?&^wL^)kc_oLRQAdcC%)AlqK{W=Pt<^VPF(pX02M3pciOkFI$xFN&5}&UHVd
z?5EF8CuE_@-AMX1k1+O;yi4|9{5j7v9YY}fRJL~};w6ttq77*|PZ|?y-87@af^mDe
z=EcZZ6|kjbBgTc}13&_AI_<<qpEzmlAn}{#;IDJzq4A$0vb~(ipD)n|?~st~qa=Yj
z34Q$Dj8taMz(X4I59*?xQ%A4#(P=%M0$8$j>kH<H$MU5jw~W8b>+UdcZV9cz>xpvL
zhO4FMdsSLiri<%SX=|5(ImBN6Syy)?;3K~-Gv-QhSwtUn1LxOR-lyLzSNMJtyyO2Q
z^{t!JrNP&C@PD(RZ^6Gy&|KQzmrOz&mSEd_*{9kt6<Ym<?Ux2>K*|a?H{-;|(->^^
zL+vtfAK&lLW<pn&xLwn>FG9edmJr90R+h}(r9x-UaRC`*ig=Cv&615Rp6{`ZFOlWR
zgT@CNqxms(hA!VeJEw6yoZ2=nxsR=&*a8ar9gBz24NV|==NSr3@i>%LC;5iqBEOHJ
zfr|g`T7z6GOu|YZZ4(o?7M=V5K7eJI_BWv+bMZW0jJ<AG8mnA#KF%1~rn)YC0adI`
z>|l<cdc)sBp3v{v%s$RsE`Ij#jw2kl3FBt$XUsLWL*kD|JK(QF-L|=m0!v50b*C-s
z^~_(YNpPpu0D8(jUrIw3A>~7Mg#Q7B5NYlpmm|d->%kA%NFQleZfx)eM8gA-DaEDS
ztMg%qsn2f)2bv1Z8f@&XJUV&PntfWvC4nlJ3!Kr{sEbSKgr>TirI%M$3oQZBysp_Z
zic7to_21j1v=51<fd?&vGe&H7kY5RNEB&blW%l9O)CUW|RN7N<w)7h`%Dpm%L|Zxj
zakPPaSc|?)jX(>R7Q?=O9o^R1I$-KW5*QD-6`}brOlxezfFIEfN_6g`*pF-f=0v2v
z!-DTW`0ZO<lih(Ts(4ntT{&3zOt>MKaeslj`6(Xt=La6wne-ePf=hi}*pc{-doA<H
zv85Q~xFTb47=DI}DX*ISN-0_|<idk&z_y1L?4sAZn}MF>PlMsHbm+4D8)ZyZ{3naX
z2LmO#WNF%LAy$VL%8HORj+mA9PFIDqf3<;j<C5e@W98qu9_+$`=p*pyQH7(RXrwVq
zdu@d8J|ZW`b!h_5i^VMoFnh2ym+x%%M<h$wy)iYS*s;<<r$Z?gD(0^CWT{6xZNmOV
z9IC}42%QjQ1rZOHODn{8__Z8UYV@`ozo7;3eolP_y(dS;>5g-F`z>77&$CM7T>!1i
z(l$v@*!>i5mGkGoNbZZZc7hjuG}OY=K>Xv<Z{$0xr~QzY0_M~U>ATHDW?N~Ee3y-7
zn+vGH^xN@>f9w*ir>&4IG|6Z(BF~GT_2(CIZp#}&%f@R$Bua^$t_fx?hn>;l5XFXs
zsZL+GJ<j5YW{*iETpjPI%*h#vWKj0MI7B$<j{DZ&MUFl-^#WFiJa+H;kawXZ{A{k|
zf}LM4B&4pd=I@?vkApM4Oe`C^_C;J^e9>CN>tPTbFz4Wi882sz>mX}6ez5tCwr{1#
zzecXgu@Pw72Ahc77Op`1cFXs4l*$~*a;>WQlUeG_`XtFgZ}dpCG|uc|4`6PyI9ZB~
zEb{<atsEQJU1>k?(EdVYi~Q%>fp#*GrrASHml;^5g^YiLqbplqx2Trj(Bo=TWcNjo
z4O=d}yyf_>r4BEaw*Q8!LhL({mSZ9&%?b+|_D1>e4g=(QHY-SrDXzw&zPT(9O}x{-
z3T;P^?ESAND8C-YQM6p}v~wZK9SrBuNZ7<c#D=yVnfZ&$H~(b4v6B_kH6(z}$qD_4
zHiD)k2Hk%$G@sfj*!qZ2n-WBnw}oJ2664KBqsJtBuELwrBj;i-?E5&9K?Yv@^x~2I
zqFiipspmAW)3$~!@YY|^I4ALnl0VDJHW_zyO#_*h2eo<1(0PClvuFxH#Ue2peO$}D
z2`KQS`fl@t=Y<vEkd9$brENmj5l+EIxi^A_xVcTU@S-=LeS8iJ74c8jb7Lo5eQf-|
z@IBTL)<FWZLf4kF1)|pE-wnF_(P36=OnFvGRK@&L3d%7qyRc>OLTk`8XHmA{1XYkw
zbNyeSepr-pG+D6bGyW0`NK%gHwMi~48shK6PAC+zAilHdJPu=E4^QoZm(&Ja*na0e
z%UU(}V%JRQRT~7Z2CoA1gG=Du)0PCG=tV%8v`xYmP#i<v#^Md}+nQr%^cD$GUa?Zs
zi^uN(ReZD(4(87$XBzL)^{FDwf)8FGe9rP?ZGH=ddz|I!hSx&h5ldX)RK(<yiRQch
zEWvXWs%weH$3xac;*MYJ3Yp>E`SOw`$dfA}^@%pg8JcmNOm)W9YAAy8^Zam*M)d1m
zJrb;%M&?YZer9({ZAjMdgwYTCUtWWmb+upj19%&s@=!c15_MT0Av5WZH`dbK2O0nt
z^MeyV)3+`>$9d`ewq|;9&CG9ftxB&e)u(L-!1%ja2ev(1&Ux@q5Oxp|pgP?c$sVJ1
zA>;J!de?IbE<j}{_2g6LgCwJ`JHX3ZtHu^bSGgKu-O9!FMWwUkM}rV^7u*K;LrNxz
z04d6&aJL#-;$hbCtTR0;ehrYGKQfJQnW?f(o&w!tT~la8gEA^p7WRnXTCc?)otyl7
zp`vhipgDQ+yaJonepY~~MT5_kY?ydWz!`7S%MTDAHdo_11dCA9qeslppmXs{!up18
zp@qpaz!}2o;T*A)PN|Diiw^i9){gD~*gmHP-v==r6QZQ#UEC+YY3<>bf!9ZzeBR~P
z%CMMP8!wclxZ;a993>(GF<YmH`)pfgUe6XFq9+;i@ZGLfn@I=mh8bSb0t~CyYR~sa
zBo<a)tZ<tTzcpE#5@;~aUg++H&^tCYebJL!(pC1m)?w%*t&|qB=(!FSc<fVY`fqh^
zkEd<T!IKAAP9*4_lSlaIKG>%$64@#()_R&i(K^=CEJLe-&!pfpkUhrT6_HV<6YKt|
zN1#a{md&wHRT}{Z^TgK)g-?#MY_s%9P$#E~##p}isju{ifa+!-Up*qJ7nJ0oW&c%@
zGsp_xAWL%j&a(2p8-Hg9jVOsIiiu8}3;Mmi>kc0ws0mniRPH~to^=@{zrr*p1INo1
z|F044$m1m%X*MRjyO>4N7`g5!s9i-u-TmQm!z^c&;>@05tahx*v{AxDc*ewXHj1p0
z5g_k#Ds}_kZ^2!9*h|m^(%L7u*KDZK)X_^avm(HsoqB{u`doIshw~{wER}R)5*2hi
z3=|F!R(j$0M6k>R2~IPIr(X}XDp_f)e#}y>immTv{9BV64Rd=Dtilxy>-f22L2gIE
zmLCxahIqNH&SuIIwjL|QbGd7|jku?nLg2#ei<qQx#UCo_TkPIj<b18wA0{~o_)!3D
zChGV(4A(JDv<-wJP;I?H#5K2+z3ID5X1^4fqe>xW_v~>VX)SXxKv>4+GcD6#lpx|a
z?vJ#i%I=I|WCigukyYy6f5#Q;6Hy<+H4q`<+%VN^59HeebiCgnVDFWG_+F$AQCMU5
zrr=#Xc^syPT;}S^%$e3Z;q`|!%f9m&F27T_{<c0EDGRV6lP^wk?B)OK^Uz}?L3dt4
z^|@?pF^C{GUi|6@sJT)b-BrRaHBAqdWqi54_{s~E5sADpLP=fY#TSmEqMUcaHf{;d
zC$8E6`RbjGS~cv&Ej!EB3pZj4DRS?1%LCdSn70@qCV;Y^FqHcc1oPTv7<-zfhE`>m
zN=XgeJS#`J&58hcwWzY1UQp&!;}$47r6QL#my(g(`AR+A=1C|(*W|N<MWwK{59b7n
zs$WL5FCAv<mII0s3oXboHyJ2OP9ruvr_4Y%Rn|)^xtT~(oxTnTaDTXQ@)E)az&;k~
zfZWGa*^&jM62=5u-5k-}8^BgpEd0NhlrFL=q3w?Lo(6do4*k8vSIq|?K9XS0HvI9m
z@=WQI2vL*3r(`7j4KWMBHO!979-B1Zm(U{YO4`D4`i!ZB_X2KjuB5tY)n<ey-+Xcv
ze)x$sIF**fYcn_7Z8ad~kG{}O`{(Rem%vfT94-nM22jxoJMNj?yDDdLJzRvtEmZhK
zLFjpa)N_=KFO-y&Xlaz2Wc!I!RG-m4QyQ$G;PLZ4efm6#s^5veAy_F&7w<c*p15SG
z(%a`5iJ!)l?*?zr>f#%$c)E>DIA7Q8d3g;UH7fH&97@x6zXDO{!<KXXFyx_qgL4H#
zvFDNBPG&<QD1j*EsiXF=Du0~@8V+YHfs;YRa#O<-GreG;jkp)V@s;>W45a?c2;~oC
znW{1mp16~*SVFI+zWAw4-R?R!^@iz}Jo3DwxLu%lw-9@H+_2}##?Kt(c$CP$`H(io
zVU*xKWHh5wL>EZ*0n(&a;esBgv4&v>wVs3SbFUAzg1eQ%Qc$}U_kaib%R>|b9N!{*
z?#I(Ar;oKv!Z(@gM7Y+JChq!eyp++e02rP0L`(mAKS=cWl7&WYoT~h51ixCvq4{I_
z6}Khmx&{|JiRKLTol;Zh_U#Wgatk&?jDU>o)U`Ju?&Yt2clJObXkch|JfkozbavzM
z-E-bZ6`#AmO3@;&Y-wbS$fw1sY;W8|LuQ)!xB>rz);h%$7hjN=JxaV9B68Tz$?l_8
zG5Sbenk_raC9fyyNxMOvL;<{qk-BP?m?cjEAHvEzxKTZ6l8`A9Kbk}!l;D*;oI&Qc
z?Xpq-Ep7D;vCS{+nBrK+ld#G^qT7rxV|!Dz#SPi<g5z;JL}pq12Y@gJmx*rbX$1ud
z-2ekdYG|rwH-w5H8Oq-&t+c+JQ>WA-Z9CGDs4pX=G}9+DjVIH~Rc7tZ%+%I3W3xz>
z%JSO5^zKU<ZE$=UH28J4Ubyh-ItcNs-o(OH=--!-1qxH1fR;p1qIxYG&C8`bFh=EK
z*vpK``KaF0W5*JzHB}79cIf8GPBZDsD0ks$2&l&s*J<}xp?Mnt<-B3(4RyLrI7;hw
zSd!}bqd~{%m5^Q;)t9M3H+L#lZK>GoA7=q+UM^JolqK_2QXY0>x|jzi!C}yyP~(o#
zw(DNVFzLE^({Oh=-sIJm-&dJq>@qQJlTiQsiZg9zxUX!Lo(7{3r-(_X;t`|Y)RTdX
z&KD=UnO|tbkH6V)moqC*JC2~!C4OHtUb41B)P+j@yhq6%gfescJvY3sbfa)^r3t;)
zITG$Y*)Hb9vkRmN#XEeH_lnB5LR*l*U=cPZ1;>>E!M$&RseBd-Vay(ZZPp_?VYwJe
zx<~QjZ<lOA&nocqUN2)FB(@Yd?d7XS2r{OgOt<Y&+#OJql`rAme`Gy$hT%gzGr)iU
z&x*4JU%*mR`Q(}9Yvza^^F8+jmw4(M35n0tDDiYd<!M>8G8Og%JkwUnOdNDc4#PQ3
zzr6hL7z`K7P<2fboq@ngj`4vYa*BW<I^M<1YL|5W{M|hHJm*ceie!HP*PIvyE7W{@
zlMI&bJ)t_)vpP`FHX{FTwTvQH%R7dta^ltVG{Oe@5b@{AtOPQo5?2Oxk?G-L1GYFR
zcc%^7jxjr?N%rm@rMdjA0tc@LD@S=eH)Nrkz&yR1E(&=vNHfw?8&X<8G(tP~d<sr<
zFnNU~DUZi(T8vPz{boGb@9};;=Xc(W9YRqGt96Jnjrk%HA2v(Z8}20JShVAs1=)o6
z=jP<XXmz|+HJLgS@SOju=VSHu2+kcmwYlcbVU(q<c^h$-$|5LwH92U4-a%eMh=KJa
zp}r(sDNNZT7*HQrH!Pq1oxk0g4^9m88cfY$7}UKzj5!0Hz^yklw$2rOb@Mm7irT9S
z%Tl73iqH%5wLQ?cn;p;aFYvno7`uVbzq9Whv)vuCWnO!MPq1Ure32O=&oMK<QjDot
zPGH;6N|rZ5jm78t=aA%)JVA9U$ppg2{eY+`zVX2q<NTYmFAkcq(Zuu;eTtJSw=!w*
zxoxT!0)MPf3d&t+YZW4%*C~|WR19+8!^fFl2GItB0kcmfVeh;DXncg<I1P?g{XCIR
zLH5t)oFs#<7%<$8Tqo%@YZo>(3E*7p1V4eX(gm;4#@%6D;510&IQ6@F=xoYaBNWXl
z0ry!d-@4cA9wK)B)CP8XGlkik@kc%TgYx`z+sKOz3KE<bFNcKgyU%o%pVU-|4E}gB
z3ZeB9xV*%7;#1NspWX5ReyaCMG6xJ21OcW&Nn6@Ig|t`{xBEdsbC-+Jc{w#h9i;26
zD~#r@*9=!-W9Suyx2azZ6U<-htMONofzDj<N|9{-a_Eg*!bQe`{(Ni;K%`CGZG7;y
zkjg*3cw=E`2DKmzdbA~;u=Hv~#kqppG&cQj`6!Qh*!1y;qsnZuL{^+5p&^7LOTM1E
z+?Zpr?2I%x9s}HTnh1W$C!Ug2nIU<&9yLprofXneJD;}gA;G1j!bud)Gq#lx%xibt
z^kpF9>2U{;YdPEV0$T;IpQ|(M$>%TYB`7N@PhZu#!io%|LpKjc>u4Y8;6{fbx%~__
z+|suhbi(F+*h|p7(QeNBjf?oj`+*f5B$kl}9b0Nz8dGCwh~H6GCBISU*eh^q(YrHq
z;z)SM-J%YUKm$?U(_?iu054RYe@t<V3@C_T&|=fotjvb$B&Sx&<n5+JRY8|P{!Y+<
zy_NKss@AWwF8T1tJMWt<C}CR7>6B&AphZbPEL&$Q9gI^kPW6WI<!J3$hzD%WMmCAw
z9)uf85A(RjZ%^q5kzK}riHtIU1th}B>d$qZCXFR54Q*U|wJt$uYvYr62bgllH6x=T
zvs3dH0}l)m|Gwb#R#W~WPrV_pm>u64qR_CG>~8Vs1c(5Q-oGCa9s^>-{4GG^@s%^)
zY^pca7T1bBQHC=n)qaxH`k1{Ou+_m@Ea2?zTpY3(LG4}3sMXW=;vgLVNt7p60eyJI
z_xFygU>BSjKOL!TN&1l6S(Fm5giyIu2d%rWwL?#}))+9}8oU?-^+^kR<4K{-qlWJ-
zb)<A>0-cMfP{FmpbjuU{*;|<$Y?`y&8=gY6vjEfGT#?}JKvHWyx7&Q^&1S6fD6|qM
zr*cp+2~pYSKF`)x*N^_?;|n{F?7(ZMy{dm(W~M#C<(!ijVuxbNt7fe<Ne6MOf*-oq
zeqFR#e5IYlSL=0A)UNA|A#JxN&z!Qg`eC=a_9ExDu$V#^BRGCDeX6b@he8QKh;UBc
zD4vjF!C}B*nW#wlQ~j~;v+ECURWH$%Nac67E?~o(;yprh#N#HMa(U=k%}A3UXPQ@^
zu4*`Ja`(~J>NQL?&f)nW?Ukh?U-cl5Voa@mWQ}#15JUJItz_@xbP5*SomW*Dx!_?e
z-E&yufEeTJE+5r_^%1Yqe}q-a%QILgyxywpgc}&A<vROUGQaaY^^#Due}~WQeHf8~
zNjIOVkttoBEpn3E`ujOnpU_#&Aeq7{)bnICUHm5^jUk^NWQ7%=xI5lpWX=5esd8mk
z-dE-Y<T#g`Y|)#IR`$$3I5@*#FX1X9hTb+tVvcFs_x~w_|2hohtxvt{{@^t%NMssB
zCSVgRNnby76YjB0oqnGYD|%%@fgMk6_DX4@<ngfsD@}-b)C((nMvET1#NH3%$c-sI
z0+mzMI!MbH!<gZG%4=dR<@PwcjL;W}fFVkbtlaDZq5}V+mKI0;?azs`o#WhO#A#Fw
zO@`4g@yo0>)!<md{CLpJZ;oy8Pijg%8gD$UxB;e;LKQXt$WoB<Kq%dIl}<h2wVrz8
zNRlC=^;b5WHdg8F6Lo`9Fq<Tdf7~ds@MEN<<GcnXKHKJ4T_ZMKl~C-~py#f=#a!U|
z|6&2OYFK=>1nDmF)7CzlQ$?+HVSrDa!^=&fW%7bYnu;z7LIF<u3MgVV<0)wgc{bc;
zjF~hk^QXd)_G#cppu;N<Zm9;(y-Q$!=>0TpG%Y$`!yGHiKVAM%qzOzhU1*$oGJhm_
zW~IQO_OxO)@`K&#hiPNkjc#IZiWDe#BDL;){?2W^5>asIwfZ`RSY$3LZ54P>6g9$*
z3suws+$Xc;lXm+XLAm)B=BffH@OPe4M-7|^Z(fqtdYzV~2&?d^i;*OjN4?rHMLezU
z*-Gt__MP<_6IK@{$8pDpZ$3}g)0=79kOx53D`X!@w8ATKyb+4&poROalyCW5A@m~U
zs*2IGDbJQ3cdX!~Ve1rICre3Xbdi9=-ud&8b06T^&q0CxA@JnKC8tG@M~_uy)BMGN
zbKq`ym*kCAx)`mc=hRoRC9n7|#neh@D)pJqig|jO9Yzd#)Ef_@S`V6V75H9GiG~Ce
zA4qym=d-FcsTzKlY3dM;0SWv@yw<t9+q1JKFh8@ip7@ql7l3E)xL4T9N4`Yb7z`q(
zq6FBQQ`yAROUS&(wXL|Hi)ryf2BRSw%#Z@*7D)(lE>R#x`LSn4eZnKje$b+KEg1Zz
zBO1JnoL1%DvD-?t6)7SL3<+ajZQ4Nv*1uL>>JCccaWmF8hOkN{3o=j`@qxmqsMJ8C
zXNhsoEcYIBC+rM+S}p<P39@0GubsUM9X{ido8_^}qY12M^m{z%Uob1p=-9XGePaop
zW_B^(0~Vm9;Ay7zpQo9B`6Lf_Y7W0_LH??GTxr2aBKbz}Bzw78=1L*iPpphU==Fgf
zKY!^?{-97js*6$0D=vstZ~@)~*Lx;OjP!kT)F7^V=F4E@G3nF9xOopLhLmdBjm-DN
z@I2G2m$=O&+Hz5}8X18*wRKBjf*q*cY9Q6|X19m}rfd0q+N9WC-cBKX*&snyQ8}U~
z^^iGpiB>Y=)~V6FC9|L_K7J?2GkK&X{%Z{0y>0ew`@;HMY9%$!ThG4_DTrJ%-P$V4
z&1cr>F?4D&F(mte9m^}yDbrH7z(VGJ|G*%^zT!uGn>{}J8)NYZDv_pq4Oc{4=3p^M
z0*m5#Sf1sVKZ2`mW=Z+ENE&Df2?FXwN229}@pFbpg%fIxhS-&#6szVO=T##V<`r>&
zz!9`72J?HT!VDO-c7WCAeq|mX3nrbM1dUb0MEfq1-FG1tKYmLR>MW}cA>3)(*;(c|
zyr!k(Ym=R(%&p5C#*wnPy14R+MDRU0v-K5hKs8GO7Dqc~d^1`tFD$ZS{$Wejx9tn<
zPt~=+<QS?{R2J>-BvDv2OD2u;wT?)94r}`R{90Al=RJ>SZCcW@A|GYEz`;;&N&@i!
zYaCf<HoayC-W#KadirGOc?+RTXRjw^h8{kKmYOZ-5}kcL&u#p9GJ`nPwEgqB>7#}l
zh2fJFC$i$-R$Aqc5_a}Npx28^j+r~^VfJT9DKU-EZ#tyl=G(XT%<gFEy3vYigpTq>
zqFauE2iI(>TUw8EO|=ZV@;v?SX%2}*gqi+lJl>t!u0+|5Avz^%4{*fA^%xK;PQT<s
zj!qp+XmLkkokTN}6!|peia0t|ew?^K<efX|cB<>vF5lGv<bj{~I`3KBgrk`$DvL<4
z@L30MBL`6s?P1ne&I}Z;=jx>2rY?Y~Oeojp7F7ObIR#sGDV2qw3N2mAVUbpTbxQ8J
z??;ii?!GSAs@gY1l<D-;Og7S+&3&@>-3E8vbnN~Xy#;IA0qW(aEF%Z^g3GYzP)EX>
z*2-ZZPi{5txU6m#*KBk-&Kl`x(uKiRBM43>VA=fRX)vvFBC+{3PPq&n$?_5{dk16V
z)C!JrHe=alk7^sYL?aR~q;D0|KJpjObQUc*Lwt1{y=HtJy@HXx0iKF|Ql3tGsX4?%
zGggeUp3y-{EcRv?vhG{l@@n~M4Zvv>M5bJL9-Y~gEwsX5NTw}sBI`blk9BJexbNvv
zCt1{16qz}>_yeFw8I4V;Bt5%!1((-MmJf?OCJrwKZW6p~@&m`DD-`eEP9b_G=0d_R
zY~lG+PkDA(NXq~(mQS`-=9H7RJ-i>hjdP2MX^MK%^7{owSyU$t0q?8n`Q*d(SW*av
z-OZnh&FI=`z0gO;RT#F|kdB|9B~^b=g-HilI==PlfyZCWiu8Q`GUuB(8~~1ZJKGK$
z+GDbWwf?A|v<XrzAyC=UJd$`HWJpYw+DY__+>D(D2NN0bmTw-+w{+ETI5j;^uChLb
zkDICC`012mC~c&Xe*ZZghUf@Y&8E)DZ>38`xJ#lzp<+SCFY2wpcU&3_0k2yByfB{Z
zN;Zogr9MjVl&fgA1BOC(y4%rlF0CE&5*5F^%DYwVgD}XwNaL)bt8DZxaI3Ywa?P3f
z%M=d(OALQj2+!t<J#Pzx4`)adq|hfT@l{UqGUOqLQO)sW<zAboTQS_ox6hYE-JS9(
zFhhH;$NbY)X=1d0s(2YmN``C!qP<^ZV<^`bs{EEcxAD45CF^hoY!X)Fa2$P&siz{Z
zo>YB_agynJxhrO<SiQUF785x~akDO!nNE#b<h`nS^6vfiZ9-2<C4ZHqqtAhql$QRq
z)A-m${ppQ?M?$jCmw==rL2d$tf%&}Co4mGED~;4jZ<4Dy$E%>tm~Mf;z+uX%);Vz!
zdN~HNR@$QFlv>ut#v}MFm!*WvJuS7HrlDo#KhkZi6!h1p`A<k8W1(}Wl~tkb@)$%;
zbFORpiN?7aPb?apba3xVVKq_Y3@#h)zgJ(%hG=SJcol3KgucF{rQ>2P8P|1x#NuL+
zs1RIQIe%J{9P=i3Ztr`}&Df%_^FdLht}$8r?Lg^GR~)Z=^viaBQ*9XPs`ia*Rp@A%
zHw)v~Qv%KUbTaQ?f)2Tev@ATW*#Pa-J+#)}FDkAg1;cD&dVyoFz=pY=ac}laqRFxp
znvmu^)21kBSED4QICAF6yS0RMyfA|^eCwFxTrOu-w@y(RRmu6n!+JW*boMr$4Xb94
z8xo@yY6%W)9Bm(=>h@M7d&3Hxo7Ay9ogx-54uAPQB?*<x%5eR6hceWNcw5Jl)5Uev
z<`?p})@J7JRCXuD^p%Fp7L*jls~dO1Jr=lb!iJ(Rat3#W!L9pNQ5jdd$WF%$M^omT
zQ?}|_JduMWQ*njkchoPQ4=ddi@T&^78JXxb`wM&_Fj2fIO=Vn@(=o112TMw2zkCwD
zQ36+!EgHchJ5!sO#SX~0e93-5gx%gWaF2dE993w=_C9ZoloGU0_Z1dw6ev#HA9r|Q
zS2n8mHNo1xuq62H!`+liME0f9J&wUiDfxO{28yeRPTH0z{94Ym(Lkrf9eW76h0L4i
zL5HS1GpepOD6UA+^&(*t+Nx^bW#ra}o(kbVHj5eQo7Guw{cgb>9`p134I$)<8Yx`}
zmeS`R_*&3Tgs~yC*TM4-ivD}ZE{Mf2hVo_LW&Mt1&9u<^tAHt8^De*5z;0AkJ+vp^
zQc>|q2d#IxS+m@m_G`<nsuw3kU-KgwLkb=hf#@DJL7?<DG7R{%Vcf_xM|5?IDX`}Z
zbSd@HwuCQT=)K}K5Mq8TQ=d8U&Ojo+-$}rUTzOxmVK;d50hBM^ESy22E@DeW6k*DO
zqt&f3mhUm_aLWa$j7-j2x<m3433VJ4ZA9WdemF9YQY$_E5pWmD^83UJH#pw7@`C5!
zj4bngx^KcnWf^j4W2CGii3Bc*lZPFIWV}WE%Cn^PJ^#4Bm+FD%RXn?d%sROE6oJ!u
zB+i=8twWeY<L4c$rYsuCoYp;bue@H8*UlfKyrtisna@rAWH(<tb(W744%ZL3q#c<!
zJ3R^N@rcPr^l!3Vb@Xn#Ne9PN<_wy8jaSFx;i!&Jrj_zcKS{PNPLJdcSq2Wuq>ni6
zTUzs*v&2#%U9h`;*8*5{=Bug?SBEi8Gj%7K1gPeAbG*OV9yLy!>6&%=aT-#==`Dsc
z46PO<cI(aaFd6RbJ4acRH_y!ECQaxvr;(+2(MW1bK~K!im`Dn(WWTZkzcF*Nj56^b
z=h#N*_VMJ}Chw+Tx7s>lB7+v%yDg_mtMIa_3IO@d3SiwdG22(08v;P1u&wtM(azzj
zaBkWajK>)%x(tG4u+ZE{T2CSGGEGId&D%K#9Zha8*s5|@TH}-`%N$z&@5!C?fl)6o
zzAa38XW?H(nHPN=aHAaoDoRacMX6D>Tt54+qGSRUrRroUGjAdfP}ewPF0G*HIsDYY
z@k+4{f~g$&p}T+c@fbWFLbJ{->g*socCGB=m-5jlv#Pc8pwPykTj3(!Rc=JcxG)6A
zv-jCH-JHJub4Z?GvVeuCVaODQm93TG{0c{tAN!CVAVbq?DlQh<S^i$xDxcn>XE>q2
z#cW7t+A)rElRUG0yOFfU^^&%@XEh<RY_>YV5>_!CSpZD8bDvI%@EBY!7BhVHu4W?~
znNs|j70uyv*$$~Wx#x9S%el$pJ>#yp^26r&Rt)tSj9>8>)aoLnR)wWYeO3=+0)&Bf
zECkT#+S!G=>M)F%!oZ3lYFdlCP|h8o(+QgtN>MmD%}exDF{IT(B0OG(a5H#iR0G9-
zYN0yXaQjd%WlLv_Dt^K!X$F~|m)PT8fQj0q07>S?2`_N%--+%<NtOlQh%xhHd++IV
zqUDu=x`$stM?;uMfHnjFg!Q)l=$go%wv54_ImuB51;uv^-fvDS$+8F-+Y4lKSvcj4
z#HCgy>0rwrl);J4T;Nu+=Zj|U)+zojz=fboJ{8>SbCn}*i&2+6!^3v}Jmastmb0Vs
zX5ImwrM6sEfFIPRv%GdB8=Y_W^)gOUrmB%|J-NW!0;7zPN|yAcw<k~|cqe28rbH08
z*2-EoY@EYag*GcxiWlEi724_4obfJjuaX+)`I2bqC_5xBw^Wtqa~n(ItJN#^)M;3a
zTjMhuoo8=T3s}7lLZB}+t-pnG<miq#=g(XLPY5_$D~@S<9JCwWbbvU9-Eo3@n(gx{
zRz;1?kt>4siNU)0apWMno1=-E%Pl9-dBjMbvZo=P1;(rmKjaCs(i;qx;D|?A-*ddT
zEsGHySBtAhYslHU6~dZgIC*CYT?w>3--jpOYU?;@p6m5|4nu|-)c*_$W%FnSKHfI%
zyWnE5s6BZTyjUik&TsK;GNW)khvSZsAV^+AH5?!#38sy25Ohd=Wz)q^Yj0rdJgK<8
z+?K6VkR;f2{HB$5gh0kV>I&95g7x9VV$wB|aYN2EE3}r2hFpY~wTf{kZV)=(5cvop
zxs!TRhxvL!5c{G<`wI+nCxk6~?Mhb}+*;bs7k2eu`6Zxy#=A9+RwFQFu=h0{D^OcP
zg_L)r$a>*7R$HI}QkFY-%O4#7`d3cw)2zZsBY|H^a_HUe^H+0U?<Z4j=`_B3qi_C6
z1vl+wsk(MTbzHidXiY?ZrD$U}1ZIQ#vr@yqCC0!PH66y3PFuLE_=G|7;cV)s_}b#%
z537!Lr?awh_YH4(`gyW)YJgGc)Oexy+We%hx4R#zV=1N^!7Lv#_j3O28@Y=qLOKZH
zQKrP1Q7W9_PmmqGwsS&vB%c{6^HRzoD;EP*JJr&Fu$n6Bemh&n{z!(Te0!@E4J>;H
z1SU=-ZLN26!$wa3yj;;sP_?=;cK$gelpP)hw*#;m_uf>?hWvsi$C+_+46Xx9msmry
zd`(C!PxM|nd#h@E8NP9OroNfM@vd(s52Vj^0RzgHxIbE#`4vn4HV<orAf$#yy}`1x
zw`!=3ol7cn18~+TM4b9KI^{}ucDcG)^4}Tc+1t;H$V`sV<vGKgPiqRgYN#?ZHJUm#
zPRmmwlp=PD-C2zlwTx6bvhER1&q36pbnf~c<v5^fUqb7K{)A?enQDCnVEf84Z<3^{
zAEHkRzQSp|6T+G<y+ml9Mo?VdqBC$<Y`HG6I`kFh5Nqulbc(Nthj^5C$<Hf_SVAkW
zzQeQdh7I=uuAfoQ8~GRHOzQg&j0SZx@XmYKLr+}k>nA)%jVZtw8zxCQuI}{8PBjg}
zeB|jDPn3bS2G<D;J3n7{Zdb1p_kTNGk?W~MK1CoJ$p+FxtDp2!re?I?%-bXyDdRp{
zN<9t=!7y>f6x+xhIkR`g(@{saRJ)w3xe5Xprd173!|@+lR;7~jy02)f;EhF>#$fy-
zQ7Cs!&k8bJfQZjHWXqVL4;cDhz2pUF*LgLSJgX4Ff94r<5qY5GB=Ubz_1@uZum2x#
z+jBZpbs06PIuS%`*KVnrv4x1eS7<3(gf0|C)!wx?6%m`(7MsM1aZuDuZDKul&iVeH
z=X(C`)$3}x@6Y{yzoynr+_<Z%%j2;|$@|(;kJd}WDKTo-LfsP<u$#deW9^AIt(9K7
z+$%P;vWbh&puiQ<J&fiir7Xh+({mR|oT3km>t7X|7+?)F7R6|He0+u9Xw(R>9H&kE
z&EQK#LnNqZNXJ)}UC9MWhd{!XQ~*2tcWoZlzp=op0c>+?C3-N=-&LYZ1DYeH2VkFT
z9Y(tuXNUH`_k+$4r~eJ9|9v1gwYt>g5E1xt;a2&VJGge+J2<e|m1;|;Hi(F*3l_QS
ztMC_G?hvqzyAE%M-9YIegA+Uwa^97*rwT6UwPKu3NM4F|olZ+-eqrhJm$)5N(%M&F
zEm0C2i)mt>!0uP}DnSG}$vz8`Tq*tc8>Anvc$-9i+G&oW(Py{Ra}rq3f<?xsp@MzZ
z63wPVHh~w!u<|HMxklU}>*Y0BQv=vU<n`E~#4ru-u|dk%<r+u(4=6RQL7T5$#nFtI
z>-_<HxG&M^+DcCa7;?Te#tjs12|v&_xbQNRXj#9PEAPmAs@=#(O;~G=7J1R4Dw9_M
zhV1ChT%REOdKO!C*UAC`n1}991tiIz;UOB{p7}&uf#FJ|?2Z;KPxV&`)Vsn9)xj&Q
z3<E#nua!@8rM#Z`9;%ffGWv_B7Cp;0#jInZee??tYC1%*n#RJ2tf>N?-AeO>Wuxul
zb&WO#YY7y+eW%~?f}dAscxgHoz@A=yH#|{Cv-IWccd`>SJzJ9FDmqK?@0YCgGw(C$
zsJlhap=mu=UI2c8Q|wd!Hel=6tZvJWqei<wjLDHMH+j~B6@qzzUJ)hkkg^UbSb8VA
zp*St9g&X_S!0^u{`KeO7Gm|}kO>I^&ikvw9nfOiHR$l?yzBOv;6JAwJ?DbfS6Sz(&
zB`1b^g-b|%3pnTMpDfK(<SmdEQ_ojUnvN15X0o$ZAf*N_-Gsc&3)6b@y&@#qTVLE5
zl~f<D<|FbnlZID6^G{xVS!urG_(2#zj(RjpC$}^3BIt&f4lvl0ku>ajvP0l7;Z1VA
z>F8s<|GQOVX|4J$?f9yawe>mw8uVBPSL%wJsE0<#ZJ%ismYxZI<0~qQT|M`RsgPhh
z98p<Ps*Jni8Ghoqk#pzD-ZfS(A0TVzIGof$KeR?mnn;90Hw4y+BVQ3pX`)RPW^&FX
z>Yd6hs;p-Ehl;j*!2aQ`a5iDwrl*ze{`F+2W3|#=;3a$i-n*mvQQt(j(DT((q3(@p
zZ{Q&W*q&E~+?<IoQHx-dOI^aWRS-hXt_>N%bJ(pbiAqTNsy+`Xx7}e^LHh#!qU#Hy
zn~QCL?#YD-phCo%5UqqgH>XQ#A^Gx{t0d;JSWV|%@)2jNa(2}kPvW5a{H4wS>l$)8
zYDrFOP~A<xaP@JNc!^+)^`XlqmAoh1XuSp?M@@q6!XSHQgoRaCLQ3z&NNknmOd=nQ
z{U$NyWwsD1?EK9aPxvaQU08iY*H$gtuUjMee6IOzCQgk{f#3&9g45s+B)&Om;J%~8
z;BD=M=oY2KGS0A^r(<S`NG+Y4<r7Ol2XP&J!|f08J|@{kA{>!I=g*>p12rpXxo~1V
znUvq1shFH9=nB&3!VT;!6!516A|9C2$DpGIl2PW6dBuJgV~7JKD$*+G?|s=bn8tL^
zmLBheaXls>4GQP#R=s`%XixsZc1!{bIL{=}ms1gW`#~p_0<l~i7z!QJHX+y4g=TOj
zP=)wGuSr9_R;P)23B<O7l=4m0g^dG{UCr+7?!x=70CpL%lXO99`gyU}@MRv+FS%HI
zkt&zdKY$ulHmMLkC9hKY9HJU*aHr+|{*8j+a%g2Id>A8RyWro0ntQ#=GH0nI7lQ(A
zdyAzCe3(oJ&Kl}lRano&G27!wkh`C%WKJ~j*_O`ncHrGwU&d2;K&?1T=0c?CM%%~4
z8mEq_?AekXNgJ5Xq4iTq&O|3n2RDb$n>eJ_V8u}o+Zsr;{}qafqA{viD=*ZlzPpU&
z2`ok)7*3h5d75|SR~{7>S&;*bcf9~_7v4$=3-rE~XhhSp4E8$p%Np*<44;f5+_@$B
z#{vk9btgMRzi|hBReS~WS1G=;42f}XnXjZxxy(uu>4bLO!|F{PlJWyYc+uqXBl%G8
z{iV>1FbN*UH>MYLa2$D(@Q+IZsae*ZyUBtzm`b=WmBb4=J5hY15?+7MsgyglcyL+Z
z*dZdLyC+GtgO8I7<o^Ax0!TabH#W4kLn|QaZT9Svx>rznjltauu75t1ToHu^Clt?(
z+`UIr`f5oG>P5H=%a&>l<7ui_a8odkIx?QJFsx0lw3CsWS`x_1$c6abn4!{a20`{a
z731Vw3rQ##0SAVjIb+#-$B)X5)W(WcJ6mhIeFl1z>UUt4A0TK%dGt=)_tn_eeGAm=
zze^P!ELCKgUBI*r8|%4Zmy*n*zjp~4V`0X;4m_*I-$lDRZx)1ELq79Ug$sgJk`vBa
zgrw67FvdG5vTf8IqPg^9W@I`zbGdm$5rO?5=Vc!CKULQwL~W!`+!=Zk41k$aJ{QCD
zt>gyIg=mfdpwJ1=`j7etXt-QVUh~s^Ms2C`BS*^kM5{(51t<7?a5{Fqfd(g_0CQ)`
z{GL{HEmMkb?r%D&{LTB0Hir8gIsyGwC2)4p2Qp_>QKyaIfYrqY?GkD$w7)y3fbyXN
zv&wqq4Ff5wm-uFJoJiujymbfevsDUFAS+DpxH$~mC;a<w$+waV_@B4Z*h$`nXjc`!
zV%N^xg<QZlsxgWKj<D7|Fsd#8qt<-95$fGJ;<&<neoIu)9#HgXJnJ<v&$b<3y)sw9
zU}=1U?arw24@E%?;B>Ca;Npa7L<mk$oA4wbN>OQ1PUg`rD`V;V0%vUy^8y<{UnRua
zO4XmtzM6Rr!X-4gx0WVcHxB?W6B>{v121fF1!h;pRDHxnNQQlZN@6_Oh@@P3H>9$)
z2xqdP%(idY*lmpa<ubVLxqP~5P^KEGow$`?NeWH?y7Eo#snyqG3kiIGf?S^T_^L15
zX}JLr+pCXVS;*2X`e{H+_2LR1`Hk2%bqkp!J_HgK`4B6QLwpKvor)r&|4j0iyVWzd
z=iY<p)@na+i!@%N0RZ@U^?F+JgK^_qSYmEv%fP*m3CzcQ*@J_hIiDo21-)n6I%+*V
zm-3c*cfya@?3pi{>Er3PeWY!nD^iG9^j=uwQ0bV|Pt7za(Dk*u*@QMhDdSTQlBztS
zpK*YKu+nO+H9YrV!7U=wFVJ+McoNK892fU^SaJ^e<#yJdVEW^D;gL2?5>G>UduMS@
zx0^yu=t#^R`4|$Zoh>WPndK`7s+p+wx1MB4$9LWJRl!Ge!3k7x@w5G+!O70CqQdF~
zOq?r0tb$~!JeM$|j+TU85PjL-7<V_XAQy7-A6K2OJ=jIAn(Ei&`ws-vOwb{FUZY+k
z0=9MBT`#tE#_D9qLuQ}pMQ$?0lJEpg=&Qt1QUnl6V0}{M%URg0NCNAVi6^mRn#V1`
zy>U4mm2gf0Cg7Op9_^Da5ks7lltaQF<m8Z9{saCL6oaj_Z->y?*q49dlo5Gqbxx~G
ztKi6jicQ)+;MAkRi^ao*1%`z~n7O80Sd*g5VNGMw!KheQK+lFD3ch|#Ww>Gc)U_0<
zP2jV52?F(Z%FpH}R_v5>awL5Da9P6ct`Q=gn^(X(E)D}5ePOhVo0Ce6?a6A7<N<5i
zZtLS_hH8{7sGsXCT~ND;wJvdS6gwD=+AL-eL8;#2gz51WWoNz|ny}OEdxQzcOwL3C
zpEtU(j&nV~oy9guU^;f@I|#1TTQ43Gsv@01#q-X!gN9G@+-LXCGDkm!@EC(Mx5>)<
zD`mi06dp%S4YXWyZaDHNiLMi?ou;!~TcIrrHjH`o|K1$q;Ek%))N_wkH&#+q<2C7z
z>Knc=KG?tWfcKuZjmJ@Wi6#8wuRx}JrKd2a+LGE0m6ArQ2x46e6SC`BoA(wf*1k<^
zA#Fzv{nxNW;lT>6$)ES7FNn^}3Q))kK>45Sj*#cmLk|Va=lGEu6^nZ{9~AgKjU5#n
z)Pkd~xgiPEJkNCUhZ(*(sZ?sZw2Adq$q5HrxtK<4<>4GP3t7`0qoc8;yDdJcdcrLQ
z+$BCQ{U$e4#M1gAubZ~WZ-<@BVdQ|^XrGCS3bzPZ7_Y1e3Ce6<Lq0QWo6sAV0pQJZ
z>ujZUt_LV^XCQM);LeDz@(g=A7}^ny=GG2cEVQ`(cV_~kR(ye|p;<HB*NuyQg_65e
zRTI}`TQzR$?#7V!m5VC#%T2+~u9OLKY#OeinZ{C&R&3jDEqBh8vKRLNP4T+GG8uOs
zcV-N%oh~QB9+S@}xqnn!EBOku>qpzht^=ob#<xgoLq?H_mOhnO&gJ}1QIX}FZ_Tqd
z3U}peOc}RNm&fHgR4TkAGA(neYioxgAVR*Q<e)dWmGo!(<zJ|Zr}%;XHGu`m1lCO)
zCD1q%8vSmyIE1<kjV|VSO<Ef#TwlO#cIb2E*L_(}6TEJymMAz>syW8Yp*kOkk4pDn
z5MB89>2Y@}SxGWa{^N>;X?ID2AARJBC~%l*$(pzqem0MKW3u_GDibzjJ!@pkSFj9d
zu0khgjZ|-Nla#cC;65NCwEp<K?B37Pr|d$^7GW?RhiVcFq)S%;R)!7^$_cZskjIVw
zGBZDj^(ua64(T0Te6)~|w4%KdWKE}AFdhG(<0q~-J$pLq-9Vp%^qgnJ*V6Tzu72FO
zHC{LRX%BeaiAb5boXP2ID^T%qDd3<i^@va00C6O|7!C`rymbr&a+fbVB|<+=*y4>m
zvvTc`*M*IQ<HGl7_88*jF7|pgT+%sUMsiPIDVH739@}Y3a%40n4Ok(+(Xc_&xvzU?
zk?B+Sn(HSu?&aqgJMzvvQ0N=6S_O^^nXZS>!}bS&vXYdk7qr8F2)kJJxjE_|lwW5`
zCqDBU!Y)YK)YDPcUnld2p74*{rymS%ZX*j#AuZME3oc-@`H<-{TqoeTjrtWHq`USX
zKA<7c*d0g(KRJUYEwx5FigM!{?`MDH(D@>2uWt&yudRZEh9uhN-zryq${(?9Tz2q*
zjl;6eFgU!PEHhk(HnySxUh#5~V)kOvL-@gc+C;z<8sXcDl}eEpWnGu~)m}_w8<Dod
zY5Y<Se8stLYwsP518K$fe&Vu8BwAK1%)K!oy54i`*xdMm<kT-L#o7H>c+xzCX)cb^
zdb87~iR8QAgQkb;EsIR4%WA&}f%Xt)1S9zmm>v99{5eZYKZ<TVms*awv)}*92tA~p
z^+*4Cww{(wjppdwbK1WAPlYcM{LMBr$ZwC1(iDab?VJMVQpC(}KMB#rK7yIsmj*L^
z&r#x6fJqi2IDlT*cEQGbp=z=pBjEg>3KaAEZc5dGqxIlQb!v7sAvCedSu*w55hU{A
zEURN0?O145&**xzl_H#h*a06ExBnv1G0BQ)sraV&5}VGIZk8dMhl-^8>>Q>Oql7w)
zyZyCPoWYHjrlYzggCT4kP(C>K^t6fq2(36bZ}pzFwF<mY&AJv0FxzPQceKV@LR=yF
zB_)MC_GimGXx#|S*7_T1SI~A09CSO2e`SAG%5wueNb%N<F$b*LUMtENSH&R0$bn#^
zEwb|i!WnVlIn+$@Z0@Qr3?bOYgKtRC6zHvK<3Z--WWow4^2l(<Z({Dm2HZcI`{lF7
z*+yf%qYL5#6Vd55cB-o*&vaE%pt@pHl%a}Nd^r9mc$I&{igE2_ok8L!+a-Rh?i@At
zCHaEKzqyx(Q7RL-+loed;UqYAB8U%iH2S&gO}j)+P$Ui-Maqw?Zsj<LE0`=l+CqO$
z5MDBXYq^Dr4E@=_92L4c^Cr~&dhjqPAT4O3T0818gxuQv%a5;!N<_Uk$>jDLBRw1?
zU2|aj^@SmemuYIm#p5{cyIU-DpY-Ywjc4$vE~j&dz!v2qni1>6ja6SVrB3#H{baWG
zejfvo{h<C4gxUy}Wj>MPZ(zt=20~<ZJ;&^GetQ?ZcIc0ww2D7FLYL=w9LKw%BgaB+
zZW&)Q9I;6$4Hu`_E7%k6{^f7kNWAEVXe?D=67MG0XH4Fp`?PPB5h}_mgM>p`7H)t&
zoTrNOb}Jg{r?)Fv?(@lB189{C*oF$X>fCm(Ec1+3ZRasD{9;PIj_N_hpo71$I_^(_
zrnLd(2)Wvlu$Tb@CBiv7tuF^j;aLN9K&pFrf|{mdqPotR1Wvg*5h}ltu~>;$Dd_YB
zg*bYB9fG0337D8Q{+Xf5SBQuQuwjdeD5SBLNx{Qu47MbsKG9g#a@gzqFvt(rdM(gm
zHJl2B0uzsXh6kkpjMWos**)309R?4zjy!5A9*n_f7Et8~b8+;E{?*tJpMm$xHAjLA
z)?=(Xm(fR$p}y_V!Lio9`d>YZqq`5=9(V8&jH_JpyTBLwksB6<;&qt66^ROQkEaeg
zA_e3NC<J&I!jRzetgE#N1Ut(l`XttNLUR%e!`JxNgFi*u{PS~1{|=ETnc|Y&@1WVi
ze=v$nv!3Ck)qb9)Nk55^fWv)A4Do_`uey@wC8$!m;Ita)^zIq3uR=q_mnJKYa`|}l
zuEBnhUWzPe?;Hb+Nx!A@w~)Zu1VIwR!ICijZna|k=aPG1-d{S}$*OBVgGk2qY?LK@
zbmP(%?w_Y8X$N;3WdG_6j>>lenwnuCx5Aj{d8B4Qb8l8|f5V|g7KgvZ<8nmOgL0_<
z$c(8_NfZKkzt!-C(mL+<n<=vRvhl26#8)^%p*st-`M!^xwh0@<e_xpbJ~y-U72`e2
z!=X}q`n!k)KS=@lNnFEDRn2zgK`md+$QpVfZ8bO4l+C%)oNxt}g69cXIyKwCP-Zdk
z{5bB<{~hlT{3Rs2wMeeg7@RN;aNg(pE^S1a;Zqt)K1>BGw(ib_8Ucq&Rb;k9x2920
ziL6tr;!3Y$L9jThzr|m-V*QZU%6?}2*$E*mvPLhiC=Tk0Idpm$EWC~h2Xfl1)wz*<
zsuaiEaC=o#AM_*8cL|&pShL(NkeJFN%G1e?+DtuEG$<R`?U|4*EU?-gUy$)E<R_-D
zj?XxjP{r*|KWo=RU2dv=$V2KtcSo<$Ae3W?zvAo;TR%E-h{TwO@X04m5qDZLLu<A6
z+&jM<+DR14D6Fu1j%z*T>J$dgG*e;9cA@Qq)ko%BhO<#1O@AZTD9@**-cRI?9a-2C
z510@EH~#*ad$T2Bz?kc>F$Ma@1$PS9+qP$cmif0n;u4$6tZ=wkUm)$Aq1&!oZHBw$
zu<pqV)`6JD?En9{zKD8<w3fOroDy4x)_RjVBpR^uAWJmiAt;|#wn<yVM;BPnUt0bc
zpMgqnSLntW<jm_Nmlh(>0CUw=RrFrdBqV{o6tVjqx^MSgJ|=(~rc<gts{`h@-~<?k
z`2%7@PDQ&OYHwAV2de`3BPE0n)BfUxT4V_5dwH7mkDE^v{Nl)_COZxQh9Y+y&#_Hp
z6pqhFp@Bc>Zec$BjYV=5@WYGRVgr5c{~^v<7Ei5*dEWQuDo6w(oXz*g%qRJ`vVNH;
zR%;WaK#LStoKim>4gHtKSYvfz$V_D4?ZCpg=;#WdCbl$B_=9@Tg7J-cnOXqlrqAvz
z8oLf<ezYh%^XXn|(*C(?zu?FtrXYkgUx9ViecL+6nJ8p@u~LNk(4*zx!e@z6o9z0=
z?!@Y+uZx&R%^8a(qcCq*Cq0X4y5lPU8kCXE>;kSW@6bj}#i!l<32<s({NJfXTPN0V
z)`VoD6uRT&(t{2_LKnwpoU!j`@7>(fkrL_Ar8Xfd!!B+|&0I19Z<g`tmCX!UCu`*6
z;)lyOWwaWk^blnoF5HmNG5m}+z8+M*w51=$RMc8;O|k{-ye#V$Wpg8&v@a!$=j?b-
zEUY?Gd__Zjr-nTZfYi5*z5JElf~1Hi18L=8?&AL_2KVTdao>dcvpSxIN>ERS@Kp(o
z1%bIOUB6Jt)a$8@k3#xFYoca>h+OoV{{CE8Y_+fSR-ZgQEoCdICK?L{=A$@lgxJLf
z>bePQBO1go>1^%-<+#d!r+5tc3u279X$a5!Vi6ZN3&cFyzeCC5n?A+KlG;qiagUa7
zZihz8XQQc9c$g9Yf?}8_*634YapDq(y8IZYj^vx1|Nl{?Q1xj2$9d3~o+b%=dXb)!
zTiIf7j;evOk&|7&R;Zi0cDAS){|KLB=8E^P=Cx(Y?g2B0kRmDbY;i(}@(~hHnQcpo
ztIuO8h2!>Z!Q%txmZKgIvv(%6P{q?(R#@^m0D@{02><vOfwsj0KKG;baK9vOaWH(8
z*)!2UQJs7t`yxtz&EfE?NsMbTw77htx{<hpUiz*d4Za#T{NYv%VPuWS?^Rhmr19W{
zgbTY_h+V1*wXkCd6y+H_^y&}c@lS)^H)`l|kJbxOh!_Fr{rhQS@Ox4Szv9;bB*M>q
z+vN&5SIQZ^MjJF2lzs7r+IovBT7#efjIT_MXw}u?=6rNbdqs!cVUqSBw+Mj`)_9i>
zeegaB^>p-A&05wEX9H@V3q6UY7+A#q{YuX!-X#OoT0rkS_G)a|q=@~W=(CY<_D(~>
zH~?-r<3^9?>_Vc><5Ji5by6w1k+pb56m*f|XnLdWA<%(qWb}5HP=(p7vfEh`KWQZ|
zOX%0sfQrFOO#?py#=e20Aj^3;ZmoJO%I-H;&^c1Cj(FXN170qPFYMH243br6bH6dl
zQP#G{l1ZFPYHR$<S=Cwn-v(CZL$jzqaJx=He`70gWBdaJm8^}NC5tk%%p#6V14lOr
zkV9BxdeB66BDzs0>Y*ocu0T&2nj-!C+XuOxujIj9HpOVmGZy1*Ui!|mI@Vd;0;gK)
zyX#GRzT0GxlWY78^gDXWKjsSNprYJ@DUr@~yTD{3fxNnOQhmH!jb|PLiCQz;yw>`E
zr)t+z&=@oBePW3(aaitr3oPbq2=zmKbLqdani%M@`5H7iX@h|S1z2E|MFIDt8YV}*
z`C|}k$n{cS>IZ0G?7fq=E+kf4Jq+g0oc|8EcKn)Rv8S+f^Y_m2qb7S5<YVH|^m}Pf
z{S2OME56TtE>#pq@%iTLI{wvssgBq0N{+r{ZDZ2?MPwS*fcX$(a&|()4VbL1cj2mz
z?tpm%fRj~1!>9szDzef|6par0P~#Rff2BG`)Zj*zK%2o3A5}}N@E{{`N{i4{n49-*
zk6Otj9JgRo5M?(WmQlFJ&;fe;MApZFc$US-=?<?0?&sYLqU+~LKHodY<MTW6TKzFu
zt(0#JePN(m?#tk>14H9)%Iz3Gzx__ruT4ts2GJ;Iz#b1*z)Ct?(7)%uQgzicNBXz)
zuSH++{MHQM#un}9?^~a7cSVm$ijeD_gg3z>7r9Rkdry)!J`IQB5^%F-sl!@^zg4t!
zhQ?QffBO`b4{c;8C;C13hEhb?P!)bxLwmit-krb2{ECC}GucOLPY-?}@bJonOFHy|
zzuqfTxRcWw;1702?xpE1fuiV@xSBqH2HClWb2+ZcJzm4j9mSnax8`dL(`~xsFo(Jv
zPljfeKEc%!_WZ-NqYCdSke+tB`l$H=@hU^B7BY-cIk;TD$t>2`1F}&(1wP|Szy1S9
z8g|M{pj{Qz`#@b10m4X?1kujk^bVKZhzMtpNi`(Dd3VXV7-X{dKeFo3#dB6Q4?h$m
zE8}t5X()$K4vG0f(&{T}1SZFF=dz?R+{LL1#6f3B>B+Vf4v(UO4)b{d5JEE#u=m~4
z$!Id#&hgR{0T<v6eP&SBw~L#y*U`{B;@3|h>R}@F<mj)seMWe|<E&dI`W2^jOK&n?
z92Tq3d4y$ugNQhjH*LnDGuZ?L^eqP~RKumYa2SX-?k7Vmod9ug7hZ9xBRqRHpIvR`
zu&=5$(_%Ge#<~*=Bo~rxQnM_*O7QQ(ixe<Niv3g|Rb&UZBGI#`s@82A`;C`ORIDQ_
zW<_evwKn68g<!ogCXZHUEK755Fbb!6)4ied_54Z+F_}JbryASoGf;tj!_}pA)PuQ>
z5iIf$4OH_6r}^u>*c&k%VARO2Tf-+?f>EO&Ah`^s650gjAly%hR<2=#p+f3rSgPH>
z>cZ_{qf3agPX5=KaygrG!$(^|ONZm{;s-DUcTf?=I5#)}Rr+VnINlq$CQk%*(n^8!
zD*8<=28nn>U`m^xeLiQFrmXkxsFCZ$$HP3iBao9m58_6p@H+GXIGaMAv?9rJ1?wJS
z0En8JeO3!Qv|f@{z{32aLc82-((lh9QWL-UKUy!8&>V_R&n|Rk;h#59j3Bl-rcFf7
zU2alQ^gKXG))}@q))4oXO?D+n%F|Vpv&9_M#{;qTx_eIS=LZQ)xy4aLmZqo3iE3BS
zlN{<Rw)Tp!w0*Y<WY-7u=BM-p!udOl$vh@i(Ti3O2Il7^^^bHFCwJ?283Q5=Qv+x2
z@VeDkCVDHNbNgbH=ijhXsVvPu83%?=))itqn``?3u9ooPe?^^~|8FsrXTmxSVK7%C
zaf~8F4Q`%$)FRPGc%W8zjV<I|&G*j71JNA&_6d!~Yq=A^pDS;es9=`pm+JnkPMS#t
z&Ap=}Dr~H}_(`(b3fSj&N8Qaco)lJ|3)T>5_T?N3|6<z8Q_AF7rSi?$05be9n)lx!
z)+3S$UTMeMi=qd<Fn<wRDu2{et>OVD#bpEOY)W3(Ozsi{`dl2K_0L;ebCNw0E?7n=
zFfCGbSog%N)v*RY)@G>|5Bg(Xc92<sU~vg_E}#8kthikJdG2{=S#@tBw3_N6n|8rq
z4uR4W_sE%gzP0{$z7>M`^^Ic@D|3$FCyS}a%KhYL!u)1A%Am(K*u%Z_sBa&RMCsw#
zpnqN-8N8W`R^7kmS|}4(KT&YFKbZwQ1%&0;)-y}(g`dGlT@cwhm)gA^7ITGo@@(yR
zS~#mab*5o*Rgj8}l)hp*5?yt-kKNxIs;GBQryG<z#LV!3A621{i%p;`Emc{RY?&1D
zB<$r^`;r>hg;(+7P5I`Y{i0Rd8UKB~0|(;V_#9)X<dSAkT-d?Cr(T#esyqt8vRg1J
zbn7=zi1f*Dy)y!ce-HepQrJEU{9IT%%Xn-KbQ()1+8u^eO*X!2Rbs|;;JW5i@MAH@
ziB1nBs;(7ax{Gr2I?j4NAs9I>=O(!VnB1#LJ0ZUvc>CDLdrX*GT!Z*f%$z$~7gwpt
ztJ;rTfJj}@cLW*!KzijR11Vi+exX1~KR7{@tx3$Lqd;YhX+TI@SnI&aV3C=`+Gnd!
zumT?dlklp+>x(+H59QDwZ`S4%L0{<G`T?hRqSCxAu;kLHCtQL>P<PBGTjKFt)cAJs
zObjx9Ei+O*;UAk=mt;rRy0G@^S<5-zP+GJNvYp2q4K!-NL9JXDXLrCSroL0okZBQY
zgPW2Gk;9ov4DW<Os0aS_|Gw6Ne0HO?mhRXYW}WL%vf9EuP{XU{ZT-@IbG)W3mo`Aw
zZ-@-rLBJ(1N(D!z)C&KK+iVQxt?Fvz5*?yiP$h3H#Yj?oZ*mh<9Sg^01A$LH_gE8j
zef)LxFeJF&|Frn!%zsb=Ie)O<o=iP0-s22k*`vnKuHDO6201WZ&Ci*v+%5nlBv_n^
zgcN$}ZA+G$<Q}DMui#owC#=}^$W2Llo_sI<YTW)_Ghe$Nxibkin@h`3l4~W)0(My@
zS${M_E+*7!9}%2l!zYjTDxRu_CvwYJH&>wF#G}5U;pznV$dpjt&@({%l;$A=ekl&V
zq=Vic1yWo_pRZI2IKG(j+@q?<LgXNE>To`eW22;SBd_oSX}#|a<Ac~tHSX!(U}sJI
zGz=IzqsG8jIXee=TN=w$7IjOiXjyPr(opQy{C*OcSyU61GrU(MsK?xyGFI(e&A%#<
z>T|?ToZWe!!Z5UUMr}W$^GgdK76^DCSyuJqucXxnUQI+xigos|!08%7aQ0&iA|#8|
z&J0ef?7L;HoGScoam_fG(j;_c0@>WJ!IT~B^pj>)Q_6r@PYj?;iE2fsw9gM74`zC(
z`TS)**7%5%WADfL)<(_Od66ph%BqMN<!cbrQTxGtFeXW^+a>aGo_YAj5@@H{Rdv{x
zA48rNyc>L*GM(FFz_?G{uC_9iu2lw4Ri)(N;T)*};oeaqshI0JCd#F^bw#D7VxD6}
z5qffP5xwxdL2Z3u^V^Q}{Eo&s&dZSH*E^>warA|}n5)|>wz4F)hX~Z*j+XTUEMq=j
zu_$D006)hYa{p86+XCS#JWs(M`|)b=*iFc{s?XNOe0t;2n;WVs9Iy^-`B@D9-W<H?
z1^5JSb52ySzfh6pc~DH1bI70ciZ9$OnR0iYFZOif9fTYOpnmT~<w#izUo&ZzLw-_y
z(}TO7*&&OVrrmd08!q)I^h5zWe^|h@&Q+mBaj*er^g2Xn<R^gzTB{+-1j3Y~1Sry(
zi2u|Ceju8f0W-vuEwBiLAn<yjxha{}F(y-ETUn&uv{8%<5WVhm_cHjiLi)ImJ(5=3
zASTuL&(HJPJZyV(Dxi_txo=vfRr<$@BQ56Ax?I-a_0%%P-Sv^0EaOWS>14ae6bbiC
z_H$_2#OJqEug%H~)#Ou>4Y>%^uYVv_Jpj%U`1<D~)ub&s%A<c#E#uk>om=k+<T5CG
z029IP<&R$ATGTd=3wmXlH6V4<kUL|wweu4$6es@Mh}KJ6p$qF@z8r{#&Q&wm-*aII
z{~v{eXvMK4xIzDcp=NWGwFZxN`YL0W+AwzuumS$!G7I9pkh$)Y1HTg&r|F=>Q4nmY
zy5IkC7RSk9YfoK5=^u2HZHqk#WbgeN@q@s@7~IuR`%kt#$A;X=uql^+kGt^6uS7`+
zP=%_Rw%x6&FJLx%PJ);EO;2<)%E(0&Uy4c=;#)YVT*i^I?R5xFk>#-Z#Zo@W!l=z`
zlBeWlthH$9qEsrILU&*0pr5rSf$%Z9=zb3Lro1*>O9-1h3s#Zq7cE{-RV>xD=XYSi
zNZxVxV#Pm-5Qz~u$qFy7x35ZiqMY{qvz?q}2o%Rm_s1TY#smH@6_=uCtORb`uxI~!
zwwvHKMcx18c=HwH<^>#`efaumUqdx=ckgxGvN1W~0vUv=Y>UIHbIutK@fk5y52@5v
z&lEF@PPbb`oQu@40t*&<h$(xEuB6n|?S`N!kXmq-WIs^VO9?rQJQH8g_vM#)`n`%v
zOA~02BYQnHMb>t$**JLMqe~)A{<8RemK4d`1yYpb-3HUWLpgg|r>y&snf8Pd4Id_v
zE7Dt<se}E}<!GvM>wB01s83;gGweECBjC?LWPt?h-aF+dxlX5)K<T<kY~Z~P!#Y}M
z_EzF8z%sCHVC-~Q9<F^sX|W;qcvvn4wDvjkses1F7s8(nj!d!cUhy<ukWE<-yK%8q
z;X}JMlMvWV&x}4B{n`L)HMRaJ_QX22AWp%nyku;W=s^Yyh?b5K)nH^+X_$FUn{N`V
z67PE<YkD`3c8O|Yt2^#X_x&Z`+8&tqSZ_DR#6|Zp&~5_$*Y_Z7EErl*Nm|JdqwQdu
z{1aeyXaOG+-pds=wKoLoeB?oW+UvN3t)ojp4Yz7i-hQ{#S&-B_R`Z@JDG~@Q20lI$
zrsRbcjv+nF;O0)_^O{?FQaTL^4?$&fTC}S4!?Qj};TY?OwV0;9#|1bS^=sazNz~`E
zR1vF5+8ItNshUr)T(h{r+9XI@*|nJm??d@n&-F`@Z*8we@PPSeM!Vt?i);d)qQi1l
z)ZzxgeJQRMKu)rhda_*R1^bzAvxxvgQR(kHSe!MPN6v!K-diCdGa2N3hP;8b%spN)
z6ilXPfch2?26U#3i#@TvYLuhuBY80(#DUr-_gP69bEYjP9hC#;D)ok-cvA6E52l=*
z@@QpROsBX(X!S1xWG+rb_}GZE*Cq@2*ddVxo71@EmtT$C_2a8E)qCLaLWQg*Bvhni
zPr?2N{w)4w9_#d?(n3Kax4L@}^MRNw&84C4ac&1np@sdad+wUtQLuzhZWY7ps50}E
zUBo2`&@$8AORuQkG=Axv{Q&oU5ItjH`d310kvJ3Vm3^n>?9fdesKZ!r{`@Eb<-`Pd
z;Gh?1CJ~a=HH$=7KPq;XrO0uP%IjR@r~zcifwt>aNl4jm`9-i8LwwXD$1zb3aSf{|
z7u8#z#ZnyqF~-}E8R{O}(Kgvf^Ekl_<&X}LZfgKv3OL5qD57shmz$W+FiWO@410QW
zo`&U5xXN9`ie7>?G+@8+3Jj~Hbp(PSwxtDMl7ab$6{!a~+iL`<?L({gSsjX~illrc
zhnWnCaqz3mx;_4}eJQ%=YVnIsH7k*8IoU^qX90Y1?eFbJi<*piZ-LxNUv1+&D9w0B
zBtbBpMyW!I0kMNrLcQag8RN~cM85~Qjt=kjv`)I<mGuB!VukotEgMhq*w%c`l|{hi
zn9wLc_ggvyZMIzKMwbw11spOEuBQ-7!hD6CecC{yY;B3csXJPJ@<^U#1cHKv{{Ag5
zi9?kYO8MW<R?7FRD_jBM=bu~I&Yt#-PWSv6;Pn6DK&X~gUe)=O`YFQX{x2%3w1wDD
z+Zg(2_cSahgZvsies4Yy;TW0S>KrLPUc;nohRpY5vxE(?mA#jRu;2T`HbIQIt*l_u
zsh5nFPP+;*ZNYpMCLqk+a++B8MG(i-AOARiQVYp(eM;{6rjy;%clCccJ+LT$AZ~T*
zz*k}1M+L3@c~vgoHwTPbCEWsnxPwVOyh_h;n#)@gcQvPX!E6g)r>e`4=q6~)=hkN}
z)x}ZEXzwjAQr6Z{Vk|m%Q&4wNs})B&b&7XI`Poxl3g#>O^=&%vi(SyV>An`ssUe5|
z=D?-hoMVQ-(ns`~M*q~TfqQ%gm=RF4HK#3BQaC^Bsb~FQVUyP%-=e#dh14nT*0Rh+
zg}5Y+NJvVK3{}9Y@djVF5nc^j1F9JY`8Y`}jbsk=oZ#-zLK!uQrw4MI&Sc(Kart?<
z!%5!_XC3=aV=iGv4UWi>I&k$29>b1@tc=H=$>>2;sh0cNBYu`B<!hd`rl>`LGpBCY
z5xNVhLs`F55{aYc7FQn9GrCB%I!>t2uyV{f(UsT1qovv@{?Y#6yg>|&(44_8yE2Wu
zGeG#2-ItyD8AL=LE%IRFPJfX=N;%FfS_4Dxh*`wBc;QbB*Y&66*ZY|8clwuJ(d+MW
z^EwyX38JYGj*O*-;in+Z7F54Sp)+&In{G!ZuAgp}M7-~$*s0~sA7TQ2tt_@`k5M81
z3{0693RWY;#_TfcIj5bh-v@m{h>Zt`TD$578}<6k3vrD&N=l3P2)xuc<0gx|ji=<$
zAW-h8g~WlrC~WtTdLXNtWb#f`)LWfrDt%+s!@ff@u>%?KPSHDKLjx16+VtJ-3LMyk
z_KLwYx4KxpLe-^-?fnXXUPf8m<2CR|az(amfOMN$2GtPJ-Ej1ZrR7VJ<KG50iB6>6
zbhlKXT?qjSo0r2l*PIR^=+#Q#uceLTn=?Z~Ec3ErSPfru`}}da>=Sd0l~#)w`3u8C
z>u_SJGEG|q{a(>TJmAnNMuQAcuBa_x1oPKObqV{ep1PAG@)hv{w5%tnuaEXP`X@!-
zm{<um;^#*q;1SN@-0T|iN%$1&u3F>5I)li(VArTA`)sv{*MSYp#<5{Di)GJpj=!(B
zNrS&rTpZivxLqZW)Mcu3Gr4kJjC{+$mk!n!$nZzbchQ$^e^7VSLE<>!<|A7FaVfE3
znK^^<LFd%=%8GD|gOSI&0^h@Km!(u->52a?yB?&$oMWkoI1zDP$rwmixNrUJ;%A3m
zCqIy%0~>b!J1^Zu-tzRoPMh>DqT?0x<w!3B`U-`?5xhXO=X3_SJwZy&7IWF%kS0*V
zb{OYPFUF3>Z|6rk&AmiqK`AM!p(nLK3s-4Z*w{m#tbZi4G$ZK_r}(16#j(U)b%>>m
z7?{2&@K>GRi;1SHjN1zqsPrY&cBwFn+0s2!)nQdH+Sy{|QReMz|I>z6vmpg*_O*KO
zvsuh}XEBuHYJj0oSY687s;$<Qm`<VZ?$(z+MTI!eta_{O5>j8>cuUr`EDb1e?l;h2
zQ4I{%XL}QwajE>8KH_+5t_1M<F-+(8pS4~amuTk?EROa~<q#(?)|EDyT16<l4+++8
zB)*p?$tJ7ri*Kb=`c~6=5X1<T)=EoQ$vd*>T~eG+QWn+VUavjSRX0wyyK&TXHGbS)
z=P`^x18Wv)zV9Jx>j!00k8A)o+WDRw32WuqFV0Br59|sdq0J_=t*f@y_wQpzD%4E6
zsi9ihocarGMPy|5(qm;t2lu67jJtBITY%mOF#65u5>|rUM+MCnLJru)p%fwaNl<~K
zumDiskJ+=kRhk596=a))lg9#TE?Qqbg?X?!1ilY0R4R@0+1#gJzkKAQv~YeB=APpj
zh~IO3q#L;gECv=Qpw;*$>a>IJF1swHKYXX$7!!3$Y}6{UG}pns;6M!zf0}TroYC$x
zN5W^m>yQxE-JO2h{X8fW=Cw_m!UC%iRr+&l9Iv@Z_@_epPww;E3UWi|8J)Yl-jdp@
zUlzL-y>mkd*{O`#IOYKIV<)a%ze$NHOpbn^!W}i22{vsR3Gq7(`P`yoFZm><sQo<y
z-%gXOsXEYb$PzQZgvv{98~gT;MPUh15TD3HFF!mtZTt0U`jkH(OR=|JHech+<x?EK
zj!Cvbogi&!!53;{qYN_F0n!V6K8HtHqK7mvKN8Mp$Xztz;R4NOwl4%{zyf^JF;$l-
zq|m#nLyu(1cPr5~{axxv&BEo^i{glapbj|)+RP`855H&~GX~Wd`~ulG8y{UOmh4e(
zsHop2`*{85H`*Bd<2SsEz4U|g6)xJVltsZi@t_C6bVMc|Q;<R7!RY=T8ZLR=!uuY5
zs%2_Iy=`YuT3^-;_<DX9pxrBihCGJSM0Ww=x@$0Db4dKVSY!PtHzRDLdYD?<Y=nrq
zw_9J-JPZcmezLWCLQg7ZXUxFpt3zUaqR(aaEX~5RNX#Q9os~`LhqPZX&Z(ras+sHB
z*WvM=3ez=cHhR;nhkC+`{}jZ2HeI^XKJ$I77&CK_B6OUPQK(XreysQ#0lDJO5SH0~
z@9g>63UpNTl!4@O>zz46w50bkF<s&B4IOeUihV3BBSkEj?7D3DSkLt7(X5f63%cR1
zGtaDr(?U>>-n<-2t*e*6UdJ|#Jlql|k3^FV-f&a8^{?pXm0{;9kpb>S{%@_H&AylM
z8~65-T{$bULk9gi8p2A@KiGraoifP6QYT|5O}hmM3;`Lnpp_Ojo*Ql>o8xP@WZ{_F
zhEcLR$N}jkx)Ir%ocb)<V+mme44%ft^M=+s+ufk;<7j&KQ&f<MI-}q-vlN~9D6KQw
zb@_a`Jc&6aAW5rj;M=mq-3L}vR@F@CW)B|CIM7ghY+%$ZcacpXZ)~mkaO-Gj>(^{y
zC;<F6qrcj$&G{+<8EioNFZIMm`*d}?yD4`#6?WaWhl3mKmv%Xq2gdhxbNKS=$~-e4
zp=z1_v@tEWk9;PHK^=XXVm-?UKq|85`l6mZ2cBQKGW7{P9RH$g&-aUL(t|dnUttTn
zBG=Pjds3faO``|SV=$8TLY%5!c8}!7FoE$T2g++B4CQA6!G7m{XGJk5JjR$R6-f|J
zec>CZJ)C>UanwNx=giEk%%FL7z%o@;=)CtVVWa-%jr}wtMnHiZlD5})aboaxG()Rg
zL*fBtMA#K*_Fhjo%9Yx&C4f6PbWqqBfl*P)++!UxQRJ1PJ}N<qB(pU9&?DFIe^b)1
zgX+t?vJVoz4F32H;8GE<=Uu|n3Hg6=SB)oLbd?|O1Ti2&6O-Dqqws31V>SgZMAD$0
z&(mmVnlxTUwmd@UOaLiqzz`*~z38;%Ea$7JZK9@0Ja*wRl{riOq!D&Svjs+1u_R&2
z+TskdyIC*)tvWsKbHCtoCu`oMCGb<(ikO)^f2Vmo8u`0b1L1cx+Upzh*X)a#20L#J
z#2R;S1;ZumQ7srPb7>%u>%@5OjR%H9zN>$H;K@F{-AmF?!S931Da-5xrY+2^J6RWD
zOLhvyMN%a#f9ZAhQDXs)f#zJA={!P5hvkI=J*P)yZ~<O9f-e*I1INkpU^r?=6ID+#
zjdcAyrh{0L{`Ezkk{=11?0lcdX_FXJy<Hr2Bw{{qXePG!BAh43K?Bd@q!Q1csrD;i
zx&}T~@hN9R>0(O#f)2Su&P45<8pw};iERg@waD+_U&C4{V;+!icn1^qbyRAmzm{HB
z&>_|K+zo4<vO&Q21<Pwk*K}<cn4sq_)On62OfW%yjI0YR7+zrT=K2+guRE8W`HJ<T
z#u2fi;b_&w-$wFQ>1G`9HT~2V|1O}Zxl>uG`BF#P8QJ{hEMNIVtLZ^*_2e!)bBH(I
zWi1^l7B1)8jFXKO{K9lqsY)R@k&~TOta5t@DQ^O=mIb$)`F`lVO5RyIZ}w;|>#Ptm
z!Jd5JE<WG)e5%HYrF3F=l>`4UOCa-OHrX61sKf|+kwci?@wP}UI8wR>HLOTgl^$kB
zEWHk5VvAEi;7$yGTUOAqlA~vGmdr`XlyL?0SUMI@X4E%&*)?_d!Qhuv*gUL9Fmq3g
zMZZaLR>i}24lvH%KopW_#ww0a&zF4o4~Z_{=^s|p9Z0U7&l=Td`_YpE{BSE_df6+?
z@T`gWPfr>{v$;5IQB-(GF0JFA%pgx}$Z^^g1$yuzS1o_co>{c~>iSU85BeY}dt6vA
zRy0Dxz4I%R%|j5?MUVa);j|0&B_x&ATpg-#(}=E(&jR|GES1X-$88gs!9_0k?;?AF
zi<~M-;?zf!hNau+7k0+b%qhoOA|Tf3J(6E%8piu#vc4`&PP_-~mG<XzQspAB;-{&)
zeok3*kdVWJhLZ!$bzUpR!M%d8EC%r`gY+PNq_6>Ji@>btD}q@zCtv2(Od47J>7Typ
z?4}4B0{+$hD%%B-HAXR5VP_HFgtD+e6^OCXFi;lk9Z^K>Xa9VRvc6vhH0B4Gq`AvJ
zW4*tPrt^i0RrL5Cz)HU}T8o@oX>IXb?bLzn#3V=2qB@GC)*-<iJc$ow+{q9r)b3~|
zwgn#9Fvf%!YRKf)kA?ky6KxK;LQKBE-DJd(?BSygt;qg(r{D?ZCL7x)?GX!}&X1*D
z@{z=)XN!N`QRo4dk$N0==ziW5*1vG+9vx5AHHeC`xN)$|nuBU$4!Zd1YY3TyUmEK{
zHPMOPH2kByt>~)~uM~WqC)OP*tu)$K{_#dxJu+YrTdhYK54s>(VzID9n|q{vpruGq
zuVgx__dGL~?<_y$BZ=LtMVTBtna9wnPMZaNQQ;EVh|K3sl@FHW3~v#}a&w9#Vb+!i
zHKovZumm|pL@eJukjN0C-!J{Ep{fC>N0@km<6kQwrl1S0sUuqWPE3*=!%?VTea0Bw
z_8fY(Vrd}sJkvkKUeD#H{tp$ji}Fi&gFi6Y#|zsFyf3<M*m5$yKWH<m?d8@sWzGHI
zT9f1)cgtgRNM>a;TWYkb*k!%qZFM^&zt}CF)DrKB<$##-)uQjAl8E}KyIw2Fno|n2
zpXA_NbFrK||E57wBjF!VEPIuLIEStb9&oAZ--$RA>PYO$)K|=sKdS7DSslZ{QQ1X(
zEEfw_&<HC=H+qh3aUG^>+&9tsv3a|hFF0m(Mb}(q!_l&_g9zJXk@4pU`099z5U1&C
z2F`mDuoQu_0$}JcNYk6Z)$6Rjg1G@dMeEIkHE+@zt+`s26V0i=S=o>vUn{a+x%|uX
zqo)uhrl7INzs^gp?okwXYRpp$CZ*@&EWg(4sqInbA(-nffoY<cm9TS$x9@i1ak3J_
zyA@+@Xq_5b1rgs|{|WboeKiR^m$*OC0TN$@ToU-?RV;fd1L7b6G195~Ye^{n@R4Hl
zc_?nkf`XZqPpfQMD_|EiU(O{bj)=|*G>lJSiB-Mn4HSMVYS@>)Ox3m@Q%Q{=PkC}i
zYj+~E+l$$FuZds(d$v`fBHI%p>tP=KvRe^$cTpE}oJ<Kf#DJ%N9oxk1ZIaah7yX<)
zF81%G7sr2{ClcpJQAIr>JH;<mp-O!f-yD79QCSS1T-*7mVN>F+K08N!2Tqfrz*U)l
zHD8CiL}#0WtDk`z%T5YTFfQdsa%P(Y#8r*(Mltwsh>W#{L}j;igKJNKhd2iohdR1n
zN710%O&D$z-S$+VZ%w07qkCchO`AR!XZIbSqm)?$%{s*_#Bwt@<1p$Y?*2vToCB}t
z+VDi<52mbG!GXVNXDh<At0U#~mwu$-q@&#9F&}z8;#i&BM*aET?TuIW!mEZ(*$xgc
zAt8V1n_u;MJ`|EU&ew7kAv9nWAaS9zV>{cRn%7zP*cJ9X?y;k{I^x`yukKEblXF=#
zKGOG8Tdko=D$~U6hp&nbxoi9vf!ID}rGc$DMI;^ddwi<Xq##3Aaa=-|6y5c~j#dKk
zS$(dkLmC?Mr>M3FuZq9NQ?S<j?V<Wu3<*d1dOf?uH#H0QWVI|=(Lxiho0=C!Y&;Kr
ztcB!LxDOrgJFtCN$i3{Tx9h%S42e0wE8?XgaZ!wPP7YruE3Qw_=`fvxH55BN#u!-g
z3Re3jI&M#AX2M%}qJlc96=AW0>70|HerXw#$_VQ&5k&rDJ3+!nuB;z7zY6({@gr6I
zdiH9hM5=s16WV3QebCjTwf$bJ)g8K8pr(?hesK%LRQ>8p#;25iBnQMV8=^iiw69Wn
zZ+K1&-ha=x-f8hHLP_A~wxWs%MZG^ph%(d#%}H_%-epswC15S(BXZd*fpjB~TwKJw
znB7!A)EqK7#kpxuC1Nchoh0jL!DFmSddW6z6Ega#2wM4IzRVb!;mYLU`c&nHFl`^)
zn^=%-mYhz`qFzDaMIXZh-}=|l=C@pt9$jgR^%aR6*2M)|SM+2*jx?`1MyTXdE8Zv1
z{*61)PKwR4ExRp2beUD3bu+ZOg;dIE5i+cdPnWWxqT{uaKs3e0IlKDmw~>lNLTzu+
z?UJ)svwM2YMYQZYBg9ZqX+|&0HwUF-vy?(JSX-UzmkcGL_D@Tm&Hic)Wg1j5-vcCb
z^fD@AxVSN<PE{}Ltw=pLt+{resC_6qu~$2_VnzK@Jw;l0UQ@&v22kREeV6%Jxrc7B
z+6?3ED-#5<2vPdyJrZdhuM_rSq~VJt(R3M*T^KP7Hm4JY$@HBC1!S?pleuIUmfK(b
z*KZ0sQuTXbMyY675Ezvwm+MR&lH&u!n=naZ4vDTj4m_dYis^9rI9pEX<~4xejo|2@
zYO+$73y6<SUOZfV89emu_FW-4GtGCq=Pt(Ay;HzVn$1*G<9D{tA-8tUG2N?$?Cn%E
zOdNpF$pN-Yf;;CT1MA+2Z%saV)3WR_<Sg24@o0aPjk^r|!9X2V+*9|{?3K%-Zxd{n
z9$z^*H?;2c;WT#AOfq5eNkk@-OkKcVAsKZ)W2%~b*b6h)=olOv_r<%fRCIVGi0g)u
zehe76m<3sG?L86yCZ_qD#dtxAg`08b9R7CQ&p=lK=_kCr?q{=)%OeE6dt3PSg-Z-)
zy{NOc%Qv6LTXtquSh2WYzv&qCm)=OpYh2;`yuFp<^`<XxmF}Fn_XnEl(&{&nFj0GK
z5t|z8ZZVL6m>)<O>^*X_WDI;agLL_RH2LT8$VSa8(xYY6&mTN)F5lV(d0-zHyX)Rr
zm-cV-rD74}`G17telMeeo@<S+@YI#5XmBa4Mgm#5U+ip&eZMr$#yv1}QDwE!tY3~y
zH9XKoeGMePn+$!YH$MsNQiE*VBRl6*5~PVb?$5}3PxA7`46X{Pb(#sfj_9)*%q`Qw
zX|EjoROvLsVALPc_vZVuTrzXiLTaoQQoO4&Lk~L`^;2bGZGPWto{&NED96sv^TDij
zKbgKu&+R^;DHDrhAk#4gT*}DWkTy{3XXCrh5@R1-S8V-_d5mr4$s@iJo&qnft;^iU
z4jktsxwp=#ge&(GJloCAf1G4>EEJ$b%ECI$(k=H)uJ94A9JuGVokwD?OjQV)^B!%;
zPdQO^yu}UL!T$mdPE1bSI}4P{cLkJ-Szh7#amG^qJO3^7t@E_LJiCeK;k;gdWkpOr
z>Bor~JbvV~pmzmA_t)9+fzR5n2X<A{qIzMZsl2ku-A+ZBH60x^`E_nfgSy*^=5|yo
zox3hF-^<esRw*`e=bP9FOQx6s!8qy1nHztdJ(zs*)K!=3G6Okq>M4bDz`&Zn3gC<0
zAf&qOJA41g{EsEd_j;mdY3r|Zc;Bk`teduGboIL*I1a&)Vs3Bjd<|S|ao?A2C59~@
z?M}(wq$O4s^ymc;hFSQ&uF>)JhNb&$6ZLn`)!d*vm^Ti!zf#zKso?~cxh0*o(?FwD
zHCT~UnM=MSx+J@JpkmoC;qbWu|G1B@Lb6Phn(q-*ac{*ol59r;tWWg+$NE?o=TtSo
zIoYemMWZ#uJHH-k*T`yKT%u!od4=@zU4Pj0$cY(O_T-O^`4{yno7gI=m@yDaU{n<*
zJE-){!B~*aEx`J9k1L5Fx}0yFuI9_fP=U2Bi;d)V=rKvTW(hLUduVbk1r4AgNwqgF
z!f+tKV~T~RSoocd8BIn7Ncm;-Dx&%PZf;7>^Kq`anOS!!;2;h{rM_HmGeZ*kMYyiM
zeIoStSg~iK^4WU1Q)jNe{ZV-B8(GXz{JGCU(5a)QH+a;*#nTs_e7kv?@?!4wH0v4I
zwQmhW42Z+k;8Uxr`oCyyoY}w7Cpu>tq*12)7PnHeACNxp6k}>Zcltt?_-TY<r2jnx
z_t%>qBj$DQAe*hZmvA>$(TB4f;gp93H$SW@1*&9f1s)m%z2zI~z<lIOS2|}i?)?EZ
z!n5BZ5B_y;&Y*^C<}BOkuf9F?_wDarF7)jpm8z5tnRrf90%=8Tm2dog`_#LozkfIB
z*|tSqwR?Z+sGKu*#`ebFcBa+e)Z?z&1)M_Z2pO%r|3B?rX;f236iz~H6TuQ9TEU_$
zLfk@;O^}L_AeLfSl)8XIus{LDXrYQA5LBQAl^*s0VgSpoh_ZN)7!Oc4qJ$Q)28;#-
zm%}0w2`EeN@T13yrx1Q8zmk(T^XA><n>RD}-tQezm^$XUB&TpBa<#<?=*(yv9@VZC
zuksj(6C)IpEOfbCTtxjXgA^FFavuj60k*b;1#VvH!w6)=J=5b-V=60CtNN1tls&p4
zUkw$F>^<&8N@w8$Tdxf=GFs>$Klmjb>$aM(AKS0SjkItd*|c8=gC&^Sv#ob01rIF7
zJs=7_OYWbc6r8~HHU>XaDreIiaTN?p|Bi>NNnGmUCVh3YTSpJh0hu%N34gaGmI2=y
z4_2l*)sWv~p7<H(he%k%?eN<*cqk!kcmG&_WTaDm31k3L%*km--?+A;!;K*niRyJZ
zg%7CizycoZvlNx{3vk=$+<T!%0>}(oZ5R}dYX*aLqcdov+ji`6FZ1LOJi4tfQ5c)~
zs8p{b$c8;G%JP=twixs_;smaV_$a;_H!yd(Kp88#d?(A!B`A@21a&1)NA;+=GKp$r
z$fD<FtvmB%5F1=6lNM~?m79L+<=j@f0m?x)8?^$vq!`|{AGrJfo|4-)yvC7sxBM1x
zf(e_0vIn!oY5dVH@!+|M(P8>1*q!Nj+}_aY=7y)1pk*v!%L44Xh;1oawx8kd;9o2?
z$g9&q+Mff`Z9gv9POiK`5PG^ZHP%t?<b-pQP8o259N1O<2d+e1Bs;pBa~>}ba5R>D
zf!c8NE<t*L%o+kxRXTaEic5wN<+yn6s#4+3bxT5?Mu{OcRBQz~{kdL{ilNJcq>KYs
z1K*)iOg}d!bmF~nqd=v?>W9E|t#NJr_ISgZLNte-wt6-fM|yFR*7o)Q<=17-1R9uy
z-)T%Zztwp@39qR~o4B;5B18pAIsi#pRI0O=^qS1&cmGj$Z^bg&d*f)1O|rI-gcaq-
z+~^2=j`wS<+r`fHO`pd{eWkC!q0);n?q^WCS|7E%fy{$i9^7hRKsV2bvFf{;ha$IY
zP_EkB2&kKCSC7uw!ywH+hz0vuJyibaoB9ja9%(*K=vm7jVX)wcu@_?RedwRFA_g<V
z&=#swTp0m8WIev7@JIpWZ37;l0fYYuupupe**J|GhLfsZYf{=fX+~6>R3g%4SdeZz
zu*cmzvWHX80X9VB4-=yNDYQ1zUQ652yJRjkem>pB<bJFt@(8dPsIFgB4GYU5w2dZC
z%9frN12jJgyJ?c$9HI%;c*YA51;-E+zAjUl=z{>PIwMq2N>-5~Q;m47q)yUuv+B7-
z?-!Uf^-zJoj|W@LN$dCM0g45aUlfbaI%+n6E@0rrByRtXXw4=XGn6RYkR`6w@tu4g
zGVr}58ANR4?!iePin<tnT?FCv<j&}Qgw^WcmCE`Q`&a@5Uo~RmG7ecIi=;8T38N6O
z(XR!3qC6DiOxNcdk`F@k{*Y7#rS<Q=mw`#l%c~R^H%bj_U)SYq_5X4ptJMeyRof+1
zZxA~I3(mtbTK&jh6KGFa`1~BPzR9FRG7l4lvdqV|dfg-fz{eup`fy}E%CVU6tI<hm
z=e?}~Ju;h)or`w;>$<?kP;E28l+Lay(zrM*vIdv52vRreJT|;w@|h=lM34?phtxFP
zS62hDF`wXX2s5~LYG)mI=ay50k{#3EXKGt*XAUMVBc*vjduAj3sE1$X)BZK9kN%qe
z*=atw<pJC6Zk?F1oIbpTwj*ZKJ&UCg(KD3shix&q6e729mxh+=<ism)4^b9ag|cUE
z-IJ16DEq$#I3t_yz^`*@sRfJ<g?Nr1Vdacaa5^xVdV#UpPKZkjExAzTX7J=s-b-7T
zK`QI016s~FCFmQXIbmv}X@HA14+n)cZCP**QY@iYZgy!Yy?MG|nns^=v~(SSf&0$B
zYTwI03Jl&i9`Nf*if6+@ISmqxB}zlr2%^MMHT=+ODD<S_qv|pnJYl91YrD<LULsbK
z3lzzrv8akAE3vb~7E5h*ZueK-#`Y&aDXss9RqkSt<>C6X&a=^Jx)M^vMuQ~V*(jn$
z2j;M~?Zny4fKiHvme&UrnwA%`6y_~ALMnV(&bML(kjec9pa8O20NKP+7BkFOWaS~i
Pz{h@*qwPf-=J9_3lvlZB

literal 0
HcmV?d00001


From 101c03903577256b6463154c87e10d5094ac2482 Mon Sep 17 00:00:00 2001
From: Daniel Vega-Myhre <danvm@meta.com>
Date: Wed, 18 Jun 2025 11:09:45 -0700
Subject: [PATCH 138/165] [float8 moe training] make using triton kernels for
 per-group scaling configurable (#2405)

* improve moe training benchmarking

* lint

* readability improvements

* grab use_triton for args instead of class attribute

* add comment
---
 .../benchmarks/benchmark_scaled_grouped_mm.py | 72 +++++++++++++------
 .../moe_training/conversion_utils.py          | 11 ++-
 .../moe_training/scaled_grouped_mm.py         | 48 +++++++++++--
 torchao/prototype/moe_training/tensor.py      | 22 +++++-
 4 files changed, 122 insertions(+), 31 deletions(-)

diff --git a/torchao/prototype/moe_training/benchmarks/benchmark_scaled_grouped_mm.py b/torchao/prototype/moe_training/benchmarks/benchmark_scaled_grouped_mm.py
index af1a652fc0..a347763fe6 100644
--- a/torchao/prototype/moe_training/benchmarks/benchmark_scaled_grouped_mm.py
+++ b/torchao/prototype/moe_training/benchmarks/benchmark_scaled_grouped_mm.py
@@ -4,7 +4,7 @@
 # This source code is licensed under the BSD 3-Clause license found in the
 # LICENSE file in the root directory of this source tree.
 # this benchmarking script is a modified version of the original script from: https://github.com/drisspg/transformer_nuggets/blob/main/transformer_nuggets/utils/benchmark.py
-
+import argparse
 import itertools
 import time
 from dataclasses import dataclass
@@ -31,7 +31,9 @@ class ExperimentConfig:
 
 @dataclass(frozen=True)
 class ExperimentResult:
-    time_us: float
+    torch_time_us: float
+    triton_time_us: bool
+    triton_speedup: float
 
 
 @dataclass(frozen=True)
@@ -41,12 +43,14 @@ class Experiment:
 
 
 def get_configs() -> List[ExperimentConfig]:
-    A_shapes = [(2**8, 4096), (2**12, 4096), (2**16, 4096)]
-    B_shapes = [(4, 4096, 4096), (8, 4096, 4096), (16, 4096, 4096)]
+    A_shapes = [(2**8, 8192), (2**12, 8192), (2**16, 8192)]
+    B_shapes = [(4, 8192, 8192), (8, 8192, 8192), (16, 8192, 8192)]
     high_precision_dtypes = [torch.bfloat16]
     configs = []
     for A_shape, B_shape, high_precision_dtype in itertools.product(
-        A_shapes, B_shapes, high_precision_dtypes
+        A_shapes,
+        B_shapes,
+        high_precision_dtypes,
     ):
         configs.append(
             ExperimentConfig(
@@ -58,7 +62,9 @@ def get_configs() -> List[ExperimentConfig]:
     return configs
 
 
-def run_experiment(config: ExperimentConfig) -> ExperimentResult:
+def run_experiment(
+    config: ExperimentConfig, args: argparse.Namespace
+) -> ExperimentResult:
     # define test inputs
     A = torch.randn(
         *config.A_shape,
@@ -92,26 +98,46 @@ def warmup(func, *args, **kwargs):
         for _ in range(10):
             func(*args, **kwargs)
 
-    def forward_backward(A, B_t, offs):
-        out = _scaled_grouped_mm(A, B_t, offs=offs, out_dtype=torch.bfloat16)
+    def forward_backward(A, B_t, offs, use_triton=True):
+        out = _scaled_grouped_mm(
+            A,
+            B_t,
+            offs=offs,
+            out_dtype=torch.bfloat16,
+            use_triton_for_per_group_scales=use_triton,
+        )
         out.sum().backward()
+        torch.cuda.synchronize()
 
-    # bench triton
-    warmup(forward_backward, A, B_t, offs)
+    # benchmark torch
+    torch_func = torch.compile(forward_backward) if args.compile else forward_backward
+    warmup(torch_func, A, B_t, offs, use_triton=False)
     start_time_ns = time.perf_counter_ns()
-    forward_backward(A, B_t, offs)
-    time_ns = time.perf_counter_ns() - start_time_ns
-    time_us = time_ns / 1e3
+    torch_func(A, B_t, offs, use_triton=False)
+    torch_time_ns = time.perf_counter_ns() - start_time_ns
+    torch_time_us = torch_time_ns / 1e3
 
-    return ExperimentResult(time_us=time_us)
+    # benchmark triton
+    warmup(forward_backward, A, B_t, offs, use_triton=True)
+    start_time_ns = time.perf_counter_ns()
+    forward_backward(A, B_t, offs, use_triton=True)
+    triton_time_ns = time.perf_counter_ns() - start_time_ns
+    triton_time_us = triton_time_ns / 1e3
+
+    return ExperimentResult(
+        torch_time_us=round(torch_time_us, 3),
+        triton_time_us=round(triton_time_us, 3),
+        triton_speedup=round(torch_time_us / triton_time_us, 3),
+    )
 
 
 def print_results(experiments: List[Experiment]):
     headers = [
         "A_shape",
         "B_shape",
-        "high_precision_dtype",
-        "time_us",
+        "torch_time_us",
+        "triton_time_us",
+        "triton_speedup",
     ]
     rows = []
     for experiment in experiments:
@@ -121,19 +147,20 @@ def print_results(experiments: List[Experiment]):
             [
                 A_shape,
                 B_shape,
-                experiment.config.high_precision_dtype,
-                experiment.result.time_us,
+                experiment.result.torch_time_us,
+                experiment.result.triton_time_us,
+                experiment.result.triton_speedup,
             ]
         )
     print(tabulate(rows, headers=headers))
 
 
-def main():
+def main(args: argparse.Namespace):
     torch.random.manual_seed(123)
     configs = get_configs()
     results = []
     for config in tqdm(configs):
-        result = run_experiment(config)
+        result = run_experiment(config, args)
         results.append(Experiment(config=config, result=result))
 
     # Use Tabulate to print results
@@ -141,4 +168,7 @@ def main():
 
 
 if __name__ == "__main__":
-    main()
+    arg_parser = argparse.ArgumentParser()
+    arg_parser.add_argument("--compile", action="store_true")
+    args = arg_parser.parse_args()
+    main(args)
diff --git a/torchao/prototype/moe_training/conversion_utils.py b/torchao/prototype/moe_training/conversion_utils.py
index 928af1cf2e..4d65303b89 100644
--- a/torchao/prototype/moe_training/conversion_utils.py
+++ b/torchao/prototype/moe_training/conversion_utils.py
@@ -28,7 +28,8 @@ class MoETrainingConfig(AOBaseConfig):
     For all other ops, ScaledGroupedMMTensor behaves like a regular torch.Tensor.
     """
 
-    pass
+    # temporary config flag for testing/benchmarking, will remove before graduating out of prototype
+    use_triton_for_per_group_scales: bool = True
 
 
 @register_quantize_module_handler(MoETrainingConfig)
@@ -46,7 +47,7 @@ def _moe_training_transform(
     Returns:
      nn.Module: The modified module with swapped parameters.
     """
-    out = _swap_params(module)
+    out = _swap_params(module, config=config)
     return out
 
 
@@ -54,6 +55,7 @@ def _swap_params(
     module: nn.Module,
     *,
     module_filter_fn: Optional[Callable[[nn.Module, str], bool]] = None,
+    config: Optional[MoETrainingConfig] = None,
 ) -> nn.Module:
     """
     Recurses through the nn.Module, recursively swapping the data tensor of
@@ -69,6 +71,7 @@ def _swap_params(
     Returns:
      nn.Module: The modified module with swapped linear layers.
     """
+    use_triton = config.use_triton_for_per_group_scales if config is not None else False
     if isinstance(module, nn.Parameter) and (
         module_filter_fn is None or module_filter_fn(module, "")
     ):
@@ -77,7 +80,9 @@ def _swap_params(
                 f"Does not support a root nn.Parameter with children: {module}"
             )
         if not isinstance(module.data, ScaledGroupedMMTensor):
-            new_data = ScaledGroupedMMTensor(module.data)
+            new_data = ScaledGroupedMMTensor(
+                module.data, use_triton_for_per_group_scales=use_triton
+            )
             return nn.Parameter(new_data, requires_grad=module.requires_grad)
         return module
 
diff --git a/torchao/prototype/moe_training/scaled_grouped_mm.py b/torchao/prototype/moe_training/scaled_grouped_mm.py
index d3aaf615db..f7d470e556 100644
--- a/torchao/prototype/moe_training/scaled_grouped_mm.py
+++ b/torchao/prototype/moe_training/scaled_grouped_mm.py
@@ -14,7 +14,11 @@
     triton_fp8_col_major_jagged_colwise_scales,
     triton_fp8_row_major_jagged_rowwise_scales,
 )
-from torchao.prototype.moe_training.utils import _is_column_major
+from torchao.prototype.moe_training.utils import (
+    _is_column_major,
+    _to_2d_jagged_float8_tensor_colwise,
+    _to_2d_jagged_float8_tensor_rowwise,
+)
 
 
 def _scaled_grouped_mm(
@@ -22,6 +26,7 @@ def _scaled_grouped_mm(
     B_t: torch.Tensor,
     offs: torch.Tensor,
     out_dtype: Optional[torch.dtype] = torch.bfloat16,
+    use_triton_for_per_group_scales: bool = True,
 ) -> torch.Tensor:
     """
     This function performs dynamic float8 quantization with row-wise scaling
@@ -34,6 +39,7 @@ def _scaled_grouped_mm(
             and in column-major memory layout.
         offs (int32 torch.Tensor): The offsets to use to mark the starting index of each group along dim0 of the A tensor.
         out_dtype (Optional[torch.dtype]): The dtype of the output tensor. Currently only torch.bfloat16 is supported.
+        use_triton_for_per_group_scales (bool): Whether to use custom triton kernels to compute per-group scales. Default is True.
     """
     return _Float8GroupedMM.apply(
         A,
@@ -53,6 +59,7 @@ def forward(
         B_t: torch.Tensor,
         offs: torch.Tensor,
         out_dtype: Optional[torch.dtype] = torch.bfloat16,
+        use_triton_for_per_group_scales: bool = True,
     ) -> torch.Tensor:
         # torchao _scaled_grouped_mm only supports A=2D, B=3D.
         assert A.ndim == 2, "A must be 2D"
@@ -136,9 +143,16 @@ def forward(
         # Store what we need for backward.
         ctx.save_for_backward(A, B_fp8_col_major, B_scales, offs)
         ctx.out_dtype = out_dtype
+        ctx.use_triton_for_per_group_scales = use_triton_for_per_group_scales
 
         # Perform scaled grouped GEMM and return result.
         # output shape: scaled grouped mm of (M,K) @ (B,K,N) = (M,N)
+        assert not _is_column_major(A_fp8_row_major), (
+            "A must be row-major for output = A @ B"
+        )
+        assert _is_column_major(B_t_fp8_col_major), (
+            "B must be column-major for output = A @ B"
+        )
         return torch._scaled_grouped_mm(
             A_fp8_row_major,
             B_t_fp8_col_major,
@@ -153,6 +167,7 @@ def forward(
     def backward(ctx, grad_output: torch.Tensor):
         A, B_fp8_col_major, B_scales, offs = ctx.saved_tensors
         out_dtype = ctx.out_dtype
+        use_triton_for_per_group_scales = ctx.use_triton_for_per_group_scales
 
         # Convert grad_output to float8, row-major for left operand of grouped GEMM
         # needed for grad_A: grad_output @ B
@@ -175,6 +190,12 @@ def backward(ctx, grad_output: torch.Tensor):
         #
         # grad_A = grad_output @ B
         # grad_A = scaled grouped mm of (M,N) @ (B,N,K) = (M,K)
+        assert not _is_column_major(grad_output_fp8_row_major), (
+            "grad_output must be row-major for grad_A = grad_output @ B"
+        )
+        assert _is_column_major(B_fp8_col_major), (
+            "B must be column-major for grad_A = grad_output @ B"
+        )
         grad_A = torch._scaled_grouped_mm(
             grad_output_fp8_row_major,
             B_fp8_col_major,
@@ -195,25 +216,42 @@ def backward(ctx, grad_output: torch.Tensor):
 
         # grad_B is a special case. both operands of the grouped gemm will be 2D with offsets determing the "groups."
         # Compute scales for grad_output_t and A, which are both 2D tensors with offsets which define the "jagged" groups.
+        per_group_rowwise_scale_func = (
+            triton_fp8_row_major_jagged_rowwise_scales
+            if use_triton_for_per_group_scales
+            else _to_2d_jagged_float8_tensor_rowwise
+        )
+        per_group_colwise_scale_func = (
+            triton_fp8_col_major_jagged_colwise_scales
+            if use_triton_for_per_group_scales
+            else _to_2d_jagged_float8_tensor_colwise
+        )
+
         grad_output_t_fp8_row_major, grad_output_t_scales = (
-            triton_fp8_row_major_jagged_rowwise_scales(
+            per_group_rowwise_scale_func(
                 grad_output_t_row_major,
                 offs,
-                output_dtype=torch.float8_e4m3fn,
+                torch.float8_e4m3fn,
                 round_scales_to_power_of_2=True,
             )
         )
 
-        A_fp8_col_major, A_scales = triton_fp8_col_major_jagged_colwise_scales(
+        A_fp8_col_major, A_scales = per_group_colwise_scale_func(
             A_col_major,
             offs,
-            output_dtype=torch.float8_e4m3fn,
+            torch.float8_e4m3fn,
             round_scales_to_power_of_2=True,
         )
 
         # Compute grad_B = grad_output_t @ A.
         # grad_B = grad_output_t @ A
         # grad_B = (N,M) @ (M,K) = (N,K)
+        assert not _is_column_major(grad_output_t_fp8_row_major), (
+            "grad_output_t must be row-major for grad_B = grad_output_t @ A"
+        )
+        assert _is_column_major(A_fp8_col_major), (
+            "A must be column-major for grad_B = grad_output_t @ A"
+        )
         grad_B = torch._scaled_grouped_mm(
             grad_output_t_fp8_row_major,
             A_fp8_col_major,
diff --git a/torchao/prototype/moe_training/tensor.py b/torchao/prototype/moe_training/tensor.py
index 2a929d3b76..8d7a8f815b 100644
--- a/torchao/prototype/moe_training/tensor.py
+++ b/torchao/prototype/moe_training/tensor.py
@@ -12,9 +12,16 @@ class ScaledGroupedMMTensor(torch.Tensor):
 
     grouped_mm_func_name = "_grouped_mm"
     offs_arg_name = "offs"
+    use_triton_for_per_group_scales = True
 
-    def __init__(self, data: torch.Tensor):
+    def __init__(
+        self, data: torch.Tensor, use_triton_for_per_group_scales: bool = True
+    ):
         self._data = data
+        self._use_triton_for_per_group_scales = use_triton_for_per_group_scales
+
+    def __repr__(self):
+        return f"ScaledGroupedMMTensor(use_triton_for_per_group_scales={self._use_triton_for_per_group_scales}, {self._data})"
 
     @classmethod
     def __torch_function__(cls, func, types, args, kwargs={}):
@@ -31,5 +38,16 @@ def __torch_function__(cls, func, types, args, kwargs={}):
             B_is_3d = B.dim() == 3
             has_offs = kwargs.get(cls.offs_arg_name) is not None
             if A_is_2d and B_is_3d and has_offs:
-                return _scaled_grouped_mm(*args, **kwargs)
+                # prefer to use B to check use_triton, as that will be the weight/nn.Parameter
+                # that is converted to ScaledGroupedMMTensor
+                use_triton = (
+                    B._use_triton_for_per_group_scales
+                    if isinstance(B, cls)
+                    else A._use_triton_for_per_group_scales
+                )
+                return _scaled_grouped_mm(
+                    *args,
+                    use_triton_for_per_group_scales=use_triton,
+                    **kwargs,
+                )
         return super().__torch_function__(func, types, args, kwargs)

From 809af2e69ad9a37d5a9d099c0e1ff7b714d86cbf Mon Sep 17 00:00:00 2001
From: Gasoonjia <gasoonjia@icloud.com>
Date: Wed, 18 Jun 2025 15:04:38 -0700
Subject: [PATCH 139/165] Replace debug handle with `from_node` to trace
 operator transformation (#2339)

Replace debug handle with `from_node` to trace operator transformation (#2339)

Summary:
X-link: https://github.com/pytorch/executorch/pull/11532

Pull Request resolved: https://github.com/pytorch/ao/pull/2339

This diff replace the debug handle  with `from_node` infrastructure, which is a first class citizen in exported program and used to trace the node-level transformation by recording every ancestor of given node. N6213836 is a demonstration of how `from_node` infra records the node transformation after unlifting and re-exporting exported graph.

For simplify the progress, we are trying to reuse the debug handle infrastructure by generating debug handle with hashing their greatest ancestor's node.

After this change user no longer need to invoke `generate_numeric_debug_handle` for debugging. Also the original pipeline will still work under current scenario.

Reviewed By: jerryzh168

Differential Revision: D76168997
---
 .../pt2e/test_numeric_debugger.py             | 75 ++++++++++---------
 test/quantization/pt2e/test_quantize_pt2e.py  |  5 +-
 torchao/quantization/pt2e/__init__.py         |  2 +
 .../quantization/pt2e/_numeric_debugger.py    | 75 ++++++++++++++++---
 torchao/quantization/pt2e/convert.py          | 43 +++++++----
 torchao/quantization/pt2e/prepare.py          | 14 ++--
 torchao/testing/pt2e/utils.py                 | 35 +++------
 7 files changed, 153 insertions(+), 96 deletions(-)

diff --git a/test/quantization/pt2e/test_numeric_debugger.py b/test/quantization/pt2e/test_numeric_debugger.py
index 5f565767aa..040cd1edcf 100644
--- a/test/quantization/pt2e/test_numeric_debugger.py
+++ b/test/quantization/pt2e/test_numeric_debugger.py
@@ -15,7 +15,6 @@
 from torch.testing._internal.common_utils import IS_WINDOWS, run_tests
 
 from torchao.quantization.pt2e import (
-    generate_numeric_debug_handle,
     prepare_for_propagation_comparison,
 )
 from torchao.testing.pt2e.utils import PT2ENumericDebuggerTestCase
@@ -35,20 +34,21 @@ def test_simple(self):
         m = TestHelperModules.Conv2dThenConv1d()
         example_inputs = m.example_inputs()
         ep = export_for_training(m, example_inputs, strict=True)
-        generate_numeric_debug_handle(ep)
-        self._assert_each_node_has_debug_handle(ep)
-        debug_handle_map = self._extract_debug_handles(ep)
+        m = ep.module()
+        self._assert_each_node_has_debug_handle(m)
+        debug_handle_map = self._extract_debug_handles(m)
 
         self.assertEqual(len(set(debug_handle_map.values())), len(debug_handle_map))
 
+    @unittest.skip("debug flow not working on model with conditional control flow")
     def test_control_flow(self):
         m = TestHelperModules.ControlFlow()
         example_inputs = m.example_inputs()
         ep = export_for_training(m, example_inputs, strict=True)
-        generate_numeric_debug_handle(ep)
+        m = ep.module()
 
-        self._assert_each_node_has_debug_handle(ep)
-        debug_handle_map = self._extract_debug_handles(ep)
+        self._assert_each_node_has_debug_handle(m)
+        debug_handle_map = self._extract_debug_handles(m)
 
         self.assertEqual(len(set(debug_handle_map.values())), len(debug_handle_map))
 
@@ -56,13 +56,13 @@ def test_copy_preserve_handle(self):
         m = TestHelperModules.Conv2dThenConv1d()
         example_inputs = m.example_inputs()
         ep = torch.export.export(m, example_inputs, strict=True)
-        generate_numeric_debug_handle(ep)
+        m = ep.module()
 
-        self._assert_each_node_has_debug_handle(ep)
-        debug_handle_map_ref = self._extract_debug_handles(ep)
+        self._assert_each_node_has_debug_handle(m)
+        debug_handle_map_ref = self._extract_debug_handles(m)
 
         ep_copy = copy.copy(ep)
-        debug_handle_map = self._extract_debug_handles(ep_copy)
+        debug_handle_map = self._extract_debug_handles(ep_copy.module())
 
         self._assert_each_node_has_debug_handle(ep)
         self.assertEqual(debug_handle_map, debug_handle_map_ref)
@@ -71,13 +71,12 @@ def test_deepcopy_preserve_handle(self):
         m = TestHelperModules.Conv2dThenConv1d()
         example_inputs = m.example_inputs()
         ep = torch.export.export(m, example_inputs, strict=True)
-        generate_numeric_debug_handle(ep)
 
-        debug_handle_map_ref = self._extract_debug_handles(ep)
+        debug_handle_map_ref = self._extract_debug_handles(ep.module())
         ep_copy = copy.deepcopy(ep)
-        debug_handle_map = self._extract_debug_handles(ep_copy)
+        debug_handle_map = self._extract_debug_handles(ep_copy.module())
 
-        self._assert_each_node_has_debug_handle(ep)
+        self._assert_each_node_has_debug_handle(ep.module())
         self.assertEqual(debug_handle_map, debug_handle_map_ref)
 
     @unittest.skip(
@@ -87,16 +86,16 @@ def test_re_export_preserve_handle(self):
         m = TestHelperModules.Conv2dThenConv1d()
         example_inputs = m.example_inputs()
         ep = export_for_training(m, example_inputs, strict=True)
-        generate_numeric_debug_handle(ep)
         m = ep.module()
 
-        self._assert_each_node_has_debug_handle(ep)
-        debug_handle_map_ref = self._extract_debug_handles(ep)
+        self._assert_each_node_has_debug_handle(m)
+        debug_handle_map_ref = self._extract_debug_handles(m)
 
         ep_reexport = export_for_training(m, example_inputs, strict=True)
+        m_reexport = ep_reexport.module()
 
-        self._assert_each_node_has_debug_handle(ep_reexport)
-        debug_handle_map = self._extract_debug_handles(ep_reexport)
+        self._assert_each_node_has_debug_handle(m_reexport)
+        debug_handle_map = self._extract_debug_handles(m_reexport)
 
         self.assertEqual(debug_handle_map, debug_handle_map_ref)
 
@@ -107,16 +106,17 @@ def test_run_decompositions_same_handle_id(self):
         m = TestHelperModules.Conv2dThenConv1d()
         example_inputs = m.example_inputs()
         ep = export_for_training(m, example_inputs, strict=True)
-        generate_numeric_debug_handle(ep)
+        m = ep.module()
 
-        self._assert_each_node_has_debug_handle(ep)
-        debug_handle_map_ref = self._extract_debug_handles(ep)
+        self._assert_each_node_has_debug_handle(m)
+        debug_handle_map_ref = self._extract_debug_handles(m)
 
         ep_copy = copy.copy(ep)
         ep_copy = ep_copy.run_decompositions()
+        m_decomposed = ep_copy.module()
 
-        self._assert_each_node_has_debug_handle(ep_copy)
-        debug_handle_map = self._extract_debug_handles(ep_copy)
+        self._assert_each_node_has_debug_handle(m_decomposed)
+        debug_handle_map = self._extract_debug_handles(m_decomposed)
 
         # checking the map still has the same ids, the node may change
         self.assertEqual(
@@ -135,18 +135,19 @@ def test_run_decompositions_map_handle_to_new_nodes(self):
         for m in test_models:
             example_inputs = m.example_inputs()
             ep = export_for_training(m, example_inputs, strict=True)
-            generate_numeric_debug_handle(ep)
+            m = ep.module()
 
-            self._assert_each_node_has_debug_handle(ep)
+            self._assert_each_node_has_debug_handle(m)
             pre_decomp_to_debug_handle_map_ref = (
-                self._extract_debug_handles_with_prev_decomp_op(ep)
+                self._extract_debug_handles_with_prev_decomp_op(m)
             )
 
             ep_copy = copy.copy(ep)
             ep_copy = ep_copy.run_decompositions()
-            self._assert_each_node_has_debug_handle(ep_copy)
+            m_decomposed = ep_copy.module()
+            self._assert_each_node_has_debug_handle(m_decomposed)
             pre_decomp_to_debug_handle_map = (
-                self._extract_debug_handles_with_prev_decomp_op(ep_copy)
+                self._extract_debug_handles_with_prev_decomp_op(m_decomposed)
             )
 
             # checking the map still has the same ids, the node may change
@@ -158,7 +159,6 @@ def test_prepare_for_propagation_comparison(self):
         m = TestHelperModules.Conv2dThenConv1d()
         example_inputs = m.example_inputs()
         ep = export_for_training(m, example_inputs, strict=True)
-        generate_numeric_debug_handle(ep)
         m = ep.module()
         m_logger = prepare_for_propagation_comparison(m)
         ref = m(*example_inputs)
@@ -175,9 +175,10 @@ def test_added_node_gets_unique_id(self) -> None:
         m = TestHelperModules.Conv2dThenConv1d()
         example_inputs = m.example_inputs()
         ep = export_for_training(m, example_inputs, strict=True)
-        generate_numeric_debug_handle(ep)
-        ref_handles = self._extract_debug_handles(ep)
+
+        ref_handles = self._extract_debug_handles(ep.module())
         ref_counter = Counter(ref_handles.values())
+
         for k, v in ref_counter.items():
             self.assertEqual(
                 v,
@@ -199,10 +200,10 @@ def test_added_node_gets_unique_id(self) -> None:
 
         # Regenerate handles, make sure only the new relu node has a new id, and
         # it doesn't clash with any of the existing ids.
-        generate_numeric_debug_handle(ep)
 
-        self._assert_each_node_has_debug_handle(ep)
-        handles_after_modification = self._extract_debug_handles(ep)
+        m = ep.module()
+        self._assert_each_node_has_debug_handle(m)
+        handles_after_modification = self._extract_debug_handles(m)
         handles_counter = Counter(handles_after_modification.values())
         for name, handle in ref_handles.items():
             self.assertIn(name, handles_after_modification)
@@ -219,7 +220,7 @@ def test_added_node_gets_unique_id(self) -> None:
 
         # Check for relu specifically. Avoid hardcoding the handle id since it
         # may change with future node ordering changes.
-        self.assertNotEqual(handles_after_modification["relu_default"], 0)
+        self.assertNotIn(handles_after_modification["relu_default"], ref_counter)
         self.assertEqual(handles_counter[handles_after_modification["relu_default"]], 1)
 
 
diff --git a/test/quantization/pt2e/test_quantize_pt2e.py b/test/quantization/pt2e/test_quantize_pt2e.py
index be5a4dc537..19f208a55c 100644
--- a/test/quantization/pt2e/test_quantize_pt2e.py
+++ b/test/quantization/pt2e/test_quantize_pt2e.py
@@ -36,7 +36,7 @@
 )
 
 import torchao
-from torchao.quantization.pt2e import ObserverOrFakeQuantize, observer
+from torchao.quantization.pt2e import FROM_NODE_KEY, ObserverOrFakeQuantize, observer
 from torchao.quantization.pt2e.quantize_pt2e import (
     convert_pt2e,
     prepare_pt2e,
@@ -1499,7 +1499,8 @@ def forward(self, x):
         for n in m.graph.nodes:
             if n.op == "get_attr" and "frozen_param" in n.target:
                 for key in n.meta:
-                    self.assertEqual(n.meta[key], weight_meta[key])
+                    if key != FROM_NODE_KEY:
+                        self.assertEqual(n.meta[key], weight_meta[key])
 
     def test_save_load(self):
         """Test save/load a quantized model"""
diff --git a/torchao/quantization/pt2e/__init__.py b/torchao/quantization/pt2e/__init__.py
index b6b8a728a3..8b6a99337b 100644
--- a/torchao/quantization/pt2e/__init__.py
+++ b/torchao/quantization/pt2e/__init__.py
@@ -7,6 +7,7 @@
 
 from torchao.quantization.pt2e._numeric_debugger import (  # noqa: F401
     CUSTOM_KEY,
+    FROM_NODE_KEY,
     NUMERIC_DEBUG_HANDLE_KEY,
     compare_results,
     extract_results_from_loggers,
@@ -132,6 +133,7 @@
     "generate_numeric_debug_handle",
     "CUSTOM_KEY",
     "NUMERIC_DEBUG_HANDLE_KEY",
+    "FROM_NODE_KEY",
     "prepare_for_propagation_comparison",
     "extract_results_from_loggers",
     "compare_results",
diff --git a/torchao/quantization/pt2e/_numeric_debugger.py b/torchao/quantization/pt2e/_numeric_debugger.py
index 0d66ca71ee..de1e1eee84 100644
--- a/torchao/quantization/pt2e/_numeric_debugger.py
+++ b/torchao/quantization/pt2e/_numeric_debugger.py
@@ -16,10 +16,16 @@
 from torch.fx import GraphModule, Node
 from torch.nn import functional as F
 
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_6
+
+if TORCH_VERSION_AT_LEAST_2_6:
+    from torch.fx.traceback import NodeSource
+
 from .graph_utils import bfs_trace_with_node_process
 
 NUMERIC_DEBUG_HANDLE_KEY = "numeric_debug_handle"
 CUSTOM_KEY = "custom"
+FROM_NODE_KEY = "from_node"
 
 log = logging.getLogger(__name__)
 
@@ -78,6 +84,56 @@ def _assign_debug_handle(node: torch.fx.Node) -> None:
     bfs_trace_with_node_process(ep, _assign_debug_handle)
 
 
+def _get_greatest_ancestor_node_source(node: Node) -> Optional["NodeSource"]:
+    if (node_source := node.meta.get(FROM_NODE_KEY)) is None:
+        return None
+
+    node_source = node_source[-1]
+
+    while len(node_source.from_node) > 0:
+        node_source = node_source.from_node[-1]
+
+    return node_source
+
+
+def _generate_debug_handle_from_node(node: Node) -> Optional[int]:
+    """
+    Generate a debug handle based on node's oldest ancestor node's name
+    and graph id, or return None if the node does not need to be traced.
+
+    This is a temporary function for migrating node tracing infra from
+    using debug handle to node.meta["from_node"]. The infrastructure will
+    depend on node.meta["from_node"] directly in the future, without the need
+    of debug handle as intermediate variable.
+    """
+
+    if node.op == "placeholder" or node.op == "output":
+        # placeholder and output nodes don't have debug handle
+        return None
+
+    if (
+        FROM_NODE_KEY not in node.meta
+        or node.meta[FROM_NODE_KEY] is None
+        or node.meta[FROM_NODE_KEY][-1].pass_name == "ExportedProgram.module().unlift()"
+    ):
+        # This node is not part of the ExportedProgram.module().graph, so it doesn't have a debug handle
+        return None
+
+    greatest_ancestor_node_source = _get_greatest_ancestor_node_source(node)
+
+    if greatest_ancestor_node_source is None:
+        # This node is not part of the ExportedProgram.module().graph, so it doesn't have a debug handle
+        return None
+
+    if greatest_ancestor_node_source.pass_name == "ExportedProgram.module().unlift()":
+        # uplifted nodes don't have debug handle
+        return None
+
+    return hash(
+        greatest_ancestor_node_source.name + str(greatest_ancestor_node_source.graph_id)
+    )
+
+
 def _detach(x: object) -> object:
     detached: object = None
     if isinstance(x, torch.Tensor):
@@ -187,23 +243,24 @@ def _insert_logger(model: GraphModule, node: Node, debug_handle: int) -> Node:
 
 
 def prepare_for_propagation_comparison(model: GraphModule) -> GraphModule:
-    """Add output loggers to node that has numeric_debug_handle
+    """Add output loggers to unlifted node
 
     Args:
         model (GraphModule): original model
     Returns:
-        a model with output loggers for all nodes that has numeric_debug_handle_id
+        a model with output loggers for all unlifted nodes
     """
+    if not TORCH_VERSION_AT_LEAST_2_6:
+        log.warning(
+            "prepare_for_propagation_comparison is only supported for PyTorch 2.6+"
+        )
+        return model
+
     # don't change the original model
     model = copy.deepcopy(model)
     for n in model.graph.nodes:
-        if (
-            CUSTOM_KEY not in n.meta
-            or NUMERIC_DEBUG_HANDLE_KEY not in n.meta[CUSTOM_KEY]
-        ):
-            continue
-        numeric_debug_handle = n.meta[CUSTOM_KEY][NUMERIC_DEBUG_HANDLE_KEY]
-        _insert_logger(model, n, numeric_debug_handle)
+        if (numeric_debug_handle := _generate_debug_handle_from_node(n)) is not None:
+            _insert_logger(model, n, numeric_debug_handle)
 
     model.recompile()
     return model
diff --git a/torchao/quantization/pt2e/convert.py b/torchao/quantization/pt2e/convert.py
index 2f3e6e0461..99516ac4c3 100644
--- a/torchao/quantization/pt2e/convert.py
+++ b/torchao/quantization/pt2e/convert.py
@@ -71,8 +71,12 @@
 from torch.fx.graph_module import _USER_PRESERVED_ATTRIBUTES_KEY
 from torch.nn.utils.parametrize import type_before_parametrizations
 
-from torchao.quantization.pt2e import CUSTOM_KEY, NUMERIC_DEBUG_HANDLE_KEY
+from torchao.quantization.pt2e import FROM_NODE_KEY
 from torchao.quantization.pt2e.observer import _is_activation_post_process
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_6
+
+if TORCH_VERSION_AT_LEAST_2_6:
+    from torch.fx.traceback import NodeSource, NodeSourceAction
 
 __all__ = [
     "convert",
@@ -182,6 +186,18 @@ def add_dequantize_op_kwargs(dequantize_op, input_node):
                 dequantize_op_kwargs = {"out_dtype": dq_out_dtype}
         return dequantize_op_kwargs
 
+    def add_quantize_dequantize_node_info(qdq_node, original_node):
+        # propagate from_node info from observer/fake_quant node to quantize/dequantize node
+        if not TORCH_VERSION_AT_LEAST_2_6:
+            return
+        qdq_node.meta[FROM_NODE_KEY] = [
+            NodeSource(
+                original_node,
+                "replace_observer_with_quantize_dequantize_node",
+                [NodeSourceAction.CREATE],
+            )
+        ]
+
     if dtype in SUPPORTED_QDTYPES and (not is_dynamic):
         # TODO: probably should cleanup this condition check, it's hard
         # to reason about this if and the following elif
@@ -254,6 +270,8 @@ def add_dequantize_op_kwargs(dequantize_op, input_node):
             quantized_node = graph.create_node(
                 node_type, quantize_op, tuple(quantize_op_inputs), {}
             )
+            add_quantize_dequantize_node_info(quantized_node, node)
+
             # use the same qparams from quantize op
             dq_inputs = [quantized_node] + quantize_op_inputs[1:]
             dequantized_node = graph.call_function(
@@ -263,16 +281,8 @@ def add_dequantize_op_kwargs(dequantize_op, input_node):
             )
 
             node.replace_all_uses_with(dequantized_node)
-            # propagate numeric debug handle from observer/fake_quant node to dequantize node
-            if (
-                CUSTOM_KEY in node.meta
-                and NUMERIC_DEBUG_HANDLE_KEY in node.meta[CUSTOM_KEY]
-            ):
-                if CUSTOM_KEY not in dequantized_node.meta:
-                    dequantized_node.meta[CUSTOM_KEY] = {}
-                dequantized_node.meta[CUSTOM_KEY][NUMERIC_DEBUG_HANDLE_KEY] = node.meta[
-                    CUSTOM_KEY
-                ][NUMERIC_DEBUG_HANDLE_KEY]
+
+            add_quantize_dequantize_node_info(dequantized_node, node)
             graph.erase_node(node)
     elif is_dynamic:
         # uint8/int8/fp16 dynamic quantization
@@ -353,6 +363,9 @@ def add_dequantize_op_kwargs(dequantize_op, input_node):
             quantized_node = graph.create_node(
                 node_type, quantize_op, tuple(quantize_op_inputs), {}
             )
+
+            add_quantize_dequantize_node_info(quantized_node, node)
+
             # use the same qparams from quantize op
             dq_inputs = [quantized_node] + quantize_op_inputs[1:]
             # need to use the tensor variant of this op, since scale and zero_point
@@ -366,11 +379,9 @@ def add_dequantize_op_kwargs(dequantize_op, input_node):
             )
 
             node.replace_all_uses_with(dequantized_node)
-            # propagate numeric debug handle from observer/fake_quant node to dequantize node
-            if NUMERIC_DEBUG_HANDLE_KEY in node.meta:
-                dequantized_node.meta[NUMERIC_DEBUG_HANDLE_KEY] = node.meta[
-                    NUMERIC_DEBUG_HANDLE_KEY
-                ]
+
+            add_quantize_dequantize_node_info(dequantized_node, node)
+
             graph.erase_node(node)
     elif dtype == torch.float16:
         # Insert to_fp16 -> to_fp32 node
diff --git a/torchao/quantization/pt2e/prepare.py b/torchao/quantization/pt2e/prepare.py
index 22542c09e2..97801f993c 100644
--- a/torchao/quantization/pt2e/prepare.py
+++ b/torchao/quantization/pt2e/prepare.py
@@ -22,8 +22,7 @@
 from torch.fx.node import Argument
 
 from torchao.quantization.pt2e import (
-    CUSTOM_KEY,
-    NUMERIC_DEBUG_HANDLE_KEY,
+    FROM_NODE_KEY,
     DerivedObserverOrFakeQuantize,
     ObserverOrFakeQuantize,
 )
@@ -43,6 +42,7 @@
     QuantizationSpecBase,
     SharedQuantizationSpec,
 )
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_6
 
 # TODO: make pt2e folder private?
 __all__ = [
@@ -556,14 +556,10 @@ def _maybe_insert_output_observer_for_node(
         if (
             isinstance(node, Node)
             and isinstance(new_output, Node)
-            and CUSTOM_KEY in node.meta
-            and NUMERIC_DEBUG_HANDLE_KEY in node.meta[CUSTOM_KEY]
+            and FROM_NODE_KEY in node.meta
+            and TORCH_VERSION_AT_LEAST_2_6
         ):
-            if CUSTOM_KEY not in new_output.meta:
-                new_output.meta[CUSTOM_KEY] = {}
-            new_output.meta[CUSTOM_KEY][NUMERIC_DEBUG_HANDLE_KEY] = node.meta[
-                CUSTOM_KEY
-            ][NUMERIC_DEBUG_HANDLE_KEY]
+            new_output.meta[FROM_NODE_KEY] = node.meta[FROM_NODE_KEY]
         return new_output
     return None
 
diff --git a/torchao/testing/pt2e/utils.py b/torchao/testing/pt2e/utils.py
index 4342d81dc1..5d903a4a15 100644
--- a/torchao/testing/pt2e/utils.py
+++ b/torchao/testing/pt2e/utils.py
@@ -22,10 +22,8 @@
 )
 from torch.testing._internal.common_utils import TestCase
 
-from torchao.quantization.pt2e import (
-    CUSTOM_KEY,
-    NUMERIC_DEBUG_HANDLE_KEY,
-)
+from torchao.quantization.pt2e import FROM_NODE_KEY
+from torchao.quantization.pt2e._numeric_debugger import _generate_debug_handle_from_node
 from torchao.quantization.pt2e.graph_utils import bfs_trace_with_node_process
 from torchao.quantization.pt2e.quantize_pt2e import (
     convert_pt2e,
@@ -153,10 +151,10 @@ def _assert_each_node_has_debug_handle(self, model) -> None:
         """Assert that each node in the model has a debug handle."""
 
         def _assert_node_has_debug_handle(node):
-            self.assertTrue(
-                CUSTOM_KEY in node.meta
-                and NUMERIC_DEBUG_HANDLE_KEY in node.meta[CUSTOM_KEY],
-                f"Node {node} doesn't have debug handle",
+            self.assertIn(
+                FROM_NODE_KEY,
+                node.meta,
+                f"Node {node} doesn't have from_node info",
             )
 
         bfs_trace_with_node_process(model, _assert_node_has_debug_handle)
@@ -167,29 +165,20 @@ def _extract_debug_handles(self, model) -> Dict[str, int]:
 
         def _extract_debug_handles_from_node(node):
             nonlocal debug_handle_map
-            if (
-                CUSTOM_KEY in node.meta
-                and NUMERIC_DEBUG_HANDLE_KEY in node.meta[CUSTOM_KEY]
-            ):
-                debug_handle_map[str(node)] = node.meta[CUSTOM_KEY][
-                    NUMERIC_DEBUG_HANDLE_KEY
-                ]
+            if (dh := _generate_debug_handle_from_node(node)) is not None:
+                debug_handle_map[str(node)] = dh
 
         bfs_trace_with_node_process(model, _extract_debug_handles_from_node)
         return debug_handle_map
 
-    def _extract_debug_handles_with_prev_decomp_op(self, model) -> Dict[str, int]:
-        """Extract debug handles with previous decomposition operation mapping."""
-        prev_decomp_op_to_debug_handle_map: Dict[str, int] = {}
+    def _extract_debug_handles_with_prev_decomp_op(self, model) -> dict[str, int]:
+        prev_decomp_op_to_debug_handle_map: dict[str, int] = {}
 
         def _extract_debug_handles_with_prev_decomp_op_from_node(node):
             nonlocal prev_decomp_op_to_debug_handle_map
-            if (
-                CUSTOM_KEY in node.meta
-                and NUMERIC_DEBUG_HANDLE_KEY in node.meta[CUSTOM_KEY]
-            ):
+            if FROM_NODE_KEY in node.meta:
                 prev_decomp_op = str(node.meta.get("nn_module_stack"))
-                debug_handle = node.meta[CUSTOM_KEY][NUMERIC_DEBUG_HANDLE_KEY]
+                debug_handle = _generate_debug_handle_from_node(node)
                 if prev_decomp_op not in prev_decomp_op_to_debug_handle_map:
                     prev_decomp_op_to_debug_handle_map[prev_decomp_op] = debug_handle
                 else:

From 4e3d0198f93602d88db9d5ba6bb6020454fc5fde Mon Sep 17 00:00:00 2001
From: Xuan Liao <xuan.liao@intel.com>
Date: Thu, 19 Jun 2025 10:51:28 +0800
Subject: [PATCH 140/165] Enable cpp kernel building (#2402)

enable cpp kernl building
---
 setup.py | 27 ++++++++++++++-------------
 1 file changed, 14 insertions(+), 13 deletions(-)

diff --git a/setup.py b/setup.py
index cb6be7e1c1..5560ab877e 100644
--- a/setup.py
+++ b/setup.py
@@ -385,19 +385,20 @@ def get_extensions():
         extra_compile_args["cxx"].extend(
             ["-O3" if not debug_mode else "-O0", "-fdiagnostics-color=always"]
         )
-
-        # TODO(future PR): make this work without using `TORCH_VERSION_AT_LEAST_2_7`,
-        # because we should not be using anything from `torchao` to build `torchao`.
-        # if use_cpu_kernels and is_linux and TORCH_VERSION_AT_LEAST_2_7:
-        #     if torch._C._cpu._is_avx512_supported():
-        #         extra_compile_args["cxx"].extend(
-        #             [
-        #                 "-DCPU_CAPABILITY_AVX512",
-        #                 "-march=native",
-        #                 "-mfma",
-        #                 "-fopenmp",
-        #             ]
-        #         )
+        if (
+            use_cpu_kernels
+            and is_linux
+            and hasattr(torch._C._cpu, "_is_avx512_supported")
+            and torch._C._cpu._is_avx512_supported()
+        ):
+            extra_compile_args["cxx"].extend(
+                [
+                    "-DCPU_CAPABILITY_AVX512",
+                    "-march=native",
+                    "-mfma",
+                    "-fopenmp",
+                ]
+            )
 
         if debug_mode:
             extra_compile_args["cxx"].append("-g")

From eb8617756682b35f98727ea43e5c6bc3d37e416e Mon Sep 17 00:00:00 2001
From: Mark Saroufim <marksaroufim@meta.com>
Date: Fri, 20 Jun 2025 18:55:30 -0700
Subject: [PATCH 141/165] Remove more Galore bits (#2417)

---
 test/galore/memory_analysis_utils.py          |  78 ----
 test/galore/model_configs.py                  | 181 --------
 test/galore/profiling_utils.py                | 196 ---------
 torchao/prototype/galore/__init__.py          |   1 -
 torchao/prototype/galore/kernels/__init__.py  |  12 -
 torchao/prototype/galore/kernels/adam_step.py | 181 --------
 .../galore/kernels/custom_autotune.py         | 395 ------------------
 torchao/prototype/galore/kernels/quant.py     | 189 ---------
 torchao/prototype/galore/optim/__init__.py    |   0
 9 files changed, 1233 deletions(-)
 delete mode 100644 test/galore/memory_analysis_utils.py
 delete mode 100644 test/galore/model_configs.py
 delete mode 100644 test/galore/profiling_utils.py
 delete mode 100644 torchao/prototype/galore/__init__.py
 delete mode 100644 torchao/prototype/galore/kernels/__init__.py
 delete mode 100644 torchao/prototype/galore/kernels/adam_step.py
 delete mode 100644 torchao/prototype/galore/kernels/custom_autotune.py
 delete mode 100644 torchao/prototype/galore/kernels/quant.py
 delete mode 100644 torchao/prototype/galore/optim/__init__.py

diff --git a/test/galore/memory_analysis_utils.py b/test/galore/memory_analysis_utils.py
deleted file mode 100644
index 41f601e3a2..0000000000
--- a/test/galore/memory_analysis_utils.py
+++ /dev/null
@@ -1,78 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from functools import partial
-
-import pandas as pd
-from IPython.display import HTML
-
-
-def plot_memory_timeline(trace_file):
-    """Plots html output of torch profiler memory trace
-    For use within Jupyter Notebook only!
-    See https://pytorch.org/docs/main/profiler.html#torch.profiler._KinetoProfile.export_memory_timeline
-
-    Args:
-        trace_file: path to html export of torch profiler memory timeline
-    """
-    with open(trace_file) as f:
-        return HTML(f.read())
-
-
-# These are the (unlabeled) columns in the json export of a torch profiler memory timeline trace
-COL_NAMES = [
-    "Parameter",
-    "Optimizer_State",
-    "Input",
-    "Temporary",
-    "Activation",
-    "Gradient",
-    "Autograd_Detail",
-    "Unknown",
-]
-
-
-def create_mem_df(mem_trace, units="GB"):
-    """Create dataframe from json export of torch profiler CUDA memory timeline trace
-    Columns per COL_NAMES, in units of MB
-    These are the (unlabeled) columns in the json export of a torch profiler memory timeline trace but can be
-    inferred (and confirmed) by comparing the plots of the json export with the plots of the html export
-
-    E.g., df.plot(kind="area", stacked=True, ylabel="MB")
-
-    See https://pytorch.org/docs/main/profiler.html#torch.profiler._KinetoProfile.export_memory_timeline
-    Args:
-        mem_trace: path to json export of torch profiler memory timeline
-        units: "MB" or "GB"
-    """
-    df = pd.read_json(mem_trace).T.explode(0)
-
-    def _convert_to_units(df, col):
-        return df[col] / 1024 ** (3 if units == "GB" else 2)
-
-    convert_cols_to_MB = {col: partial(_convert_to_units, col=col) for col in COL_NAMES}
-
-    df = pd.DataFrame(
-        [l[1:] for l in df.iloc[:, 1].to_list()], columns=COL_NAMES
-    ).assign(**convert_cols_to_MB)
-    df["Total"] = df.sum(axis=1)
-    return df
-
-
-def show_memory_stats(df, stats=["mean", "min", "50%", "max"]):
-    """Show summary statistics for torch profiler CUDA memory timeline trace
-    Args:
-        df: dataframe created by create_mem_df
-        stats: list of statistics to show. Valid stats are "mean", "min", "25%", "50%", "75%", "max"
-
-    """
-    mem_sum = (
-        df.describe()
-        .loc[stats]
-        .rename(index={"50%": "median"})
-        .style.format(precision=1, thousands=",")
-    )
-
-    return mem_sum
diff --git a/test/galore/model_configs.py b/test/galore/model_configs.py
deleted file mode 100644
index 1efb4a131e..0000000000
--- a/test/galore/model_configs.py
+++ /dev/null
@@ -1,181 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-# LLAMA100M = {
-#     "architectures": ["LLaMAForCausalLM"],
-#     "attention_bias": False,
-#     "attention_dropout": 0.0,
-#     "bos_token_id": 0,
-#     "eos_token_id": 1,
-#     "hidden_act": "silu",
-#     "hidden_size": 640,
-#     "initializer_range": 0.02,
-#     "intermediate_size": 1708,
-#     "max_position_embeddings": 2048,
-#     "max_sequence_length": 1024,
-#     "model_type": "llama",
-#     "num_attention_heads": 10,
-#     "num_hidden_layers": 12,
-#     "num_key_value_heads": 10,
-#     "pad_token_id": -1,
-#     "pretraining_tp": 1,
-#     "rms_norm_eps": 1e-06,
-#     "rope_scaling": None,
-#     "rope_theta": 10000.0,
-#     "tie_word_embeddings": False,
-#     "transformers_version": "4.39.3",
-#     "use_cache": True,
-#     "vocab_size": 32100,
-# }
-LLAMA1B = {
-    "vocab_size": 32000,
-    "max_position_embeddings": 2048,
-    "hidden_size": 2048,
-    "intermediate_size": 5461,
-    "num_hidden_layers": 24,
-    "num_attention_heads": 32,
-    "num_key_value_heads": 32,
-    "hidden_act": "silu",
-    "initializer_range": 0.02,
-    "rms_norm_eps": 1e-06,
-    "pretraining_tp": 1,
-    "use_cache": True,
-    "rope_theta": 10000.0,
-    "rope_scaling": None,
-    "attention_bias": False,
-    "attention_dropout": 0.0,
-    "return_dict": True,
-    "output_hidden_states": False,
-    "output_attentions": False,
-    "torchscript": False,
-    "torch_dtype": None,
-    "use_bfloat16": False,
-    "tf_legacy_loss": False,
-    "pruned_heads": {},
-    "tie_word_embeddings": False,
-    "chunk_size_feed_forward": 0,
-    "is_encoder_decoder": False,
-    "is_decoder": False,
-    "cross_attention_hidden_size": None,
-    "add_cross_attention": False,
-    "tie_encoder_decoder": False,
-    "max_length": 20,
-    "min_length": 0,
-    "do_sample": False,
-    "early_stopping": False,
-    "num_beams": 1,
-    "num_beam_groups": 1,
-    "diversity_penalty": 0.0,
-    "temperature": 1.0,
-    "top_k": 50,
-    "top_p": 1.0,
-    "typical_p": 1.0,
-    "repetition_penalty": 1.0,
-    "length_penalty": 1.0,
-    "no_repeat_ngram_size": 0,
-    "encoder_no_repeat_ngram_size": 0,
-    "bad_words_ids": None,
-    "num_return_sequences": 1,
-    "output_scores": False,
-    "return_dict_in_generate": False,
-    "forced_bos_token_id": None,
-    "forced_eos_token_id": None,
-    "remove_invalid_values": False,
-    "exponential_decay_length_penalty": None,
-    "suppress_tokens": None,
-    "begin_suppress_tokens": None,
-    "architectures": ["LLaMAForCausalLM"],
-    "finetuning_task": None,
-    "id2label": {0: "LABEL_0", 1: "LABEL_1"},
-    "label2id": {"LABEL_0": 0, "LABEL_1": 1},
-    "tokenizer_class": None,
-    "prefix": None,
-    "bos_token_id": 0,
-    "pad_token_id": -1,
-    "eos_token_id": 1,
-    "sep_token_id": None,
-    "decoder_start_token_id": None,
-    "task_specific_params": None,
-    "problem_type": None,
-    "_name_or_path": "./configs/llama_1b.json",
-    "transformers_version": "4.39.3",
-    "max_sequence_length": 1024,
-    "model_type": "llama",
-}
-LLAMA100M = {
-    "vocab_size": 32100,
-    "max_position_embeddings": 2048,
-    "hidden_size": 640,
-    "intermediate_size": 1708,
-    "num_hidden_layers": 12,
-    "num_attention_heads": 10,
-    "num_key_value_heads": 10,
-    "hidden_act": "silu",
-    "initializer_range": 0.02,
-    "rms_norm_eps": 1e-06,
-    "pretraining_tp": 1,
-    "use_cache": True,
-    "rope_theta": 10000.0,
-    "rope_scaling": None,
-    "attention_bias": False,
-    "attention_dropout": 0.0,
-    "return_dict": True,
-    "output_hidden_states": False,
-    "output_attentions": False,
-    "torchscript": False,
-    "torch_dtype": None,
-    "use_bfloat16": False,
-    "tf_legacy_loss": False,
-    "pruned_heads": {},
-    "tie_word_embeddings": False,
-    "chunk_size_feed_forward": 0,
-    "is_encoder_decoder": False,
-    "is_decoder": False,
-    "cross_attention_hidden_size": None,
-    "add_cross_attention": False,
-    "tie_encoder_decoder": False,
-    "max_length": 20,
-    "min_length": 0,
-    "do_sample": False,
-    "early_stopping": False,
-    "num_beams": 1,
-    "num_beam_groups": 1,
-    "diversity_penalty": 0.0,
-    "temperature": 1.0,
-    "top_k": 50,
-    "top_p": 1.0,
-    "typical_p": 1.0,
-    "repetition_penalty": 1.0,
-    "length_penalty": 1.0,
-    "no_repeat_ngram_size": 0,
-    "encoder_no_repeat_ngram_size": 0,
-    "bad_words_ids": None,
-    "num_return_sequences": 1,
-    "output_scores": False,
-    "return_dict_in_generate": False,
-    "forced_bos_token_id": None,
-    "forced_eos_token_id": None,
-    "remove_invalid_values": False,
-    "exponential_decay_length_penalty": None,
-    "suppress_tokens": None,
-    "begin_suppress_tokens": None,
-    "architectures": ["LLaMAForCausalLM"],
-    "finetuning_task": None,
-    "id2label": {0: "LABEL_0", 1: "LABEL_1"},
-    "label2id": {"LABEL_0": 0, "LABEL_1": 1},
-    "tokenizer_class": None,
-    "prefix": None,
-    "bos_token_id": 0,
-    "pad_token_id": -1,
-    "eos_token_id": 1,
-    "sep_token_id": None,
-    "decoder_start_token_id": None,
-    "task_specific_params": None,
-    "problem_type": None,
-    "_name_or_path": "./configs/llama_100m.json",
-    "transformers_version": "4.39.3",
-    "max_sequence_length": 1024,
-    "model_type": "llama",
-}
diff --git a/test/galore/profiling_utils.py b/test/galore/profiling_utils.py
deleted file mode 100644
index 9f59ae68e2..0000000000
--- a/test/galore/profiling_utils.py
+++ /dev/null
@@ -1,196 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-import gc
-import logging
-import os
-from contextlib import contextmanager
-from datetime import datetime
-from functools import partial
-
-import torch
-
-logging.basicConfig(
-    format="%(levelname)s:%(asctime)s %(message)s",
-    level=logging.INFO,
-    datefmt="%Y-%m-%d %H:%M:%S",
-)
-logger: logging.Logger = logging.getLogger(__name__)
-logger.setLevel(level=logging.INFO)
-
-TIME_FORMAT_STR: str = "%m-%d-%H"
-
-# Keep a max of 100,000 alloc/free events in the recorded history
-# leading up to the snapshot.
-MAX_NUM_OF_MEM_EVENTS_PER_SNAPSHOT: int = 100000
-
-
-def flush_cuda_mem():
-    gc.collect()
-    torch.cuda.empty_cache()
-    torch.cuda.reset_peak_memory_stats()
-    torch.cuda.reset_max_memory_allocated()
-    torch.cuda.reset_max_memory_cached()
-    torch.cuda.reset_accumulated_memory_stats()
-
-
-@contextmanager
-def cuda_max_memory():
-    try:
-        flush_cuda_mem()
-        yield
-
-    finally:
-        mem_miB = torch.cuda.max_memory_allocated() // (1024 * 1024)
-        print(f"{mem_miB} MB of CUDA memory allocated")
-        flush_cuda_mem()
-    return mem_miB
-
-
-def get_cuda_memory_usage(units="MB", show=True):
-    """
-    Get maximum allocated / reserved CUDA memory in given units
-
-    Args:
-        units: MB, GB, or B
-    """
-    units = units.upper()
-    if units == "MB":
-        divisor = 1024**2
-    elif units == "GB":
-        divisor = 1024**3
-    else:
-        units = "B"
-        divisor = 1
-    max_memory_allocated = torch.cuda.max_memory_allocated() / divisor
-    max_memory_reserved = torch.cuda.max_memory_reserved() / divisor
-    if show:
-        print(
-            "Max Memory Allocated:",
-            f"{max_memory_allocated:,.1f} {units}",
-        )
-        print(
-            "Max Memory Reserved:",
-            f"{max_memory_reserved:,.1f} {units}",
-        )
-
-    return max_memory_allocated, max_memory_reserved
-
-
-def export_memory_snapshot(prefix) -> None:
-    # Prefix for file names.
-    timestamp = datetime.now().strftime(TIME_FORMAT_STR)
-    file_prefix = f"{prefix}_{timestamp}"
-
-    try:
-        logger.info(f"Saving snapshot to local file: {file_prefix}.pickle")
-        torch.cuda.memory._dump_snapshot(f"{file_prefix}.pickle")
-    except Exception as e:
-        logger.error(f"Failed to capture memory snapshot {e}")
-        return
-
-
-@contextmanager
-def memory_recorder(file_name="cuda_memory_snapshot", export=False) -> None:
-    assert torch.cuda.is_available(), (
-        "Memory profiler requires GPU, check torch.cuda.is_available()"
-    )
-    try:
-        logger.info("Starting snapshot record_memory_history")
-        torch.cuda.memory._record_memory_history(
-            max_entries=MAX_NUM_OF_MEM_EVENTS_PER_SNAPSHOT
-        )
-        yield
-    finally:
-        logger.info("Stopping snapshot record_memory_history")
-        torch.cuda.memory._record_memory_history(enabled=None)
-        if export:
-            export_memory_snapshot(file_name)
-
-
-def trace_handler(
-    prof: torch.profiler.profile,
-    prefix: str = "profile",
-    output_dir="./",
-    sort_key="cuda_time_total",
-    export_trace=True,
-    export_memory_timeline=True,
-    print_table=True,
-):
-    timestamp = datetime.now().strftime(TIME_FORMAT_STR)
-    file_prefix = os.path.join(output_dir, f"{prefix}_{timestamp}")
-
-    if export_trace:
-        prof.export_chrome_trace(f"{file_prefix}-trace.json.gz")
-
-    if export_memory_timeline:
-        prof.export_memory_timeline(f"{file_prefix}.html", device="cuda:0")
-        prof.export_memory_timeline(
-            f"{file_prefix}-memory-timeline.json", device="cuda:0"
-        )
-    if print_table:
-        print(prof.key_averages().table(sort_by=sort_key, row_limit=10))
-
-
-def get_torch_profiler(
-    name: str = "profile",
-    output_dir: str = "./profiler_out",
-    activities=[
-        torch.profiler.ProfilerActivity.CPU,
-        torch.profiler.ProfilerActivity.CUDA,
-    ],
-    record_shapes=True,
-    profile_memory=True,
-    with_stack=True,
-    wait_steps=1,
-    warmup_steps=1,
-    active_steps=10,
-    repeat=1,
-    # options for profiler outputs
-    on_trace_ready=trace_handler,
-    export_trace=True,
-    export_memory_timeline=True,
-    print_table=True,
-):
-    """
-    Args:
-        name: name of the profiler, used for output files
-        table_key: key to sort profiler table by: one of `cpu_time`, `cuda_time`, `cpu_time_total`,
-                `cuda_time_total`, `cpu_memory_usage`, `cuda_memory_usage`,
-                `self_cpu_memory_usage`, `self_cuda_memory_usage`, `count`.
-
-    """
-    if not os.path.exists(output_dir):
-        os.makedirs(output_dir)
-    return torch.profiler.profile(
-        activities=activities,
-        schedule=torch.profiler.schedule(
-            wait=wait_steps, warmup=warmup_steps, active=active_steps, repeat=repeat
-        ),
-        record_shapes=record_shapes,
-        profile_memory=profile_memory,
-        with_stack=with_stack,
-        on_trace_ready=partial(
-            on_trace_ready,
-            prefix=name,
-            output_dir=output_dir,
-            export_trace=export_trace,
-            export_memory_timeline=export_memory_timeline,
-            print_table=print_table,
-        ),
-    )
-
-
-@contextmanager
-def nsys_profiler():
-    try:
-        torch.cuda.cudart().cudaProfilerStart()
-        free, total = torch.cuda.mem_get_info()
-        print(f"Start, Memory Usage: Free {free:.2e}, Used {(total - free):.2e}")
-        yield "nsys"
-    finally:
-        free, total = torch.cuda.mem_get_info()
-        print(f"End, Memory Usage: Free {free:.2e}, Used {(total - free):.2e}")
-        torch.cuda.cudart().cudaProfilerStop()
diff --git a/torchao/prototype/galore/__init__.py b/torchao/prototype/galore/__init__.py
deleted file mode 100644
index a769e11a16..0000000000
--- a/torchao/prototype/galore/__init__.py
+++ /dev/null
@@ -1 +0,0 @@
-from .kernels import *  # noqa: F403
diff --git a/torchao/prototype/galore/kernels/__init__.py b/torchao/prototype/galore/kernels/__init__.py
deleted file mode 100644
index 71129d34a2..0000000000
--- a/torchao/prototype/galore/kernels/__init__.py
+++ /dev/null
@@ -1,12 +0,0 @@
-from .adam_downproj_fused import fused_adam_mm_launcher
-from .adam_step import triton_adam_launcher
-from .matmul import triton_mm_launcher
-from .quant import triton_dequant_blockwise, triton_quantize_blockwise
-
-__all__ = [
-    "fused_adam_mm_launcher",
-    "triton_adam_launcher",
-    "triton_mm_launcher",
-    "triton_dequant_blockwise",
-    "triton_quantize_blockwise",
-]
diff --git a/torchao/prototype/galore/kernels/adam_step.py b/torchao/prototype/galore/kernels/adam_step.py
deleted file mode 100644
index fcb554bd1d..0000000000
--- a/torchao/prototype/galore/kernels/adam_step.py
+++ /dev/null
@@ -1,181 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-import torch
-import triton
-import triton.language as tl
-from triton.language.math import sqrt
-from triton.runtime.autotuner import heuristics
-
-from .custom_autotune import Config, autotune
-
-BETA1, BETA2 = 0.9, 0.999
-EPS = 1e-8
-
-AUTOTUNER_TOP_K = 10
-
-
-def get_configs_for_adam(num_warps=[2, 4, 8], block_sizes=[512, 1024, 2048]):
-    configs = []
-    for w in num_warps:
-        for bs in block_sizes:
-            configs.append(Config({"BLOCK_SIZE": bs}, num_warps=w))
-    return configs
-
-
-def early_adam_prune(configs, named_args):
-    numels = named_args["numels"]
-    pruned_configs = [cfg for cfg in configs if numels % cfg.kwargs["BLOCK_SIZE"] == 0]
-    # print("Pruned configs:\n")
-    for cfg in pruned_configs:
-        print(f"{cfg}\n")
-    return pruned_configs
-
-
-def get_adam_tuner(
-    configs=get_configs_for_adam(),
-    early_config_prune=None,  # early_adam_prune,
-    top_k=AUTOTUNER_TOP_K,
-):
-    return autotune(
-        configs=configs,
-        prune_configs_by={
-            "early_config_prune": early_config_prune,
-            "top_k": top_k,
-        },
-        key=["numels"],
-    )
-
-
-def get_adam_heuristics():
-    return {
-        "USE_MASK": lambda args: args["numels"] % args["BLOCK_SIZE"] != 0,
-    }
-
-
-@autotune(configs=get_configs_for_adam(), key=["numels"])
-@heuristics(get_adam_heuristics())
-@triton.jit
-def _adam_update(
-    avg_ptr,
-    avg2_ptr,
-    grad_ptr,
-    # avg_out_ptr,
-    # avg2_out_ptr,
-    # grad_out_ptr,
-    numels,
-    store,
-    BLOCK_SIZE: tl.constexpr,
-    USE_MASK: tl.constexpr,
-    BETA1: tl.constexpr = BETA1,
-    BETA2: tl.constexpr = BETA2,
-    EPS: tl.constexpr = EPS,
-):
-    pid_m = tl.program_id(0)
-    offset = pid_m * BLOCK_SIZE
-    offset = offset + tl.arange(0, BLOCK_SIZE)
-    # load_idx = offset + tl.arange(0, BLOCK_SIZE)
-    load_idx = tl.max_contiguous(tl.multiple_of(offset, BLOCK_SIZE), BLOCK_SIZE)
-
-    mask = None
-    if USE_MASK:
-        mask = load_idx < numels
-    avg = tl.load(avg_ptr + load_idx, mask=mask)
-    avg2 = tl.load(avg2_ptr + load_idx, mask=mask)
-    grad = tl.load(grad_ptr + load_idx, mask=mask)
-
-    avg = BETA1 * avg + (1.0 - BETA1) * grad
-    avg2 = BETA2 * avg2 + (1.0 - BETA2) * (grad * grad)
-
-    denom = sqrt(avg2) + EPS
-    # denom = tl.sqrt(avg2) + EPS
-
-    norm_grad = avg / denom
-
-    if store:
-        tl.store(avg_ptr + load_idx, avg, mask=mask)
-        tl.store(avg2_ptr + load_idx, avg2, mask=mask)
-        tl.store(grad_ptr + load_idx, norm_grad, mask=mask)
-    # tl.store(avg_out_ptr + load_idx, avg, mask=mask)
-    # tl.store(avg2_out_ptr + load_idx, avg2, mask=mask)
-    # tl.store(grad_out_ptr + load_idx, norm_grad, mask=mask)
-
-
-adam_update = _adam_update
-
-
-def triton_adam_launcher(
-    avg,
-    avg2,
-    grad,
-    store=True,
-    beta1=BETA1,
-    beta2=BETA2,
-    eps=EPS,
-):
-    M, N = avg.shape
-    # avg_out = torch.empty_like(avg)
-    # avg2_out = torch.empty_like(avg2)
-    # grad_out = torch.empty_like(grad)
-
-    grid = lambda META: (triton.cdiv(M * N, META["BLOCK_SIZE"]),)
-    adam_update[grid](
-        avg,
-        avg2,
-        grad,
-        # avg_out,
-        # avg2_out,
-        # grad_out,
-        avg.numel(),
-        store=store,
-        BETA1=beta1,
-        BETA2=beta2,
-        EPS=eps,
-        # BLOCK_SIZE=1024,
-        # USE_MASK=USE_MASK,
-    )
-    return avg, avg2, grad
-
-
-def ref_adam_step(exp_avg, exp_avg2, grad, beta1=BETA1, beta2=BETA2, eps=EPS):
-    exp_avg = beta1 * exp_avg + (1 - beta1) * grad
-    exp_avg2 = beta2 * exp_avg2 + (1 - beta2) * torch.square(grad)
-    denom = exp_avg2.sqrt() + eps
-    norm_grad = exp_avg / denom
-    return exp_avg, exp_avg2, norm_grad
-
-
-def make_data(M, N, rank, dtype):
-    # full_grad = torch.randn(M, N, device="cuda", dtype=dtype)
-    params = torch.randn(M, N, device="cuda", dtype=dtype)
-
-    if M >= N:
-        exp_avg = torch.randn(M, rank, device="cuda", dtype=dtype)
-    else:
-        exp_avg = torch.randn(rank, N, device="cuda", dtype=dtype)
-    exp_avg2 = exp_avg**2
-    down_grad = torch.randn_like(exp_avg)
-
-    return exp_avg, exp_avg2, down_grad, params
-
-
-if __name__ == "__main__":
-    M = N = 4096
-    rank = 128
-    dtype = torch.float32
-    exp_avg, exp_avg2, grad, params = make_data(M, N, rank, dtype=dtype)
-    exp_avg_copy, exp_avg2_copy, grad_copy = (
-        exp_avg.clone(),
-        exp_avg2.clone(),
-        grad.clone(),
-    )
-    ref_out = ref_adam_step(exp_avg, exp_avg2, grad)
-
-    # Autotune run -- changes exp_avg, exp_avg2, grad in-place
-    _ = triton_adam_launcher(exp_avg, exp_avg2, grad)
-    triton_out = triton_adam_launcher(exp_avg_copy, exp_avg2_copy, grad_copy)
-
-    for ref, tt in zip(ref_out, triton_out):
-        print(torch.max(torch.abs(ref - tt)))
diff --git a/torchao/prototype/galore/kernels/custom_autotune.py b/torchao/prototype/galore/kernels/custom_autotune.py
deleted file mode 100644
index 8ecfabf849..0000000000
--- a/torchao/prototype/galore/kernels/custom_autotune.py
+++ /dev/null
@@ -1,395 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-from __future__ import annotations
-
-import builtins
-import logging
-import os
-import time
-from typing import Dict
-
-import numpy as np
-from triton.runtime.cache import default_cache_dir
-from triton.runtime.errors import OutOfResources
-from triton.runtime.jit import KernelInterface
-from triton.testing import do_bench
-
-logger = logging.getLogger(__file__)
-
-
-class Autotuner(KernelInterface):
-    def __init__(
-        self,
-        fn,
-        arg_names,
-        configs,
-        key,
-        reset_to_zero,
-        restore_value,
-        prune_configs_by: Dict = None,
-        warmup=25,
-        rep=100,
-    ):
-        """
-        :param prune_configs_by: a dict of functions that are used to prune configs, fields:
-            'perf_model': performance model used to predicate running time with different configs, returns running time
-            'top_k': number of configs to bench
-            'prune_num_stages_by'(optional): a function used to prune num_stages. It takes configs:List[Config] as its input, and returns pruned configs.
-        """
-        if not configs:
-            self.configs = [Config({}, num_warps=4, num_stages=2, num_ctas=1)]
-        else:
-            self.configs = configs
-        self.key_idx = [arg_names.index(k) for k in key]
-        self.cache = {}
-        self.arg_names = arg_names
-
-        # Reset to zero or restore values
-        self.reset_idx = []
-        if reset_to_zero is not None:
-            self.reset_idx = [arg_names.index(k) for k in reset_to_zero]
-        self.restore_idx = []
-        if restore_value is not None:
-            self.restore_idx = [arg_names.index(k) for k in restore_value]
-
-        # Hook to reset or restore for required tensors
-        self.pre_hook = lambda args, reset_only=False: 0
-        self.post_hook = lambda args: 0
-        if len(self.reset_idx) > 0 or len(self.restore_idx) > 0:
-
-            def _pre_hook(args, reset_only=False):
-                for i in self.reset_idx:
-                    args[i].zero_()
-                if not reset_only:
-                    self.restore_copies = [args[i].clone() for i in self.restore_idx]
-
-            self.pre_hook = _pre_hook
-        if len(self.restore_idx) > 0:
-
-            def _post_hook(args):
-                for i, j in enumerate(self.restore_idx):
-                    args[j].copy_(self.restore_copies[i])
-                self.restore_copies = []
-
-            self.post_hook = _post_hook
-
-        self.perf_model = None
-        self.configs_top_k = 1.0
-        self.early_config_prune = None
-        if prune_configs_by:
-            self.perf_model = prune_configs_by.get("perf_model", self.perf_model)
-            self.configs_top_k = prune_configs_by.get("top_k", self.configs_top_k)
-            self.early_config_prune = prune_configs_by.get(
-                "early_config_prune", self.early_config_prune
-            )
-
-        self.fn = fn
-        self.num_warmups = warmup
-        self.num_reps = rep
-        # self.autotune_log_path = os.path.join(default_cache_dir(), autotune_log_file)
-        self.kernel_name = self._find_kernel_name()
-
-    def _find_kernel_name(self):
-        try:
-            kernel_name = self.fn.__name__
-        except AttributeError:
-            try:  # in case JITfn is wrapped in both autotune and heuristic
-                kernel_name = self.fn.fn.__name__
-            except:  # noqa
-                kernel_name = self.fn.__name__
-        return kernel_name
-
-    def _get_key_combination(self, args, as_str=True, sep=" "):
-        key_vals = [f"{self.arg_names[i]}={args[i]}" for i in self.key_idx]
-        return f"{sep}".join(key_vals) if as_str else key_vals
-
-    def _bench(self, *args, config, **meta):
-        # check for conflicts, i.e. meta-parameters both provided
-        # as kwargs and by the autotuner
-        conflicts = meta.keys() & config.kwargs.keys()
-        if conflicts:
-            raise ValueError(
-                f"Conflicting meta-parameters: {', '.join(conflicts)}."
-                " Make sure that you don't re-define auto-tuned symbols."
-            )
-        # augment meta-parameters with tunable ones
-        current = dict(meta, **config.kwargs)
-        full_nargs = {**self.nargs, **current}
-
-        def kernel_call():
-            if config.pre_hook:
-                config.pre_hook(full_nargs)
-            self.pre_hook(args)
-            self.fn.run(
-                *args,
-                num_warps=config.num_warps,
-                num_stages=config.num_stages,
-                num_ctas=config.num_ctas,
-                **current,
-            )
-            self.post_hook(args)
-
-        try:
-            return do_bench(
-                kernel_call,
-                warmup=self.num_warmups,
-                rep=self.num_reps,
-                quantiles=(0.5, 0.2, 0.8),
-            )
-        except OutOfResources:
-            return [float("inf"), float("inf"), float("inf")]
-
-    def run(self, *args, **kwargs):
-        self.nargs = dict(zip(self.arg_names, args))
-        if len(self.configs) > 1:
-            all_args = {**self.nargs, **kwargs}
-            _args = []
-            for name in self.arg_names:
-                if name in all_args:
-                    _args.append(all_args[name])
-            key = [_args[i] for i in self.key_idx]
-            for arg in _args:
-                if hasattr(arg, "dtype"):
-                    key.append(str(arg.dtype))
-            key = tuple(key)
-            if key not in self.cache:
-                logger.debug("Cache miss!\n")
-                logger.info(
-                    f"\n==== Autotune ====\nRunning autotune for {self.kernel_name} for {len(self.configs)} total configs"
-                    f" for key combination {self._get_key_combination(args)}..."
-                )
-                # prune configs
-                pruned_configs = self.prune_configs(kwargs)
-                logger.info(f"\nNum configs after pruning {len(pruned_configs)}")
-                bench_start = time.time()
-                timings = {}
-                for config in pruned_configs:
-                    timings[config] = self._bench(*args, config=config, **kwargs)
-                # timings = {
-                #     config: self._bench(*args, config=config, **kwargs)
-                #     for config in pruned_configs
-                # }
-                bench_end = time.time()
-                self.bench_time = bench_end - bench_start
-                self.cache[key] = builtins.min(timings, key=timings.get)
-                self.pre_hook(args, reset_only=True)
-                self.configs_timings = timings
-
-                sorted_timings = dict(
-                    sorted(timings.items(), key=lambda x: np.mean(x[1]))
-                )
-                _key_suffix = self._get_key_combination(args, sep="-")
-                autotune_file = f"autotune_{self.kernel_name}_{_key_suffix}.log"
-                autotune_log_path = os.path.join(default_cache_dir(), autotune_file)
-
-                logger.info(f"\nFinished autotune, writing log to {autotune_log_path}")
-
-                with open(f"{autotune_log_path}", "w") as f:
-                    f.write(
-                        f" ==== Autotune Results ====\nKernel name: {self.kernel_name}\nArgs: {self.arg_names}\nKeys: {self._get_key_combination(args)}\n"
-                    )
-                    f.write("\nPruned configs:\n")
-                    for cfg in pruned_configs:
-                        f.write(f"{cfg}\n")
-                    f.write("Timings:\n")
-                    for cfg, timing in sorted_timings.items():
-                        f.write(f"{cfg} {timing} \n")
-                    f.write(f"Best config: {self.cache[key]}\n")
-            config = self.cache[key]
-            logger.debug("\nAutotune: Cache hit! Running best config...")
-        else:
-            config = self.configs[0]
-        self.best_config = config
-        logger.info(f"\nAutotune Best Config: {config}\n")
-
-        full_nargs = {**self.nargs, **kwargs, **self.best_config.kwargs}
-        if config.pre_hook is not None:
-            config.pre_hook(full_nargs)
-        ret = self.fn.run(
-            *args,
-            num_warps=config.num_warps,
-            num_stages=config.num_stages,
-            num_ctas=config.num_ctas,
-            **kwargs,
-            **config.kwargs,
-        )
-        self.nargs = None
-        return ret
-
-    def prune_configs(self, kwargs):
-        pruned_configs = self.configs
-        if self.early_config_prune:
-            pruned_configs = self.early_config_prune(self.configs, self.nargs)
-        if self.perf_model:
-            top_k = self.configs_top_k
-            if isinstance(top_k, float) and top_k <= 1.0:
-                top_k = int(len(self.configs) * top_k)
-            if len(pruned_configs) > top_k:
-                est_timing = {
-                    config: self.perf_model(
-                        **self.nargs,
-                        **kwargs,
-                        **config.kwargs,
-                        num_stages=config.num_stages,
-                        num_warps=config.num_warps,
-                        num_ctas=config.num_ctas,
-                    )
-                    for config in pruned_configs
-                }
-                pruned_configs = sorted(est_timing.keys(), key=lambda x: est_timing[x])[
-                    :top_k
-                ]
-        return pruned_configs
-
-    def warmup(self, *args, **kwargs):
-        self.nargs = dict(zip(self.arg_names, args))
-        ret = []
-        for config in self.prune_configs(kwargs):
-            ret.append(
-                self.fn.warmup(
-                    *args,
-                    num_warps=config.num_warps,
-                    num_ctas=config.num_ctas,
-                    num_stages=config.num_stages,
-                    **kwargs,
-                    **config.kwargs,
-                )
-            )
-        self.nargs = None
-        return ret
-
-
-class Config:
-    """
-    An object that represents a possible kernel configuration for the auto-tuner to try.
-
-    :ivar meta: a dictionary of meta-parameters to pass to the kernel as keyword arguments.
-    :type meta: dict[Str, Any]
-    :ivar num_warps: the number of warps to use for the kernel when compiled for GPUs. For example, if
-                      `num_warps=8`, then each kernel instance will be automatically parallelized to
-                      cooperatively execute using `8 * 32 = 256` threads.
-    :type num_warps: int
-    :ivar num_stages: the number of stages that the compiler should use when software-pipelining loops.
-                       Mostly useful for matrix multiplication workloads on SM80+ GPUs.
-    :type num_ctas: int
-    :ivar num_ctas: number of blocks in a block cluster. SM90+ only.
-    :ivar pre_hook: a function that will be called before the kernel is called. Parameters of this
-                    function are args.
-    """
-
-    def __init__(self, kwargs, num_warps=4, num_stages=2, num_ctas=1, pre_hook=None):
-        self.kwargs = kwargs
-        self.num_warps = num_warps
-        self.num_ctas = num_ctas
-        self.num_stages = num_stages
-        self.pre_hook = pre_hook
-
-    def __str__(self):
-        res = []
-        for k, v in self.kwargs.items():
-            res.append(f"{k}: {v}")
-        res.append(f"num_warps: {self.num_warps}")
-        res.append(f"num_ctas: {self.num_ctas}")
-        res.append(f"num_stages: {self.num_stages}")
-        return ", ".join(res)
-
-
-def autotune(
-    configs,
-    key,
-    prune_configs_by=None,
-    reset_to_zero=None,
-    restore_value=None,
-    warmup=25,
-    rep=100,
-):
-    """
-    Decorator for auto-tuning a :code:`triton.jit`'d function.
-
-    .. highlight:: python
-    .. code-block:: python
-
-        @triton.autotune(configs=[
-            triton.Config(meta={'BLOCK_SIZE': 128}, num_warps=4),
-            triton.Config(meta={'BLOCK_SIZE': 1024}, num_warps=8),
-          ],
-          key=['x_size'] # the two above configs will be evaluated anytime
-                         # the value of x_size changes
-        )
-        @triton.jit
-        def kernel(x_ptr, x_size, **META):
-            BLOCK_SIZE = META['BLOCK_SIZE']
-    :note: When all the configurations are evaluated, the kernel will run multiple times.
-           This means that whatever value the kernel updates will be updated multiple times.
-           To avoid this undesired behavior, you can use the `reset_to_zero` argument, which
-           resets the value of the provided tensor to `zero` before running any configuration.
-    :param configs: a list of :code:`triton.Config` objects
-    :type configs: list[triton.Config]
-    :param key: a list of argument names whose change in value will trigger the evaluation of all provided configs.
-    :type key: list[str]
-    :param prune_configs_by: a dict of functions that are used to prune configs, fields:
-        'perf_model': performance model used to predicate running time with different configs, returns running time
-        'top_k': number of configs to bench
-        'early_config_prune'(optional): a function used to do early prune (eg, num_stages). It takes configs:List[Config] as its input, and returns pruned configs.
-    :param reset_to_zero: a list of argument names whose value will be reset to zero before evaluating any configs.
-    :type reset_to_zero: list[str]
-    :param restore_value: a list of argument names whose value will be restored after evaluating any configs.
-    :type restore_value: list[str]
-    :param warmup: Warmup time (in ms) to pass to benchmarking, defaults to 25.
-    :type warmup: int
-    :param rep: Repetition time (in ms) to pass to benchmarking, defaults to 100.
-    :type rep: int
-    """
-
-    def decorator(fn):
-        return Autotuner(
-            fn,
-            fn.arg_names,
-            configs,
-            key,
-            reset_to_zero,
-            restore_value,
-            prune_configs_by,
-            warmup,
-            rep,
-        )
-
-    return decorator
-
-
-class Heuristics(KernelInterface):
-    def __init__(self, fn, arg_names, values) -> None:
-        self.fn = fn
-        self.values = values
-        self.arg_names = arg_names
-
-    def run(self, *args, **kwargs):
-        for v, heur in self.values.items():
-            kwargs[v] = heur({**dict(zip(self.arg_names, args)), **kwargs})
-        return self.fn.run(*args, **kwargs)
-
-
-def heuristics(values):
-    """
-    Decorator for specifying how the values of certain meta-parameters may be computed.
-    This is useful for cases where auto-tuning is prohibitevely expensive, or just not applicable.
-
-    .. highlight:: python
-    .. code-block:: python
-
-        @triton.heuristics(values={'BLOCK_SIZE': lambda args: 2 ** int(math.ceil(math.log2(args[1])))})
-        @triton.jit
-        def kernel(x_ptr, x_size, **META):
-            BLOCK_SIZE = META['BLOCK_SIZE'] # smallest power-of-two >= x_size
-    :param values: a dictionary of meta-parameter names and functions that compute the value of the meta-parameter.
-                   each such function takes a list of positional arguments as input.
-    :type values: dict[str, Callable[[list[Any]], Any]]
-    """
-
-    def decorator(fn):
-        return Heuristics(fn, fn.arg_names, values)
-
-    return decorator
diff --git a/torchao/prototype/galore/kernels/quant.py b/torchao/prototype/galore/kernels/quant.py
deleted file mode 100644
index 7c8a58e864..0000000000
--- a/torchao/prototype/galore/kernels/quant.py
+++ /dev/null
@@ -1,189 +0,0 @@
-# Copyright (c) Meta Platforms, Inc. and affiliates.
-# All rights reserved.
-#
-# This source code is licensed under the BSD 3-Clause license found in the
-# LICENSE file in the root directory of this source tree.
-import torch
-import triton
-import triton.language as tl
-
-
-@triton.jit
-def _dequant_kernel(
-    q_idx_ptr,
-    absmax_ptr,
-    qmap_ptr,
-    dq_ptr,
-    stride_qm,
-    stride_qn,
-    M,
-    N,
-    GROUP_SIZE: tl.constexpr,
-    BLOCK_M: tl.constexpr,
-    BLOCK_N: tl.constexpr,
-):
-    pid_m = tl.program_id(0)
-    pid_n = tl.program_id(1)
-    rm = pid_m * BLOCK_M + tl.arange(0, BLOCK_M)
-    rn = pid_n * BLOCK_N + tl.arange(0, BLOCK_N)
-    # rm = tl.max_contiguous(tl.multiple_of(rm % M, BLOCK_M), BLOCK_M)
-    # rn = tl.max_contiguous(tl.multiple_of(rn % N, BLOCK_N), BLOCK_N)
-    offsets = rm[:, None] * stride_qm + rn[None, :] * stride_qn
-    mask = (rm[:, None] < M) & (rn[None, :] < N)
-    tl.static_print(offsets)
-    group_offsets = offsets // GROUP_SIZE
-    tl.static_print("group_offsets", group_offsets)
-    q_idx = tl.load(q_idx_ptr + offsets, mask=mask)
-    tl.static_print(q_idx)
-    # NOTE: Must upcast q_idx to int32 (q_idx is tl.uint8, which does not work for pointer indexing)
-    q_vals = tl.load(qmap_ptr + q_idx.to(tl.int32))
-    absmax = tl.load(
-        absmax_ptr + group_offsets, mask=group_offsets < (M * N // GROUP_SIZE)
-    )
-
-    dq = q_vals * absmax
-    tl.store(dq_ptr + offsets, dq, mask=mask)
-
-
-def triton_dequant_blockwise(
-    q: torch.Tensor, qmap: torch.Tensor, absmax: torch.Tensor, group_size: int
-):
-    M, N = q.shape
-    dq = torch.empty_like(q).to(absmax.dtype)
-    grid = lambda META: (
-        triton.cdiv(M, META["BLOCK_M"]),
-        triton.cdiv(N, META["BLOCK_N"]),
-    )
-    _dequant_kernel[grid](
-        q,
-        absmax,
-        qmap,
-        dq,
-        q.stride(0),
-        q.stride(1),
-        M,
-        N,
-        BLOCK_M=1,
-        BLOCK_N=group_size,
-        GROUP_SIZE=group_size,
-    )
-    return dq
-
-
-@triton.heuristics(
-    values={
-        "USE_MASK": lambda args: args["numels"] % args["BLOCK_SIZE"] != 0,
-        "NUM_GROUPS": lambda args: triton.cdiv(args["numels"], args["BLOCK_SIZE"]),
-    }
-)
-@triton.jit
-def _quantize_blockwise_kernel(
-    t_ptr,
-    cutoffs_ptr,
-    q_ptr,
-    absmax_ptr,
-    norm_ptr,
-    numels,
-    BLOCK_SIZE: tl.constexpr,
-    NUM_BUCKETS: tl.constexpr,
-    USE_MASK: tl.constexpr,
-    NUM_GROUPS: tl.constexpr,
-    RETURN_NORM: tl.constexpr = False,
-):
-    pid = tl.program_id(0)
-    offsets = pid * BLOCK_SIZE + tl.arange(0, BLOCK_SIZE)
-    mask = None
-    absmax_mask = None
-    if USE_MASK:
-        mask = offsets < numels
-        absmax_mask = pid < NUM_GROUPS
-    t = tl.load(t_ptr + offsets, mask=mask)
-
-    absmax = tl.max(tl.abs(t), axis=0)
-    normalized = t / absmax
-
-    # Load code buckets
-    cutoffs = tl.load(cutoffs_ptr + tl.arange(0, NUM_BUCKETS))
-    q = tl.reshape(normalized, (BLOCK_SIZE, 1)) > cutoffs
-
-    # NOTE: explicit cast is needed, addition on tl.int1 (bool) does not work as per torch / numpy
-    q = q.to(tl.uint8)
-    q = tl.sum(q, axis=1)
-
-    tl.store(q_ptr + offsets, q, mask=mask)
-    # Each block processes one group_size number of elements, hence 1 absmax
-    tl.store(absmax_ptr + pid, absmax, mask=absmax_mask)
-
-    if RETURN_NORM:
-        tl.store(norm_ptr + offsets, normalized, mask=mask)
-
-
-# NOTE: Each block processes one group_size number of elements, hence BLOCK_SIZE = group_size
-# where group_size corresponds to the groupwise quantization blocksize
-def triton_quantize_blockwise(
-    t: torch.Tensor, code, group_size=2048, return_normalized=False
-):
-    """
-    Params:
-        t: torch.Tensor, tensor to quantize
-        code: torch.Tensor, quantization codebook for bitsandbytes, output of `bitsandbytes.functional.create_dynamic_map`
-        # absmax: torch.Tensor, absolute max values for each block, if None, will be calculated from the input tensor
-        group_size: int, groupwise quantization blocksize, default 2048, the hardcoded blocksize for bitsandbytes 8-bit optimizers
-        return_normalized: bool, if True, will return the normalized tensor, primarily for debugging
-    """
-    numel = t.numel()
-    q = torch.empty(numel, dtype=torch.uint8, device=t.device)
-    normalized = torch.empty_like(t) if return_normalized else None
-    num_groups = numel // group_size
-    abs_max = torch.empty(num_groups, dtype=t.dtype, device="cuda")
-    # Cutoffs for quantization
-    # code corresponds to actual (normalized) quant codes
-    # Cutoffs are used to calculate which of these codes a value belongs to
-    # E.g., for consecutive codes C1 and C2, the corresponding cutoff is C1 + C2 / 2
-    # Hence, if a value is greater is assigned C1 if it is less than all cutoffs up to this cutoff
-    cutoffs = (code[:-1] + code[1:]) / 2
-
-    # Need to make cutoffs multiple of 2 for triton reduce
-    MAX_CUTOFF = torch.tensor(
-        torch.finfo(cutoffs.dtype).max, dtype=cutoffs.dtype, device=cutoffs.device
-    ).reshape(
-        1,
-    )
-    cutoffs = torch.cat([cutoffs, MAX_CUTOFF], dim=-1)
-    assert cutoffs.numel() % 2 == 0
-
-    grid = lambda META: (triton.cdiv(t.numel(), META["BLOCK_SIZE"]),)
-    # assert t.numel() % group_size == 0
-    _quantize_blockwise_kernel[grid](
-        t.view(-1),
-        cutoffs,
-        q,
-        abs_max,
-        normalized.view(-1) if return_normalized else None,
-        numel,
-        NUM_BUCKETS=len(cutoffs),
-        BLOCK_SIZE=group_size,
-        RETURN_NORM=return_normalized,
-    )
-    return (
-        q.reshape(t.shape),
-        normalized.reshape(t.shape) if return_normalized else None,
-        abs_max,
-    )
-
-
-# Reference implementation
-def _torch_quantize_blockwise(tensor: torch.Tensor, code, absmax=None, blocksize=2048):
-    # Flatten values first
-
-    # If not absmax, need to first normalize -> reshape to (-1, blocksize) -> max over the last dim
-
-    # Quantize by flattening A to [numels, 1] > code[:, None], sum, then reshape back to original shape
-    if absmax is None:
-        absmax = tensor.reshape(-1, blocksize).abs().max(dim=-1).values
-
-    normalized = tensor.reshape(-1, blocksize) / absmax[:, None]
-    buckets = (code[:-1] + code[1:]) / 2
-    q = normalized.reshape(normalized.numel(), 1) > buckets
-    q = q.sum(dim=1).reshape(tensor.shape)
-    return q.to(torch.uint8), normalized.reshape(tensor.shape), absmax
diff --git a/torchao/prototype/galore/optim/__init__.py b/torchao/prototype/galore/optim/__init__.py
deleted file mode 100644
index e69de29bb2..0000000000

From e73a142fa6d0561f40daa5a3c1a727bae3bd2202 Mon Sep 17 00:00:00 2001
From: Thien Tran <gau.nernst@yahoo.com.sg>
Date: Sat, 21 Jun 2025 23:44:47 +0700
Subject: [PATCH 142/165] Build mxfp4 kernel for sm120a (#2285)

---
 benchmarks/float8/bench_matmul.py             |  60 ++++--
 benchmarks/float8/utils.py                    |   9 +-
 setup.py                                      |  81 +++++---
 test/prototype/mx_formats/test_mx_mm.py       |   5 +-
 torchao/__init__.py                           |  13 ++
 ...els.cu => mx_fp_cutlass_kernels_sm100a.cu} |   0
 .../mx_fp_cutlass_kernels_sm120a.cu           | 195 ++++++++++++++++++
 torchao/testing/float8/roofline_utils.py      |   7 +
 8 files changed, 320 insertions(+), 50 deletions(-)
 rename torchao/csrc/cuda/mx_kernels/{mx_fp_cutlass_kernels.cu => mx_fp_cutlass_kernels_sm100a.cu} (100%)
 create mode 100644 torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels_sm120a.cu

diff --git a/benchmarks/float8/bench_matmul.py b/benchmarks/float8/bench_matmul.py
index e3f19d8f49..d11c233ec0 100644
--- a/benchmarks/float8/bench_matmul.py
+++ b/benchmarks/float8/bench_matmul.py
@@ -16,6 +16,8 @@
     get_name_to_shapes_iter,
 )
 
+from torchao.ops import mx_fp4_bf16
+from torchao.prototype.mx_formats.mx_tensor import to_mx
 from torchao.testing.float8.roofline_utils import get_specs
 
 
@@ -62,13 +64,19 @@ def run(
 ):
     device = "cuda"
     # TODO(future PR): this is ugly
-    assert recipe in ("tensorwise", "rowwise", "mxfp8_cublas"), "unsupported"
+    assert recipe in ("tensorwise", "rowwise", "mxfp8_cublas", "mxfp4_cutlass"), (
+        "unsupported"
+    )
+    use_fp4 = recipe == "mxfp4_cutlass"
 
     specs = get_specs()
     bf16_peak_tops = specs["bf16_peak_tops"]
     fp8_peak_tops = specs["fp8_peak_tops"]
+    fp4_peak_tops = specs["fp4_peak_tops"]
     print(f"gpu_name: {torch.cuda.get_device_name(0)}")
-    print(f"peak tops: bf16 {bf16_peak_tops:.2e}, fp8 {fp8_peak_tops:.2e}")
+    print(
+        f"peak tops: bf16 {bf16_peak_tops:.2e}, fp8 {fp8_peak_tops:.2e}, fp4 {fp4_peak_tops:.2e}"
+    )
 
     headers = (
         "fast_accum",
@@ -77,14 +85,14 @@ def run(
         "K",
         "N",
         "ref_time_s",
-        "fp8_time_s",
-        "fp8_speedup",
+        "time_s",
+        "speedup",
     )
     results = []
 
     dtype = torch.bfloat16
     name_to_shapes = get_name_to_shapes_iter(shape_gen_name, M, K, N)
-    fast_accum_vals = [True, False]
+    fast_accum_vals = [False] if use_fp4 else [True, False]
 
     for idx, (fast_accum, (name, (M, K, N))) in enumerate(
         itertools.product(fast_accum_vals, name_to_shapes)
@@ -107,35 +115,53 @@ def run(
 
         del A
 
-        # raw float8 matmul (upper bound for what we can achive in eager mode)
-        # TODO(future): add e5m2
-        d1, d2, d3 = torch.float8_e4m3fn, torch.float8_e4m3fn, dtype
-        A = torch.zeros(M, K, device=device, dtype=d1)
-        B = torch.zeros(K, N, device=device, dtype=d2).t().contiguous().t()
+        A_hp = torch.randn(M, K, device=device)
+        B_hp_t = torch.randn(N, K, device=device)
+
+        if use_fp4:
+            _, A = to_mx(A_hp, torch.float4_e2m1fn_x2, 32)
+            _, Bt = to_mx(B_hp_t, torch.float4_e2m1fn_x2, 32)
+            B = Bt.contiguous().T
+            peak_tops = fp4_peak_tops
+        else:
+            # raw float8 matmul (upper bound for what we can achive in eager mode)
+            # TODO(future): add e5m2
+            d1, d2, d3 = torch.float8_e4m3fn, torch.float8_e4m3fn, dtype
+            A = A_hp.to(d1)
+            B = B_hp_t.to(d2).contiguous().T
+            peak_tops = fp8_peak_tops
+
         if recipe == "tensorwise":
             scale_a = torch.tensor([1.0], device=device)
             scale_b = torch.tensor([1.0], device=device)
         elif recipe == "rowwise":
             scale_a = torch.ones(M, 1, device=device)
             scale_b = torch.ones(1, N, device=device)
-        elif recipe == "mxfp8_cublas":
+        elif recipe in ("mxfp8_cublas", "mxfp4_cutlass"):
             scale_a = torch.ones(M, K // 32, device=device, dtype=torch.float8_e8m0fnu)
             scale_b = torch.ones(N, K // 32, device=device, dtype=torch.float8_e8m0fnu)
         else:
             assert False, f"unknown recipe {recipe}"
 
-        def do_matmul(A, B):
+        def do_matmul_fp8(A, B):
             nonlocal scale_a
             nonlocal scale_b
             return torch._scaled_mm(
                 A, B, scale_a, scale_b, out_dtype=d3, use_fast_accum=fast_accum
             )
 
-        fp8_time_sec, fp8_tops_sec, fp8_pct_top_peak = do_benchmarks(
-            tops, fp8_peak_tops, use_gpu_kernel_time, do_matmul, A, B
+        def do_matmul_mxfp4(A, B):
+            nonlocal scale_a
+            nonlocal scale_b
+            return mx_fp4_bf16(A, B, scale_a, scale_b)
+
+        do_matmul = do_matmul_mxfp4 if use_fp4 else do_matmul_fp8
+
+        time_sec, tops_sec, pct_top_peak = do_benchmarks(
+            tops, peak_tops, use_gpu_kernel_time, do_matmul, A, B
         )
         print(
-            f"fp8 time_sec {fp8_time_sec:.2E}, tops/sec {fp8_tops_sec:.2E}, pct_peak {fp8_pct_top_peak:.3f}"
+            f"time_sec {time_sec:.2E}, tops/sec {tops_sec:.2E}, pct_peak {pct_top_peak:.3f}"
         )
 
         del A, B, scale_a, scale_b
@@ -148,8 +174,8 @@ def do_matmul(A, B):
                 K,
                 N,
                 ref_time_sec,
-                fp8_time_sec,
-                ref_time_sec / fp8_time_sec,
+                time_sec,
+                ref_time_sec / time_sec,
             ]
         )
 
diff --git a/benchmarks/float8/utils.py b/benchmarks/float8/utils.py
index 0ee2b922fc..6c3051937d 100644
--- a/benchmarks/float8/utils.py
+++ b/benchmarks/float8/utils.py
@@ -352,9 +352,6 @@ def get_gpu_kernel_gemm_time_s(f, *args, **kwargs):
     )
     # there is only 1 key, aten::mm or aten::_scaled_mm, with unit nanoseconds
     assert len(data) == 1
-    if "aten::mm" in data:
-        return data["aten::mm"] / 1e6 / n_iter
-    elif "aten::_scaled_mm" in data:
-        return data["aten::_scaled_mm"] / 1e6 / n_iter
-    else:
-        raise AssertionError("unexpected format of data")
+    key, value = next(iter(data.items()))
+    assert key in ("aten::mm", "aten::_scaled_mm", "torchao::mx_fp4_bf16")
+    return value / 1e6 / n_iter
diff --git a/setup.py b/setup.py
index 5560ab877e..65590b3cff 100644
--- a/setup.py
+++ b/setup.py
@@ -272,15 +272,18 @@ def get_cutlass_build_flags():
             raise ValueError("No CUDA version found")
 
         major, minor = map(int, cuda_version.split(".")[:2])
-        build_sm90a = major > 12 or (major == 12 and minor >= 6)
-        build_sm100a = major > 12 or (major == 12 and minor >= 8)
+        build_sm90a = (major, minor) >= (12, 6)
+        build_sm100a = (major, minor) >= (12, 8)
+        build_sm120a = (major, minor) >= (12, 8)
 
         if build_sm90a:
             print(f"CUDA {cuda_version}: Enabling SM90a CUTLASS kernels")
         if build_sm100a:
             print(f"CUDA {cuda_version}: Enabling SM100a CUTLASS kernels")
+        if build_sm120a:
+            print(f"CUDA {cuda_version}: Enabling SM120a CUTLASS kernels")
 
-        return build_sm90a, build_sm100a
+        return build_sm90a, build_sm100a, build_sm120a
     except:
         # Fallback to architecture flags
         cuda_arch_flags = _get_cuda_arch_flags()
@@ -340,6 +343,11 @@ def __init__(
         self.cmake_args = cmake_args
 
 
+def remove_items(a: list, b: list) -> list:
+    """Remove items in list b from list a"""
+    return [x for x in a if x not in b]
+
+
 def get_extensions():
     # Skip building C++ extensions if USE_CPP is set to "0"
     if use_cpp == "0":
@@ -454,7 +462,7 @@ def get_extensions():
         excluded_sources = list(
             glob.glob(os.path.join(extensions_dir, "cpu/*.cpp"), recursive=True)
         )
-        sources = [s for s in sources if s not in excluded_sources]
+        sources = remove_items(sources, excluded_sources)
 
     # Collect CUDA source files
     extensions_cuda_dir = os.path.join(extensions_dir, "cuda")
@@ -498,22 +506,24 @@ def get_extensions():
         rocm_sources = list(
             glob.glob(os.path.join(extensions_rocm_dir, "**/*.cpp"), recursive=True)
         )
-        sources = [s for s in sources if s not in rocm_sources]
+        sources = remove_items(sources, rocm_sources)
 
-    use_cutlass = False
+    use_cutlass = use_cuda and not IS_WINDOWS
     cutlass_90a_sources = None
     cutlass_100a_sources = None
+    cutlass_120a_sources = None
     build_for_sm90a = False
     build_for_sm100a = False
-    if use_cuda and not IS_WINDOWS:
-        use_cutlass = True
+    build_for_sm120a = False
+
+    if use_cutlass:
         cutlass_dir = os.path.join(third_party_path, "cutlass")
         cutlass_include_dir = os.path.join(cutlass_dir, "include")
         cutlass_tools_include_dir = os.path.join(
             cutlass_dir, "tools", "util", "include"
         )
         cutlass_extensions_include_dir = os.path.join(cwd, extensions_cuda_dir)
-    if use_cutlass:
+
         extra_compile_args["nvcc"].extend(
             [
                 "-DTORCHAO_USE_CUTLASS",
@@ -533,7 +543,7 @@ def get_extensions():
             ]
         )
 
-        build_for_sm90a, build_for_sm100a = get_cutlass_build_flags()
+        build_for_sm90a, build_for_sm100a, build_for_sm120a = get_cutlass_build_flags()
         # Define sm90a sources
         cutlass_90a_sources = [
             os.path.join(
@@ -557,40 +567,40 @@ def get_extensions():
                     "rowwise_scaled_linear_sparse_cutlass_" + dtypes + ".cu",
                 )
             )
-        # Always remove sm90a sources from main sources
-        sources = [s for s in sources if s not in cutlass_90a_sources]
+        sources = remove_items(sources, cutlass_90a_sources)
 
         # Always compile mx_fp_cutlass_kernels.cu ONLY with sm100a architecture
         cutlass_100a_sources = [
             os.path.join(
                 extensions_cuda_dir,
                 "mx_kernels",
-                "mx_fp_cutlass_kernels.cu",
+                "mx_fp_cutlass_kernels_sm100a.cu",
             ),
         ]
-        # Remove from main sources to prevent compilation with other architectures
-        sources = [
-            s for s in sources if os.path.basename(s) != "mx_fp_cutlass_kernels.cu"
+        sources = remove_items(sources, cutlass_100a_sources)
+
+        # Always compile mx_fp_cutlass_kernels.cu ONLY with sm120a architecture
+        cutlass_120a_sources = [
+            os.path.join(
+                extensions_cuda_dir,
+                "mx_kernels",
+                "mx_fp_cutlass_kernels_sm120a.cu",
+            ),
         ]
+        sources = remove_items(sources, cutlass_120a_sources)
 
     else:
-        # Remove CUTLASS-based kernels from the sources list.  An
-        # assumption is that these files will have "cutlass" in its
-        # name.
+        # Remove CUTLASS-based kernels from the sources list.  An assumption is that
+        # these files will have "cutlass" in its name.
         cutlass_sources = list(
             glob.glob(
                 os.path.join(extensions_cuda_dir, "**/*cutlass*.cu"), recursive=True
             )
         )
-        sources = [s for s in sources if s not in cutlass_sources]
+        sources = remove_items(sources, cutlass_sources)
 
     ext_modules = []
     if len(sources) > 0:
-        # Double-check to ensure mx_fp_cutlass_kernels.cu is not in sources
-        sources = [
-            s for s in sources if os.path.basename(s) != "mx_fp_cutlass_kernels.cu"
-        ]
-
         ext_modules.append(
             extension(
                 "torchao._C",
@@ -643,6 +653,27 @@ def get_extensions():
             )
         )
 
+    # Only build the cutlass_120a extension if sm120a is in the architecture flags
+    if (
+        cutlass_120a_sources is not None
+        and len(cutlass_120a_sources) > 0
+        and build_for_sm120a
+    ):
+        cutlass_120a_extra_compile_args = copy.deepcopy(extra_compile_args)
+        # Only use sm120a architecture for these sources, ignoring cuda_arch_flags
+        cutlass_120a_extra_compile_args["nvcc"].append(
+            "-gencode=arch=compute_120a,code=sm_120a"
+        )
+        ext_modules.append(
+            extension(
+                "torchao._C_cutlass_120a",
+                cutlass_120a_sources,
+                py_limited_api=True,
+                extra_compile_args=cutlass_120a_extra_compile_args,
+                extra_link_args=extra_link_args,
+            )
+        )
+
     # Build CMakeLists from /torchao/experimental - additional options become available : TORCHAO_BUILD_CPU_AARCH64, TORCHAO_BUILD_KLEIDIAI, TORCHAO_BUILD_MPS_OPS, TORCHAO_PARALLEL_BACKEND
     if build_macos_arm_auto or os.getenv("BUILD_TORCHAO_EXPERIMENTAL") == "1":
         build_options = BuildOptions()
diff --git a/test/prototype/mx_formats/test_mx_mm.py b/test/prototype/mx_formats/test_mx_mm.py
index 46380cfb55..bf383446cd 100644
--- a/test/prototype/mx_formats/test_mx_mm.py
+++ b/test/prototype/mx_formats/test_mx_mm.py
@@ -14,7 +14,7 @@
 from torchao.prototype.mx_formats.utils import to_blocked
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_8,
-    is_sm_at_least_100,
+    is_sm_version,
 )
 
 if not TORCH_VERSION_AT_LEAST_2_8:
@@ -59,7 +59,8 @@ def run_matrix_test(M: int, K: int, N: int, format) -> float:
 
 @pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
 @pytest.mark.skipif(
-    not is_sm_at_least_100(), reason="CUDA capability >= 10.0 required for mxfloat8"
+    not (is_sm_version(10, 0) or is_sm_version(12, 0)),
+    reason="CUDA capability 10.0 or 12.0 is required for mxfloat8",
 )
 @pytest.mark.parametrize(
     "size",
diff --git a/torchao/__init__.py b/torchao/__init__.py
index e6e291309f..2d40be2ac4 100644
--- a/torchao/__init__.py
+++ b/torchao/__init__.py
@@ -25,8 +25,21 @@
 
     so_files = list(Path(__file__).parent.glob("_C*.so"))
     if len(so_files) > 0:
+        compute_capability = (
+            torch.cuda.get_device_capability() if torch.cuda.is_available() else None
+        )
+
         for file in so_files:
+            # only load architecture-specific target if the current GPU matches that target
+            if (
+                ("cutlass_90a" in file.name and compute_capability != (9, 0))
+                or ("cutlass_100a" in file.name and compute_capability != (10, 0))
+                or ("cutlass_120a" in file.name and compute_capability != (12, 0))
+            ):
+                continue
+
             torch.ops.load_library(str(file))
+
         from . import ops
 
     # The following library contains CPU kernels from torchao/experimental
diff --git a/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels.cu b/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels_sm100a.cu
similarity index 100%
rename from torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels.cu
rename to torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels_sm100a.cu
diff --git a/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels_sm120a.cu b/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels_sm120a.cu
new file mode 100644
index 0000000000..0436124cbb
--- /dev/null
+++ b/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels_sm120a.cu
@@ -0,0 +1,195 @@
+// Copyright (c) Meta Platforms, Inc. and affiliates.
+// All rights reserved.
+//
+// This source code is licensed under the BSD 3-Clause license found in the
+// LICENSE file in the root directory of this source tree.
+
+#include <torch/library.h>
+
+#include <ATen/ATen.h>
+#include <ATen/core/Tensor.h>
+#include <ATen/cuda/CUDAUtils.h>
+#include <c10/util/Exception.h>
+#include <ATen/cuda/CUDAContext.h>
+#include <c10/cuda/CUDAException.h>
+
+#if defined(TORCHAO_USE_CUTLASS) && !defined(_WIN32) &&                   \
+    defined(CUDA_VERSION) && (CUDA_VERSION >= 12080)
+#define BUILD_MX_KERNELS_CUTLASS
+#endif
+
+#if defined(BUILD_MX_KERNELS_CUTLASS)
+
+#include "cute/tensor.hpp"
+#include "cutlass/detail/sm100_blockscaled_layout.hpp"
+#include "cutlass/epilogue/collective/collective_builder.hpp"
+#include "cutlass/epilogue/thread/linear_combination.h"
+#include "cutlass/gemm/collective/collective_builder.hpp"
+#include "cutlass/gemm/device/gemm_universal_adapter.h"
+#include "cutlass/util/packed_stride.hpp"
+
+
+#endif
+
+namespace torchao {
+
+#if defined(BUILD_MX_KERNELS_CUTLASS)
+namespace {
+
+using namespace cute;
+
+void run_gemm(at::Tensor& a, at::Tensor& b, at::Tensor& a_scale,
+             at::Tensor& b_scale, at::Tensor& out, int M, int K, int N) {
+
+  using MmaTileShape        = Shape<_128,_128,_128>;
+  using ClusterShape        = Shape<_1,_1,_1>;
+  using PerSmTileShape_MNK  = Shape<_128,_128,_128>;
+
+  // A matrix configuration
+  using         ElementA    = cutlass::mx_float4_t<cutlass::float_e2m1_t>;
+  using         LayoutATag  = cutlass::layout::RowMajor;                      // Layout type for A matrix operand
+  constexpr int AlignmentA  = 32;    // Memory access granularity/alignment of A matrix in units of elements (up to 16 bytes)
+
+  // B matrix configuration
+  using         ElementB    = cutlass::mx_float4_t<cutlass::float_e2m1_t>;
+  using         LayoutBTag  = cutlass::layout::ColumnMajor;                   // Layout type for B matrix operand
+  constexpr int AlignmentB  = 32;    // Memory access granularity/alignment of B matrix in units of elements (up to 16 bytes)
+
+  // C/D matrix configuration
+  using         ElementC    = cutlass::bfloat16_t;                            // Element type for C matrix operand
+  using         ElementD    = cutlass::bfloat16_t;
+  using         LayoutCTag  = cutlass::layout::RowMajor;                      // Layout type for C matrix operand
+  using         LayoutDTag  = cutlass::layout::RowMajor;                      // Layout type for D matrix operand
+  constexpr int AlignmentD  = 128 / cutlass::sizeof_bits<ElementD>::value;    // Memory access granularity/alignment of D matrix in units of elements (up to 16 bytes)
+  constexpr int AlignmentC  = 128 / cutlass::sizeof_bits<ElementC>::value;    // Memory access granularity/alignment of C matrix in units of elements (up to 16 bytes)
+  // Kernel functional config
+  using ElementAccumulator  = float;                                          // Element type for internal accumulation
+  using ArchTag             = cutlass::arch::Sm120;                           // Tag indicating the minimum SM that supports the intended feature
+  using OperatorClass       = cutlass::arch::OpClassBlockScaledTensorOp;      // Operator class tag
+
+  using CollectiveEpilogue = typename cutlass::epilogue::collective::CollectiveBuilder<
+      ArchTag, OperatorClass,
+      PerSmTileShape_MNK, ClusterShape,
+      cutlass::epilogue::collective::EpilogueTileAuto,
+      ElementAccumulator, ElementAccumulator,
+      ElementC, LayoutCTag, AlignmentC,
+      ElementD, LayoutDTag, AlignmentD,
+      cutlass::epilogue::collective::EpilogueScheduleAuto                      // Epilogue schedule policy
+    >::CollectiveOp;
+
+  using CollectiveMainloop = typename cutlass::gemm::collective::CollectiveBuilder<
+      ArchTag, OperatorClass,
+      ElementA, LayoutATag, AlignmentA,
+      ElementB, LayoutBTag, AlignmentB,
+      ElementAccumulator,
+      MmaTileShape, ClusterShape,
+      cutlass::gemm::collective::StageCountAutoCarveout<static_cast<int>(sizeof(typename CollectiveEpilogue::SharedStorage))>,
+      cutlass::gemm::collective::KernelScheduleAuto                             // Kernel schedule policy. Auto or using targeted scheduling policy
+    >::CollectiveOp;
+
+  using GemmKernel = cutlass::gemm::kernel::GemmUniversal<
+      Shape<int,int,int,int>,                                                   // Indicates ProblemShape
+      CollectiveMainloop,
+      CollectiveEpilogue,
+      void>;
+
+  using Gemm = cutlass::gemm::device::GemmUniversalAdapter<GemmKernel>;
+
+  // Reference device GEMM implementation type
+  using StrideA   = typename Gemm::GemmKernel::StrideA;
+  using StrideB   = typename Gemm::GemmKernel::StrideB;
+  using StrideC   = typename Gemm::GemmKernel::StrideC;
+  using StrideD   = typename Gemm::GemmKernel::StrideD;
+  using LayoutSFA = typename Gemm::GemmKernel::CollectiveMainloop::LayoutSFA;
+  using LayoutSFB = typename Gemm::GemmKernel::CollectiveMainloop::LayoutSFB;
+  using Sm1xxBlkScaledConfig = typename Gemm::GemmKernel::CollectiveMainloop::Sm1xxBlkScaledConfig;
+
+  // Initialize strides using packed stride configuration
+  auto stride_A = cutlass::make_cute_packed_stride(StrideA{}, make_shape(M, K, 1));
+  auto stride_B = cutlass::make_cute_packed_stride(StrideB{}, make_shape(N, K, 1));
+  auto stride_D = cutlass::make_cute_packed_stride(StrideD{}, make_shape(M, N, 1));
+
+  // Initialize scale factor layouts using block scaled configuration
+  auto layout_SFA = Sm1xxBlkScaledConfig::tile_atom_to_shape_SFA(make_shape(M, N, K, 1));
+  auto layout_SFB = Sm1xxBlkScaledConfig::tile_atom_to_shape_SFB(make_shape(M, N, K, 1));
+
+  using DtypeA = typename ElementA::DataType;
+  using DtypeB = typename ElementB::DataType;
+  using DtypeScaleA = typename ElementA::ScaleFactorType;
+  using DtypeScaleB = typename ElementB::ScaleFactorType;
+  using DtypeOut = ElementD;
+
+  Gemm gemm;
+
+  auto A_ptr = reinterpret_cast<DtypeA*>(a.data_ptr());
+  auto B_ptr = reinterpret_cast<DtypeB*>(b.data_ptr());
+  auto SFA_ptr = reinterpret_cast<DtypeScaleA*>(a_scale.data_ptr());
+  auto SFB_ptr = reinterpret_cast<DtypeScaleB*>(b_scale.data_ptr());
+  auto out_ptr = reinterpret_cast<DtypeOut*>(out.data_ptr());
+
+  typename Gemm::Arguments arguments{
+    cutlass::gemm::GemmUniversalMode::kGemm,
+    {M, N, K, 1},
+    { // Mainloop arguments
+      A_ptr, stride_A,
+      B_ptr, stride_B,
+      SFA_ptr, layout_SFA,
+      SFB_ptr, layout_SFB
+    },
+    { // Epilogue arguments
+      {1.0, 0.0},
+      nullptr, StrideC{},  // No bias for now
+      out_ptr, stride_D
+    }
+  };
+
+  // Check the problem size is supported or not
+  cutlass::Status status = gemm.can_implement(arguments);
+  TORCH_CHECK(status == cutlass::Status::kSuccess, "Cutlass cannot implement");
+  // Allocate workspace memory
+  size_t workspace_size = Gemm::get_workspace_size(arguments);
+  auto workspace = a.new_empty(
+      {static_cast<int64_t>(workspace_size)},
+      at::TensorOptions().dtype(at::kByte));
+
+  // Initialize CUTLASS kernel with arguments and workspace pointer
+  status = gemm.initialize(arguments, workspace.data_ptr());
+  TORCH_CHECK(status == cutlass::Status::kSuccess, "Cutlass cannot initialize");
+
+  status = gemm.run(at::cuda::getCurrentCUDAStream());
+  TORCH_CHECK(status == cutlass::Status::kSuccess, "Cutlass cannot run", cutlass::cutlassGetStatusString(status));
+
+  C10_CUDA_KERNEL_LAUNCH_CHECK();
+
+}
+}
+#endif
+
+at::Tensor mx_fp4_bf16(at::Tensor a, at::Tensor b, at::Tensor a_scale,
+                       at::Tensor b_scale) {
+#if defined(BUILD_MX_KERNELS_CUTLASS)
+  TORCH_CHECK(a.is_cuda(), "a must be CUDA tensor");
+  TORCH_CHECK(b.is_cuda(), "b must be CUDA tensor");
+  TORCH_CHECK(a_scale.is_cuda(), "a_scale must be CUDA tensor");
+  TORCH_CHECK(b_scale.is_cuda(), "b_scale must be CUDA tensor");
+
+  auto M = a.size(0);
+  auto K = a.size(1) * 2;
+  auto N = b.size(1);
+
+  auto out =
+      at::empty({M, N}, a.options().dtype(at::kBFloat16));
+
+  run_gemm(a, b, a_scale, b_scale, out, M, K, N);
+  return out;
+#else
+  TORCH_CHECK_NOT_IMPLEMENTED(false, __func__);
+  return at::Tensor{};
+#endif
+}
+
+TORCH_LIBRARY_IMPL(torchao, CUDA, m) {
+  m.impl("torchao::mx_fp4_bf16", &mx_fp4_bf16);
+}
+
+} // namespace torchao
diff --git a/torchao/testing/float8/roofline_utils.py b/torchao/testing/float8/roofline_utils.py
index 7bfb9887df..286803dbf2 100644
--- a/torchao/testing/float8/roofline_utils.py
+++ b/torchao/testing/float8/roofline_utils.py
@@ -54,6 +54,13 @@
         # TODO(future): run measurement on hardware
         "pct_achievable_mem_bw": 0.92,
     },
+    "NVIDIA GeForce RTX 5090": {
+        # https://images.nvidia.com/aem-dam/Solutions/geforce/blackwell/nvidia-rtx-blackwell-gpu-architecture.pdf
+        "bf16_peak_tops": 209.5e12,
+        "fp8_peak_tops": 419e12,
+        "fp4_peak_tops": 1676e12,
+        "peak_mem_bw_bytes_sec": 1.792e15,
+    },
     # TODO(future): more GPU names
 }
 

From 28989031568710ec6739eb901708eb392782cfd1 Mon Sep 17 00:00:00 2001
From: Daniel Vega-Myhre <danvm@meta.com>
Date: Sat, 21 Jun 2025 09:54:00 -0700
Subject: [PATCH 143/165] [float8 moe training] FSDP support  (#2413)

* fsdp support in moe training

* unwrap args and kwargs

* disable func

* fsdp working

* roll back use_triton flag

* add fsdp test for moe training
---
 test/prototype/moe_training/test_fsdp.py      | 156 ++++++++++++++++++
 .../benchmarks/benchmark_scaled_grouped_mm.py |  32 +---
 .../moe_training/conversion_utils.py          |   8 +-
 .../moe_training/scaled_grouped_mm.py         |  20 +--
 torchao/prototype/moe_training/tensor.py      | 102 ++++++++++--
 5 files changed, 253 insertions(+), 65 deletions(-)
 create mode 100644 test/prototype/moe_training/test_fsdp.py

diff --git a/test/prototype/moe_training/test_fsdp.py b/test/prototype/moe_training/test_fsdp.py
new file mode 100644
index 0000000000..4994a76854
--- /dev/null
+++ b/test/prototype/moe_training/test_fsdp.py
@@ -0,0 +1,156 @@
+import copy
+import os
+
+import pytest
+import torch
+from torch import distributed as dist
+from torch import nn
+from torch.distributed._composable.fsdp import fully_shard
+from torch.nn import functional as F
+
+# this feature requires CUDA and SM89+
+if not torch.cuda.is_available() or torch.cuda.get_device_capability() < (8, 9):
+    pytest.skip(
+        "CUDA not available or compute capability < 8.9", allow_module_level=True
+    )
+
+from torchao.float8.float8_utils import compute_error
+from torchao.prototype.moe_training.conversion_utils import MoETrainingConfig
+from torchao.prototype.moe_training.tensor import ScaledGroupedMMTensor
+from torchao.quantization.quant_api import quantize_
+
+# this test requires torchtitan
+try:
+    from torchtitan.experiments.llama4.model.args import TransformerModelArgs
+    from torchtitan.experiments.llama4.model.moe import MoE
+except ImportError:
+    import warnings
+
+    warnings.warn("torchtitan not installed, skipping MoE tests.")
+    pytest.skip(allow_module_level=True)
+
+
+def test_moe_float8_training_fsdp():
+    assert torch.cuda.is_available()
+
+    # setup distributed for fsdp
+    setup_distributed()
+
+    # define model args
+    target_fqns = ["experts"]
+    model_args = TransformerModelArgs(
+        moe_enabled=True,
+        num_experts=8,
+        dim=256,
+    )
+    init_std = 0.02
+    device = torch.device("cuda")
+
+    # reference bf16 MoE
+    ref_model = MoE(model_args).to(torch.bfloat16).cuda()
+    torch.manual_seed(42)
+    ref_model.init_weights(init_std, device)
+
+    # target MoE for testing conversion
+    model = copy.deepcopy(ref_model)
+
+    # assert starting params are identical for both models
+    for param1, param2 in zip(model.parameters(), ref_model.parameters()):
+        assert torch.equal(param1, param2)
+
+    # convert MoE to float8 training
+    def moe_module_filter_fn(mod: nn.Module, cur_fqn: str) -> bool:
+        for target_fqn in target_fqns:
+            if target_fqn in cur_fqn:
+                return True
+        return False
+
+    # quantize test model
+    config = MoETrainingConfig()
+    quantize_(model, config=config, filter_fn=moe_module_filter_fn)
+
+    # validate that only the experts were converted
+    _validate_model_conversion(
+        model,
+        target_fqns=target_fqns,
+    )
+
+    # FSDP2
+    fully_shard(model)
+    fully_shard(ref_model)
+
+    # inputs
+    batch, seq, dim = 8, 2048, 256
+    ref_x = torch.randn(
+        batch, seq, dim, dtype=torch.bfloat16, requires_grad=True, device=device
+    )
+    x = ref_x.detach().clone().requires_grad_(True)
+
+    # forward pass
+    ref_out = ref_model(ref_x)
+    out = model(x)
+
+    # validate output
+    out_sqnr = compute_error(out, ref_out)
+    assert out_sqnr.item() >= 30.0, f"SQNR must be >= 30.0, got {out_sqnr.item()}."
+
+    # compute loss
+    labels = torch.ones_like(ref_out)
+    ref_loss = F.mse_loss(ref_out, labels)
+    out_loss = F.mse_loss(out, labels)
+
+    # backward pass
+    ref_loss.backward()
+    out_loss.backward()
+
+    # validate input gradient
+    input_grad_sqnr = compute_error(x.grad, ref_x.grad)
+    assert input_grad_sqnr.item() >= 30.0, (
+        f"SQNR must be >= 30.0, got {input_grad_sqnr.item()}."
+    )
+
+    # validate param gradients
+    for param1, param2 in zip(model.parameters(), ref_model.parameters()):
+        param_grad_sqnr = compute_error(param1.grad, param2.grad)
+        assert param_grad_sqnr.item() >= 25.0, (
+            f"SQNR must be >= 25.0, got {param_grad_sqnr.item()}."
+        )
+
+    dist.destroy_process_group()
+
+
+def _validate_model_conversion(
+    root_module: nn.Module,
+    target_fqns: list[str],
+):
+    def _recursive_validate(
+        module: nn.Module,
+        cur_fqn: str,
+    ):
+        is_allowed_module = cur_fqn in target_fqns
+
+        # check current module params
+        for param_name, param in module.named_parameters(recurse=False):
+            is_converted_type = isinstance(param, ScaledGroupedMMTensor)
+            if is_converted_type:
+                assert is_allowed_module, (
+                    f"Module {cur_fqn} is not in target_fqns, but has converted param {param_name}."
+                )
+            if not is_allowed_module:
+                assert not is_converted_type, (
+                    f"Module {cur_fqn} is not in target_fqns, but has converted param {param_name}."
+                )
+
+        # recursively check child modules
+        for child_name, child_module in module.named_children():
+            child_fqn = f"{cur_fqn}.{child_name}" if cur_fqn else child_name
+            _recursive_validate(child_module, child_fqn)
+
+    _recursive_validate(root_module, "")
+
+
+def setup_distributed():
+    rank = int(os.environ["RANK"])
+    world_size = int(os.environ["WORLD_SIZE"])
+    dist.init_process_group("nccl", rank=rank, world_size=world_size)
+    torch.cuda.set_device(rank)
diff --git a/torchao/prototype/moe_training/benchmarks/benchmark_scaled_grouped_mm.py b/torchao/prototype/moe_training/benchmarks/benchmark_scaled_grouped_mm.py
index a347763fe6..c229eaeb71 100644
--- a/torchao/prototype/moe_training/benchmarks/benchmark_scaled_grouped_mm.py
+++ b/torchao/prototype/moe_training/benchmarks/benchmark_scaled_grouped_mm.py
@@ -31,9 +31,7 @@ class ExperimentConfig:
 
 @dataclass(frozen=True)
 class ExperimentResult:
-    torch_time_us: float
-    triton_time_us: bool
-    triton_speedup: float
+    time_us: float
 
 
 @dataclass(frozen=True)
@@ -98,36 +96,26 @@ def warmup(func, *args, **kwargs):
         for _ in range(10):
             func(*args, **kwargs)
 
-    def forward_backward(A, B_t, offs, use_triton=True):
+    def forward_backward(A, B_t, offs):
         out = _scaled_grouped_mm(
             A,
             B_t,
             offs=offs,
             out_dtype=torch.bfloat16,
-            use_triton_for_per_group_scales=use_triton,
         )
         out.sum().backward()
         torch.cuda.synchronize()
 
     # benchmark torch
     torch_func = torch.compile(forward_backward) if args.compile else forward_backward
-    warmup(torch_func, A, B_t, offs, use_triton=False)
+    warmup(torch_func, A, B_t, offs)
     start_time_ns = time.perf_counter_ns()
-    torch_func(A, B_t, offs, use_triton=False)
+    torch_func(A, B_t, offs)
     torch_time_ns = time.perf_counter_ns() - start_time_ns
-    torch_time_us = torch_time_ns / 1e3
-
-    # benchmark triton
-    warmup(forward_backward, A, B_t, offs, use_triton=True)
-    start_time_ns = time.perf_counter_ns()
-    forward_backward(A, B_t, offs, use_triton=True)
-    triton_time_ns = time.perf_counter_ns() - start_time_ns
-    triton_time_us = triton_time_ns / 1e3
+    time_us = torch_time_ns / 1e3
 
     return ExperimentResult(
-        torch_time_us=round(torch_time_us, 3),
-        triton_time_us=round(triton_time_us, 3),
-        triton_speedup=round(torch_time_us / triton_time_us, 3),
+        time_us=round(time_us, 3),
     )
 
 
@@ -135,9 +123,7 @@ def print_results(experiments: List[Experiment]):
     headers = [
         "A_shape",
         "B_shape",
-        "torch_time_us",
-        "triton_time_us",
-        "triton_speedup",
+        "time_us",
     ]
     rows = []
     for experiment in experiments:
@@ -147,9 +133,7 @@ def print_results(experiments: List[Experiment]):
             [
                 A_shape,
                 B_shape,
-                experiment.result.torch_time_us,
-                experiment.result.triton_time_us,
-                experiment.result.triton_speedup,
+                experiment.result.time_us,
             ]
         )
     print(tabulate(rows, headers=headers))
diff --git a/torchao/prototype/moe_training/conversion_utils.py b/torchao/prototype/moe_training/conversion_utils.py
index 4d65303b89..51af0fd956 100644
--- a/torchao/prototype/moe_training/conversion_utils.py
+++ b/torchao/prototype/moe_training/conversion_utils.py
@@ -28,9 +28,6 @@ class MoETrainingConfig(AOBaseConfig):
     For all other ops, ScaledGroupedMMTensor behaves like a regular torch.Tensor.
     """
 
-    # temporary config flag for testing/benchmarking, will remove before graduating out of prototype
-    use_triton_for_per_group_scales: bool = True
-
 
 @register_quantize_module_handler(MoETrainingConfig)
 def _moe_training_transform(
@@ -71,7 +68,6 @@ def _swap_params(
     Returns:
      nn.Module: The modified module with swapped linear layers.
     """
-    use_triton = config.use_triton_for_per_group_scales if config is not None else False
     if isinstance(module, nn.Parameter) and (
         module_filter_fn is None or module_filter_fn(module, "")
     ):
@@ -80,9 +76,7 @@ def _swap_params(
                 f"Does not support a root nn.Parameter with children: {module}"
             )
         if not isinstance(module.data, ScaledGroupedMMTensor):
-            new_data = ScaledGroupedMMTensor(
-                module.data, use_triton_for_per_group_scales=use_triton
-            )
+            new_data = ScaledGroupedMMTensor(module.data)
             return nn.Parameter(new_data, requires_grad=module.requires_grad)
         return module
 
diff --git a/torchao/prototype/moe_training/scaled_grouped_mm.py b/torchao/prototype/moe_training/scaled_grouped_mm.py
index f7d470e556..29adffd831 100644
--- a/torchao/prototype/moe_training/scaled_grouped_mm.py
+++ b/torchao/prototype/moe_training/scaled_grouped_mm.py
@@ -16,8 +16,6 @@
 )
 from torchao.prototype.moe_training.utils import (
     _is_column_major,
-    _to_2d_jagged_float8_tensor_colwise,
-    _to_2d_jagged_float8_tensor_rowwise,
 )
 
 
@@ -26,7 +24,6 @@ def _scaled_grouped_mm(
     B_t: torch.Tensor,
     offs: torch.Tensor,
     out_dtype: Optional[torch.dtype] = torch.bfloat16,
-    use_triton_for_per_group_scales: bool = True,
 ) -> torch.Tensor:
     """
     This function performs dynamic float8 quantization with row-wise scaling
@@ -143,7 +140,6 @@ def forward(
         # Store what we need for backward.
         ctx.save_for_backward(A, B_fp8_col_major, B_scales, offs)
         ctx.out_dtype = out_dtype
-        ctx.use_triton_for_per_group_scales = use_triton_for_per_group_scales
 
         # Perform scaled grouped GEMM and return result.
         # output shape: scaled grouped mm of (M,K) @ (B,K,N) = (M,N)
@@ -167,7 +163,6 @@ def forward(
     def backward(ctx, grad_output: torch.Tensor):
         A, B_fp8_col_major, B_scales, offs = ctx.saved_tensors
         out_dtype = ctx.out_dtype
-        use_triton_for_per_group_scales = ctx.use_triton_for_per_group_scales
 
         # Convert grad_output to float8, row-major for left operand of grouped GEMM
         # needed for grad_A: grad_output @ B
@@ -216,19 +211,8 @@ def backward(ctx, grad_output: torch.Tensor):
 
         # grad_B is a special case. both operands of the grouped gemm will be 2D with offsets determing the "groups."
         # Compute scales for grad_output_t and A, which are both 2D tensors with offsets which define the "jagged" groups.
-        per_group_rowwise_scale_func = (
-            triton_fp8_row_major_jagged_rowwise_scales
-            if use_triton_for_per_group_scales
-            else _to_2d_jagged_float8_tensor_rowwise
-        )
-        per_group_colwise_scale_func = (
-            triton_fp8_col_major_jagged_colwise_scales
-            if use_triton_for_per_group_scales
-            else _to_2d_jagged_float8_tensor_colwise
-        )
-
         grad_output_t_fp8_row_major, grad_output_t_scales = (
-            per_group_rowwise_scale_func(
+            triton_fp8_row_major_jagged_rowwise_scales(
                 grad_output_t_row_major,
                 offs,
                 torch.float8_e4m3fn,
@@ -236,7 +220,7 @@ def backward(ctx, grad_output: torch.Tensor):
             )
         )
 
-        A_fp8_col_major, A_scales = per_group_colwise_scale_func(
+        A_fp8_col_major, A_scales = triton_fp8_col_major_jagged_colwise_scales(
             A_col_major,
             offs,
             torch.float8_e4m3fn,
diff --git a/torchao/prototype/moe_training/tensor.py b/torchao/prototype/moe_training/tensor.py
index 8d7a8f815b..3ea9529237 100644
--- a/torchao/prototype/moe_training/tensor.py
+++ b/torchao/prototype/moe_training/tensor.py
@@ -1,7 +1,24 @@
+from typing import Any, Optional, Tuple
+
 import torch
+import torch.utils._pytree as pytree
+from torch._prims_common import suggest_memory_format
 
 from torchao.prototype.moe_training import _scaled_grouped_mm
 
+_ops_to_preserve_subclass = {
+    torch.ops.aten.empty_like.default,
+    torch.ops.aten.new_zeros.default,
+    torch.ops.aten.slice.Tensor,
+    torch.ops.aten.copy_.default,
+    torch.ops.aten.view.default,
+    torch.ops.aten.as_strided.default,
+    torch.ops.aten._to_copy.default,
+    torch.ops.aten._pin_memory.default,
+    torch.ops.aten.split.Tensor,
+    torch.ops.aten.clone.default,
+}
+
 
 class ScaledGroupedMMTensor(torch.Tensor):
     """
@@ -12,19 +29,34 @@ class ScaledGroupedMMTensor(torch.Tensor):
 
     grouped_mm_func_name = "_grouped_mm"
     offs_arg_name = "offs"
-    use_triton_for_per_group_scales = True
 
-    def __init__(
-        self, data: torch.Tensor, use_triton_for_per_group_scales: bool = True
+    @staticmethod
+    def __new__(
+        cls,
+        tensor: torch.Tensor,
     ):
-        self._data = data
-        self._use_triton_for_per_group_scales = use_triton_for_per_group_scales
+        return torch.Tensor._make_wrapper_subclass(
+            cls,
+            tensor.size(),
+            strides=tensor.stride(),
+            storage_offset=tensor.storage_offset(),
+            memory_format=suggest_memory_format(tensor),
+            dtype=tensor.dtype,
+            layout=tensor.layout,
+            device=tensor.device,
+            pin_memory=tensor.is_pinned(),
+            requires_grad=tensor.requires_grad,
+        )
 
-    def __repr__(self):
-        return f"ScaledGroupedMMTensor(use_triton_for_per_group_scales={self._use_triton_for_per_group_scales}, {self._data})"
+    def __init__(
+        self,
+        tensor: torch.Tensor,
+    ):
+        self._data = tensor
 
     @classmethod
     def __torch_function__(cls, func, types, args, kwargs={}):
+        # override the grouped mm op to use the differentiable _scaled_grouped_mm
         if func.__name__ == cls.grouped_mm_func_name:
             # Use torchao scaled grouped mm with dynamic quant for
             # "2d x 3d with offsets" case (used for routed experts).
@@ -38,16 +70,54 @@ def __torch_function__(cls, func, types, args, kwargs={}):
             B_is_3d = B.dim() == 3
             has_offs = kwargs.get(cls.offs_arg_name) is not None
             if A_is_2d and B_is_3d and has_offs:
-                # prefer to use B to check use_triton, as that will be the weight/nn.Parameter
-                # that is converted to ScaledGroupedMMTensor
-                use_triton = (
-                    B._use_triton_for_per_group_scales
-                    if isinstance(B, cls)
-                    else A._use_triton_for_per_group_scales
-                )
                 return _scaled_grouped_mm(
                     *args,
-                    use_triton_for_per_group_scales=use_triton,
                     **kwargs,
                 )
-        return super().__torch_function__(func, types, args, kwargs)
+
+        # Disable torch_function by hand because we don't want
+        # the wrapping behavior of the super() impl, go directly to dispatch
+        with torch._C.DisableTorchFunctionSubclass():
+            return func(*args, **kwargs)
+
+    @classmethod
+    def __torch_dispatch__(cls, func, types, args, kwargs={}):
+        # detach is special case
+        if func == torch.ops.aten.detach.default:
+            return ScaledGroupedMMTensor(args[0]._data)
+
+        # unwrap args and kwargs
+        unwrap = lambda tensor: tensor._data
+        args, kwargs = pytree.tree_map_only(
+            ScaledGroupedMMTensor, unwrap, (args, kwargs or {})
+        )
+
+        # perform op
+        out = func(*args, **kwargs)
+
+        # return regular tensors for ops that don't preserve subclass
+        if func not in _ops_to_preserve_subclass:
+            return out
+
+        # wrap outputs back into ScaledGroupedMMTensor for ops that do preserve subclass
+        return pytree.tree_map_only(
+            torch.Tensor,
+            lambda x: ScaledGroupedMMTensor(x),
+            out,
+        )
+
+    def fsdp_pre_all_gather(self, mesh):
+        return (self._data,), ()
+
+    def fsdp_post_all_gather(
+        self,
+        all_gather_outputs: Tuple[torch.Tensor, ...],
+        metadata: Any,
+        param_dtype: torch.dtype,
+        *,
+        out: Optional[torch.Tensor] = None,
+    ):
+        (data,) = all_gather_outputs
+        return ScaledGroupedMMTensor(
+            data,
+        ), (data,)

From 4e25496f10073c0ca8f9f174046080eea842d45e Mon Sep 17 00:00:00 2001
From: Gasoonjia <gasoonjia@meta.com>
Date: Mon, 23 Jun 2025 13:58:09 -0700
Subject: [PATCH 144/165] mitigate the numeric test issue (#2426)

mitigate the numeric test issue (#2426)

Summary:

this update mitigate the existing numeric debug ppl issue. Will further investigate it and reenable the test

Reviewed By: jerryzh168

Differential Revision: D77162495
---
 test/quantization/pt2e/test_numeric_debugger.py | 1 +
 1 file changed, 1 insertion(+)

diff --git a/test/quantization/pt2e/test_numeric_debugger.py b/test/quantization/pt2e/test_numeric_debugger.py
index 040cd1edcf..e935c25d68 100644
--- a/test/quantization/pt2e/test_numeric_debugger.py
+++ b/test/quantization/pt2e/test_numeric_debugger.py
@@ -24,6 +24,7 @@
     from torch.export import export_for_training
 
 
+@unittest.skip("skip for now, need to fix")
 @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_7, "Requires torch 2.7+")
 @unittest.skipIf(IS_WINDOWS, "Windows not yet supported for torch.compile")
 class TestNumericDebuggerInfra(PT2ENumericDebuggerTestCase):

From d506cc7831e2b7da5a44b4360cc3c94d8f3d4972 Mon Sep 17 00:00:00 2001
From: Jerry Zhang <jerryzh168@gmail.com>
Date: Mon, 23 Jun 2025 18:35:12 -0700
Subject: [PATCH 145/165] Revert "Build mxfp4 kernel for sm120a" (#2428)

Revert "Build mxfp4 kernel for sm120a (#2285)"

This reverts commit e73a142fa6d0561f40daa5a3c1a727bae3bd2202.
---
 benchmarks/float8/bench_matmul.py             |  60 ++----
 benchmarks/float8/utils.py                    |   9 +-
 setup.py                                      |  81 +++-----
 test/prototype/mx_formats/test_mx_mm.py       |   5 +-
 torchao/__init__.py                           |  13 --
 ...els_sm100a.cu => mx_fp_cutlass_kernels.cu} |   0
 .../mx_fp_cutlass_kernels_sm120a.cu           | 195 ------------------
 torchao/testing/float8/roofline_utils.py      |   7 -
 8 files changed, 50 insertions(+), 320 deletions(-)
 rename torchao/csrc/cuda/mx_kernels/{mx_fp_cutlass_kernels_sm100a.cu => mx_fp_cutlass_kernels.cu} (100%)
 delete mode 100644 torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels_sm120a.cu

diff --git a/benchmarks/float8/bench_matmul.py b/benchmarks/float8/bench_matmul.py
index d11c233ec0..e3f19d8f49 100644
--- a/benchmarks/float8/bench_matmul.py
+++ b/benchmarks/float8/bench_matmul.py
@@ -16,8 +16,6 @@
     get_name_to_shapes_iter,
 )
 
-from torchao.ops import mx_fp4_bf16
-from torchao.prototype.mx_formats.mx_tensor import to_mx
 from torchao.testing.float8.roofline_utils import get_specs
 
 
@@ -64,19 +62,13 @@ def run(
 ):
     device = "cuda"
     # TODO(future PR): this is ugly
-    assert recipe in ("tensorwise", "rowwise", "mxfp8_cublas", "mxfp4_cutlass"), (
-        "unsupported"
-    )
-    use_fp4 = recipe == "mxfp4_cutlass"
+    assert recipe in ("tensorwise", "rowwise", "mxfp8_cublas"), "unsupported"
 
     specs = get_specs()
     bf16_peak_tops = specs["bf16_peak_tops"]
     fp8_peak_tops = specs["fp8_peak_tops"]
-    fp4_peak_tops = specs["fp4_peak_tops"]
     print(f"gpu_name: {torch.cuda.get_device_name(0)}")
-    print(
-        f"peak tops: bf16 {bf16_peak_tops:.2e}, fp8 {fp8_peak_tops:.2e}, fp4 {fp4_peak_tops:.2e}"
-    )
+    print(f"peak tops: bf16 {bf16_peak_tops:.2e}, fp8 {fp8_peak_tops:.2e}")
 
     headers = (
         "fast_accum",
@@ -85,14 +77,14 @@ def run(
         "K",
         "N",
         "ref_time_s",
-        "time_s",
-        "speedup",
+        "fp8_time_s",
+        "fp8_speedup",
     )
     results = []
 
     dtype = torch.bfloat16
     name_to_shapes = get_name_to_shapes_iter(shape_gen_name, M, K, N)
-    fast_accum_vals = [False] if use_fp4 else [True, False]
+    fast_accum_vals = [True, False]
 
     for idx, (fast_accum, (name, (M, K, N))) in enumerate(
         itertools.product(fast_accum_vals, name_to_shapes)
@@ -115,53 +107,35 @@ def run(
 
         del A
 
-        A_hp = torch.randn(M, K, device=device)
-        B_hp_t = torch.randn(N, K, device=device)
-
-        if use_fp4:
-            _, A = to_mx(A_hp, torch.float4_e2m1fn_x2, 32)
-            _, Bt = to_mx(B_hp_t, torch.float4_e2m1fn_x2, 32)
-            B = Bt.contiguous().T
-            peak_tops = fp4_peak_tops
-        else:
-            # raw float8 matmul (upper bound for what we can achive in eager mode)
-            # TODO(future): add e5m2
-            d1, d2, d3 = torch.float8_e4m3fn, torch.float8_e4m3fn, dtype
-            A = A_hp.to(d1)
-            B = B_hp_t.to(d2).contiguous().T
-            peak_tops = fp8_peak_tops
-
+        # raw float8 matmul (upper bound for what we can achive in eager mode)
+        # TODO(future): add e5m2
+        d1, d2, d3 = torch.float8_e4m3fn, torch.float8_e4m3fn, dtype
+        A = torch.zeros(M, K, device=device, dtype=d1)
+        B = torch.zeros(K, N, device=device, dtype=d2).t().contiguous().t()
         if recipe == "tensorwise":
             scale_a = torch.tensor([1.0], device=device)
             scale_b = torch.tensor([1.0], device=device)
         elif recipe == "rowwise":
             scale_a = torch.ones(M, 1, device=device)
             scale_b = torch.ones(1, N, device=device)
-        elif recipe in ("mxfp8_cublas", "mxfp4_cutlass"):
+        elif recipe == "mxfp8_cublas":
             scale_a = torch.ones(M, K // 32, device=device, dtype=torch.float8_e8m0fnu)
             scale_b = torch.ones(N, K // 32, device=device, dtype=torch.float8_e8m0fnu)
         else:
             assert False, f"unknown recipe {recipe}"
 
-        def do_matmul_fp8(A, B):
+        def do_matmul(A, B):
             nonlocal scale_a
             nonlocal scale_b
             return torch._scaled_mm(
                 A, B, scale_a, scale_b, out_dtype=d3, use_fast_accum=fast_accum
             )
 
-        def do_matmul_mxfp4(A, B):
-            nonlocal scale_a
-            nonlocal scale_b
-            return mx_fp4_bf16(A, B, scale_a, scale_b)
-
-        do_matmul = do_matmul_mxfp4 if use_fp4 else do_matmul_fp8
-
-        time_sec, tops_sec, pct_top_peak = do_benchmarks(
-            tops, peak_tops, use_gpu_kernel_time, do_matmul, A, B
+        fp8_time_sec, fp8_tops_sec, fp8_pct_top_peak = do_benchmarks(
+            tops, fp8_peak_tops, use_gpu_kernel_time, do_matmul, A, B
         )
         print(
-            f"time_sec {time_sec:.2E}, tops/sec {tops_sec:.2E}, pct_peak {pct_top_peak:.3f}"
+            f"fp8 time_sec {fp8_time_sec:.2E}, tops/sec {fp8_tops_sec:.2E}, pct_peak {fp8_pct_top_peak:.3f}"
         )
 
         del A, B, scale_a, scale_b
@@ -174,8 +148,8 @@ def do_matmul_mxfp4(A, B):
                 K,
                 N,
                 ref_time_sec,
-                time_sec,
-                ref_time_sec / time_sec,
+                fp8_time_sec,
+                ref_time_sec / fp8_time_sec,
             ]
         )
 
diff --git a/benchmarks/float8/utils.py b/benchmarks/float8/utils.py
index 6c3051937d..0ee2b922fc 100644
--- a/benchmarks/float8/utils.py
+++ b/benchmarks/float8/utils.py
@@ -352,6 +352,9 @@ def get_gpu_kernel_gemm_time_s(f, *args, **kwargs):
     )
     # there is only 1 key, aten::mm or aten::_scaled_mm, with unit nanoseconds
     assert len(data) == 1
-    key, value = next(iter(data.items()))
-    assert key in ("aten::mm", "aten::_scaled_mm", "torchao::mx_fp4_bf16")
-    return value / 1e6 / n_iter
+    if "aten::mm" in data:
+        return data["aten::mm"] / 1e6 / n_iter
+    elif "aten::_scaled_mm" in data:
+        return data["aten::_scaled_mm"] / 1e6 / n_iter
+    else:
+        raise AssertionError("unexpected format of data")
diff --git a/setup.py b/setup.py
index 65590b3cff..5560ab877e 100644
--- a/setup.py
+++ b/setup.py
@@ -272,18 +272,15 @@ def get_cutlass_build_flags():
             raise ValueError("No CUDA version found")
 
         major, minor = map(int, cuda_version.split(".")[:2])
-        build_sm90a = (major, minor) >= (12, 6)
-        build_sm100a = (major, minor) >= (12, 8)
-        build_sm120a = (major, minor) >= (12, 8)
+        build_sm90a = major > 12 or (major == 12 and minor >= 6)
+        build_sm100a = major > 12 or (major == 12 and minor >= 8)
 
         if build_sm90a:
             print(f"CUDA {cuda_version}: Enabling SM90a CUTLASS kernels")
         if build_sm100a:
             print(f"CUDA {cuda_version}: Enabling SM100a CUTLASS kernels")
-        if build_sm120a:
-            print(f"CUDA {cuda_version}: Enabling SM120a CUTLASS kernels")
 
-        return build_sm90a, build_sm100a, build_sm120a
+        return build_sm90a, build_sm100a
     except:
         # Fallback to architecture flags
         cuda_arch_flags = _get_cuda_arch_flags()
@@ -343,11 +340,6 @@ def __init__(
         self.cmake_args = cmake_args
 
 
-def remove_items(a: list, b: list) -> list:
-    """Remove items in list b from list a"""
-    return [x for x in a if x not in b]
-
-
 def get_extensions():
     # Skip building C++ extensions if USE_CPP is set to "0"
     if use_cpp == "0":
@@ -462,7 +454,7 @@ def get_extensions():
         excluded_sources = list(
             glob.glob(os.path.join(extensions_dir, "cpu/*.cpp"), recursive=True)
         )
-        sources = remove_items(sources, excluded_sources)
+        sources = [s for s in sources if s not in excluded_sources]
 
     # Collect CUDA source files
     extensions_cuda_dir = os.path.join(extensions_dir, "cuda")
@@ -506,24 +498,22 @@ def get_extensions():
         rocm_sources = list(
             glob.glob(os.path.join(extensions_rocm_dir, "**/*.cpp"), recursive=True)
         )
-        sources = remove_items(sources, rocm_sources)
+        sources = [s for s in sources if s not in rocm_sources]
 
-    use_cutlass = use_cuda and not IS_WINDOWS
+    use_cutlass = False
     cutlass_90a_sources = None
     cutlass_100a_sources = None
-    cutlass_120a_sources = None
     build_for_sm90a = False
     build_for_sm100a = False
-    build_for_sm120a = False
-
-    if use_cutlass:
+    if use_cuda and not IS_WINDOWS:
+        use_cutlass = True
         cutlass_dir = os.path.join(third_party_path, "cutlass")
         cutlass_include_dir = os.path.join(cutlass_dir, "include")
         cutlass_tools_include_dir = os.path.join(
             cutlass_dir, "tools", "util", "include"
         )
         cutlass_extensions_include_dir = os.path.join(cwd, extensions_cuda_dir)
-
+    if use_cutlass:
         extra_compile_args["nvcc"].extend(
             [
                 "-DTORCHAO_USE_CUTLASS",
@@ -543,7 +533,7 @@ def get_extensions():
             ]
         )
 
-        build_for_sm90a, build_for_sm100a, build_for_sm120a = get_cutlass_build_flags()
+        build_for_sm90a, build_for_sm100a = get_cutlass_build_flags()
         # Define sm90a sources
         cutlass_90a_sources = [
             os.path.join(
@@ -567,40 +557,40 @@ def get_extensions():
                     "rowwise_scaled_linear_sparse_cutlass_" + dtypes + ".cu",
                 )
             )
-        sources = remove_items(sources, cutlass_90a_sources)
+        # Always remove sm90a sources from main sources
+        sources = [s for s in sources if s not in cutlass_90a_sources]
 
         # Always compile mx_fp_cutlass_kernels.cu ONLY with sm100a architecture
         cutlass_100a_sources = [
             os.path.join(
                 extensions_cuda_dir,
                 "mx_kernels",
-                "mx_fp_cutlass_kernels_sm100a.cu",
+                "mx_fp_cutlass_kernels.cu",
             ),
         ]
-        sources = remove_items(sources, cutlass_100a_sources)
-
-        # Always compile mx_fp_cutlass_kernels.cu ONLY with sm120a architecture
-        cutlass_120a_sources = [
-            os.path.join(
-                extensions_cuda_dir,
-                "mx_kernels",
-                "mx_fp_cutlass_kernels_sm120a.cu",
-            ),
+        # Remove from main sources to prevent compilation with other architectures
+        sources = [
+            s for s in sources if os.path.basename(s) != "mx_fp_cutlass_kernels.cu"
         ]
-        sources = remove_items(sources, cutlass_120a_sources)
 
     else:
-        # Remove CUTLASS-based kernels from the sources list.  An assumption is that
-        # these files will have "cutlass" in its name.
+        # Remove CUTLASS-based kernels from the sources list.  An
+        # assumption is that these files will have "cutlass" in its
+        # name.
         cutlass_sources = list(
             glob.glob(
                 os.path.join(extensions_cuda_dir, "**/*cutlass*.cu"), recursive=True
             )
         )
-        sources = remove_items(sources, cutlass_sources)
+        sources = [s for s in sources if s not in cutlass_sources]
 
     ext_modules = []
     if len(sources) > 0:
+        # Double-check to ensure mx_fp_cutlass_kernels.cu is not in sources
+        sources = [
+            s for s in sources if os.path.basename(s) != "mx_fp_cutlass_kernels.cu"
+        ]
+
         ext_modules.append(
             extension(
                 "torchao._C",
@@ -653,27 +643,6 @@ def get_extensions():
             )
         )
 
-    # Only build the cutlass_120a extension if sm120a is in the architecture flags
-    if (
-        cutlass_120a_sources is not None
-        and len(cutlass_120a_sources) > 0
-        and build_for_sm120a
-    ):
-        cutlass_120a_extra_compile_args = copy.deepcopy(extra_compile_args)
-        # Only use sm120a architecture for these sources, ignoring cuda_arch_flags
-        cutlass_120a_extra_compile_args["nvcc"].append(
-            "-gencode=arch=compute_120a,code=sm_120a"
-        )
-        ext_modules.append(
-            extension(
-                "torchao._C_cutlass_120a",
-                cutlass_120a_sources,
-                py_limited_api=True,
-                extra_compile_args=cutlass_120a_extra_compile_args,
-                extra_link_args=extra_link_args,
-            )
-        )
-
     # Build CMakeLists from /torchao/experimental - additional options become available : TORCHAO_BUILD_CPU_AARCH64, TORCHAO_BUILD_KLEIDIAI, TORCHAO_BUILD_MPS_OPS, TORCHAO_PARALLEL_BACKEND
     if build_macos_arm_auto or os.getenv("BUILD_TORCHAO_EXPERIMENTAL") == "1":
         build_options = BuildOptions()
diff --git a/test/prototype/mx_formats/test_mx_mm.py b/test/prototype/mx_formats/test_mx_mm.py
index bf383446cd..46380cfb55 100644
--- a/test/prototype/mx_formats/test_mx_mm.py
+++ b/test/prototype/mx_formats/test_mx_mm.py
@@ -14,7 +14,7 @@
 from torchao.prototype.mx_formats.utils import to_blocked
 from torchao.utils import (
     TORCH_VERSION_AT_LEAST_2_8,
-    is_sm_version,
+    is_sm_at_least_100,
 )
 
 if not TORCH_VERSION_AT_LEAST_2_8:
@@ -59,8 +59,7 @@ def run_matrix_test(M: int, K: int, N: int, format) -> float:
 
 @pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
 @pytest.mark.skipif(
-    not (is_sm_version(10, 0) or is_sm_version(12, 0)),
-    reason="CUDA capability 10.0 or 12.0 is required for mxfloat8",
+    not is_sm_at_least_100(), reason="CUDA capability >= 10.0 required for mxfloat8"
 )
 @pytest.mark.parametrize(
     "size",
diff --git a/torchao/__init__.py b/torchao/__init__.py
index 2d40be2ac4..e6e291309f 100644
--- a/torchao/__init__.py
+++ b/torchao/__init__.py
@@ -25,21 +25,8 @@
 
     so_files = list(Path(__file__).parent.glob("_C*.so"))
     if len(so_files) > 0:
-        compute_capability = (
-            torch.cuda.get_device_capability() if torch.cuda.is_available() else None
-        )
-
         for file in so_files:
-            # only load architecture-specific target if the current GPU matches that target
-            if (
-                ("cutlass_90a" in file.name and compute_capability != (9, 0))
-                or ("cutlass_100a" in file.name and compute_capability != (10, 0))
-                or ("cutlass_120a" in file.name and compute_capability != (12, 0))
-            ):
-                continue
-
             torch.ops.load_library(str(file))
-
         from . import ops
 
     # The following library contains CPU kernels from torchao/experimental
diff --git a/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels_sm100a.cu b/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels.cu
similarity index 100%
rename from torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels_sm100a.cu
rename to torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels.cu
diff --git a/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels_sm120a.cu b/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels_sm120a.cu
deleted file mode 100644
index 0436124cbb..0000000000
--- a/torchao/csrc/cuda/mx_kernels/mx_fp_cutlass_kernels_sm120a.cu
+++ /dev/null
@@ -1,195 +0,0 @@
-// Copyright (c) Meta Platforms, Inc. and affiliates.
-// All rights reserved.
-//
-// This source code is licensed under the BSD 3-Clause license found in the
-// LICENSE file in the root directory of this source tree.
-
-#include <torch/library.h>
-
-#include <ATen/ATen.h>
-#include <ATen/core/Tensor.h>
-#include <ATen/cuda/CUDAUtils.h>
-#include <c10/util/Exception.h>
-#include <ATen/cuda/CUDAContext.h>
-#include <c10/cuda/CUDAException.h>
-
-#if defined(TORCHAO_USE_CUTLASS) && !defined(_WIN32) &&                   \
-    defined(CUDA_VERSION) && (CUDA_VERSION >= 12080)
-#define BUILD_MX_KERNELS_CUTLASS
-#endif
-
-#if defined(BUILD_MX_KERNELS_CUTLASS)
-
-#include "cute/tensor.hpp"
-#include "cutlass/detail/sm100_blockscaled_layout.hpp"
-#include "cutlass/epilogue/collective/collective_builder.hpp"
-#include "cutlass/epilogue/thread/linear_combination.h"
-#include "cutlass/gemm/collective/collective_builder.hpp"
-#include "cutlass/gemm/device/gemm_universal_adapter.h"
-#include "cutlass/util/packed_stride.hpp"
-
-
-#endif
-
-namespace torchao {
-
-#if defined(BUILD_MX_KERNELS_CUTLASS)
-namespace {
-
-using namespace cute;
-
-void run_gemm(at::Tensor& a, at::Tensor& b, at::Tensor& a_scale,
-             at::Tensor& b_scale, at::Tensor& out, int M, int K, int N) {
-
-  using MmaTileShape        = Shape<_128,_128,_128>;
-  using ClusterShape        = Shape<_1,_1,_1>;
-  using PerSmTileShape_MNK  = Shape<_128,_128,_128>;
-
-  // A matrix configuration
-  using         ElementA    = cutlass::mx_float4_t<cutlass::float_e2m1_t>;
-  using         LayoutATag  = cutlass::layout::RowMajor;                      // Layout type for A matrix operand
-  constexpr int AlignmentA  = 32;    // Memory access granularity/alignment of A matrix in units of elements (up to 16 bytes)
-
-  // B matrix configuration
-  using         ElementB    = cutlass::mx_float4_t<cutlass::float_e2m1_t>;
-  using         LayoutBTag  = cutlass::layout::ColumnMajor;                   // Layout type for B matrix operand
-  constexpr int AlignmentB  = 32;    // Memory access granularity/alignment of B matrix in units of elements (up to 16 bytes)
-
-  // C/D matrix configuration
-  using         ElementC    = cutlass::bfloat16_t;                            // Element type for C matrix operand
-  using         ElementD    = cutlass::bfloat16_t;
-  using         LayoutCTag  = cutlass::layout::RowMajor;                      // Layout type for C matrix operand
-  using         LayoutDTag  = cutlass::layout::RowMajor;                      // Layout type for D matrix operand
-  constexpr int AlignmentD  = 128 / cutlass::sizeof_bits<ElementD>::value;    // Memory access granularity/alignment of D matrix in units of elements (up to 16 bytes)
-  constexpr int AlignmentC  = 128 / cutlass::sizeof_bits<ElementC>::value;    // Memory access granularity/alignment of C matrix in units of elements (up to 16 bytes)
-  // Kernel functional config
-  using ElementAccumulator  = float;                                          // Element type for internal accumulation
-  using ArchTag             = cutlass::arch::Sm120;                           // Tag indicating the minimum SM that supports the intended feature
-  using OperatorClass       = cutlass::arch::OpClassBlockScaledTensorOp;      // Operator class tag
-
-  using CollectiveEpilogue = typename cutlass::epilogue::collective::CollectiveBuilder<
-      ArchTag, OperatorClass,
-      PerSmTileShape_MNK, ClusterShape,
-      cutlass::epilogue::collective::EpilogueTileAuto,
-      ElementAccumulator, ElementAccumulator,
-      ElementC, LayoutCTag, AlignmentC,
-      ElementD, LayoutDTag, AlignmentD,
-      cutlass::epilogue::collective::EpilogueScheduleAuto                      // Epilogue schedule policy
-    >::CollectiveOp;
-
-  using CollectiveMainloop = typename cutlass::gemm::collective::CollectiveBuilder<
-      ArchTag, OperatorClass,
-      ElementA, LayoutATag, AlignmentA,
-      ElementB, LayoutBTag, AlignmentB,
-      ElementAccumulator,
-      MmaTileShape, ClusterShape,
-      cutlass::gemm::collective::StageCountAutoCarveout<static_cast<int>(sizeof(typename CollectiveEpilogue::SharedStorage))>,
-      cutlass::gemm::collective::KernelScheduleAuto                             // Kernel schedule policy. Auto or using targeted scheduling policy
-    >::CollectiveOp;
-
-  using GemmKernel = cutlass::gemm::kernel::GemmUniversal<
-      Shape<int,int,int,int>,                                                   // Indicates ProblemShape
-      CollectiveMainloop,
-      CollectiveEpilogue,
-      void>;
-
-  using Gemm = cutlass::gemm::device::GemmUniversalAdapter<GemmKernel>;
-
-  // Reference device GEMM implementation type
-  using StrideA   = typename Gemm::GemmKernel::StrideA;
-  using StrideB   = typename Gemm::GemmKernel::StrideB;
-  using StrideC   = typename Gemm::GemmKernel::StrideC;
-  using StrideD   = typename Gemm::GemmKernel::StrideD;
-  using LayoutSFA = typename Gemm::GemmKernel::CollectiveMainloop::LayoutSFA;
-  using LayoutSFB = typename Gemm::GemmKernel::CollectiveMainloop::LayoutSFB;
-  using Sm1xxBlkScaledConfig = typename Gemm::GemmKernel::CollectiveMainloop::Sm1xxBlkScaledConfig;
-
-  // Initialize strides using packed stride configuration
-  auto stride_A = cutlass::make_cute_packed_stride(StrideA{}, make_shape(M, K, 1));
-  auto stride_B = cutlass::make_cute_packed_stride(StrideB{}, make_shape(N, K, 1));
-  auto stride_D = cutlass::make_cute_packed_stride(StrideD{}, make_shape(M, N, 1));
-
-  // Initialize scale factor layouts using block scaled configuration
-  auto layout_SFA = Sm1xxBlkScaledConfig::tile_atom_to_shape_SFA(make_shape(M, N, K, 1));
-  auto layout_SFB = Sm1xxBlkScaledConfig::tile_atom_to_shape_SFB(make_shape(M, N, K, 1));
-
-  using DtypeA = typename ElementA::DataType;
-  using DtypeB = typename ElementB::DataType;
-  using DtypeScaleA = typename ElementA::ScaleFactorType;
-  using DtypeScaleB = typename ElementB::ScaleFactorType;
-  using DtypeOut = ElementD;
-
-  Gemm gemm;
-
-  auto A_ptr = reinterpret_cast<DtypeA*>(a.data_ptr());
-  auto B_ptr = reinterpret_cast<DtypeB*>(b.data_ptr());
-  auto SFA_ptr = reinterpret_cast<DtypeScaleA*>(a_scale.data_ptr());
-  auto SFB_ptr = reinterpret_cast<DtypeScaleB*>(b_scale.data_ptr());
-  auto out_ptr = reinterpret_cast<DtypeOut*>(out.data_ptr());
-
-  typename Gemm::Arguments arguments{
-    cutlass::gemm::GemmUniversalMode::kGemm,
-    {M, N, K, 1},
-    { // Mainloop arguments
-      A_ptr, stride_A,
-      B_ptr, stride_B,
-      SFA_ptr, layout_SFA,
-      SFB_ptr, layout_SFB
-    },
-    { // Epilogue arguments
-      {1.0, 0.0},
-      nullptr, StrideC{},  // No bias for now
-      out_ptr, stride_D
-    }
-  };
-
-  // Check the problem size is supported or not
-  cutlass::Status status = gemm.can_implement(arguments);
-  TORCH_CHECK(status == cutlass::Status::kSuccess, "Cutlass cannot implement");
-  // Allocate workspace memory
-  size_t workspace_size = Gemm::get_workspace_size(arguments);
-  auto workspace = a.new_empty(
-      {static_cast<int64_t>(workspace_size)},
-      at::TensorOptions().dtype(at::kByte));
-
-  // Initialize CUTLASS kernel with arguments and workspace pointer
-  status = gemm.initialize(arguments, workspace.data_ptr());
-  TORCH_CHECK(status == cutlass::Status::kSuccess, "Cutlass cannot initialize");
-
-  status = gemm.run(at::cuda::getCurrentCUDAStream());
-  TORCH_CHECK(status == cutlass::Status::kSuccess, "Cutlass cannot run", cutlass::cutlassGetStatusString(status));
-
-  C10_CUDA_KERNEL_LAUNCH_CHECK();
-
-}
-}
-#endif
-
-at::Tensor mx_fp4_bf16(at::Tensor a, at::Tensor b, at::Tensor a_scale,
-                       at::Tensor b_scale) {
-#if defined(BUILD_MX_KERNELS_CUTLASS)
-  TORCH_CHECK(a.is_cuda(), "a must be CUDA tensor");
-  TORCH_CHECK(b.is_cuda(), "b must be CUDA tensor");
-  TORCH_CHECK(a_scale.is_cuda(), "a_scale must be CUDA tensor");
-  TORCH_CHECK(b_scale.is_cuda(), "b_scale must be CUDA tensor");
-
-  auto M = a.size(0);
-  auto K = a.size(1) * 2;
-  auto N = b.size(1);
-
-  auto out =
-      at::empty({M, N}, a.options().dtype(at::kBFloat16));
-
-  run_gemm(a, b, a_scale, b_scale, out, M, K, N);
-  return out;
-#else
-  TORCH_CHECK_NOT_IMPLEMENTED(false, __func__);
-  return at::Tensor{};
-#endif
-}
-
-TORCH_LIBRARY_IMPL(torchao, CUDA, m) {
-  m.impl("torchao::mx_fp4_bf16", &mx_fp4_bf16);
-}
-
-} // namespace torchao
diff --git a/torchao/testing/float8/roofline_utils.py b/torchao/testing/float8/roofline_utils.py
index 286803dbf2..7bfb9887df 100644
--- a/torchao/testing/float8/roofline_utils.py
+++ b/torchao/testing/float8/roofline_utils.py
@@ -54,13 +54,6 @@
         # TODO(future): run measurement on hardware
         "pct_achievable_mem_bw": 0.92,
     },
-    "NVIDIA GeForce RTX 5090": {
-        # https://images.nvidia.com/aem-dam/Solutions/geforce/blackwell/nvidia-rtx-blackwell-gpu-architecture.pdf
-        "bf16_peak_tops": 209.5e12,
-        "fp8_peak_tops": 419e12,
-        "fp4_peak_tops": 1676e12,
-        "peak_mem_bw_bytes_sec": 1.792e15,
-    },
     # TODO(future): more GPU names
 }
 

From 8b051b49dd2931d4518b6bb6d8ea4f5d3704aeca Mon Sep 17 00:00:00 2001
From: Vasiliy Kuznetsov <vkuzo@users.noreply.github.com>
Date: Tue, 24 Jun 2025 10:16:36 -0400
Subject: [PATCH 146/165] fix float8 training TP+SP integration tests (#2414)

Update

[ghstack-poisoned]
---
 test/float8/test_dtensor.py  | 2 ++
 test/float8/test_fsdp2_tp.py | 2 ++
 2 files changed, 4 insertions(+)

diff --git a/test/float8/test_dtensor.py b/test/float8/test_dtensor.py
index 9db046b749..a9ccb35b79 100644
--- a/test/float8/test_dtensor.py
+++ b/test/float8/test_dtensor.py
@@ -67,6 +67,8 @@ def setup_distributed():
     device_mesh = init_device_mesh("cuda", (world_size,))
     # seed must be the same in all processes
     torch.manual_seed(1)
+    local_rank = torch.distributed.get_rank()
+    torch.cuda.set_device(local_rank)
     return device_mesh
 
 
diff --git a/test/float8/test_fsdp2_tp.py b/test/float8/test_fsdp2_tp.py
index fa3d30410b..f04b791273 100644
--- a/test/float8/test_fsdp2_tp.py
+++ b/test/float8/test_fsdp2_tp.py
@@ -46,6 +46,8 @@ def setup_distributed():
     )
     # seed must be the same in all processes
     torch.manual_seed(1)
+    local_rank = torch.distributed.get_rank()
+    torch.cuda.set_device(local_rank)
     return device_mesh
 
 
From 1a701e6d3f9cc50acb829f73aa645b01fd7bdbb1 Mon Sep 17 00:00:00 2001
From: Vasiliy Kuznetsov <vkuzo@users.noreply.github.com>
Date: Tue, 24 Jun 2025 10:17:34 -0400
Subject: [PATCH 147/165] rename `torchao.testing.float8` to
 `torchao.testing.training` (#2415)

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]
---
 benchmarks/float8/bench_matmul.py                      | 2 +-
 benchmarks/float8/float8_roofline.py                   | 2 +-
 test/float8/test_base.py                               | 2 +-
 test/float8/test_compile.py                            | 2 +-
 test/float8/test_dtensor.py                            | 2 +-
 test/float8/test_fsdp2/test_fsdp2.py                   | 5 ++++-
 test/float8/test_fsdp2_tp.py                           | 2 +-
 test/float8/test_numerics_integration.py               | 2 +-
 torchao/testing/{float8 => training}/__init__.py       | 0
 torchao/testing/{float8 => training}/dtensor_utils.py  | 0
 torchao/testing/{float8 => training}/fsdp2_utils.py    | 0
 torchao/testing/{float8 => training}/roofline_utils.py | 0
 torchao/testing/{float8 => training}/test_utils.py     | 0
 13 files changed, 11 insertions(+), 8 deletions(-)
 rename torchao/testing/{float8 => training}/__init__.py (100%)
 rename torchao/testing/{float8 => training}/dtensor_utils.py (100%)
 rename torchao/testing/{float8 => training}/fsdp2_utils.py (100%)
 rename torchao/testing/{float8 => training}/roofline_utils.py (100%)
 rename torchao/testing/{float8 => training}/test_utils.py (100%)

diff --git a/benchmarks/float8/bench_matmul.py b/benchmarks/float8/bench_matmul.py
index e3f19d8f49..cf844fa51b 100644
--- a/benchmarks/float8/bench_matmul.py
+++ b/benchmarks/float8/bench_matmul.py
@@ -16,7 +16,7 @@
     get_name_to_shapes_iter,
 )
 
-from torchao.testing.float8.roofline_utils import get_specs
+from torchao.testing.training.roofline_utils import get_specs
 
 
 def benchmark_fn_in_sec(f, *args, **kwargs):
diff --git a/benchmarks/float8/float8_roofline.py b/benchmarks/float8/float8_roofline.py
index f9374f835e..5a8419cde8 100644
--- a/benchmarks/float8/float8_roofline.py
+++ b/benchmarks/float8/float8_roofline.py
@@ -63,7 +63,7 @@
 )
 from torchao.prototype.mx_formats import MXLinearConfig
 from torchao.quantization import quantize_
-from torchao.testing.float8.roofline_utils import (
+from torchao.testing.training.roofline_utils import (
     get_float8_mem_sympy,
     get_gemm_time_sympy,
 )
diff --git a/test/float8/test_base.py b/test/float8/test_base.py
index 8e3efeab60..15099dc2c1 100644
--- a/test/float8/test_base.py
+++ b/test/float8/test_base.py
@@ -55,7 +55,7 @@
     fp8_tensor_statistics,
     tensor_to_scale,
 )
-from torchao.testing.float8.test_utils import get_test_float8_linear_config
+from torchao.testing.training.test_utils import get_test_float8_linear_config
 from torchao.utils import is_MI300, is_ROCM
 
 random.seed(0)
diff --git a/test/float8/test_compile.py b/test/float8/test_compile.py
index ac5d1f8d96..aaf9d3d3f5 100644
--- a/test/float8/test_compile.py
+++ b/test/float8/test_compile.py
@@ -37,7 +37,7 @@
     hp_tensor_to_float8_dynamic,
 )
 from torchao.float8.float8_tensor import GemmInputRole, LinearMMConfig, ScaledMMConfig
-from torchao.testing.float8.test_utils import get_test_float8_linear_config
+from torchao.testing.training.test_utils import get_test_float8_linear_config
 
 
 def _test_compile_base(
diff --git a/test/float8/test_dtensor.py b/test/float8/test_dtensor.py
index a9ccb35b79..e7220bff9f 100644
--- a/test/float8/test_dtensor.py
+++ b/test/float8/test_dtensor.py
@@ -57,7 +57,7 @@
 )
 from torchao.float8.float8_utils import tensor_to_scale
 from torchao.float8.fsdp_utils import WeightWithDynamicFloat8CastTensor
-from torchao.testing.float8.dtensor_utils import ToyModel
+from torchao.testing.training.dtensor_utils import ToyModel
 
 torch.set_float32_matmul_precision("high")
 
diff --git a/test/float8/test_fsdp2/test_fsdp2.py b/test/float8/test_fsdp2/test_fsdp2.py
index 6f0cfecf41..b4c7f9fd15 100644
--- a/test/float8/test_fsdp2/test_fsdp2.py
+++ b/test/float8/test_fsdp2/test_fsdp2.py
@@ -43,7 +43,10 @@
 from torchao.float8.float8_scaling_utils import hp_tensor_to_float8_dynamic
 from torchao.float8.float8_tensor import GemmInputRole
 from torchao.float8.fsdp_utils import WeightWithDynamicFloat8CastTensor
-from torchao.testing.float8.fsdp2_utils import check_parity_bf16_mp, check_parity_no_mp
+from torchao.testing.training.fsdp2_utils import (
+    check_parity_bf16_mp,
+    check_parity_no_mp,
+)
 
 if not is_sm_at_least_89():
     pytest.skip("Unsupported CUDA device capability version", allow_module_level=True)
diff --git a/test/float8/test_fsdp2_tp.py b/test/float8/test_fsdp2_tp.py
index f04b791273..93c7735149 100644
--- a/test/float8/test_fsdp2_tp.py
+++ b/test/float8/test_fsdp2_tp.py
@@ -32,7 +32,7 @@
     Float8ColwiseParallel,
     Float8RowwiseParallel,
 )
-from torchao.testing.float8.dtensor_utils import ToyModel
+from torchao.testing.training.dtensor_utils import ToyModel
 
 
 def setup_distributed():
diff --git a/test/float8/test_numerics_integration.py b/test/float8/test_numerics_integration.py
index f25c876189..db02444109 100644
--- a/test/float8/test_numerics_integration.py
+++ b/test/float8/test_numerics_integration.py
@@ -33,7 +33,7 @@
     convert_to_float8_training,
 )
 from torchao.float8.float8_utils import IS_ROCM, compute_error
-from torchao.testing.float8.test_utils import get_test_float8_linear_config
+from torchao.testing.training.test_utils import get_test_float8_linear_config
 
 torch.manual_seed(0)
 
diff --git a/torchao/testing/float8/__init__.py b/torchao/testing/training/__init__.py
similarity index 100%
rename from torchao/testing/float8/__init__.py
rename to torchao/testing/training/__init__.py
diff --git a/torchao/testing/float8/dtensor_utils.py b/torchao/testing/training/dtensor_utils.py
similarity index 100%
rename from torchao/testing/float8/dtensor_utils.py
rename to torchao/testing/training/dtensor_utils.py
diff --git a/torchao/testing/float8/fsdp2_utils.py b/torchao/testing/training/fsdp2_utils.py
similarity index 100%
rename from torchao/testing/float8/fsdp2_utils.py
rename to torchao/testing/training/fsdp2_utils.py
diff --git a/torchao/testing/float8/roofline_utils.py b/torchao/testing/training/roofline_utils.py
similarity index 100%
rename from torchao/testing/float8/roofline_utils.py
rename to torchao/testing/training/roofline_utils.py
diff --git a/torchao/testing/float8/test_utils.py b/torchao/testing/training/test_utils.py
similarity index 100%
rename from torchao/testing/float8/test_utils.py
rename to torchao/testing/training/test_utils.py

From b96354087db6d0480ebbc10d5a63a9ca49c19dfa Mon Sep 17 00:00:00 2001
From: Vasiliy Kuznetsov <vkuzo@users.noreply.github.com>
Date: Tue, 24 Jun 2025 10:19:02 -0400
Subject: [PATCH 148/165] make dtensor shared test util more generic (#2416)

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]
---
 test/float8/test_dtensor.py               | 160 ++++------------------
 torchao/testing/training/dtensor_utils.py | 138 +++++++++++++++++++
 2 files changed, 161 insertions(+), 137 deletions(-)

diff --git a/test/float8/test_dtensor.py b/test/float8/test_dtensor.py
index e7220bff9f..5509eb1cc2 100644
--- a/test/float8/test_dtensor.py
+++ b/test/float8/test_dtensor.py
@@ -10,7 +10,6 @@
 TODO(future): make this run in CI
 """
 
-import copy
 import os
 
 import pytest
@@ -23,12 +22,6 @@
 
 from torch.distributed._tensor import DTensor, Replicate, Shard, distribute_tensor
 from torch.distributed.device_mesh import DeviceMesh, init_device_mesh
-from torch.distributed.tensor.parallel import (
-    ColwiseParallel,
-    PrepareModuleInput,
-    RowwiseParallel,
-    parallelize_module,
-)
 from torch.testing._internal.distributed._tensor.common_dtensor import (
     ModelArgs,
     Transformer,
@@ -50,14 +43,11 @@
     LinearMMConfig,
     hp_tensor_and_scale_to_float8,
 )
-from torchao.float8.float8_tensor_parallel import (
-    Float8ColwiseParallel,
-    Float8RowwiseParallel,
-    PrepareFloat8ModuleInput,
-)
 from torchao.float8.float8_utils import tensor_to_scale
 from torchao.float8.fsdp_utils import WeightWithDynamicFloat8CastTensor
-from torchao.testing.training.dtensor_utils import ToyModel
+from torchao.testing.training.dtensor_utils import (
+    _test_lowp_mlp_tensor_parallelism_base,
+)
 
 torch.set_float32_matmul_precision("high")
 
@@ -193,140 +183,36 @@ def _test_dtensor_fp8_autograd(mesh: DeviceMesh, size=16):
     loss.backward()
 
 
-def _test_fp8_mlp_tensor_parallelism_base(
-    mesh: DeviceMesh, size=16, compile: bool = False, rowwise: bool = False
-):
-    device = mesh.device_type
-
-    if rowwise:
-        config = Float8LinearConfig.from_recipe_name(Float8LinearRecipeName.ROWWISE)
-        # hack around config being frozen
-        # TODO(future PR): we should make this nicer at the config level
-        object.__setattr__(config, "emulate", True)
-    else:
-        config = Float8LinearConfig(emulate=True)
-
-    toy_model = ToyModel().to(device)
-    toy_model_fp8 = convert_to_float8_training(toy_model, config=config)
-
-    tp_model = copy.deepcopy(toy_model)
-    tp_model = convert_to_float8_training(tp_model, config=config)
-    sp_model = copy.deepcopy(toy_model)
-    sp_model = convert_to_float8_training(sp_model, config=config)
-
-    # For tensorwise scaling, enable float8 all_gather.
-    # For rowwise scaling, keep high precision all_gather. Motivation for
-    # not doing float8 all-gather for rowwise: tensors need to be scaled both ways,
-    # so for float8 all-gather we'd need to send two float8 copies per tensor,
-    # which is similar # bytes over the wire than just doing bfloat16 all-gather.
-    if rowwise:
-        colwise_parallel_cls = ColwiseParallel
-        rowwise_parallel_cls = RowwiseParallel
-        prepare_input_cls = PrepareModuleInput
-    else:
-        colwise_parallel_cls = Float8ColwiseParallel
-        rowwise_parallel_cls = Float8RowwiseParallel
-        prepare_input_cls = PrepareFloat8ModuleInput
-
-    # vanilla TP
-    tp_model = parallelize_module(
-        tp_model,
-        mesh,
-        {
-            "ffn.w1": colwise_parallel_cls(),
-            "ffn.w2": colwise_parallel_cls(),
-            "ffn.out_proj": rowwise_parallel_cls(),
-        },
+def _test_fp8_mlp_tensor_parallelism_eager(mesh: DeviceMesh, size=16):
+    tensorwise_config = Float8LinearConfig(emulate=True)
+    _test_lowp_mlp_tensor_parallelism_base(
+        mesh, tensorwise_config, size, compile=False, allgather_in_lowp=True
     )
 
-    # "sequence parallel" mlp computation
-    sp_model = parallelize_module(
-        sp_model,
-        mesh,
-        {
-            "ffn": prepare_input_cls(
-                input_layouts=Shard(1), desired_input_layouts=Replicate()
-            ),
-            "ffn.w1": colwise_parallel_cls(),
-            "ffn.w2": colwise_parallel_cls(),
-            "ffn.out_proj": rowwise_parallel_cls(
-                output_layouts=Shard(1), use_local_output=False
-            ),
-        },
+    rowwise_config = Float8LinearConfig.from_recipe_name(Float8LinearRecipeName.ROWWISE)
+    # hack around config being frozen
+    # TODO(future PR): we should make this nicer at the config level
+    object.__setattr__(rowwise_config, "emulate", True)
+    _test_lowp_mlp_tensor_parallelism_base(
+        mesh, rowwise_config, size, compile=False, allgather_in_lowp=False
     )
 
-    # prepare_input_cls with specific submodule fqn
-    sp_model2 = copy.deepcopy(toy_model)
-    sp_model2 = convert_to_float8_training(sp_model2, config=config)
 
-    if rowwise:
-        prepare_input = prepare_input_cls(
-            input_layouts=Shard(1),
-            desired_input_layouts=Replicate(),
-        )
-    else:
-        prepare_input = prepare_input_cls(
-            input_layouts=Shard(1),
-            desired_input_layouts=Replicate(),
-            fwd_config_submodule_fqn="w2",
-        )
-
-    sp_model2 = parallelize_module(
-        sp_model2,
-        mesh,
-        {
-            "ffn": prepare_input,
-            "ffn.w1": colwise_parallel_cls(),
-            "ffn.w2": colwise_parallel_cls(),
-            "ffn.out_proj": rowwise_parallel_cls(
-                output_layouts=Shard(1), use_local_output=False
-            ),
-        },
-    )
-
-    if compile:
-        tp_model = torch.compile(tp_model)
-        sp_model = torch.compile(sp_model)
-        sp_model2 = torch.compile(sp_model2)
-
-    x_fp32 = torch.rand(size, size * 2, size, device=device, requires_grad=False)
-    x_fp32_tp_input = x_fp32.clone()
-    x_fp32_sp_input = distribute_tensor(x_fp32.clone(), mesh, [Shard(0)])
-
-    tp_out = tp_model(x_fp32_tp_input)
-    tp_out.sum().backward()
-    sp_out = sp_model(x_fp32_sp_input)
-    sp_out.sum().backward()
-    global_out = toy_model_fp8(x_fp32)
-    global_out.sum().backward()
-    torch.testing.assert_close(tp_out, global_out)
-    torch.testing.assert_close(sp_out.full_tensor(), global_out)
-    torch.testing.assert_close(tp_model.ffn.w1.weight.grad, sp_model.ffn.w1.weight.grad)
-    torch.testing.assert_close(
-        tp_model.ffn.out_proj.weight.grad, sp_model.ffn.out_proj.weight.grad
+def _test_fp8_mlp_tensor_parallelism_compile(mesh: DeviceMesh, size=16):
+    tensorwise_config = Float8LinearConfig(emulate=True)
+    _test_lowp_mlp_tensor_parallelism_base(
+        mesh, tensorwise_config, size, compile=True, allgather_in_lowp=True
     )
 
-    sp_out2 = sp_model2(x_fp32_sp_input)
-    sp_out2.sum().backward()
-    torch.testing.assert_close(sp_out2.full_tensor(), global_out)
-    torch.testing.assert_close(
-        tp_model.ffn.w1.weight.grad, sp_model2.ffn.w1.weight.grad
-    )
-    torch.testing.assert_close(
-        tp_model.ffn.out_proj.weight.grad, sp_model2.ffn.out_proj.weight.grad
+    rowwise_config = Float8LinearConfig.from_recipe_name(Float8LinearRecipeName.ROWWISE)
+    # hack around config being frozen
+    # TODO(future PR): we should make this nicer at the config level
+    object.__setattr__(rowwise_config, "emulate", True)
+    _test_lowp_mlp_tensor_parallelism_base(
+        mesh, rowwise_config, size, compile=True, allgather_in_lowp=False
     )
 
 
-def _test_fp8_mlp_tensor_parallelism_eager(mesh: DeviceMesh, size=16):
-    _test_fp8_mlp_tensor_parallelism_base(mesh, size, compile=False, rowwise=False)
-    _test_fp8_mlp_tensor_parallelism_base(mesh, size, compile=False, rowwise=True)
-
-
-def _test_fp8_mlp_tensor_parallelism_compile(mesh: DeviceMesh, size=16):
-    _test_fp8_mlp_tensor_parallelism_base(mesh, size, compile=True, rowwise=False)
-    _test_fp8_mlp_tensor_parallelism_base(mesh, size, compile=True, rowwise=True)
-
-
 def _test_distribute_fsdp_tensor_subclass(tp_mesh: DeviceMesh):
     torch.manual_seed(42)
     model = Transformer(ModelArgs(dropout_p=0.0, weight_tying=False)).cuda()
diff --git a/torchao/testing/training/dtensor_utils.py b/torchao/testing/training/dtensor_utils.py
index 84e4095263..7ac0360363 100644
--- a/torchao/testing/training/dtensor_utils.py
+++ b/torchao/testing/training/dtensor_utils.py
@@ -3,9 +3,27 @@
 #
 # This source code is licensed under the BSD 3-Clause license found in the
 # LICENSE file in the root directory of this source tree.
+import copy
 
+import torch
 import torch.nn as nn
 import torch.nn.functional as F
+from torch.distributed._tensor import Replicate, Shard, distribute_tensor
+from torch.distributed.device_mesh import DeviceMesh
+from torch.distributed.tensor.parallel import (
+    ColwiseParallel,
+    PrepareModuleInput,
+    RowwiseParallel,
+    parallelize_module,
+)
+
+from torchao.float8 import Float8LinearConfig
+from torchao.float8.float8_linear_utils import convert_to_float8_training
+from torchao.float8.float8_tensor_parallel import (
+    Float8ColwiseParallel,
+    Float8RowwiseParallel,
+    PrepareFloat8ModuleInput,
+)
 
 
 class FeedForward(nn.Module):
@@ -28,3 +46,123 @@ def __init__(self):
 
     def forward(self, x):
         return self.ffn(x)
+
+
+def _test_lowp_mlp_tensor_parallelism_base(
+    mesh: DeviceMesh,
+    config: Float8LinearConfig,
+    size=16,
+    compile: bool = False,
+    allgather_in_lowp: bool = False,
+):
+    device = mesh.device_type
+
+    toy_model = ToyModel().to(device)
+    toy_model_fp8 = convert_to_float8_training(toy_model, config=config)
+
+    tp_model = copy.deepcopy(toy_model)
+    tp_model = convert_to_float8_training(tp_model, config=config)
+    sp_model = copy.deepcopy(toy_model)
+    sp_model = convert_to_float8_training(sp_model, config=config)
+
+    # For tensorwise scaling, enable float8 all_gather.
+    # For rowwise scaling, keep high precision all_gather. Motivation for
+    # not doing float8 all-gather for rowwise: tensors need to be scaled both ways,
+    # so for float8 all-gather we'd need to send two float8 copies per tensor,
+    # which is similar # bytes over the wire than just doing bfloat16 all-gather.
+    if not allgather_in_lowp:
+        colwise_parallel_cls = ColwiseParallel
+        rowwise_parallel_cls = RowwiseParallel
+        prepare_input_cls = PrepareModuleInput
+    else:
+        colwise_parallel_cls = Float8ColwiseParallel
+        rowwise_parallel_cls = Float8RowwiseParallel
+        prepare_input_cls = PrepareFloat8ModuleInput
+
+    # vanilla TP
+    tp_model = parallelize_module(
+        tp_model,
+        mesh,
+        {
+            "ffn.w1": colwise_parallel_cls(),
+            "ffn.w2": colwise_parallel_cls(),
+            "ffn.out_proj": rowwise_parallel_cls(),
+        },
+    )
+
+    # "sequence parallel" mlp computation
+    sp_model = parallelize_module(
+        sp_model,
+        mesh,
+        {
+            "ffn": prepare_input_cls(
+                input_layouts=Shard(1), desired_input_layouts=Replicate()
+            ),
+            "ffn.w1": colwise_parallel_cls(),
+            "ffn.w2": colwise_parallel_cls(),
+            "ffn.out_proj": rowwise_parallel_cls(
+                output_layouts=Shard(1), use_local_output=False
+            ),
+        },
+    )
+
+    # prepare_input_cls with specific submodule fqn
+    sp_model2 = copy.deepcopy(toy_model)
+    sp_model2 = convert_to_float8_training(sp_model2, config=config)
+
+    if not allgather_in_lowp:
+        prepare_input = prepare_input_cls(
+            input_layouts=Shard(1),
+            desired_input_layouts=Replicate(),
+        )
+    else:
+        prepare_input = prepare_input_cls(
+            input_layouts=Shard(1),
+            desired_input_layouts=Replicate(),
+            fwd_config_submodule_fqn="w2",
+        )
+
+    sp_model2 = parallelize_module(
+        sp_model2,
+        mesh,
+        {
+            "ffn": prepare_input,
+            "ffn.w1": colwise_parallel_cls(),
+            "ffn.w2": colwise_parallel_cls(),
+            "ffn.out_proj": rowwise_parallel_cls(
+                output_layouts=Shard(1), use_local_output=False
+            ),
+        },
+    )
+
+    if compile:
+        tp_model = torch.compile(tp_model)
+        sp_model = torch.compile(sp_model)
+        sp_model2 = torch.compile(sp_model2)
+
+    x_fp32 = torch.rand(size, size * 2, size, device=device, requires_grad=False)
+    x_fp32_tp_input = x_fp32.clone()
+    x_fp32_sp_input = distribute_tensor(x_fp32.clone(), mesh, [Shard(0)])
+
+    tp_out = tp_model(x_fp32_tp_input)
+    tp_out.sum().backward()
+    sp_out = sp_model(x_fp32_sp_input)
+    sp_out.sum().backward()
+    global_out = toy_model_fp8(x_fp32)
+    global_out.sum().backward()
+    torch.testing.assert_close(tp_out, global_out)
+    torch.testing.assert_close(sp_out.full_tensor(), global_out)
+    torch.testing.assert_close(tp_model.ffn.w1.weight.grad, sp_model.ffn.w1.weight.grad)
+    torch.testing.assert_close(
+        tp_model.ffn.out_proj.weight.grad, sp_model.ffn.out_proj.weight.grad
+    )
+
+    sp_out2 = sp_model2(x_fp32_sp_input)
+    sp_out2.sum().backward()
+    torch.testing.assert_close(sp_out2.full_tensor(), global_out)
+    torch.testing.assert_close(
+        tp_model.ffn.w1.weight.grad, sp_model2.ffn.w1.weight.grad
+    )
+    torch.testing.assert_close(
+        tp_model.ffn.out_proj.weight.grad, sp_model2.ffn.out_proj.weight.grad
+    )

From 9eeb101efe2e4d4631d8db7a3cab158d26c7728d Mon Sep 17 00:00:00 2001
From: Daniel Vega-Myhre <danvm@meta.com>
Date: Tue, 24 Jun 2025 12:08:18 -0600
Subject: [PATCH 149/165] [float8] add _auto_filter_for_recipe to float8
 (#2410)

* add auto_filter_for_recipe to float8

* lint

* address comments

* add tests
---
 torchao/float8/__init__.py            |  6 +-
 torchao/float8/float8_linear_utils.py | 87 ++++++++++++++++++++++++++-
 2 files changed, 90 insertions(+), 3 deletions(-)

diff --git a/torchao/float8/__init__.py b/torchao/float8/__init__.py
index a97a46fa1c..4f90292918 100644
--- a/torchao/float8/__init__.py
+++ b/torchao/float8/__init__.py
@@ -6,7 +6,10 @@
     ScalingGranularity,
     ScalingType,
 )
-from torchao.float8.float8_linear_utils import convert_to_float8_training
+from torchao.float8.float8_linear_utils import (
+    _auto_filter_for_recipe,
+    convert_to_float8_training,
+)
 from torchao.float8.float8_tensor import (
     Float8Tensor,
     GemmInputRole,
@@ -44,6 +47,7 @@
     # top level UX
     "convert_to_float8_training",
     "precompute_float8_dynamic_scale_for_fsdp",
+    "_auto_filter_for_recipe",
     # types
     "FP8Granularity",
     # note: Float8Tensor and Float8Linear are not public APIs
diff --git a/torchao/float8/float8_linear_utils.py b/torchao/float8/float8_linear_utils.py
index 230bfd881f..0d9674e6c3 100644
--- a/torchao/float8/float8_linear_utils.py
+++ b/torchao/float8/float8_linear_utils.py
@@ -4,11 +4,12 @@
 # This source code is licensed under the BSD 3-Clause license found in the
 # LICENSE file in the root directory of this source tree.
 import logging
-from typing import Callable, Optional
+from functools import partial
+from typing import Callable, List, Optional, Union
 
 import torch.nn as nn
 
-from torchao.float8.config import Float8LinearConfig
+from torchao.float8.config import Float8LinearConfig, Float8LinearRecipeName
 from torchao.float8.float8_linear import Float8Linear
 
 log = logging.getLogger(__name__)
@@ -113,3 +114,85 @@ def convert_to_float8_training(
         from_float,
         module_filter_fn=module_filter_fn,
     )
+
+
+def _auto_filter_for_recipe(
+    recipe: Union[str, Float8LinearRecipeName], filter_fqns: List[str]
+) -> Callable[[nn.Module, str], bool]:
+    """Returns function which automatically filters nn.Linear modules that meet at least one of the following criteria:
+
+    1. Dims not divisible by 16 (hardware requirement for float8).
+    2. Dim sizes below certain thresholds, which may result in worse performance.
+
+    NOTE: the thresholds are simple heuristics based on performance testing, and may not be optimal
+    for your model. For the best performance, we recommend defining your own module_filter_fn customized for
+    your module, using the performance tables for the given float8 recipe here:
+    https://github.com/pytorch/ao/tree/main/torchao/float8#performance). These benchmarks referenced for
+    auto filtering layers were run on H100 GPUs, and may not be representative of other hardware.
+
+    This is an experimental API, the design may change in the future.
+    """
+    if isinstance(recipe, str):
+        recipe = Float8LinearRecipeName(recipe)
+    if recipe == Float8LinearRecipeName.TENSORWISE:
+        return partial(_auto_filter_for_tensorwise, filter_fqns=filter_fqns)
+    elif recipe == Float8LinearRecipeName.ROWWISE:
+        return partial(_auto_filter_for_rowwise, filter_fqns=filter_fqns)
+    elif recipe == Float8LinearRecipeName.ROWWISE_WITH_GW_HP:
+        raise NotImplementedError(f"Unsupported recipe: {recipe}")
+    else:
+        raise ValueError(f"Invalid recipe: {recipe}")
+
+
+def _auto_filter_for_rowwise(mod: nn.Module, fqn: str, filter_fqns: List[str]) -> bool:
+    if not isinstance(mod, nn.Linear):
+        return False
+
+    # If the fqn matches any filtered fqn, then we should not convert this module.
+    is_filtered_fqn = any(filter_fqn in fqn for filter_fqn in filter_fqns)
+    if is_filtered_fqn:
+        return False
+
+    # All dims must be divisible by 16 due to float8 hardware requirements.
+    N, K = mod.weight.shape
+    dims_multiples_of_16 = K % 16 == 0 and N % 16 == 0
+    if not dims_multiples_of_16:
+        return False
+
+    # Dims below these thresholds may result in worse performance
+    # (see https://github.com/pytorch/ao/tree/main/torchao/float8#rowwise-scaling)
+    # Note that these benchmarks referenced for auto filtering layers were run on
+    # H100 GPUs, and may not be representative of other hardware.
+    if N <= 2048:
+        return False
+    elif K <= 1024:
+        return False
+    elif N <= 4096 and K <= 2048:
+        return False
+    return True
+
+
+def _auto_filter_for_tensorwise(
+    mod: nn.Module, fqn: str, filter_fqns: List[str]
+) -> bool:
+    if not isinstance(mod, nn.Linear):
+        return False
+
+    # If the fqn matches any filtered fqn, then we should not convert this module.
+    is_filtered_fqn = any(filter_fqn in fqn for filter_fqn in filter_fqns)
+    if is_filtered_fqn:
+        return False
+
+    # All dims must be divisible by 16 due to float8 hardware requirements.
+    N, K = mod.weight.shape
+    dims_multiples_of_16 = K % 16 == 0 and N % 16 == 0
+    if not dims_multiples_of_16:
+        return False
+
+    # Dims below these thresholds may result in worse performance
+    # (see https://github.com/pytorch/ao/tree/main/torchao/float8#tensorwise-scaling)
+    # Note that these benchmarks referenced for auto filtering layers were run on
+    # H100 GPUs, and may not be representative of other hardware.
+    if K <= 4096 and N <= 1024:
+        return False
+    return True

From a743e9be832457b25dedf5d2bec53dda6bcc6865 Mon Sep 17 00:00:00 2001
From: Scott Roy <161522778+metascroy@users.noreply.github.com>
Date: Tue, 24 Jun 2025 11:14:35 -0700
Subject: [PATCH 150/165] Update github links in torchao pt2e tutorial (#2435)

update github links in torchao pt2e tutorial
---
 .../tutorials_source/pt2e_quantizer.rst       | 28 +++++++++----------
 1 file changed, 14 insertions(+), 14 deletions(-)

diff --git a/docs/source/tutorials_source/pt2e_quantizer.rst b/docs/source/tutorials_source/pt2e_quantizer.rst
index e669c5b986..3fa6909da2 100644
--- a/docs/source/tutorials_source/pt2e_quantizer.rst
+++ b/docs/source/tutorials_source/pt2e_quantizer.rst
@@ -32,16 +32,16 @@ Introduction
 Please see `here <https://pytorch.org/tutorials/prototype/pt2e_quant_ptq.html#motivation-of-pytorch-2-export-quantization>`__ For motivations for the new API and ``Quantizer``.
 
 An existing quantizer object defined for ``XNNPACK`` is in
-`QNNPackQuantizer <https://github.com/pytorch/pytorch/blob/main/torch/ao/quantization/pt2e/quantizer/xnnpack_quantizer.py>`__
+`XNNPackQuantizer <https://github.com/pytorch/executorch/blob/752f6a729d3a2090b43ace6915086d8b4e03644f/backends/xnnpack/quantizer/xnnpack_quantizer.py>`__
 
 Annotation API
 ^^^^^^^^^^^^^^^^^^^
 
 ``Quantizer`` uses annotation API to convey quantization intent for different operators/patterns.
 Annotation API mainly consists of
-`QuantizationSpec <https://github.com/pytorch/pytorch/blob/1ca2e993af6fa6934fca35da6970308ce227ddc7/torch/ao/quantization/_pt2e/quantizer/quantizer.py#L38>`__
+`QuantizationSpec <https://github.com/pytorch/ao/blob/b96354087db6d0480ebbc10d5a63a9ca49c19dfa/torchao/quantization/pt2e/quantizer/quantizer.py#L40>`__
 and
-`QuantizationAnnotation <https://github.com/pytorch/pytorch/blob/07104ca99c9d297975270fb58fda786e60b49b38/torch/ao/quantization/_pt2e/quantizer/quantizer.py#L144>`__.
+`QuantizationAnnotation <https://github.com/pytorch/ao/blob/b96354087db6d0480ebbc10d5a63a9ca49c19dfa/torchao/quantization/pt2e/quantizer/quantizer.py#L121>`__.
 
 ``QuantizationSpec`` is used to convey intent of how a tensor will be quantized,
 e.g. dtype, bitwidth, min, max values, symmetric vs. asymmetric etc.
@@ -133,7 +133,7 @@ parameters can be shared among some tensors explicitly. Two typical use cases ar
 
 -  Example 1: One example is for ``add`` where having both inputs sharing quantization
    parameters makes operator implementation much easier. Without using of
-   `SharedQuantizationSpec <https://github.com/pytorch/pytorch/blob/1ca2e993af6fa6934fca35da6970308ce227ddc7/torch/ao/quantization/_pt2e/quantizer/quantizer.py#L90>`__,
+   `SharedQuantizationSpec <https://github.com/pytorch/ao/blob/b96354087db6d0480ebbc10d5a63a9ca49c19dfa/torchao/quantization/pt2e/quantizer/quantizer.py#L97>`__,
    we must annotate ``add`` as example in above section 1, in which two inputs of ``add``
    has different quantization parameters.
 -  Example 2: Another example is that of sharing quantization parameters between inputs and output.
@@ -211,7 +211,7 @@ as this:
 Another typical use case to annotate a quantized model is for tensors whose
 quantization parameters are known beforehand. For example, operator like ``sigmoid``, which has
 predefined and fixed scale/zero_point at input and output tensors.
-`FixedQParamsQuantizationSpec <https://github.com/pytorch/pytorch/blob/1ca2e993af6fa6934fca35da6970308ce227ddc7/torch/ao/quantization/_pt2e/quantizer/quantizer.py#L90>`__
+`FixedQParamsQuantizationSpec <https://github.com/pytorch/ao/blob/b96354087db6d0480ebbc10d5a63a9ca49c19dfa/torchao/quantization/pt2e/quantizer/quantizer.py#L76>`__
 is designed for this use case. To use ``FixedQParamsQuantizationSpec``, users need to pass in parameters
 of ``scale`` and ``zero_point`` explicitly.
 
@@ -243,14 +243,14 @@ of ``scale`` and ``zero_point`` explicitly.
 Another use case is to define the constraint for tensors whose quantization parameters are derived from other tensors.
 For example, if we want to annotate a convolution node, and define the ``scale`` of its bias input tensor
 as product of the activation tensor's ``scale`` and weight tensor's ``scale``. We can use
-`DerivedQuantizationSpec <https://github.com/pytorch/pytorch/blob/1ca2e993af6fa6934fca35da6970308ce227ddc7/torch/ao/quantization/_pt2e/quantizer/quantizer.py#L102>`__
+`DerivedQuantizationSpec <https://github.com/pytorch/ao/blob/b96354087db6d0480ebbc10d5a63a9ca49c19dfa/torchao/quantization/pt2e/quantizer/quantizer.py#L107>`__
 to annotate this conv node.
 
 -  Step 1: Identify the original floating point pattern in the FX graph. We can use the same
    methods introduced in ``QuantizationSpec`` example to identify the ``convolution`` pattern.
 -  Step 2: Define ``derive_qparams_fn`` function, it accepts list of ``ObserverOrFakeQuantize`` (
-   `ObserverBase <https://github.com/pytorch/pytorch/blob/07104ca99c9d297975270fb58fda786e60b49b38/torch/ao/quantization/observer.py#L124>`__
-   or `FakeQuantizeBase <https://github.com/pytorch/pytorch/blob/07104ca99c9d297975270fb58fda786e60b49b38/torch/ao/quantization/fake_quantize.py#L60>`__)
+   `ObserverBase <https://github.com/pytorch/ao/blob/b96354087db6d0480ebbc10d5a63a9ca49c19dfa/torchao/quantization/pt2e/observer.py#L157>`__
+   or `FakeQuantizeBase <https://github.com/pytorch/ao/blob/b96354087db6d0480ebbc10d5a63a9ca49c19dfa/torchao/quantization/pt2e/fake_quantize.py#L78>`__)
    as input. From each ``ObserverOrFakeQuantize`` object, user can get the ``scale``, ``zero point`` value.
    User can define its heuristic about how to derive new ``scale``, ``zero point`` value based on the
    quantization parameters calculated from the observer or fake quant instances.
@@ -293,13 +293,13 @@ and run a `toy example <https://gist.github.com/leslie-fang-intel/b78ed682aa9b54
 with ``Torchvision Resnet18``. To better understand the final example, here are the classes and utility
 functions that are used in the example:
 
--  `QuantizationConfig <https://github.com/pytorch/pytorch/blob/73fd7235ad25ff061c087fa4bafc6e8df4d9c299/torch/ao/quantization/_pt2e/quantizer/quantizer.py#L103-L109>`__
+-  `QuantizationConfig <https://github.com/pytorch/ao/blob/b96354087db6d0480ebbc10d5a63a9ca49c19dfa/torchao/quantization/pt2e/quantizer/utils.py#L21>`__
    consists of ``QuantizationSpec`` for activation, weight, and bias separately.
 -  When annotating the model,
-   `get_input_act_qspec <https://github.com/pytorch/pytorch/blob/47cfcf566ab76573452787335f10c9ca185752dc/torch/ao/quantization/_pt2e/quantizer/utils.py#L10>`__,
-   `get_output_act_qspec <https://github.com/pytorch/pytorch/blob/47cfcf566ab76573452787335f10c9ca185752dc/torch/ao/quantization/_pt2e/quantizer/utils.py#L23>`__,
-   `get_weight_qspec <https://github.com/pytorch/pytorch/blob/47cfcf566ab76573452787335f10c9ca185752dc/torch/ao/quantization/_pt2e/quantizer/utils.py#L36>`__, and
-   `get_bias_qspec <https://github.com/pytorch/pytorch/blob/47cfcf566ab76573452787335f10c9ca185752dc/torch/ao/quantization/_pt2e/quantizer/utils.py#L53>`__
+   `get_input_act_qspec <https://github.com/pytorch/ao/blob/b96354087db6d0480ebbc10d5a63a9ca49c19dfa/torchao/quantization/pt2e/quantizer/utils.py#L48>`__,
+   `get_output_act_qspec <https://github.com/pytorch/ao/blob/b96354087db6d0480ebbc10d5a63a9ca49c19dfa/torchao/quantization/pt2e/quantizer/utils.py#L61>`__,
+   `get_weight_qspec <https://github.com/pytorch/ao/blob/b96354087db6d0480ebbc10d5a63a9ca49c19dfa/torchao/quantization/pt2e/quantizer/utils.py#L74>`__, and
+   `get_bias_qspec <https://github.com/pytorch/ao/blob/b96354087db6d0480ebbc10d5a63a9ca49c19dfa/torchao/quantization/pt2e/quantizer/utils.py#L92>`__
    can be used to get the ``QuantizationSpec`` from ``QuantizationConfig`` for a specific pattern.
 
 A Note on IR for PT2E Quantization Flow
@@ -378,4 +378,4 @@ Conclusion
 With this tutorial, we introduce the new quantization path in PyTorch 2. Users can learn about
 how to define a ``BackendQuantizer`` with the ``QuantizationAnnotation API`` and integrate it into the PyTorch 2 Export Quantization flow.
 Examples of ``QuantizationSpec``, ``SharedQuantizationSpec``, ``FixedQParamsQuantizationSpec``, and ``DerivedQuantizationSpec``
-are given for specific annotation use case. You can use `XNNPACKQuantizer <https://github.com/pytorch/pytorch/blob/main/torch/ao/quantization/quantizer/xnnpack_quantizer.py>`_ as an example to start implementing your own ``Quantizer``. After that please follow `this tutorial <https://pytorch.org/tutorials/prototype/pt2e_quant_ptq.html>`_ to actually quantize your model.
+are given for specific annotation use case. You can use `XNNPACKQuantizer <https://github.com/pytorch/executorch/blob/752f6a729d3a2090b43ace6915086d8b4e03644f/backends/xnnpack/quantizer/xnnpack_quantizer.py>`_ as an example to start implementing your own ``Quantizer``. After that please follow `this tutorial <https://pytorch.org/tutorials/prototype/pt2e_quant_ptq.html>`_ to actually quantize your model.

From 7d6bb6a3e481f83d9a9bfeb1c0f79bfa49cc89cf Mon Sep 17 00:00:00 2001
From: Vasiliy Kuznetsov <vkuzo@users.noreply.github.com>
Date: Tue, 24 Jun 2025 15:17:13 -0400
Subject: [PATCH 151/165] enable to_mxfp8 cast for DTensor (#2420)

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]
---
 test/prototype/mx_formats/test_mx_dtensor.py | 98 ++++++++++++++++++++
 test/prototype/mx_formats/test_mx_dtensor.sh | 17 ++++
 torchao/prototype/mx_formats/kernels.py      |  3 -
 torchao/prototype/mx_formats/mx_tensor.py    | 45 +++++++--
 torchao/testing/training/dtensor_utils.py    | 23 +++--
 5 files changed, 168 insertions(+), 18 deletions(-)
 create mode 100644 test/prototype/mx_formats/test_mx_dtensor.py
 create mode 100755 test/prototype/mx_formats/test_mx_dtensor.sh

diff --git a/test/prototype/mx_formats/test_mx_dtensor.py b/test/prototype/mx_formats/test_mx_dtensor.py
new file mode 100644
index 0000000000..bfc930c579
--- /dev/null
+++ b/test/prototype/mx_formats/test_mx_dtensor.py
@@ -0,0 +1,98 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+"""
+Test numerics of manually defined float16 TP vs mxfp8 TP of toy models
+
+Note: for now, this does not run in CI.
+TODO(future): make this run in CI
+"""
+
+import os
+
+import pytest
+import torch
+
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_7
+
+if not TORCH_VERSION_AT_LEAST_2_7:
+    pytest.skip("Unsupported PyTorch version", allow_module_level=True)
+
+from torch.distributed._tensor import DTensor, Shard, distribute_tensor
+from torch.distributed.device_mesh import DeviceMesh, init_device_mesh
+from tqdm import tqdm
+
+from torchao.prototype.mx_formats import MXLinearConfig
+from torchao.prototype.mx_formats.mx_tensor import MXTensor
+from torchao.testing.training.dtensor_utils import (
+    _test_lowp_mlp_tensor_parallelism_base,
+)
+
+torch.set_float32_matmul_precision("high")
+
+
+def setup_distributed():
+    world_size = int(os.environ.get("WORLD_SIZE", -1))
+    device_mesh = init_device_mesh("cuda", (world_size,))
+    # seed must be the same in all processes
+    torch.manual_seed(1)
+    local_rank = torch.distributed.get_rank()
+    torch.cuda.set_device(local_rank)
+    return device_mesh
+
+
+def _test_dtensor_cast_to_mxfp8(mesh: DeviceMesh, size=4):
+    device = mesh.device_type
+
+    x_fp32 = torch.rand(size, size, device=device)
+    x_fp8 = MXTensor.to_mx(x_fp32, torch.float8_e4m3fn, block_size=size // 2)
+
+    dist_x_fp32 = distribute_tensor(x_fp32, mesh, [Shard(0)])
+    dist_x_fp8 = MXTensor.to_mx(dist_x_fp32, torch.float8_e4m3fn, block_size=size // 2)
+    assert isinstance(dist_x_fp8, DTensor)
+
+    # Verify that the result of to_mx with DTensor matches the slice of the
+    # result of to_mx without DTensor. This will fail on numeric op mismatches.
+    local_rank = torch.distributed.get_rank()
+    world_size = torch.distributed.get_world_size()
+    assert size % world_size == 0, "unsupported"
+    x_fp8_fp32 = x_fp8.to_dtype(torch.float32)
+    rows_per_slice = size // world_size
+    slice_start = local_rank * rows_per_slice
+    slice_end = (local_rank + 1) * rows_per_slice
+    x_fp8_fp32_slice = x_fp8_fp32[slice_start:slice_end]
+    torch.testing.assert_close(
+        x_fp8_fp32_slice, dist_x_fp8.to_local().to_dtype(torch.float32), atol=0, rtol=0
+    )
+
+
+def _test_mxfp8_mlp_tensor_parallelism_eager(mesh: DeviceMesh, size=16):
+    config = MXLinearConfig.from_recipe_name("mxfp8_emulated")
+    # TODO(future PR): assert that the K dim must be divisible by block size,
+    # today this is silently incorrect if block_size is greater than K
+    config.block_size = 16
+    _test_lowp_mlp_tensor_parallelism_base(
+        mesh, config, size, compile=False, allgather_in_lowp=False
+    )
+
+    # TODO(future PR): compile
+
+
+if __name__ == "__main__":
+    device_mesh = setup_distributed()
+    tests = [
+        _test_dtensor_cast_to_mxfp8,
+        # TODO(next PR): enable this (current PR got too large, so splitting)
+        # _test_mxfp8_mlp_tensor_parallelism_eager,
+    ]
+
+    for test in tqdm(tests, desc="Running tests"):
+        try:
+            test(device_mesh)
+        except Exception as e:
+            print(f"Test {test.__name__} failed with error: {e}")
+            raise e
+
+    torch.distributed.destroy_process_group()
diff --git a/test/prototype/mx_formats/test_mx_dtensor.sh b/test/prototype/mx_formats/test_mx_dtensor.sh
new file mode 100755
index 0000000000..abf9424e3c
--- /dev/null
+++ b/test/prototype/mx_formats/test_mx_dtensor.sh
@@ -0,0 +1,17 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+#!/bin/bash
+
+# terminate script on first error
+set -e
+
+if python -c 'import torch;print(torch.cuda.is_available())' | grep -q "False"; then
+    echo "Skipping test_dtensor.sh because no CUDA devices are available."
+    exit
+fi
+
+# integration tests for TP/SP
+NCCL_DEBUG=WARN torchrun --nproc_per_node 2 test/prototype/mx_formats/test_mx_dtensor.py
diff --git a/torchao/prototype/mx_formats/kernels.py b/torchao/prototype/mx_formats/kernels.py
index eacf0ac5df..f96e73a55a 100644
--- a/torchao/prototype/mx_formats/kernels.py
+++ b/torchao/prototype/mx_formats/kernels.py
@@ -1102,15 +1102,12 @@ def _triton_calculate_scale(x, axis):
         bf16_mbits = 7
         bf16_exp_bias = 127
         fp32_mbits = 23
-        # We use a small epsilon to avoid division by zero
-        epsilon = 1e-10
 
         # Find the maximum absolute value for each row
         max_abs = tl.max(x, axis=axis)
 
         # Calculate the e8m0 scale by extracting the exponent (floor)
         # TODO(future PR): support other exponent extraction types (ceil, RNE)
-        max_abs = max_abs + epsilon
         max_abs = max_abs.to(tl.bfloat16)
         max_abs_int16 = max_abs.to(tl.int16, bitcast=True)
         extracted_pow2 = ((max_abs_int16 >> bf16_mbits) & 0b11111111) - bf16_exp_bias
diff --git a/torchao/prototype/mx_formats/mx_tensor.py b/torchao/prototype/mx_formats/mx_tensor.py
index 784d3eda6d..ef9ae42fcd 100644
--- a/torchao/prototype/mx_formats/mx_tensor.py
+++ b/torchao/prototype/mx_formats/mx_tensor.py
@@ -21,6 +21,7 @@
 from typing import Callable, Dict, Union
 
 import torch
+from torch.distributed._tensor import DTensor
 
 from torchao.prototype.mx_formats.config import MXGemmKernelChoice
 from torchao.prototype.mx_formats.constants import (
@@ -166,6 +167,8 @@ def to_mx(
     # calculate the scale in e8m0 format
 
     orig_shape = data_hp.shape
+    # TODO(future PR): fix this line for TP, currently this reshape does not work
+    # for rank 3 tensor where dim1 is sharded
     data_hp = data_hp.reshape(-1, block_size)
 
     # find max value of the data
@@ -174,10 +177,6 @@ def to_mx(
     # section 6.3.
     max_abs = torch.amax(torch.abs(data_hp), 1)
 
-    # Add an epsilon to prevent the log2 function call for returning -inf
-    # where the values are zero.
-    eps = F32_MIN_NORMAL * (max_abs == 0).type(max_abs.dtype)
-
     # Set X to be the largest power-of-two less than or equal to
     # max_abs(v), divided by the largest power of two representable
     # in the element data type, and get the mbits at the same time
@@ -233,8 +232,12 @@ def to_mx(
             )
 
         # Calculate the scale for different modes
-        max_abs_int32 = (max_abs + eps).view(hp_int_dtype)
-        extracted_pow2 = ((max_abs_int32 >> hp_mbits) & 0b11111111) - hp_exp_bias
+        max_abs_int32 = max_abs.view(hp_int_dtype)
+        # For now, use `torch.bitwise_right_shift` instead of `>>` to support DTensor
+        # See https://github.com/pytorch/pytorch/issues/156533.
+        extracted_pow2 = (
+            (torch.bitwise_right_shift(max_abs_int32, hp_mbits)) & 0b11111111
+        ) - hp_exp_bias
 
         if scaling_mode in (ScaleCalculationMode.FLOOR, ScaleCalculationMode.EVEN):
             scale_e8m0_unbiased = extracted_pow2 - target_max_pow2
@@ -266,9 +269,11 @@ def to_mx(
         )
 
         # For now, calculate the scale in floating point.
-        scale_fp32 = (scale_e8m0_biased.to(torch.int32) << MBITS_F32).view(
-            torch.float32
-        )
+        # For now, use `torch.bitwise_left_shift` instead of `<<` to support DTensor
+        # See https://github.com/pytorch/pytorch/issues/156533.
+        scale_fp32 = (
+            torch.bitwise_left_shift(scale_e8m0_biased.to(torch.int32), MBITS_F32)
+        ).view(torch.float32)
 
         # Today, 2**-127 returns 0 in compile+inductor+triton because it is in the
         # float32 denormal range. For now, manually adjust the fp scale. This is
@@ -597,6 +602,28 @@ def to_mx(
         scale_e8m0_biased, data_lp = to_mx(
             data_hp, elem_dtype, block_size, scaling_mode, pack_fp6
         )
+        if isinstance(scale_e8m0_biased, DTensor):
+            assert isinstance(data_lp, DTensor), "unsupported"
+            local_scale_e8m0_biased = scale_e8m0_biased.to_local()
+            local_data_lp = data_lp.to_local()
+            inner_mx_tensor = MXTensor(
+                local_scale_e8m0_biased,
+                local_data_lp,
+                elem_dtype,
+                block_size,
+                data_hp.dtype,
+                use_fp4_custom_triton_dequant_kernel,
+                gemm_kernel_choice,
+                pack_fp6,
+            )
+            return DTensor.from_local(
+                inner_mx_tensor,
+                data_lp.device_mesh,
+                data_lp.placements,
+                run_check=False,
+                shape=data_lp.size(),
+                stride=data_lp.stride(),
+            )
         return MXTensor(
             scale_e8m0_biased,
             data_lp,
diff --git a/torchao/testing/training/dtensor_utils.py b/torchao/testing/training/dtensor_utils.py
index 7ac0360363..815ee20969 100644
--- a/torchao/testing/training/dtensor_utils.py
+++ b/torchao/testing/training/dtensor_utils.py
@@ -4,6 +4,7 @@
 # This source code is licensed under the BSD 3-Clause license found in the
 # LICENSE file in the root directory of this source tree.
 import copy
+from typing import Union
 
 import torch
 import torch.nn as nn
@@ -24,6 +25,8 @@
     Float8RowwiseParallel,
     PrepareFloat8ModuleInput,
 )
+from torchao.prototype.mx_formats.config import MXLinearConfig
+from torchao.quantization import quantize_
 
 
 class FeedForward(nn.Module):
@@ -36,7 +39,9 @@ def __init__(self):
         self.out_proj = nn.Linear(32, 16, bias=False)
 
     def forward(self, x):
-        return self.out_proj(F.silu(self.w1(x)) * self.w2(x))
+        x = F.silu(self.w1(x)) * self.w2(x)
+        x = self.out_proj(x)
+        return x
 
 
 class ToyModel(nn.Module):
@@ -50,20 +55,26 @@ def forward(self, x):
 
 def _test_lowp_mlp_tensor_parallelism_base(
     mesh: DeviceMesh,
-    config: Float8LinearConfig,
+    config: Union[Float8LinearConfig, MXLinearConfig],
     size=16,
     compile: bool = False,
     allgather_in_lowp: bool = False,
 ):
     device = mesh.device_type
 
+    # TODO(future): remove this once float8 training works with `quantize_` API
+    convert_model_func = convert_to_float8_training
+    if isinstance(config, MXLinearConfig):
+        convert_model_func = quantize_
+
     toy_model = ToyModel().to(device)
-    toy_model_fp8 = convert_to_float8_training(toy_model, config=config)
+    toy_model_fp8 = copy.deepcopy(toy_model)
+    convert_model_func(toy_model_fp8, config=config)
 
     tp_model = copy.deepcopy(toy_model)
-    tp_model = convert_to_float8_training(tp_model, config=config)
+    convert_model_func(tp_model, config=config)
     sp_model = copy.deepcopy(toy_model)
-    sp_model = convert_to_float8_training(sp_model, config=config)
+    convert_model_func(sp_model, config=config)
 
     # For tensorwise scaling, enable float8 all_gather.
     # For rowwise scaling, keep high precision all_gather. Motivation for
@@ -108,7 +119,7 @@ def _test_lowp_mlp_tensor_parallelism_base(
 
     # prepare_input_cls with specific submodule fqn
     sp_model2 = copy.deepcopy(toy_model)
-    sp_model2 = convert_to_float8_training(sp_model2, config=config)
+    convert_model_func(sp_model2, config=config)
 
     if not allgather_in_lowp:
         prepare_input = prepare_input_cls(

From 7ca9f10d048bd7ff3b5a9cd14a66c264be8b22e6 Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Tue, 24 Jun 2025 12:20:00 -0700
Subject: [PATCH 152/165] NVfp4 (#2408)

---
 test/prototype/mx_formats/test_mx_linear.py  | 138 ++++-
 test/prototype/mx_formats/test_mx_tensor.py  |  66 ++
 torchao/prototype/mx_formats/__init__.py     |   8 +-
 torchao/prototype/mx_formats/config.py       |   6 +-
 torchao/prototype/mx_formats/mx_subclass.py  |  73 ++-
 torchao/prototype/mx_formats/nvfp4_tensor.py | 617 +++++++++++++++++++
 6 files changed, 894 insertions(+), 14 deletions(-)
 create mode 100644 torchao/prototype/mx_formats/nvfp4_tensor.py

diff --git a/test/prototype/mx_formats/test_mx_linear.py b/test/prototype/mx_formats/test_mx_linear.py
index bfb6742d14..0e39264742 100644
--- a/test/prototype/mx_formats/test_mx_linear.py
+++ b/test/prototype/mx_formats/test_mx_linear.py
@@ -9,6 +9,7 @@
 import pytest
 import torch
 import torch.nn as nn
+import torch.nn.functional as F
 
 from torchao.prototype.mx_formats.config import (
     MXGemmKernelChoice,
@@ -25,7 +26,11 @@
     MXInferenceLinear,
     MXLinear,
 )
-from torchao.prototype.mx_formats.mx_subclass import MXFPInferenceConfig
+from torchao.prototype.mx_formats.mx_subclass import (
+    MXFPInferenceConfig,
+    NVFP4InferenceConfig,
+    NVFP4MMConfig,
+)
 from torchao.quantization import quantize_
 from torchao.quantization.utils import compute_error
 from torchao.testing.utils import skip_if_rocm
@@ -404,6 +409,7 @@ def test_inference_print_str():
 @skip_if_rocm(
     "ROCm float4 gemm require gfx950"
 )  # TODO(future): deploy gfx950 in ROCM CI
+@pytest.mark.skipif(not is_sm_at_least_100(), reason="CUDA capability >= 10.0 required")
 def test_inference_subclass(elem_dtype, bias: bool, compile: bool):
     """
     Smoke test for inference compile
@@ -441,3 +447,133 @@ def test_inference_subclass(elem_dtype, bias: bool, compile: bool):
     assert sqnr >= SQNR_THRESHOLD, (
         f"Got a sqnr of {sqnr} for {elem_dtype} and bias={bias}"
     )
+
+
+@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(
+    not TORCH_VERSION_AT_LEAST_2_8, reason="torch.compile requires PyTorch 2.8+"
+)
+@pytest.mark.parametrize("bias", [True, False])
+@pytest.mark.parametrize("compile", [True, False])
+@pytest.mark.parametrize(
+    "mm_config", [NVFP4MMConfig.DYNAMIC, NVFP4MMConfig.WEIGHT_ONLY]
+)
+@pytest.mark.parametrize("inpt_dtype", [torch.bfloat16, torch.float32])
+@torch.no_grad()
+@skip_if_rocm("ROCm float4 gemm require gfx950")
+def test_inference_subclass_nvfp4(
+    bias: bool, compile: bool, mm_config: NVFP4MMConfig, inpt_dtype: torch.dtype
+):
+    """
+    Test NVFP4 recipe with scale_dtype=float8_e4m3fn and block_size=16
+    Tests both DYNAMIC and WEIGHT_ONLY mm_config modes
+    """
+    # DYNAMIC mode requires SM100+, but WEIGHT_ONLY works on older GPUs
+    if mm_config == NVFP4MMConfig.DYNAMIC and not is_sm_at_least_100():
+        pytest.skip("CUDA capability >= 10.0 required for DYNAMIC float4 gemm")
+
+    if bias and inpt_dtype == torch.float32:
+        pytest.xfail("Bias is not supported when module weight is in fp32")
+
+    if mm_config == NVFP4MMConfig.WEIGHT_ONLY and compile:
+        pytest.skip("TODO: NVFP4MMConfig.WEIGHT_ONLY currently errors w/ compile")
+    m = nn.Linear(64, 256, bias=bias, dtype=inpt_dtype, device="cuda")
+    m_mx = copy.deepcopy(m)
+
+    config = NVFP4InferenceConfig(mm_config=mm_config)
+    quantize_(m_mx, config=config)
+
+    if compile:
+        m_mx = torch.compile(m_mx, fullgraph=True, backend="aot_eager")
+
+    x = torch.randn(128, 64, device="cuda", dtype=inpt_dtype)
+    y_ref = m(x)
+    y_mx = m_mx(x)
+    sqnr = compute_error(y_ref, y_mx)
+
+    if mm_config == NVFP4MMConfig.WEIGHT_ONLY:
+        SQNR_THRESHOLD = 18.0
+    else:
+        SQNR_THRESHOLD = 15.0
+
+    assert y_mx.dtype == inpt_dtype, f"Got {y_mx.dtype} for inpt_dtype={inpt_dtype}"
+    assert sqnr >= SQNR_THRESHOLD, (
+        f"Got a sqnr of {sqnr} for NVFP4 recipe with bias={bias}, mm_config={mm_config}"
+    )
+
+
+@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(
+    not TORCH_VERSION_AT_LEAST_2_8, reason="torch.compile requires PyTorch 2.8+"
+)
+@pytest.mark.parametrize("use_gelu", [True, False])
+@pytest.mark.parametrize(
+    "mm_config", [NVFP4MMConfig.DYNAMIC, NVFP4MMConfig.WEIGHT_ONLY]
+)
+@pytest.mark.parametrize("compile", [False])
+@pytest.mark.parametrize("bias", [True, False])
+@pytest.mark.parametrize("inpt_dtype", [torch.bfloat16, torch.float32])
+@torch.no_grad()
+@skip_if_rocm("ROCm float4 gemm require gfx950")
+def test_nvfp4_matmul_with_amax(
+    use_gelu: bool,
+    mm_config: NVFP4MMConfig,
+    compile: bool,
+    bias: bool,
+    inpt_dtype: torch.dtype,
+):
+    from torchao.prototype.mx_formats.nvfp4_tensor import (
+        NVFP4Tensor,
+        per_tensor_amax_to_scale,
+    )
+
+    # DYNAMIC mode requires SM100+, but WEIGHT_ONLY works on older GPUs
+    if mm_config == NVFP4MMConfig.DYNAMIC and not is_sm_at_least_100():
+        pytest.skip("CUDA capability >= 10.0 required for DYNAMIC float4 gemm")
+
+    if bias and inpt_dtype == torch.float32:
+        pytest.xfail("Bias is not supported when module weight is in fp32")
+
+    if mm_config == NVFP4MMConfig.WEIGHT_ONLY and compile:
+        pytest.skip("TODO: NVFP4MMConfig.WEIGHT_ONLY currently errors w/ compile")
+
+    m, k, n = 64, 256, 128
+
+    # Create activation tensor
+    if use_gelu:
+        x = torch.randn(m, k, dtype=inpt_dtype, device="cuda")
+        A = torch.nn.functional.gelu(x)
+    else:
+        A = torch.randn(m, k, dtype=inpt_dtype, device="cuda")
+
+    B = torch.randn(n, k, dtype=inpt_dtype, device="cuda")
+    bias_tensor = torch.randn(n, dtype=inpt_dtype, device="cuda") if bias else None
+
+    # Compute reference
+    C_ref = F.linear(A, B, bias_tensor)
+
+    a_scale = per_tensor_amax_to_scale(torch.amax(torch.abs(A)))
+    b_scale = per_tensor_amax_to_scale(torch.amax(torch.abs(B)))
+    A_nvfp4 = NVFP4Tensor.to_nvfp4(
+        A,
+        per_tensor_scale=a_scale,
+        mm_config=mm_config,
+    )
+    B_nvfp4 = NVFP4Tensor.to_nvfp4(
+        B,
+        per_tensor_scale=b_scale,
+        mm_config=mm_config,
+    )
+
+    func = torch.compile(F.linear, fullgraph=True) if compile else F.linear
+
+    C_nvfp4 = func(A_nvfp4, B_nvfp4, bias_tensor)
+    assert C_nvfp4.dtype == inpt_dtype, (
+        f"Got {C_nvfp4.dtype} for inpt_dtype={inpt_dtype}"
+    )
+
+    sqnr = compute_error(C_ref, C_nvfp4)
+    SQNR_THRESHOLD = 16.0
+    assert sqnr >= SQNR_THRESHOLD, (
+        f"SQNR {sqnr:.2f} < {SQNR_THRESHOLD}, use_gelu={use_gelu}, mm_config={mm_config}, compile={compile}, bias={bias}"
+    )
diff --git a/test/prototype/mx_formats/test_mx_tensor.py b/test/prototype/mx_formats/test_mx_tensor.py
index 6dfd33f9c7..0490b0b1ee 100644
--- a/test/prototype/mx_formats/test_mx_tensor.py
+++ b/test/prototype/mx_formats/test_mx_tensor.py
@@ -14,6 +14,7 @@
 from torchao.prototype.mx_formats.constants import (
     DTYPE_FP6_E2M3,
     DTYPE_FP6_E3M2,
+    F4_E2M1_MAX,
     SUPPORTED_ELEM_DTYPES,
 )
 from torchao.prototype.mx_formats.kernels import pack_uint4, pack_uint6
@@ -591,3 +592,68 @@ def to_f8(x):
     torch.testing.assert_close(
         data_in_range_f8_c, data_out_of_range_f8_c, atol=0, rtol=0
     )
+
+
+@pytest.mark.parametrize(
+    "dtype,shape,use_per_tensor_scale",
+    [
+        (torch.bfloat16, (32, 64), False),
+        (torch.float32, (64, 128), False),
+        (torch.bfloat16, (128, 256), False),
+        (torch.bfloat16, (64, 128), True),
+    ],
+)
+@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(
+    not TORCH_VERSION_AT_LEAST_2_8, reason="torch.compile requires PyTorch 2.8+"
+)
+def test_nvfp4_reconstruction(dtype, shape, use_per_tensor_scale):
+    from torchao.prototype.mx_formats.nvfp4_tensor import (
+        NVFP4Tensor,
+        per_tensor_amax_to_scale,
+    )
+
+    x = torch.randn(shape, dtype=dtype, device="cuda")
+    if use_per_tensor_scale:
+        tensor_amax = torch.max(torch.abs(x))
+        scale = per_tensor_amax_to_scale(tensor_amax)
+    else:
+        scale = None
+
+    x_nvfp4 = NVFP4Tensor.to_nvfp4(x, per_tensor_scale=scale)
+    x_reconstructed = x_nvfp4.to_dtype(dtype)
+
+    def assert_sqnr_gt_threshold(orig, new, threshold):
+        sqnr = compute_error(orig, new)
+        if torch.all(torch.isnan(sqnr)):
+            # if both operands are full of zeroes, sqnr is nan and this is ok
+            # test for this explicitly
+            assert torch.all(orig == 0) and torch.all(new == 0)
+        else:
+            assert sqnr >= threshold
+
+    reconstructed_amax = x_nvfp4.get_hp_scales().view(shape[0], -1, 1) * F4_E2M1_MAX
+    max_abs = torch.amax(
+        torch.abs(x.reshape(shape[0], -1, x_nvfp4._block_size)), dim=-1
+    ).unsqueeze(-1)
+
+    assert_sqnr_gt_threshold(max_abs, reconstructed_amax, 30.0)
+    assert_sqnr_gt_threshold(x, x_reconstructed, 8.0)
+
+    assert x.shape == x_reconstructed.shape, (
+        f"Shape mismatch: {x.shape} vs {x_reconstructed.shape}"
+    )
+    assert x.dtype == x_reconstructed.dtype, (
+        f"Dtype mismatch: {x.dtype} vs {x_reconstructed.dtype}"
+    )
+
+    x_nvfp4_t = x_nvfp4.t()
+    x_reconstructed_t = x_nvfp4_t.to_dtype(dtype)
+    assert_sqnr_gt_threshold(x.t(), x_reconstructed_t, 8.0)
+
+    assert x.t().shape == x_reconstructed_t.shape, (
+        f"Transpose shape mismatch: {x.t().shape} vs {x_reconstructed_t.shape}"
+    )
+    assert x.t().dtype == x_reconstructed_t.dtype, (
+        f"Transpose dtype mismatch: {x.t().dtype} vs {x_reconstructed_t.dtype}"
+    )
diff --git a/torchao/prototype/mx_formats/__init__.py b/torchao/prototype/mx_formats/__init__.py
index 7c1f0ace55..5947d616be 100644
--- a/torchao/prototype/mx_formats/__init__.py
+++ b/torchao/prototype/mx_formats/__init__.py
@@ -6,7 +6,11 @@
 )
 
 # Note: Prototype and subject to change
-from torchao.prototype.mx_formats.mx_subclass import MXFPInferenceConfig
+from torchao.prototype.mx_formats.mx_subclass import (
+    MXFPInferenceConfig,
+    NVFP4InferenceConfig,
+    NVFP4MMConfig,
+)
 
 # import mx_linear here to register the quantize_ transform logic
 # ruff: noqa: I001
@@ -18,4 +22,6 @@
     "MXLinearConfig",
     "MXLinearRecipeName",
     "MXFPInferenceConfig",
+    "NVFP4InferenceConfig",
+    "NVFP4MMConfig",
 ]
diff --git a/torchao/prototype/mx_formats/config.py b/torchao/prototype/mx_formats/config.py
index eb1b15228d..525bf21fc6 100644
--- a/torchao/prototype/mx_formats/config.py
+++ b/torchao/prototype/mx_formats/config.py
@@ -57,10 +57,10 @@ def _validate_gemm_kernel_choice(gemm_kernel_choice, block_size, elem_dtype):
             f"elem_dtype must be one of {valid_dtypes} to use the CUTLASS MX gemm kernels, got {elem_dtype}"
         )
     elif gemm_kernel_choice == MXGemmKernelChoice.CUBLAS:
-        assert block_size == 32, (
-            f"block_size must be 32 to use the cuBLAS MX gemm kernels, got {block_size}"
+        assert block_size in [16, 32], (
+            f"block_size must be in [16, 32] to use the cuBLAS MX gemm kernels, got {block_size}"
         )
-        valid_dtypes = [torch.float8_e4m3fn]
+        valid_dtypes = [torch.float8_e4m3fn, torch.float4_e2m1fn_x2]
         assert elem_dtype in valid_dtypes, (
             f"elem_dtype must be one of {valid_dtypes} to use the CUTLASS MX gemm kernels, got {elem_dtype}"
         )
diff --git a/torchao/prototype/mx_formats/mx_subclass.py b/torchao/prototype/mx_formats/mx_subclass.py
index 2173c97002..d1be8a04f4 100644
--- a/torchao/prototype/mx_formats/mx_subclass.py
+++ b/torchao/prototype/mx_formats/mx_subclass.py
@@ -10,7 +10,6 @@
 
 import torch
 
-import torchao
 from torchao.core.config import AOBaseConfig
 from torchao.prototype.mx_formats import (
     MXGemmKernelChoice,
@@ -20,13 +19,19 @@
     _validate_gemm_kernel_choice,
 )
 from torchao.prototype.mx_formats.mx_tensor import MXTensor
+from torchao.prototype.mx_formats.nvfp4_tensor import NVFP4MMConfig, NVFP4Tensor
 from torchao.quantization.quant_api import to_linear_activation_quantized
 from torchao.quantization.transform_module import (
     register_quantize_module_handler,
 )
-from torchao.utils import TORCH_VERSION_AT_LEAST_2_5, is_sm_at_least_100
+from torchao.utils import (
+    TORCH_VERSION_AT_LEAST_2_5,
+    TORCH_VERSION_AT_LEAST_2_8,
+    is_sm_at_least_100,
+)
 
 
+# TODO The naming for these configs is a little weird, rename before moving to public API
 # Note: This API is extra prototype and will change in the future
 @dataclass
 class MXFPInferenceConfig(AOBaseConfig):
@@ -63,16 +68,13 @@ class MXFPInferenceConfig(AOBaseConfig):
 
     block_size: int = 32
 
-    # Dtypes for Input and Weights
+    # Dtypes for Input and Weights, supports Fp8 and Fp4 formats
     activation_dtype: torch.dtype = torch.float8_e4m3fn
     weight_dtype: torch.dtype = torch.float8_e4m3fn
 
     # Which kernel to run for mm
     gemm_kernel_choice: MXGemmKernelChoice = MXGemmKernelChoice.CUBLAS
 
-    # Set some magic perf settings
-    set_inductor_config: bool = False
-
     def __post_init__(self):
         assert self.activation_dtype == self.weight_dtype, (
             "For now - we only support matching input/weight dtypes."
@@ -115,8 +117,6 @@ def _mx_inference_linear_transform(
     # TODO Sm120 has slightly more restrictive reqs
     # TODO handle AMD
     assert is_sm_at_least_100(), "MXFP is only supported on sm100 machiens for now"
-    if config.set_inductor_config:
-        torchao.quantization.utils.recommended_inductor_config_setter()
 
     activation_dtype = config.activation_dtype
     weight_dtype = config.weight_dtype
@@ -151,7 +151,62 @@ def _mx_inference_linear_transform(
     return module
 
 
+@dataclass
+class NVFP4InferenceConfig(AOBaseConfig):
+    """
+    NVIDIA FP4 (NVFP4) Inference Quantization Configuration
+
+    This is a specialized configuration for NVIDIA's FP4 format.
+    All parameters are fixed in the NVFP4 implementation except mm_config:
+    - mm_config: NVFP4MMConfig, which can be set to DYNAMIC or WEIGHT_ONLY (emulated mm in high precision)
+    - Data: float4_e2m1fn_x2
+    - Scales: float8_e4m3fn
+    - Block size: 16 along the reduction dim
+    """
+
+    mm_config: NVFP4MMConfig = NVFP4MMConfig.DYNAMIC
+
+    def __post_init__(self):
+        # Validate PyTorch version
+        if not TORCH_VERSION_AT_LEAST_2_8:
+            raise RuntimeError("NVFP4InferenceConfig requires PyTorch 2.8 or later")
+
+
+@register_quantize_module_handler(NVFP4InferenceConfig)
+def _nvfp4_inference_linear_transform(
+    module: torch.nn.Linear, config: NVFP4InferenceConfig
+):
+    """Quantization handler for NVFP4InferenceConfig"""
+    if config.mm_config == NVFP4MMConfig.DYNAMIC:
+        assert is_sm_at_least_100(), (
+            "NVFP4 DYNAMIC mode is only supported on sm100+ machines"
+        )
+
+    weight = module.weight
+
+    if module.bias is not None and weight.dtype == torch.float32:
+        raise RuntimeError(
+            "Bias is not supported when module weight is in fp32 (out_dtype=Float32). "
+            "Please use bfloat16 or float16 weights, or remove the bias from the linear layer."
+        )
+
+    quantized_weight = NVFP4Tensor.to_nvfp4(
+        weight,
+        mm_config=config.mm_config,
+    )
+
+    module.weight = torch.nn.Parameter(quantized_weight, requires_grad=False)
+    module.extra_repr = types.MethodType(_linear_extra_repr, module)
+    return module
+
+
 if TORCH_VERSION_AT_LEAST_2_5:
     torch.serialization.add_safe_globals(
-        [MXTensor, MXGemmKernelChoice, _input_activation_quant_func_mxfp]
+        [
+            MXTensor,
+            NVFP4Tensor,
+            NVFP4MMConfig,
+            MXGemmKernelChoice,
+            _input_activation_quant_func_mxfp,
+        ]
     )
diff --git a/torchao/prototype/mx_formats/nvfp4_tensor.py b/torchao/prototype/mx_formats/nvfp4_tensor.py
new file mode 100644
index 0000000000..ed1b5df1d0
--- /dev/null
+++ b/torchao/prototype/mx_formats/nvfp4_tensor.py
@@ -0,0 +1,617 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+
+from enum import Enum
+from typing import Any, Callable, Dict, Optional
+
+import torch
+from torch.utils._python_dispatch import return_and_correct_aliasing
+
+from torchao.prototype.mx_formats.constants import F4_E2M1_MAX, F8E4M3_MAX
+from torchao.prototype.mx_formats.kernels import (
+    f4_unpacked_to_f32,
+    f32_to_f4_unpacked,
+    pack_uint4,
+    unpack_uint4,
+)
+from torchao.prototype.mx_formats.mx_tensor import (
+    tensor_size_fp4x2_to_hp,
+    tensor_size_hp_to_fp4x2,
+)
+from torchao.prototype.mx_formats.utils import to_blocked
+from torchao.utils import fill_defaults
+
+E4M3_EPS = torch.finfo(torch.float8_e4m3fn).tiny
+
+aten = torch.ops.aten
+
+NVFP4_OPS_TABLE: Dict[Any, Any] = {}
+
+
+class NVFP4MMConfig(Enum):
+    DYNAMIC = "dynamic"
+    WEIGHT_ONLY = "weight_only"
+
+
+def implements(aten_ops):
+    """Register aten ops to the NVFP4 op table"""
+
+    def decorator(func):
+        for op in aten_ops:
+            NVFP4_OPS_TABLE[op] = func
+        return func
+
+    return decorator
+
+
+class NVFP4Tensor(torch.Tensor):
+    """NVIDIA FP4 (NVFP4) Tensor subclass.
+
+    This implements the NVIDIA variant of MX FP4 format, which uses a specific
+    quantization algorithm for FP4 data with UE4M3 scales.
+
+    Attributes:
+        _scale_e4m3: Blockwise scales in float8_e4m3fn format
+        _per_tensor_scale: Optional global per-tensor scale in float32 format
+        _data: Packed FP4 data (2 values per byte)
+        _block_size: Block size for quantization (fixed at 16)
+        _orig_dtype: Original tensor dtype before quantization
+        mm_config: Matrix multiplication configuration
+    """
+
+    _scale_e4m3: torch.Tensor
+    _per_tensor_scale: Optional[torch.Tensor]
+    _data: torch.Tensor
+    _block_size: int
+    _orig_dtype: torch.dtype
+    mm_config: NVFP4MMConfig
+
+    def __new__(
+        cls,
+        blockwise_scales,
+        per_tensor_scale,
+        data_bits,
+        block_size,
+        orig_dtype,
+        mm_config=NVFP4MMConfig.DYNAMIC,
+    ):
+        # FP4 tensor size handling
+        new_size = data_bits.size()
+        new_size = tensor_size_fp4x2_to_hp(
+            new_size,
+            data_bits.is_contiguous(),
+        )
+
+        self = torch.Tensor._make_wrapper_subclass(
+            cls,
+            new_size,
+            dtype=orig_dtype,
+            device=data_bits.device,
+            requires_grad=False,
+        )
+
+        self._scale_e4m3 = blockwise_scales
+        self._per_tensor_scale = per_tensor_scale
+        self._data = data_bits
+        self._block_size = block_size
+        self._orig_dtype = orig_dtype
+        self.mm_config = mm_config
+        return self
+
+    def __repr__(self):
+        return f"NVFP4Tensor: blockwise_scales: {self._scale_e4m3}, per_tensor_scale: {self._per_tensor_scale}, d: {self._data}, d_hp: {self.to_dtype(self._orig_dtype)}"
+
+    @classmethod
+    def __torch_dispatch__(cls, func, types, args, kwargs=None):
+        # Use NVFP4-specific ops table
+        if func in NVFP4_OPS_TABLE:
+            return NVFP4_OPS_TABLE[func](func, types, args, kwargs)
+
+        raise NotImplementedError(f"{func} not implemented for NVFP4Tensor")
+
+    @staticmethod
+    def to_nvfp4(
+        data_hp: torch.Tensor,
+        block_size: int = 16,
+        per_tensor_scale: Optional[torch.Tensor] = None,
+        mm_config: NVFP4MMConfig = NVFP4MMConfig.DYNAMIC,
+    ):
+        """Convert high precision tensor to NVFP4 format.
+
+        Args:
+            data_hp: High precision input tensor (bfloat16 or float32)
+            block_size: Block size for quantization (must be 16)
+            per_tensor_amax: Optional pre-computed absolute maximum for calibration.
+                If provided, uses per-tensor scaling. If None, uses block-wise scaling only.
+
+        Returns:
+            NVFP4Tensor: Quantized tensor in NVFP4 format
+        """
+        blockwise_scales, data_lp = nvfp4_quantize(
+            data_hp, block_size, per_tensor_scale
+        )
+        return NVFP4Tensor(
+            blockwise_scales,
+            per_tensor_scale,
+            data_lp,
+            block_size,
+            data_hp.dtype,
+            mm_config,
+        )
+
+    def __tensor_flatten__(self):
+        ctx = {
+            "_block_size": self._block_size,
+            "_orig_dtype": self._orig_dtype,
+            "mm_config": self.mm_config,
+        }
+        tensor_list = ["_scale_e4m3", "_data"]
+        if self._per_tensor_scale is not None:
+            tensor_list.append("_per_tensor_scale")
+        return tensor_list, ctx
+
+    def _apply_fn_to_data(self, fn: Callable):
+        """Applies a fn to all tensor components stored on this class"""
+        tensor_names, ctx = self.__tensor_flatten__()
+        new_tensors = {}
+        for name in tensor_names:
+            new_tensors[name] = fn(getattr(self, name))
+        if "_per_tensor_scale" not in tensor_names:
+            new_tensors["_per_tensor_scale"] = None
+        return self.__class__.__tensor_unflatten__(
+            new_tensors,
+            ctx,
+            None,
+            None,
+        )
+
+    @staticmethod
+    def __tensor_unflatten__(
+        inner_tensors,
+        metadata,
+        outer_size,
+        outer_stride,
+    ):
+        return NVFP4Tensor(
+            inner_tensors["_scale_e4m3"],
+            inner_tensors.get("_per_tensor_scale", None),
+            inner_tensors["_data"],
+            metadata["_block_size"],
+            metadata["_orig_dtype"],
+            metadata["mm_config"],
+        )
+
+    # Do not force the NVFP4Tensor type on the returned tensor
+    __torch_function__ = torch._C._disabled_torch_function_impl
+
+    def to_dtype(self, target_dtype: torch.dtype) -> torch.Tensor:
+        """Convert NVFP4Tensor back to high precision dtype.
+
+        Args:
+            target_dtype: Target dtype for dequantization (e.g., torch.float32, torch.bfloat16)
+
+        Returns:
+            torch.Tensor: Dequantized tensor in the target dtype
+        """
+        is_transposed = not self._data.is_contiguous()
+        if is_transposed:
+            M, K = self.shape[1], self.shape[0]
+        else:
+            M, K = self.shape[0], self.shape[1]
+        data = self._data.t() if is_transposed else self._data
+        data_unpacked = unpack_uint4(data.contiguous().view(torch.uint8))
+        data_f32 = f4_unpacked_to_f32(data_unpacked)
+
+        data_f32 = data_f32.view(M, K // self._block_size, self._block_size)
+        scale_e4m3_reshaped = self.get_hp_scales().view(M, K // self._block_size, 1)
+        data_scaled = data_f32 * scale_e4m3_reshaped.to(torch.float32)
+        result = data_scaled.view(M, K).to(target_dtype)
+
+        if is_transposed:
+            result = result.t()
+
+        return result
+
+    def get_hp_scales(self) -> torch.Tensor:
+        """Get the scales of the NVFP4Tensor in original dtype.
+
+        Returns:
+            torch.Tensor: Scales of the NVFP4Tensor
+        """
+        return (
+            self._scale_e4m3.to(self._orig_dtype)
+            if not self._per_tensor_scale
+            else self._per_tensor_scale * self._scale_e4m3.to(self._orig_dtype)
+        )
+
+    @classmethod
+    def _same_metadata(cls, self: "NVFP4Tensor", src: "NVFP4Tensor") -> bool:
+        """Check if two NVFP4Tensors have the same metadata.
+
+        Args:
+            self: First NVFP4Tensor to compare
+            src: Second NVFP4Tensor to compare
+
+        Returns:
+            bool: True if both tensors have identical metadata, False otherwise
+        """
+        # Check per_tensor_scale equality
+        per_tensor_scale_equal = (
+            self._per_tensor_scale is None and src._per_tensor_scale is None
+        ) or (self._per_tensor_scale.shape == src._per_tensor_scale.shape)
+
+        return (
+            isinstance(self, NVFP4Tensor)
+            and isinstance(src, NVFP4Tensor)
+            and self._block_size == src._block_size
+            and self._orig_dtype == src._orig_dtype
+            and self._scale_e4m3.shape == src._scale_e4m3.shape
+            and per_tensor_scale_equal
+            and self._data.shape == src._data.shape
+        )
+
+
+@implements([aten.detach.default, aten.alias.default])
+def nvfp4_detach_alias(func, types, args, kwargs):
+    return return_and_correct_aliasing(
+        func, args, kwargs, args[0]._apply_fn_to_data(func)
+    )
+
+
+@implements([aten._to_copy.default])
+def nvfp4_to_copy(func, types, args, kwargs):
+    """Autocast + device movement"""
+    assert isinstance(args[0], NVFP4Tensor)
+
+    # Handle dtype parameter
+    dtype = kwargs.pop("dtype", None)
+    if dtype is not None:
+        assert dtype in {
+            torch.float16,
+            torch.bfloat16,
+            torch.float32,
+        }, "Only support floating point conversion for autocast w/ NVFP4Tensor"
+
+    # Handle device parameter
+    device = kwargs.pop("device", None)
+    if device is not None:
+        # Apply device change using _apply_fn_to_data
+        tensor = args[0]._apply_fn_to_data(lambda x: func(x, device=device))
+        tensor = return_and_correct_aliasing(func, args, {}, tensor)
+    else:
+        tensor = args[0]
+
+    if dtype is not None:
+        res = NVFP4Tensor(
+            tensor._scale_e4m3,
+            tensor._per_tensor_scale,
+            tensor._data,
+            tensor._block_size,
+            dtype,
+            tensor.mm_config,
+        )
+        return res
+
+    return tensor
+
+
+@implements([aten.copy_.default])
+def nvfp4_copy_(func, types, args, kwargs):
+    self = args[0]
+    src = args[1]
+    if NVFP4Tensor._same_metadata(self, src):
+        self_tensors = self.__tensor_flatten__()[0]
+        for tensor_name in self_tensors:
+            getattr(self, tensor_name).copy_(getattr(src, tensor_name))
+        return self
+    raise ValueError(
+        f"Not supported args for copy_ due to metadata mismatch: {self}, {src}"
+    )
+
+
+@implements([aten.clone.default])
+def nvfp4_clone(func, types, args, kwargs):
+    self = args[0]
+    memory_format = kwargs.get("memory_format", None)
+
+    if memory_format is not None:
+        clone_fn = lambda x: x.clone(memory_format=memory_format)
+    else:
+        clone_fn = lambda x: x.clone()
+
+    return self._apply_fn_to_data(clone_fn)
+
+
+@implements([aten.slice.Tensor])
+def nvfp4_slice(func, types, args, kwargs):
+    x, dim, start, end, step = fill_defaults(args, 5, [0, None, None, 1])
+
+    if step != 1:
+        raise ValueError("Only support aten.slice with step=1")
+
+    assert x._data.is_contiguous(), "Only support contiguous data for now"
+
+    M, K = x.shape[0], x.shape[1]
+    scale_shaped = x._scale_e4m3.view(M, K // x._block_size)
+
+    if dim == 0:
+        # Slicing along the first dimension (rows)
+        sliced_scale = aten.slice.Tensor(scale_shaped, dim, start, end, step).flatten()
+        sliced_data = aten.slice.Tensor(x._data, dim, start, end, step)
+    elif dim == 1:
+        # Slicing along reduction dim - must align with block boundaries
+        if start is not None:
+            assert start % x._block_size == 0, (
+                f"Start index {start} must be a multiple of block_size {x._block_size}"
+            )
+
+        if end is not None:
+            assert end % x._block_size == 0, (
+                f"End index {end} must be a multiple of block_size {x._block_size}"
+            )
+
+        sliced_data = aten.slice.Tensor(x._data, dim, start, end, step)
+
+        # Calculate which scale blocks to keep
+        start_block = 0 if start is None else start // x._block_size
+        end_block = None if end is None else end // x._block_size
+
+        # Slice the scale tensor accordingly
+        sliced_scale = aten.slice.Tensor(scale_shaped, 1, start_block, end_block, step)
+    else:
+        raise ValueError(
+            f"NVFP4Tensor only supports slicing along dimensions 0 and 1, got dim={dim}"
+        )
+
+    return NVFP4Tensor(
+        sliced_scale,
+        x._per_tensor_scale,  # Unchanged per-tensor scale
+        sliced_data,
+        x._block_size,
+        x._orig_dtype,
+        x.mm_config,
+    )
+
+
+@implements([aten.t.default])
+def nvfp4_t(func, types, args, kwargs):
+    # For now, only transpose(input, 0, 1) is supported.
+    old = args[0]
+    new = NVFP4Tensor(
+        old._scale_e4m3,
+        old._per_tensor_scale,
+        old._data.t(),
+        old._block_size,
+        old._orig_dtype,
+        old.mm_config,
+    )
+    return new
+
+
+@implements([aten.view.default])
+def nvfp4_view_op(func, types, args, kwargs):
+    data = args[0]._data
+    new_size = args[1]
+    new_size = tensor_size_hp_to_fp4x2(new_size, data.is_contiguous())
+    new_data = func(data, new_size, *args[2:], **kwargs)
+    return NVFP4Tensor(
+        args[0]._scale_e4m3,
+        args[0]._per_tensor_scale,
+        new_data,
+        args[0]._block_size,
+        args[0]._orig_dtype,
+        args[0].mm_config,
+    )
+
+
+def _addmm_nvfp4_dispatch(
+    a: NVFP4Tensor, b: NVFP4Tensor, aten_op, bias: Optional[torch.Tensor] = None
+) -> torch.Tensor:
+    """
+    Core implementation shared between nvfp4_mm, nvfp4_addmm, and nvfp4_linear.
+    The only difference is whether bias is None or not.
+    """
+    assert a._data.is_contiguous()
+    assert b._data.t().is_contiguous()
+    assert a._block_size == 16, f"NVFP4 requires block_size=16, got {a._block_size}"
+    assert b._block_size == 16, f"NVFP4 requires block_size=16, got {b._block_size}"
+
+    M, K = a.shape[0], a.shape[1]
+    N = b.shape[1]
+
+    # Swizzle Dizzle
+    a_scale = a._scale_e4m3.view(M, K // a._block_size)
+    b_scale = b._scale_e4m3.view(N, K // b._block_size)
+    a_scale_blocked = to_blocked(a_scale)
+    b_scale_blocked = to_blocked(b_scale)
+
+    # Merge double quant scales into 1 scale for Scale_In^D
+    if a._per_tensor_scale is not None:
+        assert b._per_tensor_scale is not None
+        scale_result = a._per_tensor_scale * b._per_tensor_scale
+    else:
+        assert b._per_tensor_scale is None and a._per_tensor_scale is None
+        scale_result = None
+
+    # THIS IS A WORKAROUND:
+    # RuntimeError: CUDA error: CUBLAS_STATUS_INVALID_VALUE when calling
+    # When we have per-tensor scaling, we need to apply it before bias
+    # since bias is not quantized
+    should_add_bias_separately = (scale_result is not None) and (bias is not None)
+
+    result = torch._scaled_mm(
+        a._data.view(torch.float4_e2m1fn_x2),
+        b._data.view(torch.float4_e2m1fn_x2),
+        a_scale_blocked.view(torch.float8_e4m3fn),
+        b_scale_blocked.view(torch.float8_e4m3fn),
+        bias=None if should_add_bias_separately else bias,
+        out_dtype=a._orig_dtype,
+        # scale_result=scale_result,  # Not supported yet
+    )
+
+    if scale_result is not None:
+        result = result * scale_result.to(a._orig_dtype)
+
+    # Add bias after scaling if needed
+    if should_add_bias_separately:
+        result = result + bias
+
+    return result
+
+
+@implements([torch.nn.functional.linear, aten.linear.default])
+def nvfp4_linear(func, types, args, kwargs):
+    input_tensor, weight_tensor, bias = (
+        args[0],
+        args[1],
+        args[2] if len(args) > 2 else None,
+    )
+
+    if not isinstance(weight_tensor, NVFP4Tensor):
+        raise NotImplementedError("NVFP4Tensor: weight must be NVFP4Tensor")
+
+    config = weight_tensor.mm_config
+
+    if config == NVFP4MMConfig.WEIGHT_ONLY:
+        weight_dequant = weight_tensor.to_dtype(weight_tensor._orig_dtype)
+        return torch.nn.functional.linear(input_tensor, weight_dequant, bias)
+    else:
+        input_quant = NVFP4Tensor.to_nvfp4(input_tensor, mm_config=config)
+        return _addmm_nvfp4_dispatch(input_quant, weight_tensor, func, bias=bias)
+
+
+@implements([aten.mm.default, aten.matmul.default])
+def nvfp4_mm(func, types, args, kwargs):
+    input_tensor, weight_tensor = args[0], args[1]
+
+    if not isinstance(weight_tensor, NVFP4Tensor):
+        raise NotImplementedError("NVFP4Tensor: weight must be NVFP4Tensor")
+
+    config = weight_tensor.mm_config
+
+    if config == NVFP4MMConfig.WEIGHT_ONLY:
+        weight_dequant = weight_tensor.to_dtype(weight_tensor._orig_dtype)
+        if isinstance(input_tensor, NVFP4Tensor):
+            input_dequant = input_tensor.to_dtype(input_tensor._orig_dtype)
+            return func(input_dequant, weight_dequant)
+        else:
+            return func(input_tensor, weight_dequant)
+    else:
+        if not isinstance(input_tensor, NVFP4Tensor):
+            input_tensor = NVFP4Tensor.to_nvfp4(input_tensor, mm_config=config)
+        return _addmm_nvfp4_dispatch(input_tensor, weight_tensor, func)
+
+
+@implements([aten.addmm.default])
+def nvfp4_addmm(func, types, args, kwargs):
+    bias, input_tensor, weight_tensor = args[0], args[1], args[2]
+
+    if not isinstance(weight_tensor, NVFP4Tensor):
+        raise NotImplementedError("NVFP4Tensor: weight must be NVFP4Tensor")
+
+    config = weight_tensor.mm_config
+
+    if config == NVFP4MMConfig.WEIGHT_ONLY:
+        weight_dequant = weight_tensor.to_dtype(weight_tensor._orig_dtype)
+        if isinstance(input_tensor, NVFP4Tensor):
+            input_dequant = input_tensor.to_dtype(input_tensor._orig_dtype)
+            return torch.addmm(bias, input_dequant, weight_dequant)
+        else:
+            return torch.addmm(bias, input_tensor, weight_dequant)
+    else:
+        if not isinstance(input_tensor, NVFP4Tensor):
+            input_tensor = NVFP4Tensor.to_nvfp4(input_tensor, mm_config=config)
+        return _addmm_nvfp4_dispatch(input_tensor, weight_tensor, func, bias=bias)
+
+
+def per_tensor_amax_to_scale(amax: torch.Tensor) -> torch.Tensor:
+    """Convert per-tensor amax to per-tensor scale.
+    Used to scale fp32 scales down to fp8 scales
+
+    Args:
+        amax: Per-tensor amax tensor
+
+    Returns:
+        torch.Tensor: Per-tensor scale tensor
+    """
+    return torch.clamp(amax / F8E4M3_MAX, min=E4M3_EPS, max=F8E4M3_MAX).to(
+        torch.float32
+    )
+
+
+def nvfp4_quantize(
+    data_hp: torch.Tensor,
+    block_size: int = 16,
+    per_tensor_scale: Optional[torch.Tensor] = None,
+) -> tuple[torch.Tensor, torch.Tensor]:
+    """NVIDIA FP4 quantization with UE4M3 scales.
+
+    Implements the NVIDIA algorithm for quantizing tensors to FP4 format
+    with unsigned E4M3 (UE4M3) scales.
+
+    Args:
+        data_hp: High precision input tensor (bfloat16 or float32)
+        block_size: Block size for quantization (must be 16)
+        per_tensor_amax: Optional pre-computed absolute maximum for calibration.
+            If provided, uses per-tensor scaling. If None, uses block-wise scaling only.
+
+    Returns:
+        tuple: A tuple containing:
+            - total_scale_fp8: Blockwise scales in float8_e4m3fn format
+            - per_tensor_scale: Global per-tensor scale if per_tensor_amax provided, else None
+            - data_lp: Packed FP4 data (2 values per byte)
+
+    Raises:
+        AssertionError: If input dtype is not supported, tensor size is not
+            divisible by block_size, tensor is not contiguous, or block_size != 16
+    """
+    assert data_hp.dtype in (torch.bfloat16, torch.float), (
+        f"{data_hp.dtype} not supported"
+    )
+    assert data_hp.numel() % block_size == 0, "unsupported"
+    assert data_hp.is_contiguous(), "unsupported"
+    assert block_size == 16, "NVFP4 requires block_size=16"
+
+    orig_shape = data_hp.shape
+    data_hp = data_hp.reshape(orig_shape[0], -1, block_size)
+
+    max_abs = torch.amax(torch.abs(data_hp), dim=-1)
+    # These scales are currently in fp32, we are going to `quantize` them to e4m3
+    block_scale = max_abs / F4_E2M1_MAX
+
+    out_scales = None
+    if per_tensor_scale is None:
+        # We are doing single level scaling
+        block_scale_fp8 = torch.clamp(block_scale, min=E4M3_EPS, max=F8E4M3_MAX).to(
+            torch.float8_e4m3fn
+        )
+        block_scale_fp32 = block_scale_fp8.to(torch.float32)
+        data_scaled = data_hp / block_scale_fp32.unsqueeze(-1)
+        out_scales = block_scale_fp8
+    else:
+        # We are doing two level scaling,
+        # This will likely be calibrated but
+        # we want the per_tensor_scale ~= amax of the block_scale_fp32
+        block_scale_fp32 = block_scale.to(torch.float32)
+        # Quantize the blockwise scales w/ the per_tensor_scale
+        scaled_block_scales = block_scale_fp32 / per_tensor_scale
+        scaled_block_scales_fp8 = torch.clamp(
+            scaled_block_scales, min=E4M3_EPS, max=F8E4M3_MAX
+        ).to(torch.float8_e4m3fn)
+        scaled_block_scales_fp32 = scaled_block_scales_fp8.to(torch.float32)
+        # We "temporarily" dequant the scaled_block_scales_fp32 to get the per_tensor_scale
+        # To apply to data
+        total_scale = per_tensor_scale * scaled_block_scales_fp32
+        data_scaled = data_hp / total_scale.unsqueeze(-1)
+        out_scales = scaled_block_scales_fp8
+
+    data_scaled = torch.clamp(data_scaled, -F4_E2M1_MAX, F4_E2M1_MAX)
+    data_scaled = data_scaled.view(orig_shape)
+    data_lp = f32_to_f4_unpacked(data_scaled.float())
+    # TODO: NotImplementedError: "copy_kernel" not implemented for 'Float4_e2m1fn_x2'
+    # data_lp = pack_uint4(data_lp).view(torch.float4_e2m1fn_x2)
+    data_lp = pack_uint4(data_lp)
+    return out_scales, data_lp

From 32599bee3dadf9ba9b6e55f70b2e7ca49fba2d96 Mon Sep 17 00:00:00 2001
From: Vasiliy Kuznetsov <vkuzo@users.noreply.github.com>
Date: Tue, 24 Jun 2025 15:26:47 -0400
Subject: [PATCH 153/165] enable tensor parallelism for MXLinear (#2434)

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]

* Update

[ghstack-poisoned]
---
 test/prototype/mx_formats/test_mx_dtensor.py | 12 ++---
 test/prototype/mx_formats/test_mx_linear.py  |  4 +-
 test/prototype/mx_formats/test_mx_tensor.py  |  2 +-
 torchao/prototype/mx_formats/kernels.py      |  8 ++--
 torchao/prototype/mx_formats/mx_tensor.py    | 50 ++++++++++----------
 torchao/testing/training/dtensor_utils.py    | 11 +++--
 6 files changed, 45 insertions(+), 42 deletions(-)

diff --git a/test/prototype/mx_formats/test_mx_dtensor.py b/test/prototype/mx_formats/test_mx_dtensor.py
index bfc930c579..4aefb3874e 100644
--- a/test/prototype/mx_formats/test_mx_dtensor.py
+++ b/test/prototype/mx_formats/test_mx_dtensor.py
@@ -68,24 +68,22 @@ def _test_dtensor_cast_to_mxfp8(mesh: DeviceMesh, size=4):
     )
 
 
-def _test_mxfp8_mlp_tensor_parallelism_eager(mesh: DeviceMesh, size=16):
+def _test_mxfp8_mlp_tensor_parallelism(mesh: DeviceMesh, size=16):
     config = MXLinearConfig.from_recipe_name("mxfp8_emulated")
-    # TODO(future PR): assert that the K dim must be divisible by block size,
-    # today this is silently incorrect if block_size is greater than K
     config.block_size = 16
     _test_lowp_mlp_tensor_parallelism_base(
         mesh, config, size, compile=False, allgather_in_lowp=False
     )
-
-    # TODO(future PR): compile
+    _test_lowp_mlp_tensor_parallelism_base(
+        mesh, config, size, compile=True, allgather_in_lowp=False
+    )
 
 
 if __name__ == "__main__":
     device_mesh = setup_distributed()
     tests = [
         _test_dtensor_cast_to_mxfp8,
-        # TODO(next PR): enable this (current PR got too large, so splitting)
-        # _test_mxfp8_mlp_tensor_parallelism_eager,
+        _test_mxfp8_mlp_tensor_parallelism,
     ]
 
     for test in tqdm(tests, desc="Running tests"):
diff --git a/test/prototype/mx_formats/test_mx_linear.py b/test/prototype/mx_formats/test_mx_linear.py
index 0e39264742..8a69737889 100644
--- a/test/prototype/mx_formats/test_mx_linear.py
+++ b/test/prototype/mx_formats/test_mx_linear.py
@@ -195,8 +195,8 @@ def test_linear_eager_emulated_vs_real_gemm(recipe_name, mkn):
 # TODO(future): enable compile support
 @pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
 def test_activation_checkpointing():
-    input_shape = (2, 4)
-    grad_shape = (2, 8)
+    input_shape = (16, 4)
+    grad_shape = (16, 8)
     elem_dtype = torch.float8_e4m3fn
 
     m = nn.Sequential(
diff --git a/test/prototype/mx_formats/test_mx_tensor.py b/test/prototype/mx_formats/test_mx_tensor.py
index 0490b0b1ee..7294590b57 100644
--- a/test/prototype/mx_formats/test_mx_tensor.py
+++ b/test/prototype/mx_formats/test_mx_tensor.py
@@ -73,7 +73,7 @@ def assert_sqnr_gt_threshold(orig, new, threshold):
 @pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
 @pytest.mark.parametrize("elem_dtype", SUPPORTED_ELEM_DTYPES)
 def test_hello_world(elem_dtype):
-    data = torch.randn(4, 4, device="cuda", dtype=torch.bfloat16)
+    data = torch.randn(8, 8, device="cuda", dtype=torch.bfloat16)
     block_size = 4
     _test_mx(data, elem_dtype, block_size)
 
diff --git a/torchao/prototype/mx_formats/kernels.py b/torchao/prototype/mx_formats/kernels.py
index f96e73a55a..72cbba1802 100644
--- a/torchao/prototype/mx_formats/kernels.py
+++ b/torchao/prototype/mx_formats/kernels.py
@@ -1056,7 +1056,7 @@ def pack_uint6(uint8_data: torch.Tensor) -> torch.Tensor:
 
         # effective mx block size since we're packing 2 fp4 into 1 uint8
         packed_mx_block_size = 3 * mx_block_size // 4
-        packed_shape = [uint8_data.shape[0], packed_mx_block_size]
+        packed_shape = [*uint8_data.shape[:-1], packed_mx_block_size]
         n_mx_blocks = uint8_data.numel() // mx_block_size
 
         grid = lambda meta: (triton.cdiv(n_mx_blocks, meta["BLOCK_SIZE_IN"]),)
@@ -1337,7 +1337,9 @@ def triton_to_mxfp8_dim1(
 
         # Create scale tensors
         col_scale = torch.empty(
-            (n_cols * n_rows // inner_block_size, 1), dtype=torch.uint8, device=x.device
+            (n_cols, n_rows // inner_block_size, 1),
+            dtype=torch.uint8,
+            device=x.device,
         )
 
         # Calculate grid dimensions based on tile size
@@ -1374,7 +1376,7 @@ def triton_to_mxfp8_dim1_reference(
         scale_e8m0_dim1, x_hp_d1_normalized = to_mx(
             x_hp_d1, torch.float8_e4m3fn, block_size
         )
-        scale_e8m0_dim1 = scale_e8m0_dim1.unsqueeze(1).view(torch.float8_e8m0fnu)
+        scale_e8m0_dim1 = scale_e8m0_dim1.view(torch.float8_e8m0fnu)
         return (
             x_hp_d1_normalized.t(),
             scale_e8m0_dim1,
diff --git a/torchao/prototype/mx_formats/mx_tensor.py b/torchao/prototype/mx_formats/mx_tensor.py
index ef9ae42fcd..e98878af77 100644
--- a/torchao/prototype/mx_formats/mx_tensor.py
+++ b/torchao/prototype/mx_formats/mx_tensor.py
@@ -25,7 +25,6 @@
 
 from torchao.prototype.mx_formats.config import MXGemmKernelChoice
 from torchao.prototype.mx_formats.constants import (
-    BF16_EXP_BIAS,
     BLOCK_SIZE_DEFAULT,
     DTYPE_FP6_E2M3,
     DTYPE_FP6_E3M2,
@@ -62,7 +61,6 @@
 
 # TODO(later): read from somewhere else?
 SBITS, EBITS_F32, MBITS_F32 = 1, 8, 23
-EBITS_BF16, MBITS_BF16 = 8, 7
 EBITS_F4_E2M1, MBITS_F4_E2M1 = 2, 1
 EBITS_F6_E2M3, MBITS_F6_E2M3 = 2, 3
 EBITS_F6_E3M2, MBITS_F6_E3M2 = 3, 2
@@ -137,9 +135,7 @@ def _to_mx_rceil(
     )
 
     # scale and saturated cast the data elements to max of target dtype
-    data_lp = torch.clamp(
-        data_hp * descale_fp.unsqueeze(1), min=-1 * max_pos, max=max_pos
-    )
+    data_lp = torch.clamp(data_hp * descale_fp, min=-1 * max_pos, max=max_pos)
     return exponent, data_lp
 
 
@@ -160,22 +156,33 @@ def to_mx(
         torch.float,
     ), f"{data_hp.dtype} is not supported yet"
     # TODO(future PR): consider supporting padding
-    assert data_hp.numel() % block_size == 0, "unsupported"
+    assert data_hp.shape[-1] % block_size == 0, (
+        f"the last dimension of shape {data_hp.shape} must be divisible by block_size {block_size}"
+    )
     assert data_hp.is_contiguous(), "unsupported"
     assert elem_dtype in SUPPORTED_ELEM_DTYPES, "unsupported"
 
-    # calculate the scale in e8m0 format
-
     orig_shape = data_hp.shape
-    # TODO(future PR): fix this line for TP, currently this reshape does not work
-    # for rank 3 tensor where dim1 is sharded
-    data_hp = data_hp.reshape(-1, block_size)
+    data_hp = data_hp.reshape(
+        *orig_shape[:-1], orig_shape[-1] // block_size, block_size
+    )
 
     # find max value of the data
     # Note: this only implements the `minimally supported` version of
     # https://www.opencompute.org/documents/ocp-microscaling-formats-mx-v1-0-spec-final-pdf
     # section 6.3.
-    max_abs = torch.amax(torch.abs(data_hp), 1)
+    max_abs = torch.amax(torch.abs(data_hp), -1).unsqueeze(-1)
+
+    # We cast to float32 here because
+    # in the `max_abs_int32 = max_abs.view(hp_int_dtype)` line below,
+    # if tensor parallel is enabled then the resulting shape is 2x larger
+    # than it should be under some conditions, likely because of a bug in
+    # the `view` op with DTensor and target dtype int16.  I reproduce in
+    # torchtitan but not in a unit test, so not enough info to file a good
+    # issue in pytorch/pytorch. For now, work around. In the future we should
+    # debug and fix this properly.
+    data_hp = data_hp.to(torch.float32)
+    max_abs = max_abs.to(torch.float32)
 
     # Set X to be the largest power-of-two less than or equal to
     # max_abs(v), divided by the largest power of two representable
@@ -206,17 +213,11 @@ def to_mx(
     if scaling_mode == ScaleCalculationMode.RCEIL:
         scale_e8m0_biased, data_lp = _to_mx_rceil(data_hp, max_abs, max_pos)
     else:
-        if data_hp.dtype is torch.float32:
-            hp_int_dtype = torch.int32
-            hp_mbits = MBITS_F32
-            hp_ebits = EBITS_F32
-            hp_exp_bias = F32_EXP_BIAS
-        else:
-            assert data_hp.dtype is torch.bfloat16
-            hp_int_dtype = torch.int16
-            hp_mbits = MBITS_BF16
-            hp_ebits = EBITS_BF16
-            hp_exp_bias = BF16_EXP_BIAS
+        assert data_hp.dtype is torch.float32
+        hp_int_dtype = torch.int32
+        hp_mbits = MBITS_F32
+        hp_ebits = EBITS_F32
+        hp_exp_bias = F32_EXP_BIAS
 
         # rounding before calculating the largest power of 2
         # X = 2^(floor(log2(rounding(max_abs(v)))-max_exp))
@@ -285,7 +286,7 @@ def to_mx(
         scale_fp32 = torch.clamp(scale_fp32, min=F32_MIN_NORMAL)
 
         # scale and saturated cast the data elements to max of target dtype
-        data_lp = data_hp / scale_fp32.unsqueeze(1)
+        data_lp = data_hp / scale_fp32
 
         if (
             elem_dtype in (torch.float8_e4m3fn, torch.float8_e5m2)
@@ -511,7 +512,6 @@ def __new__(
         assert scale_e8m0_bits.dtype == torch.float8_e8m0fnu, (
             f"scale_e8m0_bits.dtype must be `torch.float8_e8m0fnu`, got {scale_e8m0_bits.dtype}"
         )
-        assert len(scale_e8m0_bits.shape) == 1, "unsupported"
         assert data_bits.dtype in (
             torch.float8_e4m3fn,
             torch.float8_e5m2,
diff --git a/torchao/testing/training/dtensor_utils.py b/torchao/testing/training/dtensor_utils.py
index 815ee20969..7ebf67d53c 100644
--- a/torchao/testing/training/dtensor_utils.py
+++ b/torchao/testing/training/dtensor_utils.py
@@ -152,15 +152,18 @@ def _test_lowp_mlp_tensor_parallelism_base(
         sp_model2 = torch.compile(sp_model2)
 
     x_fp32 = torch.rand(size, size * 2, size, device=device, requires_grad=False)
+    go_fp32 = torch.rand(size, size * 2, size, device=device, requires_grad=False)
     x_fp32_tp_input = x_fp32.clone()
+    go_fp32_tp = go_fp32.clone()
     x_fp32_sp_input = distribute_tensor(x_fp32.clone(), mesh, [Shard(0)])
+    go_fp32_sp = distribute_tensor(go_fp32.clone(), mesh, [Shard(0)])
 
     tp_out = tp_model(x_fp32_tp_input)
-    tp_out.sum().backward()
+    tp_out.backward(go_fp32_tp)
     sp_out = sp_model(x_fp32_sp_input)
-    sp_out.sum().backward()
+    sp_out.backward(go_fp32_sp)
     global_out = toy_model_fp8(x_fp32)
-    global_out.sum().backward()
+    global_out.backward(go_fp32)
     torch.testing.assert_close(tp_out, global_out)
     torch.testing.assert_close(sp_out.full_tensor(), global_out)
     torch.testing.assert_close(tp_model.ffn.w1.weight.grad, sp_model.ffn.w1.weight.grad)
@@ -169,7 +172,7 @@ def _test_lowp_mlp_tensor_parallelism_base(
     )
 
     sp_out2 = sp_model2(x_fp32_sp_input)
-    sp_out2.sum().backward()
+    sp_out2.backward(go_fp32_sp)
     torch.testing.assert_close(sp_out2.full_tensor(), global_out)
     torch.testing.assert_close(
         tp_model.ffn.w1.weight.grad, sp_model2.ffn.w1.weight.grad

From 7a846d5578a0c9c0111b82f367cb426d2639812e Mon Sep 17 00:00:00 2001
From: mobicham <37179323+mobicham@users.noreply.github.com>
Date: Tue, 24 Jun 2025 21:29:21 +0200
Subject: [PATCH 154/165] Gemlite generate.py fix (#2372)

* fix get_plain() with FMA mode

* update

* fix in_features/out_feature meta-data mismatch

* update gemlite slice test

* add packing_bitwidth support

* add packing_bitwidth support and cleanup

* update default gemlite layout

* cleanup

* fix symmetric use-case and relax _same_meta_data

* _copy() meta data

* fix (4,) in autoquant

* Add dynamic mode in gemlite layout

* mode explanation

Signed-off-by: mobicham <hicham@mobiuslabs.com>

* use weights_only instead of static

* generate fix

Signed-off-by: mobicham <hicham@mobiuslabs.com>

* remove set_packing_bitwidth

---------

Signed-off-by: mobicham <hicham@mobiuslabs.com>
---
 torchao/_models/llama/benchmarks.sh | 18 +++++--------
 torchao/_models/llama/generate.py   | 39 +++++++++++------------------
 2 files changed, 20 insertions(+), 37 deletions(-)

diff --git a/torchao/_models/llama/benchmarks.sh b/torchao/_models/llama/benchmarks.sh
index 4c11b193d5..ed01500c33 100644
--- a/torchao/_models/llama/benchmarks.sh
+++ b/torchao/_models/llama/benchmarks.sh
@@ -97,19 +97,13 @@ python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --co
 python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --compile_prefill --quantization sparse-marlin --write_result benchmark_results.txt --prefill_size 8000 --precision float16 --sparsity semi-structured
 
 # gemlite benchmarks
-python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-8-4-64  --write_result benchmark_results.txt
-python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-32-4-64  --write_result benchmark_results.txt
-python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-8-4-None  --write_result benchmark_results.txt
-python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-32-4-None  --write_result benchmark_results.txt
-python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-8-8-None  --write_result benchmark_results.txt
-python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-32-8-None  --write_result benchmark_results.txt
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-4-64-wo  --write_result benchmark_results.txt
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-4-128-wo  --write_result benchmark_results.txt
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-8-None-dq  --write_result benchmark_results.txt
 
-python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-8-4-64  --write_result benchmark_results.txt  --batch_size 32
-python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-32-4-64  --write_result benchmark_results.txt  --batch_size 32
-python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-8-4-None  --write_result benchmark_results.txt  --batch_size 32
-python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-32-4-None  --write_result benchmark_results.txt --batch_size 32
-python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-8-8-None  --write_result benchmark_results.txt --batch_size 32
-python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-32-8-None  --write_result benchmark_results.txt --batch_size 32
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-4-64-wo  --write_result benchmark_results.txt --batch_size 32
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-4-128-wo  --write_result benchmark_results.txt --batch_size 32
+python generate.py --checkpoint_path $CHECKPOINT_PATH/$MODEL_REPO/model.pth --compile --precision float16 --quantization gemlite-8-None-dq  --write_result benchmark_results.txt --batch_size 32
 
 # 2:4 sparse model
 export MODEL_REPO=nm-testing/SparseLlama-3-8B-pruned_50.2of4
diff --git a/torchao/_models/llama/generate.py b/torchao/_models/llama/generate.py
index 0cf166103b..8f02e83a99 100644
--- a/torchao/_models/llama/generate.py
+++ b/torchao/_models/llama/generate.py
@@ -244,7 +244,7 @@ def encode_tokens(tokenizer, string, bos=True, device=default_device):
 
 def _load_model(checkpoint_path, device, precision):
     checkpoint = torch.load(
-        str(checkpoint_path), mmap=True, weights_only=True, map_location=device
+        str(checkpoint_path), mmap=True, weights_only=True, map_location="cpu"
     )
     if "model" in checkpoint and "stories" in str(checkpoint_path):
         checkpoint = checkpoint["model"]
@@ -366,34 +366,24 @@ def ffn_or_attn_only(mod, fqn):
             import os
             import pwd
 
-            from gemlite.core import GemLiteLinearTriton
+            import gemlite
+
+            gemlite.set_autotune("max")
+            config_file = f"/tmp/{pwd.getpwuid(os.getuid()).pw_gecos}_gemlite.json"
 
             _quant_args = quantization.split("-")
-            bit_width = int(_quant_args[-2])
-            group_size = None if _quant_args[-1] == "None" else int(_quant_args[-1])
-            try:
-                packing_bitwidth = int(_quant_args[-3])
-            except:
-                # if only 2 inputs found, use default value
-                packing_bitwidth = 32
+            bit_width = int(_quant_args[1])
+            group_size = None if _quant_args[2] == "None" else int(_quant_args[2])
+            mode = "dynamic" if _quant_args[3] == "dq" else "weight_only"
 
             quantize_(
                 model,
-                gemlite_uintx_weight_only(group_size, bit_width, packing_bitwidth),
+                gemlite_uintx_weight_only(
+                    bit_width=bit_width, group_size=group_size, mode=mode
+                ),
             )
 
-            # try to load gemlite kernel config
-            try:
-                GemLiteLinearTriton.load_config(
-                    f"/tmp/{pwd.getpwuid(os.getuid()).pw_gecos}_gemlite.json"
-                )
-                print(
-                    f"loaded gemlite kernel cache /tmp/{pwd.getpwuid(os.getuid()).pw_gecos}_gemlite.json"
-                )
-            except:
-                print(
-                    f"unable to load gemlite kernel cache /tmp/{pwd.getpwuid(os.getuid()).pw_gecos}_gemlite.json"
-                )
+            gemlite.load_config(config_file)
 
             print("running gemlite warmup")
             generate(
@@ -405,9 +395,8 @@ def ffn_or_attn_only(mod, fqn):
                 temperature=temperature,
                 top_k=top_k,
             )
-            GemLiteLinearTriton.cache_config(
-                f"/tmp/{pwd.getpwuid(os.getuid()).pw_gecos}_gemlite.json"
-            )
+            gemlite.cache_config(config_file)
+
         if "int8wo" in quantization:
             quantize_(model, int8_weight_only())
         if "int8dq" in quantization:

From faf788a1752dd8fbe3c529e6fe3612e68324651f Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Tue, 24 Jun 2025 12:59:38 -0700
Subject: [PATCH 155/165] add-to-benchmarks (#2427)

---
 benchmarks/float8/bench_matmul.py          | 93 +++++++++++++++++-----
 benchmarks/float8/utils.py                 |  9 +--
 torchao/testing/training/roofline_utils.py |  7 ++
 3 files changed, 84 insertions(+), 25 deletions(-)

diff --git a/benchmarks/float8/bench_matmul.py b/benchmarks/float8/bench_matmul.py
index cf844fa51b..30ea2eab39 100644
--- a/benchmarks/float8/bench_matmul.py
+++ b/benchmarks/float8/bench_matmul.py
@@ -16,6 +16,8 @@
     get_name_to_shapes_iter,
 )
 
+from torchao.ops import mx_fp4_bf16
+from torchao.prototype.mx_formats.mx_tensor import to_mx
 from torchao.testing.training.roofline_utils import get_specs
 
 
@@ -62,29 +64,38 @@ def run(
 ):
     device = "cuda"
     # TODO(future PR): this is ugly
-    assert recipe in ("tensorwise", "rowwise", "mxfp8_cublas"), "unsupported"
+    assert recipe in (
+        "tensorwise",
+        "rowwise",
+        "mxfp8_cublas",
+        "mxfp4_cutlass",
+        "nvfp4",
+    ), "unsupported"
+    use_fp4 = recipe in ("mxfp4_cutlass", "nvfp4")
 
     specs = get_specs()
     bf16_peak_tops = specs["bf16_peak_tops"]
     fp8_peak_tops = specs["fp8_peak_tops"]
+    fp4_peak_tops = specs["fp4_peak_tops"]
     print(f"gpu_name: {torch.cuda.get_device_name(0)}")
-    print(f"peak tops: bf16 {bf16_peak_tops:.2e}, fp8 {fp8_peak_tops:.2e}")
-
+    print(
+        f"peak tops: bf16 {bf16_peak_tops:.2e}, fp8 {fp8_peak_tops:.2e}, fp4 {fp4_peak_tops:.2e}"
+    )
     headers = (
         "fast_accum",
         "name",
         "M",
         "K",
         "N",
-        "ref_time_s",
-        "fp8_time_s",
+        "time_s",
+        "speedup",
         "fp8_speedup",
     )
     results = []
 
     dtype = torch.bfloat16
     name_to_shapes = get_name_to_shapes_iter(shape_gen_name, M, K, N)
-    fast_accum_vals = [True, False]
+    fast_accum_vals = [False] if use_fp4 else [True, False]
 
     for idx, (fast_accum, (name, (M, K, N))) in enumerate(
         itertools.product(fast_accum_vals, name_to_shapes)
@@ -107,38 +118,82 @@ def run(
 
         del A
 
-        # raw float8 matmul (upper bound for what we can achive in eager mode)
-        # TODO(future): add e5m2
-        d1, d2, d3 = torch.float8_e4m3fn, torch.float8_e4m3fn, dtype
-        A = torch.zeros(M, K, device=device, dtype=d1)
-        B = torch.zeros(K, N, device=device, dtype=d2).t().contiguous().t()
+        A_hp = torch.randn(M, K, device=device)
+        B_hp_t = torch.randn(N, K, device=device)
+
+        if recipe == "mxfp4_cutlass":
+            _, A = to_mx(A_hp, torch.float4_e2m1fn_x2, 32)
+            _, Bt = to_mx(B_hp_t, torch.float4_e2m1fn_x2, 32)
+            B = Bt.contiguous().T
+            peak_tops = fp4_peak_tops
+        elif recipe == "nvfp4":
+            from torchao.prototype.mx_formats.nvfp4_tensor import nvfp4_quantize
+
+            A_scales, A_data = nvfp4_quantize(A_hp, block_size=16)
+            B_scales, B_data = nvfp4_quantize(B_hp_t, block_size=16)
+            A = A_data.view(torch.float4_e2m1fn_x2)
+            B = B_data.view(torch.float4_e2m1fn_x2).T
+            peak_tops = fp4_peak_tops
+        else:
+            # raw float8 matmul (upper bound for what we can achive in eager mode)
+            # TODO(future): add e5m2
+            d1, d2, d3 = torch.float8_e4m3fn, torch.float8_e4m3fn, dtype
+            A = A_hp.to(d1)
+            B = B_hp_t.to(d2).contiguous().T
+            peak_tops = fp8_peak_tops
+
         if recipe == "tensorwise":
             scale_a = torch.tensor([1.0], device=device)
             scale_b = torch.tensor([1.0], device=device)
         elif recipe == "rowwise":
             scale_a = torch.ones(M, 1, device=device)
             scale_b = torch.ones(1, N, device=device)
-        elif recipe == "mxfp8_cublas":
+        elif recipe in ("mxfp8_cublas", "mxfp4_cutlass"):
             scale_a = torch.ones(M, K // 32, device=device, dtype=torch.float8_e8m0fnu)
             scale_b = torch.ones(N, K // 32, device=device, dtype=torch.float8_e8m0fnu)
+        elif recipe == "nvfp4":
+            # Use the blockwise scales from nvfp4_quantize
+            scale_a = A_scales.view(torch.float8_e4m3fn)
+            scale_b = B_scales.view(torch.float8_e4m3fn)
         else:
             assert False, f"unknown recipe {recipe}"
 
-        def do_matmul(A, B):
+        def do_matmul_fp8(A, B):
             nonlocal scale_a
             nonlocal scale_b
             return torch._scaled_mm(
                 A, B, scale_a, scale_b, out_dtype=d3, use_fast_accum=fast_accum
             )
 
-        fp8_time_sec, fp8_tops_sec, fp8_pct_top_peak = do_benchmarks(
-            tops, fp8_peak_tops, use_gpu_kernel_time, do_matmul, A, B
+        def do_matmul_mxfp4(A, B):
+            nonlocal scale_a
+            nonlocal scale_b
+            return mx_fp4_bf16(A, B, scale_a, scale_b)
+
+        def do_matmul_nvfp4(A, B):
+            nonlocal scale_a
+            nonlocal scale_b
+            return torch._scaled_mm(A, B, scale_a, scale_b, out_dtype=dtype)
+
+        if recipe == "mxfp4_cutlass":
+            do_matmul = do_matmul_mxfp4
+        elif recipe == "nvfp4":
+            do_matmul = do_matmul_nvfp4
+        else:
+            do_matmul = do_matmul_fp8
+
+        time_sec, tops_sec, pct_top_peak = do_benchmarks(
+            tops, peak_tops, use_gpu_kernel_time, do_matmul, A, B
         )
         print(
-            f"fp8 time_sec {fp8_time_sec:.2E}, tops/sec {fp8_tops_sec:.2E}, pct_peak {fp8_pct_top_peak:.3f}"
+            f"time_sec {time_sec:.2E}, tops/sec {tops_sec:.2E}, pct_peak {pct_top_peak:.3f}"
         )
 
-        del A, B, scale_a, scale_b
+        del A, B
+        if scale_a is not None:
+            del scale_a
+        if scale_b is not None:
+            del scale_b
 
         results.append(
             [
@@ -148,8 +203,8 @@ def do_matmul(A, B):
                 K,
                 N,
                 ref_time_sec,
-                fp8_time_sec,
-                ref_time_sec / fp8_time_sec,
+                time_sec,
+                ref_time_sec / time_sec,
             ]
         )
 
diff --git a/benchmarks/float8/utils.py b/benchmarks/float8/utils.py
index 0ee2b922fc..6c3051937d 100644
--- a/benchmarks/float8/utils.py
+++ b/benchmarks/float8/utils.py
@@ -352,9 +352,6 @@ def get_gpu_kernel_gemm_time_s(f, *args, **kwargs):
     )
     # there is only 1 key, aten::mm or aten::_scaled_mm, with unit nanoseconds
     assert len(data) == 1
-    if "aten::mm" in data:
-        return data["aten::mm"] / 1e6 / n_iter
-    elif "aten::_scaled_mm" in data:
-        return data["aten::_scaled_mm"] / 1e6 / n_iter
-    else:
-        raise AssertionError("unexpected format of data")
+    key, value = next(iter(data.items()))
+    assert key in ("aten::mm", "aten::_scaled_mm", "torchao::mx_fp4_bf16")
+    return value / 1e6 / n_iter
diff --git a/torchao/testing/training/roofline_utils.py b/torchao/testing/training/roofline_utils.py
index 7bfb9887df..286803dbf2 100644
--- a/torchao/testing/training/roofline_utils.py
+++ b/torchao/testing/training/roofline_utils.py
@@ -54,6 +54,13 @@
         # TODO(future): run measurement on hardware
         "pct_achievable_mem_bw": 0.92,
     },
+    "NVIDIA GeForce RTX 5090": {
+        # https://images.nvidia.com/aem-dam/Solutions/geforce/blackwell/nvidia-rtx-blackwell-gpu-architecture.pdf
+        "bf16_peak_tops": 209.5e12,
+        "fp8_peak_tops": 419e12,
+        "fp4_peak_tops": 1676e12,
+        "peak_mem_bw_bytes_sec": 1.792e15,
+    },
     # TODO(future): more GPU names
 }
 

From 4ebc9c042565e16af249b7cec8ebb2dc9fa0274f Mon Sep 17 00:00:00 2001
From: Gasoonjia <gasoonjia@meta.com>
Date: Tue, 24 Jun 2025 13:19:45 -0700
Subject: [PATCH 156/165] solve the test issue (#2432)

bring numeric debug test back (#2432)

Summary:

torchao numeric debug infra have to rely on pytorch 2.8 nightly and beyond; update the test decorator to skip the tests on lower version pytorch

Differential Revision: D77191199
---
 test/quantization/pt2e/test_numeric_debugger.py | 9 +++++----
 1 file changed, 5 insertions(+), 4 deletions(-)

diff --git a/test/quantization/pt2e/test_numeric_debugger.py b/test/quantization/pt2e/test_numeric_debugger.py
index e935c25d68..80648f6c77 100644
--- a/test/quantization/pt2e/test_numeric_debugger.py
+++ b/test/quantization/pt2e/test_numeric_debugger.py
@@ -18,14 +18,15 @@
     prepare_for_propagation_comparison,
 )
 from torchao.testing.pt2e.utils import PT2ENumericDebuggerTestCase
-from torchao.utils import TORCH_VERSION_AT_LEAST_2_7
+from torchao.utils import TORCH_VERSION_AT_LEAST_2_8
 
-if TORCH_VERSION_AT_LEAST_2_7:
+if TORCH_VERSION_AT_LEAST_2_8:
     from torch.export import export_for_training
 
 
-@unittest.skip("skip for now, need to fix")
-@unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_7, "Requires torch 2.7+")
+@unittest.skipIf(
+    not TORCH_VERSION_AT_LEAST_2_8, "Requires torch 2.8 and above, including nightly"
+)
 @unittest.skipIf(IS_WINDOWS, "Windows not yet supported for torch.compile")
 class TestNumericDebuggerInfra(PT2ENumericDebuggerTestCase):
     @unittest.skip(

From 8940aa72b182afe70f95e33500f01fc270c9f7cd Mon Sep 17 00:00:00 2001
From: shiyang-weng <shiyang.weng@intel.com>
Date: Wed, 25 Jun 2025 16:22:23 +0800
Subject: [PATCH 157/165] [float8] Prevent
 quantize_affine_float8/dequantize_affine_float8 decomposed on inductor
 (#2379)

* quantize_affine_float8/dequantize_affine_float8 not decomposed on inductor

* remove redundant unittest.skipIf

* fix rebase issue

* change dispatch key to a flag decomposed

* To be more explicit, use name inductor_decomposed instead

* Change ut path
---
 test/dtypes/test_affine_quantized_float.py | 40 ++++++++++++++++++++++
 torchao/quantization/quant_primitives.py   | 20 +++++++++++
 torchao/utils.py                           | 13 +++++--
 3 files changed, 70 insertions(+), 3 deletions(-)

diff --git a/test/dtypes/test_affine_quantized_float.py b/test/dtypes/test_affine_quantized_float.py
index b63a406715..33a1fe66a7 100644
--- a/test/dtypes/test_affine_quantized_float.py
+++ b/test/dtypes/test_affine_quantized_float.py
@@ -675,6 +675,46 @@ def test_preprocess_scale_3d_reshape(self):
         expected_shape = (8, 1)  # Flattened (2*2*2, 1)
         self.assertEqual(result.shape, expected_shape)
 
+    @common_utils.parametrize("float8_dtype", [torch.float8_e4m3fn, torch.float8_e5m2])
+    @common_utils.parametrize("hp_dtype", [torch.float32, torch.bfloat16])
+    def test_quantize_dequantize_fp8_inductor(self, float8_dtype, hp_dtype):
+        quantize_affine_float8 = torch.ops.torchao.quantize_affine_float8
+        dequantize_affine_float8 = torch.ops.torchao.dequantize_affine_float8
+        input = torch.randn(10, 10)
+        with torch.no_grad():
+            torch._dynamo.reset()
+            expected_scale = torch.tensor(2.0)
+            expected_quantized = quantize_affine_float8(
+                input,
+                expected_scale,
+                float8_dtype=float8_dtype,
+            )
+            expected_dequantized = dequantize_affine_float8(
+                expected_quantized,
+                expected_scale,
+                output_dtype=hp_dtype,
+            )
+            test_q, (code_q,) = torch._inductor.utils.run_and_get_code(
+                torch.compile(quantize_affine_float8),
+                input,
+                expected_scale,
+                float8_dtype=float8_dtype,
+            )
+            torch.testing.FileCheck().check(
+                "torch.ops.torchao.quantize_affine_float8.default"
+            ).run(code_q)
+            test_dq, (code_dq,) = torch._inductor.utils.run_and_get_code(
+                torch.compile(dequantize_affine_float8),
+                test_q,
+                expected_scale,
+                hp_dtype,
+            )
+            torch.testing.FileCheck().check(
+                "torch.ops.torchao.dequantize_affine_float8.default"
+            ).run(code_dq)
+            torch.testing.assert_close(expected_quantized, test_q)
+            torch.testing.assert_close(expected_dequantized, test_dq)
+
 
 common_utils.instantiate_parametrized_tests(TestAffineQuantizedFloat8Compile)
 
diff --git a/torchao/quantization/quant_primitives.py b/torchao/quantization/quant_primitives.py
index df136bc06e..56e8422197 100644
--- a/torchao/quantization/quant_primitives.py
+++ b/torchao/quantization/quant_primitives.py
@@ -2270,6 +2270,7 @@ def _expand_scale_to_tensor_shape(
     return expanded_scale
 
 
+@_register_custom_op(quant_lib, False)
 def _quantize_affine_float8(
     tensor: torch.Tensor,
     scale: torch.Tensor,
@@ -2290,6 +2291,16 @@ def _quantize_affine_float8(
     return fp8_tensor
 
 
+@torch.library.impl(quant_lib, "quantize_affine_float8", "Meta")
+def _quantize_affine_float8_meta(
+    tensor: torch.Tensor,
+    scale: torch.Tensor,
+    float8_dtype: torch.dtype = torch.float8_e4m3fn,
+) -> torch.Tensor:
+    return torch.empty_like(tensor, dtype=float8_dtype)
+
+
+@_register_custom_op(quant_lib, False)
 def _dequantize_affine_float8(
     tensor: torch.Tensor,
     scale: torch.Tensor,
@@ -2305,3 +2316,12 @@ def _dequantize_affine_float8(
 
     hp_tensor = fp8_tensor * scale_expanded
     return hp_tensor.to(output_dtype)
+
+
+@torch.library.impl(quant_lib, "dequantize_affine_float8", "Meta")
+def _dequantize_affine_float8_meta(
+    tensor: torch.Tensor,
+    scale: torch.Tensor,
+    output_dtype: torch.dtype = torch.float32,
+) -> torch.Tensor:
+    return torch.empty_like(tensor, dtype=output_dtype)
diff --git a/torchao/utils.py b/torchao/utils.py
index 416d23d785..1a12fb0668 100644
--- a/torchao/utils.py
+++ b/torchao/utils.py
@@ -179,7 +179,7 @@ def find_multiple(n: int, *args: int) -> int:
     return n + k - (n % k)
 
 
-def _register_custom_op(lib):
+def _register_custom_op(lib, inductor_decomposed=True):
     """This decorator is used to preserve some high level operators for torch.export.export
     while still allow them to be decomposed for inductor path
 
@@ -206,6 +206,12 @@ def _the_op_that_needs_to_be_preserved(...)
     """
     from torch._inductor.decomposition import register_decomposition
 
+    dispatch_key = (
+        "CompositeImplicitAutograd"
+        if inductor_decomposed
+        else "CompositeExplicitAutograd"
+    )
+
     def decorator(fn):
         if TORCH_VERSION_AT_LEAST_2_5:
             from torch._library.infer_schema import infer_schema
@@ -221,11 +227,12 @@ def decorator(fn):
             op_name = fn.__name__[1:]
             schema = op_name + infer_schema(fn, mutates_args={})
             lib.define(schema)
-            lib.impl(op_name, fn, "CompositeImplicitAutograd")
+            lib.impl(op_name, fn, dispatch_key)
 
             lib_namespace = lib.ns
             op = getattr(getattr(torch.ops, lib_namespace), op_name)
-            register_decomposition([op])(fn)
+            if inductor_decomposed:
+                register_decomposition([op])(fn)
             return op
         else:
             return fn

From 8b57afe6b38dccb2b2045ca32c2e35e818142eaa Mon Sep 17 00:00:00 2001
From: Xia Weiwen <weiwen.xia@intel.com>
Date: Wed, 25 Jun 2025 16:34:41 +0800
Subject: [PATCH 158/165] [CPU] Enable DA8W4 on CPU (#2128)

* [CPU] enable int8_dynamic_activation_int4_weight with Int4CPULayout

* Fix format issue

* Add Int8DynamicActInt4WeightCPULayout

* remove dispatch for t()

* Add cpp kernel for weight packing and GEMM

* Register ATQ linear dispatch for da8w4 linear

* Fix issues with torch.compile

* Fix DA8W4CPUAQTTensorImpl.get_plain

* Test DA8W4CPUAQTTensorImpl.get_plain in UT

* Skip UT if CPP kernel not built

* Add AVX512_VNNI implementation for small M

* improve performance

* Support symmetric quantization of activation

* Refine code

* Refine code

* Put in a separate file

* Bug fix

* refine code
---
 setup.py                                      |  37 +-
 test/quantization/test_quant_api.py           |  68 ++
 torchao/csrc/cpu/da8w4_linear.cpp             | 745 ++++++++++++++++++
 torchao/dtypes/__init__.py                    |   2 +
 torchao/dtypes/affine_quantized_tensor_ops.py |   8 +
 torchao/dtypes/uintx/__init__.py              |   4 +
 .../uintx/dyn_int8_act_int4_wei_cpu_layout.py | 312 ++++++++
 torchao/dtypes/uintx/int4_cpu_layout.py       |  18 +-
 torchao/ops.py                                |  84 ++
 torchao/quantization/quant_api.py             |  48 +-
 10 files changed, 1296 insertions(+), 30 deletions(-)
 create mode 100644 torchao/csrc/cpu/da8w4_linear.cpp
 create mode 100644 torchao/dtypes/uintx/dyn_int8_act_int4_wei_cpu_layout.py

diff --git a/setup.py b/setup.py
index 5560ab877e..88669e7b3b 100644
--- a/setup.py
+++ b/setup.py
@@ -385,20 +385,29 @@ def get_extensions():
         extra_compile_args["cxx"].extend(
             ["-O3" if not debug_mode else "-O0", "-fdiagnostics-color=always"]
         )
-        if (
-            use_cpu_kernels
-            and is_linux
-            and hasattr(torch._C._cpu, "_is_avx512_supported")
-            and torch._C._cpu._is_avx512_supported()
-        ):
-            extra_compile_args["cxx"].extend(
-                [
-                    "-DCPU_CAPABILITY_AVX512",
-                    "-march=native",
-                    "-mfma",
-                    "-fopenmp",
-                ]
-            )
+
+        if use_cpu_kernels and is_linux:
+            if (
+                hasattr(torch._C._cpu, "_is_avx512_supported")
+                and torch._C._cpu._is_avx512_supported()
+            ):
+                extra_compile_args["cxx"].extend(
+                    [
+                        "-DCPU_CAPABILITY_AVX512",
+                        "-march=native",
+                        "-mfma",
+                        "-fopenmp",
+                    ]
+                )
+            if (
+                hasattr(torch._C._cpu, "_is_avx512_vnni_supported")
+                and torch._C._cpu._is_avx512_vnni_supported()
+            ):
+                extra_compile_args["cxx"].extend(
+                    [
+                        "-DCPU_CAPABILITY_AVX512_VNNI",
+                    ]
+                )
 
         if debug_mode:
             extra_compile_args["cxx"].append("-g")
diff --git a/test/quantization/test_quant_api.py b/test/quantization/test_quant_api.py
index 0435a6c59b..2bb20d5afd 100644
--- a/test/quantization/test_quant_api.py
+++ b/test/quantization/test_quant_api.py
@@ -29,6 +29,7 @@
     AffineQuantizedTensor,
     Int4CPULayout,
     Int4XPULayout,
+    Int8DynamicActInt4WeightCPULayout,
     PlainLayout,
     QDQLayout,
     TensorCoreTiledLayout,
@@ -70,6 +71,7 @@
     TORCH_VERSION_AT_LEAST_2_4,
     TORCH_VERSION_AT_LEAST_2_5,
     TORCH_VERSION_AT_LEAST_2_6,
+    TORCH_VERSION_AT_LEAST_2_7,
     TORCH_VERSION_AT_LEAST_2_8,
     is_sm_at_least_89,
     is_sm_at_least_90,
@@ -695,6 +697,72 @@ def test_int4wo_cpu(self, dtype, x_dim, use_hqq):
             assert "_weight_int4pack_mm_for_cpu" in code[0]
             assert "aten.mm.default" not in code[0]
 
+    @unittest.skipIf(
+        "CPU" not in torch._C._dispatch_dump("torchao::da8w4_linear_cpu"),
+        reason="cpp kernels not built",
+    )
+    @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_7, "Test only enabled for 2.7+")
+    @common_utils.parametrize("dtype", [torch.float, torch.bfloat16, torch.half])
+    @common_utils.parametrize("x_dim", [2, 3])
+    @common_utils.parametrize("bias", [True, False])
+    @common_utils.parametrize("bs", [1, 160])
+    @common_utils.parametrize("sym_quant_a", [True, False])
+    def test_8da4w_cpu(self, dtype, x_dim, bias, bs, sym_quant_a):
+        if sym_quant_a and not TORCH_VERSION_AT_LEAST_2_8:
+            # not supported until PT 2.8
+            return
+        device = "cpu"
+        m = ToyLinearModel(bias=bias).eval().to(dtype).to(device)
+        m2 = copy.deepcopy(m)
+        example_inputs = m.example_inputs(batch_size=bs, dtype=dtype, device=device)
+        if x_dim == 3:
+            example_inputs = (example_inputs[0].unsqueeze(0),)
+
+        with torch.no_grad():
+            # Currently, the difference between Int8DynamicActInt4WeightCPULayout and PlainLayout
+            # is that the former packs two int4 weights into one int8, while the latter does not.
+            quantize_(
+                m,
+                Int8DynamicActivationInt4WeightConfig(
+                    group_size=32,
+                    layout=Int8DynamicActInt4WeightCPULayout(),
+                    act_mapping_type=MappingType.SYMMETRIC
+                    if sym_quant_a
+                    else MappingType.ASYMMETRIC,
+                ),
+            )
+            y, code = torch._inductor.utils.run_and_get_code(
+                torch.compile(m, fullgraph=True, dynamic=True),
+                *example_inputs,
+            )
+            # ensure the expected op is in the code
+            assert "torch.ops.torchao.da8w4_linear_cpu.default" in code[0]
+            quantize_(
+                m2,
+                int8_dynamic_activation_int4_weight(
+                    group_size=32,
+                    layout=PlainLayout(),
+                    act_mapping_type=MappingType.SYMMETRIC
+                    if sym_quant_a
+                    else MappingType.ASYMMETRIC,
+                ),
+            )
+            torch._dynamo.reset()  # may segfault without this
+            y2 = torch.compile(m2, fullgraph=True, dynamic=True)(*example_inputs)
+            atol, rtol = 4e-7, 1e-5
+            if dtype == torch.bfloat16:
+                atol, rtol = 1e-2, 3e-3
+            elif dtype == torch.half:
+                atol, rtol = 6e-3, 2e-3
+            assert torch.allclose(y, y2, atol=atol, rtol=rtol)
+            # Test get_plain by dequantize()
+            dqw1 = m.linear1.weight.original_weight_tensor.dequantize()
+            dqw2 = m.linear2.weight.original_weight_tensor.dequantize()
+            dqw1_ref = m2.linear1.weight.original_weight_tensor.dequantize()
+            dqw2_ref = m2.linear2.weight.original_weight_tensor.dequantize()
+            assert torch.allclose(dqw1, dqw1_ref)
+            assert torch.allclose(dqw2, dqw2_ref)
+
     # TODO(#1690): move to new config names
     @unittest.skipIf(not TORCH_VERSION_AT_LEAST_2_4, "Test only enabled for 2.4+")
     @unittest.skipIf(not torch.cuda.is_available(), "Need CUDA available")
diff --git a/torchao/csrc/cpu/da8w4_linear.cpp b/torchao/csrc/cpu/da8w4_linear.cpp
new file mode 100644
index 0000000000..537aa0fce9
--- /dev/null
+++ b/torchao/csrc/cpu/da8w4_linear.cpp
@@ -0,0 +1,745 @@
+#include <torch/all.h>
+#include <ATen/cpu/vec/vec.h>
+#include <ATen/native/CPUBlas.h>
+#include <c10/util/Unroll.h>
+
+namespace torchao {
+
+namespace {
+
+#define BLOCK_N 32
+
+static bool cpublas_checked = false;
+static bool cpublas_can_pack = false;
+
+bool cpublas_could_pack() {
+  // the could_pack check requires AMX support implicitly
+  if (cpublas_checked) {
+    return cpublas_can_pack;
+  }
+  cpublas_can_pack = at::native::cpublas::could_pack(at::kByte);
+  cpublas_checked = true;
+  return cpublas_can_pack;
+}
+
+/*
+return: packed_weight, packed_scales, packed_qzeros, compensation
+*/
+std::tuple<at::Tensor, at::Tensor, at::Tensor, at::Tensor>
+da8w4_linear_prepack_impl(
+    const at::Tensor& weight,
+    const at::Tensor& scales,
+    const at::Tensor& qzeros) {
+  // weight shape = [N, K]
+  // scales shape = [N, G]
+  // qzeros shape = [N, G]
+  TORCH_CHECK(weight.dim() == 2,
+              "DA8W4 CPU: Weight should be a 2D tensor for packing");
+  TORCH_CHECK(weight.size(1) % 2 == 0,
+              "DA8W4 CPU: Weight should have even number of columns for packing");
+
+  auto new_scales = scales;
+  auto new_qzeros = qzeros;
+  if (new_scales.dim() == 1) {
+    new_scales.unsqueeze_(1);
+  }
+  new_scales = new_scales.to(at::kFloat);
+  if (new_qzeros.dim() == 1) {
+    new_qzeros.unsqueeze_(1);
+  }
+  new_qzeros = new_qzeros.to(at::kChar);
+  int N = weight.size(0);
+  int K = weight.size(1);
+  int G = scales.size(1);
+  int group_size = K / G;
+  int block_k = group_size > 128 ? 128 : group_size;
+  constexpr int block_n = BLOCK_N;
+  int Nc = N / block_n;
+  int Kc = K / block_k;
+
+  // Reorder weight to [N/block_n, K/block_k, block_k, block_n]
+  // Reorder scales/qzeros to [N/block_n, G, block_n]
+  auto weight_view = weight.view({Nc, block_n, Kc, block_k});
+  at::Tensor weight_reordered = weight_view.permute({0, 2, 3, 1}).contiguous();
+  at::Tensor blocked_weight;
+  at::Tensor blocked_scales = new_scales.view({Nc, block_n, G}).permute({0, 2, 1}).contiguous();
+  at::Tensor blocked_qzeros = new_qzeros.view({Nc, block_n, G}).permute({0, 2, 1}).contiguous();
+  // Compensation = Σ(k)(W[k][n] - ZP[n]) for each block.
+  auto weight_sub_qzero = weight.view({Nc, block_n, G, -1}).to(at::kInt) - new_qzeros.view({Nc, block_n, G, -1});
+  weight_sub_qzero = weight_sub_qzero.view({Nc, block_n, Kc, block_k});
+  at::Tensor compensation = weight_sub_qzero.sum(-1);
+  compensation = compensation.permute({0, 2, 1}).contiguous().to(at::kInt);
+
+  if (cpublas_could_pack()) {
+    blocked_weight = at::empty({Nc, Kc, block_k, block_n / 2}, weight.options());
+    auto weight_ptr = weight_reordered.data_ptr<uint8_t>();
+    auto blocked_weight_ptr = blocked_weight.data_ptr<uint8_t>();
+    int64_t num_blocks = Nc * Kc;
+    at::parallel_for(0, num_blocks, 1, [&](int64_t begin, int64_t end) {
+      for (const auto i : c10::irange(begin, end)) {
+        auto in_ptr = weight_ptr + i * block_k * block_n;
+        auto out_ptr = blocked_weight_ptr + i * block_k * block_n / 2;
+
+        // Reorder weight block to VNNI4 and pack two lanes along N
+        // N=16 viewed as two lanes: a0, ...a7, b0, ...b7
+        // pack two lanes: [a0, b0], ..., [a7, b7]
+        // plain shape = [block_k, block_n]
+        // packed shape = [block_k / 4, block_n / 2, 4] viewed as [block_k, block_n / 2]
+        constexpr int n_group_size = 8;
+        constexpr int vnni_size = 4;
+        constexpr int n_group = block_n / n_group_size; // 4
+        for (int nb = 0; nb < n_group; nb += 2) {
+          for (int k = 0; k < block_k; k += vnni_size) {
+            for (int ni = 0; ni < n_group_size; ++ni) {
+              for (int ki = 0; ki < vnni_size; ++ki) {
+                int src_idx_1 = nb * n_group_size + ni + (k + ki) * block_n;
+                int src_idx_2 = (nb + 1) * n_group_size + ni + (k + ki) * block_n;
+                int dst_idx = (nb / 2 * n_group_size + ni) * vnni_size + k * block_n / 2 + ki;
+                uint8_t src_1 = *(in_ptr + src_idx_1);
+                uint8_t src_2 = *(in_ptr + src_idx_2);
+                uint8_t dst = (src_1 & 0x0f) | ((src_2 & 0x0f) << 4);
+                *(out_ptr + dst_idx) = dst;
+              }
+            }
+          }
+        }
+      }
+    });
+  } else {
+    // Pack weight: two int4 -> one int8
+    using namespace at::indexing;
+    at::Tensor even_columns =
+        weight_reordered.index({Slice(), Slice(), Slice(), Slice(1, None, 2)});
+    even_columns = even_columns.bitwise_left_shift(4);
+    at::Tensor odd_columns =
+        weight_reordered.index({Slice(), Slice(), Slice(), Slice(None, None, 2)});
+    blocked_weight = even_columns.bitwise_or(odd_columns);
+  }
+
+  return std::make_tuple(std::move(blocked_weight), std::move(blocked_scales), std::move(blocked_qzeros), std::move(compensation));
+}
+
+template<bool sym_quant_a>
+struct ActDtype;
+template<>
+struct ActDtype<true> {
+  using type = int8_t;
+};
+
+template<>
+struct ActDtype<false> {
+  using type = uint8_t;
+};
+
+
+#if defined(CPU_CAPABILITY_AVX512)
+inline std::array<__m256i, 2> load_zps_4vnni(const int8_t* __restrict__ zps) {
+  // broadcast 01234567 to
+  // 01234567012345670123456701234567
+  __m256i vzps_low = _mm256_set1_epi64x(*reinterpret_cast<const long*>(zps));
+  __m256i vzps_high = _mm256_set1_epi64x(*reinterpret_cast<const long*>(zps + 8));
+  // shuffle from
+  // 01234567012345670123456701234567
+  // to
+  // 00001111222233334444555566667777
+  __m256i shuffle_mask = _mm256_set_epi8(
+      7,
+      7,
+      7,
+      7,
+      6,
+      6,
+      6,
+      6,
+      5,
+      5,
+      5,
+      5,
+      4,
+      4,
+      4,
+      4,
+      3,
+      3,
+      3,
+      3,
+      2,
+      2,
+      2,
+      2,
+      1,
+      1,
+      1,
+      1,
+      0,
+      0,
+      0,
+      0);
+  vzps_low = _mm256_shuffle_epi8(vzps_low, shuffle_mask);
+  vzps_high = _mm256_shuffle_epi8(vzps_high, shuffle_mask);
+  return {vzps_low, vzps_high};
+}
+
+inline std::array<__m256i, 2> load_uint4_as_int8(const uint8_t* __restrict__ qB) {
+  __m256i packed = _mm256_loadu_si256(reinterpret_cast<const __m256i*>(qB));
+  const __m256i low_mask = _mm256_set1_epi8(0x0f);
+  __m256i high = _mm256_srli_epi16(packed, 4);
+  high = _mm256_and_si256(high, low_mask);
+  __m256i low = _mm256_and_si256(packed, low_mask);
+  return {low, high};
+}
+
+template <int64_t N, int64_t ldb>
+void _dequant_weight_zp_only(
+    const uint8_t* __restrict__ B,
+    int8_t* dqB,
+    const int8_t* __restrict__ qzeros,
+    int64_t K) {
+  // unpack weight int8 -> two int4
+  // subtract zero point
+  // B shape = [K, ldb] = [K, N / 2], actual shape = [K / 4, N / 2, 4]
+  // dqB shape = [K, N], actual shape = [K / 4, N, 4]
+#pragma GCC unroll 2
+  for (int n = 0; n < N; n += 16) {
+    auto [zps_low, zps_high] = load_zps_4vnni(&qzeros[n]);
+    for (int k = 0; k < K; k += 4) {
+      auto [vb_low, vb_high] = load_uint4_as_int8(B + ldb * k + n / 2 * 4);
+      vb_high = _mm256_sub_epi8(vb_high, zps_high);
+      vb_low = _mm256_sub_epi8(vb_low, zps_low);
+      // store vb to B
+      _mm256_storeu_si256(reinterpret_cast<__m256i_u*>(dqB + N * k + n * 4), vb_low);
+      _mm256_storeu_si256(reinterpret_cast<__m256i_u*>(dqB + N * k + (n + 8) * 4), vb_high);
+    }
+  }
+}
+
+template <bool accum, int64_t N, bool sym_quant_a>
+void _dequant_and_store(
+    float* __restrict__ output,
+    const int32_t* __restrict__ input,
+    const float* __restrict__ scale_a,
+    const int32_t* __restrict__ zp_a,
+    const float* __restrict__ scale_b,
+    const int32_t* __restrict__ comp_b,
+    int M,
+    int ldi,
+    int ldo,
+    int ldsa = 1) {
+  for (int m = 0; m < M; ++m) {
+    float a_scale = *(scale_a + m * ldsa);
+    __m512 va_scale = _mm512_set1_ps(a_scale);
+    int32_t a_zp;
+    __m512i va_zp;
+    if constexpr (!sym_quant_a) {
+      a_zp = *(zp_a + m * ldsa);
+      va_zp = _mm512_set1_epi32(a_zp);
+    }
+    int n = 0;
+#pragma GCC unroll 2
+    for (; n < N; n += 16) {
+      __m512i vc = _mm512_loadu_si512(input + m * ldi + n);
+      if constexpr (!sym_quant_a) {
+        __m512i vb_comp = _mm512_loadu_si512(comp_b + n);
+        vc = _mm512_sub_epi32(vc, _mm512_mullo_epi32(vb_comp, va_zp));
+      }
+      __m512 vc_f = _mm512_cvtepi32_ps(vc);
+      __m512 vc_f_mul = _mm512_mul_ps(vc_f, va_scale);
+      __m512 vb_s = _mm512_loadu_ps(scale_b + n);
+      vc_f_mul = _mm512_mul_ps(vc_f_mul, vb_s);
+      if constexpr (accum) {
+        __m512 vo = _mm512_loadu_ps(output + m * ldo + n);
+        _mm512_storeu_ps(output + m * ldo + n, _mm512_add_ps(vo, vc_f_mul));
+      } else {
+        _mm512_storeu_ps(output + m * ldo + n, vc_f_mul);
+      }
+    }
+    for (; n < N; ++n) {
+      float dq_val;
+      if constexpr (sym_quant_a) {
+        dq_val = (float)input[m * ldi + n] * a_scale * scale_b[n];
+      } else {
+        dq_val =
+          (float)(input[m * ldi + n] - a_zp * comp_b[n]) * a_scale * scale_b[n];
+      }
+      if constexpr (accum) {
+        output[m * ldo + n] += dq_val;
+      } else {
+        output[m * ldo + n] = dq_val;
+      }
+    }
+  }
+}
+
+#else
+template<int64_t N, int64_t ldb>
+void _dequant_weight_zp_only(
+    const uint8_t* B,
+    int8_t* dqB,
+    const int8_t* qzeros,
+    int64_t K) {
+  // B shape = [K, N / 2]
+  // dqB shape = [K, N]
+  for (int k = 0; k < K; ++k) {
+    for (int n = 0; n < N / 2; ++n) {
+      int32_t b = (int32_t)B[k * ldb + n];
+      dqB[k * N + n * 2] = (b & 0xf) - qzeros[n];
+      dqB[k * N + n * 2 + 1] = (b >> 4) - qzeros[n];
+    }
+  }
+}
+#endif
+
+#if defined(CPU_CAPABILITY_AVX512_VNNI)
+inline __m512i combine_m256i(__m256i a, __m256i b) {
+  __m512i c = _mm512_castsi256_si512(a);
+  return _mm512_inserti64x4(c, b, 1);
+}
+
+inline __m512i combine_m256i(std::array<__m256i, 2> two_256) {
+  return combine_m256i(two_256[0], two_256[1]);
+}
+
+// negate elements in a according to b's sign
+static inline __m512i _mm512_sign_epi8(__m512i a, __m512i b) {
+  __m512i zero = _mm512_setzero_si512();
+  __mmask64 blt0 = _mm512_movepi8_mask(b);
+  return _mm512_mask_sub_epi8(a, blt0, zero, a);
+}
+
+template <int64_t M, int64_t N, int64_t ldb, bool sym_quant_a>
+void _dequant_gemm_accum_small_M(
+    float* __restrict__ C,
+    const uint8_t* A,
+    const float* scales_a,
+    const int32_t* qzeros_a,
+    const uint8_t* B,
+    const float* scales_b,
+    const int8_t* qzeros_b,
+    int64_t K,
+    int64_t lda,
+    int64_t ldc) {
+  // if sym_quant_a is true, A pointer type is passed in as uint8_t* but actually int8_t*.
+
+  constexpr int COLS = N / 16;
+  // Computing compensation is faster than loading it for small M
+  // because it's memory bound.
+  __m512i ones = _mm512_set1_epi8(1); // used for computing compensation
+  __m512i va;
+  __m512i vb[COLS];
+  __m512i vc[M * COLS];
+  __m512 vscales[COLS];
+  __m512i vzps[COLS];
+  __m512i vcompensate[COLS];
+
+  // Load scales and zps
+  c10::ForcedUnroll<COLS>{}([&](auto i) {
+      vscales[i] = _mm512_loadu_ps(scales_b + i * 16);
+      vzps[i] = combine_m256i(load_zps_4vnni(qzeros_b + i * 16));
+      if constexpr (!sym_quant_a) {
+        vcompensate[i] = _mm512_setzero_epi32();
+      }
+    });
+  c10::ForcedUnroll<M * COLS>{}(
+      [&](auto i) { vc[i] = _mm512_setzero_epi32(); });
+
+  auto compute = [&](auto i, int k) {
+    constexpr const int row = i / COLS;
+    constexpr const int col = i % COLS;
+
+    if constexpr (col == 0) {
+      va = _mm512_set1_epi32(*(int32_t*)(A + row * lda + k));
+    }
+
+    if constexpr (row == 0) {
+      int B_offset = k * ldb + col * 16 * 2;
+      vb[col] = combine_m256i(load_uint4_as_int8(B + B_offset));
+      vb[col] = _mm512_sub_epi8(vb[col], vzps[col]);
+      if constexpr (!sym_quant_a) {
+          vcompensate[col] =
+              _mm512_dpbusd_epi32(vcompensate[col], ones, vb[col]);
+      }
+      _mm_prefetch(B + B_offset + 128 * ldb, _MM_HINT_T0);
+    }
+    if constexpr (sym_quant_a) {
+        auto vsb = _mm512_sign_epi8(vb[col], va);
+        auto vabsa = _mm512_sign_epi8(va, va);
+        vc[i] = _mm512_dpbusds_epi32(vc[i], vabsa, vsb);
+    } else {
+      vc[i] = _mm512_dpbusd_epi32(vc[i], va, vb[col]);
+    }
+  };
+
+  // Accumulate along k
+  constexpr const int unroll = 4;
+  int k = 0;
+  for (; k < K / 4 / unroll; k++) {
+    c10::ForcedUnroll<unroll>{}([&](auto i) {
+      c10::ForcedUnroll<M * COLS>{}(compute, 4 * (k * unroll + i));
+    });
+  }
+  k *= 4 * unroll;
+  for (; k < K; k += 4) {
+    c10::ForcedUnroll<M * COLS>{}(compute, k);
+  }
+
+  // Store to C
+  auto store = [&](auto i) {
+    constexpr const int row = i / COLS;
+    constexpr const int col = i % COLS;
+    // compute (qC - compensate * zp_a) * scale_a * scale_b
+    __m512 vc_float;
+    if constexpr (!sym_quant_a) {
+      vc[i] = _mm512_sub_epi32(
+          vc[i],
+          _mm512_mullo_epi32(
+              vcompensate[col], _mm512_set1_epi32(*(qzeros_a + row))));
+    }
+    vc_float = _mm512_cvtepi32_ps(vc[i]);
+    vc_float = _mm512_mul_ps(vc_float, _mm512_set1_ps(*(scales_a + row)));
+
+    vc_float = _mm512_mul_ps(vc_float, vscales[col]);
+    auto vc_old = _mm512_loadu_ps(C + row * ldc + col * 16);
+    vc_float = _mm512_add_ps(vc_float, vc_old);
+    _mm512_storeu_ps(C + row * ldc + col * 16, vc_float);
+  };
+  c10::ForcedUnroll<M * COLS>{}(store);
+
+}
+
+#define call_dequant_gemm_accum_small_M(M) \
+  _dequant_gemm_accum_small_M<M, N, ldb, sym_quant_a>( \
+      C, \
+      A, \
+      scales_a, \
+      qzeros_a, \
+      B, \
+      scales_b, \
+      qzeros_b, \
+      K, \
+      lda, \
+      ldc);
+#endif
+
+template <bool cpublas_can_pack, int64_t N, int64_t ldb, bool sym_quant_a>
+void _dequant_gemm_accum(
+    float* C,
+    const uint8_t* A,
+    const float* scales_a,
+    const int32_t* qzeros_a,
+    const uint8_t* B,
+    const float* scales_b,
+    const int8_t* qzeros_b,
+    const int32_t* compensation,
+    int64_t M,
+    int64_t K,
+    int64_t lda,
+    int64_t ldc) {
+  // Compute GEMM int8 * int8 -> int32
+  // dequant result to float by applying scales/qzeros
+#if defined(CPU_CAPABILITY_AVX512_VNNI)
+  if (M <= 4 && cpublas_can_pack) {
+    switch (M) {
+      case 1:
+        call_dequant_gemm_accum_small_M(1);
+        return;
+      case 2:
+        call_dequant_gemm_accum_small_M(2);
+        return;
+      case 3:
+        call_dequant_gemm_accum_small_M(3);
+        return;
+      case 4:
+        call_dequant_gemm_accum_small_M(4);
+        return;
+    }
+  }
+#endif
+
+  int8_t dqB[K * N];
+  _dequant_weight_zp_only<N, ldb>(B, dqB, qzeros_b, K);
+  using Tin = typename ActDtype<sym_quant_a>::type;
+  Tin* A_ptr = (Tin*)A;
+#if defined(CPU_CAPABILITY_AVX512)
+  if constexpr (cpublas_can_pack) {
+    int32_t C_i32[M * N];
+    at::native::cpublas::brgemm(
+        M,
+        N,
+        K,
+        lda,
+        N /*ldb*/,
+        N /*ldc*/,
+        false /* add_C */,
+        A_ptr,
+        dqB,
+        C_i32,
+        true /* is_vnni */);
+    _mm_prefetch(B + N * K / 2, _MM_HINT_T0);
+    _mm_prefetch(A + K, _MM_HINT_T0);
+    _dequant_and_store<true, N, sym_quant_a>(
+        C,
+        C_i32,
+        scales_a,
+        qzeros_a,
+        scales_b,
+        compensation,
+        M,
+        N /*ldi*/,
+        ldc,
+        1 /*ldsa*/);
+  } else
+#endif
+  {
+    for (int64_t i = 0; i < M; ++i) {
+      for (int64_t j = 0; j < N; ++j) {
+        float sum = 0;
+        for (int64_t k = 0; k < K; ++k) {
+          if constexpr (sym_quant_a) {
+            sum += ((int32_t)A_ptr[i * lda + k] * dqB[k * N + j]);
+          } else {
+            sum += ((int32_t)A_ptr[i * lda + k] - qzeros_a[i]) * (int32_t)dqB[k * N + j];
+          }
+        }
+        C[i * ldc + j] += sum * scales_a[i] * scales_b[j];
+      }
+    }
+  }
+}
+
+template<int64_t N>
+inline void copy_bias(const float* bias_ptr, float* y_buf, int64_t m) {
+  if (bias_ptr) {
+    for (int i = 0; i < m; ++i) {
+      int j = 0;
+#if defined(CPU_CAPABILITY_AVX512)
+#pragma GCC unroll 2
+      for (; j < N; j += 16) {
+        __m512 bias_vec = _mm512_loadu_ps(bias_ptr + j);
+        _mm512_storeu_ps(y_buf + i * N + j, bias_vec);
+      }
+#endif
+      for (; j < N; ++j) {
+        y_buf[i * N + j] = bias_ptr[j];
+      }
+    }
+  } else { // initialize to zero
+    for (int i = 0; i < m; ++i) {
+      int j = 0;
+#if defined(CPU_CAPABILITY_AVX512)
+#pragma GCC unroll 2
+      for (; j < N; j += 16) {
+        __m512 zero_vec = _mm512_setzero_ps();
+        _mm512_storeu_ps(y_buf + i * N + j, zero_vec);
+      }
+#endif
+      for (; j < N; ++j) {
+        y_buf[i * N + j] = 0;
+      }
+    }
+  }
+}
+
+template<typename out_dtype, int64_t N>
+inline void store_out(const float* y_buf, out_dtype* c_ptr, int64_t m, /* int64_t n, */ int64_t lda) {
+  for (int i = 0; i < m; ++i) {
+    int j = 0;
+    if constexpr (std::is_same<out_dtype, float>::value) {
+#if defined(CPU_CAPABILITY_AVX512)
+#pragma GCC unroll 2
+      for (; j < N; j += 16) {
+        __m512 y_vec = _mm512_loadu_ps(y_buf + i * N + j);
+        _mm512_storeu_ps(c_ptr + i * lda + j, y_vec);
+      }
+#endif
+      for (; j < N; ++j) {
+        c_ptr[i * lda + j] = y_buf[i * N + j];
+      }
+    } else if constexpr (std::is_same<out_dtype, at::BFloat16>::value) {
+#if defined(CPU_CAPABILITY_AVX512)
+#pragma GCC unroll 2
+      for (; j < N; j += 16) {
+        __m512 y_vec = _mm512_loadu_ps(y_buf + i * N + j);
+        __m256i y_bf16_vec = at::vec::cvtfp32_bf16(y_vec);
+        _mm256_storeu_si256(reinterpret_cast<__m256i*>(c_ptr + i * lda + j), y_bf16_vec);
+      }
+#endif
+      for (; j < N; ++j) {
+        c_ptr[i * lda + j] = at::BFloat16(y_buf[i * N + j]);
+      }
+    } else if constexpr (std::is_same<out_dtype, at::Half>::value) {
+#if defined(CPU_CAPABILITY_AVX512)
+#pragma GCC unroll 2
+      for (; j < N; j += 16) {
+        __m512 y_vec = _mm512_loadu_ps(y_buf + i * N + j);
+        __m256i y_fp16_vec = at::vec::cvtfp32_fp16(y_vec);
+        _mm256_storeu_si256(reinterpret_cast<__m256i*>(c_ptr + i * lda + j), y_fp16_vec);
+      }
+#endif
+      for (; j < N; ++j) {
+        c_ptr[i * lda + j] = at::Half(y_buf[i * N + j]);
+      }
+    } else {
+      TORCH_CHECK(false, "Unsupported output dtype");
+    }
+  }
+}
+
+template<typename out_dtype, bool cpublas_can_pack, bool sym_quant_a>
+void _da8w4_linear_impl(
+    const at::Tensor& input,
+    const at::Tensor& input_scales,
+    const at::Tensor& input_qzeros,
+    const at::Tensor& weight,
+    const at::Tensor& weight_scales,
+    const at::Tensor& weight_qzeros,
+    const at::Tensor& compensation,
+    const std::optional<at::Tensor>& bias,
+    at::Tensor& output) {
+  // input shape = [..., K]
+  // input is per token quantized
+  int64_t K = input.size(-1);
+  auto input_view = input.view({-1, K});
+  int64_t M = input_view.size(0);
+  TORCH_CHECK(input_scales.numel() == M, "DA8W4: unexpected input scales shape");
+  TORCH_CHECK(input_scales.sizes() == input_qzeros.sizes(), "DA8W4: unexpected input qzeros shape");
+
+  // weight shape = [Nc, Kc, block_k, block_n/2]
+  // scales/qzeros shape = [Nc, G, block_n]
+  // compensation shape = [Nc, Kc, block_n]
+  int64_t Nc = weight.size(0);
+  int64_t Kc = weight.size(1);
+  int64_t block_k = weight.size(2);
+  constexpr int64_t block_n = BLOCK_N;
+  TORCH_CHECK(weight.size(3) * 2 == block_n, "DA8W4: unexpected weight shape");
+  int64_t N = Nc * block_n;
+  TORCH_CHECK(K == Kc * block_k, "DA8W4: weight and input shapes mismatch");
+  int64_t block_m = [&]() -> long {
+    if (M <= 48) {
+      return M;
+    } else if (M < 64) {
+      return 32;
+    } else if (M < 96) {
+      return 48;
+    } else {
+      return 64;
+    }
+  }();
+  int64_t Mc = (M + block_m - 1) / block_m;
+  bool parallel_on_M = M > 128;
+  int64_t num_blocks = parallel_on_M ? Mc * Nc : Nc;
+
+  // scales/qzeros shape = [Nc, G, block_n]
+  int64_t num_groups = weight_scales.size(1);
+  int64_t group_size = K / num_groups;
+  TORCH_CHECK(group_size % block_k == 0,
+              "DA8W4 CPU: group_size should be divisible by block_k");
+  int64_t block_per_group = group_size / block_k;
+
+  using Tin = typename ActDtype<sym_quant_a>::type;
+  const Tin* a_ptr = input_view.data_ptr<Tin>();
+  const float* a_scales_ptr = input_scales.data_ptr<float>();
+  const int32_t* a_qzeros_ptr = sym_quant_a ? nullptr : input_qzeros.data_ptr<int32_t>();
+  const uint8_t* b_ptr = weight.data_ptr<uint8_t>();
+  const float* b_scales_ptr = weight_scales.data_ptr<float>();
+  const int8_t* b_qzeros_ptr = weight_qzeros.data_ptr<int8_t>();
+  const int32_t* compensation_ptr = sym_quant_a ? nullptr : compensation.data_ptr<int32_t>();
+  out_dtype* c_ptr = output.data_ptr<out_dtype>();
+  const float* bias_ptr = bias.has_value() ? bias.value().data_ptr<float>() : nullptr;
+
+  at::parallel_for(0, num_blocks, 1, [&](int64_t begin, int64_t end) {
+    for (const auto i : c10::irange(begin, end)) {
+      int64_t mc = parallel_on_M ? i / Nc : 0;
+      int64_t nc = parallel_on_M ? i % Nc : i;
+      int64_t mc_end = parallel_on_M ? mc + 1 : Mc;
+
+      for (int mci = mc; mci < mc_end; ++mci) {
+        int64_t m_size = mci * block_m + block_m > M ? M - mci * block_m : block_m;
+        alignas(64) float y_buf[m_size][block_n];
+        // copy bias to y_buf if bias is not None
+        auto bias_data = bias_ptr ? bias_ptr + nc * block_n : nullptr;
+        copy_bias<block_n>(bias_data, y_buf[0], m_size);
+        for (int kci = 0; kci < Kc; ++kci) {
+          _dequant_gemm_accum<cpublas_can_pack, block_n, block_n / 2, sym_quant_a>(
+            y_buf[0] /*C*/,
+            (uint8_t*)a_ptr + mci * block_m * K + kci * block_k /*A*/,
+            a_scales_ptr + mci * block_m /*scales_a*/,
+            a_qzeros_ptr + mci * block_m /*qzeros_a*/,
+            b_ptr + (nc * Kc + kci) * block_n * block_k / 2 /*B*/,
+            b_scales_ptr + nc * block_n * num_groups + kci / block_per_group * block_n /*scales_b*/,
+            b_qzeros_ptr + nc * block_n * num_groups + kci / block_per_group * block_n /*qzeros_b*/,
+            compensation_ptr + nc * block_n * Kc + kci * block_n /*compensation*/,
+            m_size /*M*/,
+            block_k /*K*/,
+            K /*lda*/,
+            block_n /*ldc*/);
+        }
+        // store y_buf to output with dtype conversion
+        store_out<out_dtype, block_n>(
+          y_buf[0],
+          c_ptr + mci * block_m * N + nc * block_n,
+          m_size,
+          N /*lda*/);
+      }
+    }
+    if constexpr (cpublas_can_pack) {
+      at::native::cpublas::brgemm_release();
+    }
+  });
+}
+
+at::Tensor da8w4_linear_impl(
+    const at::Tensor& input,
+    const at::Tensor& input_scales,
+    const at::Tensor& input_qzeros,
+    const at::Tensor& weight,
+    const at::Tensor& weight_scales,
+    const at::Tensor& weight_qzeros,
+    const at::Tensor& compensation,
+    const std::optional<at::Tensor>& bias,
+    at::ScalarType output_dtype) {
+  static bool cpublas_can_pack = cpublas_could_pack();
+  bool sym_quant_a = input.scalar_type() == c10::kChar;
+  auto out_sizes = input.sizes().vec();
+  int64_t N = weight.size(0) * weight.size(-1) * 2;
+  out_sizes.back() = N;
+  auto output = at::empty(out_sizes, input.options().dtype(output_dtype));
+
+#define call__da8w4_linear_impl(cpublas_can_pack, sym_quant_act) \
+    AT_DISPATCH_FLOATING_TYPES_AND2( \
+        at::ScalarType::BFloat16, at::ScalarType::Half, output_dtype, "da8w4_linear_cpu", [&] { \
+          _da8w4_linear_impl<scalar_t, cpublas_can_pack, sym_quant_act>( \
+              input, \
+              input_scales, \
+              input_qzeros, \
+              weight, \
+              weight_scales, \
+              weight_qzeros, \
+              compensation, \
+              bias, \
+              output); \
+        });
+
+  if (cpublas_can_pack) {
+    if (sym_quant_a) {
+      call__da8w4_linear_impl(true, true);
+    } else {
+      call__da8w4_linear_impl(true, false);
+    }
+  } else {
+    if (sym_quant_a) {
+      call__da8w4_linear_impl(false, true);
+    } else {
+      call__da8w4_linear_impl(false, false);
+    }
+  }
+  return output;
+}
+
+} // anonymous namespace
+
+TORCH_LIBRARY_IMPL(torchao, CPU, m) {
+  m.impl("torchao::da8w4_linear_prepack_cpu", &da8w4_linear_prepack_impl);
+  m.impl("torchao::da8w4_linear_cpu", &da8w4_linear_impl);
+}
+
+} // namespace torchao
diff --git a/torchao/dtypes/__init__.py b/torchao/dtypes/__init__.py
index 581c3e4ecb..b0dde2cf10 100644
--- a/torchao/dtypes/__init__.py
+++ b/torchao/dtypes/__init__.py
@@ -20,6 +20,7 @@
     CutlassInt4PackedLayout,
     Int4CPULayout,
     Int4XPULayout,
+    Int8DynamicActInt4WeightCPULayout,
     MarlinQQQLayout,
     MarlinQQQTensor,
     MarlinSparseLayout,
@@ -67,4 +68,5 @@
     "FbgemmInt4Tensor",
     "to_fbgemm_fp8",
     "FbgemmFp8Tensor",
+    "Int8DynamicActInt4WeightCPULayout",
 ]
diff --git a/torchao/dtypes/affine_quantized_tensor_ops.py b/torchao/dtypes/affine_quantized_tensor_ops.py
index 02a2d3004a..8b028352e4 100644
--- a/torchao/dtypes/affine_quantized_tensor_ops.py
+++ b/torchao/dtypes/affine_quantized_tensor_ops.py
@@ -35,6 +35,10 @@
     _linear_int8_act_int4_weight_cutlass_check,
     _linear_int8_act_int4_weight_cutlass_impl,
 )
+from torchao.dtypes.uintx.dyn_int8_act_int4_wei_cpu_layout import (
+    _linear_int8_act_int4_weight_cpu_check,
+    _linear_int8_act_int4_weight_cpu_impl,
+)
 from torchao.dtypes.uintx.gemlite_layout import (
     _linear_fp_act_int4_weight_gemlite_check,
     _linear_fp_act_int4_weight_gemlite_impl,
@@ -247,6 +251,10 @@ def _register_aqt_quantized_linear_dispatches():
             _linear_bf16_act_uint4_weight_float_zero_check,
             _linear_bf16_act_uint4_weight_float_zero_impl,
         ),
+        (
+            _linear_int8_act_int4_weight_cpu_check,
+            _linear_int8_act_int4_weight_cpu_impl,
+        ),
     ]:
         register_aqt_quantized_linear_dispatch(dispatch_condition, impl)
 
diff --git a/torchao/dtypes/uintx/__init__.py b/torchao/dtypes/uintx/__init__.py
index fee6141164..6d1bc95653 100644
--- a/torchao/dtypes/uintx/__init__.py
+++ b/torchao/dtypes/uintx/__init__.py
@@ -4,6 +4,9 @@
 from .cutlass_int4_packed_layout import (
     CutlassInt4PackedLayout,
 )
+from .dyn_int8_act_int4_wei_cpu_layout import (
+    Int8DynamicActInt4WeightCPULayout,
+)
 from .int4_cpu_layout import (
     Int4CPULayout,
 )
@@ -48,4 +51,5 @@
     "PackedLinearInt8DynamicActivationIntxWeightLayout",
     "QDQLayout",
     "Int4XPULayout",
+    "Int8DynamicActInt4WeightCPULayout",
 ]
diff --git a/torchao/dtypes/uintx/dyn_int8_act_int4_wei_cpu_layout.py b/torchao/dtypes/uintx/dyn_int8_act_int4_wei_cpu_layout.py
new file mode 100644
index 0000000000..ced7ec0dd8
--- /dev/null
+++ b/torchao/dtypes/uintx/dyn_int8_act_int4_wei_cpu_layout.py
@@ -0,0 +1,312 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the BSD 3-Clause license found in the
+# LICENSE file in the root directory of this source tree.
+from dataclasses import dataclass
+from typing import Tuple
+
+import torch
+from torch.utils._python_dispatch import (
+    return_and_correct_aliasing,
+)
+
+from torchao.dtypes.affine_quantized_tensor import (
+    AffineQuantizedTensor,
+    register_layout,
+)
+from torchao.dtypes.utils import Layout, PlainLayout, is_device
+from torchao.utils import (
+    TORCH_VERSION_AT_LEAST_2_7,
+    TORCH_VERSION_AT_LEAST_2_8,
+)
+
+from .int4_cpu_layout import (
+    Int4CPUAQTTensorImpl,
+    _is_float,
+)
+
+aten = torch.ops.aten
+
+
+@dataclass(frozen=True)
+class Int8DynamicActInt4WeightCPULayout(Layout):
+    """Layout class for da8w4 CPU layout for affine quantized tensor"""
+
+    pass
+
+
+@register_layout(Int8DynamicActInt4WeightCPULayout)
+class DA8W4CPUAQTTensorImpl(Int4CPUAQTTensorImpl):
+    """TensorImpl for da8w4 CPU layout for affine quantized tensor
+    It stores the original tensor of dimension [n][k] (int32 dtype) as packed weight of 2-d tensor of
+    dimension: [n][k / 2] (uint8 dtype)
+    It is similar to Int4CPUAQTTensorImpl but with a different memory layout of weight data
+    fields:
+      packed_weight (torch.Tensor): the 2-d packed tensor in a Int4 CPU layout
+      scales (torch.Tensor): the scales Tensor used to map between floating point tensor to quantized tensor
+      qzeros (torch.Tensor): the zero_point Tensor used to map between floating point tensor to quantized tensor
+    """
+
+    def __new__(
+        cls,
+        packed_weight: torch.Tensor,
+        scales: torch.Tensor,
+        qzeros: torch.Tensor,
+        compensation: torch.Tensor,
+        transposed: bool,
+        _layout: Layout,
+    ):
+        kwargs = {}
+        kwargs["device"] = packed_weight.device
+        kwargs["layout"] = (
+            kwargs.get("layout")
+            if kwargs.get("layout", False)
+            else packed_weight.layout
+        )
+        kwargs["dtype"] = packed_weight.dtype
+        kwargs["requires_grad"] = False
+        shape = packed_weight.shape
+        return torch.Tensor._make_wrapper_subclass(cls, shape, **kwargs)  # type: ignore[attr-defined]
+
+    def __init__(
+        self,
+        packed_weight: torch.Tensor,
+        scales: torch.Tensor,
+        qzeros: torch.Tensor,
+        compensation: torch.Tensor,
+        transposed: bool,
+        _layout: Layout,
+    ):
+        self.packed_weight = packed_weight
+        self.scales = scales
+        self.qzeros = qzeros
+        self.compensation = compensation
+        self.transposed = transposed
+        self._layout = _layout
+
+    def __tensor_flatten__(self):
+        return ["packed_weight", "scales", "qzeros", "compensation"], [
+            self.transposed,
+            self._layout,
+        ]
+
+    @classmethod
+    def __tensor_unflatten__(
+        cls, tensor_data_dict, tensor_attributes, outer_size, outer_stride
+    ):
+        packed_weight, scales, qzeros, compensation = (
+            tensor_data_dict["packed_weight"],
+            tensor_data_dict["scales"],
+            tensor_data_dict["qzeros"],
+            tensor_data_dict["compensation"],
+        )
+        (
+            transposed,
+            _layout,
+        ) = tensor_attributes
+        return cls(packed_weight, scales, qzeros, compensation, transposed, _layout)
+
+    @classmethod
+    def from_plain(
+        cls,
+        int_data: torch.Tensor,
+        scale: torch.Tensor,
+        zero_point: torch.Tensor,
+        _layout: Layout,
+    ):
+        assert isinstance(_layout, Int8DynamicActInt4WeightCPULayout)
+        assert int_data.dtype == torch.uint8, "DA8W4 CPU: expects uint8 weight"
+        assert int_data.shape[1] % 2 == 0, "DA8W4 CPU: expects even number of columns"
+        if scale.dim() == 1:
+            scale.unsqueeze_(-1)
+        scale = scale.to(torch.float)
+        if zero_point.dim() == 1:
+            zero_point.unsqueeze_(-1)
+
+        weight_int4, scales, qzeros, compensation = (
+            torch.ops.torchao.da8w4_linear_prepack_cpu(int_data, scale, zero_point)
+        )
+        return cls(weight_int4, scales, qzeros, compensation, False, _layout)
+
+    def _apply_fn_to_data(self, fn):
+        return self.__class__(
+            fn(self.packed_weight),
+            fn(self.scales),
+            fn(self.qzeros),
+            fn(self.compensation),
+            self.transposed,
+            self._layout,
+        )
+
+    @classmethod
+    def __torch_dispatch__(cls, func, types, args, kwargs):
+        kwargs = {} if kwargs is None else kwargs
+        if func is aten.t.default:
+            """we don't need to repack the weight and just rely on external
+            shape being changed and record the status of transpose/no-transpose
+            """
+            transposed = DA8W4CPUAQTTensorImpl(
+                args[0].packed_weight,
+                args[0].scales,
+                args[0].qzeros,
+                args[0].compensation,
+                not args[0].transposed,
+                args[0]._layout,
+            )
+            return return_and_correct_aliasing(func, args, kwargs, transposed)
+        else:
+            return super().__torch_dispatch__(func, types, args, kwargs)
+
+    __torch_function__ = torch._C._disabled_torch_function_impl
+
+    @property
+    def block_size(self):
+        assert len(self.packed_weight.shape) == 2
+        weight_shape = self.packed_weight.shape
+        N = weight_shape[0]
+        K = weight_shape[1] * 2
+        groups = self.scales.numel() // N
+        group_size = K // groups
+        return (1, group_size)
+
+    def get_plain(self) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
+        # Unpack weight by linear(eye(K), packed_weight).t()
+        packed_w_shape = self.packed_weight.shape
+        if len(packed_w_shape) == 4:
+            K = packed_w_shape[1] * packed_w_shape[2]
+        else:
+            K = packed_w_shape[1]
+        x = torch.eye(K).to(torch.uint8)
+        x_scale = torch.ones(K).float()
+        x_qzero = torch.zeros(K).to(torch.int32)
+        w_scale = torch.ones_like(self.scales).float()
+        w_qzero = torch.zeros_like(self.qzeros).to(torch.int8)
+        plain_weight = torch.ops.torchao.da8w4_linear_cpu.default(
+            x,
+            x_scale,
+            x_qzero,
+            self.packed_weight,
+            w_scale,
+            w_qzero,
+            self.compensation,
+            None,  # bias
+            torch.float,  # out_dtype
+        )
+        plain_weight = plain_weight.t().contiguous()
+        plain_weight = plain_weight.to(torch.int8)
+
+        if self.scales.dim() == 2:
+            assert self.qzeros.dim() == 2
+            plain_scales = self.scales
+            plain_qzeros = self.qzeros
+        else:
+            assert self.scales.dim() == 3 and self.qzeros.dim() == 3
+            packed_shape = self.scales.shape  # [Nc, G, block_n]
+            plain_scales = (
+                self.scales.permute([0, 2, 1]).contiguous().view([-1, packed_shape[1]])
+            )
+            plain_qzeros = (
+                self.qzeros.permute([0, 2, 1]).contiguous().view([-1, packed_shape[1]])
+            )
+
+        return plain_weight, plain_scales, plain_qzeros
+
+
+def _aqt_is_uint8(aqt):
+    """Check if an AffineQuantizedTensor is uint8 quantized Tensor"""
+    return (
+        aqt.tensor_impl.dtype == torch.uint8
+        and aqt.quant_min == 0
+        and aqt.quant_max == 255
+    )
+
+
+def _aqt_is_int8(aqt):
+    """Check if an AffineQuantizedTensor is uint8 quantized Tensor"""
+    return (
+        aqt.tensor_impl.dtype == torch.int8
+        and aqt.quant_min == -127
+        and aqt.quant_max == 127
+    )
+
+
+def _aqt_is_uint4(aqt):
+    """Check if an AffineQuantizedTensor is uint4 quantized Tensor"""
+    return (
+        aqt.tensor_impl.dtype == torch.uint8
+        and aqt.quant_min == 0
+        and aqt.quant_max == 15
+    )
+
+
+def _linear_int8_act_int4_weight_cpu_check(input_tensor, weight_tensor, bias):
+    return (
+        TORCH_VERSION_AT_LEAST_2_7
+        and is_device(input_tensor.device.type, "cpu")
+        and is_device(weight_tensor.device.type, "cpu")
+        and (bias is None or is_device(bias.device.type, "cpu"))
+        and isinstance(input_tensor, AffineQuantizedTensor)
+        and (_aqt_is_uint8(input_tensor) or _aqt_is_int8(input_tensor))
+        and _is_float(input_tensor.dtype)
+        and isinstance(input_tensor._layout, PlainLayout)
+        and isinstance(weight_tensor, AffineQuantizedTensor)
+        and _aqt_is_uint4(weight_tensor)
+        and _is_float(weight_tensor.dtype)
+        and isinstance(weight_tensor._layout, Int8DynamicActInt4WeightCPULayout)
+    )
+
+
+def _linear_int8_act_int4_weight_cpu_impl(input_tensor, weight_tensor, bias):
+    assert TORCH_VERSION_AT_LEAST_2_7, (
+        f"Requires PyTorch version at least 2.7, but got: {torch.__version__}"
+    )
+    if _aqt_is_int8(input_tensor):
+        assert TORCH_VERSION_AT_LEAST_2_8, (
+            f"Requires PyTorch version at least 2.8, but got: {torch.__version__}"
+        )
+    assert is_device(input_tensor.device.type, "cpu"), (
+        f"For CPU device only but got: {input_tensor.device}"
+    )
+    assert weight_tensor.block_size[0] == 1, (
+        f"Requires groupwise quantization, got block_size: {weight_tensor.block_size}"
+    )
+    assert input_tensor.shape[-1] == weight_tensor.shape[1], (
+        f"need input_tensor shape: {input_tensor.shape} final"
+        f"dim to match weight_tensor shape: {weight_tensor.shape} second dim "
+    )
+
+    act_mat = input_tensor
+    act = act_mat.tensor_impl.int_data
+    act_scales = act_mat.tensor_impl.scale
+    act_qzeros = act_mat.tensor_impl.zero_point
+
+    packed_weight = weight_tensor.tensor_impl.packed_weight
+    wei_scales = weight_tensor.tensor_impl.scales
+    wei_qzeros = weight_tensor.tensor_impl.qzeros
+    compensation = weight_tensor.tensor_impl.compensation
+
+    orig_act_size = act_mat.size()
+    orig_dtype = act_mat.dtype
+
+    # reshape to 2D
+    act = act.reshape(-1, act.shape[-1])
+
+    y = torch.ops.torchao.da8w4_linear_cpu.default(
+        act.contiguous(),
+        act_scales,
+        act_qzeros,
+        packed_weight,
+        wei_scales,
+        wei_qzeros,
+        compensation,
+        bias.float() if bias is not None else bias,  # requires bias to be float
+        orig_dtype,  # out_dtype
+    )
+
+    # remove out_feature padding
+    orig_out_features = weight_tensor.shape[-2]
+    y = y[:, :orig_out_features]
+    y = y.reshape(*orig_act_size[:-1], orig_out_features)
+
+    return y.to(orig_dtype)
diff --git a/torchao/dtypes/uintx/int4_cpu_layout.py b/torchao/dtypes/uintx/int4_cpu_layout.py
index bf9446d265..da19bbc259 100644
--- a/torchao/dtypes/uintx/int4_cpu_layout.py
+++ b/torchao/dtypes/uintx/int4_cpu_layout.py
@@ -150,7 +150,7 @@ def to(self, *args, **kwargs):
         device = kwargs["device"]
         if not is_device(torch.device(self.device).type, device):
             raise ValueError(
-                f"Int4CPUAQTTensorImpl does not support conversion from {self.device} to {device}"
+                f"{self.__class__.__name__} does not support conversion from {self.device} to {device}"
             )
         return self.__class__(
             self.packed_weight.to(device),
@@ -181,18 +181,6 @@ def __torch_dispatch__(cls, func, types, args, kwargs):
                 func, args, kwargs, args[0]._apply_fn_to_data(torch.clone)
             )
 
-        if func is aten.t.default:
-            """we don't need to repack the weight and just rely on external
-            shape being changed and record the status of transpose/no-transpose
-            """
-            transposed = Int4CPUAQTTensorImpl(
-                args[0].packed_weight,
-                args[0].scale_and_zero,
-                not args[0].transposed,
-                args[0]._layout,
-            )
-            return return_and_correct_aliasing(func, args, kwargs, transposed)
-
         if func is aten.slice.Tensor:
             self, dim, start, end, step = fill_defaults(args, 5, [0, None, None, 1])
             if dim in [0, 1]:
@@ -217,11 +205,11 @@ def __torch_dispatch__(cls, func, types, args, kwargs):
                 return return_and_correct_aliasing(func, args, kwargs, sliced)
             else:
                 raise NotImplementedError(
-                    f"Int4CPUAQTTensorImpl dispatch: attempting to run {func}, with dim={dim}, that is not supported"
+                    f"{cls.__name__} dispatch: attempting to run {func}, with dim={dim}, that is not supported"
                 )
 
         raise NotImplementedError(
-            f"Int4CPUAQTTensorImpl dispatch: attempting to run {func}, this is not supported"
+            f"{cls.__name__} dispatch: attempting to run {func}, this is not supported"
         )
 
     __torch_function__ = torch._C._disabled_torch_function_impl
diff --git a/torchao/ops.py b/torchao/ops.py
index cda3746624..babe5506c0 100644
--- a/torchao/ops.py
+++ b/torchao/ops.py
@@ -64,6 +64,12 @@
 lib.define(
     "qscaled_dot_product(Tensor query, Tensor key, Tensor value, Tensor? attn_mask=None, float dropout_p=0.0, bool is_causal=False, float? scale=None, float q_scale=1.0, int q_zp=0, float k_scale=1.0, int k_zp=0, float v_scale=1.0, int v_zp=0, float a_scale=1.0, int a_zp=0, float o_scale=1.0, int o_zp=0) -> Tensor"
 )
+lib.define(
+    "da8w4_linear_prepack_cpu(Tensor weight, Tensor scales, Tensor qzeros) -> (Tensor, Tensor, Tensor, Tensor)"
+)
+lib.define(
+    "da8w4_linear_cpu(Tensor input, Tensor input_scales, Tensor input_qzeros, Tensor weight, Tensor weight_scales, Tensor weight_qzeros, Tensor compensation, Tensor? bias, ScalarType output_dtype) -> Tensor"
+)
 
 
 def register_custom_op(name):
@@ -1022,3 +1028,81 @@ def meta_mx_fp4_bf16(A: Tensor, B: Tensor, A_scale: Tensor, B_scale: Tensor):
     """Meta impl for mx_fp4_bf16"""
     # Assume that the contraction happens in the K dim thus M,N are perserved post bit pack
     return torch.empty((A.size(0), B.size(1)), dtype=torch.bfloat16, device=A.device)
+
+
+def da8w4_linear_prepack_cpu(
+    weight: Tensor,
+    scales: Tensor,
+    qzeros: Tensor,
+) -> Tensor:
+    """
+    Prepack weights for DA8W4 linear operator on CPU.
+    Args:
+        weight: weight tensor.
+        scales: scales for weight tensor.
+        qzeros: zero points for weight tensor.
+    Returns:
+        packed weight, scales, and zero points.
+    """
+    return torch.ops.torchao.da8w4_linear_prepack_cpu.default(weight, scales, qzeros)
+
+
+@register_custom_op("torchao::da8w4_linear_prepack_cpu")
+def _(weight: Tensor, scales: Tensor, qzeros: Tensor) -> Tensor:
+    return weight, scales, qzeros, torch.Tensor()
+
+
+def da8w4_linear_cpu(
+    input: Tensor,
+    input_scales: Tensor,
+    input_qzeros: Tensor,
+    weight: Tensor,
+    weight_scales: Tensor,
+    weight_qzeros: Tensor,
+    compensation: Tensor,
+    bias: Optional[Tensor],
+    out_dtype: torch.dtype,
+):
+    """
+    DA8W4 linear operator on CPU.
+    Args:
+        input: input tensor.
+        input_scales: scales for input tensor.
+        input_qzeros: zero points for input tensor.
+        weight: weight tensor.
+        weight_scales: scales for weight tensor.
+        weight_qzeros: zero points for weight tensor.
+        compensation: compensation tensor for weight.
+        bias: optional bias tensor.
+        out_dtype: output data type.
+    Returns:
+        output tensor in out_dtype.
+    """
+    return torch.ops.torchao.da8w4_linear_cpu.default(
+        input,
+        input_scales,
+        input_qzeros,
+        weight,
+        weight_scales,
+        weight_qzeros,
+        compensation,
+        bias,
+        out_dtype,
+    )
+
+
+@register_custom_op("torchao::da8w4_linear_cpu")
+def _(
+    input: Tensor,
+    input_scales: Tensor,
+    input_qzeros: Tensor,
+    weight: Tensor,
+    weight_scales: Tensor,
+    weight_qzeros: Tensor,
+    compensation: Tensor,
+    bias: Optional[Tensor],
+    out_dtype: torch.dtype,
+) -> Tensor:
+    assert weight.dim() == 4
+    N = weight.size(0) * weight.size(3) * 2
+    return input.new_empty(*input.shape[:-1], N, dtype=out_dtype)
diff --git a/torchao/quantization/quant_api.py b/torchao/quantization/quant_api.py
index 8b66ac84ce..7287ae2bc0 100644
--- a/torchao/quantization/quant_api.py
+++ b/torchao/quantization/quant_api.py
@@ -35,6 +35,7 @@
     Float8Layout,
     Int4CPULayout,
     Int4XPULayout,
+    Int8DynamicActInt4WeightCPULayout,
     MarlinQQQLayout,
     MarlinSparseLayout,
     PackedLinearInt8DynamicActivationIntxWeightLayout,
@@ -660,6 +661,38 @@ def _int8_asymm_per_token_quant(x: torch.Tensor) -> torch.Tensor:
         )
 
 
+def _uint8_asymm_per_token_quant(x: torch.Tensor) -> torch.Tensor:
+    mapping_type = MappingType.ASYMMETRIC
+    target_dtype = torch.uint8
+    scale_dtype = torch.float32
+    eps = torch.finfo(torch.float32).eps
+    zero_point_dtype = torch.int32
+    quant_min = 0
+    quant_max = 255
+    if TORCH_VERSION_AT_LEAST_2_6:
+        out = to_affine_quantized_intx(
+            x,
+            mapping_type,
+            _get_per_token_block_size(x),
+            target_dtype,
+            quant_min=quant_min,
+            quant_max=quant_max,
+            eps=eps,
+            scale_dtype=scale_dtype,
+            zero_point_dtype=zero_point_dtype,
+        )
+    else:
+        out = to_affine_quantized_intx(
+            x,
+            mapping_type,
+            _get_per_token_block_size(x),
+            target_dtype,
+            quant_min=quant_min,
+            quant_max=quant_max,
+        )
+    return out
+
+
 def _int8_symm_per_token_quant(x: torch.Tensor) -> torch.Tensor:
     mapping_type = MappingType.SYMMETRIC
     target_dtype = torch.int8
@@ -731,7 +764,10 @@ def _int8_dynamic_activation_int4_weight_transform(
 
     # input settings
     if act_mapping_type == MappingType.ASYMMETRIC:
-        input_quant_func = _int8_asymm_per_token_quant
+        if isinstance(layout, Int8DynamicActInt4WeightCPULayout):
+            input_quant_func = _uint8_asymm_per_token_quant
+        else:
+            input_quant_func = _int8_asymm_per_token_quant
     elif act_mapping_type == MappingType.SYMMETRIC:
         if isinstance(layout, MarlinQQQLayout):
             input_quant_func = _int8_symm_per_token_quant
@@ -748,6 +784,16 @@ def _int8_dynamic_activation_int4_weight_transform(
         )
     elif isinstance(layout, CutlassInt4PackedLayout):
         weight = _int4_symm_cutlass_quant(weight)
+    elif isinstance(layout, Int8DynamicActInt4WeightCPULayout):
+        weight = to_affine_quantized_intx(
+            weight,
+            mapping_type,
+            block_size,
+            target_dtype=torch.uint8,
+            quant_min=0,
+            quant_max=15,
+            _layout=layout,
+        )
     else:
         weight = to_affine_quantized_intx(
             weight,

From 5a5066735d6336bc770cb487811a681b99f612e2 Mon Sep 17 00:00:00 2001
From: andrewor14 <andrewor14@gmail.com>
Date: Wed, 25 Jun 2025 15:29:30 -0400
Subject: [PATCH 159/165] Call out axolotl + QAT integration on README (#2442)

---
 README.md | 1 +
 1 file changed, 1 insertion(+)

diff --git a/README.md b/README.md
index d269c3974e..fffb640cc7 100644
--- a/README.md
+++ b/README.md
@@ -25,6 +25,7 @@
 ## 📣 Latest News
 
 - [Jun 25] Our [TorchAO paper](https://codeml-workshop.github.io/codeml2025/) was accepted to CodeML @ ICML 2025!
+- [May 25] QAT is now integrated into [Axolotl](https://github.com/axolotl-ai-cloud/axolotl) for fine-tuning ([docs](https://docs.axolotl.ai/docs/qat.html))!
 - [Apr 25] Float8 rowwise training yielded [1.34-1.43x training speedup](https://pytorch.org/blog/accelerating-large-scale-training-and-convergence-with-pytorch-float8-rowwise-on-crusoe-2k-h200s/) at 2k H100 GPU scale
 - [Apr 25] TorchAO is added as a [quantization backend to vLLM](https://docs.vllm.ai/en/latest/features/quantization/torchao.html) ([docs](https://docs.vllm.ai/en/latest/features/quantization/torchao.html))!
 - [Mar 25] Our [2:4 Sparsity paper](https://openreview.net/pdf?id=O5feVk7p6Y) was accepted to SLLM @ ICLR 2025!

From 420f782b5769256cb25575927566a39387bb3467 Mon Sep 17 00:00:00 2001
From: Xia Weiwen <weiwen.xia@intel.com>
Date: Thu, 26 Jun 2025 18:06:39 +0800
Subject: [PATCH 160/165] [CPU] Fix ref path of DA8W4 cpp kernel (#2444)

---
 torchao/csrc/cpu/da8w4_linear.cpp | 5 ++++-
 1 file changed, 4 insertions(+), 1 deletion(-)

diff --git a/torchao/csrc/cpu/da8w4_linear.cpp b/torchao/csrc/cpu/da8w4_linear.cpp
index 537aa0fce9..df2f60b4c7 100644
--- a/torchao/csrc/cpu/da8w4_linear.cpp
+++ b/torchao/csrc/cpu/da8w4_linear.cpp
@@ -70,6 +70,7 @@ da8w4_linear_prepack_impl(
   at::Tensor compensation = weight_sub_qzero.sum(-1);
   compensation = compensation.permute({0, 2, 1}).contiguous().to(at::kInt);
 
+#if defined(CPU_CAPABILITY_AVX512)
   if (cpublas_could_pack()) {
     blocked_weight = at::empty({Nc, Kc, block_k, block_n / 2}, weight.options());
     auto weight_ptr = weight_reordered.data_ptr<uint8_t>();
@@ -105,7 +106,9 @@ da8w4_linear_prepack_impl(
         }
       }
     });
-  } else {
+  } else
+#endif
+  {
     // Pack weight: two int4 -> one int8
     using namespace at::indexing;
     at::Tensor even_columns =

From 353dd44926fb155895d5288bc57b6ed3129429d6 Mon Sep 17 00:00:00 2001
From: Vasiliy Kuznetsov <vkuzo@users.noreply.github.com>
Date: Thu, 26 Jun 2025 13:03:04 -0400
Subject: [PATCH 161/165] float8 readme: remove duplication (#2447)

We had two duplicate example training loops in float8 readme, removing and making the same example work for all recipes
---
 torchao/float8/README.md | 64 ++++++----------------------------------
 1 file changed, 9 insertions(+), 55 deletions(-)

diff --git a/torchao/float8/README.md b/torchao/float8/README.md
index 8533a05779..578fea0d1f 100644
--- a/torchao/float8/README.md
+++ b/torchao/float8/README.md
@@ -12,16 +12,12 @@ and composable with key systems such as autograd, ```torch.compile``` and distri
 
 # Single GPU User API
 
-## float8 linear with dynamic tensorwise scaling
-
-This is the default recipe, with a good balance of performance and accuracy.
-
 ```python
 import time
 
 import torch
 import torch.nn as nn
-from torchao.float8 import convert_to_float8_training
+from torchao.float8 import convert_to_float8_training, Float8LinearConfig
 from torchao.utils import TORCH_VERSION_AT_LEAST_2_5
 
 if not TORCH_VERSION_AT_LEAST_2_5:
@@ -47,8 +43,15 @@ def module_filter_fn(mod: torch.nn.Module, fqn: str):
             return False
     return True
 
+# configure float8 recipe
+# valid recipe names: "tensorwise", "rowwise", "rowwise_with_gw_hp"
+config = Float8LinearConfig.from_recipe_name("tensorwise")
+
 # convert specified `torch.nn.Linear` modules to `Float8Linear`
-convert_to_float8_training(m, module_filter_fn=module_filter_fn)
+convert_to_float8_training(m, config=config, module_filter_fn=module_filter_fn)
+
+# display converted model
+print(m)
 
 # enable torch.compile for competitive performance
 m = torch.compile(m)
@@ -75,55 +78,6 @@ end_time = time.time()
 print("Training time:", end_time - start_time)
 ```
 
-## float8 linear with rowwise scaling
-
-This is a more accurate recipe compared to tensorwise, with more granular scaling.
-
-```python
-import torch
-import torch.nn as nn
-from torchao.float8 import convert_to_float8_training, Float8LinearConfig
-from torchao.utils import TORCH_VERSION_AT_LEAST_2_5
-
-if not TORCH_VERSION_AT_LEAST_2_5:
-    raise AssertionError("torchao.float8 requires PyTorch version 2.5 or greater")
-
-# create model and sample input
-m = nn.Sequential(
-    nn.Linear(2048, 4096),
-    nn.Linear(4096, 128),
-).bfloat16().cuda()
-x = torch.randn(4096, 2048, device="cuda", dtype=torch.bfloat16)
-optimizer = torch.optim.SGD(m.parameters(), lr=0.1)
-
-# optional: filter modules from being eligible for float8 conversion
-def module_filter_fn(mod: torch.nn.Module, fqn: str):
-    # don't convert the last module
-    if fqn == "1":
-        return False
-    # don't convert linear modules with weight dimensions not divisible by 16
-    if isinstance(mod, torch.nn.Linear):
-        if mod.in_features % 16 != 0 or mod.out_features % 16 != 0:
-            return False
-    return True
-
-# configure rowwise scaling
-config = Float8LinearConfig.from_recipe_name("rowwise")
-
-# convert specified `torch.nn.Linear` modules to `Float8Linear`
-convert_to_float8_training(m, config=config, module_filter_fn=module_filter_fn)
-
-# enable torch.compile for competitive performance
-m = torch.compile(m)
-
-# toy training loop
-for _ in range(10):
-    optimizer.zero_grad()
-    y = m(x)
-    y.sum().backward()
-    optimizer.step()
-```
-
 # Multi GPU User API
 
 We compose with the `DTensor` based [distributed APIs](https://pytorch.org/docs/stable/distributed.tensor.parallel.html),

From de5707176df2ff3b8cf5f93ef6f0afcdab9e6a60 Mon Sep 17 00:00:00 2001
From: Vasiliy Kuznetsov <vkuzo@users.noreply.github.com>
Date: Thu, 26 Jun 2025 13:04:03 -0400
Subject: [PATCH 162/165] float8 readme: add key features section (#2448)

Adds a section summarizing the key features of float8 training
---
 torchao/float8/README.md | 9 +++++++++
 1 file changed, 9 insertions(+)

diff --git a/torchao/float8/README.md b/torchao/float8/README.md
index 578fea0d1f..7234840560 100644
--- a/torchao/float8/README.md
+++ b/torchao/float8/README.md
@@ -6,6 +6,15 @@ and up to [**1.25x at 8 GPU / 8B parameter count scale**](#training-benchmarks).
 The codebase strives to stay small, hackable, debuggable with native PyTorch tooling
 and composable with key systems such as autograd, ```torch.compile``` and distributed.
 
+## Key features
+
+* e2e pretraining speedups of up to [**1.5x at 512 GPU / 405B parameter count scale**](https://pytorch.org/blog/training-using-float8-fsdp2/),
+and up to [**1.25x at 8 GPU / 8B parameter count scale**](#training-benchmarks), with performance and accuracy validated on up to [**2k GPUs**](https://pytorch.org/blog/accelerating-large-scale-training-and-convergence-with-pytorch-float8-rowwise-on-crusoe-2k-h200s/), via [torchtitan's float8 integration](https://github.com/pytorch/torchtitan/blob/main/docs/float8.md)
+* seamless composability with [torch.compile](https://docs.pytorch.org/docs/stable/torch.compiler.html)
+* seamless composability with [DTensor](https://docs.pytorch.org/docs/stable/distributed.tensor.html), including [FSDP2 with float8 weight all-gather](https://dev-discuss.pytorch.org/t/enabling-float8-all-gather-in-fsdp2/2359) and [Async TP](https://discuss.pytorch.org/t/distributed-w-torchtitan-introducing-async-tensor-parallelism-in-pytorch/209487)
+* seamless composability with [PyTorch Activation Checkpointing](https://pytorch.org/blog/activation-checkpointing-techniques/)
+* three different scaling recipes to trade off performance vs accuracy: tensorwise (fastest), rowwise, rowwise_with_gw_hp (most accurate)
+
 ℹ️ <em>See the [feature tracker](https://github.com/pytorch/ao/issues/556) for upcoming features.</em>
 
 ℹ️ <em>These APIs are training-only and float8-only, and we plan to [unify them with the rest of torchao](https://github.com/pytorch/ao/issues/894) in the future.</em>

From 6f9f9692b8b708fb737b8ed6d42cf195907e48c2 Mon Sep 17 00:00:00 2001
From: Scott Roy <161522778+metascroy@users.noreply.github.com>
Date: Thu, 26 Jun 2025 10:13:00 -0700
Subject: [PATCH 163/165] Improve tiling params to speed up prefill (#2406)

init
---
 .../linear_8bit_act_xbit_weight.cpp                            | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/torchao/experimental/ops/linear_8bit_act_xbit_weight/linear_8bit_act_xbit_weight.cpp b/torchao/experimental/ops/linear_8bit_act_xbit_weight/linear_8bit_act_xbit_weight.cpp
index 96bfe17b5a..8caffe4342 100644
--- a/torchao/experimental/ops/linear_8bit_act_xbit_weight/linear_8bit_act_xbit_weight.cpp
+++ b/torchao/experimental/ops/linear_8bit_act_xbit_weight/linear_8bit_act_xbit_weight.cpp
@@ -203,7 +203,8 @@ void linear_operator(
     nc = tiling_params->nc;
   } else {
     auto params = LinearTilingParams::from_target_tiles_per_thread(
-        m,
+        // We process m sequentially, so m_step is the "m" for the purpose of computing tiling params
+        m_step,
         m_step,
         n,
         n_step,

From b1163dc63dfa22d403586672fd3648cd661c5003 Mon Sep 17 00:00:00 2001
From: Abdourrahmane Kabbaj <145877572+Akabbaj@users.noreply.github.com>
Date: Thu, 26 Jun 2025 10:22:33 -0700
Subject: [PATCH 164/165] Fixes issue #156414: Fixes bug in implementation of
 _combine_histogram (Follow up) (#2418)

Fixes issue #156414: Fixes bug in implementation of _combine_histograms in torchao/.
---
 torchao/quantization/pt2e/observer.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/torchao/quantization/pt2e/observer.py b/torchao/quantization/pt2e/observer.py
index b781f5a07e..4115040669 100644
--- a/torchao/quantization/pt2e/observer.py
+++ b/torchao/quantization/pt2e/observer.py
@@ -1248,7 +1248,7 @@ def _combine_histograms(
         # If the orig hist only has one value (i.e., the min and max are the same)
         # we can just add it into new histogram
         if orig_min == orig_max:
-            bin_value = torch.sum(update_hist)
+            bin_value = torch.sum(orig_hist)
             transformed_orig_hist = (
                 torch.histc(orig_min, bins=self.bins, min=update_min, max=update_max)  # type: ignore[arg-type]
                 * bin_value

From 994a4ba6c869854fcaa6ca7e118fcbd75e6c28cc Mon Sep 17 00:00:00 2001
From: Driss Guessous <32754868+drisspg@users.noreply.github.com>
Date: Thu, 26 Jun 2025 12:50:32 -0700
Subject: [PATCH 165/165] Store NVFP4 block scales in swwizzled layout on
 tensor (#2438)

---
 test/prototype/mx_formats/test_mx_linear.py  |   2 +
 test/prototype/mx_formats/test_mx_tensor.py  | 298 +++++++++++++++++++
 torchao/prototype/mx_formats/mx_subclass.py  |   7 +-
 torchao/prototype/mx_formats/nvfp4_tensor.py | 243 ++++++++++++---
 torchao/prototype/mx_formats/utils.py        |  32 ++
 torchao/utils.py                             |   4 +
 6 files changed, 543 insertions(+), 43 deletions(-)

diff --git a/test/prototype/mx_formats/test_mx_linear.py b/test/prototype/mx_formats/test_mx_linear.py
index 8a69737889..4e24cfc482 100644
--- a/test/prototype/mx_formats/test_mx_linear.py
+++ b/test/prototype/mx_formats/test_mx_linear.py
@@ -558,11 +558,13 @@ def test_nvfp4_matmul_with_amax(
         A,
         per_tensor_scale=a_scale,
         mm_config=mm_config,
+        is_swizzled_scales=True,
     )
     B_nvfp4 = NVFP4Tensor.to_nvfp4(
         B,
         per_tensor_scale=b_scale,
         mm_config=mm_config,
+        is_swizzled_scales=True,
     )
 
     func = torch.compile(F.linear, fullgraph=True) if compile else F.linear
diff --git a/test/prototype/mx_formats/test_mx_tensor.py b/test/prototype/mx_formats/test_mx_tensor.py
index 7294590b57..3c4dc7c7b6 100644
--- a/test/prototype/mx_formats/test_mx_tensor.py
+++ b/test/prototype/mx_formats/test_mx_tensor.py
@@ -657,3 +657,301 @@ def assert_sqnr_gt_threshold(orig, new, threshold):
     assert x.t().dtype == x_reconstructed_t.dtype, (
         f"Transpose dtype mismatch: {x.t().dtype} vs {x_reconstructed_t.dtype}"
     )
+
+
+@pytest.mark.parametrize(
+    "shape",
+    [
+        (128, 4),
+        (256, 8),
+        (100, 3),
+        (4, 4),
+        (50, 10),
+        (384, 12),
+    ],
+)
+@pytest.mark.parametrize(
+    "use_triton_kernel", [False, True] if torch.cuda.is_available() else [False]
+)
+@pytest.mark.skipif(
+    not TORCH_VERSION_AT_LEAST_2_8, reason="torch.compile requires PyTorch 2.8+"
+)
+def test_to_blocked_from_blocked_roundtrip(shape, use_triton_kernel: bool):
+    from torchao.prototype.mx_formats.utils import from_blocked, to_blocked
+
+    rows, cols = shape
+    device = "cuda" if torch.cuda.is_available() else "cpu"
+
+    original = torch.randint(0, 255, (rows, cols), device=device, dtype=torch.uint8)
+
+    blocked = to_blocked(original, use_triton_kernel=use_triton_kernel)
+    reconstructed = from_blocked(blocked, rows, cols)
+
+    torch.testing.assert_close(
+        original,
+        reconstructed,
+        atol=0.0,
+        rtol=0.0,
+        msg=f"Roundtrip failed for shape {shape} with use_triton_kernel={use_triton_kernel}",
+    )
+
+
+@pytest.mark.parametrize("is_swizzled_scales", [False, True])
+@pytest.mark.parametrize(
+    "shape",
+    [
+        (32, 64),
+        (16, 32),
+        (64, 128),
+        (384, 128),
+    ],
+)
+@pytest.mark.skipif(
+    not TORCH_VERSION_AT_LEAST_2_8, reason="torch.compile requires PyTorch 2.8+"
+)
+@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+def test_nvfp4_swizzled_scales_construction(is_swizzled_scales, shape):
+    """
+    Test that NVFP4Tensor can be constructed with swizzled scales and
+    that the _is_swizzled_scales flag is set correctly.
+    """
+    from torchao.prototype.mx_formats.nvfp4_tensor import NVFP4Tensor
+
+    M, K = shape
+    data = torch.randn(M, K, device="cuda", dtype=torch.bfloat16)
+
+    tensor = NVFP4Tensor.to_nvfp4(data, is_swizzled_scales=is_swizzled_scales)
+    assert tensor._is_swizzled_scales == is_swizzled_scales
+    reconstructed = tensor.to_dtype(torch.bfloat16)
+    assert reconstructed.shape == data.shape
+
+
+@pytest.mark.parametrize(
+    "slice_dim,slice_spec",
+    [
+        # Row slicing - must align with 128-row boundaries
+        pytest.param(0, slice(0, 128), id="slice_rows[0:128]"),
+        pytest.param(0, slice(128, 256), id="slice_rows[128:256]"),
+        # Column slicing - must align with 64-column boundaries (4 scale columns * 16 block_size)
+        pytest.param(1, slice(0, 64), id="slice_cols[0:64]"),
+        pytest.param(1, slice(64, 128), id="slice_cols[64:128]"),
+        pytest.param(1, slice(0, 128), id="slice_cols[0:128]_full_width"),
+        # Test tensor parallelism patterns (half splits)
+        pytest.param(1, slice(0, 2048), id="slice_cols[0:2048]_tp_first_half"),
+        pytest.param(1, slice(2048, 4096), id="slice_cols[2048:4096]_tp_second_half"),
+        # Test quarter splits
+        pytest.param(1, slice(0, 1024), id="slice_cols[0:1024]_quarter"),
+        pytest.param(1, slice(1024, 2048), id="slice_cols[1024:2048]_quarter"),
+    ],
+)
+@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(
+    not TORCH_VERSION_AT_LEAST_2_8, reason="NVFP4 requires PyTorch 2.8+"
+)
+def test_nvfp4_swizzled_scales_slicing(slice_dim, slice_spec):
+    """
+    Test that slicing works correctly with swizzled scales and maintains
+    the swizzled state in the output tensor.
+    """
+    from torchao.prototype.mx_formats.nvfp4_tensor import NVFP4Tensor
+
+    # Use larger tensor sizes that align with swizzled requirements
+    if slice_dim == 0:
+        # For row slicing, need at least 256 rows to test 128-row boundaries
+        M, K = 256, 4096
+    else:
+        # For column slicing, need multiples of 64 columns for alignment
+        M, K = 128, 4096
+
+    data = torch.randn(M, K, device="cuda", dtype=torch.bfloat16)
+
+    tensor = NVFP4Tensor.to_nvfp4(data, is_swizzled_scales=True)
+    assert tensor._is_swizzled_scales == True
+
+    if slice_dim == 0:
+        sliced_tensor = tensor[slice_spec, :]
+    else:
+        sliced_tensor = tensor[:, slice_spec]
+
+    # Verify sliced tensor maintains swizzled state
+    assert sliced_tensor._is_swizzled_scales == True
+
+    # Verify sliced tensor can be dequantized
+    sliced_reconstructed = sliced_tensor.to_dtype(torch.bfloat16)
+
+    # Compare with direct slicing of original data
+    original_reconstructed = tensor.to_dtype(torch.bfloat16)
+    if slice_dim == 0:
+        expected = original_reconstructed[slice_spec, :]
+    else:
+        expected = original_reconstructed[:, slice_spec]
+
+    torch.testing.assert_close(sliced_reconstructed, expected, atol=1e-6, rtol=1e-6)
+
+
+@pytest.mark.parametrize(
+    "slice_dim,slice_spec,expected_error",
+    [
+        # Row slicing with misaligned boundaries
+        pytest.param(
+            0,
+            slice(0, 100),
+            "Row slicing of NVFP4Tensor with swizzled scales requires",
+            id="misaligned_row_end",
+        ),
+        pytest.param(
+            0,
+            slice(50, 150),
+            "Row slicing of NVFP4Tensor with swizzled scales requires",
+            id="misaligned_row_start",
+        ),
+        # Column slicing with misaligned boundaries
+        pytest.param(
+            1,
+            slice(0, 32),
+            "Column slicing of NVFP4Tensor with swizzled scales requires",
+            id="misaligned_col_32",
+        ),
+        pytest.param(
+            1,
+            slice(16, 80),
+            "Column slicing of NVFP4Tensor with swizzled scales requires",
+            id="misaligned_col_start",
+        ),
+        pytest.param(
+            1,
+            slice(0, 100),
+            "Column slicing of NVFP4Tensor with swizzled scales requires",
+            id="misaligned_col_end",
+        ),
+        # Odd column boundaries (FP4 packing requirement)
+        pytest.param(
+            1,
+            slice(1, 65),
+            "start index to be a multiple of 64, got 1",
+            id="odd_start",
+        ),
+        pytest.param(
+            1,
+            slice(0, 65),
+            " multiple of 64 or equal to tensor size 4096, got 65",
+            id="odd_end",
+        ),
+    ],
+)
+@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(
+    not TORCH_VERSION_AT_LEAST_2_8, reason="NVFP4 requires PyTorch 2.8+"
+)
+def test_nvfp4_swizzled_scales_slicing_errors(slice_dim, slice_spec, expected_error):
+    """
+    Test that slicing raises appropriate errors for misaligned boundaries.
+    """
+    from torchao.prototype.mx_formats.nvfp4_tensor import NVFP4Tensor
+
+    M, K = 256, 4096
+    data = torch.randn(M, K, device="cuda", dtype=torch.bfloat16)
+    tensor = NVFP4Tensor.to_nvfp4(data, is_swizzled_scales=True)
+
+    with pytest.raises(RuntimeError, match=expected_error):
+        if slice_dim == 0:
+            _ = tensor[slice_spec, :]
+        else:
+            _ = tensor[:, slice_spec]
+
+
+@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(
+    not TORCH_VERSION_AT_LEAST_2_8, reason="NVFP4 requires PyTorch 2.8+"
+)
+def test_nvfp4_swizzled_scales_view_semantics():
+    """
+    Test that slicing maintains proper view semantics where possible.
+    """
+    from torchao.prototype.mx_formats.nvfp4_tensor import NVFP4Tensor
+
+    M, K = 256, 4096
+    data = torch.randn(M, K, device="cuda", dtype=torch.bfloat16)
+    tensor = NVFP4Tensor.to_nvfp4(data, is_swizzled_scales=True)
+
+    # Test row slicing (should maintain views)
+    sliced_tensor = tensor[0:128, :]
+
+    # Test that the sliced tensor shares storage with original for data
+    # (Note: scales might not share storage due to swizzled layout complexity)
+    assert sliced_tensor._data.data_ptr() == tensor._data.data_ptr()
+
+    # Test full-width column slicing (should maintain views)
+    full_width_slice = tensor[:, 0:K]
+    assert full_width_slice._scale_e4m3.data_ptr() == tensor._scale_e4m3.data_ptr()
+    assert full_width_slice._data.data_ptr() == tensor._data.data_ptr()
+
+
+@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(
+    not TORCH_VERSION_AT_LEAST_2_8, reason="NVFP4 requires PyTorch 2.8+"
+)
+def test_nvfp4_swizzled_scales_serialization():
+    """
+    Test that tensor flatten/unflatten preserves the swizzled scales state.
+    """
+    from torchao.prototype.mx_formats.nvfp4_tensor import NVFP4Tensor
+
+    M, K = 32, 64
+    data = torch.randn(M, K, device="cuda", dtype=torch.bfloat16)
+
+    # Create tensor with swizzled scales
+    original_tensor = NVFP4Tensor.to_nvfp4(data, is_swizzled_scales=True)
+
+    # Test serialization
+    tensor_list, ctx = original_tensor.__tensor_flatten__()
+
+    # Verify swizzled flag is preserved in context
+    assert "_is_swizzled_scales" in ctx
+    assert ctx["_is_swizzled_scales"] == True
+
+    # Test deserialization
+    inner_tensors = {}
+    for name in tensor_list:
+        inner_tensors[name] = getattr(original_tensor, name)
+
+    reconstructed_tensor = NVFP4Tensor.__tensor_unflatten__(
+        inner_tensors, ctx, None, None
+    )
+
+    # Verify the swizzled state is preserved
+    assert reconstructed_tensor._is_swizzled_scales == True
+
+    # Verify functionality is preserved
+    original_dq = original_tensor.to_dtype(torch.bfloat16)
+    reconstructed_dq = reconstructed_tensor.to_dtype(torch.bfloat16)
+
+    torch.testing.assert_close(original_dq, reconstructed_dq, atol=1e-6, rtol=1e-6)
+
+
+@pytest.mark.skipif(not torch.cuda.is_available(), reason="CUDA not available")
+@pytest.mark.skipif(
+    not TORCH_VERSION_AT_LEAST_2_8, reason="NVFP4 requires PyTorch 2.8+"
+)
+def test_nvfp4_swizzled_scales_get_scales_method():
+    """
+    Test that the get_scales() method correctly unswizzles scales when needed.
+    """
+    from torchao.prototype.mx_formats.nvfp4_tensor import NVFP4Tensor
+
+    M, K = 32, 64
+    data = torch.randn(M, K, device="cuda", dtype=torch.bfloat16)
+
+    # Create tensors with both storage methods
+    regular_tensor = NVFP4Tensor.to_nvfp4(data, is_swizzled_scales=False)
+    swizzled_tensor = NVFP4Tensor.to_nvfp4(data, is_swizzled_scales=True)
+
+    # Get scales from both tensors and verify they are equal
+    regular_scales = regular_tensor.get_hp_scales()
+    swizzled_scales = swizzled_tensor.get_hp_scales()
+    torch.testing.assert_close(regular_scales, swizzled_scales, atol=0.0, rtol=0.0)
+
+    # Verify scales have the expected shape
+    expected_shape = (M, K // 16)
+    assert regular_scales.shape == expected_shape
+    assert swizzled_scales.shape == expected_shape
diff --git a/torchao/prototype/mx_formats/mx_subclass.py b/torchao/prototype/mx_formats/mx_subclass.py
index d1be8a04f4..e70930cd55 100644
--- a/torchao/prototype/mx_formats/mx_subclass.py
+++ b/torchao/prototype/mx_formats/mx_subclass.py
@@ -184,6 +184,11 @@ def _nvfp4_inference_linear_transform(
 
     weight = module.weight
 
+    if weight.shape[0] % 16 != 0 or weight.shape[1] % 16 != 0:
+        raise RuntimeError(
+            f"NVFP4 only supports weight shape divisible by 16, got {weight.shape}"
+        )
+
     if module.bias is not None and weight.dtype == torch.float32:
         raise RuntimeError(
             "Bias is not supported when module weight is in fp32 (out_dtype=Float32). "
@@ -193,8 +198,8 @@ def _nvfp4_inference_linear_transform(
     quantized_weight = NVFP4Tensor.to_nvfp4(
         weight,
         mm_config=config.mm_config,
+        is_swizzled_scales=True,
     )
-
     module.weight = torch.nn.Parameter(quantized_weight, requires_grad=False)
     module.extra_repr = types.MethodType(_linear_extra_repr, module)
     return module
diff --git a/torchao/prototype/mx_formats/nvfp4_tensor.py b/torchao/prototype/mx_formats/nvfp4_tensor.py
index ed1b5df1d0..1545b1bc94 100644
--- a/torchao/prototype/mx_formats/nvfp4_tensor.py
+++ b/torchao/prototype/mx_formats/nvfp4_tensor.py
@@ -4,6 +4,7 @@
 # This source code is licensed under the BSD 3-Clause license found in the
 # LICENSE file in the root directory of this source tree.
 
+import sys
 from enum import Enum
 from typing import Any, Callable, Dict, Optional
 
@@ -21,8 +22,8 @@
     tensor_size_fp4x2_to_hp,
     tensor_size_hp_to_fp4x2,
 )
-from torchao.prototype.mx_formats.utils import to_blocked
-from torchao.utils import fill_defaults
+from torchao.prototype.mx_formats.utils import from_blocked, to_blocked
+from torchao.utils import ceil_div, fill_defaults
 
 E4M3_EPS = torch.finfo(torch.float8_e4m3fn).tiny
 
@@ -54,11 +55,12 @@ class NVFP4Tensor(torch.Tensor):
     quantization algorithm for FP4 data with UE4M3 scales.
 
     Attributes:
-        _scale_e4m3: Blockwise scales in float8_e4m3fn format
+        _scale_e4m3: Blockwise scales in float8_e4m3fn format (may be swizzled)
         _per_tensor_scale: Optional global per-tensor scale in float32 format
         _data: Packed FP4 data (2 values per byte)
         _block_size: Block size for quantization (fixed at 16)
         _orig_dtype: Original tensor dtype before quantization
+        _is_swizzled_scales: Whether scales are stored in swizzled (blocked) format
         mm_config: Matrix multiplication configuration
     """
 
@@ -67,6 +69,7 @@ class NVFP4Tensor(torch.Tensor):
     _data: torch.Tensor
     _block_size: int
     _orig_dtype: torch.dtype
+    _is_swizzled_scales: bool
     mm_config: NVFP4MMConfig
 
     def __new__(
@@ -77,12 +80,14 @@ def __new__(
         block_size,
         orig_dtype,
         mm_config=NVFP4MMConfig.DYNAMIC,
+        is_swizzled_scales=False,
     ):
-        # FP4 tensor size handling
+        # FP4 tensor size handling two paths, contiguous or not
         new_size = data_bits.size()
+
         new_size = tensor_size_fp4x2_to_hp(
             new_size,
-            data_bits.is_contiguous(),
+            data_bits.stride(0) > data_bits.stride(1),
         )
 
         self = torch.Tensor._make_wrapper_subclass(
@@ -94,6 +99,7 @@ def __new__(
         )
 
         self._scale_e4m3 = blockwise_scales
+        self._is_swizzled_scales = is_swizzled_scales
         self._per_tensor_scale = per_tensor_scale
         self._data = data_bits
         self._block_size = block_size
@@ -118,14 +124,17 @@ def to_nvfp4(
         block_size: int = 16,
         per_tensor_scale: Optional[torch.Tensor] = None,
         mm_config: NVFP4MMConfig = NVFP4MMConfig.DYNAMIC,
+        is_swizzled_scales: bool = False,
     ):
         """Convert high precision tensor to NVFP4 format.
 
         Args:
             data_hp: High precision input tensor (bfloat16 or float32)
             block_size: Block size for quantization (must be 16)
-            per_tensor_amax: Optional pre-computed absolute maximum for calibration.
+            per_tensor_scale: Optional pre-computed absolute maximum for calibration.
                 If provided, uses per-tensor scaling. If None, uses block-wise scaling only.
+            mm_config: Matrix multiplication configuration
+            is_swizzled_scales: If True, store scales in swizzled format for faster matrix multiplication
 
         Returns:
             NVFP4Tensor: Quantized tensor in NVFP4 format
@@ -133,6 +142,12 @@ def to_nvfp4(
         blockwise_scales, data_lp = nvfp4_quantize(
             data_hp, block_size, per_tensor_scale
         )
+
+        if is_swizzled_scales:
+            M, K = data_hp.shape[0], data_hp.shape[1]
+            scale_shape = (M, K // block_size)
+            blockwise_scales = to_blocked(blockwise_scales.view(scale_shape)).flatten()
+
         return NVFP4Tensor(
             blockwise_scales,
             per_tensor_scale,
@@ -140,12 +155,14 @@ def to_nvfp4(
             block_size,
             data_hp.dtype,
             mm_config,
+            is_swizzled_scales,
         )
 
     def __tensor_flatten__(self):
         ctx = {
             "_block_size": self._block_size,
             "_orig_dtype": self._orig_dtype,
+            "_is_swizzled_scales": self._is_swizzled_scales,
             "mm_config": self.mm_config,
         }
         tensor_list = ["_scale_e4m3", "_data"]
@@ -182,6 +199,7 @@ def __tensor_unflatten__(
             metadata["_block_size"],
             metadata["_orig_dtype"],
             metadata["mm_config"],
+            metadata.get("_is_swizzled_scales", False),
         )
 
     # Do not force the NVFP4Tensor type on the returned tensor
@@ -196,7 +214,7 @@ def to_dtype(self, target_dtype: torch.dtype) -> torch.Tensor:
         Returns:
             torch.Tensor: Dequantized tensor in the target dtype
         """
-        is_transposed = not self._data.is_contiguous()
+        is_transposed = self._data.stride(0) < self._data.stride(1)
         if is_transposed:
             M, K = self.shape[1], self.shape[0]
         else:
@@ -221,10 +239,21 @@ def get_hp_scales(self) -> torch.Tensor:
         Returns:
             torch.Tensor: Scales of the NVFP4Tensor
         """
+        is_transposed = self._data.stride(0) < self._data.stride(1)
+        if is_transposed:
+            M, K = self.shape[1], self.shape[0]
+        else:
+            M, K = self.shape[0], self.shape[1]
+
+        if self._is_swizzled_scales:
+            scale_e4m3 = from_blocked(self._scale_e4m3, M, K // self._block_size)
+        else:
+            scale_e4m3 = self._scale_e4m3
+
         return (
-            self._scale_e4m3.to(self._orig_dtype)
+            scale_e4m3.to(self._orig_dtype)
             if not self._per_tensor_scale
-            else self._per_tensor_scale * self._scale_e4m3.to(self._orig_dtype)
+            else self._per_tensor_scale * scale_e4m3.to(self._orig_dtype)
         )
 
     @classmethod
@@ -238,7 +267,6 @@ def _same_metadata(cls, self: "NVFP4Tensor", src: "NVFP4Tensor") -> bool:
         Returns:
             bool: True if both tensors have identical metadata, False otherwise
         """
-        # Check per_tensor_scale equality
         per_tensor_scale_equal = (
             self._per_tensor_scale is None and src._per_tensor_scale is None
         ) or (self._per_tensor_scale.shape == src._per_tensor_scale.shape)
@@ -248,6 +276,7 @@ def _same_metadata(cls, self: "NVFP4Tensor", src: "NVFP4Tensor") -> bool:
             and isinstance(src, NVFP4Tensor)
             and self._block_size == src._block_size
             and self._orig_dtype == src._orig_dtype
+            and self._is_swizzled_scales == src._is_swizzled_scales
             and self._scale_e4m3.shape == src._scale_e4m3.shape
             and per_tensor_scale_equal
             and self._data.shape == src._data.shape
@@ -292,6 +321,7 @@ def nvfp4_to_copy(func, types, args, kwargs):
             tensor._block_size,
             dtype,
             tensor.mm_config,
+            tensor._is_swizzled_scales,
         )
         return res
 
@@ -335,46 +365,166 @@ def nvfp4_slice(func, types, args, kwargs):
     assert x._data.is_contiguous(), "Only support contiguous data for now"
 
     M, K = x.shape[0], x.shape[1]
-    scale_shaped = x._scale_e4m3.view(M, K // x._block_size)
-
-    if dim == 0:
-        # Slicing along the first dimension (rows)
-        sliced_scale = aten.slice.Tensor(scale_shaped, dim, start, end, step).flatten()
-        sliced_data = aten.slice.Tensor(x._data, dim, start, end, step)
-    elif dim == 1:
-        # Slicing along reduction dim - must align with block boundaries
-        if start is not None:
-            assert start % x._block_size == 0, (
-                f"Start index {start} must be a multiple of block_size {x._block_size}"
-            )
 
-        if end is not None:
-            assert end % x._block_size == 0, (
-                f"End index {end} must be a multiple of block_size {x._block_size}"
+    if x._is_swizzled_scales:
+        scale_rows = M
+        scale_cols = K // x._block_size
+        n_row_blocks = ceil_div(scale_rows, 128)
+        n_col_blocks = ceil_div(scale_cols, 4)
+        elements_per_block = 32 * 16  # 512 elements
+
+        if dim == 0:
+            # Row slicing
+            # Handle sys.maxsize (default slice end)
+            if end == sys.maxsize:
+                end = M
+
+            # Check if start/end align with 128-row boundaries
+            if start is not None and start % 128 != 0:
+                raise RuntimeError(
+                    f"Row slicing of NVFP4Tensor with swizzled scales requires "
+                    f"start index to be a multiple of 128, got {start}"
+                )
+            if end is not None and end != M and end % 128 != 0:
+                raise RuntimeError(
+                    f"Row slicing of NVFP4Tensor with swizzled scales requires "
+                    f"end index to be a multiple of 128 or equal to tensor size {M}, got {end}"
+                )
+
+            # Calculate which row blocks to keep
+            start_block = 0 if start is None else start // 128
+            end_block = n_row_blocks if end is None or end >= M else end // 128
+
+            # The swizzled tensor has shape (n_row_blocks * n_col_blocks * 32 * 16,)
+            blocks_per_row = n_col_blocks
+            start_idx = start_block * blocks_per_row * elements_per_block
+            end_idx = (
+                end_block * blocks_per_row * elements_per_block
+                if end_block < n_row_blocks
+                else None
             )
 
-        sliced_data = aten.slice.Tensor(x._data, dim, start, end, step)
+            sliced_scale = aten.slice.Tensor(x._scale_e4m3, 0, start_idx, end_idx, 1)
+            sliced_data = aten.slice.Tensor(x._data, 0, start, end, step)
+
+        elif dim == 1:
+            # Column slicing
+            # Handle sys.maxsize (default slice end)
+            if end == sys.maxsize:
+                end = K
+
+            # Check if start/end align with 64-column boundaries (4 scale columns * 16 block_size)
+            if start is not None and start % 64 != 0:
+                raise RuntimeError(
+                    f"Column slicing of NVFP4Tensor with swizzled scales requires "
+                    f"start index to be a multiple of 64, got {start}"
+                )
+            if end is not None and end != K and end % 64 != 0:
+                raise RuntimeError(
+                    f"Column slicing of NVFP4Tensor with swizzled scales requires "
+                    f"end index to be a multiple of 64 or equal to tensor size {K}, got {end}"
+                )
+
+            # Also check FP4 packing alignment
+            if start is not None and start % 2 != 0:
+                raise RuntimeError(f"Start index {start} must be even for FP4 packing")
+            if end is not None and end != K and end % 2 != 0:
+                raise RuntimeError(f"End index {end} must be even for FP4 packing")
+
+            # Calculate which column blocks to keep
+            start_scale_col = 0 if start is None else start // 16
+            end_scale_col = scale_cols if end is None or end >= K else end // 16
+
+            start_col_block = start_scale_col // 4
+            end_col_block = end_scale_col // 4
+
+            # Verify the end aligns with block boundary
+            if end_scale_col % 4 != 0:
+                raise RuntimeError(
+                    f"Column slicing end index {end} does not align with scale block boundaries. "
+                    f"End must result in a multiple of 4 scale columns (64 data columns)."
+                )
+
+            if start_col_block == 0 and end_col_block == n_col_blocks:
+                # Full width - no slicing needed
+                sliced_scale = x._scale_e4m3
+            else:
+                # Extract specific column blocks from each row block
+                # Each row block in swizzled format contains n_col_blocks chunks of (32, 16)
+                elements_per_row_block = n_col_blocks * elements_per_block
+
+                # Build list of slices to extract
+                slices_to_extract = []
+                for row_block in range(n_row_blocks):
+                    row_start = row_block * elements_per_row_block
+                    col_start = row_start + start_col_block * elements_per_block
+                    col_end = row_start + end_col_block * elements_per_block
+                    slices_to_extract.append(x._scale_e4m3[col_start:col_end])
+
+                # Concatenate all the slices
+                sliced_scale = torch.cat(slices_to_extract, dim=0)
+
+            # Slice the data tensor
+            packed_start = None if start is None else start // 2
+            packed_end = None if end is None else end // 2
+            sliced_data = aten.slice.Tensor(
+                x._data, dim, packed_start, packed_end, step
+            )
 
-        # Calculate which scale blocks to keep
-        start_block = 0 if start is None else start // x._block_size
-        end_block = None if end is None else end // x._block_size
+        else:
+            raise ValueError(
+                f"NVFP4Tensor only supports slicing along dimensions 0 and 1, got dim={dim}"
+            )
 
-        # Slice the scale tensor accordingly
-        sliced_scale = aten.slice.Tensor(scale_shaped, 1, start_block, end_block, step)
     else:
-        raise ValueError(
-            f"NVFP4Tensor only supports slicing along dimensions 0 and 1, got dim={dim}"
-        )
+        scale_shaped = x._scale_e4m3.view(M, K // x._block_size)
+
+        if dim == 0:
+            sliced_scale = aten.slice.Tensor(scale_shaped, dim, start, end, step)
+            sliced_data = aten.slice.Tensor(x._data, dim, start, end, step)
+
+        elif dim == 1:
+            if start is not None:
+                assert start % x._block_size == 0, (
+                    f"Start index {start} must be a multiple of block_size {x._block_size}"
+                )
+                assert start % 2 == 0, (
+                    f"Start index {start} must be even for FP4 packing"
+                )
+
+            if end is not None and end != sys.maxsize:
+                assert end % x._block_size == 0, (
+                    f"End index {end} must be a multiple of block_size {x._block_size}"
+                )
+                assert end % 2 == 0, f"End index {end} must be even for FP4 packing"
+
+            packed_start = None if start is None else start // 2
+            packed_end = None if end is None else end // 2
+            sliced_data = aten.slice.Tensor(
+                x._data, dim, packed_start, packed_end, step
+            )
 
-    return NVFP4Tensor(
+            start_block = 0 if start is None else start // x._block_size
+            end_block = None if end is None else end // x._block_size
+            sliced_scale = aten.slice.Tensor(
+                scale_shaped, 1, start_block, end_block, step
+            )
+
+        sliced_scale = sliced_scale.flatten()
+
+    # Create result tensor
+    result = NVFP4Tensor(
         sliced_scale,
-        x._per_tensor_scale,  # Unchanged per-tensor scale
+        x._per_tensor_scale,
         sliced_data,
         x._block_size,
         x._orig_dtype,
         x.mm_config,
+        x._is_swizzled_scales,
     )
 
+    return return_and_correct_aliasing(func, args, kwargs, result)
+
 
 @implements([aten.t.default])
 def nvfp4_t(func, types, args, kwargs):
@@ -387,6 +537,7 @@ def nvfp4_t(func, types, args, kwargs):
         old._block_size,
         old._orig_dtype,
         old.mm_config,
+        old._is_swizzled_scales,
     )
     return new
 
@@ -404,6 +555,7 @@ def nvfp4_view_op(func, types, args, kwargs):
         args[0]._block_size,
         args[0]._orig_dtype,
         args[0].mm_config,
+        args[0]._is_swizzled_scales,
     )
 
 
@@ -423,10 +575,17 @@ def _addmm_nvfp4_dispatch(
     N = b.shape[1]
 
     # Swizzle Dizzle
-    a_scale = a._scale_e4m3.view(M, K // a._block_size)
-    b_scale = b._scale_e4m3.view(N, K // b._block_size)
-    a_scale_blocked = to_blocked(a_scale)
-    b_scale_blocked = to_blocked(b_scale)
+    if a._is_swizzled_scales:
+        a_scale_blocked = a._scale_e4m3  # Already swizzled
+    else:
+        a_scale = a._scale_e4m3.view(M, K // a._block_size)
+        a_scale_blocked = to_blocked(a_scale)
+
+    if b._is_swizzled_scales:
+        b_scale_blocked = b._scale_e4m3  # Already swizzled
+    else:
+        b_scale = b._scale_e4m3.view(N, K // b._block_size)
+        b_scale_blocked = to_blocked(b_scale)
 
     # Merge double quant scales into 1 scale for Scale_In^D
     if a._per_tensor_scale is not None:
@@ -571,8 +730,8 @@ def nvfp4_quantize(
     assert data_hp.dtype in (torch.bfloat16, torch.float), (
         f"{data_hp.dtype} not supported"
     )
-    assert data_hp.numel() % block_size == 0, "unsupported"
-    assert data_hp.is_contiguous(), "unsupported"
+    assert data_hp.size(-1) % block_size == 0, "K dim must be divisible by block_size"
+    assert data_hp.is_contiguous(), "Only support contiguous data for now"
     assert block_size == 16, "NVFP4 requires block_size=16"
 
     orig_shape = data_hp.shape
diff --git a/torchao/prototype/mx_formats/utils.py b/torchao/prototype/mx_formats/utils.py
index e4777d3899..1a48dd4592 100644
--- a/torchao/prototype/mx_formats/utils.py
+++ b/torchao/prototype/mx_formats/utils.py
@@ -58,6 +58,38 @@ def to_blocked(input_matrix, use_triton_kernel: bool = True) -> Tensor:
     return rearranged.flatten()
 
 
+def from_blocked(
+    blocked_tensor: Tensor, original_rows: int, original_cols: int
+) -> Tensor:
+    """
+    Inverse of to_blocked: convert from blocked layout back to regular row-major layout.
+
+    Args:
+        blocked_tensor: Flattened blocked tensor from to_blocked()
+        original_rows: Original number of rows before blocking
+        original_cols: Original number of columns before blocking
+
+    Returns:
+        Tensor of shape (original_rows, original_cols) in regular layout
+    """
+    n_row_blocks = ceil_div(original_rows, 128)
+    n_col_blocks = ceil_div(original_cols, 4)
+
+    rearranged = blocked_tensor.view(n_row_blocks * n_col_blocks, 32, 16)
+
+    temp = rearranged.reshape(n_row_blocks * n_col_blocks, 32, 4, 4)
+
+    temp = temp.transpose(1, 2)
+
+    blocks = temp.reshape(n_row_blocks, n_col_blocks, 128, 4)
+
+    padded_view = blocks.permute(0, 2, 1, 3)
+
+    padded = padded_view.reshape(n_row_blocks * 128, n_col_blocks * 4)
+
+    return padded[:original_rows, :original_cols]
+
+
 def _to_blocked_single(scales: Tensor) -> Tensor:
     """Assume that we have a 128x4 block of scales in K Major order
 
diff --git a/torchao/utils.py b/torchao/utils.py
index 1a12fb0668..677bad2718 100644
--- a/torchao/utils.py
+++ b/torchao/utils.py
@@ -705,6 +705,10 @@ def check_xpu_version(device, version="2.8.0"):
     return device == "xpu" and compare_versions(torch.__version__, version) >= 0
 
 
+def ceil_div(a, b):
+    return (a + b - 1) // b
+
+
 TORCH_VERSION_AFTER_2_5 = _torch_version_at_least("2.5.0.dev")
 TORCH_VERSION_AFTER_2_4 = _torch_version_at_least("2.4.0.dev")
 TORCH_VERSION_AFTER_2_3 = _torch_version_at_least("2.3.0.dev")