mapping updates

uonafya · Mar 28, 2023 · e28ca3d · e28ca3d
1 parent 3b4f3f9
commit e28ca3d
Show file tree

Hide file tree

Showing 127 changed files with 37,372 additions and 22,743 deletions.
diff --git a/.vs/ProjectSettings.json b/.vs/ProjectSettings.json
@@ -0,0 +1,3 @@
+{
+  "CurrentProjectSetting": null
+}
diff --git a/.vs/VSWorkspaceState.json b/.vs/VSWorkspaceState.json
@@ -0,0 +1,4 @@
+{
+  "ExpandedNodes": [],
+  "PreviewInSolutionExplorer": false
+}
diff --git a/.vs/middlewareapi/FileContentIndex/910d1090-dd3d-4965-85d7-ed047c772a40.vsidx b/.vs/middlewareapi/FileContentIndex/910d1090-dd3d-4965-85d7-ed047c772a40.vsidx
diff --git a/.vs/middlewareapi/FileContentIndex/read.lock b/.vs/middlewareapi/FileContentIndex/read.lock
diff --git a/.vs/middlewareapi/v17/.wsuo b/.vs/middlewareapi/v17/.wsuo
diff --git a/.vs/middlewareapi/v17/workspaceFileList.bin b/.vs/middlewareapi/v17/workspaceFileList.bin
diff --git a/.vs/slnx.sqlite b/.vs/slnx.sqlite
diff --git a/.vscode/launch.json b/.vscode/launch.json
@@ -8,6 +8,7 @@
             "name": "Python: Django",
             "type": "python",
             "request": "launch",
+            "python": "D:\\projects\\env\\Scripts\\python",
             "program": "${workspaceFolder}\\manage.py",
             "args": [
                 "runserver"

diff --git a/api/__pycache__/admin.cpython-311.pyc b/api/__pycache__/admin.cpython-311.pyc
diff --git a/api/__pycache__/comparedata.cpython-311.pyc b/api/__pycache__/comparedata.cpython-311.pyc
diff --git a/api/__pycache__/comparedata1.cpython-311.pyc b/api/__pycache__/comparedata1.cpython-311.pyc
diff --git a/api/__pycache__/data_mapping.cpython-311.pyc b/api/__pycache__/data_mapping.cpython-311.pyc
diff --git a/api/__pycache__/dataset_regex.cpython-311.pyc b/api/__pycache__/dataset_regex.cpython-311.pyc
diff --git a/api/__pycache__/load_files.cpython-311.pyc b/api/__pycache__/load_files.cpython-311.pyc
diff --git a/api/__pycache__/models.cpython-311.pyc b/api/__pycache__/models.cpython-311.pyc
diff --git a/api/__pycache__/urls.cpython-311.pyc b/api/__pycache__/urls.cpython-311.pyc
diff --git a/api/__pycache__/views.cpython-311.pyc b/api/__pycache__/views.cpython-311.pyc
diff --git a/api/admin.py b/api/admin.py
@@ -24,7 +24,7 @@ class MappingAdmin(admin.ModelAdmin):
 class ComparisonAdmin(admin.ModelAdmin):
     search_fields = ('facility', 'ward', 'subcounty', 'county',
                      'indicators', 'khis_minus_datim', 'concodance')
-    list_filter = ['created', 'county', 'facility', 'ward',
+    list_filter = ['create_date', 'county', 'facility', 'ward',
                    'subcounty']
     list_display = ['facility', 'ward', 'subcounty', 'county', 'MOH_FacilityID', 'MOH_IndicatorCode', 'DATIM_Disag_Name',
                     'indicators', 'khis_data', 'datim_data', 'weight', 'concodance', 'khis_minus_datim']

diff --git a/api/comparedata.py b/api/comparedata.py
diff --git a/api/comparedata1.py b/api/comparedata1.py
@@ -0,0 +1,194 @@
+import re
+from datetime import timedelta
+from datetime import datetime
+from pathlib import Path
+import json
+from .serializers import *
+from .models import *
+import os
+import pandas as pd
+# from mapping_rules.models import *
+from .dataset_regex import *
+
+data_groups = GruopSeriesData.objects.first()
+
+
+def append_data(mydict, m, d, check=1):
+    mydict.append({
+        'created': m['created'],
+        'facility': m['facility'],
+        'ward': m['ward'],
+        'subcounty': m['subcounty'],
+        'county': m['county'],
+        'MOH_FacilityID': m['MOH_UID'],
+        'MOH_IndicatorCode': m['MOH_Indicator_ID'],
+        'DATIM_Disag_ID': d['DATIM_Disag_ID'],
+        'category': d['DATIM_Indicator_Category'],
+        'MOH_Indicator_Name':  m['MOH_Indicator_Name'],
+        'DATIM_Disag_Name': d['DATIM_Disag_Name'],
+        'khis_data': m['khis_data'],
+        'datim_data': d['datim_data'],
+    })
+
+
+def extract_age_group(element):
+    age_group = re.search(
+        r"(\d{2}[+])|(\d+[-]\d+)|([<]\d{1})", element).group()
+    # print(element, age_group)
+    try:
+        if age_group.endswith("+"):
+            age_group = "25+"
+            element = str(element).replace(age_group, "25+")
+        elif "-" in age_group and int(age_group.split("-")[1]) >= 25:
+            age_group = "25+"
+            element = str(element).replace(age_group, "25+")
+            element = str(element).replace(age_group, "25+")
+        elif "-" in age_group and (int(age_group.split("-")[1]) >= 1 and int(age_group.split("-")[1]) <= 9):
+            element = str(element).replace(age_group, "1-9")
+            age_group = "1-9"
+        # print(age_group)
+        # print(element)
+        return age_group
+    except Exception as e:
+        print("age:{}".format(e))
+
+# Define a function to extract gender from khis elements
+
+
+def extract_gender_khis(element):
+    gender = ""
+    try:
+        age_group = re.search(
+            r"(\d{2}[+])|(\d+[-]\d+)|([<]\d{1})", element).group()
+        # print(element, gender)
+        if age_group in ["<1", "1-9", "1-4", "5-9"]:
+            gender = "Unknown Sex"
+        else:
+            gender = re.search(r"\((F|M)\)", element).group(1)
+            if gender == 'F':
+                gender = "Female"
+            elif gender == 'M':
+                gender = "Male"
+        # print(gender)
+        return gender
+    except Exception as e:
+        print("khis gender:{}".format(e))
+
+
+def extract_gender_datim(element):
+    try:
+        gender = re.search(r"(Female|Male)", element).group()
+        age_group = re.search(
+            r"(\d{2}[+])|(\d+[-]\d+)|([<]\d{1})", element).group()
+        # print(element, gender)
+        if age_group in ["<1", "1-9", "1-4", "5-9"]:
+            gender = "Unknown Sex"
+        # print(gender)
+        return gender
+    except Exception as e:
+        print("datim gender:{}".format(e))
+
+# Define a function to find the most similar datim element for a khis element
+
+
+def find_similar_datim(khis_name, datim_element):
+    try:
+        max_similarity = 3
+        most_similar_datim = {}
+        similarity = sum([1 for word in str(str(khis_name).split()).replace("_", " ").replace(
+            "(F)", " Female").replace("(M)", " Male")
+            if word.lower() in str(datim_element['DATIM_Disag_Name']).replace(",", "").lower()])
+        if similarity > max_similarity:
+            max_similarity = similarity
+            most_similar_datim = datim_element
+            # print("Most similar=>", khis_name, most_similar_datim)
+        else:
+            most_similar_datim = None
+    except Exception as e:
+        print(e)
+    return most_similar_datim
+
+
+def group_datim_elem(element):
+    age_group = re.search(
+        r"(\d{2}[+])|(\d+[-]\d+)|([<]\d{1})", element).group()
+    gender = re.search(r"(Female|Male)", element).group()
+    try:
+        if age_group.endswith("+"):
+            element = str(element).replace(age_group, "25+")
+        elif '-' in age_group and int(age_group.split("-")[1]) >= 25:
+            element = str(element).replace(age_group, "25+")
+        elif "-" in age_group and (int(age_group.split("-")[1]) >= 1 and int(age_group.split("-")[1]) <= 9):
+            element = str(element).replace(age_group, "1-9")
+        elif "<" in age_group and int(age_group.split("<")[1]) <= 1:
+            element = str(element).replace(age_group, "<1")
+        # print(element)
+        return element
+    except Exception as e:
+        print("age:{}".format(e))
+
+
+def merge_grouped_elememts(dict_list, d, datim_name):
+    try:
+        match_found = False
+        for element in dict_list:
+            if element[datim_name] == datim_name and (extract_age_group(datim_name) == '25+' or extract_age_group(datim_name) == '1-9'):
+                element['datim_data'] += int(d['datim_data'])
+                match_found = True
+        print(match_found, element, datim_name)
+        return match_found
+    except Exception as e:
+        print("merge elem:{}".format(e))
+
+
+def map_data(mohdict, datimydict):
+    # Map khis elements to datim elements
+    mapped_list = []
+    group_datim_elements = True
+    for i, d in enumerate(datimydict):
+        try:
+            next = False
+            exists = False
+            # m['name'] = group_elem(m['name'])
+            if group_datim_elements:
+                d['DATIM_Disag_Name'] = group_datim_elem(d['DATIM_Disag_Name'])
+            datim_name = d['DATIM_Disag_Name']
+            datim_age = extract_age_group(datim_name)
+            datim_gender = extract_gender_datim(datim_name)
+            for j, m in enumerate(mohdict):
+                if next:
+                    break
+                khis_name = m['MOH_Indicator_Name']
+                khis_age = extract_age_group(khis_name)
+                khis_gender = extract_gender_khis(khis_name)
+                # print(khis_name, datim_name)
+                if datim_age in khis_age and datim_gender in khis_gender and find_similar_datim(khis_name, d) != None:
+                    if [i for i in ['25+', '1-9'] if i in datim_name]:
+                        data_range = 0
+                        for element in mapped_list:
+                            if datim_name in element['DATIM_Disag_Name']:
+                                data_range = int(
+                                    element['khis_data'])-int(element['datim_data'])
+                                if data_range <= 10:
+                                    exists = False
+                                else:
+                                    element['datim_data'] += int(
+                                        d['datim_data'])
+                                    mohdict.remove(mohdict[j])
+                                    exists = True
+                                    if data_range <= 10:
+                                        next = True
+                                    break
+                        if not exists:
+                            append_data(mapped_list, m, d)
+                            mohdict.remove(mohdict[j])
+                            break
+                    else:
+                        append_data(mapped_list, m, d)
+                        mohdict.remove(mohdict[j])
+                        break
+        except Exception as e:
+            print("mapping:{}".format(e))
+    temp_df = pd.DataFrame(mapped_list)
+    temp_df.drop_duplicates(inplace=True)
+    return temp_df